inSite サイトマップチェッカー
sitemap.xmlを取得・解析し、URL数・lastmod・構文エラーなどを検証。サイトマップインデックスにも対応しています。
チェックするURLを入力
サイトのURLまたはsitemap.xmlのURLを入力してください
使い方
URLを入力
サイトマップのURLまたはサイトのURLをペースト
チェックを実行
「チェック」ボタンでサイトマップを取得・解析
結果を確認
URL数・lastmod・構文エラーなどの検証結果を確認
サイトマップ(sitemap.xml)とは
サイトマップ(sitemap.xml)は、検索エンジンにサイト内のURLリストを伝えるためのXMLファイルです。Googleなどのクローラーはサイトマップを参照することで、サイト内のページを効率的に発見・クロールできるようになります。
特に新規ページの追加や大規模サイトのクロールにおいて、サイトマップは重要な役割を果たします。内部リンクだけではクローラーが到達しにくいページも、サイトマップに記載することで発見を促進できます。
サイトマップには主に2つの形式があります。urlset(通常のサイトマップ)は個別のURLを列挙するもので、sitemapindex(サイトマップインデックス)は複数のサイトマップファイルをまとめて管理するものです。大規模サイトでは、サイトマップインデックスを使って投稿タイプ別やカテゴリ別にサイトマップを分割するのが一般的です。
sitemap.xmlの構成要素
サイトマップの各URLエントリ(<url>)には、以下の要素を記述できます。
| 要素 | 必須 | 説明 |
|---|---|---|
<loc> | 必須 | ページのURL。絶対URLで記述する |
<lastmod> | 推奨 | ページの最終更新日。W3C Datetime形式(YYYY-MM-DD) |
<changefreq> | 任意 | 更新頻度のヒント。Googleは無視する傾向 |
<priority> | 任意 | サイト内の相対的な優先度(0.0〜1.0)。Googleは無視する傾向 |
実用上最も重要なのは<loc>と<lastmod>の2つです。Googleは<changefreq>と<priority>を無視する傾向にあると公式に明言しています。
<lastmod>は正確な更新日を反映することが重要です。ページの内容が変わっていないのにlastmodだけ更新すると、Googleがlastmodの信頼性を低く評価し、将来的にlastmodを無視するようになる可能性があります。
サイトマップの上限と分割方法
Googleが定めるサイトマップの制限は以下のとおりです。
これらの上限を超える場合は、サイトマップを複数ファイルに分割し、サイトマップインデックスで管理します。サイトマップインデックスには最大50,000件のサイトマップURLを記載できます。
分割の方法としては、以下のようなパターンが一般的です。
投稿タイプ別
投稿・固定ページ・カテゴリ・タグなど、コンテンツタイプごとにサイトマップを分割。WordPressプラグインの多くがこの方式を採用
日付別
年月ごとにサイトマップを分割。古い記事のサイトマップは更新頻度が低いため、クロール効率が向上
カテゴリ別
サイトのカテゴリ構造に沿って分割。特定カテゴリの更新状況を把握しやすくなる
よくあるサイトマップの問題と対処法
sitemap.xmlが存在しない
サイトマップが設置されていない場合、クローラーは内部リンクのみでページを発見することになります。大規模サイトや新しいサイトでは、ページの発見漏れが起きやすくなります。
対処法: CMSの標準機能やプラグインでサイトマップを自動生成し、robots.txtにSitemap: https://example.com/sitemap.xmlを記載してください。
lastmodが未設定・不正確
lastmodが未設定だと、Googleはページの更新タイミングを把握しにくくなります。また、内容を変更していないのにlastmodを更新し続けると、Googleがlastmodの信頼性を低く評価するようになります。
対処法: ページの内容を実際に更新した日時のみをlastmodに設定してください。自動的に全ページのlastmodを更新する設定は避けましょう。
404/リダイレクトページがサイトマップに含まれている
削除済みページ(404)やリダイレクトされるURLがサイトマップに残っていると、クロールバジェットが無駄に消費されます。Search Consoleでもエラーとして報告されます。
対処法: 定期的にサイトマップ内のURLをチェックし、404やリダイレクトになっているURLを除外してください。本ツールで一括チェックが可能です。
noindexページがサイトマップに含まれている
noindexを設定しているページをサイトマップに記載すると、矛盾するシグナルを検索エンジンに送ることになります。Search Consoleでは「送信されたURLにnoindexタグが追加されています」というエラーが表示されます。
対処法: インデックスさせたくないページはサイトマップから除外してください。サイトマップにはインデックス対象のURLのみを記載します。
robots.txtでサイトマップが指定されていない
robots.txtにサイトマップのURLを記載していない場合、クローラーがサイトマップの場所を自動的に発見できません。Search Consoleで手動送信していても、robots.txtでの指定を併用するのが確実です。
対処法: robots.txtの末尾にSitemap: https://example.com/sitemap.xmlを追記してください。
Search Consoleでのサイトマップ管理
STEP 1 サイトマップの送信
Search Consoleの左メニューから「サイトマップ」を選択し、サイトマップのURLを入力して「送信」をクリックします。サイトマップインデックスのURLを送信すれば、配下の全サイトマップが自動的に認識されます。
STEP 2 エラー・警告の確認
送信後、Search Consoleはサイトマップを読み取り、エラーや警告があれば表示します。「取得できませんでした」「解析エラー」などのステータスが出た場合は、XMLの構文やサーバーの応答を確認してください。
STEP 3 本ツールとの併用メリット
Search Consoleはサイトマップの送信と結果確認に最適ですが、XMLの構文チェックやURL単位の詳細検証には本ツールが便利です。サイトマップをSearch Consoleに送信する前に、本ツールで構文エラーやURL数の確認を行うことで、送信後のエラーを未然に防げます。
ポイント: 本ツールでサイトマップの構文・URL数・lastmodを事前にチェックし、問題がなければSearch Consoleに送信するというワークフローがおすすめです。定期的なチェックにより、サイトマップの品質を維持できます。
サイトマップに関するよくある質問
サイトマップは必ず必要ですか?
サイトマップは必須ではありませんが、Googleが推奨しています。特に500ページ以上の大規模サイト、内部リンクが少ないページがあるサイト、新規サイトや外部リンクが少ないサイトでは、サイトマップがクロール効率を大きく向上させます。小規模で内部リンクが適切に設定されたサイトでは、サイトマップがなくてもGoogleはほとんどのページを発見できます。
サイトマップを更新したらどうすればいいですか?
サイトマップを更新したら、Search Consoleの「サイトマップ」セクションから再送信するのが最も確実です。また、robots.txtにサイトマップのURLを記載しておけば、クローラーが自動的に最新のサイトマップを取得します。Googleのping機能は現在非推奨となっており、Search Consoleからの送信が推奨されています。
サイトマップに載せるべきでないページは?
noindexを設定しているページ、robots.txtでクロールをブロックしているページ、canonicalタグで別のURLを正規として指定しているページ、リダイレクトされるページ、404エラーのページはサイトマップに含めるべきではありません。サイトマップにはインデックスさせたい正規URLのみを記載するのがベストプラクティスです。
サイトマップインデックスとは何ですか?
サイトマップインデックスは、複数のサイトマップファイルをまとめて管理するためのXMLファイルです。1つのサイトマップにはURL 50,000件・50MBという上限があるため、大規模サイトではサイトマップを分割し、サイトマップインデックスで一覧化します。WordPressなどのCMSでは、投稿・固定ページ・カテゴリなどをタイプ別に分割し、サイトマップインデックスで管理するのが一般的です。
関連記事
サイト全体のSEO状態を把握したい方へ
inSiteなら、サイト全体のインデックス状況・内部リンク構造を一元管理。SEOの改善サイクルを効率化できます。
14日間無料トライアルを始めるカード登録不要 / 自動課金なし