noindexチェッカー

meta robots・X-Robots-Tag・robots.txtの3ソースを一括診断する最適なnoindex確認方法。Googleにインデックスされるかを即判定します。

サーバーサイドで安全に処理 登録不要・完全無料

チェックするURLを入力

meta robots・X-Robots-Tagヘッダー・robots.txtの3つのソースからnoindex設定を検出します。

使い方

1

URLを入力

noindex設定を確認したいページのURLをペースト

2

チェックを実行

「チェック」ボタンで3つのソースを一括確認

3

結果を確認

インデックス可否と各ソースの検出状況を確認

noindexとは

noindexとは、検索エンジンに対して「このページをインデックス(検索結果に登録)しないでください」と伝えるディレクティブ(指示)です。Googlebotがページをクロールした際にnoindexを検出すると、そのページは検索結果から除外されます。

noindexは主に以下のようなケースで使用されます。

  • 管理画面やログインページなど、検索結果に表示する必要がないページ
  • サンクスページ(お問い合わせ完了ページ等)
  • サイト内検索結果ページ
  • 重複コンテンツを含むページ
  • テスト環境やステージング環境のページ

noindexはクロール自体を止めるものではなく、あくまで「インデックスしない」という指示です。Googlebotはnoindexが設定されたページも通常どおりクロールしますが、検索結果には表示しません。

noindexの設定方法3つ

1. meta robotsタグ(HTML内に記述)

もっとも一般的な方法です。HTMLの<head>セクション内にmetaタグを追加します。ページ単位で柔軟に制御でき、WordPressのSEOプラグインでも広く採用されています。

<meta name="robots" content="noindex, nofollow">

Googlebot専用に設定する場合は name="googlebot" を使用します。

2. X-Robots-Tag HTTPヘッダー

HTTPレスポンスヘッダーにnoindex指示を含める方法です。PDFや画像などHTML以外のリソースにもnoindexを適用できるのが特徴です。サーバー設定(.htaccess、nginx.conf等)やCDN(Cloudflare等)で設定します。

X-Robots-Tag: noindex

Apacheの場合: Header set X-Robots-Tag "noindex"

3. robots.txt(クロール制御)

robots.txtはnoindex指示ではなく、クローラーのアクセス自体を制御するファイルです。Disallowルールでクロールをブロックできますが、noindexとは目的が異なります。robots.txtでブロックされたページは、外部リンク等からURLが発見されるとnoindexタグを読み取れないまま検索結果に表示される可能性があります。

User-agent: *
Disallow: /admin/
Disallow: /search/

確実にインデックスから除外したい場合は、robots.txtではなくnoindexタグの使用が推奨されます。

noindexが必要なページ

ページ種別 理由 推奨設定
管理画面・ログイン 検索結果に表示する必要がなく、セキュリティ上のリスクもある noindex, nofollow
サンクスページ お問い合わせ完了・購入完了等のページは検索流入が不要 noindex
サイト内検索結果 無限に生成され、クロールバジェットを浪費する。低品質と判定されるリスクも noindex
重複コンテンツ 同一内容のページが複数存在する場合。canonicalタグとの使い分けを検討 noindex または canonical
テスト・ステージング 本番環境以外のページが誤ってインデックスされるのを防止 noindex, nofollow
タグ・アーカイブ 記事一覧ページが重複コンテンツとみなされる場合 noindex(サイトによる)

noindexの注意点とよくある間違い

robots.txtとnoindexの併用問題

robots.txtでDisallowしているページにnoindexタグを設定しても、Googlebotがページにアクセスできないためnoindexを読み取れません。結果として、外部リンク等からURLが発見された場合にインデックスされてしまう可能性があります。確実にインデックスから除外するには、robots.txtのDisallowを解除してnoindexタグのみで制御するか、X-Robots-Tagヘッダーを使用してください。

noindexとnofollowの混同

noindexは「インデックスしない」、nofollowは「ページ内のリンクを評価しない」という別の指示です。noindexだけを設定した場合、ページ自体はインデックスされませんが、ページ内のリンク先にはPageRankが渡ります。両方を制御したい場合は noindex, nofollow と記述します。

canonicalタグとの使い分け

重複コンテンツの対処法としてnoindexとcanonicalタグがありますが、目的が異なります。canonicalタグは「正規URLはこちらです」と伝える指示で、PageRankを正規URLに統合できます。noindexは単に「インデックスしない」だけでPageRankの統合はありません。重複ページのSEO評価を正規ページに集約したい場合はcanonicalタグが適切です。

サイト全体が意図せずnoindexになるケース

WordPressの「検索エンジンがサイトをインデックスしないようにする」オプションや、ステージング環境のnoindex設定が本番に持ち込まれるケースは非常に多い問題です。サイト公開時やサーバー移行後は、必ず本ツールやSearch Consoleでnoindex設定が残っていないか確認してください。

noindexの確認方法(4つの手段)

noindexの確認方法には、目的に応じて4つの手段があります。本ツールは3つのソース(meta robots・X-Robots-Tag・robots.txt)を一括チェックでき、もっとも素早く正確な確認方法です。それぞれの特徴を理解して使い分けましょう。

1. noindexチェッカーで一括確認(もっとも簡単)

本ツールはURLを入力するだけで、meta robotsタグ・X-Robots-Tag HTTPヘッダー・robots.txtの3つのソースを同時にチェックします。ページを開いて目視で確認する手間が不要で、サーバー側のヘッダーまで含めて判定できる点が最大のメリットです。設定変更直後の即時確認や、複数ページを連続でチェックしたい場面に最適です。

特に「meta robotsタグは外したのにインデックスされない」というケースでは、X-Robots-Tagヘッダーやrobots.txt側に原因が残っていることが多く、本ツールで一発特定できます。

2. Chrome DevToolsで HTML を直接確認

ブラウザで対象ページを開き、F12キー(または右クリック→検証)でDevToolsを開き、Elementsタブで<head>内に <meta name="robots"> があるか確認します。NetworkタブのレスポンスヘッダーでX-Robots-Tagもチェック可能です。

ただし、JavaScriptで動的にmetaタグが変更されるサイトでは初期HTMLに含まれず、Googlebotが見るのと違う結果になる可能性があります。初期HTMLの状態を確認したい場合は本ツールやcurlコマンドを使用してください。

3. curl コマンドでヘッダー+HTML確認

ターミナルで以下のコマンドを実行すると、HTTPレスポンスヘッダー(X-Robots-Tag含む)とHTMLソースの両方を取得できます。Googlebotが受け取る生のレスポンスに最も近い形でnoindex設定を確認できます。

# ヘッダーのみ確認
curl -I https://example.com/

# ヘッダー+HTML を取得
curl -L https://example.com/ | grep -i "robots"

エンジニア向けの確認方法ですが、確実性は最も高い手段です。CIでの自動チェックにも組み込めます。

4. Search Console URL検査ツールで Googleの認識を確認

本ツール・DevTools・curl はいずれも「現在のページに何が書かれているか」を確認する方法ですが、Search ConsoleのURL検査ツールは「Googleが現在どう認識しているか」を確認する唯一の方法です。noindexがGoogleに反映されている場合、「インデックス登録: いいえ — 'noindex' タグにより除外されました」と表示されます。

サイト全体の状況は「ページのインデックス登録」レポート(旧カバレッジ)で「noindex タグにより除外されました」のURL一覧として確認可能です。意図しないnoindexがサイト全体で何件あるかを把握するならこちらが向いています。

ただし、Googleの再クロールには時間がかかるため、設定変更直後の即時確認には不向きです。即時確認は本ツール、Googleへの反映確認はSearch Console、と使い分けが効率的です。

結論:noindexの確認方法は本ツールが最速。3つのソースを一括チェックでき、設定変更直後の即時確認に最適です。Googleへの反映が気になる段階で Search Console URL検査を併用するのが、もっとも実務的な確認フローです。

noindexに関するよくある質問

noindexとnofollowの違いは?

noindexは検索エンジンに「このページをインデックスしないでください」と伝える指示です。nofollowは「このページ内のリンクを評価しないでください」という指示です。noindexを設定してもページ内のリンクは通常どおり評価されます。両方を同時に設定する場合は「noindex, nofollow」と記述します。

noindexを設定してもクロールされる?

はい、noindexを設定してもGooglebotはページをクロール(巡回)します。noindexはあくまで「インデックスしない」という指示であり、クロール自体を止めるものではありません。クロールを制御したい場合はrobots.txtのDisallowルールを使用します。ただし、robots.txtでブロックするとnoindexタグ自体を読み取れなくなるため、併用には注意が必要です。

robots.txtでブロックするのとnoindexの違いは?

robots.txtのDisallowはクローラーのアクセス自体をブロックし、ページの内容を取得させません。一方、noindexはクローラーがページを読んだうえで「インデックスしない」と判断させます。robots.txtでブロックすると、外部リンクなどからURLが発見された場合にnoindexを読み取れず、結果的にインデックスされてしまう可能性があります。確実にインデックスから除外したい場合はnoindexの使用が推奨されます。

noindexを解除してからインデックスされるまでどれくらいかかる?

noindexを解除した後、Googleがページを再クロールしてインデックスするまでの期間はサイトによって異なります。一般的には数日から数週間程度ですが、クロール頻度の低いサイトではさらに時間がかかる場合があります。Search ConsoleのURL検査ツールで「インデックス登録をリクエスト」を送信すると、再クロールを促進できます。