noindexチェッカー
meta robots・X-Robots-Tag・robots.txtの3ソースを一括診断する最適なnoindex確認方法。Googleにインデックスされるかを即判定します。
チェックするURLを入力
meta robots・X-Robots-Tagヘッダー・robots.txtの3つのソースからnoindex設定を検出します。
使い方
URLを入力
noindex設定を確認したいページのURLをペースト
チェックを実行
「チェック」ボタンで3つのソースを一括確認
結果を確認
インデックス可否と各ソースの検出状況を確認
noindexとは
noindexとは、検索エンジンに対して「このページをインデックス(検索結果に登録)しないでください」と伝えるディレクティブ(指示)です。Googlebotがページをクロールした際にnoindexを検出すると、そのページは検索結果から除外されます。
noindexは主に以下のようなケースで使用されます。
- 管理画面やログインページなど、検索結果に表示する必要がないページ
- サンクスページ(お問い合わせ完了ページ等)
- サイト内検索結果ページ
- 重複コンテンツを含むページ
- テスト環境やステージング環境のページ
noindexはクロール自体を止めるものではなく、あくまで「インデックスしない」という指示です。Googlebotはnoindexが設定されたページも通常どおりクロールしますが、検索結果には表示しません。
noindexの設定方法3つ
1. meta robotsタグ(HTML内に記述)
もっとも一般的な方法です。HTMLの<head>セクション内にmetaタグを追加します。ページ単位で柔軟に制御でき、WordPressのSEOプラグインでも広く採用されています。
<meta name="robots" content="noindex, nofollow"> Googlebot専用に設定する場合は name="googlebot" を使用します。
2. X-Robots-Tag HTTPヘッダー
HTTPレスポンスヘッダーにnoindex指示を含める方法です。PDFや画像などHTML以外のリソースにもnoindexを適用できるのが特徴です。サーバー設定(.htaccess、nginx.conf等)やCDN(Cloudflare等)で設定します。
X-Robots-Tag: noindex Apacheの場合: Header set X-Robots-Tag "noindex"
3. robots.txt(クロール制御)
robots.txtはnoindex指示ではなく、クローラーのアクセス自体を制御するファイルです。Disallowルールでクロールをブロックできますが、noindexとは目的が異なります。robots.txtでブロックされたページは、外部リンク等からURLが発見されるとnoindexタグを読み取れないまま検索結果に表示される可能性があります。
User-agent: *
Disallow: /admin/
Disallow: /search/ 確実にインデックスから除外したい場合は、robots.txtではなくnoindexタグの使用が推奨されます。
noindexが必要なページ
| ページ種別 | 理由 | 推奨設定 |
|---|---|---|
| 管理画面・ログイン | 検索結果に表示する必要がなく、セキュリティ上のリスクもある | noindex, nofollow |
| サンクスページ | お問い合わせ完了・購入完了等のページは検索流入が不要 | noindex |
| サイト内検索結果 | 無限に生成され、クロールバジェットを浪費する。低品質と判定されるリスクも | noindex |
| 重複コンテンツ | 同一内容のページが複数存在する場合。canonicalタグとの使い分けを検討 | noindex または canonical |
| テスト・ステージング | 本番環境以外のページが誤ってインデックスされるのを防止 | noindex, nofollow |
| タグ・アーカイブ | 記事一覧ページが重複コンテンツとみなされる場合 | noindex(サイトによる) |
noindexの注意点とよくある間違い
robots.txtとnoindexの併用問題
robots.txtでDisallowしているページにnoindexタグを設定しても、Googlebotがページにアクセスできないためnoindexを読み取れません。結果として、外部リンク等からURLが発見された場合にインデックスされてしまう可能性があります。確実にインデックスから除外するには、robots.txtのDisallowを解除してnoindexタグのみで制御するか、X-Robots-Tagヘッダーを使用してください。
noindexとnofollowの混同
noindexは「インデックスしない」、nofollowは「ページ内のリンクを評価しない」という別の指示です。noindexだけを設定した場合、ページ自体はインデックスされませんが、ページ内のリンク先にはPageRankが渡ります。両方を制御したい場合は noindex, nofollow と記述します。
canonicalタグとの使い分け
重複コンテンツの対処法としてnoindexとcanonicalタグがありますが、目的が異なります。canonicalタグは「正規URLはこちらです」と伝える指示で、PageRankを正規URLに統合できます。noindexは単に「インデックスしない」だけでPageRankの統合はありません。重複ページのSEO評価を正規ページに集約したい場合はcanonicalタグが適切です。
サイト全体が意図せずnoindexになるケース
WordPressの「検索エンジンがサイトをインデックスしないようにする」オプションや、ステージング環境のnoindex設定が本番に持ち込まれるケースは非常に多い問題です。サイト公開時やサーバー移行後は、必ず本ツールやSearch Consoleでnoindex設定が残っていないか確認してください。
noindexの確認方法(4つの手段)
noindexの確認方法には、目的に応じて4つの手段があります。本ツールは3つのソース(meta robots・X-Robots-Tag・robots.txt)を一括チェックでき、もっとも素早く正確な確認方法です。それぞれの特徴を理解して使い分けましょう。
1. noindexチェッカーで一括確認(もっとも簡単)
本ツールはURLを入力するだけで、meta robotsタグ・X-Robots-Tag HTTPヘッダー・robots.txtの3つのソースを同時にチェックします。ページを開いて目視で確認する手間が不要で、サーバー側のヘッダーまで含めて判定できる点が最大のメリットです。設定変更直後の即時確認や、複数ページを連続でチェックしたい場面に最適です。
特に「meta robotsタグは外したのにインデックスされない」というケースでは、X-Robots-Tagヘッダーやrobots.txt側に原因が残っていることが多く、本ツールで一発特定できます。
2. Chrome DevToolsで HTML を直接確認
ブラウザで対象ページを開き、F12キー(または右クリック→検証)でDevToolsを開き、Elementsタブで<head>内に <meta name="robots"> があるか確認します。NetworkタブのレスポンスヘッダーでX-Robots-Tagもチェック可能です。
ただし、JavaScriptで動的にmetaタグが変更されるサイトでは初期HTMLに含まれず、Googlebotが見るのと違う結果になる可能性があります。初期HTMLの状態を確認したい場合は本ツールやcurlコマンドを使用してください。
3. curl コマンドでヘッダー+HTML確認
ターミナルで以下のコマンドを実行すると、HTTPレスポンスヘッダー(X-Robots-Tag含む)とHTMLソースの両方を取得できます。Googlebotが受け取る生のレスポンスに最も近い形でnoindex設定を確認できます。
# ヘッダーのみ確認
curl -I https://example.com/
# ヘッダー+HTML を取得
curl -L https://example.com/ | grep -i "robots" エンジニア向けの確認方法ですが、確実性は最も高い手段です。CIでの自動チェックにも組み込めます。
4. Search Console URL検査ツールで Googleの認識を確認
本ツール・DevTools・curl はいずれも「現在のページに何が書かれているか」を確認する方法ですが、Search ConsoleのURL検査ツールは「Googleが現在どう認識しているか」を確認する唯一の方法です。noindexがGoogleに反映されている場合、「インデックス登録: いいえ — 'noindex' タグにより除外されました」と表示されます。
サイト全体の状況は「ページのインデックス登録」レポート(旧カバレッジ)で「noindex タグにより除外されました」のURL一覧として確認可能です。意図しないnoindexがサイト全体で何件あるかを把握するならこちらが向いています。
ただし、Googleの再クロールには時間がかかるため、設定変更直後の即時確認には不向きです。即時確認は本ツール、Googleへの反映確認はSearch Console、と使い分けが効率的です。
結論:noindexの確認方法は本ツールが最速。3つのソースを一括チェックでき、設定変更直後の即時確認に最適です。Googleへの反映が気になる段階で Search Console URL検査を併用するのが、もっとも実務的な確認フローです。
noindexに関するよくある質問
noindexとnofollowの違いは?
noindexは検索エンジンに「このページをインデックスしないでください」と伝える指示です。nofollowは「このページ内のリンクを評価しないでください」という指示です。noindexを設定してもページ内のリンクは通常どおり評価されます。両方を同時に設定する場合は「noindex, nofollow」と記述します。
noindexを設定してもクロールされる?
はい、noindexを設定してもGooglebotはページをクロール(巡回)します。noindexはあくまで「インデックスしない」という指示であり、クロール自体を止めるものではありません。クロールを制御したい場合はrobots.txtのDisallowルールを使用します。ただし、robots.txtでブロックするとnoindexタグ自体を読み取れなくなるため、併用には注意が必要です。
robots.txtでブロックするのとnoindexの違いは?
robots.txtのDisallowはクローラーのアクセス自体をブロックし、ページの内容を取得させません。一方、noindexはクローラーがページを読んだうえで「インデックスしない」と判断させます。robots.txtでブロックすると、外部リンクなどからURLが発見された場合にnoindexを読み取れず、結果的にインデックスされてしまう可能性があります。確実にインデックスから除外したい場合はnoindexの使用が推奨されます。
noindexを解除してからインデックスされるまでどれくらいかかる?
noindexを解除した後、Googleがページを再クロールしてインデックスするまでの期間はサイトによって異なります。一般的には数日から数週間程度ですが、クロール頻度の低いサイトではさらに時間がかかる場合があります。Search ConsoleのURL検査ツールで「インデックス登録をリクエスト」を送信すると、再クロールを促進できます。