この記事のポイント
  • 重複コンテンツとは同一または酷似した内容が複数のURLに存在する状態のこと
  • ペナルティではなく「評価の分散」が最大の問題。検索順位が伸びない原因になる
  • URL構造・CMS設定・類似記事の量産が主な発生原因
  • canonical・301リダイレクト・noindexを状況に応じて使い分けるのが対策の基本
  • GSCやinSiteで定期的にインデックス状況を監視し、早期発見する仕組みが重要

重複コンテンツとは、同一または酷似した内容が複数のURLに存在する状態のことです。ペナルティではなく「評価の分散」が最大の問題であり、放置すると検索順位が伸びない原因になります。

「Google Search Consoleで”重複しています”と表示されたが、どう対処すればいいのかわからない」。インハウスでSEOを担当していると、一度はこの状況に出くわすはずです。

筆者も人材求人サイト(数万ページ規模)のSEOを担当していた際、パラメータ付きURLが大量に生成されて重複が発生し、主要ページの順位が伸び悩んだ経験があります。canonicalタグの設定で評価を統合してからは、狙ったページが正しくインデックスされるようになりました。

この記事では、重複コンテンツの基準から影響、見つけ方、具体的な対策方法までを実務者向けに解説します。

\ インデックス状況の監視を自動化 /

inSite(インサイト)

インデックス状況を毎日自動取得。重複ページの発生を早期に発見し、対処が必要なページを一覧で確認できます。

inSiteのインデックス状態チェック機能のダッシュボード 無料で試してみる ↗

重複コンテンツとは

まずは重複コンテンツの定義と、どのような状態が「重複」に該当するのかを整理しましょう。

Googleが定義する重複コンテンツの基準

Googleの公式ドキュメントでは、重複コンテンツを「ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じか非常によく似たコンテンツのブロック」と定義しています。

ポイントは「完全一致」だけでなく「非常によく似た」内容も含まれるということです。例えば、同じ商品説明を色違い・サイズ違いのページでほぼそのまま使い回している場合も重複とみなされる可能性があります。

同一サイト内の重複と外部サイトとの重複の違い

重複コンテンツには大きく2つのパターンがあります。

重複の2パターン
  • 同一サイト内の重複
    URL違い(www有り/無し、http/https)、パラメータ付きURL、印刷用ページなど。自分で対処できるケースがほとんど
  • 外部サイトとの重複
    他サイトによるコピー、プレスリリースの転載、ECモールへの商品説明の流用など。自分だけでは対処が難しい場合もある

実務で問題になるのは圧倒的に「同一サイト内の重複」です。技術的な設定ミスや、CMSの自動生成によって意図せず発生するケースが多いでしょう。

重複コンテンツがSEOに与える影響

重複コンテンツを放置すると、具体的にどのような問題が起きるのか。3つの影響を押さえておきましょう。

重複コンテンツの影響フロー(評価分散→順位低下→クロール浪費の連鎖)

評価が分散して検索順位が上がらなくなる

重複コンテンツの最大の問題は「評価の分散」です。

同じ内容のページが複数のURLに存在すると、被リンクや内部リンクの評価がそれぞれのURLに分散してしまいます。本来1ページに集まるはずだった評価が半分ずつに分かれれば、どちらのページも十分な評価を得られず、検索順位が伸びません。

この現象はキーワードカニバリゼーションとも密接に関わっています。詳しくは「キーワードカニバリゼーションとは?SEOへの影響と確認・解消方法」で解説しています。

クロールバジェットが無駄に消費される

Googleのクローラーがサイトを巡回する際、重複ページのクロールにリソースが使われると、新しいページや重要なページの発見が遅れる可能性があります。

数十ページ程度のサイトでは大きな問題にはなりませんが、数百〜数万ページの大規模サイトでは影響が無視できません。

ペナルティになるケース・ならないケース

「重複コンテンツはペナルティの対象になる」と誤解されがちですが、Googleは悪意のない重複に対してペナルティを科さないと明言しています。

ペナルティ対象になるのはこんなケース
  • 他サイトのコンテンツを大量にコピーして自サイトに掲載する行為
  • 検索順位を操作する目的で、同じ内容のページを意図的に大量生成する行為

「ペナルティにならない=問題ない」ではありません。ペナルティがなくても、評価の分散による順位低下は確実に起きます。

重複コンテンツが発生する原因

どのような場面で重複コンテンツが発生するのか、インハウスSEOの現場でよく見かけるパターンを紹介します。

URL構造の問題

技術的な設定漏れによって、同じページが複数のURLでアクセスできる状態になっているケースです。

よくあるURL重複のパターン
  • www有り/無し
    https://www.example.com/ と https://example.com/ が両方アクセス可能
  • http/https
    SSL化後にhttpからのリダイレクトが設定されていない
  • パラメータ付きURL
    ?sort=price、?ref=twitter などのパラメータで別URLが生成される
  • 末尾スラッシュ有無
    /blog/page と /blog/page/ が別ページとして扱われる

これらは意図して発生させたものではなく、サーバー設定やCMSの初期設定が原因で起きることがほとんどです。

CMS設定の問題

WordPressなどのCMSでは、設定次第で意図しない重複ページが自動生成されることがあります。

カテゴリページやタグページが記事本文と同じ内容を表示していたり、ページネーション(?page=2等)で本文が分割表示されたりする場合が該当します。

類似コンテンツの量産

同じキーワードをターゲットにした似た記事が複数存在する状態も、広い意味で重複コンテンツの問題になります。

特にAI生成コンテンツを活用する場合、似たような構成・似たような結論の記事が量産されやすく、キーワードカニバリゼーションを引き起こすリスクが高まっています。「キーワードカニバリゼーションとは?SEOへの影響と確認・解消方法」も合わせて確認しておきましょう。

重複コンテンツの見つけ方

重複コンテンツは「存在に気づけない」ことが最大のリスクです。以下の方法で定期的にチェックしましょう。

Google Search Consoleで確認する

GSCの「ページのインデックス登録」レポートで、以下のステータスが表示されているページがないか確認します。

重複に関連するGSCのステータス
  • 重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました
    設定したcanonicalとGoogleの判断が食い違っている状態
  • 重複しています。ユーザーにより、正規ページとして選択されていません
    canonicalが未設定で、Googleが重複を検知した状態

各ステータスの詳しい対処法は「「重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」の原因と対処法」と「「重複しています。ユーザーにより、正規ページとして選択されていません」の原因と対処法」で解説しています。

inSiteでインデックス状況を監視する

inSite(インサイト)は、インデックス状況を毎日自動で取得するサイト管理ツールです。重複ステータスのページが新たに発生した場合、ダッシュボード上で変化をすぐに確認できます。

GSCを毎回手動で確認しに行く運用だと、重複の発生から発見まで数週間〜数ヶ月のタイムラグが生じがちです。inSiteなら日次で自動チェックされるため、問題の早期発見と対処が可能になります。

\ 重複ページの発生を毎日自動でチェック /

inSite(インサイト)

インデックス状況・内部リンク構造・検索パフォーマンスを毎日自動取得。重複ページの発生をいち早く発見し、対処が必要なページを一覧で確認できます。

inSiteのインデックス状態チェック機能のダッシュボード 無料で試してみる ↗

Screaming Frogでサイト全体をチェックする

Screaming Frog SEO Spiderでサイト全体をクロールすると、重複タイトル・重複ディスクリプション・近似コンテンツを一括で検出できます。500URL以下のサイトなら無料版で十分対応可能です。

inSiteとの使い分けとしては、Screaming Frogは「サイトリニューアル時などのスポット診断」、inSiteは「日常的なインデックス状況の継続監視」が得意分野です。

重複コンテンツの対策方法

重複コンテンツが見つかったら、状況に応じて適切な対策を選びましょう。canonical・301リダイレクト・noindexの3つが基本的な手法になります。

重複コンテンツの対策フローチャート(canonical・301リダイレクト・noindexの使い分け)

canonicalタグで正規ページを指定する

最も汎用的な対策がcanonicalタグです。重複ページのHTMLに以下のタグを追加し、「このページの評価は正規ページに集約してください」とGoogleに伝えます。

<link rel="canonical" href="https://example.com/original-page/" />

URLが複数存在するが、どちらのページもユーザーに見せたい場合(例: パラメータ付きURLの検索結果ページ)に適しています。canonicalタグの詳しい仕様は「「代替ページ(適切なcanonicalタグあり)」とは?基本的に対処不要な理由を解説」を参照してください。

301リダイレクトで統合する

古いURLを新しいURLに恒久的に転送する方法です。ページを統合する場合や、URLの変更を行った場合に使います。

# .htaccessの例
Redirect 301 /old-page/ https://example.com/new-page/

canonicalとの違いは、301リダイレクトはユーザーも自動的に転送される点です。古いページにアクセスしたユーザーが404エラーを見ることなく、正しいページに到達できます。

noindexで検索結果から除外する

検索結果には表示させたくないが、ページ自体はサイト内に残しておきたい場合に使います。例えば、サンクスページや管理画面用のページなどが該当するでしょう。

<meta name="robots" content="noindex" />

noindexの詳しい使い方は「「noindexタグによって除外されました」とは?対処が必要なケースと解除方法」で解説しています。

コンテンツ自体を差別化する

類似記事どうしのカニバリゼーションが原因の場合は、技術的な対策ではなくコンテンツの統合または差別化が根本的な解決策になります。

コンテンツ面での対処法
  • 統合する
    2つの似た記事を1つに統合し、不要な方から301リダイレクト
  • 差別化する
    各ページに独自の一次情報・事例・切り口を追加し、検索意図を明確に分ける

よくある質問

重複コンテンツはGoogleのペナルティ対象ですか?
通常の重複コンテンツはペナルティの対象ではありません。Googleは悪意のない重複に対してペナルティを科さないと明言しています。ただし、他サイトのコンテンツを大量にコピーするなど悪質なケースはペナルティの対象になる可能性があります。ペナルティでなくても評価の分散による順位低下は起きるため、対策は必要です。
どのくらいの一致率で重複と判断されますか?
Googleは具体的な数値基準を公開していません。「完全一致」だけでなく「非常によく似た内容」も重複として扱われます。判断はGoogleのアルゴリズムに依存するため、「何%以上で重複」という明確なラインは存在しないと考えてください。
canonicalタグと301リダイレクトはどちらを使うべきですか?
URLを残したままで評価だけを統合したい場合はcanonicalタグ、ページ自体を統合してユーザーも転送したい場合は301リダイレクトを使いましょう。迷った場合は、ユーザーがそのURLに直接アクセスする可能性があるかどうかで判断すると良いでしょう。アクセスする可能性があるならcanonical、ないなら301が適切です。
重複コンテンツを放置するとどうなりますか?
検索順位が伸びない、クロールバジェットが無駄になる、内部リンクの効果が分散するといった問題が発生します。特に大規模サイトでは影響が大きくなるため、発見次第早めに対処することをおすすめします。

まとめ

重複コンテンツへの対策は、インデックス管理の基本です。以下の記事も合わせてご覧ください。

関連記事 インデックスカバレッジとは?全18ステータスの対処優先度と確認方法 関連記事 SEOチェックリスト|インハウス担当者が確認すべき項目を優先度付きで解説
この記事のポイント
  • 重複コンテンツとは同一または酷似した内容が複数のURLに存在する状態のこと
  • ペナルティではなく「評価の分散」が最大の問題。検索順位が伸びない原因になる
  • URL構造・CMS設定・類似記事の量産が主な発生原因
  • canonical・301リダイレクト・noindexを状況に応じて使い分けるのが対策の基本
  • GSCやinSiteで定期的にインデックス状況を監視し、早期発見する仕組みが重要