見出し画像

【SEO】重複コンテンツを放置してはいけない理由|自動ペナルティがある

「重複コンテンツはペナルティにならない」を信じて放置した結果ひどい目に遭った体験談と、今すぐ修正するべき理由について解説します。


重複コンテンツはペナルティの対象ではない?

結論から言うと、重複コンテンツは検索順位の低下につながります。ゆえに「自動ペナルティがある」と言えます。しかし、Google検索セントラルに「ペナルティにならない」と記述されているため混乱を生じさせています。

「ペナルティ」の概念がGoogleとSEO界隈で異なる

Google公式の「ペナルティ」とSEO用語の「ペナルティ」は概念が異なります。

Google検索セントラルは、重複コンテンツが「ペナルティにならない」と宣言しています。

複数の URL からアクセスできるコンテンツがあっても問題はなく、気にする必要はありません。非効率ですが、手動による対策が必要になることはありません。

検索エンジン最適化(SEO)スターター ガイド

しかし、Googleの言う「ペナルティ」とは「手動による対策」のことであり、「アルゴリズムによって低評価を受ける」こととは無関係です。

なぜなら、当該ドキュメントの「正規化とは」の項目で、重複コンテンツの存在が好ましい状態ではないことに言及しているためです。

サイト上で重複コンテンツが発生することは通常のことであり、Google のスパムに関するポリシーの違反にはなりません。ただし、同一のコンテンツが多数の異なる URL からアクセスできるようになっていると、ユーザー エクスペリエンスの悪化につながることがあります(たとえば、どれが正しいページなのか、2 つのページに違いがあるかどうかなどの疑問をユーザーが抱く可能性があります)。また、検索結果でのコンテンツのパフォーマンスを追跡することが難しくなる可能性もあります。

正規化とは

まとめると「重複コンテンツを理由にGoogle担当者が手動で検索結果から除外することはないが、ユーザーエクスペリエンスの悪化というマイナスの影響はある」ということです。これを非公式なSEO用語で「自動ペナルティ」と言います。

検索順位の低下につながる理由

GoogleはURL単位でコンテンツを評価しているため、「myskc.php」と「myskc.php?id=1」の2つのURLが存在するとそれぞれをインデックスしようとします。この結果コンテンツの評価が分散してしまい、「myskc.php」「myskc.php?id=1」の両方が「それほど有益でもないページ」という評価に落ち着いてしまうのです。

もう1つ重要なのが、上記引用箇所のように「ユーザーエクスペリエンスの悪化につながることがある」と公式に言及されていることです。実際のユーザーがいちいちURLのパラメータを見ているのかというと甚だ疑問ですが、Google公式がそう言うなら、重複状態は解消するしかないでしょう。

放置した結果ひどい目に遭った体験談

重複コンテンツを放置した結果、2023年10月のコアアップデートで検索流入が3分の1にまで低下しました。理由はこれだけではないと思いますが、以下の対策を取っても検索流入が一切変化しない状況です。

  • 著者情報の表示

  • 問い合わせ、プライバシーポリシーなどのページの設置

  • 記事のリライト

  • 内部リンクの再構築

  • ページスピードの改善

  • 新たな外部リンクの獲得

  • ユーザーの役に立たない記事の削除

果ては、競合が記事を書いていない「ロングテールキーワード」にドンピシャな記事を書いても『ドンピシャじゃないサイト』より下位に表示されます。これはサイト全体の品質が低評価を受けていると言わざるを得ません。

何を隠そう、弊サイトは463ページのコンテンツに対し、約16,500ページの重複・低品質コンテンツが存在する状態なのです。要するに、サイトの97%がダメページというわけです。

低品質コンテンツに変化してしまった事例

当初「重複コンテンツ」にカウントされていたものが、「インデックス未登録」に移動する事象が観測されています。

重複から低品質への移動事例

こちらは弊サイトのSearchConsoleのデータですが、もともと「重複コンテンツ」だったものが、クロールを経ずに「インデックス未登録」にごっそり移動しています。

弊サイトで発生している重複コンテンツは「スラッシュ区切りのパラメータ」を付されたスパムリンクで生じたもので、下記画像のように「画像・CSSを一切読み込まず、すべての内部リンクが間違っているダメページ」ですから、Googlebotが「重複か、低品質か」を決めあぐねているのかもしれません。

正規ページと重複ページ

さらに重複コンテンツの一部がインデックス登録されてしまう事態にも見舞われ、その数は最大1,000ページに及び、本来のコンテンツ463ページに対して2倍以上の「ダメページ」がGoogleの検索結果に出てしまいました。

このように、「重複コンテンツ」が「低品質コンテンツ」「検索結果に出てしまう」など状態が変化するため、放置していると致命傷になりかねません

弊サイトではこれらの重複状態の解消に向けて対策を実施しています。その具体的な方法は次の関連記事を参照してください。

検索流入の低下の原因が別にある可能性

一方で、弊サイトに発生した重複コンテンツは、本来スパムとGoogleしかアクセスしないURLです。サイト上のどこにもそのような重複コンテンツへの内部リンクはなく、Googleが検索結果に出しさえしなければ、ユーザーエクスペリエンスが悪化することもなかったはずなのです。

そう、内部リンクです。

弊サイトでは、内部リンクがSEO的に正常に動作していない可能性が浮上しています。もし本当にそうなら、本来のコンテンツ463ページも、重複コンテンツ16,500ページも、どちらも「内部リンクのない宙ぶらりん状態」です。

すると「サイト上のどこにも重複コンテンツにリンクしていない」どころか「そもそも内部リンクがない」ために「ユーザーエクスペリエンスが著しく悪いサイト」と判定されても仕方がありません。

これについては検証中のためはっきりしたことが言えないのですが、原因は「サイトマップのlastmodが古すぎること」にあるのではないかと推測しています。これについては次の関連記事で解説しています。

今すぐ重複状態を解消しよう!

弊サイトの検索順位低下の原因が「重複コンテンツ」だけではなかったとしても、これがある日突然「低品質コンテンツ」に移動したり、「検索結果に出る」など状態が変化する以上、重複コンテンツを放置してはいけません

現在筆者は、これら大量のページを処理したことをGooglebotに認識させるのに苦労しています。試行錯誤の末、効果も上がっていますので、これから重複コンテンツを処理する方は次の関連記事も参考にしてください。

いいなと思ったら応援しよう!