【SEO】サイトマップは作るな!失敗事例と成功事例|内部リンクに致命傷を与える仕組み
サイトマップがSEOに与える悪影響について、失敗サイトと成功サイトの2つの事例から検証しています。lastmodが古いことで、内部リンクに致命傷を与えている可能性があります。
まずは結論!
サイトマップは作成しないほうがいいです。なぜなら、筆者運営の「サイトマップのないサイト」が検索結果の上位を独占している一方で、「サイトマップのあるサイト」はまったく上位表示されないためです。
サイトマップがどんな悪影響を与えるかというと、「lastmodが古いと内部リンクが評価されない」ことです。これについて、Googleアルゴリズムの面から詳しくみていきましょう。
低品質コンテンツからはリンクジュースを流さない
本記事で重要になる「アルゴリズムの仕組み」の1つが「低品質コンテンツからのリンクジュースをせき止める」ことです。かつてより(2011年のパンダアップデート・2012年のペンギンアップデート以来)Googleはスパム対策に追われており、不正なリンクをいかに「評価しない」かに注力しています。
このアップデート以降「スパムリンクによる逆SEO」を仕掛ける嫌がらせが流行したこともあり、現在では以下で紹介するようなリンクを「マイナス」にはしないものの「0点」にしていると思われます。
評価されないリンクの例
関連性の低いページからのリンク
前後の脈絡なく張られているリンク
古すぎるコンテンツからのリンク
関連性の低いページからのリンク
弊サイトは「5ちゃんねる掲示板」でコピペになった記事が複数ありますが、最もコピペ数の多い記事は検索順位に影響がありません。一方で、「まとめサイト」にもコピペされた記事については検索順位で長年上位に位置しています。
「5ちゃんねる」と「まとめサイト」の違いは、「特定のテーマに関連する書き込みに絞っているかどうか」でしょう。前者では無関係な(例えば『ぬるぽ』のような)書き込みであふれている一方で、後者はそのような無関係な書き込みを除外しています。
これにより「5ちゃんねるは関連性が低い」「まとめサイトは関連性が高い」と評価されていると言え、前者のような「関連性の低いページからはリンクジュースを流さない」という処理が行われているのです。
前後の脈絡なく張られているリンク
弊サイトは多数の外部リンクをいただいていますが、「本文中でリンクを張られたページ」については検索順位が上昇し、「記事下部でまとめて『参考記事』としてリンクを張られたページ」については検索順位に寄与していません。
たびたびSEO業者が担当するウェブサイトについて「相互リンクをお願いします」とメールを送ってくるのですが、これに応じたことが何度かあります。それらは「記事下部でまとめて『参考記事』としてリンク」または「〇〇で紹介されました!という形でリンク」されたのですが、いずれのページも検索順位に変動が見られません。
一方で、このような依頼と関係なく、他社サイトの本文中で「お探しのファイルはこのサイトで無料配布されていますよ」という形でリンクを張られたページは、検索順位が大きく上昇しました。
このように、「前後の脈絡のないリンクはリンクジュースを流さない」という処理が行われていると考えられます。
古すぎるコンテンツからのリンク
弊サイトにはかつて、大手ニュースサイトで取り上げられた記事があります。当初は検索順位で1位につけていたのですが、時間が経過するにつれて徐々に順位を落としています。
当該ニュース記事は「弊記事と同じテーマ」かつ「本文中での紹介」だったため、当該リンクはかなり高く評価されていたと思われます。しかし、さすがに10年前のニュース記事ですから、徐々にその効果が薄れているようです。
このように、「リンク元のコンテンツの古さに応じてリンクジュースが減る」という処理が行われていると考えられます。
内部リンクの評価にサイトマップを利用している?
Googleによる内部リンクの再評価は「クロールで持ち帰ったデータベース」を用いてオフラインで処理されていると考えられます。
実際、SearchConsoleの内部リンクのデータ更新の際に「サイトのクロール数が急増する」といった事象は観測されていませんから、この推測は正解でしょう。
ではこの際、「リンク元コンテンツの新しさ」をどうやって判断しているのかというと、おそらく「サイトマップのlastmod」を優先利用しています。
「コンテンツの最終更新日」はウェブサイト管理者によって操作が可能であり条件はサイトマップと同じです。また膨大な内部リンクについていちいち「前回のクロール時点との差分」を検出して「最終更新日を検査する」のはあまりに非効率です。ゆえに、サイトマップのlastmodを参照すればGooglebotのリソースを節約できるというわけです。
弊サイトで起きている問題について考えてみる
弊サイトではサイトマップのlastmodを長らく放置しており、古いものだと2013年・2014年のものも多数存在していました。もちろんコンテンツの更新はしており、構造化データで最終更新日もマークアップしているのですが、サイトマップだけは記事作成日のままだったのです。
これにより内部リンクの再評価にあたって「古すぎるコンテンツからのリンク」と判定され、未だ各ページの参照元が「httpからのリダイレクト(6年前)」「気まぐれにlastmodを更新したページ(5年半前)」に限られている現状を生み出しているのです。
筆者がこれらの問題について「サイトマップのlastmodにある」と考えている根拠は、次の関連記事で解説しています。
まとめると、弊サイトで起きている問題は次の通りです。
lastmodが古すぎるために内部リンクが評価されていない
これによりサイトの構造がGoogleに理解されていない
ゆえに重複・低品質コンテンツとの優先順位がつけられず、それらを大量インデックスしてしまった
重複・低品質コンテンツは「スラッシュ区切りのパラメータをつけられる」というスパムリンクにより生じたもので、そのURLはスパムとGoogleしかアクセスしないURLです。当然、ユーザーがこれらにたどり着くような内部リンクは設置していません。(この重複・低品質コンテンツの発生経緯や現在の対策については次の関連記事を参照)
にも関わらず、これらのページが「重複」「低品質」「インデックス登録済み」に振り分けられてしまったのは、「Googlebotがサイト内での優先順位がつけられなかった=内部リンクがゼロ評価」だと推測できるわけです。
Googleによって大量に認識されてしまった重複・低品質コンテンツですが、現在はリダイレクト処理を施した上で「処理済みであることをGoogleに早く認識してもらう」ため、ある方法を取っています。これについては次の記事で解説しています。
SEOが強すぎる別のサイトの事例
筆者は「MY就活ネット」とは別に、趣味でゲーム制作およびそのウェブサイトも運営しています。そのゲームサイトはSEOが強すぎる状況にあり、他の人気作者を差し置いて検索結果の上位10位のうち6つが私です。
特に、就活サイトで「カテゴリページ」がまったく評価されていない一方で、ゲームサイトの「カテゴリページ」は非常に高く評価されています。
どちらもカテゴリページは全記事から内部リンクを施しているのですが、ゲームサイトの決定的な違いはサイトマップを作っていないことです。要は、ゲームサイトはlastmod問題がないため内部リンクが正常に動作しているというわけです。
以下はゲームの詳細記事をURL検査した結果ですが、「参照元ページ」のトップに「カテゴリページ」があり、その次に「サイトのトップページ」が来ています。つまり、ゲームサイトのサイト構造をGoogleが正しく理解していると言えます。
加えて、ゲームサイトも就活サイトと同様に「/1000」のスパムリンクを受け、下記画像のような重複・低品質コンテンツをGoogleが大量に認識しています。
就活サイトではこれら「ダメページ」が大量に「インデックス登録済み」として検索結果に露出してしまった一方で、ゲームサイトでは「ダメページ」が一切検索結果に出ていません。
ゲームサイトはSEOを意識しておらず、「何がテーマの記事なのかわからない」レベルの「純粋な低品質コンテンツ」がもともと大量にあります。それにも関わらず検索結果に「トップページ」「カテゴリページ」が上位表示されるのは、サイト構造と重要なページをGoogleが正しく理解しているからに他なりません。
ここからわかるのは、サイトマップはないほうがいいということです。
アルゴリズムに関する考察
以上のことから、Googleが内部リンクを評価する仕組みを考察しました。
データベース上で内部リンクを検出する
その古さを判定するためサイトマップのlastmodを参照する
「lastmodがなければ」その他の方法で最終更新日を取得する
この段階で「古すぎる」と判断されたらリンク元を調査せずに終了する
就活サイトでは「2」の時点でリンク元に関して低評価を受け、内部リンクのSEO評価は0点のまま終了しました。
一方のゲームサイトでは「2」が確認できず「3」に移り、「新しいリンク」だと確認できたためリンクジュースが流れました。
このように、内部リンクの評価にサイトマップのlastmodを優先利用していると考えられます。