見出し画像

【SEO検証中】サイトマップのlastmodは更新しないとヤバい?

サイトマップのlastmodの日付が古すぎることで、内部リンクがSEO上、まったく評価を受けていない疑念が生じました。そこでSearchConsoleのデータから考察して、講じた対策がどのような影響をもたらすか(またはもたらさないか)の検証を開始した無料記事です。


lastmodを更新していなかった!

サイトマップには「lastmod」で最終更新日を指定するものですが、私は日付を更新していませんでした。古いものだと2014年です。

lastmodの日付が古い見本

Google公式見解で「(lastmodの日付が正確でないと)最終更新日に関してはもう信じられなくなります」と言われていたことから「もう手遅れだろう」「更新するのもめんどくさい」という理由で放置していたのです。

lastmodの日付が古いことで起きる問題

古すぎるlastmod」の影響で「内部リンクが正常に動作していないのではないか」という疑念が生じました。理由は以下の3点です。

  • 「URL検査」で表示される「参照元ページ」が更新されない

  • クロールリクエスト「検出」に「昔からあるページ」ばかり表示される

  • httpページを未だクロールしている

1.「URL検査」で表示される「参照元ページ」が更新されない

2024年5月初頭に内部リンクを大きく削減し、関連性の高いものとカテゴリトップに限定しています。ですが、約2ヶ月経った現在も「URL検査」で表示される「参照元ページ」に「すでにリンクを外しているページ」が表示され続けています。

参照元ページが古い情報のまま

ちなみに、サイト上のほとんどのページの参照元が「blacklist_01.php」「ginko2.php」になっているのですが、サイトマップを確認したところ、どちらも「気まぐれにlastmodを更新したことのあるページ」でした。

そして比較的最近アップしたページに至っては、サイトマップしか参照元にないという状況です。ですが、サーチコンソールの「リンク」で当該ページを確認すると、関連記事が多数表示されています。下記画像のように、内部リンク自体は認識されているようです。そのため「たいした問題ではない」と考えることもできます。

一方で、「SEO評価0点のダメリンクがカウントされているだけ」の可能性もあります(後述します)。

内部リンクの数はおよそ正確

もう1つ気づいたのが、「lastmodが新しいページは参照元にサイトマップがある」「古いページは参照元にサイトマップがない」ことです。つまり、Googlebotは当該ページをクロールする際にサイトマップから直接飛んできていないと思われます。

2.クロールリクエスト「検出」に「昔からあるページ」ばかり表示される

公式ヘルプによると、「検出」とは「初めてクロールするページ」について付されるフラグだそうです。にも関わらず、「昔からあるページ」が「検出」され続けていることに気づきました。

古い記事が検出され続けている

サイトマップを確認したところ、「検出」され続けているのは「lastmodが2018年以前のページ」だということが判明しました。

(24/07/05追記)
この件は無関係だったと考え直しました。おそらく「検出目的」で出発したbotがリダイレクト先の「昔からあるページ」に着地し、「リダイレクト元」「リダイレクト先」両方に「検出」フラグを立てた可能性が濃厚です。

3.httpページを未だクロールしている

弊サイトがhttpsに移行したのは2018年のことですが、6年前に移行したにも関わらず未だGooglebotがhttpページを毎日クロールしていることも判明しました。

httpページを未だクロールしている例

httpからhttpsへのリダイレクトは6年前より実施していますから、httpページにはアクセスできないはずです。にも関わらず6年間も毎日クロールを試み続けているのは、何か参照元があるはずです。

しかし、そのhttpページをURL検査してみたところ、参照元に表示されたのは独自ドメイン移行前のURLで、8年前に削除済みのページでした。

考察

このことから浮上したのが、「リンクの塩漬け」というペナルティを受けている可能性です。

Yahoo seo Google様はかなり昔からwebサイトを運営されており、弊サイトと似たような問題に言及されているため参考にしているのですが、低品質ページからのリンクジュースを流さない「リンクの塩漬け」ペナルティについて考察されています。

つまり、弊サイトで発生している問題は「lastmodが古すぎるためにリンクジュースが流れず、内部リンクが評価されていない」のかもしれません。

リンクの一覧にリンクジュースは関係ない

SearchConsoleのリンクの項目には、内部リンク約2万件が表示されています。しかし、この内部リンクに価値が認められているかどうかはわかりません

なぜなら、外部リンク欄にはnofollowの付されたリンクも表示されているためです。内部リンクにnofollowを付したことがないため確定ではありませんが、リンクの項目に内部リンクがカウントされていたとしても、それにリンクジュースが流れているかどうかとは関係がないと考えられます。

(24/07/05追記)
内部リンクの一覧について、リンクジュースの濃さを読み取れるのではないかと考察しました。

Googlebotのクロール経路

面白いことに、弊サイトのどのページをURL検査しても、参照元が「blacklist_01.php」「ginko2.php」「検査したページのhttpバージョン」になっています。そしてそのhttpバージョンの参照元は「独自ドメイン移行前の削除済みページ」です。おそらくGooglebotはこれらのページを経由してクロールしに来ています。

上述の「リンクの塩漬け」ペナルティが存在すると仮定すると説明がつきます。「古すぎるページからのリンク」は0点なので、「削除済みのページ」「httpページ」といった「Googleのデータベースに眠っているページ以外に評価できるリンクがない」と判断されている可能性です(削除したのもhttps化したのもlastmodよりは最近なので・・・)。

一方で「参照元は単に新規発見時の経路を記録しているだけ」という説もありますが、その場合はサイトマップかインデックスリクエスト時の「セルフ参照」になるはずで、加えて当該ページに直接アクセスすれば済み、わざわざ「参照元」を経由するのは非効率です。以上より、「特にリンクジュースの濃いリンク」が機能しているか確認する意味があると考えています。

「lastmodのないサイトマップ」でも同様の事象が発生

現在、並行して「/1000」で生じた重複ページをリダイレクト処理し、「誤ったURL」をサイトマップに記載して送信することで、Googlebotに再クロールを促進しています。

この「ダメページだけのサイトマップ」はURL件数が数千件に上ることから、lastmodを付与するのがめんどくさくて、URLだけをびっしり書いたtxtファイルをサイトマップとして送信していました。

その結果、サイトマップをきっかけに再クロールを開始したのに、サイトマップを参照していないという事象が見られました。これに関して詳しくは次の関連記事をご覧ください。

対応策

サイトマップのlastmodをすべて修正し、ついでにスパムリンクで生じた重複ページについてもlastmodを付与しました。(重複ページの発生経緯については次の関連記事を参照。再クロールを促すため一時的にサイトマップを作成しています)

新しいサイトマップ

結果が出るまで時間がかかるとは思いますが、何か変化が観測できたら随時本記事を更新します。

2024年6月30日時点の状況

検索流入ですが、6月下旬に入ってから徐々に減少を続けており、その原因として次の2つが考えられます。

  • 重複・低品質コンテンツのペナルティ

  • 内部リンク最後の砦だった「blacklist_01.php」「ginko2.php」からのリンクを5月に外してしまった

  • 24/06/20~29のスパムアップデートに捕捉された

時期的にスパムアップデートの可能性が高いのですが、いずれにせよ内部リンクの影響は否定できません。これについて次の記事で詳細を考察しています。

この記事が気に入ったらサポートをしてみませんか?