重複コンテンツに対する施策 #22
Google Search Consoleにサイトマップを送信したのが2022年3月6日ごろ。
2,796ページあります。
20日間ぐらいたったところ確認してみると、
有効が1,764ページはわかるのですが、除外が5,436ページ!?
パラメーター付きのページは別ページとみられている
原因はすぐに判明。
ユーザーの動きを把握するためにURLにパラメーターを設定したのですが、どうやらパラメーターがついたURLは別ページとみられているようです。
これらが別ページとしてGoogleからは見られているようです。
この問題としては、全く同じ内容のページが複数存在していること。
下手したらGoogleから重複コンテンツのペナルティを受けてしまう。
どうすればいいのか?ググってみたところ、URLの正規化というものをしたほうがいいらしい。
要は、
不動産アフィリ.com/aaa.html
不動産アフィリ.com/aaa.html?1
不動産アフィリ.com/aaa.html?2
不動産アフィリ.com/aaa.html?3
不動産アフィリ.com/aaa.html?4
不動産アフィリ.com/aaa.html?5
のうち、
どれが正規版かをGoogleに知らせておいてね、ということらしい。
知らせる方法はいくつかあるのですが、rel=canonical <link> タグをヘッダーに記載することで自分は対応。
<link rel="canonical" href="不動産アフィリ.com/aaa.html">
こんな感じで各ページのヘッダーに記載するだけ。ということでさっそく対応しました。
これで恐らくペナルティを受けることはないでしょう。
インデックス登録されましたが、サイトマップに送信していません
有効の詳細をみてみると不思議なメッセージが。
全てのページをサイトマップに送信しているはずなのですが。。
これも結局はパラメーターの問題。
パラメーターが付与されたURLがインデックスに登録されていました。
で、よくみると、
不動産アフィリ.com/bbb.html
不動産アフィリ.com/bbb.html?1
不動産アフィリ.com/bbb.html?2
不動産アフィリ.com/bbb.html?3
のうち、
不動産アフィリ.com/bbb.html?1
不動産アフィリ.com/bbb.html?3
がインデックスに登録されていたりします。
パラメーターが付与されているだけで全く同じページがインデックスに登録されている。
あんまりよろしくない状況な気がします。
とりあえず様子をみましょう。
Google式10Xに挑戦中!