見出し画像

20021002 Google(2)

 昨日、Googleの更新の速さ$${^{*1}}$$について書いた。更新情報が速いとweb上に出てきて直ぐ消えてしまうようなあまり有用ではないサイトが検索の邪魔になるのではないかと書いた。

 その点は心配なかった。ページランク$${^{*2}}$$という考え方があって、これによって検索語句に対してその語句を含む重要度の高いページが最初の方に表示されるような仕組みになっているらしい。

 重要度が高いページというのはどういうことなのか。多くの人に見られているページは無条件に重要度が高いと考える。実際は必ずしもそうではないが、みんなが見に行くページならば何も役に立たないと言うことは殆どないだろう。

 ところが、検索エンジンはあるページがどれだけ人々に見られているかを把握することは出来ない。その代わりあるページがどこからリンク$${^{*3}}$$されているかは判る。沢山リンクされているページは多くの人々に見られていることになるのだろうか。極端な場合、仲間内だけでお互いにリンクを貼り合っているだけではみんなが見ていていることにはならない。

 Googleでは「みんなからリンクされているページがリンクしているページはみんなに見られている$${^{*4}}$$」という考え方を採用しているらしい。どれだけリンクされているかを数値に置き換え$${^{*5}}$$、高い数値のページからリンクされされたページは高い数値のページになる。仲間内のリンクでも数値はある程度増えるかもしれないが、Yahoo!やGoogleなどの圧倒的に数値の高いページ$${^{*6}}$$に比べれば殆ど無視出来るぐらいの低い数値だろうから、この仕組みの信頼性は保たれている。

 「エバルト球」という語句で検索をしてみる。表示されるページは殆どが学術的な内容のページだが、学術とはかけ離れている雑記草が上の方に表示されている。(※この現象は、2002年10月当時起こっていた)「エバルト球$${^{*7}}$$」を検索する人にとって邪魔になっているだろうが、仕方がない。完全な仕組みというのは不可能なのである。

 こう考えているとページランクがあるので更新情報の速さというのはそれ程重要ではないように思えてきた。

*1 20021001 Google
*2 Google の人気の秘密
*3 20000713 リンク
*4 Google の秘密 - PageRank 徹底解説
*5 google対策攻略とPageRank/グーグル研究-GOOGLE/リンクポピュラリティー
*6 登録テクニック https://web.archive.org/web/20021108132348/http://www.p-ch.jp:80/tec/detail.asp?ids=138&w=google+%8c%9f%8d%f5%83G%83%93%83W%83%93
*7 20011110 情報の空洞化

いいなと思ったら応援しよう!