![見出し画像](https://assets.st-note.com/production/uploads/images/37587412/rectangle_large_type_2_87f422adfccd09d07436dad33fc9c4dc.png?width=1200)
20020627 イメージ検索
Googleには「イメージ検索$${^{*1}}$$」という便利な機能がある。語句を入力するとその語句に関連している画像が世界中のwebのページから抽出されるのである。
例えば井伏鱒二$${^{*2}}$$はどんな顔だったか、と言うときに使えば直ぐに出てくる$${^{*3}}$$。普通の検索$${^{*4}}$$では文字しか表示されないので、抽出されたページをいちいち開かないと井伏鱒二の顔が掲載されているのかどうか判らない。
画像に近くに配置してある文字列や画像の説明文や見出しを解析して抽出$${^{*5}}$$する仕組みだそうである。
試しに検索語句を「雑記草$${^{*6}}$$」にしてみる。雑記草のサイト内に掲載されている数々の画像の一部が抽出されている。雑記草のバナーなどを使ってリンクして頂いているサイトも抽出されている。
しかし抽出された画像が掲載されているページを見ても「雑記草」という文字は含まれていないのもある。画像の近くに「雑記草」という文字列は全く配置されていないのである。これは一体どういうことなのか。
よくよく調べてみると雑記草の記事中でリンクしたサイトに掲載されている画像が抽出されているのである。この麻雀牌の絵$${^{*7}}$$は2年ほど前の記事$${^{*8}}$$でリンクしたページに掲載されている。
これは凄い機能と言うべきか、お節介な機能と言うべきか判断が難しい。何やら検索語句とは関係ない余分な画像も抽出されやすくなりそうな気もする。検索語句が含まれたページのリンク先だけを表示するのではなく、リンク元の情報も表示してくれれば非常に助かる。
「zakkisou」で検索をしてみる。雑記草で掲載されている画像の一覧が表示される。しかしこれが全てではない。取りこぼしもあるようだ。
*1 Google イメージ検索
*2 早稲田と文学(井伏鱒二)
*3 井伏鱒二 | 著者プロフィール | 新潮社
*4 井伏鱒二とは - コトバンク
*5 20020621 蝶の尿寄せ
*6 雑記草
*7 www.asahi-net.or.jp/~mn8y-kt/font/mahj_sc.gif
*8 20000830 盲牌