見出し画像

20040316 リンク(4)

 先日$${^{*0}}$$、「Internet Archive$${^{*1}}$$」を使ってリンクを貼ることについて書いた。「Internet Archive$${^{*2}}$$」はweb上のデータをそのまま収集して公開しているので、本当のページと瓜二つのページをいつでも本当のページの状態とは一切関係なしに閲覧することが出来る。「直接リンクを断りなしにしてくれるな」と訴えているページにリンクを設定する場合や直ぐに消えてなくなってしまうようなページへのリンクに使える。

 どんなサイトでも永続性が保証されているわけではないから、最初から雑記草の記事中のリンクは全て「Internet Archive」を介すればいいような気がする。

 ところがそうはいかない。「Internet Archive」が全世界のデータを収集するのに結構時間が掛かる$${^{*1}}$$のである。雑記草が取り込まれている様子を見てみると半年前までの記事までしか取り込まれていない。「Internet Archive」の解説にも数ヶ月毎に巡回している$${^{*3}}$$と書いてある。

 一方、検索サイト$${^{*4}}$$は毎月巡回して新しいサイトを追加$${^{*5}}$$しているらしい。登録済みのページの更新は一日程度$${^{*6}}$$で行われている。検索サイトで検索できても「Internet Archive」にそのサイトのデータが取り込まれていない場合がある。

 最近の記事は「Internet Archive」では見ることが出来ないのである。つまり最近公開された記事は直接リンクするしかない。

 逆に少なくとも「Internet Archive」に掲載されるまでの期間は公開されているようなサイトを雑記草の記事の中でリンクするという基準を作って、最初から「Internet Archive」を使えば、過去の記事のリンクを見直す必要はまずなくなる。

 最終的な問題は「Internet Archive」に永続性があるかどうか$${^{*7}}$$だ。雑記草よりも長生きしてくれるのだろうか。

*0 20040315 リンク(3)
*1 20030921 インターネットアーカイブ(3)
*2 Internet Archive
*3 Internet Archive Frequently Asked Questions
*4 Google
*5 Web マスターのための Google 情報
*6 20021001 Google
*7 公開講演会:生物多様性研究・教育を支える広域データベース 日本の生物多様性関連Webサイト:Wayback Machineの利用について

この記事が気に入ったらサポートをしてみませんか?