20060617 インターネットアーカイブ(6)
最近、雑記草の記事でリンクした先のページの消失が頻繁に起こるようになってきた。これは以前から起こっていたかも知れないが、近頃は特に気になる。
以前から記事にリンクを設定する時、そのリンク先として直ぐに消失しそうなページは避けてきた$${^{*1}}$$。直ぐに消失しそうなページとは個人が運営しているページである。こういうページには滅多にリンクしない。できるだけ組織で運営されているサイトのページ、企業、大学の研究室、政府関係などに絞ってきた。海外のページは日本のものに比べて比較的寿命が長いので、あまりこだわらなかった。こういったページでも何年かするとサイトの構造の見直しや住所変更などがあるので、リンク切れがどうしても発生する。
ところが数ヶ月前に書いた記事でもリンク切れが時々発生している。そこで切れたリンクの先のページに直ぐに辿り着けるように表紙にインターネット・アーカイブ$${^{*2}}$$のリンクを設定した。これでリンク先の住所$${^{*3}}$$を検索すれば、かってその住所に存在したページの内容を閲覧することができる。インターネット・アーカイブにそのページの内容が記録されるまでには数ヶ月から一年程度かかる。世界中のサイトの内容を収集しているのでそれぐらいの時間がかかってしまうようだ。非営利組織で運営されているのでGoogleのように昨日書いた記事が今日$${^{*4}}$$既にキャッシュに保存$${^{*5}}$$されているというわけにはいかないのだろう。
表紙$${^{*6}}$$の「Wayback Machine」と書かれたバナー$${^{*7}}$$をクリックすると別のウインドウに「Wayback Machine」のページが開く。「http://」から始まるリンク先のページの住所を入れてボタンを押すと、そのページが記録された時期の一覧が示される。閲覧したい時期をクリックすれば記録されたページが表示される。
記事を書く際に、最初からインターネット・アーカイブにリンク$${^{*8}}$$しておけばいいような気もするが、完全に記録されていない$${^{*9}}$$場合やまだ一度も記録されていない場合もある。まずは直接リンクを貼る方針にしている。
*1 20020210 インターネットアーカイブ
*2 Internet Archive
*3 URLとは 【Uniform Resource Locator】 ─ 意味・解説 : IT用語辞典 e-Words
*4 20021001 Google
*5 Googleの特殊機能
*6 雑記草の表紙
*7 バナー広告とは 【banner advertisement】 ─ 意味・解説 : IT用語辞典 e-Words
*8 20030921 インターネットアーカイブ(3)
*9 20040315 リンク(3)