時間が無限に融けるようになった国会図書館デジタルアーカイブ

2022年12月26日 18:00

　以前、「国会図書館デジタルアーカイブ」の事を取り上げ、「身近に調べたいならまずコレ」という旨を紹介しましたが、2022年12月にリニューアルされてすさまじいアーカイブへと変化しました。

　一言でいうと「時間が溶ける」。　

　笑いごとでも冗談でもなく、本当にすさまじい量の情報が発掘できるようになったため、無限に時間が溶けるようになりました。

　圧倒的に読みやすくなったページデザインに、より精鋭化された検索機能、これまでは何かと不便だった著書名などもわかりやすく見られるようになり、「グレードアップ」の言葉がこれほど当てはまる事は早々ないです。

恐るべきは「全文検索」という機能が付いた点です。

　話によるとOCR（光学文字認識、書いた文字を識別するという最新技術の一つ）を導入して、年代も書体も構成もバラバラな本たちを次々とスキャンして、文字認識に成功し、それをデータベースにする事で「全文検索」を可能にした、といいます。

　これがとにかくすごい。これまでなら作品名や作家名、よくて目次や記事名くらいしか検索できなかったものが、全文検索でより一層深い領域まで調べられるようになりました。

　これはどういうことか。

　簡単に言うと、「こんな本や雑誌には出てないだろう」というような見落としを防いだり、「この雑誌は余りにも数が多すぎてその中から一行を探すのが面倒くさい」といった手間を大幅に削減してくれるようになった、というわけです。

　これは研究・調査をしている人なら（あるいはこの連載に感化されて始めるようになった人も）わかると思いますが、資料というのは意外な所に転がりたがるものです。

「え、こんな人がこんなところに？！？！」なんて案件はよくよくある事です。

　個人的な話をすると、医学雑誌や軍事雑誌に芸人の話が出ていたり、まるで関係なさそうな人の自伝や評伝の中に思わぬ記載があったりします。

　これらの噺や記載というのは目次だけでは到底把握の出来ない物だったりします。無理もありません。

「雑報」の中に実は自分が欲しいプロフィールや動向が記されていたり、「木枯らし」なんてまるで関係なさそうな小説や目次の中にいきなりお目当ての資料が出て来たりするのですから、「ここから推測してはかり知って下さい」なんてことは無理に等しいわけですね。

　そうした推測をグッと確信に近づけてくれるのが、本文検索と言う訳です。

何千何万とある文字の海や森の中から「多分これではないか」という文字列を、ジャンルや年代関係なく見つけ出してくれるのですから、これを使わない手はありません。

　時間が溶ける――と表現したのはこの「本文検索」によって、ドンドン新情報が見つかる、それがゆえに時間がどんどん流れていく、と表現したかったというべきでしょうか。

　何はともあれ恐ろしいグレードアップが来たものです。この感動を一刻も早く味わってほしい所存です。

　このグレードアップの背景には、表現規制反対やデジタルアーカイブ推進を謳って若年層に多大なる人気を集めている参議院議員・山田太郎氏などの諸氏の活躍が大きいといいます。

　彼らは党派や思想を超えて、官庁や行政に掛け合い、「5年間で200億の予算確保」「ネット閲覧可能とするための法改正」といった成果を勝ち取った――といいます。

　SNSや山田氏の記事などを見ると、その旨がきちんと明記されています。

　曰く、出版社や図書館、行政と掛け合って法改正を行い、その上で資料のスキャンや整理を行う人材を整備。高価なOCR（光学文字認識、書いた文字を識別するという最新技術の一つ）によって、文字認識に成功――そのデータを元に全文検索を可能にした、といいます。

　これは何処の政党であれ、アッパレとしか言いようのない見事な仕事と言えるでしょう。こういう地道な仕事こそ、実は議員の本領と言えるものではないでしょうか。

　逆に皮肉を言えば「学術国家」を謳いたいなら、これくらいの事をせねばまず無理でしょう。やれ著作権、肖像権と日本は権利ばかりうるさくて、公開や共有に踏み切ることが出来ない――その中で、どうやって人々は研究をすればいいのでしょうか。

「役に立つ研究や天才だけを積極的に登用して、大切にしていこう」と言わんばかりの態度を見せる官僚や議員にそう尋ねたい所存であります。

　愚痴はさておき、本当に素晴らしい更新が、グレードアップが来たな、と久々に唸ってしまいました。

　クリスマスはこれらの検索で無限に時間が溶けてしまったのは言うまでもないでしょう。楽しくもわびしいクリスマスでした。

いいなと思ったら応援しよう！