リファレンシャルデータベースの可能性

データベースはリレーショナルデータベースの使い勝手が非常に良いということで、それがほぼデファクトスタンダードとなっているといって良い。リレーショナルデータベースとは、データベース間で共通キーを持つことで、その二つのデータを相互参照させて統合できるという仕組であり、これによって大量のデータを自由自在に切りはりするというビッグデータ時代の基礎が整ったといえる。

しかしながら、このやり方は、データ形式が整っていることを前提としており、そのためにデータベースの作成が一定のフォーマットにしたがって行われないと、データ参照ができなかったり、それがうまく結びつかずに不完全なデータになったりする一方で、フォーマットにそぐわないデータはゴミとして切り捨てられる、ということになる。つまり、データはフォーマットありきであり、フォーマットに当てはまらないデータは役立たないゴミ扱いになり、だから、データは必然的に規格にあったものに揃えられることになる。

そのやり方の限界が典型的に現れるのは、一つのコンテンツに複数のタグをつけていくつかの文脈での解釈をするというときに、データベースが急速に肥大化するということがある。それを小さくするためには、どんなタグでも一つの括りに入れて管理する、ということになり、それはテキストマイニングによる検索とほとんど変わらないものとなる。タグというのは分野ごとにこの見方ではこういうカテゴリー、ということを分けて初めて意味を持つものであり、それが分野分けもできずにただタグとしてつけるだけでは見出し語をつけている以上の意味は持たない。

それは、リレーショナルデータベースでは、データベース利用者側の文脈管理はできないことを意味する。一旦データフォーマットが定まったら、その文脈以外のデータは受け付けない、ということになるのだ。全ての情報を既存のデータベースフォーマットに合わせて分類、管理する、というのは、管理する側にとっては非常に楽なのであろうが、データ入力側は自分の考えをそのフォーマットに合わせて分類し、入力することを強いられる。つまり、データ作成時点でデータフォーマット作成者の考えに合わせなければならないのだ。しかも、データフォーマット作成者がそのフォーマットを変えれば、厳密に言えばそれまでのデータだってその解釈は変わりうるかもしれないのだが、リレーショナルデータベース的一括変換によって自動的に新しいフォーマットに変換を強いられることになる。一つ一つは些細なことでも、そんなことが積み重なれば、いつの間にか最初のデータとは全く違うものがデータ格納者の意図として収められ、流通するということにもなりかねない。

リレーショナルデータベースの果たしてきた歴史的役割は大きいとは思うが、もはやその役割は終わりつつあるのではないか。一つの可能性として、リファレンシャルデータベースというものを提示したい。とはいっても、具体的にイメージがあるわけではないが、とにかく個別の文脈をもっと重視したデータベースが必要なのではないか、ということ。いくつかのフェーズがあるのだろうが、一つには分散型データベースでデータベース構成を規定フォーマットとするのではなく、各自がそれぞれ自分の好きなように設計できるようにして、キーにしたい部分はAPIとして外部接続できるようにする、という考え方。それによって、個々人は自分の好きなようにデータベース設計をしながら、データとして共有したい部分についてはキーをつけて外部接続ができるようになる。

もう一つには、いつも書いていることだが、Wikipediaのように、個別文脈の中にその中の一つを深掘りできるようなリンクがついていてそれを伝っていける、という仕組みがあり、それをもう少し深化させられないか、ということ。元々Wikipedia自体リレーショナルデータベースで作られているので、当然一つのテキストからは一つのリンク、ということになるのだが、それを複数選べるようにする、つまり直線的文脈ではなく、一つの言葉の解釈の元となる考えには複数の文脈があることも考えられるので、その参照リンクをもっと充実させられるようなイメージ。実務的には接続用APIを準備し、そこに合わせて接続したいデータベースが該当データを飛ばし、参照元がその可否を決めるなりなんなりして接続できるようにする、といった感じか。

別にリファレンシャルデータベースなどと振りかぶることもなく、既存のデータベースのAPIによる応用拡大、という感じではあるが、とにかくキー一発で全面統合ということではなく、もっと緩やかな接続形態があっても良いのではないか、ということ。完全に頭の中のイメージを文章化できているわけではないが、とにかく私の頭の中では、リレーショナルデータベース的な情報整理はどうも感覚的にフィットしていないようだ。

いずれにしても、リレーショナルデータベースから考え方を少しずらしてみると、ビッグデータ的なデータ活用とは少し違う形のデータの使い方への道も開けるのではないだろうか。デジタル化、といって定められたフォーマットに従って全員がそこに格納される、というのとは違ったデジタル化の方が、より人間の顔をしているのではないだろうか。

誰かが読んで、評価をしてくれた、ということはとても大きな励みになります。サポート、本当にありがとうございます。