Graph DBの必要性について
最近、思うのはRDBMSの限界ってありませんか?
WEBサービス、アドテク技術などがこれまで関わってきていて、
データの種類って大きく3つに別れると思っています。
- Master data
- Transaction data
それに加えて
- Relation data
というのがあると思ってます。
Master dataを記述するにはRDBMSが適している。
Transaction dataは以前はHadoop, Redshift, 最近ではStorage + BigqueryもしくはS3 + Athena
それに加えて
Relation dataの記述方法が重要になって来ると感じてます。
というのもRDBMSのRがRelationなので、「え、RDBMSがRelatoinを記述するのに適しているんじゃないの?」って発想があります。
有限数と有限数のRelationならば問題ないと思ってます。ただ、億単位(まぁ有限っちゃあ有限だけど)と億単位のRelationを記述するにはRDBMSはもう無理だと思ってます。
理由としては、例えばTwitterのFollow, Followerって億Combination億のデータ量が含まれてます。
MySQLとかでExplainするとそれはもう無理じゃないですか。
だとした時にこれまではKVSを使ってやると。
ただ、KVSも弱点があって、Relationの属性やScoreの定義がしにくいという問題があります。
そこで次のソリューションとしてGraph論を使う必要が出てきます。
さて、本題(なげーな)。
Graph論を記述するためのDBとしてGraph DBがあります。
最近、調査を始めているんですが、日本でうまく活用できている事例が全然ありません。
そこで、もしこの概念に興味ある方がいれば一緒に勉強しませんか?
また、すでにその知見がある方、よろしければランチしませんか?(おごります)
ということを最近進めています。
ぜひ、刺さった方お話ししましょう〜!!