見出し画像

BIをやる人は、スタースキーマを知っておくとよい

もらったデータのファイルをそのまま分析してグラフにしているような初心者BI開発者は、あまり見ることがないのですが、分析のために一番よいデータ構造、データ設計をしないといけない場合、けっこう悩みます。

出身がRDBごりごり開発者だとこれはその前に、スキルマスターしているはずなので、気にしないのですが、たとえばExcelマクロを作っていたような人には、ちょっとこのデータ設計センスを磨かないと、やばいです。

BIは、100万件とか2000万件とかいっぱいデータを複数種類もらってグラフを作ったりして分析するので、データ設計には敏感でないといけません。

そこで知っておくとよいのが、「スタースキーマ」という考え方です。
例によって、私が0から説明すると面倒なのでwww 他人様のコンテンツをリンクします。


中で説明用に使われるのが、この図です。
スタースキーマとは、こんなかんじでテーブル同士がスター状になるのですが(きれいに設計しますと)、まあ、現実はそんなに簡単ではないです。
でもまあ、このスタースキーマを身に着けておくと、話が簡単になります。

(使うとわかりますが、リレーションシップ管理の画面にはいって、テーブルを配置すると、まるでこういうようなスターの絵になるのです。)

上記より引用

ファクトテーブルって、「事実」って意味ですが、これ、RDB技術者からみたら、普通にたとえば取引データの「トランザクションテーブル」かなあと思うとわかりやすいかなと思います。
取引あったら、どんどこ増えていきます。

他のディメンションテーブルは、多くはマスターのことが多いです。たとえば、従業員マスター、商品マスター、顧客マスターなどです。

ファクトテーブルには、たとえば 2024/8/1 商品 りんご 10個を買いましたとかっていう事実があって、ディメンションは 「リンゴ」の商品ID、商品名が入ってる商品マスターがあるって感じです。

これをリレーションシップ管理機能で、商品IDで紐づけするのです。

まあ、私の説明より動画をご覧になるほうがわかりやすいと思います。
(ついでに、MS社のPowerBIにもスタースキーマの説明があるが、あっちがまた、いまひとつわかりにくく、こういうYoutuberのほうがわかりやすい(苦笑) もっとちゃんとしたプロのライターを雇えっていいたい。自分で作ってみて、自分で文章を書かないとちょっとねー。)



AI,脳科学、生物学、心理学など幅広く研究しております。 貴重なサポートは、文献の購入などにあてさせていただきます。 これからも、科学的事実を皆様に役立つようにシェアしていきたいと思います。 ありがとうございます!!