
データ統合基盤で押さえるべきポイント
はじめに
皆さんこんにちは!久しぶりの投稿になります。
今回のテーマはデータ統合基盤(データ活用基盤)を検討する際に押さえておくべきポイントについてです。
現在、データ統合基盤を検討する案件に参画させていただいており、その中でここが大事だなと感じた点がいくつかあったので、私の備忘録もかねて残しておこうと思っています!
走り書きのような形になってしいますが、最後まで読んでいただければ幸いです。
また、今回のブログはデータ統合基盤が何かについてある程度知っている方を前提しています。少しややこしい話になるかと思いますが、お付き合いください。
さて、データ統合基盤で押さえるべきポイントですが、今回は大きく2つあります。
ポイント①:データの粒度を押さえる
これは特にマスタデータの統合を検討する際に重要です。
※マスタデータとはかなり簡単に解釈すると、組織の中で重要なデータを指し、ヒト・モノ・カネといった内容を表すデータが該当します。
例)社内組織、取引先、勘定科目 等
(マスタデータについて詳しく知りたい方は下記ブログを参考にすると良いかもしれません)
「データの粒度を押さえる」とは、対象となるテーブルでは、どのような粒度でデータが登録されているか?を押さえるということです。
取引先を例に挙げて考えてみましょう。
偏に取引先といっても、法人だけを管理している場合もあれば、その下の組織(支店等)まで管理している、または法人×支払条件で管理しているというように様々な粒度感で管理されることが多いです。
このような粒度感を意識するメリットはデータ利活用時に表れます。
例えば、ある企業の取引先テーブルでは、法人単位だけでなくその下の組織単位まで管理していたとしましょう。

粒度を意識せず、取引先テーブルを上記の形のままデータ統合基盤でのマスタとしたとします。このような場合、法人単位だけで集計したいとった要望があっても、その下の組織まで一つのテーブルで管理しているため、簡単に集計することができません。
集計時に名称を手掛かりに編集を行う等手間が発生します。さらに、ユーザが登録する名称が正確でなければ、そもそも法人単位で集計することは難しくなります。
利活用時の利便性を上げるため、データ統合基盤のマスタでは、法人単位とその下の組織単位で正規化した形で持たせるといった検討が必要です。

ポイント②:データの範囲を押さえる
これは、テーブルが管理している中身がどの範囲を指すのか?を押さえることです。
例えば先ほどの取引先に戻りますが、取引先には顧客だけでなく、仕入先や協力会社が登録されている可能性もあります。(下記参照)

マスタだけでなく、受注などのトランザクションデータでも同様です。
例えば受注テーブルがあったとしても、値を見ると受注だけでなく発注も1つのテーブルで管理しており、その汎化されたテーブルが受注テーブルと呼ばれているというような場合もあります。(下記参照)

※テーブルとしては1つだが、赤枠部分が受注に関する項目、青枠が発注に関する項目になります。かなり簡易版のためツッコミどころは多いかもしれませんがご了承ください。
このようにデータの範囲をきちんと押さえることで、データ統合基盤で扱うデータの対象範囲や項目を明確にすることが出来ます。
例えば、受注テーブルの中でも発注に関する内容は今回データ統合基盤の対象としないとなった場合、発注関連の項目はデータ統合基盤では保持しないとすることが出来ます。(下記参照)

対象範囲を明確にすることで、無駄な項目を保持しないで済み、テーブルの中身も明確となるため、利用者にとっても便利です。
最後に
昨今データを利活用するため、データ統合基盤を構築する流れが非常に活発になっているように思えます。しかし、とりあえずデータを集めてきたのはいいけど、利用ができないという状況に陥ってしまっているという声も少なくありません。
そのため、まずはデータ統合基盤の対象となる現行システムのデータが、業務上どのように利用されているのか?どのような値が登録されているのか?というところを押さえる。その際、特に上記2点をまずは押さえるというところを意識すると少しうまくいくようになるのではないでしょうか。。?
長文となってしまいましたが、最後までお読みいただきありがとうございます!
本日は以上です!それでは!