見出し画像

「データウェアハウスとビジネスインテリジェンス」データマネジメント知識体系(DMBOK)第11章の解説

はじめに

この章のタイトルを見た時の印象は、ビジネスインテリジェンスについて書かれている章なのかと思っていたら、データソースからデータウェアハウスにデータを格納してBIが参照するというデータ環境全体について書かれている章であった。

この章についてはデータエンジニアリングの領域として、かなり情報も整っているので、DMBOKを参考にして何かを行うより、AWSやGCPなどを用いて構成された実例などを見たほうがわかりやすいのではないかと思う。

AWS データレイク解説シリーズ 第 4 回: 実践的なデータレイク構築方法とポイントより
GCP Data Fusion と Composer を使って Google Cloud でデータレイクを構築より

DMBOKの各章の要約・解説

他の章も興味ある人はこちらからどうぞ。

今すぐわかるデータマネジメントの進め方

著者のDMBOKを用いてCDO室を立ち上げデータマネジメントを推進した経験を基にデータマネジメントの進め方をまとめたkindle本を執筆しました。

データマネジメント知識体系(DMBOK)第11章「データウェアハウスとビジネスインテリジェンス」について

データウェアハウスとビジネスインテリジェンスとは

自分の印象では一般的に「データアーキテクチャ」と呼ばれているものがDMBOKの「データウェアハウスとビジネスインテリジェンス」にあたる章で、データソースから形成されたデータがデータウェアハウスに格納されて、ビジネスに活用されるという構成について書かれている。

実際、本章の図にも「アーキテクチャ」という用語と共に構成例が書かれている。

概念的なDW/BIとビッグデータのアーキテクチャ DMBOKより

また、一般的に「データ戦略」と呼ばれているものがDMBOKの「データアーキテクチャ」にあたり、こちらはデータに関する青写真を描いてステークホルダーと共通認識を持ち、スポンサーを獲得せよという内容と理解している。

ビジネスインテリジェンスとは

ビジネスインテリジェンスという用語には二つの意味がある。

  1. 組織の業務と改善の機会を把握するために使われるデータ分析の一種

  2. 1点目のデータ分析を可能とする一連の技術

データウェアハウスとは

データウェアハウスは2つの主要コンポーネントの組み合わせである。

  1. 統合意思決定支援データベース(DWHそのもの)

  2. 関連ソフトウェアプログラム(ETLツール、BIツール等の広い意味)

データウェアハウジングとは

抽出、クレンジング、変換、制御、取り込みプロセスなどの処理を意味し、取り込まれた後はデータウェアハウス内のデータを維持する。

データウェアハウスとビジネスインテリジェンスのゴール

ゴールはあくまでもビジネス上に成果が出ていることがゴール。そのためにはデータ環境の構築だけで終わることはなく、BIが活用できるまで支援することも不可欠。

  1. 業務遂行機能、規制遵守要件、ビジネスインテリジェンス関連アクティビティを支援するため、統合データの提供に必要な技術環境、ITプロセス、業務のプロセスを構築し維持されている

  2. ナレッジワーカーの効果的な業務分析と意思決定を支援し実行されている

データウェアハウスとビジネスインテリジェンスの進め方

要件を理解する

業務上のゴールと戦略からデータを利用して知りたいことをとらえる。
業務担当者がどのように情報を見分け、分類するか記録する。成果測定尺度と計算式の定義を整えて、業務ルールとして明示して文書化する。
ビジネスに役立つためのデータはどうあるべきかを定義して、それを尺度としてデータ品質をモニタリングできるようする。

DW/BIアーキテクチャを定義し更新する

データがどこから来るのか、どこへ行くのか、そのタイミングについてを示し、文書化する必要がある。
技術要件としては、パフォーマンス、可用性、タイミング要求を記述する。

データウェアハウスとデータマートを開発する

DW/BIプロジェクトは同時に3つの開発が進行する。
開発と同時にデータのリネージを明確にして文書化し、BIツールを扱うときに活用する。

  1. データソースからのデータをDWHに統合する作業

  2. DWHやBIツールが動くサーバーやネットワークなどのバックエンド

  3. BIツールのアプリケーションにかかわる開発

データウェアハウスにデータを投入する

DWHにどんなデータを含めるのか決定し、定義することはDWHアーキテクチャ上の優先事項である。

データ投入方法を決定する際に重要な要素は、「待ち時間」「バッチ時間帯」「アップロード感覚」「データソースの利用可能性」「ターゲットデータベース」「ディメンジョンの考慮」「データウェアハウスとデータマートに対する時間枠の一貫性」「データ品質の処理」「変換の実行時間」「遅れて取り込まれるディメンション」「データ拒否」などがある。

ビジネスインテリジェンス・ポートフォリオを導入する

ビジネスインテリジェンス・ポートフォリオとは、適切なユーザーコミュニティが適したツールを利用できるように事業部内や事業部間で定めること。

必要に応じたグループ・ユーザーとは、部門によって業務プロセスだったり、スキルであったり、レポートのタイミングであったり、必要な要求が異なる。

このような要求の部署間の類似点を見つけて全社最適化を行いつつ、ユーザーにツールを対応させていくということが必要。

データ関連成果物の維持

データ関連成果物というのは、DW/BIによって生み出されたレポートや物事の予測、ビジネス成果を出しているものを指す。これらは作って終わりではなく、データソースが変わったときや業務側の要求が変わったときも維持していく必要があり、ガバナンス態勢を構築して維持していく必要がある。

第三章に「データガバナンス」があるが、データウェアハウスとビジネスインテリジェンスのガバナンスについては、データ関連成果物を維持していくための体制をガバナンスと呼ぶと考えられる。

リリースプロセスの例 DMBOKより

データウェアハウスとビジネスインテリジェンスの成果物

アーキテクチャの章であると書いたが、「定着と適用計画」などいかにビジネス価値を生み出すのかという観点も成果物に定められているのが、ポイントである。

  • DW/BIのアーキテクチャ

  • データ関連成果物

  • データ投入プロセス

  • ガバナンスアクティビティ

  • リネージ辞書

  • 定着と適用計画

  • 支援プロセスの策定

  • データ取り込みチューニングアクティビティ

  • BIアクティビティの監視

おわりに

自分の知識をまとめるためと今後誰かがデータマネジメントをやってみたいと思った時のきっかけとなるためにnoteを書くことにしました。

モチベーションのために役にたったという人はぜひ、フォロー&スキをお願いします。

ツイッターでもデータマネジメントに係る情報をつぶやいてますので、よろしくお願いします。

データマネジメントを学ぶ人が抑えておきたい本

今すぐわかるデータマネジメントの進め方

著者のDMBOKを用いてCDO室を立ち上げデータマネジメントを推進した経験を基にデータマネジメントの進め方をまとめたkindle本を執筆しました。

データ組織立ち上げ編 AI事務員宮西さん

著者のデータ組織の立ち上げ経験をマンガ+コメントでまとめてみました。立ち上げ編は組織を立ち上げてやることが決まるまでのストーリーです。
無料公開のため0円となります。
データ組織の立ち上げに関係する方は是非読んでみてください。

DXを成功に導くデータマネジメント

DXを成し遂げるために必要なデータをどうマネジメントしていけばよいかが書かれている。
データ環境より、セキュリティの観点であったり、プライバシーの観点であったりといった非技術者向けの内容が多く書かれている。
データマネージメントに興味を持った人はまずは読んでみるとデータマネジメントでなすべき概要が理解できる。


実践的データ基盤への処方箋

データ利活用を行うために必要なデータ基盤の考え方と、利活用するためにはデータをどのようにマネジメントしていけば良いかを具体的な例を用いて説明されている。
技術が中心になるので現在データ技術に係る人がデータマネージメントに興味を持った時には、まず手に取ることをおすすめする。


個人データ戦略活用 ステップでわかる改正個人情報保護法実務ガイドブック

個人情報保護法を順守するための基本的な考え方が実務ベースで書かれている。2022年4月に施工される改正個人情報保護法で新たに追加される概念も同様に記載されている。
政府の出しているガイドラインよりも俯瞰的に読めるためデータプライバシーにかかわる人、データを使ったビジネスを推進する人は読んでおくとスムーズに業務が進められる。


データマネジメント知識体系ガイド(DMBOK)

自分も要約・解説記事を書いているDMBOK。データマネジメントに興味を持った人がまず手に取ると挫折することは間違いないほどのボリュームがある。
読めば読むほど味が出てくるので、データマネジメントを進めようとしている人は各家庭に1冊は是非買っておきたい。


データマネジメントが30分でわかる本

著者もDMBOKを読むためには非常にボリュームが多く読み解くには苦労するので、かみ砕いた解説書をまとめたと書いてある通り、DMBOKを独自解釈してわかりやすく書かれている。
DMBOKを技術者目線で読み解いた内容になっているので、実践的データ基盤への処方箋と同様データ技術に係る人におすすめする。


いいなと思ったら応援しよう!