データマネジメントとは何か


DMBOKとは

DMBOK(ディンボック)とはData Management Body Of Knowledge(データマネジメント知識体系)の略で、データマネジメントに関する知識を体系立ててまとめた書籍のことです。
初版は2009年に出版されましたが、2018年にデータマネジメント知識体系 第二版(DMBOK2)が出版されました。

DMBOK2の章立ては以下のようになっています。

第1章 データマネジメント
第2章 データ取扱倫理
第3章 データガバナンス
第4章 データアーキテクチャ
第5章 データモデリングとデザイン
第6章 データストレージとオペレーション
第7章 データセキュリティ
第8章 データ統合と相互運用性
第9章 ドキュメントとコンテンツ管理
第10章 参照データとマスターデータ
第11章 データウェアハウジングとビジネスインテリジェンス
第12章 メタデータ管理
第13章 データ品質
第14章 ビッグデータとデータサイエンス
第15章 データマネジメント成熟度アセスメント
第16章 データマネジメント組織と役割期待
第17章 データマネジメントと組織の変革

これは、DMBOKを構成する以下の11の知識領域をベースに組み立てられています。

DMBOKを構成する11の知識領域
  1. データガバナンス
    企業のニーズを考慮し、データにまつわる意思決定権の体系を確立し、それによってデータマネジメントの方向性を決め、監督する。

  2. データアーキテクチャ
    データ資産管理のブループリントを定義すること。
    データアーキテクチャは、戦略的データ要件と、その設計を確立する。

  3. データモデリングとデザイン
    データモデルという明確な形式でデータの要件を洗い出し、分析し、表現し、伝達するプロセス。

  4. データストレージとオペレーション
    データの価値を最大化するため、保存データを設計、実装、サポートすること。

  5. データセキュリティ
    データのプライバシーと機密性を保ち、データを侵略から守り、適切なアクセスを確保する。

  6. データ統合と相互運用
    データストア、アプリケーション、組織などの内部またはその間を移動し、統合されるデータに関するプロセス。

  7. ドキュメントとコンテンツ管理
    非構造メディア、特に法律や規制に準拠するための文書など、そこに含まれるデータや情報のライフサイクル管理のための計画、実装、統制活動。

  8. 参照データとマスターデータ
    最も正確で、鮮度が高く、関連が深い事実が重要なビジネスエンティティに対してシステム間で一貫し取り扱われるように、重要な共有データを継続的に照合・保守する方法。

  9. データウェアハウジングとビジネスインテリジェンス
    意思決定を支えるデータを管理し、ナレッジワーカーがデータ分析やレポートを通してデータから価値を得られるようにすること。

  10. メタデータ
    高品質で統合されたメタデータをアクセス可能にするための計画、実装、統制の活動。

  11. データ品質
    組織内で利用されるデータの適性を測定し、評価し、改善するための品質管理技術の計画と遂行。


データマネジメントの概要

DMBOKでは、データマネジメントを次のように定義しています。

データという資産の価値を提供し、管理し、守り、高めるために、それらのライフサイクルを通して計画、方針、スケジュール、手順などを開発、実施、監督すること。

データマネジメント知識体系 第二版(DMBOK2)

これを、
なぜ(WHy)、
だれが(Who)、
どのように(How)、
何をするのか(What)、
で分解すると、次のように言い換えることができます。
データマネジメントとは、
データの品質、セキュリティ、経済性を維持、向上するために(Why)、
データマネジメント組織が(Who)、
データマネジメントプロセス(開発、実施、監督)に従って(How)、
データのライフサイクルを管理すること(What)。

データマネジメントの概要

データのライフサイクルは、計画、設計・実装、生成・収集、保管・維持(場合によって破棄)、利活用、改善・強化という流れです。
具体的に言うと、まず、業務上必要なデータを計画し、データの構造(データモデル)やデータの流れ(データフロー)を設計し(データアーキテクチャ)、それをデータベース(以降、DB)などデータ管理基盤上に実装します。
次に、業務活動を通して発生するデータが、データ管理基盤上で生成・収集、保管・維持されます。
データ管理基盤上のデータは、企業価値を高めるために利活用され(データドリブン経営)、その結果を受けて改善・強化されます。
なお、ここではDBやESBなどデータの保管や連携を管理するIT基盤をデータ管理基盤と呼んでいます(企業全体で一元的にデータを管理するIT基盤を狭義的なデータ管理基盤と呼びます)。

データライフサイクルを通してデータを管理する組織とプロセスを、それぞれ、データマネジメント組織、データマネジメントプロセスといいます。
データマネジメント組織は、データマネジメントプロセスに従って、データを設計、実装し、データ管理基盤を構築、運用するだけでなく、それらを通して、データの品質、セキュリティ、経済性を評価し改善します。
データマネジメント組織を、データマネジメント実行する役割と、それが適切に遂行されているか監督する役割に分掌することで、データガバナンスを確立、維持することができます。

データマネジメントの対象には、データアーキテクチャという論理的基盤と、データ管理基盤という物理的基盤があります。
よく見受けられるのが、高額なデータウェアハウスを導入して、「後は、業務部門が自由に使ってください」、というアプローチです。
いくら箱(物理的基盤)だけ用意しても、
なぜ、どのようなデータを、どのように記録し、活用すべきなのか
というデータアーキテクチャ(論理的基盤)が整備されていないと、業務部門も困惑するだけで、どうデータ利活用すればよいかわからず、宝の持ち腐れになってしまうのです。
目的がなく手段だけあるという状態です。
データアーキテクチャとデータ管理基盤が両輪となってデータドリブン経営を実現するのです。

この記事が気に入ったらサポートをしてみませんか?