見出し画像

DMBOK第1章データマネジメント

要約

データマネジメントはデータと情報の価値を最大化し、ライフサイクルを通じて計画・実施・監督するものです。価値の定量的評価が難しく、データ品質の管理が重要になります。
また、リーダーシップとコミットメントが効果的なデータマネジメントに必要になります。
課題としてデータの特異性やデータ品質、横断的な視点が挙げられ、その1つの解決策として様々なフレームワークが存在します。

データマネジメントとは

定義についてはDMBOKに以下のように記載されています。

データマネジメントとは、データとインフォメーションという資産の価値を提供し、管理し、守り、高めるために、それらのライフサイクルを通して計画、方針、スケジュール、手順などを開発実施監督することである。

DMBOKより

データマネジメントの失敗は、企業資本の管理に失敗することと同じでチャンスを逃すことになります。
また、ITの変化とともに、データとは一体何なのかという人々の理解も変化したため、データマネジメントが必要とされる範囲が拡大されたと言われています。

データマネジメントの原則

原則は大きく分けると以下の4つになります。

・データは価値を持つ
・データマネジメント要件はビジネス要件そのものである
・データマネジメントには多様なスキルが求められる
・データマネジメントはライフサイクル管理である

DMBOKより

データの価値は経済的視点で評価可能、評価されるべきです。データの価値を定性的および定量的に測定する手法は存在しますが、そのための一般的な基準はまだ確立されていません。これについては以下の記事に記載されています。

データの管理はデータ品質の管理であり、データ品質を管理するためには、ステークホルダーの品質要求事項を理解し、データがその要求に応えているかどうかを測定する必要があります。

効果的なデータマネジメントにはリーダーのコミットが必要で、その実現には管理スキルだけではなく、ビジョンや目的が必要です。リーダーがそれにコミットすることも必要になります。これについても以下の記事に記載されています。

データマネジメントの課題

データマネジメントの原則に従う時に発生する課題があります。DMBOKではそれらを13個紹介しています。

・データは他の資産と異なる
・データ評価
・データ品質
・より高品質なデータを目指した計画
・メタデータとデータマネジメント
・データマネジメントは機能横断的である
・全社的な視点を確立する
・他の視点を考慮する
・データライフサイクル
・多様な種類のデータ
・データとリスク
・データマネジメントとIT
・効果的なデータマネジメントにはリーダーシップとコミットメントが必要

DMBOKより

データマネジメント・フレームワーク

データマネジメントにはいくつかのフレームワークが存在し、その中には有名なものもあります。

戦略的アラインメントモデル

Venkatraman らはデータマネジメントに取り組む際の根本的な推進要因をまとめています。

戦略的アラインメントモデル(itpediaより)

アムステルダムインフォメーションモデル

Abcouwer, Maes, Truijens らは業務とITの整合性という課題を戦略的な観点から表現しています。

アムステルダムインフォメーションモデル(businessitalignmentより)

DAMA-DMBOKフレームワーク

このフレームワークがとても重要です。最も有名かと思います。
データマネジメント全範囲を構成する知識領域についてより深く網羅しています。
最も使われているのが、DAMAホイール図になります。

DAMAホイール図(DAMA Japanより)

DMBOKピラミッド

次にAikenのDMBOKピラミッドです。こちらもDMBOKの機能領域を使用しており、企業のフェーズ毎にどの領域に取り組むべきかをピラミッド構造で表現しています。
フェーズは合計で4つに分かれており、フェーズ1から順に取り組むと良いとされています。

DMBOKピラミッド (Summarizing DMBOK v2より)

◾️フェーズ1
・データ統合と相互運用性
・データセキュリティ
・データストレージとオペレーション
・データモデリングとデザイン
◾️フェーズ2
・データアーキテクチャ
・データ品質
・メタデータ
◾️フェーズ3
・データガバナンス
・データウェアハウジング、ビジネスインテリジェンス
・参照データとマスターデータ
・ドキュメントとコンテンツ
◾️フェーズ4
・マイニング、Analytics、ビッグデータ

DMBOKより

DMBOKピラミッドを活用したパーソルキャリア株式会社の事例が参考になります。フェーズ1から始めており、データマネジメントの初期・中期段階の企業には参考になるのではないでしょうか。

ただし、企業によって課題や優先度は全く異なるので状況に合わせた知識領域から始めて良いと思います。必ずしもフェーズ1から始める必要はありません

The Modern Data Stack

こちらはDMBOKに記載の無い内容です。

The Modern Data Stackは現代のデータ処理および管理方法に関する技術領域をまとめたものであり、より具体的な要素技術にフォーカスしており、最新の技術進化への追従性が高いことが特徴になります。

企業毎に使用している技術や現段階で良く使われている技術が掲載されています。データエンジニアであれば、何らかの技術を使う場面が出てくると思います。

また、こちらの技術スタックを網羅している図も分かりやすいかと思います。

The Modern Data Stack(snowplowより)

まとめ

以上、データマネジメントについて解説しました。
データマネジメントはデータ価値最大化のための戦略的アプローチになります。DAMA-DMBOKフレームワークを使いながら企業に合わせた効果的な取り組みが重要になります。
データエンジニアであれば、The Modern Data Stackにも注目です。

DMBOKのデータマネジメントについて特に重要な点を解説しました。ただし、非常に量が多いため解説していない部分が多々あります。詳細は本書を手にとってみて下さい。


いいなと思ったら応援しよう!

zono
よろしければ応援お願いします! いただいたチップはデータエンジニアとしての活動費や勉強代、教育に使わせていただきます!