見出し画像

DMBOKにおけるデータマネジメント戦略

”代表が最近面白いと思っている技術について1時間話すイベント”、これを当社では「ワクふむ会議」と呼んでいます。そもそもは2023年5月にオフィスを増床移転したタイミングに、出社のきっかけになるようなイベントをやろうとスタートした本イベント。

今回は初となる外部講師にご登壇いただき、大変刺激的な時間となりました。簡単にですが、先日行われた第10回の様子をレポートしていきたいと思います!


「ワクふむ」とは?

まず「ワクふむ」という言葉の説明をしたいと思うのですが、これは過去の記事(INSIGHT LABの記念すべき初note)にてお話していますので、こちらをご参照ください。読んで字のごとく、「ワクワク」と「ふむふむ」のことではあるのですが、実はそこにもう一歩踏み込んだ意味があったりします。

「ワクふむ会議」とは?

「ワクふむ会議」というのは、2023年4月に本社オフィスを増床した際に、オフィスの活性化やクロスコネクション(部署を跨いだコミュニケーション)の実現を目的として開始した、社内イベントです。プレゼンを1時間、その後懇親会をだいたい1時間くらいやって、インプット×アウトプットができるように設計されています。

主な目的

  1. 最新技術への興味関心を持つきっかけ、知識を増やす

  2. 懇親会での会話でさらに理解を深め、クロスコネクションが実現できる

  3. 代表と直接コミュニケーションを取り、相互に意見交換ができる

第10回の登壇者は?

2024年5月10日に開催した第10回のテーマは「DMBOKにおけるデータマネジメント戦略」です。今回は初めての外部講師をお招きしての開催。運営としても、大変緊張しながらこの日をむかえました。
ご登壇いただいたのは、一般社団法人 データマネジメント協会日本支部(略称:DAMA-J、DAMA日本支部)の会長 木山 靖史 様 。(先日当社も参加した、ガートナー データ&アナリティクス サミットでも登壇されていて、改めて「本当にすごい方にご登壇いただいたのだな…!」と実感。ありがたい…!)

テーマは「DMBOKにおけるデータマネジメント戦略」

DMBOKとは何か?

「PMBOK」なら聞いたことがあるけど、「DMBOK」は初耳。そんな方もいらっしゃるかもしれないので、まずはこの言葉についてのご説明から。

Data Management Association International(DAMA-I)が、刊行しているデータマネジメント知識体系ガイド(The DAMA Guide to The Data Management Body of Knowledge :略称DMBOK)。
1st Editionは2010年に刊行され、2011年には日経BP社より日本語版が刊行されました。
2nd Editionは、2017年に米国で刊行され、2018年には世界に先駆けてDAMA日本支部が監訳し、日経BP社より日本語版を刊行しました。この功績が認められ、DAMA日本支部翻訳チームは、DAMA-I Data Management Excellence Awards 2019に選ばれています。
DAMA DMBOKは、データマネジメントプロフェッショナルにとって有益な資料かつ指針となることを目指し、データ管理のもっとも信頼できる入門書となるよう編集されています。
1st Editionは、13章408ページから成り、データガバナンスを中軸に、データアーキテクチャ、データ開発、データオペレーション管理、データセキュリティ管理、リファレンスデータとマスタデータ管理、データウェアハウジングとビジネスインテリジェンス管理、ドキュメントとコンテンツ管理、メタデータ管理、データクオリティ管理の各サブジェクトエリアの解説が記載されています。
2nd Editionは、17章671ページと、最新のデータマネジメントの動向を踏まえて知識領域を再構成し、内容をより詳細かつ明確にするとともに記載範囲が拡張されています。

DAMA DMBOKとは

要するに、データマネジメントに関する知識が、体系立ててまとめられている書籍が「DMBOK」です。
と、とても簡単に言いましたが、上記のとおり2nd Editionは、17章671ページ。大きさ、厚み共にかなりのもので、京極夏彦さんの小説くらいあります(※超主観です)。
普段DMBOKのセミナーでは、1章1時間かけてご説明されていると、木山さまからお話がありました。それをこの場で1時間で全部まとめて伝えるというのは無理があるので、この日は要点をかなり絞り込んでお話いただきました。以下、お話いただいたこと全てとはいきませんが、私が個人的に印象に残った内容を書き留めていきたいと思います。

データは、活用して初めて価値が生まれる

データというのは、活用に至るまでにさまざまな処理が必要です(計画・設計実装・生成取得・格納維持・強化……そしてゆくゆくは廃棄)。
逆に言えば、それらの処理はデータを活用するためにかかるコスト。つまり、データは活用して初めて価値が生まれるコストをかけて活用の準備をしても、活用されなければ価値にならない。当然と言えば当然なんですが、ここまで言語化されると逃げ場がないというか、突きつけられるものがあるなと感じます。
そしてデータは単体では意味をなさないというお話もありました。なぜなら「Data」というのは「Datum」の複数系だから。身近過ぎて一切疑問を持たずに使っていた「Data」という言葉の解像度が上がった感覚がありました。ワクふむが止まらない。

データ活用は何のため?

最近データが話題だから、データを集められる場所を用意しよう!場所が用意できたら、とりあえず集められるだけデータを集めてみよう!集まったら、じゃあそれをどう使うか考えよう!
…この順番では、本末転倒だとDMBOKでは言われています。

データ活用の前に、まずは、ビジネスの目的が定義されていること。これをとても丁寧に伝えてくださいました。ビジネスの目的とは、売上増・費用減・リスク管理、そのどれかに関与・寄与するもの。それらの意思決定をするために必要となるデータこそが、活用できる価値のあるデータなわけで、それに関係ないデータは本来は不要なはずです。ですが目的なくデータを集めてしまうと、そういった不要なデータも収集されてしまう。つまりそこに無駄なコストが発生してしまうのです。あくまでも目的に対しての意思決定に使えるデータに対してコストを使う意識。そしてその必要なデータの定義の整理から、プロであるわたしたちが支援するという意識。どちらも、すごく大切だなと感じました。

データにおける「正確さ」とは

データの品質という観点で問われることの多い「正確さ」。ですが木山さまは < 完全性 → 適合性 → 有効性 → 正確性 >の順で高めていこうとお話されていました。

完全性:マストのデータが揃っているか?
適合性:想定の書式通りのデータか?
有効性:あらかじめ決められているデータセットとの関係が正しいか?

ここまで担保されて初めて、正確かどうかの議論ができる。
そしてこの「正確かどうかの判定」は、ユーザーたちにとって「正確」とされているデータに対して「正しい」か「正しくない」かの判断になるのだそうです。これもまた難しい。「このデータは正しくないのでは?」という議論の多くは、「定義の違い」に起因する。例えば、こちらの部署の定義で見ると正しいデータでも、あちらの部署の定義で見ると正しくない、、そんなことがざらに起こる(確かに想像に容易いですよね)。だからこそ、まずは前提となる部分をしっかりおさえましょうという教えです。

まとめ

今は広報担当をしている私、かつては総務としてKintoneの管理をしていたこともありました。KintoneってUIがやさしいので気付かなかったのですが、ひとつひとつのKintoneアプリに入っているものすべてが「データ」なわけで、それらの紐づきを含めて管理していくことってまさに「データマネジメント」の領域だったんだなと、今回の話をききながら感じていました(知識もないのにこだわって作ったりしてたので、きっと今の総務や情シスメンバーには苦労をかけてしまっています、本当にすまないことをしました)。
ということでDMBOKは、一見してデータに関係ないような業務にも活きる知識の宝庫でした。17章、671ページ。まずは気になるページから、少しずつでも読んでいこうと思います…!!