データマネジメント2022 その1 急拡大するデータマネジメントの現実と理想海外最新事例から読み解くベストプラクティス
データマネジメント2022 ~データを制するものがDXを制す!~
2022年3月10日(木)に年に一度の「JDMCカンファレンス データマネジメント2022 ~データを制するものがDXを制す!~」があり、視聴したのでレポートを書きます。
JDMCさんがアーカイブを公開してくれているので、見た順番にコツコツ書いていこうと思います。
開催概要は以下JDMCのデータマネージメント2022の公式サイトにて確認ください。
https://seminar-reg.jp/jdmc/dm2022/
データマネジメント セミナーレポート
データマネジメント関連のセミナーに興味ある人はこちらからどうぞ。
急拡大するデータマネジメントの現実と理想海外最新事例から読み解くベストプラクティス
発表者
インフォマティカ・ジャパン株式会社 セールスコンサルティング本部 CoE ソリューションアーキテクト & エバンジェリスト 森本 卓也 氏
概要
今そこにあるデータ分析基盤
データ分析基盤 構築プロジェクトを行うときに必要な要素は以下の4点。
スケジュール、予算、スコープ
リソース・性能に関する制約
データ分析の内容
構築後のデータ戦略、ゴール
エンジニアは1と2にフォーカスされていることが多く、3と4については構想レベルにとどまっているケースがあるが、データは価値に結びつけないと意味がないため3と4についても準備することが必要。
企業はデータを分散して保持しているケースが多い。膨大な数のデータソースを分析できるようにしておく必要がある。データ統合の方法、データ統合技術の標準化、データの利用者へのナレッジ公開。
今そこにあるものではなく将来を見据えて準備することが重要。
データ品質戦線異常なし
データクレンジング、データ品質は重要だが取り組んでいる国内の企業はたったの7%の企業しかいない。一方海外の企業は44%と状況が違っている。
なぜこれだけの違いがあるのかというと、海外企業はデータ品質をイメージできているから。より具体的に書くと企業のKPIを達成するためにはデータ品質が必要だとカスケードダウンできている。
データ品質を向上させるためにはマスタデータ管理まで見据えたうえで、KPIに直結するデータ品質の可視化をスタートすることが必要。そのためには全社的にマスターデータマネジメントとそれを統治するガバナンスが必要になる。
データカタログの不都合な真実
データカタログはテーブル定義的な内容から、ビジネスに起因する実業務に紐づく内容が重視されるようになった。
なぜそのような形になっているのかというと、データカタログを準備しても使ってくれないという事実がある。
海外の成功事例を見ると、システム的に取得できるものは自動化する。棚卸プロセスをワークフロー化する。といったことを行っている。
また、「Data Marketplace」という思想でAmazonのような欲しいものを見つけられるようなプラットフォームを構築することで、ユーザーが使いたくなるカタログの作成に取り組んでいる。
沈まぬデータガバナンス
データガバナンスとはDMBOKホイールの中心で、データマネジメントされた状態を恒常的に維持していくことである。
データガバナンスの取組は企業横断のDX推進の取組の普及に従って注目を集めている。データガバナンスの要素はデータ戦略、紐づく攻めのデータガバナンスと守りのデータ保護、それらを支える技術が必要になる。
データガバナンスを支える技術はデータまわりの透明性、信頼できるデータをいかにシステム的に自動化していくのかという事が重要になる。
データガバナンスを成功に導くためには、実践しながらアジャイルに軌道修正を行いながら前に進めるという事が重要。
感想
この発表はすごいボリュームがあるが、4つのテーマに沿って感想を書いていきたいと思う。
1つ目のテーマである「今そこにあるデータ分析基盤」については、常々思っていることでデータ基盤の構築はデータエンジニアやデータサイエンティストが主導して行っているケースが多いように見受けられるが、データ基盤は価値を生み出すために構築するものであり、他のプロダクトと同様にプロダクトマネージャーのような人と企業戦略とビジネス企画を持って構築していくほうが健全なのだと思う。
一般的なものつくりはプロダクトマネージャーという役職があるが、データについてはデータマネージャーという役職がその役割を担うとデータエンジニアやデータサイエンティストが本来の仕事に集中できるようになってより成果を出せるようになると考えている。
2つ目のテーマである「データ品質戦線異常なし」については、データ品質とは何だろうかと長い間しっくり来ていなくて、シンプルに考えるとデータ基盤で管理されているデータの「完全性」「有効性」「正確性」「妥当性」「一貫性」「整合性」「適時性」が品質の指標となるのだけど、DMBOKを読むとデータ品質とはビジネスに価値のあるデータの状態であると定義されていて、その関係性がしっくりこなかった。
少し前に経営戦略からカスケードダウンされる形でDX戦略がありDX戦略からカスケードダウンされる形でデータ戦略があり、そのデータ戦略のKPIがデータ品質であり、フレームワークとして上記7つの軸があるのだと考えるとDMBOKの意味がしっくり来た。
今回の講演の内容も同じようなことを言っていたのではないかと思う。
3つ目のテーマである「データカタログの不都合な真実」については、考え方としてはDMBOKの「メタデータ管理」の要約・解説でも書いた通りデータカタログを作ること自体に意味を見出すのではなくて、そのカタログに対して検索できることが重要であるという事を言っているのだと思う。
4つ目の「沈まぬデータガバナンス」については、ガバナンスというのは堅い審査機関を作るようなイメージがあるが、フローや審査体制ありきになって目的が見失われることが相応にしてある。
目的はデータで価値を生み出すことなのだという事をガバナンスに関係するステークホルダーは念頭に置いて、現状に満足することなく常にPDCAを回していく必要がある。
おわりに
自分の知識をまとめるためと今後誰かがデータマネジメントをやってみたいと思った時のきっかけとなるためにnoteを書くことにしました。
モチベーションのために役にたったという人はぜひ、フォロー&スキをお願いします。
ツイッターでもデータマネジメントに係る情報をつぶやいてますので、よろしくお願いします。
データマネジメントを学ぶ人が抑えておきたい本
DXを成功に導くデータマネジメント
DXを成し遂げるために必要なデータをどうマネジメントしていけばよいかが書かれている。
データ環境より、セキュリティの観点であったり、プライバシーの観点であったりといった非技術者向けの内容が多く書かれている。
データマネージメントに興味を持った人はまずは読んでみるとデータマネジメントでなすべき概要が理解できる。
実践的データ基盤への処方箋
データ利活用を行うために必要なデータ基盤の考え方と、利活用するためにはデータをどのようにマネジメントしていけば良いかを具体的な例を用いて説明されている。
技術が中心になるので現在データ技術に係る人がデータマネージメントに興味を持った時には、まず手に取ることをおすすめする。
個人データ戦略活用 ステップでわかる改正個人情報保護法実務ガイドブック
個人情報保護法を順守するための基本的な考え方が実務ベースで書かれている。2022年4月に施工される改正個人情報保護法で新たに追加される概念も同様に記載されている。
政府の出しているガイドラインよりも俯瞰的に読めるためデータプライバシーにかかわる人、データを使ったビジネスを推進する人は読んでおくとスムーズに業務が進められる。
データマネジメント知識体系ガイド(DMBOK)
自分も要約・解説記事を書いているDMBOK。データマネジメントに興味を持った人がまず手に取ると挫折することは間違いないほどのボリュームがある。
読めば読むほど味が出てくるので、データマネジメントを進めようとしている人は各家庭に1冊は是非買っておきたい。
データマネジメントが30分でわかる本
本の著者もDMBOKを読むためには非常にボリュームが多く読み解くには苦労するので、かみ砕いた解説書をまとめたと書いてある通り、DMBOKを独自解釈してわかりやすく書かれている。
DMBOKを技術者目線で読み解いた内容になっているので、実践的データ基盤への処方箋と同様データ技術に係る人におすすめする。