【3章】実践的データ基盤への処方箋を現場で活かすために
概要
「データ基盤を支える組織」
第3章ではデータ基盤を開発する上での制度や組織作りについて着目されています。
アセスメントを用いて組織のデータ活用レベルを客観的に評価し、データ活用の基準を設けていくことをはじめ、フェーズ毎に組織形態を変えていくことでより効率的にデータ組織を成長させることが重要になっていきます。
第2章は、以下の記事に書いています。
アセスメントによって組織の現状を客観的に把握する
データやAIが流行りだしてもう数年経ちました。様々な企業がデータに対して関心を持つようになりました。経営戦略としてデータ活用を推進するという発信がありながら、データ分析やデータ活用に責務を負った組織を立ち上げられない、またはプロジェクトチームが組成されても効果を十分に発揮されることなく解散するといったことがよくあります。
組織がどの程度データを活用できているかを客観的に判断するのは難しいです。しかし、できるだけこの判断をサポートできるようなものがアセスメントになります。アセスメントとは客観的に評価するという意味で、ここではデータ活用の状態を客観的に評価します。
この本では、以下のようにレベル分けをされています。
詳細は本書を手に取って確認してみてください。
個人的にはレベル3まで実施できている企業は限りなく少ないと思われます。皆さんの会社はどのレベルでしょうか?
アセスメントの具体例として、後述するDMBOKを自社に合うようにカスタマイズしたものをよく見ます。他にも本書で取り上げられているものとして「DX Criteria」というものになります。参考例として見るのをオススメします。
組織の状況に合わせて組織構造を採用する
そして、データを活用するために、具体的に組織図をどのように作っていくかが重要になってきます。結論、組織図はフェーズによって変えていくことが良いとされています。本書では以下のように記載されています。
データ基盤の初期フェーズは、様々な制度やルールが整っていない可能性があり、1つにまとまる集権型組織を作成する方が効率的です。ただし、データ活用がこの状態で続くと進むと集権型のタスク請負による社内受託のような仕事が中心になってしまう可能性があります。この現象は非常によく見る光景になります。
対応策としては、事業部横断のプロジェクトを作り、そのプロジェクトに各事業部からメンバーを数人アサインしてプロジェクトを進めていくという方法が本書に記載されています。
中期フェーズでは分権型組織になります。ここでは、スクラムのように事業ごとにチームを作り、そのチームの中にデータを扱えるメンバーがいるという状態になります。ただし、条件としてはデータを扱える人材を育てておくことが必須となります。また、このデメリットとして事業ごとのサイロ化や同じような作業が複数発生して効率が悪くなるケースあります。
対応策としては、組織内の知見を共有する施策があります。ただし、こちらも現実的には難しい部分(なかなか進まない)があるため、データエンジニアのようなメンバーが率先して知見を共有できるようなKPIを作るのが良いかと思います。
最後にハイブリット型組織になります。組織としてデータ活用部門を設置してデータ基盤を整備していきます。それに加えて、横断型の組織として各事業部にデータサイエンティストやデータアナリストなどの人材を所属させます。
ただし、このハイブリット型は非常に難しい組織構造になると思っています。なぜならば、一定以上のデータ活用人材(個人的感覚としては1/3以上の割合)がいることが前提となるからです。この組織を作るフェーズとしては、上記のアセスメントでいうと、レベル4以上のフェーズで採用するとより機能すると本書では記載されています。
データ組織の成功に必要な要因を理解する
データ組織をうまく機能させるための必要な要因をDMBOKから引用をしています。DMBOKもいずれ解説をしたいと思います。
一つ一つ説明をしていくと膨大な量になってしまうので、特に重要な部分のみ述べていきます。
まずは、幹部からの支援、つまり経営層から後押しをしてもらうことになります。このようなデータ活用のプロジェクトでいうと、トップダウンで進めないとなかなか前に進まない現象が非常によくあります。そのためにも経営層が抱える課題が何なのかを認識し、それを解決するためにどのようなデータから改善していくのかを経営層に共有するというアプローチをしていく必要があります。
また、本書で面白いと思ったものがメッセージの反応や誰からリアクションがあったのかを計測、検証すると効果的なコミュニケーションにつながることです。私がイメージしたのはコミュニケーションツール、Slackになります。Slackにはチャンネルがあり、そこで返信やスタンプの数を自動的に収集するような仕組みを作っておくことで、どのチームがどのコメントに対して少しでも関心があるのかを見ておくとデータ利活用の意識がわかるようになると思います。ただし、こちらも自動化や集計作業が面倒な点がデメリットになります。
最後に導入状況の評価になります。ダッシュボードやデータ分析ツールのアクセス状況や分析やデータの品質をモニタリングすることになります。アクセス状況に関しては、どのデータが特に見られているかを可視化することで、データチームが行うタスクの優先度を決定することができます。分析やデータの品質はデータパッチ、つまりデータの修正を何回行ったのかとをモニタリングし、KPIとすることで、データ基盤の品質を高めることになります。
担当、見直しサイクル、判断基準を決めてデータやツールの棚卸を定期的に行う
ここでは、データ基盤の棚卸しについて記載されています。上述の通り、利用していないリソースに関しては削除していくという内容になっているのですが、これはなかなか難しいかなと個人的に思っています。というのも、何かしらのデータやダッシュボードを削除するのは、タスクの優先度がどうしても上がらないからです。それよりも何かしらを作成するようなタスク(データマートを作ってほしい)の優先度が高くなってしまうのが現状かと思います。1年に1、2回ほどコストを削減するタスクで棚卸しをするのが良いかと思います。
また、注意点としてリソースの削除は慎重に行った方が良いため、アーカイブ用のフォルダやダッシュボードを作成して一旦アーカイブ用に移動させるということが良いかと思います。本書にも記載がありますが、現場から復元を依頼されることもあるためです。
まとめ
以上、3章データの活用組織について解説しました。
これにて「実践的データ分析基盤の処方箋」の解説は終了です。
アセスメントを活用することで、組織のデータ活用レベルを客観的に評価できます。データ活用の基準を設け、モニタリングや管理を行うことが重要になってきます。また、定期的な棚卸しも必要であり、リソースの削除には慎重に取り組んでください。本書では、データ活用の向上に役立つ具体例も豊富に紹介されていますので、ぜひ参考にしてみてください。
データエンジニア向け書籍の紹介
データエンジニアなら一度は手に取ることをオススメしている記事になります。どの本も非常に役に立つはずです。