
MonotaRO Tech Talk #9 (データマネジメント編)レポート
MonotaRO Tech Talk #9 (データマネジメント編)
MonotaRO社主催のイベントにオンライン参加してきました。
データマネジメントというテーマだったので、感想交えてレポートを書きます。概要を一部抜粋。
「モノタロウにおけるデータ活用/管理のこれまでとこれから」をテーマにMonotaROのデータ基盤の進化の歴史現在のデータ基盤が抱えている課題感
それを解決するために行なっている最近の取り組み今後どういったデータ基盤、データマネジメントを目指していきたいかを紹介したいと思います。
詳細な内容は公式ページを参照ください。
Tech Blogにセミナーでお話しされた、データ基盤に関する内容と同じような記事もありますので、こちらもどうぞ。
データマネジメント セミナーレポート
データマネジメント関連のセミナーに興味ある人はこちらからどうぞ。
MonotaRO のデータ活用と基盤の過去、現在、未来
概要
MonotaROのデータ基盤の歴史を時代ごとに説明された。
2015年以前もデータドリブンで経営判断をしていくような会社だったんだけど、データに特化した基盤がなかったためマシンリソースが厳しくなりBigQueryを導入して展開することになった。
データ基盤を構築して、マシンリソースの課題はなくなったが、データが集められるようになったことでデータが複雑になっていったことが次の課題になった。
で、今回のテーマであるデータを正しく管理するというデータマネジメントという手段を用いることで、データを管理してさらにビジネス的な価値が出るようにしていくという話だった。

ポイント
話を聞いてMonotaROという会社の良いなって思う点が2つ
1.技術系社員以外がテクノロジーへの理解
テクノロジーの下地があり、いわゆるデジタル企業で全社的にテクノロジーへの理解がある会社だということ。
技術系社員以外がテクノロジーへの理解があるというのが相当重要で、特に経営陣が技術の理解がないと、ベンダーの言いなりになってしまってデータ基盤の価値が理解されず投資が促進されない。
2.技術系社員がビジネスへの理解
データを用いてビジネスに貢献していくという、データドリブンな経営ができている会社だということ。
技術系社員がビジネスへの理解があるというのが相当重要で、ビジネスへのビジョンを示さないと、データサイエンティストは研究などビジネスとは関係のない所にリソースを割いてしまいせっかくのデータがビジネス的な成果を生まない。
感想
自分の会社でも頑張っているものの、会社全体でデータは価値があるもので、意味ある投資をすればビジネス的な価値を生むことが理解されているという状況に持っていくことが相当に難しい。おそらくMonotaROも時間をかけてそうなっていったのだと思われる。
まさにMonotaROはデジタルディスラプターになっていて、従来の製造業の資材の小売り業者がテクノロジーの価値、データの価値に全社的に理解されるのが今から10年かかるとすれば本屋がAmazonに駆逐されるように、製造業の資材の小売りはMonotaROに駆逐されるのだろうなと思う。
社内のデータ活用を一段階あげるための取り組み
概要
データ基盤は整ってきたが、次の課題となったのはデータに関する情報が集約管理されておらず以下2点の課題が発生してきた
課題となっている2点
・データ管理やデータ定義の局所最適化が進んでいる
・データの使い方がわからない
この課題の解決手段としてLookerを導入して、集中管理できるようにしているといったもの。
LookerはLookMLというもので定義を管理できるため、中央管理できデータのリネージを把握することができる。
ポイント
データの活用は、SQL等の技術的な知識、統計的な知識があればできると思われがちだけど、データそのものへの理解DMBOK的には12章のメタデータの知識が重要になってくる。
そういったデータマネジメントされていない状況でデータサイエンティストを雇ったとしても、宝の持ち腐れというかほぼ力が発揮できないといったことになる。
データカタログを頑張って整備するという、運用的なアプローチも大事だけど、Lookerを導入して管理するという技術的なアプローチも大事。
感想
ちなみにうちの会社では、例えば「当月売上」といった指標があり計測されているが、その集計が20年以上も前のシステムでされており、仕様書すら残っていないので、誰もどうやって集計されているのかわかっていないような係数があがめられている。
そのせいで、DWHを導入したとしてもBIから出される「当月売上」を正とするわけにはいかず、いつまでもIE9でしか見れない20年前のシステムで出力された数字を手でコピペするという残念な運用になっている。
まさに、データマネジメントをちゃんとしていないとこうなるよっていう状況になっているので、LookMLのようなここを見れば定義がわかるという状況を作っておくというのはすごい大事。
データ基盤グループを支えるチームビルディング
概要
前半はデータマネジメント組織をどう作っていくのかという構想について。
全社的にデータ利活用を進めるために、IT部門と業務部門を結ぶCoE(Center of Excellence)を設置して、データ品質を上げていく必要がある。
後半は実際自分のチームで行っているチームビルディング手法について。
データ基盤組織と言っても、エンジニアリングに強い人もいればマネジメントに強い人もいるため、お互いのスキルを可視化して役割を明確にすることで強いチームを作ることができるといった内容。
ポイント
CoEという組織が出てきたが、データマネジメントはデータ組織だけでは到底実現することができない。
例えばデータ品質であれば、Inputがあるフロントエンドシステムだったり、オペレーションの担当者だったりという人たちが、データ品質を高めることは全社的なデータ利活用、敷いてはビジネスの向上につながることを理解して、協力してもらう必要がある。
また、メタデータであっても同様にフロントエンドシステムだったり、業務の部門だったりという人たちが正しく定義して、データ組織にフィードバックする必要がある。
MonotaROのデータマネジメントにおけるCoEはどのような組織形態なのだろうかというのは気になった。ちなみにDMBOKには2つのモデルの紹介がされている。


感想
少し前に楽天のデータチームのセミナーを聞きに行ったとき、楽天はデータ利活用推進を目的としたCoEを設置しているということを言っていた。
ちなみに、うちはデータマネジメントを目的としたCoEを立ち上げたが、データマネジメントの意味を理解されるまでに至っていない会社だったので、途中からデータ利活用推進のCoEに舵を切って、データマネジメントの課題が明確になってから、データマネジメントも対象とするようにした。
全社横断組織となるとビジネスを生み出すプロフィット部門ではなくて、コストセンターとみられてしまうとつらいので、プロフィット部門であることをデータで示していかないといけないと思っている。
おわりに
自分の知識をまとめるためと今後誰かがデータマネジメントをやってみたいと思った時のきっかけとなるためにnoteを書くことにしました。
モチベーションのために役にたったという人はぜひ、フォロー&スキをお願いします。
ツイッターでもデータマネジメントに係る情報をつぶやいてますので、よろしくお願いします。
コツコツ書いてます。
— よしむら@データマネジメント担当 (@FP92754991) October 28, 2021
データマネジメント知識体系ガイドDMBOK要約・解説|データマネジメント担当 よしむら #note https://t.co/G9R0eeatZd
データマネジメントを学ぶ人が抑えておきたい本
DXを成功に導くデータマネジメント
DXを成し遂げるために必要なデータをどうマネジメントしていけばよいかが書かれている。
データ環境より、セキュリティの観点であったり、プライバシーの観点であったりといった非技術者向けの内容が多く書かれている。
データマネージメントに興味を持った人はまずは読んでみるとデータマネジメントでなすべき概要が理解できる。
実践的データ基盤への処方箋
データ利活用を行うために必要なデータ基盤の考え方と、利活用するためにはデータをどのようにマネジメントしていけば良いかを具体的な例を用いて説明されている。
技術が中心になるので現在データ技術に係る人がデータマネージメントに興味を持った時には、まず手に取ることをおすすめする。
個人データ戦略活用 ステップでわかる改正個人情報保護法実務ガイドブック
個人情報保護法を順守するための基本的な考え方が実務ベースで書かれている。2022年4月に施工される改正個人情報保護法で新たに追加される概念も同様に記載されている。
政府の出しているガイドラインよりも俯瞰的に読めるためデータプライバシーにかかわる人、データを使ったビジネスを推進する人は読んでおくとスムーズに業務が進められる。
データマネジメント知識体系ガイド(DMBOK)
自分も要約・解説記事を書いているDMBOK。データマネジメントに興味を持った人がまず手に取ると挫折することは間違いないほどのボリュームがある。
読めば読むほど味が出てくるので、データマネジメントを進めようとしている人は各家庭に1冊は是非買っておきたい。
データマネジメントが30分でわかる本
著者もDMBOKを読むためには非常にボリュームが多く読み解くには苦労するので、かみ砕いた解説書をまとめたと書いてある通り、DMBOKを独自解釈してわかりやすく書かれている。
DMBOKを技術者目線で読み解いた内容になっているので、実践的データ基盤への処方箋と同様データ技術に係る人におすすめする。