GoogleCloud DataAnalytics OnAir2022 レポート(後半 GCP編)
GoogleCloud DataAnalytics OnAir2022について
公式サイトより概要を抜粋。
公開されている動画を見ながら、概要と感想をまとめていきます。
後半のセッションはGCP関係で、GCPのサービスを使ってデータ基盤を作る方法が語られていた。
データマネジメント セミナーレポート
データマネジメント関連のセミナーに興味ある人はこちらからどうぞ。
リアルタイムに、シームレスに、データに基づく意思決定ができる。データ分析・活用基盤としてのGoogleCloudの優位性とは。
発表者
Google Cloud データアナリティクス スペシャリスト 鈴木 邦明氏
概要
データ基盤構築の流れ
データソース→データレイク→DWH→データマート→BI・AI
※データレイク→DWH→データマートにはメタデータ管理も含む。
ステークホルダー
データ基盤には
ビジネスユーザー、デジタルマーケ、データサイエンティスト、IT部門
の4グループのステークホルダーが存在する。
各ステークホルダーの課題
ビジネスユーザー:やりたいことはあるが、データの在り処やアクセス方法がわからない。SQLが使えない。BIの編集ができない。
デジタルマーケ:マーケティングツールには慣れている。部門横断の分析がしたい。リアルタイムに手を打ちたい。
データサイエンティスト:インフラに依存するが、IT部門の管理するインフラに手が出ない。
IT部門:インフラのサイジングが困難。ビジネスユーザーに振り回される。ビジネス側に勝手ツールを持ってほしくない。
GCPを使いデータ基盤を構築するとこれらの課題は解決できる。
感想
よくある話なので、特に感想はないが、ビジネスユーザー向けにBIツールを提供していくのはある程度諦めて、BigQuery×スプレッドシート(コネクティッドシート)を提供するというのがいいのかもしれない。
LoB=Line of Business 事業部門側の略
Google Cloud の Smart Analytics で始めるデジタルマーケティング入門
発表者
Google Cloud カスタマー エンジニア 千川 浩平氏
概要
データマーケティングの環境
カスタマージャーニーは年々複雑に。データも増大。
顧客の興味、関心に寄り添うことが不可欠。ただ、顧客データは社内のあちこちに分散している。
マーケティングデータ基盤に求められる要素
・データ収集・管理
・ID統合
・複雑な分析ができる環境
・分析した結果をもとに施策が実施できる環境
・ビックデータを扱えるパフォーマンス
GCPを使ったCDP環境
Googleのサービスには、GA,BigQuery,Analytics,Firebaseと一通りそろっておりシームレスに連携することができる。
※ちなみに、GAのローデータをエクスポートできるのはBigQueryのみ。
フルマネージドかつ、大量のデータを処理できるBigQueryを使えば一般的なCDP商品が備えている機能は満たすことができ、CDP環境を構築するためには向いている。
フルマネージドサービスのため、運用面にリソースを割く必要がなく、メタデータ管理などよりビジネスに必要なところにリソースを割くことができる。
BigQueryにはBigQueryMLという機械学習機能を兼ね備えており、PythonやRなどの言語を覚えることなく機械学習を行うことが可能。
感想
あえてCDP文脈で語られているので、マーケティング担当者向けのセッションなのかもしれない。
個人的には顧客ベースでデータ環境を作るのが当たり前だったので、DWH≒CDPと思っていたのだけど、工場のデータとか物流のデータとかメーカー系のDWHだと顧客ベースではないケースも多々あるので、あえてCDP目線で語るというのはありなのかなと思った。
ただ、この話を聞く人がDWHとCDPの違いを環境構築側が理解できているとは思えない。
大量データを扱う分析基盤の構築における Google Cloud の活用方法とは?
発表者
アイレット株式会社 執行役員 / エバンジェリスト 後藤 和貴氏
概要
企業はデータを一元的に統合・管理して、ビジネスの意思決定を行っていきたいと思っているが、実際にはデータ利活用が進んでいない。
データ利活用が進まない要因
・データが分散していて活用できていない
・データフォーマットが違い横断して分析できない
・何をやればいいのかわからない
・管理・保守の運用コストがかかる
これらの課題を解決するための伴走者が求められている。
どのように解決しているか
GCPだとフルマネージドなデータ基盤を構築することができるため、全てが解決できる。
感想
結局GCPが銀の弾丸みたいな説明されていたが、ユーザー企業側の課題は残ったままなのではないかと思う。
コンサルが作ったGCPにユーザー企業がついていけるための仕組みを作るのが本来の課題なので、コンサル企業とは考え方が違うなと感じた。
事例にガンホーが出てきたが、ガンホーは冒頭説明した課題のうち管理・保守コストだけしか課題がなさそうで話の内容がつながってなくて説明としてはいまいちだった。
Google Cloud を用いた一人ひとりに最適なアプリ体験を実現する方法
発表者
株式会社LIFULL LIFULL HOME'S事業本部プロダクトエンジニアリング部 エンジニア 菊地 慧氏
概要
「やることリスト」について
LIFULLアプリのデータをGCPに格納して、一人ひとりに最適なアプリを作った事例の紹介。
「やることリスト」という物件探しのTODOチェックリストツールがあるが、利用者数が低くユーザーに認知されていない。ただし「やることリスト」を使っているユーザーのリテンションは高かった。そのため「やることリスト」の利用者を拡大していけば、アプリ利用の継続率も上げることができると考えて、施策を実施した。
行った施策の事例
自動生成機能:「やることリスト」は使う前にいくつかの質問に答えていく必要があるが、そこをアプリ内の行動で代替することで手間を省いた。
自動チェック機能:「やることリスト」のチェックをアプリ内の行動で代替することで自動的にチェックされるようにした。
施策の効果
施策を行う前に比べて、全体の1%の利用率が29%と大幅に向上した。
ただ、データがアプリローカルに保存されていた、OS別にデータ構造が違う、クライアント側で実装すると運用負荷が高かったので、サーバー側が移行していきたいという要望が出てきた。
Gloud Firestoreの利用
ローカルのデータ(Firebase)からFirestoreに移行することでGCP上で処理を行うことができるようになった。
アプリはFirestoreのデータを見に行っている。FirestoreをPub/subを起点に更新することで、アプリ側で実装していた「やることリスト」の機能をサーバー側で実装するように移行した。
感想
セッションが初級と書いてあったが全然初級じゃなくて全てのセッションの中で一番具体的かつ効果が明確でわかりやすかった。
こういう隠れた名機能をデータで掘り起こして、データで解決するという事を見るとデータ利活用が必要だなと思われられる。
最適な体験を提供するためには、行動分析を行いそれをお客様の体験へのフィードバックすることが重要という事の事例を知った。
おわりに
自分の知識をまとめるためと今後誰かがデータマネジメントをやってみたいと思った時のきっかけとなるためにnoteを書くことにしました。
モチベーションのために役にたったという人はぜひ、フォロー&スキをお願いします。
ツイッターでもデータマネジメントに係る情報をつぶやいてますので、よろしくお願いします。
データマネジメントを学ぶ人が抑えておきたい本
DXを成功に導くデータマネジメント
DXを成し遂げるために必要なデータをどうマネジメントしていけばよいかが書かれている。
データ環境より、セキュリティの観点であったり、プライバシーの観点であったりといった非技術者向けの内容が多く書かれている。
データマネージメントに興味を持った人はまずは読んでみるとデータマネジメントでなすべき概要が理解できる。
実践的データ基盤への処方箋
データ利活用を行うために必要なデータ基盤の考え方と、利活用するためにはデータをどのようにマネジメントしていけば良いかを具体的な例を用いて説明されている。
技術が中心になるので現在データ技術に係る人がデータマネージメントに興味を持った時には、まず手に取ることをおすすめする。
個人データ戦略活用 ステップでわかる改正個人情報保護法実務ガイドブック
個人情報保護法を順守するための基本的な考え方が実務ベースで書かれている。2022年4月に施工される改正個人情報保護法で新たに追加される概念も同様に記載されている。
政府の出しているガイドラインよりも俯瞰的に読めるためデータプライバシーにかかわる人、データを使ったビジネスを推進する人は読んでおくとスムーズに業務が進められる。
データマネジメント知識体系ガイド(DMBOK)
自分も要約・解説記事を書いているDMBOK。データマネジメントに興味を持った人がまず手に取ると挫折することは間違いないほどのボリュームがある。
読めば読むほど味が出てくるので、データマネジメントを進めようとしている人は各家庭に1冊は是非買っておきたい。
データマネジメントが30分でわかる本
著者もDMBOKを読むためには非常にボリュームが多く読み解くには苦労するので、かみ砕いた解説書をまとめたと書いてある通り、DMBOKを独自解釈してわかりやすく書かれている。
DMBOKを技術者目線で読み解いた内容になっているので、実践的データ基盤への処方箋と同様データ技術に係る人におすすめする。