見出し画像

2019-11-19 data tech 2019

2019/11/19 に開催された data tech 2019 のイベントレポートです。

●イベント概要
昨今、デジタルトランフォーメーション(DX)を推進する企業が増加しています。
DXの目的は、デジタルを通じたイノベーションやデジタルビジネスの創出から、既存ビジネスの変革や事業基盤の改革といった領域まで幅広く、電通デジタルの調査ではデジタル変革に着手している国内企業は63%、着手予定まで含めると76%にのぼります。

デジタルトランフォーメーション(DX)を根底で支え、デジタル戦略の核となるのが「データ活用」です。 企業によるDX投資の波及効果でデータ分析市場は拡大し、各社が「データ」によって競争優位を得ようとしのぎを削っています。

しかし、DXやデータ利活用への期待が高まる一方、「データの可用性」「データの信頼性」「データの保守性」「データの機密性」といった、データマネジメントやデータガバナンスに関わる課題が存在します。データマネジメントは、データを正しく、効果的に利活用するためのベース作り。
データを利活用するためには、データガバナンスは不可欠です。

いくら優秀なデータサイエンティストがいても、正確な情報がなければ正確な分析結果は期待できません。

本年度の翔泳社主催の年次カンファレンス『data tech 2019』では、「DX推進に向けたデータ活用とデータマネジメントーデータを正しく、効率的に利活用するための条件」と題して、専門家やユーザー企業などを講師にお迎えし、来場者の皆さまにデータ活用の最新事例とデータテクノロジーに関する情報とアドバイスをご提供していきます。


■ZOZOテクノロジーズが描くイノベーションにおけるデータ活用

金山 裕樹さん[ZOZOテクノロジーズ]

画像1

●自己紹介
・Chief Innovation Officer
  ZOZOのアセットを使って、新しいビジネスを作っている

●Yahoo!によるZOZOのM&Aを支持しますか?
・ヤフー社へ株を売却し、ZOZOの社長を辞任した本当の理由。 by 前澤さん
  これが事実
・支持する 57%

●Yahoo!とLINEの統合
・何も言えない
・孫さんのスタイルはタイムマシン経営
  今は中国から真似ている
  SoftBankが潰れると、みずほも潰れるので潰せない
・データを統合しAIを活用して日本からアジア、そして世界に挑戦します!
・Yahoo!とLINEが持っているデータが統合できる
->データってそんなに重要なの?

●Data is the new oil
・データは石油ほどの価値がある
  ググると1億8千万件
・石油と似ているところ
  そのままでは役に立たない
  産業革命を推進していくもの
・そのままでは役に立たない
  精製所で加工して価値が生まれる
  10PBのデータがあっても、BIツールなどで精製して使えるようになる
・データは「意思決定」をつかさどる
  とある女性が服を買おうとしている
  色んな服から自分が買いたいなと思うものをピックアップ
  データを与える
    ファッション雑誌 1冊
      雑誌の中はデータ(イメージとテキスト)
      行動は変容
    ファッション雑誌 多数
      データが多すぎて、意思決定できない
      -> BIツールで、人間の脳が視覚で知覚できる形に加工
    ファッション雑誌 更に多数
      人間の脳では処理しきれないデータ
      -> データサイエンティストがAIで学習、サジェスト
  人間は因果でしか考えられない
    AIで相関からアプローチ
  やっぱり意思決定
    予測、パターン認識
    絵を描く も連続した意思決定
  AIが脳に代わり意思決定していく
・産業革命を推進していくもの
  19世紀の産業革命
    動力の革命
      蒸気でヒト以上の力
    重労働からの開放
  21世紀の産業革命
    知力の革命
      人間では認識できない情報の処理
    知的労働からの開放
      部分的に切り出して、ヒトは考えなくて良くなる
      あくまで弱いAI
・雇用が減る は減ると思う
  ただ、産業革命は労働を減らしてきている
  狩猟民族のころは働かないと生きていけなかった
  働くなくて良くなっていく
・ヒトは犬に近い存在になっていきそう
  パートナーのような
  AIが行っていく知的生産活動はヒトには理解できなくなりそう
  余暇を楽しむように時間を使っていくのでは

●ZOZOでは全てAIにしていこうとしている
・ジャネール・モネイのTシャツを買った
  Lサイズを買ったら届いたものは小さかった
  -> Lってなに?
    企業によってサイズがブレる
    これが、お客様にとって良いわけがない
  ネットだとサイズがわからないという理由で
  服を買うのを止めたことがありますか?
    89%
    機会損失
    -> 機械学習で解消
      YourSize
・まずはデータ収集
  ZOZOスーツ
  ZOZOマット
・ZOZOでは「あなたサイズ」をONにすると
  データを絞り込んで表示
  -> 服選びを楽に
・憧れのブランドをピッタリのサイズで
  体型データを提供
  ブランドの工場で生産
  国内外のブランドと連携
・MS(マルチサイズ)
  もうZOZOスーツを切る必要はない
  身長、体重、性別から機械学習で推測
・ZOZOMAT
  あしのサイズ計測を自宅で
・好みの問題が出てきた
  好みとトレンドをかけ合わせると、なかなか推薦できない
  見ればわかる
  試着の体験を再現
    デジタルミラーと同じくらいの精度で
    服のデータと、体型のデータ
    着せこんでシワなどのデータを重ねる

データで、だいたいの人間の意思決定をAIで代替できる

●QA
・欲しいデータはありますか?
  着用データ
  何が売れたかはわかる
  動画配信なら視聴データがわかる
  アパレル、ECでは買ったところまで
  着ているかどうかは分からない
  試しているが、いまいち経済的に合わない
    洗濯機にセンサー
    クローゼットにカメラ
  何かマッチするものがあるはず
・データのフェイク問題をクリアできる?
  ディープフェイクは網膜では判断できない
  デジタルコンテンツを全てブロックチェーンで管理する時代が来るかも
  チェーン上でのコストが高いのでまだ広がっていない
・データ活用の課題は?
  うまく使えば人間以上の知力を発揮する
  マインドセットが整っていない
・アパレル以外への進出は?
  人口は急激に増えることはない
  購入する量、頻度、質を上げていく


■AI/データ活用の本格化で見えたDX推進の「ボトルネック」と「処方箋」

近藤 嘉恒さん[ブレインパッド]

画像2

●自己紹介
・オービック
  ERP
・エクスペリアンジャパン
  マーケティングオートメーション
・ブレインパッド
  Rtoaster

●ブレインパッド
・データ活用の促進を通じて持続可能な未来をつくる
・データ専業で東証1部上場
・データ分析業界を牽引
  ・データサイエンティスト協会の立ち上げ
  ・JDLAの立ち上げ、検定試験を作っている
  ・GCP, MS, AWS, nvidiaの認定パートナー
・ビジネス
  ・全日本女子バレーボール
    iPadでやっていた予測部分
  ・コカコーラの画像解析
    twitter、instagramの解析
    飲まれているシチュエーションを分析
・データマーケティング
  データサイエンティスト集団
  ソリューション
    Rtoaster
    Probance
    Crimson Hexagon
●DXをテーマに相談いただく観点
・データ統合
・デジタルマーケティング
・分析チーム立ち上げ
・情報銀行・新規ビジネス

●今日は地味な話
・プロジェクトの「現場のリアル」

●DX
・さまざまな定義
  第3のプラットフォームを活用
  デジタルビジネスを推進
・エリック・ストルターマン
  ITの浸透が、人々の生活をあらゆる面で、より良い方向に変化させる
・日本はDXが進んでいない
  政府が率先して支援
  まだ、システムリプレイス合戦
  企業を格付け
・社内の仕組みづくりが中心
  重要性は理解している
  CDOを立てたり、仕組みを準備している
・DXプロジェクト と呼ばれる案件が増えてきた
  「AIを使って、DXしろ!」って経営陣から言われたんですよね。。。

画像4

●DXの分類
・観点
  既存ビジネスの進化
    合理化
    収益増強
  新たな市場創出
  x
  社内/顧客接点
・分類
  1. オペレーションのデジタル化
  2. 接点チャネルのデジタル化
  3. 意思決定のデジタル化
  4. サービス/製品のデジタル化
  5. 新規デジタルビジネスの創出
・1->5につながっていく流れ
  上に行くほど人が考えるもの

●X-Techもデータ活用の基本原理は一緒
・データ基盤、技術基盤、ビジネス基盤の構造モデル

●2025年の世界のデータ量予測
・163ゼタバイト
  256GBのiphoneが1兆5000億台
・整形:分析可能な状態
  -> 15%
・分析に利用
  -> 3%
・つまり 97% が使われていない
  この活用が必要

●勘違いしたデータ活用も発生
・データは売るものではない
・たまったデータはお客様のもの
  付加価値を生むために活用

●データ競争で勝敗を分けるのは?
・97%の活用
・鮮度の高いデータを持ち続けていること
  消費者からサービスが選ばれている事が必要
    サービスそのものの魅力を高める
    UI/UXを追求して依存性を高める
  日常的に触れるようなサービス設計が必要

●DXテーマでの取り組み
・サービス共創型の事業開発
・Google, MSを巻き込んだり

●DX3大疾患
・AI勘違い病
・PoC貧乏性
・ツール依存症

●AI勘違い病
・手段と目的を見失う症状
・製造メーカーから問い合わせ
  AI使って何かしたい
  A社でやろうとして失敗した
・事象
  データがない、整わない
    AIはデータが整備できていることが前提
  相談先が間違っている
    AIは手段なのでベンダーへ
    着想コンサルが必要だった
・モデリング以前に80%の時間を費やす
  目的設定
  データ準備 ★ここで時間が必要
  分析設計
  モデリング
  評価改善
・データが手元に届かない
  使ってよいのかわからない
    ポリシーやガイドラインが不足
  抽出環境が外部ベンダー任せ
    追加データ出したい -> 予算とってなかった
    インフラが脆弱すぎて抽出に16日
・データが読み解けない
  過去データを捨てちゃった
    トランザクションデータを捨てる流れ
    DBコスト削減
    -> 過去データから未来を予測するもの
  ERPで許容した特殊運用
    手入力の備忘データはテキストマイニングでも無理
  コードの使い回し
・処方箋
  経営主導でのデータガバナンス構築
  まず行うべきはデータを
    捨てない
    つなぐ
    隠さない

●PoC貧乏性
・ベンダーに依頼するが、検証方法を見失う
・食品流通業 発注自動化の例
  2社でPoCを実施したが選べない
  事象: PoC精度検証の条件が違う
    rawデータを渡して、まず考えるのは、成果
    条件は都合の良いもの
    どちらも間違ってない
    ベンダーごとに解釈が異なる
  設計思想の違い
    在庫の最適化 vs 需要の予測
・統計データが出てくるが、キードライバーはなんだかわからない
  -> 一長一短で選べない、業務理解が良ければ
・そもそもPoCの目的がずれてない?
  アルゴリズムの実用性検証だったはず
  で、一体 ナンボ 儲かるんだろう?
  ビジネスインパクトで判断

●ツール依存症
・流行りに乗って導入したMAツール、効果が出ないから他社にリプレイス
・罠1: CDPにデータを貯めたが使いこなせてない
    なんで貯めたの?
    いつどのように使う?
・罠2: MAツールを入れたが効果が上がらない
    効果って何?
・通称"デジマ"といえば、だいたいダブルファネルの話
・MarTechは、だいたいオートメーションに収まる
  顧客行動データを集め
    なんのために
  分析を駆使して、施策を考える
    誰に、いつ
  オンラインチャネルで接客
    どこで、どうやって
・デジマ系SaaSツールは戦国時代
  1年で1.9倍 930種
・マーケティングの基礎にたちかえろう
  セグメンテーション
    デジタル化で進化したこと
    データ収集、活用の価値
  ターゲティング
  ポジショニング
    消費者の行動に合わせて試行錯誤する部分
・配信手段よりも、顧客理解
  Howは充足している
  骨格を定めるためのデータ活用がカギ

●DXを進めるヒント
・成功事例
  大型商業施設
    収益根源はリアルな来客で有ることは普遍
    デジタルの直接と間接効果を可視化
    360度カスタマービュー
    来場前、来場中、来場後のシーンに紐付けたゲスト分析
    分析に基づいたコミュニケーション技法、オファリング設計
  課題の仮説を作り、立証
    なぜ その施策を行うべきか、データで立証する
・データサイエンティストがいない場合は?
  データの民主化が進んできた
  拡張分析
    自然言語でグラフィカルに
    一部のデータから学習
  VizTact
    回帰分析から要因を特定
    自然言語で分析したいテーマを指示
・民主化に向けたデータサイエンティスト職の育成
  人事の研修に盛り込む事例が増えた
  日本では1%しかいない
    DS : データサイエンティスト
    CDS: シチズンデータサイエンティスト
    IA : インフォメーションアナリスト

●まとめ
・データをいかに組み込んでいくか
・データを捨てない、具なぐ、隠さない
・なんぼ儲かるん?
・課題発見をファクトで示す
・課題を発見する新トレンド
  拡張分析
  組織立ち上げ

・本質的な目利き
・ツールは手段
・最適解を求める

●ワイガントさん
・なぜビジネス戦略を考える上でデータが必要か?
  顧客の疑問に答えるため
  顧客により良い問いかけをするため
  繰り返しを見極め自動化するため


■ビジネスを伸ばすためのWebパフォーマンスデータ活用方法

金児 仁史さん[アカマイ・テクノロジーズ]

画像3

●アカマイ・テクノロジー
・webパフォーマンス
・クラウドセキュリティ
・メディアデリバリー
・クラウドネットワーキング

●webパフォーマンスがなぜ重要なのか?
・webパフォーマンスを分析しているヒトはいますか?
  10%くらい
・webパフォーマンスとビジネスの関係
  LoadTimeが0.1秒遅くなると、コンバージョン率は7%低下
  2秒遅くなると、直帰率が x2
  3秒かかると53%が離脱
・コンテンツを探すときにイライラする体験は?
  1. ページをたくさん見る
  2. 関係ないオファー
  3. ページの読み込みが遅い
    32%
    18-34歳だと 41%
・遅いサイトは、Googleの検索ランキングが低下
  アクセス数が減少
・Google Chromeで、遅いサイトと認定したら「遅い」表示
  ビジネスに影響も

●webサイトを取り巻く環境の変化
・モバイルネットワークのスピード変化
  2010: 0.9Mbps
  2017: 15.6MBps
  -> 来年は5Gも
・webサイトのパフォーマンス変化
  2017: 4.9秒
  2019: 7.2秒
  -> ネットワークは早くなっているが、パフォーマンスは低下
・webサイトのサイズ変化
  2017: 1301KB
  2019: 1752KB
・画像サイズ変化
  2017: 703KB
  2019: 890KB
・JavaScriptサイズ変化
  2017: 290KB
  2019: 378KB
・JavaScriptリクエスト数とパフォーマンスの関係

画像5

・3rd partyコンテンツの割合
  SNSや広告など
  www.akami.com では 66.4%が3rd party
  -> 3rd partyコンテンツの管理も必要
・webパフォーマンスデータ活用例
  ExpediaグループのVrbo
  パフォーマンスとコンバージョンの関連を分析
  変更前後での比較

●webパフォーマンスデータの取得方法
・パフォーマンス分析
  Synthetic Testting
  RUM(リアルユーザーモニタリング)
・Synthetic Testting
  ツールがアクセスして計測
  メリット
    定期的にアクセスして傾向を把握
    サイト側には手を入れなくて良い
    リグレッションテスト
  WebPagetest
    www.webpagetest.org
    オープンソース
    キャッシュヒットなども確認できる
    まず始めるならこれ
  Rigor(リゴー)
    有償だけあって色々なあ情報が見れる
  Google Page Speed Insights
    スコア化されるため、非常にわかりやすい
    ベストプラクティスの適用尾状況が確認できる
    ChromeUXレポートからフィールドデータも確認できる
    -> score 100で売上が上がるわけではない
・RUM(リアルユーザーモニタリング)
  メリット
    実ユーザのパフォーマンスをトラック
    購入完了までの繊維などビジネス指標のトラッキング
    障害検知にも使える
  mPulse
    ほぼリアルタイム
    サンプルではなく全クライアントにビーコン
    知覚的パフォーマンス値が取れる
    パフォーマンスとビジネス指標の関係を可視化
      ロード時間 vs コンバージョン など

●webパフォーマンスデータの活用方法
・データに基づいて意思決定
・遅い原因を分析、改善
・データ活用に関わるmPulseの機能
  ビーコンをAWS S3にアップロードできる
  Query API -> DataDogなどへ連携など
  データが取れるのは良いけど、活用する時間がとれない
  ->アカマイエンジニアが定期レポート
    分析、提案、実装


■DXを加速度的に推進するデータマネジメントのあり方 ~組織横断でデータ活用を実現するデータ整備と体制とは~

櫻井 崇さん[リアライズ]

●リアライズ
・データマネジメントを通じて
 お客様の情報活用を実現するプロフェッショナル集団
・今週 ウィングアーク1stとの業務提携を発表
・データの悩み
  システムの中に入っているデータは、経年劣化する
  マスターが破壊されていると信用ならない
・サービスの全体像
  現状データ調査
  方針策定
    コンサルティング
  データ構築
    クレンジングサービス
  データ運用
    アウトソーシングサービス
・支援の範囲
  マスタ統合(MDM)
  MDMを守る組織
  品質が上がる
  BIへつながっていく
・データ課題解決の検討要素
  「データを使って何をしていきたいのか」を軸に
  体制・役割
  ルール・プロセス
  ツール
  教育

●自己紹介
・金融系でシステムをつくっていた
  一生懸命つくるがユーザがうまく使ってくれない。。。
・リアライズ
  ユーザがうまく活用していけるように

●活用の概要をまとめると
・DMPイメージ
  rawデータ
  -> Data Lake
  -> DWH
  -> ビジネス活用
    PoC
    公式データ
      PoCから昇格も
・PoC(sandboxエリア)を無制限に開放するとぐちゃぐちゃになる
  3ヶ月ですべて消すなどのルールが大切

●データ活用の阻害要因
・データが壊れている
・改ざん、不正
・データ移行を最初にやって積み上がらない
  取得できなかった事例はwebには上がっていない
-> 全てがシステム起因の課題ではない

●データマネジメント
・データを管理すること
・DMBOK
  データを統制保護し、提供、向上する
・いろいろあるが
  データ(fact)と向かい合うということ
・ただし、何でもかんでも見れば良いわけではない
  人が見るのはマスタに関わるもの
    不備
    整合性
  ヒトでは無理なもの
    トランザクションデータの補正

●今さら聞けないDX
・デジタル技術を浸透することで
 人々の生活をより良いものへと変革すること
・既存の価値観や枠組みを覆すようなイノベーションをもたらすもの
  局所的なデジタライゼーション
    デジカメ
  全域的なデジタライゼーション
    メールで画像をやりとり
  視界的な影響を生み出すのがデジタルトランスフォーメーション
    SNSで世界中に広まる
・企業におけるDX
  モノ売りからサービスを売る
  データを売るかもしれない
・現状は、、、
  AIでいい感じの成果を出してくれ
  もう絶滅しているはずですがw
・最近の受ける相談
  DMPをつくるために
    全部DataLakeに突っ込んだのでぐちゃぐちゃに。整理を手伝って
    一旦全部全て捨てるので手伝って

ここからの話は「何をしたいのか」の戦略があることが前提

●マスタ統合とデータモデリング
・マスタデータ統合のパターン
  解析型
    各システムがマスタを持っている
    読み替えて連携
  マスタハブ型(調和型)
    一旦集めて、各システムに同期
    更新時期に合わせて統合型へ移行
  マスタハブ型(統合型)
    統合マスタから各システムに配信
・顧客MDMのサンプル
  基本型
    グループ->会社->部署->担当者
  階層管理型
    グループ->会社->部署->担当者
         -上位会社->下位会社
  変化対応型
・商品MDMのサンプル
  製造部品
    一般商材
・顧客は難しい
  営業のお客様と、デリバリのお客様は別
  統合が難しい
  全社と営業、デリバリで持つ部分を分ける

●マスタデータのクレンジング・名寄せ
・顧客データのクレンジング・名寄せ
  顧客データクレンジング
    名寄せはクレンジングしてあるからできる
  項目の一致量で判断
  運用でチェックするサイクル
・商品データのクレンジング・名寄せ
  不要なデータを廃止していくことがクレンジングになる

●データ編集・加工の支援
・データサイエンティスト
  複合的な役割を持つヒトに名前がついた
  50-80%はデータの準備に時間が使われている
・データの品質を上げていく
  データソースを特定、入手
  データ構造を理解
  分析モデルを検討
  データ分析を実施
  結果をレポート
・セルフETLツールが流行っていきそう
  Alteryxなど

●データカタログの作り方
・データカタログ
  企業の全データ活用促進の辞書
    存在、生い立ち、特徴、意味定義、品質、コードの意味合い
    などが揃っている必要がある
  ≠MDM
  順に増やしていくしかないので戦略がないと途中で倒れてしまう
・データカタログの構築事例
  中央集権的に集める
    主要なエンティティの概念モデルからバックボーンを抽出
  統合対象のサービスを広げていく
  データカタログ担当、開発者を一緒のチームに
    正副の2名くらいでも

●体制、考慮すべきポイント
・ダウンロード資料に掲載してます

●まとめ
データを制するものがビジネスを創る時代になっています
データを見てあげてください


■「セクシーな仕事」から市民データサイエンスの時代へ

西内 啓さん[データビークル]

●この文章見たことありますか?
・I keep saying the sexy job in the next ten years will be data scientists.
  Hal Varian 2009
・本当はデータサイエンティストって言ってない
  statisticians
  統計家
・すでに10年経った
  次の10年は?

●データ活用の理想
・理想的なサイクル
  データ
    活用しやすく整備
  分析
    適切な手法を
  意思決定
    どう活かすかを指示
  現場
    効果を検証
・企業の課題
  このサイクルを回せていない
  10年前から変わってない
  どこかで止まってしまう

●現実は
・意思決定
  見える化しかわからない
  慎重に議論しようよ、で止まってしまう
・現場
  やりっぱなし
・データ
  利用が困難
  タイムスタンプしかないから、分析対象を特定できない
  顔認証はあるけど、動線がつかめない
  買収を重ねていると、データが分断している
・分析
  高度だが無意味

●データサイエンティストは何に時間を使っているか
・データ収集
  19%
・データ加工
  63%
  データは正規化して格納される
  分析するときは結合して1つの表にする必要がある
・アルゴリズムの適用とチューニング
  13%
・その他
  5%
  社内調整とか?

●データの扱い方
・記述的分析
  過去に何が起きたかを正確に把握
  BIツール
    昨日いくら売り上げた、男女比などを正確に把握できる
・予測的分析
  将来何が起きるのかの確率を分析
  AI
    レコメンドエンジンなど
・診断的分析
  なぜ起きたのかの因果関係を明らかに
  統計ツール + 専門家
    ここが難しい

●BIツールの限界
・横軸探しの地獄
  グラフの種類を選ぶ
  軸を決める
・経験と勘に基づく仮説を裏付けても「当たり前」の結果だけ

●AIによる予測的分析とその限界
・大量の入力データ -> ブラックボックス -> 売上・コスト予測
・理由はわからないが5万円買ってくれそう
  もうちょっと買ってくれるには?は分からない

●診断的分析のイメージ
・意外な要因 -> 売上やコスト
  イメージを変えれば XX円儲かるかも
  研修を変えれば XX円儲かるかも
  特定の立地に出せば XX円儲かるかも
・コスト
  SAS, SPSSなど統計解析ツール
    ライセンスだけで 1000万円/年
  データサイエンティスト
    350万/月 x2名 x12ヶ月 = 8400万円
・それだけ掛けても結果は
  その話だすやついるけどだいたいコケるんだよ、な結果など
  分析 と 現場 のコミュニケーションギャップ
  分析側から見ると
    ドメイン知識はない
    データとの格闘は大変

●DataVehicle
・分析 -> 意思決定 をスムーズにつなぐ
・アプローチ
  分析用のデータ準備が大変、センス頼み
    いろんな会社で同じプログラムを書いていた
    業務データベースから、分析用データを自動生成
  AIで予測はできてもアクションにつながらない
    スパースモデリング
    多様な変数から「意味のある要因」を自動探索
  意思決定者は「集計」「見える化」までしか分からない
    自然言語とグラフで可視化
・dataDiver
  経営課題を入力すればOK
  集計単位 ごとに見た 項目 の 合計が少ないことが課題
    解析 -> 十数秒で結果が出る
  統計的仮説検定は自然言語で丸め
    pが5%以下 を とてもクリア などに
  分析結果の断面図を自動で可視化
・これが世の中の流れになってきた
  ハイプ・サイクルで 市民データサイエンス という言葉を出してきた
  2023年までに主流になっていきそう

●2019 データ/アナリティクス・テクノロジ・トレンド トップ10
・拡張アナリティクス
  データ準備、洞察の生成、洞察の可視化 を自動化
  多くの状況でデータサイエンティストの関与が不要に
・説明可能なAI
  Explainable AI
  モデルを説明し、その長所と短所を明らかにし、起こり得る行動を予測
  Amazonの採用AI
    予測結果が見れないから、男女差別しているように見えてしまった

●Hal Varian 2009 の続き
・2009年時点で全部話していた
  Statisticianはデータを理解し価値を引き出す仕事の「ほんの一部」
  データから洞察を得て伝えるスキルが重要
  マネージャーがデータにアクセスできるように

●創業以来の私たちのミッション
・データサイエンスをすべての人に
  東大の教授時代から、統計学がみんなに役立っていない感
・dataDiverの立ち位置
  記述的分析
    BIツール
  診断的分析
    dataDiverで自動化
  予測的分析
    dataDiverの来年のリリースでサポート

●機械学習技術の作業フロー
・kaggleの主流
  生データ
  -> 分析用データ
  -> さまざまな手法
    ディープラーニング
    ディシジョンツリー
    回帰分析
  -> チューニング
  -> アンサンブル学習
    多数決に精度の重み付け
  -> 予測値の算出、精度の検証
・AutoMLで新たに自動化できる部分
  -> さまざまな手法
  -> チューニング
  -> アンサンブル学習
・dataDiverと組み合わせればフローを回せる
  生データ
  -> 分析用データ
・データ分析/データ活用のサイクルを楽にしても
  人間がリスクテイキングする意思決定が必要
  いくつ売れるから、準備しよう は取り入れやすい
  全然売れないから、仕入れるべきではない は意思決定が必要

●必要なポジション
・データサイエンティストがいなくても大丈夫
・ボス
  数字と理屈で意思決定のリスクを取れる人
  問題があれば頭を下げられる覚悟
・エキスパート
  現場の事情とオペの肌感覚
・データマネージャー
  データとシステムの土地勘がある
・分析担当者
  ITとハードワークが苦にならない若手/中堅

●得られる効果
・データドリブンに意思決定していると、生産性は5-6%向上
  5%が福利で効いてくると15年で倍以上のさ
・データ分析のROIは、13倍

●まとめ
・元と分析をつなげる市民データサイエンスを活用
・データと打ち手が「回る」組織
・データドリブンな意思決定は大きな利益を生む

●Tokyo Data Science Labs 2019
  12/6 に大崎でやります


■感想

・産業革命はヒト以上の力を生み出すもの
  21世紀の産業革命は知力の革命
・DXの5分類
  1. オペレーションのデジタル化
  2. 接点チャネルのデジタル化
  3. 意思決定のデジタル化
  4. サービス/製品のデジタル化
  5. 新規デジタルビジネスの創出
・データ活用のサイクル
  データ > 分析 > 意思決定 > 現場
・データ分析の種類
  記述的分析、予測的分析、診断的分析

など、データの活用方法が型化されてきたのを感じてワクワクが止まりませんでした!処方的分析ができるようになるのも近いかもしれませんね!

登壇者の皆さん、運営の皆さん ありがとうございました!!


いつも応援していただいている皆さん支えられています。