Platform 101:Data Plattformまとめ
こんにちは。Riekoです。
今回はDATA Saber最終試練に向けて、
KTさんの動画「Platform 101:Data Plattform」を観て学んだことをまとめました。
基本箇条書きなので駄文失礼します。
美しいvizを作ってそこからストーリーを得ることは、ゴールではない
そこからActionを導いていくことがゴール
その時にファイルを添付してメールで送る方法だといつまでたっても使い物にならない
自分も相手も同じ土台にいる世界に作っていかなきゃならない
分析結果をファイル形式で送っていると
同じデータが複数個所に存在
それぞれのデータの同期をとる必要がある
間違って古いデータを使ってしまう可能性がある
データを送ったりそれを確認したりするのにものすごく工数がかかる
データが安全かどうか、使ってもいいものかどうか全員がチェックしていかなければならない
そんなことは全員が行う必要はない
Tableau Serverを置くことができれば
データをデータソースとして置くことができる
分析結果を中心にみんなが同じデータを見ることになる
同じデータに対して様々な分析結果を作るごとに違うデータをアップしているのはもったいない(DBにも負荷がかかる)
データソースを一つにすれば、vizを複数作ってもその更新元が一つになる
様々なDBと接続しているデータソースでも、分析者がそれを意識することなく分析できるようになる
データを準備する人の存在も必要
IT部門が、グラフの作成まで依頼されることがある
本来の仕事はDB周りの面倒を見ること
Taskを持っている人自身がデータを見て考えられた方がいい
チャンピオンが存在することで
レポート作成依頼が多く発生し、キューが溜まってしまう。
やっとキューを返せた頃には2週間後などになり、そうするとレポートが「もう要らない」ことも起こりうる
チャンピオンの本当の役割は、レポートの作成を導くこと(知識の発信)
データを欲しい人自らレポートを作成すべき
知識の伝承を行いみんなができるようにする
100%できる人を5人育てるより5%知っている人を100人育てるほうがよい
データを作りたい人自らが作ることができ、それぞれの役割に応じて得意な作業を行える環境がData Plattform
Tableau Serverでできること
カスタムビュー:自分に合ったvizの表現を保存できる
メールの登録:vizをメールで通知して確認するよう設定できる
Web編集:自分のオリジナルのビューを作成できる
データソース一覧
データソースが認証された安全なデータかどうか確認できる
メンテナンス中で注意すべきデータを確認できる
どのデータがどれだけ使われているか見ることができる
DBのチューニングプランを立てることができる
1個のWBしかない場合、それに合わせればいいが、たくさんWBがある場合、色々な工夫が必要になる
外部アセット:データがどこから来てどのように使われているかわかる
警告:データの品質に対してアラートを付けたりメールを飛ばしたりすることができる
分析者がどこに対してどのようにアクションすればいいかわかる
まとめ
データはみんなで共有していかなければいけない
同じ場所(Platform)に存在することで、みんなが安全に安心して使うことができる
データが間違っていたり古かったりする場合データを安心して使うことができない