BI(Tableau)で絶対知っとくべきデータの構造
私はTableauやAdobe Analyticsの社内勉強会を自主的に行う機会が多い。
でもこういう勉強会はどうしてもツールの使い方に重きが置かれてしまうためなかなかデータの構造まで理解してもらうことは少ない。
でも絶対知っておいたほうが良いと思うので、書いてみた。
1、データの持ち方と可視化
データの持ち方すなわち構造。これは言語化することが難しいのだが、全てのグラフの裏には数表(クロス集計)が存在して、それを基にグラフが描画される。
つまり可視化だ。Tableauではすぐにグラフを変更することが可能だが、それも裏の数表と表現方法を変えているだけに過ぎない。裏ではその描画を行う上でのデータの持ち方がある。
言葉では理解しづらいと思うのでざっくりのイメージを作ってみた。
つまり上記の棒グラフには色がついているが下のクロス集計表を基に作られている。
ちなみに円グラフでも散布図でも箱ヒゲ図でもなんでも必ず描画するための数表は存在する。よって、全てのグラフはこの数表を基に色々な見せ方をしている。逆を言えば適切な数表がない限り可視化は絶対不可能である。
だがそれがTableauだと理解しにくい。これが発生してしまう理由はTableauが直感的かつ簡単であるがゆえに元データ作成という手順を通常踏まない(※実際はやっているのだが意識しづらい)ツールであることが理由だと思っている。
2、Excelとの違い
どうやって手順を飛ばしているのか、Excelとの比較で記載してみる。
一方、Tableauで作ると以下の様になる。※色々あるけど結構端折ってます
Tableauの場合
■その1
①ディメンションやメジャーをドラッグ&ドロップ
②マークから描画したいグラフの種類を選ぶ
③完成!
ExcelとTableauの大きな違いはグラフの元となる数表を作っているかいないかという点がある。
Tableauはドラッグ&ドロップのような簡単な操作である程度グラフが作れてしまい、更にそこまでの手順が非常に簡単であることから手順だけを覚えてしまうと裏に数表が存在することまで意識しにくい。
しかし両者は同じグラフであれば同じ数表を元にグラフを作成している。この点は可視化とデータの持ち方を正確に理解してもらう上できちんと説明をするべきだと考える。
何より大事なのは目的に沿った可視化をする際にどういった数表を作れば、目的を達成できるのかが分かるようになることだ
これが分かると作りたいビューから逆算してどういうデータが必要でどのようなデータベースが必要かまで追える。
これはTableauのようなBIツールでは非常に重要な要素だが、更に色々なツール習得を初め全てのことにつながる。
例えばGoogle Analyticsとかだとグラフや数字は、計測ログとその集計結果を表示しているに過ぎないことが分かれば裏のデータや構造が分かるなど非常に応用が利くなど他のツールでも考察の幅が広がる。
是非今後BIツールを使っている人は簡単に可視化をするだけではなく、何を基に描画しているのかまで常に意識するようにしてほしい。