[Tableau Prep] 前処理に活用したいPrepの魅力とは?
DATA Saber ProgramのWEEK7の教材中にも取り上げられているTableau Prepですが、私が現在やろうとしていること、悩みにぴったりだったので、トライアルで使用してみることにしました。(Tableau CreatorアカウントをもっていればTableau Prepも利用できるとのこと。セットで使いたい…)以下はそのまとめになります。
Tableau Prep?
ちなみにTableau Prepとはなにか?ETLツールとの違いは何か?についてはこちらで詳しくKTさんが解説されていますのでTabealu Prepについて詳しく知りたい方はこちらを見てから利用検討されるのをお勧めします。
どんなユースケースに有効か?
先に触れた「私がやろうとしていたこと、悩み」についてですが大きくまとめると以下の4点になります。
分析しようとしているデータが断片的でそのままではVisualize化・分析できない(ユニオンや結合を多数且つ多種する必要がある、等)→ワイルドカードで複数テーブルのユニオン、Tableau Desktopではサポートのない右のみ/左のみ結合、非内部結合も利用可
データそのものが初見で中身を見ながら(妥当性の確認も含め)進めていく必要がある→データクリーニング機能で中身を確認しながら修正可能
月次売上と日次売上等の粒度の異なるデータを粒度を揃えて結合したり比較したりする必要がある→集計機能にてデータの集計単位を選びグルーピングすることが可能
複数ユニオンしたデータから一意の組み合わせを利用したい(重複を除きたい)→PrepでもLOD表現を用い一意の組み合わせを作成することが可能
こういった悩みをお持ちでTableauを利用している方にはTableau Prepはぴったりと言えそうです。詳細は長くなってしまうので各ポイント後日記事にしたいと思います。
Tableau Prep 最大の魅力
それは個人的には大きく2つあると思っています。
試行錯誤しながらデータを確認し、修正を加えたり時にはステップをさかのぼって途中に処理を加えながらデータをきれいに、そして分析できる状態にしていけること
その記録を明示的に残せること
やはり初見のデータを扱う際や、何等かの誤りを見つけるというのは行数や列数、データの規模によっては至難の業。Tableau Prepではデータを投入すると自動でその分布を教えてくれたり、修正の提案をしてくれるので初心者にはかなり有難い機能です。
実際に以下のサンプルデータでみると一番左のカラムにNull値が多いのがわかります。例えばこちらをクリックすると、4番目のカラムに表示されている日付情報の内、2007年のものに多く該当することが分かり、古い情報にNullが多いのかな?という想像がつく、というようなものです。
またTableau Prepでは取り込みデータから自動的に推奨事項を確認してくれる機能があり、カラムごとに削除を推奨されたり、次の工程に行く前にやった方がいいことなどを教えてくれます。
また、それらの修正や加工の記録、データの出所や行先が画面上部のようにMap化でき、詳細を共有することができるので、後から見返してもデータの生成についてBlackbox化することが防げます。
以上、Tableau Prepの魅力についてお伝えしました。
初心者にもとても使いやすいツールとなっていますので同じようなケースでお悩みの方には一度試して頂きたいです。