Udemyで学ぶTabeleau

流し見していく



【完】Tableau Prep 入門(約6時間)

セクション1 はじめに

Tabeleau Prepはデータプレパレーションツール
CSV形式で結果を出力して、可視化は他のツールを使ってもOK

セクション2 データプレパレーション

データ整形について、Tabeleau Desktop(表計算関数、LOD計算など)とTabeleau Prepの両方どちらでも可能な処理は多い
しかし、いくつかやり方を知っておくことには意味がある
・テーブル結合
・テーブルユニオン(ワイルドカードユニオンを含む)
・ピボット
・列名変更
・特定値の除外
・集計
※データ可視化はDesktopのみで可能

ファイル形式
・処理結果
 ・hyperファイル
・フロー
 ・tflファイル(フロー)
 ・tflxファイル(パッケージドフロー)

DesktopよりもPrepを使ったほうがよい場合
・想定通りのデータが入っているか確認したい(クレンジングが必要なことが判っている)
・試行錯誤しながら整形したい(整形の途中を見ながらやりたい)
・Desktopの表計算関数やLOD計算が苦手(組織内の一部のViz作成者は使いこなせても、他の者は苦手)
・Desktop側の計算式をシンプルにしたい(保守性を高めたい)
・パフォーマンスを改善したい(Desktop側で処理させるデータを減らす)

https://www.principle-c.com/column/tableau/tableau-prep-streamlining/

画面構成
・接続ペイン
・フローペイン:ステップで構成されている
・プロファイルペイン:フロー上のステップに対応
 ・変更ペイン:ステップで行っている変更が見れる
 ・データペイン:レコードが見れる


セクション3 データの接続・確認・準備

データインタプリタ
・分析用には適さないセル結合などを含むExcelファイルを、分析に適したテーブル形式に自動変換してくれる機能

UNION
・Excelが同じフィールド定義の複数シート(例:月別シート)
・ワイルドカードUNION機能を使うことで、ルールを満たすファイルを全てUNIONすることができる

JOIN

セクション4 ステップ(クリーニング)の追加

列の除外
値の除外(フィルタ)
列名とデータ型の変更
列の分割:区切り文字を使って分割

ディメンション
・ディメンションメンバー:ディメンションを構成する要素
・ディメンションメンバーの名称は変更可能、クリーニング機能でゆらぎ削除やトリミングも可能
・ディメンションメンバーをグルーピングすることが可能:1~30回をライトユーザ、31~60回をヘビーユーザ、などとしてまとめる

ゼロをNULLで置換する
・ゼロとNULLは全く異なるため注意が必要
 ・例:平均値を算出する場合、ゼロは分子に加算され分母は+1されるが、NULLはそもそも除外される
・データソース上にゼロがあった場合、それはNULLである可能性があるため、もし本来的にNULLなら、Tableau上でNULL置換すべき(ゼロのまま分析すると間違う)

計算フィールド

列のマージ

セクション5 集計・ピボット・結合・ユニオン

セクション6 出力の追加

セクション7 フロー自体に対する操作

セクション8 実践的問題解説

集計ノードによるLOD計算の模倣
・LOD計算はPrepではなくDesktopの機能、複数行間の計算(集計)
 ・例:{ fixed [オーダーid] : sum(売上) }
・しかし、Desktopをシンプルにしたい(LOD計算のような高度な処理は正しく理解されない可能性があるため、Prep側でETL処理してしまいたい)というニーズがある

セクション9 まとめ

補足:大量レコード読み込み時のサンプリング

本コースでは解説されていないが、レコード数が多いとPrepは勝手にサンプリングし始める仕様に気付いていなくて焦った

列数にもよるが、数十万~百万行(100K~1M)になると発生し始めるらしい


公式ヘルプ

https://help.tableau.com/current/offline/ja-jp/tableau_prep.pdf




【完】データ活用初学者のための Tableau講座〜入門編〜(約3時間)

セクション1 コース概要

コースの特徴
・実務で躓くポイント
・意思決定に使える可視化方法

セクション2 BIツールの位置づけと必要性

データソース

ETLツール

DWH

BIツール

最近BIツールには、ETL機能やDWH機能が付いている


セクション3 Tableau操作のデモンストレーション

・スコアカード
・スライサー:どうやってやる?
・ツールヒント
・アクション
・What-If分析:どうやってやる?


セクション4


セクション5

アナリティクス>傾向線


セクション6

地図


セクション7 売上と利益の散布図を確認しよう

クラスタの作り方
・自動(アナリティクス機能)
・手動(グループ化)


セクション8 予算比の売上を可視化しよう

簡易表計算
・移動平均
・前年比成長率
など

ブレンド関係
理解しにくかったので補足でコメント

計算フィールド

セクション9 ダッシュボードにまとめよう

スコアカードっぽいものを作る
最新日付のデータを表示する方法
 ・相対日付を使う
 ・計算式を設定する

アクションフィルタ
ダッシュボード>アクションで定義する


補足10 現場で即活用できるスキル集




補足11 終わりに




補足:Tableauにおける結合の種類

SQLの結


補足:Tableauにおける結合の種類

SQLの結合みたいなことがやりたいとき、Tableau Desktopではいくつか方法がある
(ちなみにTableau Prepでは「結合」のみ)

・結合:繋げてから集計する
・ブレンド:集計してから繋げる
・リレーションシップ:一番新しい

結合
結合したいテーブルが別個ファイルにある場合は「クロスデータベース結合」を使う

ブレンド
・集計されていない値を扱うことはできない
・LOD計算を使えない

https://ameblo.jp/yy1612yama/entry-12806372785.html

・リレーションシップ:LODを意識しなくても使える(Tableauが自動で判断してくれる)





データブレンドのメリット

結合との違いや方法についてはわかりましたが、ではどういう時にデータブレンドを使えばいいのでしょうか。Tableau社がいくつかデータブレンドのメリットは提唱していますが、代表的なのは、双方のデータソースの粒度が異なる時はデータブレンドの方がよい、でしょうか。
エントリの最初の例を見ればわかりますが、例えば、片方が日単位、もう片方が月単位のデータを結合するとき、結合の方法によっては、レコード数が増大します。同じレコード(データ)が増大することによって、余計に集計してしまう可能性があります。データブレンドは、そのようにはならないので、このようなケースの時はデータブレンドを検討してみる余地があるでしょう。

まとめ
リレーションシップの、レコード複製を避けてデータテーブルを結びつける働きはとても画期的です。
結合クエリがなくなり、パフォーマンス向上も期待されます。
また、リレーションシップを設定したデータソースをパブリッシュできる点も、大きな利点です。
しかしながら、これで、結合やデータブレンド(ブレンディング)の役割がなくなったわけではないようです。

【WIP】【中級】ビジネス分析を習得!~Tableau実践トレーニング



【WIP】Tabeleau Desktopコース(約11時間)

木田和廣氏のコース
字幕があればもっとよかった

コースのゴールで"Qualified Associate"、"Certified Professional"という試験区分?が出てくるけどこれは古い

元々は2018年にリリースされたコースらしいので仕方ない

Tableau Desktop Certified Professional
Tableau Desktop Certified Associate
Tableau Server Certified Professional
の各試験が廃止されました。

https://www.tableau.com/ja-jp/tableau-certification-faq

セクション1 コース概要


セクション2 画面の説明

サンプルデータとしては↓(スーパーストア.xls)を使う

基本的な動作は、
①データペインからビューにメジャー(指標)をD&D
②ディメンション(切り口)をD&D
③見栄えの調整
④シートに名前を付ける

ワークシート
・表示形式(Vizの種類)として、円グラフは非推奨
 ・負値を表現できない
 ・細かくなると大小関係が分かりにくい

ダッシュボード
フィルタを設定することでシート間の相互作用を設定できる

ファイル形式
・twb(ワークブック):データソースを含まない、実体はXMLファイル
・twbx(パッケージ):データソースを含む、実体はtwbファイルとデータソースを含むzipファイル(展開すると取り出せる)
最も原始的なダッシュボード共有方法は、twbxファイルをメール添付で送信して、TableauReaderで開く(読み取り専用)こと

セクション3 Vizのカスタマイズ





セクション4 書式のカスタマイズ



セクション5 チャートの種類




セクション6 ダッシュボードとストーリー



セクション7 データソースの変更




セクション8 実践演習


セクション9 まとめ

上級資格になると、どう見せれば理解しやすいか(色指定なども含めて)というスキルが要求されるらしい



【WIP】Desktop Specialist試験対策(約23時間)

・全範囲に亘って偏りなく網羅的に体系的に学べることが試験対策のアドバンテージ
・資格持ってても業務で役に立たないと意味ないので、表面的な解説はしてない(理解に必要な解説に時間をかけてる)

約11時間のコースの上位互換か?


【未購入】Tableau Desktop Specialist資格対策(約2時間)


木田氏の23時間コースを購入してしまったのでこっちは買わないかも


【未購入】【Tableau Desktop Specialist】最短で合格するための試験対策問題集

もし受験する気が起きたら購入予定


【未購入】TableauPrepとTableauをマスターしてデータ分析・BIツール作成スキルを習得(約2時間)

さすがに2時間は短すぎる、クチコミも良くなさそう



試験情報

・Tabeleau Desktop
 ・Associateレベル: Tabeleau Desktop Specialist
 ・Professionalレベル: Tableau Certified Data Analyst
・Tableau Server
 ・Specialistレベル: Tabeleau Server Certified Associste


いいなと思ったら応援しよう!