Udemyで学ぶTableau

流し見していく



【完】Tableau Prep 入門(約6時間)

セクション1 はじめに

Tabeleau Prepはデータプレパレーションツール
CSV形式で結果を出力して、可視化は他のツールを使ってもOK

セクション2 データプレパレーション

データ整形について、Tabeleau Desktop(表計算関数、LOD計算など)とTabeleau Prepの両方どちらでも可能な処理は多い
しかし、いくつかやり方を知っておくことには意味がある
・テーブル結合
・テーブルユニオン(ワイルドカードユニオンを含む)
・ピボット
・列名変更
・特定値の除外
・集計
※データ可視化はDesktopのみで可能

ファイル形式
・処理結果
 ・hyperファイル
・フロー
 ・tflファイル(フロー)
 ・tflxファイル(パッケージドフロー)

DesktopよりもPrepを使ったほうがよい場合
・想定通りのデータが入っているか確認したい(クレンジングが必要なことが判っている)
・試行錯誤しながら整形したい(整形の途中を見ながらやりたい)
・Desktopの表計算関数やLOD計算が苦手(組織内の一部のViz作成者は使いこなせても、他の者は苦手)
・Desktop側の計算式をシンプルにしたい(保守性を高めたい)
・パフォーマンスを改善したい(Desktop側で処理させるデータを減らす)

https://www.principle-c.com/column/tableau/tableau-prep-streamlining/

画面構成
・接続ペイン
・フローペイン:ステップで構成されている
・プロファイルペイン:フロー上のステップに対応
 ・変更ペイン:ステップで行っている変更が見れる
 ・データペイン:レコードが見れる


セクション3 データの接続・確認・準備

データインタプリタ
・分析用には適さないセル結合などを含むExcelファイルを、分析に適したテーブル形式に自動変換してくれる機能

UNION
・Excelが同じフィールド定義の複数シート(例:月別シート)
・ワイルドカードUNION機能を使うことで、ルールを満たすファイルを全てUNIONすることができる

JOIN

セクション4 ステップ(クリーニング)の追加

列の除外
値の除外(フィルタ)
列名とデータ型の変更
列の分割:区切り文字を使って分割

ディメンション
・ディメンションメンバー:ディメンションを構成する要素
・ディメンションメンバーの名称は変更可能、クリーニング機能でゆらぎ削除やトリミングも可能
・ディメンションメンバーをグルーピングすることが可能:1~30回をライトユーザ、31~60回をヘビーユーザ、などとしてまとめる

ゼロをNULLで置換する
・ゼロとNULLは全く異なるため注意が必要
 ・例:平均値を算出する場合、ゼロは分子に加算され分母は+1されるが、NULLはそもそも除外される
・データソース上にゼロがあった場合、それはNULLである可能性があるため、もし本来的にNULLなら、Tableau上でNULL置換すべき(ゼロのまま分析すると間違う)

計算フィールド

列のマージ

セクション5 集計・ピボット・結合・ユニオン

セクション6 出力の追加

セクション7 フロー自体に対する操作

セクション8 実践的問題解説

集計ノードによるLOD計算の模倣
・LOD計算はPrepではなくDesktopの機能、複数行間の計算(集計)
 ・例:{ fixed [オーダーid] : sum(売上) }
・しかし、Desktopをシンプルにしたい(LOD計算のような高度な処理は正しく理解されない可能性があるため、Prep側でETL処理してしまいたい)というニーズがある

セクション9 まとめ

補足:大量レコード読み込み時のサンプリング

本コースでは解説されていないが、レコード数が多いとPrepは勝手にサンプリングし始める仕様に気付いていなくて焦った

列数にもよるが、数十万~百万行(100K~1M)になると発生し始めるらしい


公式ヘルプ

https://help.tableau.com/current/offline/ja-jp/tableau_prep.pdf


【完】データ活用初学者のための Tableau講座〜入門編〜(約3時間)

セクション1 コース概要

コースの特徴
・実務で躓くポイント
・意思決定に使える可視化方法

セクション2 BIツールの位置づけと必要性

データソース

ETLツール

DWH

BIツール

最近BIツールには、ETL機能やDWH機能が付いている


セクション3 Tableau操作のデモンストレーション

・スコアカード
・スライサー:どうやってやる?
・ツールヒント
・アクション
・What-If分析:どうやってやる?


セクション4 環境設定


セクション5 売上をカテゴリや期間で集計

アナリティクス>傾向線


セクション6 売上を地域ごとに集計

地図


セクション7 売上と利益の散布図を確認しよう

クラスタの作り方
・自動(アナリティクス機能)
・手動(グループ化)


セクション8 予算比の売上を可視化しよう

簡易表計算
・移動平均
・前年比成長率
など

ブレンド関係
理解しにくかったので補足でコメント

計算フィールド

セクション9 ダッシュボードにまとめよう

スコアカードっぽいものを作る
最新日付のデータを表示する方法
 ・相対日付を使う
 ・計算式を設定する

アクションフィルタ
ダッシュボード>アクションで定義する


補足10 現場で即活用できるスキル集

補足11 終わりに

補足:Tableauにおける「結合みたいな操作」の種類

SQLの結合みたいなことがやりたいとき、Tableau Desktopではいくつか方法がある
(ちなみにTableau Prepでは「結合」のみ)

・結合:繋げてから集計する
・ブレンド:集計してから繋げる
・リレーションシップ:一番新しい

結合
結合したいテーブルが別個ファイルにある場合は「クロスデータベース結合」を使う

ブレンド
・集計されていない値を扱うことはできない
・LOD計算を使えない

https://ameblo.jp/yy1612yama/entry-12806372785.html

・リレーションシップ:LODを意識しなくても使える(Tableauが自動で判断してくれる)





データブレンドのメリット

結合との違いや方法についてはわかりましたが、ではどういう時にデータブレンドを使えばいいのでしょうか。Tableau社がいくつかデータブレンドのメリットは提唱していますが、代表的なのは、双方のデータソースの粒度が異なる時はデータブレンドの方がよい、でしょうか。
エントリの最初の例を見ればわかりますが、例えば、片方が日単位、もう片方が月単位のデータを結合するとき、結合の方法によっては、レコード数が増大します。同じレコード(データ)が増大することによって、余計に集計してしまう可能性があります。データブレンドは、そのようにはならないので、このようなケースの時はデータブレンドを検討してみる余地があるでしょう。

まとめ
リレーションシップの、レコード複製を避けてデータテーブルを結びつける働きはとても画期的です。
結合クエリがなくなり、パフォーマンス向上も期待されます。
また、リレーションシップを設定したデータソースをパブリッシュできる点も、大きな利点です。
しかしながら、これで、結合やデータブレンド(ブレンディング)の役割がなくなったわけではないようです。

【WIP】【中級】ビジネス分析を習得!~Tableau実践トレーニング(約4.5時間)

操作マニュアル的な話に終始してないのがよい


セクション1 コース紹介とTableauの歴史

セクション2 用語と基本操作

スーパーストアを使って、基本的なワークシート/ダッシュボード/ストーリーを作成する


セクション3 基本のチャート作成

明細表
・明細表は、データソースを集計せずに、最も細かい単位でテーブルに表示するもの(例:トランザクションデータ)
・実はTableauでは苦手な可視化だが、同一データに基づく集計値と明細の両方を確認したいという業務ニーズは多いため、よく使う

時系列
・棒グラフ:売上高、利益
・折れ線グラフ:売上高利益率

表計算(WIP)
・既にビュー上に表示されている計算結果に対して、さらにビュー上で計算する機能(表計算を設定したピルには△マークが付く)

・例
 ・構成比(合計に対する割合)
 ・増減費(差の割合) ※対前年同期増減率も可
 ・百分
 ・移動計算
 ・累計
 ・差

・計算の順序:「表計算」は最後に実行される
 ・TableauDesktop外での処理
  ①データソース
  ②カスタムSQL:記述する場所はTableauDesktopの「データソース」タブだが、処理を担うリソースはTableauの接続先データベース等である
 ・TableauDesktop上の処理
  ③VizQL:ビュー上で描画を行う時に実行される(例:売上を年や四半期で集計して表示)
  ④表計算:ビューの描画結果に対して実行される

・「表計算」と「計算フィールド」の使い分け方
 ・動的集計や「次の値」計算が必要な場合:「表計算」
 ・その他の場合:「計算フィールド」


クロス集計・ハイライト表
・クロス集計:軸は階層化して使う(概要から明細にブレイクダウンして見ていけるように)
 ・階層は「グループ」により自由に作成可能
・行ごとや列ごとに色付けしたい場合は、表計算の「特定のディメンション」を使う(?)


前年同月比(昨対比)
・エリアグラフ(分析>スタックマーク>OFF)にすると、線の交差が分かりやすくなる

三重軸(複数メジャーでの比較)
・認知不可が高くなるので注意

メジャーバリュー・メジャーネーム
・Tableauが自動生成するフィールド
・メジャーとなっているフィールドについて、「フィールド名」と「値(バリュー)」をまとめて操作/変更するために使う
※Tableauにおいてフィールドはメジャー/ディメンジョンのいずれか
※TableauにおいてフィールドをUI要素にしたものを「ピル」と呼ぶ

散布図
・初期分析に使う、関係性が未知の変数を見る

割合の計算
・集計:集計(集計単位はビュー上の切り口)してから計算
 ※例:SUM([利益]) / SUM([利益])
・非集計:行ごとに計算
 ※例:[利益]) / [利益]

セクション4 応用的なチャート

アンケート分析
・IF関数、CONTAINS関数
・パイチャート

レイアウトマッピング
・結合(JOIN)
・背景イメージの追加

ドーナツチャート
・UNION:ワイルドカード指定で自動読み込みできる
・ドーナツチャート:Tableau標準のVizにはない、技巧的(https://www.udemy.com/course/tableautrain/learn/lecture/31570168#content

ガントチャート
・ステータスの遷移を可視化できる
 ・機械設備の稼働状況
 ・Webサイト等における来訪者の滞在履歴

顧客ライフサイクル分析
・コホート分析
 ・「初回オーダ日が2021年のユーザ」、「初回オーダ日が2022年のユーザ」などのコホート(群れ)に分けて、コホートごとの成長率などを可視化する
・共通起点の累計
 ・DATEDIFF関数:初回オーダー日からの日数
 ・INDEX関数:レコードに連番を降る

バスケット分析(顧客行動分析の一種)
・同時購入された品目を特定するもの(例:オムツとビールの逸話)
・自己結合を使って、縦軸横軸に同じフィールドを並べてマトリクス表を作る(対角線はnullにする)

ファネルチャート
・マーケティング領域で頻用される
・プロセス上のボトルネックを特定するために使う
 ・ただし、グラフ上だけからは増減率は読み取りにくいため、計算してラベル表示するのがお薦め
・面グラフの符号を逆転させて作る
・「差の割合(最初を基準)」で算出し、100%から引くことで、何%ずつ減っていったのかが可視化できる

補足:LOD計算(詳細レベル計算)フィールドの記法

・ビューによる動的な自動計算とは別の方法で計算したいときに使う
 ・例:「全レコードの初回オーダー日」ではなく、「顧客IDごとの初回オーダー日」を表示したい場合
・LOD関数は3種類ある(Fixed、Include、Exclude)
・記法:{ LOD関数 集計単位1, 集計単位2, … : 集計関数( [集計対象メジャー] ) }
 ・例: { Fixed [顧客ID] : MIN( [オーダー日] ) }


セクション5 複合的なビュー

予測データの取得
・Tableau上で可視化するのが目的ではなく、Tableauで予測値を算出してCSVエクスポートするのが目的

達成率(予実対比)
・DATETRUNC関数:日付データを月などに変換する

パレート図とABC分析
・パレート図:パレート則に基づき可視化したもの、ABC分析に使う
・ABC分析:集団をA/B/Cに分割し、個別に適した施策を打つ
・パラメータ機能:ビュー上から入力した値によりインタラクティブにBIするための機能(計算式で使う)

顧客の離反防止
・最終出荷日から現在日付までの日数
DATEDIFF( 'day',
  { FIXED [顧客ID] : MAX( [出荷日] ) }
, TODAY() )
・離反懸念顧客を地図上に表示する
 ・マップレイヤー:地図の種類や配色を変更できる
・離反懸念顧客を担当者別で表示する

RFM分析(顧客行動分析の一種)
・R(最新購入日)/F(頻度)/M(購入金額)により顧客を分類する

おわりに

【WIP】Tabeleau Desktopコース(約11時間)

木田和廣氏のコース
字幕があればもっとよかった

コースのゴールで"Qualified Associate"、"Certified Professional"という試験区分?が出てくるけどこれは古い

元々は2018年にリリースされたコースらしいので仕方ない

Tableau Desktop Certified Professional
Tableau Desktop Certified Associate
Tableau Server Certified Professional
の各試験が廃止されました。

https://www.tableau.com/ja-jp/tableau-certification-faq

セクション1 コース概要


セクション2 画面の説明

サンプルデータとしては↓(スーパーストア.xls)を使う

基本的な動作は、
①データペインからビューにメジャー(指標)をD&D
②ディメンション(切り口)をD&D
③見栄えの調整
④シートに名前を付ける

ワークシート
・表示形式(Vizの種類)として、円グラフは非推奨
 ・負値を表現できない
 ・細かくなると大小関係が分かりにくい

ダッシュボード
フィルタを設定することでシート間の相互作用を設定できる

ファイル形式
・twb(ワークブック):データソースを含まない、実体はXMLファイル
・twbx(パッケージ):データソースを含む、実体はtwbファイルとデータソースを含むzipファイル(展開すると取り出せる)
最も原始的なダッシュボード共有方法は、twbxファイルをメール添付で送信して、TableauReaderで開く(読み取り専用)こと


セクション3 Vizのカスタマイズ

最も重たいセクション






セクション4 書式のカスタマイズ



セクション5 チャートの種類




セクション6 ダッシュボードとストーリー



セクション7 データソースの変更




セクション8 実践演習


セクション9 まとめ

上級資格になると、どう見せれば理解しやすいか(色指定なども含めて)というスキルが要求されるらしい



【WIP】Desktop Specialist試験対策(約23時間)

・全範囲に亘って偏りなく網羅的に体系的に学べることが試験対策のアドバンテージ
・資格持ってても業務で役に立たないと意味ないので、表面的な解説はしてない(理解に必要な解説に時間をかけてる)

約11時間のコースの上位互換か?


【未購入】Tableau Desktop Specialist資格対策(約2時間)


木田氏の23時間コースを購入してしまったのでこっちは買わないかも


【未購入】【Tableau Desktop Specialist】最短で合格するための試験対策問題集

もし受験する気が起きたら購入予定


【未購入】TableauPrepとTableauをマスターしてデータ分析・BIツール作成スキルを習得(約2時間)

さすがに2時間は短すぎる、クチコミも良くなさそう



試験情報

・Tabeleau Desktop
 ・Associateレベル: Tabeleau Desktop Specialist
 ・Professionalレベル: Tableau Certified Data Analyst
・Tableau Server
 ・Specialistレベル: Tabeleau Server Certified Associste


用語集


いいなと思ったら応援しよう!