Tableau Data Saber〜Ord9〜
< Tableau Data Saberとは >
公式サイトから引用した上記の人材になるための試練です。
特徴
・期間が3ヶ月
・認定されるにはData Saberの師匠に教えを乞う必要あり
・技術試練10問とコミュニティ活動50pt以上で最終試練へ挑戦可能
・最終試練突破でData Saberに
< Ord9 HandsOn - Advanced IIのTips >
本Noteでは、Data SaberのOrd1を受けた上で学んだことをTipsとして残しておきます。(基礎かつ今後のOrd内でもかなり活用するTips多いため)
前提
※公式サイトを一読し、Ord1を取り組んでからNoteをみていただくことを推奨しています。
本NoteではOrd9の解説に当たるKTさんの下記動画から学んだことを記載しています。
Q1
【問題文】
サブカテゴリ「テーブル」の最後の年(2016)の売上は、最初の年(2013)と比べて何%増加していますか?
【Hint】
表計算で下記のように特定の年との差が出せる!
Q2
【問題文】
各都道府県がサブカテゴリ「椅子」の利益に及ぼした貢献度を知りたいです。都道府県を利益合計を多い順に並べ、積みあがっていく状況と総計を表してください。
Q2-1: 累計利益金額が最大となるのはどの都道府県ですか?
Q2-2: Q2-1の時の利益はいくらでしょうか?
Q2-3: 利益に対して貢献できなかった都道府県に地域特性はありますか?
【Hint】
表計算の累計を使用することで積み上げがわかる!
Tips1.ウォーターフォールチャート
-ウォーターフォールチャートとは?
開始時点と終了時点の間で、数値がどのように増減したかを、棒の長さや色を使って可視化したグラフ。数値の増減が一目でわかる
【Tableauでの作成方法】
1. グラフの表示をガントチャートに
└棒グラフの頂点のみを出せる
2.サイズを-合計(利益)などに
└頂点に厚みを持たせられる
└マイナスにすることで頂点を始点に横軸側に厚みを持たせられる
(3. お好みでアナリティクスペインの合計を追加)
Q3
【問題文】
年四半期ごとサブカテゴリの売上ランキングの推移をみたとき、
Q3-1: 最も長い間、継続して1位を獲得していたのはどのサブカテゴリでしょうか?
Q3-2: そのサブカテゴリがもっともランキングを下げたときは何位でしたか?
Q3-3: そのサブカテゴリ含め、同じカテゴリに所属しているサブカテゴリは全期間の内何回1位を獲得しましたか?
【Hint】
表計算のランクを用いる!
※既存のままだとサブカテゴリ内の年四半期毎の順位になってしまうので注意
Tips2.ランクチャート(ハイライトテーブル型)
-ランクチャートとは
順位の推移を見るグラフ
【Tableauでの作成方法】
1. 表計算でランクを指定
※ランクの指定は各用途によって使い分けてください
2. 横軸(ランク)を反転
└デフォルトではランクが小さいほど横軸側に
3. グラフは棒にし、列をMIN(1)にする
棒形のは下記の方のQiitaが参考になるのでぜひ!
Q4
【問題文】
利益TOP10、WORST10の顧客の売上を比較し、利益でTOP1の金額を出している顧客の売上とそれ以外の顧客それぞれの売上の差を見せてください
Q4-1: 利益TOP1の顧客より高い売上を出している顧客はいますか?
Q4-2: 利益WORST10の顧客の中で売上金額の差が利益TOP1と比較してもっとも小さい顧客との金額差はいくらですか?
Q4-3: Q4-2の顧客は利益WORST何位でしたか?
【Hint】
上位と下位を同時にフィルタできない…
→セットの作成(上位と下位を2つ)
→結合セットの作成
Q5
【問題文】
年四半期の売上が最高記録を更新したのは何回ありますか? 売上が最初に発生した四半期は回数から除いて下さい。なお、最高記録を更新したタイミングがわかるよう、その箇所は色を変えて表現してください。
【Hint】
表計算の累計、最大値を使用する!
→RUNNING_MAX
Q6
【問題文】
利益率ワースト3のサブカテゴリを除外すると、利益率は何%になりますか?
【Hint】
ビジュアライズにこだわるためには1つのダッシュボードを作成しフィルタ時に選択されたサブカテゴリが除外される設定にするのがいい
Q7
【問題文】
サブカテゴリごとの売上と売上の前年比成長率の相関を年ごとに確認したいです。2015年と2016年で前年比割れしてしまったサブカテゴリの傾向を教えてください。役員がモバイルで確認するため横に並べて各年を比較することができず、フィルターで切り替えて確認できるように依頼されています。
【Hint】
今までのようにオーダー年でフィルタしたいが前年比成長率は前年の値がないとNULLになってしまう
→LOOKUP(MIN(オーダー年),0)
Q8
【問題文】
出荷にかかる平均日数を週単位の推移で見せてください。社の方針として上方管理限界線(UCL:Upper Control Limit)を3σとして管理しているのですが、
Q8-1: この限界を突破して配送が遅延した週は何回ありましたか?
Q8-2: その週の配送先の市区町村を確認し、問題が起こった原因について調査してください。
【Hint】
アナリティクス:平均線を編集し分布から標準偏差が出せる
Q9
【問題文】
2016年の四半期単位の売上推移をメーカーごとに比較してください。メーカー名が「s」で終わるメーカーにはどのようなトレンドがありますか?メーカーの情報はExcelに入っていないので、「サンプル - スーパーストア - メーカー情報.tdsx」を使用してください。
【Hint】
・メーカーをフィルタしワイルドカードで後方一致「s」
・軸を各行または列の独立した範囲に
Q10
【問題文】
地域別売上ランキングの推移を年四半期で見たとき、売上開始当初(2013/1Q)と最終四半期(2016/4Q)でランキングの変動があった地域はどこですか?
【Hint】
売上開始四半期と最後の四半期を比べるパターンは2つ
1.四半期関係ない部分を除外(静的)
2.最初と最後のもののみ表示する(動的)
Q11
【問題文】
カテゴリ「家電」における週数別の売上を見たとき、500,000円を連続で超えたのは
Q11-1: 最大何週間ですか?
※閾値500,000はシミュレーションで変更される可能性があるので可変にしてください。閾値を超えた週を異なる色で強調した上で「閾値超え連続週数」を数えて下さい。閾値超えが途切れたら、ゼロリセットし、閾値超え連続週数の値を連続した週の最後の週にのみ表示して下さい。
Q11-2: 連続で超えている間、500,000円の超過分を累計したとき、最も高い累計金額はいくらですか?
※閾値を超過している分の売上高を累計し、最後の週に表示してください。
【Hint】
PREVIOUS_VALUE関数と閾値を用いる!
最後に
ウォーターフォールチャートとウォーターフロー開発がごっちゃになります。
Q6以降は相当難しい&人によってビジュアルが変わりそうと思いました。