復習!Intermediate I
メリークリスマス!
こんばんはコロ助です。
というわけで、Intermediate Iの復習編、さっそくやっていきましょう!
Q1
北海道を除き、赤字の1都道府県を除けば劇的に利益が向上する地域の担当マネージャーを教えてください。
💡ポイント
データの結合
マップの二重軸
除外フィルター
Q2
メーカーごとの売上の分布を見たとき、利益が赤字になっているメーカーの売上に特徴はありますか?
なお、メーカーごとに作っている商品のカテゴリが異なるので、カテゴリも分けられるよう考慮して表現してください。
メーカーの情報はExcelに入っていないので、「サンプル - スーパーストア - メーカー情報.tdsx」を使用してください。
💡ポイント
tdsxの使い方
ブレンド
プライマリグループの作成
空間グループで見る
メーカーを詳細に入れて分布を見る
不透明度を使う際は色に注意する
Tableauでデータを合わせてみる方法
・データ結合(JOIN)
・データブレンド
・クロスデータベース
データ結合(JOIN)
同じデータベース内にあるもの
同じデータソースの表を結合する
(例:ファクト(トランザクション)テーブルとマスタテーブルの結合
JOINしたあとのテーブルをTableauはひとつの大きなテーブルとして扱う
行も列も増えた状態に見えている
マスターテーブルの結合区が複数あった場合、
JOIN後のテーブルが複数できてしまうので注意
データの粒度を合わせてから行う
ブレンド
粒度が異なるものの結合に使用
異なるデータソースの表を結合する
同じデータソースの表であるが、多対多リレーションシップなどでJOINした際に値が合わないデータを結合する
(例:ファクト(トランザクション)テーブル同士の結合
集計してからくっつける
全て左結合になるのでプライマリにないデータは出てこない
アスタリスクが出る場合は、結合区以外に複数のディメンションが存在する
プライマリデータソースは青✔
セカンダリデータソースは赤✔
プライマリにある値でしか集計ができない
接続データは全てセカンダリになる
リンクの数が少ないほど動作が早い
クロスデータベースJOIN
別のデータベースにあるものの結合
すべてのディメンションで自由自在に分析可能
LOD表現もばっちりOK
分析するときにどっちをプライマリにするとか、どの項目をリンクするとか、考えなくてよくなる
知見のある人が設定した正しい結合方法のデータを、たくさんの人が安全にりようできるようなる
より多くの人が、簡単に、正しく、安全にデータを使用することができる
Q3
1年前の売上を目標金額としたとき、
2016年の売上が目標未達成だった
カテゴリを教えてください。
【オプション問題】
そのカテゴリは95%は達成していましたか?
💡ポイント
年毎の売上の計算式
リファレンスライン
リファレンスバンド
Q4
1行単位で記録されている1商品取引ごとの利益を見たとき、 最も大きな利益を出している商品取引のあるサブカテゴリはどれですか? また、そのサブカテゴリの合計利益は 他のサブカテゴリに比べ好調でしょうか?
【オプション問題】
対象サブカテゴリの赤字レコードを除外すると 合計利益のサブカテゴリランクがどのくらい上がりますか?
対象サブカテゴリで赤字レコードを出しているのは どこのメーカーが多そうでしょうか?
💡ポイント
行単位のメジャー
ツールチップセレクション ハイライター
集計と非集計
Excelではこんな見方出来ないですもんね。
本当にTableauは素晴らしい!
Q5
売上トップ10/ワースト10製品の利益は良好でしょうか?
もし赤字の製品がある場合、
もっとも赤字の製品数が多いカテゴリはどれでしょうか?
💡ポイント
セット
結合セット
独立した軸範囲
属性
ランク
再び属性にやられました・・・
まだまだ理解が・・・
Q6
利益の合計がプラス(0は含める)の
サブカテゴリごとで売上を比較してください。
💡ポイント
集計のフィルター
Q7
利益がプラス(0は含める)のレコードだけで、
サブカテゴリごとの売上を比較してください。
💡ポイント
非集計のフィルター
Q8
利益が赤字顧客と黒字顧客の売上の割合を、
オーダー月ごとに教えてください。
(月別トレンドを見たいので、オーダー年は含めない。顧客の項目は顧客名を使用すること)
💡ポイント
セット
見せたい値を左に寄せる
合計に対する割合
100%棒グラフはデフォルト105%から100%に直す
Q9
2016年の売上を昨年の売上と比較します。昨年の売上はカテゴリごとに見る必要はありません。今年の売上はカテゴリごとに色分けしたいです。これと同時に、今年のカテゴリごとの売上の累計を表示したいです。バラバラにグラフを作ることはできたのですが、これを重ねて一個のグラフにすることはできるでしょうか?
💡ポイント
リファレンスバンドで3軸を表現
Q10
売上と利益の相関を見たときに利益が低いクラスターと、 売上と割引率の相関を見たときに割引率が高いクラスターの 顧客をそれぞれ探してください。 人数を絞りたいので、いずれもクラスター数は5に設定してください。 そのクラスターを用いて、割引率は高いけれども利益は低くない顧客を割り出し、割引率を高く設定しながらも比較的黒字を出せている顧客区分を教えてください。
💡ポイント
結合セット
結合の向き
散布図は原則、正方形に
Q10
地域、カテゴリ別の予算のファイルを入手しました。
(サンプル - スーパーストア - 予算.xlsx)
地域、カテゴリ、オーダー年ごとの売り上げ実績と予算を対比して、
家電カテゴリにおいて、すべての年で売り上げ目標を達成していない地域を教えてください。
また、その未達成度合いはどのくらいでしょうか。
50%にも満たない年があるようであれば教えてください。
なお、予算シート作成担当者がうっかりしており、家電は昨年までの名称「テクノロジー」のままになってしまっています。
また目標年月を更新せずに目標金額だけ更新してしまったようです。
予算のExcelの年月は+2年して比較してください。
💡ポイント
データインタープリター
ピボット
DATEADD
セカンダリの名前を合わせる(別名の編集)
リファレンスライン
アドホック計算
地域はきちんと並び替える
まとめ
Q2でいきなりつまずきました。
メーカーごとの売上の分布をどう見せるか?で見せ方思いつかず。
○○が見せたい場合はこうする!という、ビジュアライズのセオリーがまだまだ身についていないのを実感しました。
後は探り探りなところもありますが何とかOK!?です!
Intermediate Iの振り返り完了しました!