見出し画像

Tableauで層別解析!

さいしょに

データ分析プロジェクトって、まずは全体感をざっくり掴んで
その後、詳細を深堀して〜。見たいな感じで進んでいきます。
その過程で、データをいくつかのグループに分ける場面が絶対出てきます。
そのグループ分けのことを【層別】といいます。

層別っていつ使うの?

基本的には
データ全体の傾向・相関の原因を探るときに使用します。
本質的にはどちらも同じですが、以下に具体例を2つ紹介します。

ケース1:ヒストグラムに2つの山がある問題

例えば、横軸が身長で縦軸が度数の、全日本人を対象にした
以下の図のようなヒストグラムがあったとします。
基本的にはデータが十分な量ある場合、そのデータのヒストグラムは
正規分布に近づくと言われています。
なので以下のヒストグラムはなんかおかしい訳です。

画像1

なぜこんなヒストグラムになるのかを【層別】を使って考えてみます。
そうすると、日本人は「男性」と「女性」にグループ分けできます。
(前半の山が女性側の身長の最頻値、後半が男性側と分かります。)
【層別】を使うことで、
全体を対象にすると見えなかったコトが見えるようになります。

ケース2:相関が強いのはどのグループかな問題

例えば、世帯所得とゲーム機の売上に関する散布図があったとします。
(架空のデータです)
これを見ると、世帯収入が多い人にゲーム機が売れてることがわかります。

画像2

ただゲーム機ってたくさんありますよね。
そこを【層別】してみます。

画像3

するとPS4は世帯収入と売上に相関がありますが
Swithには相関がないことがわかります。

全てのデータで相関があるように見えましたが
実は一部のデータの傾向に全体が引っ張られているだけでした。

Tableauで任意の階層を作る!

このように【層別】は数値計算などを用いずにできる分析方法です。
ではこの【層別】をTableauで使えるようにしましょう。

1.階層を作りたいディメンションを右クリックし、「階層を作成」を選択

スクリーンショット 2021-01-10 13.29.36

2.任意の名前をつけて…

スクリーンショット 2021-01-10 13.31.32

3.階層にしたい他のディメンションをドラッグして追加するだけ!
 そうすると製品というディメンションに
 カテゴリ→サブカテゴリ→製品名
 の順で階層ができました!!

スクリーンショット 2021-01-10 13.33.10

階層を作っておくと
ディメンションに+マークが出現します。
これを押すと…

画像7

先ほど作った階層ごとに勝手にドリルダウンしてくれます。

スクリーンショット 2021-01-10 13.40.23

さいごに

このように【層別】を理解し応用することで、データに惑わされることなく
正確な傾向・相関を把握することができます。
またTableauのドリルダウンはワンクリックでグラフの形を変えられるので
グラフから「気付き」を得る際にとても有効です。

いいなと思ったら応援しよう!