【Tableau Data Saberチャレンジ】ord.2 Visual Best Practice I 選ぶべきグラフ
はじめに
この9月からTableauスキルの向上のためにData Saberにチャレンジをしています。
ord1の解説記事は多いのですが、ord2は提出するvizがないので、さらっと流してしまいがちです。
ですが、この章で得た知識はTableauのスキルだけでなく、今後のお仕事に絶対に役に立ちます。知ってるのと知らないのでは大違いの知識をさらっと流すのはあまりにももったいないので、noteを書くことにした手始めにまとめることにしました。
最も大切な質問「何を伝えたいですか?」
Tableauで作成できるビジュアライゼーションは多岐に渡ります。
ですがデータ分析の仕事においてほとんどの場合、美しいvizを作ることが目的ではないですよね。
何を伝えたいのかによって、選ぶべきグラフ、表現、色合い、データの数が変わってきます。
KTの動画では前段としてのPreattentive Attributesについて詳しく説明してくれています。
・位置
・色
・サイズ
・形状
もう少し詳細に説明すると、
・向きや幅や長さや囲いなどの形による視覚効果
・色相や彩度などの色分け
・空間グループや位置などの位置による判別
の三つに大別されます。
このあたりのTipsについては、KTの動画を繰り返し見ることで理解を深めることをお勧めします。
ですので、ここでは選ぶべきグラフについてまとめていきます。
何を見せたいとき、どれを選ぶべきなのか
~グラフの種類の選び方~
・経時的な変化
もっとも一般的なデータ分析の手法に、経時的な傾向の追跡があります。
これはメジャー(売上・客数などの知りたい項目)が時間を経るにしたがってどのように変わっていったのかを見る方法です。
時間がたつごとに売上が上がったのか下がったのかを見ていくのは、一番多く使われるグラフです。
この時に選ぶべき最適なビジュアライゼーションは、折れ線グラフ、面グラフ、棒グラフです。
経過時間を X 軸に、メジャーをY 軸に設定することを忘れないようにしましょう。
(1)線グラフ、折れ線グラフ
線グラフはカテゴリごとのメジャーの推移が分かります。
但し、合計を知る機能は線グラフにはありませんので、この状態で「過去4年間を通して最も売上が高い月は何月か?」という質問の答えを正確に知ることは出来ません。
(2)面グラフ
積み上げ形式の面グラフを選べば、最も売上が高くなる月が分かります。
(3)積み上げ棒グラフ
月ごとの売上の棒グラフを作り、年を色に入れると月ごとに年で色分けされた積み上げ棒グラフになります。
・比較とランク付け
データ分析の別の手法に、比較とランク付けがあります。
何が、どこが、いつが、一番多いのか、少ないのか。
多くの場合、これで方向性や業績などがわかります。
こんな時は棒グラフです。
(1)棒グラフ
棒グラフは値を 1 つのベースライン上での長さとして表現することでとても簡単に値を比較することができるため、比較とランク付けに適しています。
・相関性
相関性ときたら散布図と組み合わせグラフ。これは丸暗記しておきましょう。
(1)散布図
X軸とY軸の二つの要素が変わると結果がどう変わるか?を見たい場合は散布図を作成します。
一般的にX軸には結果を、Y軸には原因となるものを入れましょう。仮に利益が変わることが売上にどのような影響を与えているかを見たければ、X軸に売上を、Y軸に利益率を入れましょう。
(2)折れ線グラフと棒グラフを組み合わせ
データの相関は組み合わせグラフでも表現できます。
棒グラフで売上を、線グラフで利益を表すことで、売上が上がると利益も上がるのか?の相関性を確認できます。
・分布
分布、つまりすべての定量的範囲にわたって定量値がどのように分布しているかがすぐに知りたいときは箱ひげ図かヒストグラムを選びましょう。
(1)箱ひげ図
箱ひげ図は複数の分布を表すのが得意です。
カテゴリごとに、顧客ごとの売上金額はいくらくらいが多いかを表したものです。箱の中の色が薄いグレーと濃いグレーに分かれている部分が中央値ですので、カテゴリでは事務用品の顧客は売上金額が低めなことが多いと分かりますね。
(この箱ひげ図は最大値のラインから飛び出している外れ値が多いので注意しましょう)
(2)ヒストグラム
分布を表示するもう 1 つの方法にヒストグラムがあります。
ヒストグラムは棒グラフのように見えますが、連続メジャーの値を範囲・区分(ビン)にグループ化します。データを分けてその区分ごとに集計したもので、どこがピークなのかを表します。
性年代別の人口などを表すのに適しています。
・一部と全体との関係(比較)
円グラフを使うな棒グラフを使え
×円グラフ
そもそも円グラフはあまり使わないほうがいいです。基本的に円グラフには以下のデメリットがあるからです。
・隣り合っているものしか比較できない
・角度を比較するのが困難
・色を使わないと表現できない
・スペースを大幅に取る
・数が多いものを比較することができない
円グラフはビジネスシーンで使われがちですが、めちゃくちゃ使いづらいグラフです。アンケート結果などで顧客満足度をデカデカとカラーで表示できる場合くらいにしか使わないようにしましょう。
〇棒グラフ
イチブトゼンブを比較したいときは棒グラフを使いましょう。
円グラフと同じデータですが、100%棒グラフを使えば合計に対する割合が一目でわかります。
ちなみに合計に対する割合は簡易表計算ではうまく出ませんので、表計算の追加から計算タイプ「合計に対する割合」を選び、次を使用して計算「表(下)」を選びましょう。
・地理的データ
Tableauはマップを作れるのが優秀ですね。
都道府県のディメンションに地理的役割を割り当てて、データに追加すればマップになります。色に利益を入れると、利益の低い都道府県はオレンジに塗り分けられます。
このマップデータに数値の大きいものから小さいものの順に並べられた棒グラフや傾向を示した折れ線グラフ、あるいは実データを示したクロス集計などを組み込めば、より分かりやすい資料を作ることができます。
比較の分析には円グラフをお勧めしませんが、円グラフをマップに載せることはお勧めできます。 マップに円グラフを載せると地域別の内訳が簡単にわかり、前述のようなタイプのグラフを補えば、マップはさらに便利になります。
まとめ
グラフには得意分野があり、それを知っておくとOrdealに回答する際に最適なグラフをすぐに選択するだけでなく、ビジネスシーンにも役立ちます。
なのでこの内容は丸暗記してしまいましょう!絶対絶対役に立つよ!
・経時的な変化は折れ線グラフ、面グラフ、棒グラフ
・比較とランク付けは棒グラフ
・相関性は散布図と棒線組み合わせグラフ
・分布は箱ひげ図とヒストグラム
・一部と全体との関係(比較)は円グラフを使いがちだが棒グラフを使え
・地理的データはマップ
参考資料
・DATA Saber Boot Camp Week2 "Visual Best Practice: Art and Science of Visual Analytics"
・視覚的分析のベストプラクティス: ガイドブック
https://www.tableau.com/sites/default/files/media/Whitepapers/visualanalysisbestpractices_jp.pdf