逆Visual Best Practice

現在挑戦中のDataSaberプログラムでは、「Visual Best Practice」が一つのキーワードとなっていますが、これは逆に言うと、表現方法によってはViz作成者の匙加減で与える印象を操作できるような可視化ができる(できてしまう)ということでもあるという捻くれた捉え方をしました。
今回は、自分への注意喚起の意味を込めて意図的な印象を持たせるVizを作成してみることにしました。
わざわざそんなVizを作る必要があるか?とも思いましたが、簡単に作れてしまうということを体感することで自分への戒めにもなると思い作成しました。
データはサンプルスーパーストア-注文を用いています。また、よくないことをやっているという自覚はあるので今回作成したVizはパブリッシュしていません。

ケース1:売上倍増!?

年々売上が倍増している!?

上の図は年ごとの売上推移を表しています。ぱっと見2014年から2015年にかけて売上が倍増、さらに2015年から2016年にかけても倍増しており、絶好調!というように見えます。
しかし、縦軸を見るとわかる通り目盛が0スタートではなく50Mスタートとなっています。軸の編集で最小値を固定することであたかも年々倍々になっているような印象を与えています。軸を固定しないと以下のようになります。増加はしていますが倍増ペースでは全くありません。

軸を固定しなかった場合

ケース2:気温が下がれば売上が上がる!

気温が下がると売上が上がる!?

上の図は売上の年推移と平均気温の年推移を同じグラフにプロットしたものです。 平均気温は気象庁が公開しているデータを利用しております。<https://www.data.jma.go.jp/obd/stats/etrn/view/monthly_s3.php?prec_no=44&block_no=47662>
このように都合の良い別データを引っ張ってきて、あたかもそこになんらかの関係があるかのように見せかけられます。
例えばこれがおでんの売上と気温の関係であれば「気温が下がったので熱いおでんを食べる人が増えた」→「売上が増えた」という相関関係があり、また因果関係があるとも言えるでしょう。
しかし、上の図を見せたところで「誰がなんと言おうとサンプルスーパーストアの売上と気温は明らかに因果関係がある!」とは言えません。
見る側としてはいわゆる擬似相関(見せかけの相関)があることを疑う必要があり、そもそも相関と因果の違いを意識して見る必要があります。
(統計にはあまり自信がないので、間違っていたらご指摘ください…)

ケース3:時間の流れも自由自在

年月ごとの売 上 推 移

上の図は年月ごとの売上推移を表しています。これも一瞬なんの変哲もないグラフに見えますが、横軸を見ると2013~2016年の期間と2016年~2017年の期間で目盛が違います(画面左半分で2013~2016年の3年間、右半分で2016~2017年の1年間、時間の進み方が違う)。この図では明らかな違和感があるので気づきやすいですが、もっと精巧に細工をすれば悪用できてしまいそうです。

思ったこと

今回は意図的に良くないVizを作成しましたが、ひょっとしたら無意識のうちに逆Visual Best Practiceを実践してしまう場合もあるなぁと思いました。なので、Tableauの技術的な部分はもちろんのこと、色使いや配置、グラフの形状等といったビジュアライゼーションのところを理論的に学ぶ必要があるというのことを痛感しました。
また、見る側としては良く言われる「データは事実ではあるが真実ではない」ということを念頭において、人が作ったVizを懐疑的な目線で見る とまではいきませんが、全て頭を働かさせず流されるがままに見るというのも良くないなと思いました。


いいなと思ったら応援しよう!