Visual Best Practice : Art and Science of Visual Analytics~まとめ~
こんばんは。Riekoです。
今回はDATA Saberの最終試練対策、「Visual Best Practice : Art and Science of Visual Analytics」を見て学んだことをリストアップしていきます。いつの間にか超長文になってしまいました。
本人のまとめ用なので、駄文失礼します。
なぜデータをビジュアル化するのか
人の脳がどうやって働くかを知る必要
人が瞬時に理解できるのは7±2前後くらいの数
数字がただ並んでいるだけの中から3が何個あるか探すのは難しいが、3だけ色が変えられていればほとんどの人が個数を把握することができる
この場合は赤だけを見ていて、他の色は認知から除外することで素早く数えることができる
視覚的な効果が人間の脳に及ぼす影響は大きい
Visualizationが持つ、人の認知を助ける力はとても大きい
色相だけでなく、彩度でも認知を助けることは可能
様々な視覚的効果を用いて人の認知を助ける必要がある
Visual Analyticsとは?
xとyに様々な数字が入っている表がある
平均や分散などいくつかの方法で集計すると、I~Ⅳのパターンどれも殆ど同じ数値になる
xとyは同じ事象を表している?→本当にそうか?
散布図を作ってみると、傾向線は同じだが、分布をみるとそれぞれ異なる
数字の集計だけでは得られない、Visualizationによって理解できる事象がある
Visualizationによって、その時々あったものを選んでいく必要がある
Visual Analyticsのサイクル
Task
Get Data
Choose Visual Mapping
View Data
Develop insight
Act/Share
Taskが忘れられてはならない
データを視たいから見るのではなく、Taskを解決するためにデータを使う
それぞれのプロセスはいったり来たりすることでTaskを得られる
なぜchoose Visual Mappingが必要なのか?
データをより素早く正確に理解するため
なぜ視覚化が簡単に行えなければならないのでしょうか?
Taskの欠落を防ぐため
いつの間にかデータを分析することがTaskになってしまうことが多々ある
Get DataやChoose Visual Mappingが難しいものだと、それ自体が目的になってしまう。そうならないために、個々のプロセスは簡単に行えなけらばならない。
記憶とプロセス
Sensory:無意識な反応。人によって差がない
Short-Term:今まさに自分が脳の中で考えていること。たくさんのことを一気に覚えられない。
Long-Term:思い出。人によって覚えらえる数が違う。
Visual Analyticsの中ではSensory&Shor-Term Memoryが大事
それぞれの特性を活かしてうまく見せていくことが大事
人間の認知と認識
2桁の掛け算を暗算でできる人は多くない
覚えていなければならない事象が多いから
筆算でやると速い
書くことでShort-Term Memoryから除外できる
暗算ができない理由
Short-Term Memoryが、覚えておく事柄で圧迫される
Short-Term Memoryの残ったスペースで残りの計算を行う
紙に書くことで、Memoryがクリアされて、Short-Term Memoryの容量がリセットされる
Memoryが空くことで、考えること(計算自体)に集中できる
現実世界では、仕事中に上司から話しかけられたり、作業中に誰かから話しかけられたりすると、Short-Term Memoryに差し込みが入り何を進行していたか忘れてしまうことがある
会議の開催事項をメモするなど、私たち自身もShort-Term Memoryを空ける工夫をしている
外に出せるものは積極的に外に出していくことで、私たちは考えることに集中できる
文字を書くには?
紙やペンなど、書く道具が必要
書くために、私たちは何度も何度も練習をしてきた
無意識に書けるようになって初めて、私たちは書いたもの自体に集中できる
覚えていない外国語で書こうとすると、とても難しい
データを見るには?
紙とペンが必要なように、データを見るのにはTableauのような道具が必要
なるべく無意識で、自分のモノになっている必要がある。そうなって初めてインサイトに集中できる。
データをよりよく見るために次はこうしたい、などが浮かんでくるが、その時にできる技をもっていないとそこで止まってしまう
深い思考のプロセスに乗るためには、自分の手のように道具がなじんで使えるようになっていないといけない
Visual Analyticsのフローを効率よく回すためには、それぞれのプロセスを簡単にしてShort-Term Memoryを空けておく必要がある
クロス集計vs.
クロス集計自体も、Visual化はされている
Taskが「~~における利益はいくらですか?」といった質問の場合、とても有効
しかし、多くの人が、クロス集計表で解決しようとしていることが問題
「マイナスのカテゴリはいくつですか?」といった質問の場合、数値に色を付けることが有効
文字だけでは大きさがわからない。→どのくらい赤字なのかはわからない
Visual化することで、どこが赤字なのか、売上が大きいのに赤字なのはどこなのか?といった質問に瞬時に答えることができる
質問に合わせてVisual化の方法を変えていかなければならない
記憶とプロセスの力を十分に発揮する
Visual化のベストプラクティス
Preattentive Attributes
色
地図
コンテキスト
比較対象
ダッシュボード
デザイン
Preattentive Attributes
Sensory Memoryをどう反応させるかが重要
Short-Term memoryはたくさんのことを覚えられないので、それを有効に活用するために、Sensory Memoryを上手に働かせてあげる必要がある
Sensory Memoryをフル活用させておくことで、Short-Term Memoryを思索の方に使わせるようにする
注意的な→意図して動かしている、という意味。その前段階なので、「自分では意識していないうちに」、という意味。
Form
向き
幅
長さ
囲い
サイズ
形状
Color
色(色相)
色(彩度)
Position
空間グループ
位置
1つ1つのチャートはこれらの組み合わせに過ぎない
棒グラフは長さと位置によって作られている
これらを使うと、人は物事を瞬時に反応できる
これらを使うことでSensory Memoryを使って瞬時にデータを把握できる
Short-Term Memoryが空いた分思索をめぐらすことができる
Preattentive Attribute の強度
位置
色
サイズ
形状
サンプルスーパーストアの売上を形状で表してみると?
強さとかそれ以前に相性が悪すぎる
サイズと色だと、色の方がインパクトがある
位置だと、凄く売れている集団などがわかる
色でもまぁわかるが、テーブルと電話機がどれくらい違うかなどはわからない
サイズになると、テーブルが電話機の2倍売れているか、といったことは全然わからない(細かい差はほとんどわからない)
色と形状はどちらが強いのか?
散布図のマークを色で分類するのと、形状で分類するのとで違いがわかる
形状は色ほどインパクトがない
メインの項目に強いものを当てていくことが必要
弱いものをメインの項目にあてると、読み解き手が誤解してしまう
ただし、棒グラフは十分な高さや幅がないと機能しない
色は限られたスペースで十分機能する(ものすごく省スペース)
どこにどう置くかなど、シチュエーションによってPreattentive Attributesを使い分けていく
Tableauはなんとなくでも強い順に置いていくことができるが、自分自身が用途によって使い分けることが必要
データのタイプ
分類的な名義:1つ1つパシッと分かれているもの
順序的な名義:金銀銅など、それ自体に順序があるもの
量的な名義:メジャー。大小で測られる。
データのタイプとPreattentive Attributesの相性は?
分類的な名義:形状、色相(全然違うタイプのものをパキッと分けるのに適する。赤と青。オレンジと青。〇と□など。)
順序的な名義:色相、形状、サイズ,彩度,位置(分類的な名義と量的な名義両方の側面を持つ)
量的な名義:位置,彩度,長さ,サイズ(大小を表しやすい)
サンプルスーパーストアの月を列、売上を行に入れてみると...
年を色で表すことが多い。これは順序的な名義を色相に使っている。
ただ、色相で表すとそれ自体に順番の概念がないので、売上が伸びているのか減っているのかわからない
彩度であらわすと順番がわかり、色が濃いので最新、という流れを見せることができるが、2つの色が同じくらいになったときに差がわからないことが起こりうる。
色相も彩度も相性がいいが、見せたい内容によって使い分ける必要がある
人がイメージしやすい組み合わせ
場所→地図
時間→横の流れのライン(エリアやラインチャート)
比較値→棒グラフ。※棒を使うときは比較値。棒が1本だけだとただの埋め尽くした四角になってしまう(フィルターされた結果一本になっているダッシュボードが多々ある)
例外的に認められているのはリファレンスラインがある予実対比の棒グラフ。
相対的割合→ツリーマップ。円グラフより文字も入れやすいし、割合を表現しやすい。
関連性→散布図。
棒グラフの向き→たくさんある場合は横向きの方がみやすい
有効に使いましょう。(多様厳禁)
色
目がちかちかしない優しい色合いであるが、ちゃんと識別できるカラーパレットになっている
メジャーのデフォルトのカラーリングはオレンジー青
緑赤は見えない方もいるので、それがより少ないオレンジ・青が選ばれている。
赤や緑は波長が長いので、オレンジ・青の方が細かい違いがはっきりと見える
Tableauのカラーパレットは研究された結果出された色なので積極的に使うとよい
色数が多すぎると....
関係ない組み合わせが似たような色になる
わかりづらくごちゃごちゃしてしまう
6色まで落とすと、その中に私たちはパターンを見出すことができる
色が多くないのに、色が不必要なのに色を多用するとよくない
色をなくしたり、違うメジャーを色に入れたりすることでわかりやすくなる
背景が重要
色は相対的なもの
同じ色に対して背景は同じ色にしておく
散布図でマークの不透明度を下げたりすると、同じ色に対して背景が異なってくるので注意が必要
枠線を使って区切ることもできる
地図の場合
大地の部分と陸の部分で背景色が異なる
ハローを使うとマークではなく全体の背景を変えることができる
地図
空間的な質問に対してのみ地図を使う
面積が大きいものが色が濃く見える(メジャーが過大評価される)
コンテキスト
オレンジと青でプラスマイナスを表した場合、どちらがプラスか、などを凡例を見るまでわからない
矢印で表現するとわかりやすくなる
特定の文化や人しかわからない表現方法ではなく、みんながわかるコンテキストを選択する
比較対象
人は数字だけ見てもその意味がわからない
イメージしやすい比較対象を作ることで大小の意味を把握できる
ダッシュボード
伝えたいことを意識しよう
何が言いたいかわからないダッシュボードはよくない
強調すべき点を整理して、伝わりやすくする
データから情報を抽出
何が言いたいか情報を抽出してまとめてあげる
探索型:中立
説明型:言いたいことが決まっていて、それに合わせた強調がされている
自分が作りたいものに合わせて見せ方を変える
デザイン
説明がなくてもわかるようなデザインにする
見てわかるものは読まなくてもわかる
読まなくちゃいけないようなものを作らない
知らないものはオーダーできない
×どんなダッシュボードがいいですか?
〇何がしたいですか?→その先にある場所に最高速で近づく
まとめ
Sensory Memoryを活かしてShort-Term Memoryを思索の方へ向けることの重要性を忘れないように。