データ可視化の基礎
■データ可視化の目的
●目的はコミュニケーション
・データを可視化する目的
情報を伝達、対話するコミュニケーション
・コミュニケーションを成立させるには
コンテキスト(背景・文脈・共通認識)が必要
コンテキストを利用して多くの定義や説明を省略している
●コミュニケーションの本質的な目的
・相手が認知、理解していなかった情報・事実を伝達する
・相手の判断を行動を促す、変える
●データの可視化は、英会話での文法や発音
・重要なのは内容
表現形式に過度にとらわれる必要はない
・正しい情報を伝えるために
文法がでたらめで、発音が聞きづらければ
正しい情報を伝えることはできない
■数値情報に意味を与えるのは比較
●単一の数値情報では良いとも悪いとも言えない
・今年度売上 1100億円
これだけで何かを判断することはできない
・同業他社が 1200億円
他社より低いので悪いと判断できる
・前年度売上が 900億円
前年度より高いため良いと判断できる
・市場全体の売上成長率 30%
売上成長率は、22%
市場全体より低いため悪いと判断できる
●多面的な比較を繰り返すことでストーリーが生まれる
・同業他社には劣るが、前年度に比べて成長できている。
ただし、業界の成長率と比べると、さらに成長の余地がある。
■データの種類
・属性データ
名称データ
地理データ
日付データ
順序データ
・ 指標データ
間隔尺度データ
比例尺度データ
●名称データ
・人や物につけられている名前
・例
性別:男性、女性
果物:みかん、いちご
●地理データ
・座標情報に紐づくデータ
・例
都道府県、市区町村、郵便番号、位置情報
●日付データ
・年月日を表すデータ
・連続
時系列で視覚化する場合の扱い
日付の前後関係は並び替えしない
・不連続
年、月、日などを集計項目として視覚化する場合の扱い
月次売上を売上高で並び替え など
●順序データ
・順序そのものに意味があるデータ
・例
メダル:金、銀、銅
満足度:満足、普通、不満
●間隔尺度データ
・間隔のみに意味があるデータ
・絶対的ゼロなし
・例
気温、知能指数
●比例尺度データ
・間隔にも値にも意味があるデータ
・絶対的ゼロあり
・例
売上、身長、体重
※絶対的ゼロ
ゼロ = 存在しない の意味になるもの
売上ゼロ は 存在しない ので絶対的ゼロあり
摂氏0度 は 華氏32度 なので絶対的ゼロなし
●データの種類ごとの可能な演算
■認知負荷
●認知負荷とは
・ワーキングメモリで行われる作業量
ワーキングメモリに保持できるのは4~5個
保持した情報は10秒程度で消えてしまう
●適度な負荷
・ワーキングメモリはすぐに過負荷の状態になる
・適度な負荷がかかったときに最も学習できる
・一度にあまり多くの情報を与えないような配慮が必要
■データインクレシオ
●情報伝達の効率性
・相手が一度に処理できる情報量には限界がある
・より多くの情報・事実・アイデアを
より少ない時間・スペース・労力で
理解・納得してもらう
・生のデータからシグナルを最大化し
ノイズを最小化するようにデザイン
●シグナルとノイズ
・シグナル
データが保つ元来の意味が、より相手にとって伝わりやすくなる効果
・ノイズ
データが持つ元来の意味ではないものが、相手に伝わってしまう効果
●データインクレシオ
・チャートから余計な装飾を削ぎ落とすほど
ノイズが減りシグナルが高まる
・データインク(Data-ink)
チャートでのデータそのものを表す部分
棒グラフの棒 など
・ノンデータインク(Non-Data-ink)
データインク以外を表す部分
グラフの背景、枠線、軸の補助線 など
・データインクレシオ(Data-ink ratio)
Data-ink / (Data-ink + Non-Data-ink)
■視覚属性
●視覚属性の強弱
●適用できるデータの種類
■ゲシュタルトの法則
・近接 / 近似(Proximity)
・類同(Similarity)
・連続(Continuity)
・閉合(Closure)
・共通運命(Common Fate)
・面積(Area)
・対称性(Symmetry)
●近接 / 近似(Proximity)
・距離が近いとグループと考える
●類同(Similarity)
・色や形が同じだとグループと考える
●連続(Continuity)
・切れ目や変化の無い線を見出す
●閉合(Closure)
・単純で閉じた図形を見出す
●共通運命(Common Fate)
・移動のベクトルや、変化の周期が同じだとグループと考える
●面積(Area)
・重なっている図形では、面積の小さいほうが主として認識されやすい
●対称性(Symmetry)
・対称な図形だとグループと考える
■参考
●Go Andoさんのデータ可視化のデザイン
●データビジュアライゼーションの教科書
いつも応援していただいている皆さん支えられています。