データ可視化の基礎

データ可視化の基礎

■データ可視化の目的

●目的はコミュニケーション
・データを可視化する目的
  情報を伝達、対話するコミュニケーション
・コミュニケーションを成立させるには
  コンテキスト(背景・文脈・共通認識)が必要
  コンテキストを利用して多くの定義や説明を省略している

●コミュニケーションの本質的な目的
・相手が認知、理解していなかった情報・事実を伝達する
・相手の判断を行動を促す、変える

●データの可視化は、英会話での文法や発音
・重要なのは内容
  表現形式に過度にとらわれる必要はない
・正しい情報を伝えるために
   文法がでたらめで、発音が聞きづらければ
  正しい情報を伝えることはできない


■数値情報に意味を与えるのは比較

●単一の数値情報では良いとも悪いとも言えない
・今年度売上 1100億円
  これだけで何かを判断することはできない
・同業他社が 1200億円
  他社より低いので悪いと判断できる
・前年度売上が 900億円
  前年度より高いため良いと判断できる
・市場全体の売上成長率 30%
  売上成長率は、22%
  市場全体より低いため悪いと判断できる

●多面的な比較を繰り返すことでストーリーが生まれる
・同業他社には劣るが、前年度に比べて成長できている。
 ただし、業界の成長率と比べると、さらに成長の余地がある。


■データの種類

・属性データ
  名称データ
  地理データ
  日付データ
  順序データ
・ 指標データ
  間隔尺度データ
  比例尺度データ

●名称データ
・人や物につけられている名前
・例
  性別:男性、女性
  果物:みかん、いちご

●地理データ
・座標情報に紐づくデータ
・例
  都道府県、市区町村、郵便番号、位置情報

●日付データ
・年月日を表すデータ
・連続
  時系列で視覚化する場合の扱い
  日付の前後関係は並び替えしない
・不連続
  年、月、日などを集計項目として視覚化する場合の扱い
  月次売上を売上高で並び替え など

●順序データ
・順序そのものに意味があるデータ
・例
  メダル:金、銀、銅
  満足度:満足、普通、不満

●間隔尺度データ
・間隔のみに意味があるデータ
・絶対的ゼロなし
・例
  気温、知能指数

●比例尺度データ
・間隔にも値にも意味があるデータ
・絶対的ゼロあり
・例
  売上、身長、体重

※絶対的ゼロ
  ゼロ = 存在しない の意味になるもの
  売上ゼロ は 存在しない ので絶対的ゼロあり
  摂氏0度 は 華氏32度 なので絶対的ゼロなし

●データの種類ごとの可能な演算

可能な演算


■認知負荷

●認知負荷とは
・ワーキングメモリで行われる作業量
  ワーキングメモリに保持できるのは4~5個
  保持した情報は10秒程度で消えてしまう

●適度な負荷
・ワーキングメモリはすぐに過負荷の状態になる
・適度な負荷がかかったときに最も学習できる
・一度にあまり多くの情報を与えないような配慮が必要


■データインクレシオ

データインクレシオ

●情報伝達の効率性
・相手が一度に処理できる情報量には限界がある
・より多くの情報・事実・アイデアを
 より少ない時間・スペース・労力で
 理解・納得してもらう
・生のデータからシグナルを最大化し
 ノイズを最小化するようにデザイン

●シグナルとノイズ
・シグナル
  データが保つ元来の意味が、より相手にとって伝わりやすくなる効果
・ノイズ
  データが持つ元来の意味ではないものが、相手に伝わってしまう効果

●データインクレシオ

・チャートから余計な装飾を削ぎ落とすほど
 ノイズが減りシグナルが高まる
・データインク(Data-ink)
  チャートでのデータそのものを表す部分
  棒グラフの棒 など
・ノンデータインク(Non-Data-ink)
  データインク以外を表す部分
  グラフの背景、枠線、軸の補助線 など
・データインクレシオ(Data-ink ratio)
  Data-ink / (Data-ink + Non-Data-ink)


■視覚属性

●視覚属性の強弱

視覚属性

●適用できるデータの種類

適用できるデータの種類


■ゲシュタルトの法則

・近接 / 近似(Proximity)
・類同(Similarity)
・連続(Continuity)
・閉合(Closure)
・共通運命(Common Fate)
・面積(Area)
・対称性(Symmetry)

●近接 / 近似(Proximity)
・距離が近いとグループと考える

近似

●類同(Similarity)
・色や形が同じだとグループと考える

同類

●連続(Continuity)
・切れ目や変化の無い線を見出す

画像3

●閉合(Closure)
・単純で閉じた図形を見出す

閉合

●共通運命(Common Fate)
・移動のベクトルや、変化の周期が同じだとグループと考える

共通運命

●面積(Area)
・重なっている図形では、面積の小さいほうが主として認識されやすい

画像6

●対称性(Symmetry)
・対称な図形だとグループと考える

対称


■参考

●Go Andoさんのデータ可視化のデザイン

●データビジュアライゼーションの教科書




いつも応援していただいている皆さん支えられています。