見出し画像

DataSaber技術課題の備忘録_1

この記事の背景

7月18日にスタートしたDataSaberチャレンジですが、9月初旬に何とか10個の技術課題をクリア出来ました。
ですが、このチャレンジの過程で学んだことを全て自分のものに出来ているかというとかなり心許ない状態なので、復習を兼ねて、自分なりに言語化して置くことにしました。
1回目のこの記事は、2つ目の技術課題である『Visual Best Practice I』で学んだことについてまとめたいと思います。

DataSaberチャレンジの内容についてご存じない方のためにすこし前提を説明させていただくと、DataSaberチャレンジでは、技術課題を解くためのトレーニング教材として、YouTubeで『KTChannel』という動画が公開されています。
そして、『Visual Best Practice I』のために用意された動画はこちらで、

Visual Best Practice: Art and Science of Visual Analytics
https://www.youtube.com/watch?v=_flMp3iD8z4

この動画では、
①なぜビジュアライゼーションが必要なのか
②なぜ簡単に視覚化が出来なければいけないか
③ビジュアル化のベストプラクティス
について、約2時間で説明されていました。
(DataSaberチャレンジの中で、一番人気のコンテンツなのだそうです。)

この記事では、この動画を通して学んだことをまとめていきたいと思います。

なぜビジュアライゼーションが必要か

ビジュアライゼーションの目的は大きく下記の2つ:

①より早く正確にデータを理解出来るようにするため
②統計量では捉えきれないデータの傾向を知るため

動画では、簡単なテストや事例の紹介を通して説明されていました。

なぜ簡単に視覚化出来なくてはいけないか

ここでは『人間の脳は一度にたくさんのことを覚えつつ、考えられるような構造にはなっていない。そのため、覚えておく必要がない様、都度アウトプットするようにすれば、短期記憶を有効に使って、深い考察に入ることが出来る。その状態(フロー状態)に入るためには、ビジュアライゼーションスキルが必要になってくる。』ということを、脳の記憶の仕組み(Sensory memory/Short-Term memory/Long-Term memory)に関する説明とともに説明されていました。

個人的にはここが一番印象に残った内容でした。
ビジュアライゼーションを通して示唆を得るため、より深いフローに入ってより深い考察を得るためには、スキルを磨く必要があるということを痛感しました。

ビジュアル化のベストプラクティス

『ビジュアル化のベストプラクティス』では、Preattentive Attributes/色/地図/コンテキスト/比較対象/ダッシュボード/デザインの順にTipsが紹介されました。ここでは、そのTipsを箇条書きしていきたいと思います。

■Preattentive Attributesについて
・Sensory memoryを有効活用することで、Short-term memoryを有意義な考察に振り分けることが出来る
・Sensory memoryはPreattentiveなものに反応する
・データビジュアライゼーションに使えるPreattentive Attributesは大きくはFrom/Clolor/Positionの3つ
・Formは 向き/幅/長さ/囲い/サイズ/形状、Colorは 色相/彩度、Positonは 空間グループ/位置に分けられ、Preattentive Attributesは全部で10種類ある
・Preattentive Attributesは位置>色>サイズ>形状の順で強い
ただし、シチュエーションによって適切なものは変わり、データのタイプとの相性もある
・データのタイプは分類的な名義/順序的な名義/量的の3つに分けられ、
 分類的な名義は、形状・色相
 順序的な名義は、位置・サイズ・色の彩度・色相・形状
 量的は、位置・長さ・サイズ・色の彩度
と相性が良い

■色
・色数は5~6色、最大7色くらいまでに絞る
・可能であれば3色くらいに抑えたい
・背景によって違って見えるので、背景は統一する
・背景色が乱れる場合はハローを使って背景色を整えると良い

■地図
・地図は空間的な質問に答えるときに使う
・量的データを地域別比較するときなどは地図より棒グラフの方が良い

■コンテキスト
・みんなが持っているであろうコンテキストを使い、伝わりやすい表現を選ぶ(説明しなくても分かる表現を選ぶ)

■比較対象
・適切な比較対象をグラフに加える(データを強化する)ことで、理解しやすくなる場合もある

■ダッシュボード
・探索型と説明型(ストーリーテリング)の2パターンある
・探索型は中立的、説明型は意見が明確

■デザイン
・考えなくても分かる、自然なデザインを目指す
・見てわかるものは読まなくても分かるので、不要な描写を避ける

最後に

この動画を見ながら、2年前に読んだ永田ゆかりさんの『データ視覚化のデザイン』にもこんな感じのことが書かれていたな、とぼんやり思い出したのですが、それもそのはず、永田ゆかりさんは日本人女性で初めてTableauZEN MASTERに選ばれた方だった、ということを改めて認識し直しました。

また、偶然勤務先の研修でほぼ同じ内容の動画を拝見する機会もあったのですが、改めて、このKTChannelの動画で、KTさんの熱量の高い話し方を通して学べたことは幸運だったと思いました。
KTさんは熱心、かつ丁寧に分かりやすい話し方をされているので、私のように、可視化のポイントがいまひとつ分からないと感じていらっしゃる方は、一度この動画をご覧になると良いかもしれません。

いいなと思ったら応援しよう!