見出し画像

データを説明するチカラ~ビジョン化とは

こちらの記事で、的確な情報共有の方法と、アクションができるための指標を示せる能力が必要になるので、だれもが見てもわかるようにビジョン化できるスキルが必要とだとお伝えしました。

今回は、この「データを説明するチカラとビジョン化についてお伝えしていこうと思います。

データを読むチカラの必要性

日本政府は、『AI戦略 2019~人・産業・地域・政府すべてにAI~』を策定しています。
『AI戦略2019』では、デジタル社会の基礎知識(読み書きそろばんのようなもの)として、「数理・データサイエンス・AI」に関するチカラを身に着けることを目標に掲げています。
実は、小学校では2020年から、「プログラミング教育」が必修となっています。
また、高校では、2022年から「情報Ⅰ」が必修科目になりました。
もちろん大学や高等専門学校でも「数理・データサイエンス・AIリテラシー教育」が始まっています。

つまり、数年後にはデータリテラシーが一般教養として身についている人材が会社に入ってくるようになるのです。
データリテラシーが身についていない既存社員と、身についている社員の間でリテラシーの格差が広がっていく可能性があります。
あらゆる世代においてデータリテラシーを身に着けることが求められています。

数字は嘘をつかないが、嘘つきは数字を使う

誰がやっても同じ答えが出てくるので、数字は嘘つきません。
しかし、嘘つきは数字を使います。
たとえば、ミスリードを起こさせて相手を合法的に騙す手口があります。
営業活動などで、わざと変化を見せたりすることで相手の印象をよくしようとしたり、変化を見せることで相手に不安を煽るようにするときによく使われます。
残念ながら、騙される側に非があると判断されることが多いです。
なんでもかんでも見ただけですぐに影響されたり、真偽を自分で確認する手間を省いた時点で過失とみなされてしまうからです。

上のグラフでは大きな変化があるように見えますが、
実は同じ数値なんです!

データを可視化するチカラ

AI時代がやってくると「ビジョン化するチカラ」がとても重要になります。
AIはあるものの組み合わせを試すこと、教え上げることが得意ですが、ゼロから考えることは苦手だとされています。
しかし、人間にはそれが可能です。
人間には、図を使って物事を抽象化し、その抽象化されたイメージから構造や関係性を読み解ける能力があります。
人間はもともとクリエイティブな生き物なんです。

ビジョン化する必要性

アンスコムの例(アンスコムのれい、Anscombe's quartet)あるいはアンスコムの数値例(アンスコムのすうちれい)とは、回帰分析において、散布図はそれぞれ異なるのに回帰直線やその他の統計量が同じになってしまう現象について、統計学者のフランク・アンスコム(英語版)が1973年に紹介した例である。
回帰分析をする前に散布図を確認し傾向を把握することの重要性、そして外れ値が統計量に与える影響の大きさを示している

フリー百科事典『ウィキペディア(Wikipedia)

問題です。
この4つのグループはそれぞれどんな傾向をもったデータでしょうか。

アンスコムの数値例

こういったデータの傾向を把握するためには、「統計処理」をすることでそれぞれのデータの傾向を把握できるはずなのですが……。

それぞれ小数第2位、小数第3位まで一致している…

では、散布図にして比較してみましょう。

傾向が異なる!!

散布図を作って調べてみたところ、「平均、分散、相関係数(小数第2位、小数第3位まで)が一致していても、傾向が全く異なる」ということが判明しました。
つまり、統計量だけでは表せないデータの傾向が存在するということなのです。
これほどまでに傾向が異なると、ビジネス上でとるべきアクションも変える必要があるということが分かります。
もし、数字だけで判断してしまったら、的外れな意思決定をしてしまうリスクが高まっていたことでしょう(汗)

データ分析などにおいて、統計的指標はとても役に立つものの、「集計」された指標であるということを念頭に入れておく必要があります。
何か1つの指標を見るだけでは、分析したい対象の分布や推移などの本当の姿に気づくことができないのです。

データをビジョン化しかつ、統計量を観察することでより的確な判断材料をえることができるのではないでしょうか。

まとめ

今回は、この「データを説明するチカラとビジョン化についてお伝えしました。
データというものは、角度を変えて観察する必要があります。
色々な角度から観察することが必要なのでビジョン化しかつ統計量などの数学的数値をだすことが必要なのです。


いいなと思ったら応援しよう!