見出し画像

すぐに使いたくなる記述統計!

どうもこんにちはmayuです。
『統計学を学ぶシリーズ』今回のテーマはこちら!

『記述統計について』

記述統計とは簡単に言えば手持ちのデータにどんな特徴があるかを集計・観察する手段のことです。
「統計学知らないと勿体ない!」でも解説がありましたが、統計学は実は身近にあって知らず知らずのうちに使っているものなんですね!

仕事などで使う機会がない方も、ニュースやバラエティ番組、ネットなどでアンケート結果を表した円グラフや棒グラフなど、一度は見たことがあるんじゃないでしょうか?

画像1

「○%のお客様がリピートしたいと答えました!」なんていうよく見る広告の売り文句も記述統計を使っているんです。そう思うと一気に身近な存在になりましたね。今回は、今持っているデータを情報として可視化する手法についてまとめていきたいと思います。

では早速、アンケートを例に集めたデータを情報にしてみたいと思います。
以下は500人に「次回もリピートしたいか」というアンケートを取ったものを集計した結果です。

「500人にアンケートを取った結果、とても思うと答えた人は187人、やや思うと答えた人は216人、あまり思わないと答えた人は21人、思わないと答えた人は34人、どちらでもないと答えた人は42でした。その中で思うと答えた総人数は403人です。」


・・・・長い!!!読む気しない!!!


画像5

そう思いませんでしたか???もちろんこの文字だけの結果も情報になってはいるんですが、いまいちピンときませんよね?
これをにしてみます。

画像7

ちょっと見やすくなりました!
でも、頭では計算しきれないしまだイメージが沸きづらい・・・。結局全体でどのぐらいの人がリピートしたいと思ってくれたの???ってなりますよね。

そこで活用するのがグラフです!

さっきの表を円グラフにしてみました。

画像7

めちゃくちゃ見やすくなってる~~~!!!!

画像6


記述統計は数字だけでは読み解くのが難しいデータを見やすくするためのものでもあるんですね~!ありがたい!

データをより見やすくするデザインについては、2/19(金)投稿予定の『プレゼンテーション~デザイン編~』の記事をお楽しみに!

グラフ化の快感を覚えた私は使ってみたくて色んなデータをグラフにできないか?と、あれもこれもグラフにしようとして必要ないデータもどうにかグラフにしたい!!とグラフ脳に陥ったりしました(笑)

画像4

やってみたいけど、手持ちのデータって色んな人にアンケートを取りにいかないといけないの?というとそんなことはありません!
前回、nanさんが家計簿をグラフ化していたように、データはどこにでもあって、自分の身の回りで集めることが可能です。

・買いたい家電は何処で買ったら安いんだろう?
・好きになるアイドルやキャラクターの法則ってあるのかな?
・持ってる服の価格帯ってどのぐらいかな?

などなど身の回りで探し出すといくらでも収集できちゃいます!
そういえばあれってどうなんだろう?って思ったあなたはもうグラフ脳になってます!!!(笑)

そして、グラフ脳になったのをきっかけに、統計では様々なグラフを使うことを知りました。その中で私が初めて出会ったなんだこれ!と思ったグラフをちょっと紹介したいと思います。

なんだこれ! その①
『散布図』

画像7

その名の通り、点が散らばったグラフで初めて見た私の感想はまさに「なんだこれ~~~?!」です!(笑)この散らばった点の何を見たらいいのか、どうだったら何なのかが全然分からずとにかく衝撃的でした。

この散布図は「相関図」とも呼ばれるらしいのですが、こちらの名前の方がピンとくる人も多いはず。そうです!2つの関係性を調べることができるグラフなんですね~!

上記の散布図は「身長と体重」の関係を表しているんですが、身長が伸びればその分体重は重くなるよね~という普段当たり前に感じているようなことなども証明することができるんです。

この散らばった点が右上がりの一本線に近づくほどその2つの関係性は深く、逆に全体に分散しているほど関係性が薄いということを表しています。
例えば、「身長とゲーム時間」は想像だけだと関係性の点はバラバラになりそうですよね。でも、もしかしたら身長が高い人ほど長時間ゲームをするという結果が出るかもしれない!そう思ったら調べてみたくてワクワクしませんか?

なんだこれ! その②
『ヒストグラム』

画像8

こちらのグラフ・・・実は棒グラフじゃないんです!!!知ってるよって方ももちろんいると思いますが、アーニーに入って初めてこの単語を知った私・・・。社内のエンジニア達が良く使っているのは見ていましたが正直ななんだろうと思っていました。統計学を勉強し始めてやっと使い方や見方を理解することができました!ごめんなさい(笑)

棒グラフとヒストグラムの違いは簡単に言うと、棒グラフは様々な条件を対等に比較するためのグラフですが、ヒストグラムは1つの条件の「分布」を見る時に使います。

例えば
・棒グラフ
「りんご」「みかん」「ぶどう」の収穫量はどれが多いのかを見たい時
・ヒストグラム
「ぶどう」の収穫時の重量はどのぐらい差があるのかを見たい時

私はワインが好きなので、「ぶどう」を例にヒストグラムを解説してみたいと思います。
以下の計測結果は、1房のぶどうの重さを20房分記録したものです。

画像9


そして、右側の「度数分布表」というのが計測結果を集計した表なんですが、この表をグラフ化する時に使うのがヒストグラムです!
もちろん数値だけみても350~400gのぶどうが一番多いのは分かるのですが、グラフにするともっと見た目的に分かりやすくなります。

画像10

一番多い重さは350~400gだ!というのは明らかにすぐ分かりますし、その前後を見ると250~400gが一般的な重さなのかな~というのも見て取れますね。

ここでもう一つ棒グラフとの違いを言うと、ヒストグラムは重量の分布を見るためにあるので昇順降順では見ないんです!
世の中のランキング情報に浸かっているせいか、すぐに大きい順に並べ替えたくなってしまう私には一番の違いはここかなと思いました。

そして、山の形もとっても重要です!今回は一般的な左右対称型のヒストグラムですが、この山の形は情報によって変化します。「離れ小島型」とか「左絶壁型」とか形通りの名前がちゃんと付いていてちょっと可愛いです(笑)

このように、統計学とグラフは切っても切れない関係で、知っていると色んな情報を読み取れるようになって凄く楽しい学問だということを知りました!他にも色んな形やグラフがありますが、私もまだまだ勉強不足なのでこの辺で。興味を持った方はぜひ検索して探してみてください。

今回、勉強に使った書籍はこちら。
マンガでわかる統計学
統計学の図鑑(まなびのずかん)

次回!『統計学を学ぶシリーズ』は、この記述統計を使って実際にテスターが行なっている業務について、実例を含めて書いていきたいと思います。お楽しみに~!

画像11

いいなと思ったら応援しよう!