数字と仲良くなるための統計学
数字に強くなりたいですか?
仕事でデータ分析を扱う人が増えていることもあり、数字(データ)に強くなりたいという声をよく聞きます。
エクセルなどのツールを使えることも大切ですが、統計の理解が曖昧なままでは、時には誤った結論を得てしまい、そのこと自体に気づかない恐れもあります。
まずは基礎的な統計学について学び、数字に恐怖感なく向き合えるようになりましょう。
今回は、数字と仲良くなるための基礎的な統計学&オススメの本をご紹介します。
▽
0.わからないことを曖昧にしない
統計学だけではなく、数学を理解するためにも一番大切なこと。
「ちょっと何言ってるかわかんないな。まぁ、いっか。」と流していませんか?
その場その場で調べていては時間が足りないので、何がわからないのかをメモしておきましょう。(資料や本に「?」を書くだけでもOK)
わからないことを一つずつ調べてつぶしていくと、いつの間にか数字と仲良くなっているかもしれません。
1.データをわかりやすく整理する記述統計
手元にあるデータを活用したいとき、まずはデータの特徴が見やすくなるように整理します。整理する方法には、表やグラフがあります。
データの種類や目的に応じてグラフを使い分け、特徴を捉えましょう。
【基本的なグラフ】
① 棒グラフ:量を比べる
② 折れ線グラフ:変化の様子を調べる
③ 円グラフ:割合をみる
④ ヒストグラム(柱状グラフ):データのちらばりの様子をみる
まずは、小学校で習う上記のグラフを押さえましょう。
余力があれば、来年度から中学数学に加わる箱ひげ図もぜひ。箱ひげ図は知名度が低いですが、3つ以上の分布の比較に便利です。
データの種類としては、量的データ(連続データ、離散データ)と質的データとの違いは知っておきたいところです。
さらに、量的データは代表値を用いて特徴を捉えます。
【基本的な代表値】
平均値、中央値、最頻値
どんなときも平均値!になっていませんか?
ゆがんだ分布や、分布からはずれた値がある場合は、その影響を受けにくい中央値(または最頻値)を用いることが多いです。分布の形がわからないときは、最初から複数の代表値を求めると良いかと思います。
2.一部から全体を推測する推測統計
一方で、一部のデータ(標本/サンプル)を集めて分析し、全体(母集団)の特徴を推測するのが推測統計です。
全体の特徴をつかむためには、偏りのないように標本を取り出す(無作為抽出をする)必要があります。
実際は、調査対象や方法が限られていて単純な無作為抽出ができないことも多いですが、できるだけ偏りがないように抽出方法を工夫します。どうしても偏りがある場合は、どのような偏りがあるのかを把握して、分析に反映しましょう。
ただし、標本の大きさ(調査対象の数)が小さいと、母集団の特徴から遠い標本が得られる確率が高くなります。調査コストとの兼ね合いですが、調査対象数はある程度確保したいです。少ないデータから得た考察は過信せず、慎重に扱いましょう。
3.抵抗感がある人にオススメの本
『この世で一番おもしろい統計学:誰も「データ」でダマされなくなるかもしれない16講+α』アラン・ダブニー(著)、グレディ・クライン(イラスト)、山形浩生(訳)、ダイヤモンド社、2014年.
漫画で読める統計学の本。ドラゴンとか出てきて楽しく読めて、直観的にわかりやすい!
ぜひ、自分が使う分野の統計学の本と合わせて読んでみてください。
▽
いかがでしたでしょうか?
具体的なデータも使って解説したかったのですが、今回は概観ということで…。
また一つ一つ取り上げたいと思いますので、一緒に学んでいきましょう。