n=2から始めよう:平均と標準偏差
手を動かすとわかることがある(と思う)
英語を習うのに、まず文法をしっかり学んでから、と考えてしまうとハードルが高くなる。まず英語を使ってみる、話せることを話してみる、そういう環境に身を置くことが、続けるための方法のひとつ、という話を聞いた。
そこで、まずやってみる、手を動かして計算してみる、というところから、統計というものに近づいてもらうのはどうだろうと考えた。最初は、n=2、つまり数が2つあるところから始めよう。
平均を計算しよう
次のデータの平均を計算しよう。電卓(あるいはスマホ等の電卓アプリ)を使います。
データ1:{ 2, 4 }
馬鹿にしてんのか? とか思われそうだが、まじめである。
平均は、すべての数値を足し合わせ、データの数で割ったものである。
すべての(2つしかないが)数値を足し合わせる。2+4=6
データの数(2つだ)で割る。6÷2=3
練習
計算方法を確認したら、少し練習しよう。データをいくつか提示するので、平均を計算しよう。
データ2:{ 3, 6 }
データ3:{ 1, 5 }
データ4:{ 9, 4 }
データ5:{ 8, 2 }
答えは次のようになる。
データ2から順に、《 4.5 3 6.5 5 》である。
もしかしたら、答えが小数になったとき(4.5とか)に、若干の不安を覚えたかもしれない。答えが小数になることは、よくあることなので、心配しなくてよい。あとは、自分の暗算力を過信せずに、電卓のキーを打ち間違えないよう、気をつければよい。
分散・標準偏差を計算しよう
さて、分散の計算は、覚えるまでがちょっとややこしい。最初のデータ{2,4}を使って練習しよう。
データから平均を引いた値(これを「偏差」という)を求める。平均は3だったので、それぞれの数値から3を引く。(引く順番に注意)
ひとつめの{2}は、2-3=ー1になる。
ふたつのめ{4}は、4-3=1になる。
平均を引くことで、{2,4}が{ー1,1}(偏差)に変わった。
偏差を2乗する(これを「偏差2乗」という)。(2乗は、同じ数を2回かけ合わせること。)
ひとつめの偏差{ー1}は、2乗すると、(ー1)×(ー1)=1。
ふたつめの偏差{1}は、2乗すると、1×1=1。
2乗したことで、さらに{1,1}(偏差2乗)に変わった。
偏差2乗を平均する。(←ここ、大丈夫かな。偏差2乗になったら、もとのデータは{1,1}に変身した。この{1,1}を使って、「すべての数値を足し合わせて、データの数で割る」という計算をするのである)
すべての数値を足し合わせる。1+1=2
データの数で割る(データは2つだ)2÷2=1
最後の答えが分散である。分散は1だ。
分散のルートをとると標準偏差になる。√1=1。標準偏差は1だ。
分散と標準偏差は同じ数だと思ってはいけない。分散が1だったので、たまたま標準偏差も1(だってルート1は1だから)になっただけの話で、分散が2だったら、標準偏差はルート2である。
蛇足だが、いま、ルートを開いて小数にする必要はない。分散を求めたら、それにルートをくっつければよいし、「ルート4ってことは、2だ」とわかったら、書き直せばよい。
工程表をつくってみる
計算の順序を覚えるまではややこしいので、次のような工程表を作ってみよう。上の説明と照らし合わせながら見るとよい。
練習
さっき平均を計算したデータで、今度は分散を計算しよう。分散が計算できたら、ルートをとって、標準偏差も書いておこう。
データ2:{ 3, 6 }、平均=4.5
データ3:{ 1, 5 }、平均=3
データ4:{ 9, 4 }、平均=6.5
データ5:{ 8, 2 }、平均=5
データ2の平均が4.5だったので、最初から怖気づいているかもしれない。データ2の回答を途中まで示そう。
途中までといったが、ほぼ最後まで書いている。たしかに、1.5の2乗など、日常生活では計算する機会がないが、たかが数である。我々には電卓という強い見方がある。恐れることは無い。キーを打ち間違えたからといって、誰かに叱られるわけでも、財布のお金が減るわけでもない。
すべて空欄の工程表をつけておくので、データ3から5にも取り組んでいただきたい。
このあと何行か開けて、答えが書いてある。自分で計算してから、答え合わせをしていただきたい。
答え:
データ2:分散2.25、標準偏差1.5
データ3:分散4、標準偏差2
データ4:分散6.25、標準偏差2.5
データ5:分散9、標準偏差3
なんか、きれいに数が並んでいませんか? 作ったみたいに。(作ったんだが。)