見出し画像

n=2から始めよう:平均と標準偏差

手を動かすとわかることがある(と思う)

英語を習うのに、まず文法をしっかり学んでから、と考えてしまうとハードルが高くなる。まず英語を使ってみる、話せることを話してみる、そういう環境に身を置くことが、続けるための方法のひとつ、という話を聞いた。

そこで、まずやってみる、手を動かして計算してみる、というところから、統計というものに近づいてもらうのはどうだろうと考えた。最初は、n=2、つまり数が2つあるところから始めよう。

平均を計算しよう

次のデータの平均を計算しよう。電卓(あるいはスマホ等の電卓アプリ)を使います。

データ1:{ 2, 4 }

馬鹿にしてんのか? とか思われそうだが、まじめである。
平均は、すべての数値を足し合わせ、データの数で割ったものである。

  1. すべての(2つしかないが)数値を足し合わせる。2+4=6

  2. データの数(2つだ)で割る。6÷2=3

練習

計算方法を確認したら、少し練習しよう。データをいくつか提示するので、平均を計算しよう。

データ2:{ 3, 6 }
データ3:{ 1, 5 }
データ4:{ 9, 4 }
データ5:{ 8, 2 }

答えは次のようになる。
データ2から順に、《 4.5 3 6.5 5 》である。
もしかしたら、答えが小数になったとき(4.5とか)に、若干の不安を覚えたかもしれない。答えが小数になることは、よくあることなので、心配しなくてよい。あとは、自分の暗算力を過信せずに、電卓のキーを打ち間違えないよう、気をつければよい

分散・標準偏差を計算しよう

さて、分散の計算は、覚えるまでがちょっとややこしい。最初のデータ{2,4}を使って練習しよう。

  1. データから平均を引いた値(これを「偏差」という)を求める。平均は3だったので、それぞれの数値から3を引く。(引く順番に注意)

    1. ひとつめの{2}は、2-3=ー1になる。

    2. ふたつのめ{4}は、4-3=になる。

    3. 平均を引くことで、{2,4}が{ー1,1}(偏差)に変わった。

  2. 偏差を2乗する(これを「偏差2乗」という)。(2乗は、同じ数を2回かけ合わせること。)

    1. ひとつめの偏差{ー1}は、2乗すると、(ー1)×(ー1)=1。

    2. ふたつめの偏差{1}は、2乗すると、1×1=1。

    3. 2乗したことで、さらに{1,1}(偏差2乗)に変わった。

  3. 偏差2乗を平均する。(←ここ、大丈夫かな。偏差2乗になったら、もとのデータは{1,1}に変身した。この{1,1}を使って、「すべての数値を足し合わせて、データの数で割る」という計算をするのである)

    1. すべての数値を足し合わせる。1+1=2

    2. データの数で割る(データは2つだ)2÷2=1

  4. 最後の答えが分散である。分散は1だ。

  5. 分散のルートをとると標準偏差になる。√1=1。標準偏差は1だ。

分散と標準偏差は同じ数だと思ってはいけない。分散が1だったので、たまたま標準偏差も1(だってルート1は1だから)になっただけの話で、分散が2だったら、標準偏差はルート2である。
蛇足だが、いま、ルートを開いて小数にする必要はない。分散を求めたら、それにルートをくっつければよいし、「ルート4ってことは、2だ」とわかったら、書き直せばよい。

工程表をつくってみる

計算の順序を覚えるまではややこしいので、次のような工程表を作ってみよう。上の説明と照らし合わせながら見るとよい。

分散の計算

練習

さっき平均を計算したデータで、今度は分散を計算しよう。分散が計算できたら、ルートをとって、標準偏差も書いておこう。

データ2:{ 3, 6 }、平均=4.5
データ3:{ 1, 5 }、平均=
データ4:{ 9, 4 }、平均=6.5
データ5:{ 8, 2 }、平均=

データ2の平均が4.5だったので、最初から怖気づいているかもしれない。データ2の回答を途中まで示そう。

データ2

途中までといったが、ほぼ最後まで書いている。たしかに、1.5の2乗など、日常生活では計算する機会がないが、たかが数である。我々には電卓という強い見方がある。恐れることは無い。キーを打ち間違えたからといって、誰かに叱られるわけでも、財布のお金が減るわけでもない。

すべて空欄の工程表をつけておくので、データ3から5にも取り組んでいただきたい。

分散計算の工程表

このあと何行か開けて、答えが書いてある。自分で計算してから、答え合わせをしていただきたい。










答え:
データ2:分散2.25、標準偏差1.5
データ3:分散4、標準偏差2
データ4:分散6.25、標準偏差2.5
データ5:分散9、標準偏差3
なんか、きれいに数が並んでいませんか? 作ったみたいに。(作ったんだが。)