データの散らばり
偏差
各観測値から平均値を引いた値
偏差=観測値ー平均値
偏差が大きい観測値を多く含むデータは全体の散らばりが大きいと判断できそうだが、偏差の合計は0になる
2, 3, 6, 7, 8, 10
平均値=36÷6=6
偏差
2-6=-4
3-6=-3
6-6=0
7-6=1
8-6=2
10-6=4
偏差の合計
(-4)+(-3)+0+1+2+4=0
したがって、偏差の平均も0となる
そこで…
データ全体の散らばりを考える際は下記の2つが用いられる。
平均偏差=偏差の絶対値の平均値
(4+3+0+1+2+4)÷6=2.33333…
分散=偏差を平方した値の平均値
(16+9+0+1+4+16)÷6=7.6666…
分散の単位は観測値の平方となる平均値とは単位が異なるため解釈が難しい。そこで
分散の平方根をとった標準偏差が用いられることもある。