![見出し画像](https://assets.st-note.com/production/uploads/images/22915029/rectangle_large_type_2_97588b606ee1637dc899eefefcb3f21a.png?width=1200)
1σって聞いたことありますか?「平均と標準偏差」の話
「平均とか偏差とか、知ってるに決まってんじゃねーか!」と思いますよね!
なら、1σ(シグマ)って聞いたことありますか?聞いたことない?それは平均を理解してるとは言えませんよ?
聞いたことない人は是非読んでいってください!平均の意味がわかってくると思います!
「平均年収は意味がない、年収は中央値をとれ」とか聞いたことありますよね?なんでかちゃんと理解していますか?
平均とは何か
平均というのは、これです。まぁ常識ですよね(笑)
正確に言えば、相加平均といいますね。高校の時に、証明問題の裏技で「相加平均と相乗平均の関係より」ってやつありましたね!懐かしい(笑)
その相加平均です。
さて、これが平均の定量的な意味ですが、定性的には母集団を代表する値を意味することが多いでしょう。この時、問題になるのが、この平均値が実際に母集団を代表しているのかどうかです。
平均が母集団を代表する値であるためには、一つの仮定を置く必要があります。
それが「母集団の分布が正規分布であること」です。
正規分布というのは、母集団のヒストグラムを書いた時に、以下のような形になっているグラフのことをいいます。
この時、この母集団を代表する値は0であると言えるでしょう。では次の場合はどうでしょうか?いわゆるべき分布(指数分布)と呼ばれるものです。
この時、平均値は母集団を代表する値にはなりません。
国民の年収というのはこのベキ分布になると言われています。そのため、平均値というのが定性的には意味がないと言われる訳ですね。
分散と標準偏差
偏差値って聞いたことありますよね?知らない人はほとんどいないと思います。でも、偏差値ってなんだか知っていますか?これは、正規分布の真ん中を50とした時の、自分の位置です。式にするとこうなります。
この時、σが標準偏差になります。意外と馴染みがありますね!
ちなみに、テストの点数は正規分布になりますので、1点上がるだけで、順位は大きく変動します。(もし正規分布にならなければ偏差値に意味がなくなります。)このへんの話は過去記事に詳しく書いています。
→ 理想の新天地に行けなかったあなたにエールを。「今日が一番若い日だから!」
分散とは、この標準偏差の二乗です。っといより、標準偏差は分散の平方根です。ので、基本的に同じものです。分散はばらつきを示します。分散が高いほど、値がばらついているなーという事になります。式でいうとこうです。これをルートとってあげると標準偏差になります。今更ですが、標準偏差は基本的にσで表記します。
標準偏差の基本的な使い方
「標準偏差ってどういうものなのかはわかったけど、結局何につかえるの?」
標準偏差は平均からどれだけ解離しているかを表すのに用いられます。
偏差値で考えるとわかりやすいですが、偏差値80っていったら化物ですよね?(笑)
これを、1σという物差しをつかって図る訳です。下の図のように正規分布を仮定した時に平均値からどの程度離れているかを図るための物差しとして利用します。
「1σの範囲」といったら、平均から両側にσだけ離れた範囲内を表しています。この範囲内には、全体の約68%程度が含まれます。(目安です。もちろん、データによって変動します。)
「2σ」といったら、全体の95%が含まれる範囲内という事を話しています。
つまり「2σの範囲内に入っていないものは外れ値として扱いましょう。」という議論になる訳ですね。
おわりに
さて、1σの意味はわかりましたか?
今度はRをつかった実践編をアップロードしようかと思っています!
いいなと思ったら応援しよう!
![しゅい](https://assets.st-note.com/production/uploads/images/21109425/profile_6a7bbd10428271743f7ef703276372ee.jpg?width=600&crop=1:1,smart)