恋愛で学ぶ統計学♡(No.11 自由度とは?)
こんにちは!今回も恋愛のシチュエーションを通して、統計を学んでいきましょう!
自由度とは
統計学を少し勉強すると、「自由度」という言葉が出てくることに気づくでしょう。
ですが、この言葉だけ聞いても、なにが自由なの?
というような疑問が浮かんでくると思います。
また、私は、自由なほうが嬉しいですが、自由すぎても何をしていいかわからないというような方もいると思うので、自由度は高いほうがいいの?それとも低い方がいいの?というような質問も出てくるかと思います。
そんな疑問や質問に答えるため、「自由度」について一緒に学びましょう!
自由度というのは、「どれだけ自由に決めることができるかの度合い」と考えることができます。
デートプランを考えよう!
例えば、あなたとあなたが気になっている相手とデートに行ったとします。
そこで、あなたは、デートのコースを考えようと思っています。
気になっている相手に、「どこにいきたい?」と聞くと
「全部任せる~」
と一言言われただけです、、、、これが一番難しいですよね(;^ω^)
まず、この「全部任された状況」は、「自由度は無限」とも考えられます。
もちろん、デートに行く場所の候補は有限なので、細かく言うと「自由度は無限」は言い過ぎです。しかし、「なんでも選べる」という状況は「かなり自由がきく(自由度が高い)」状況といえますよね。
そして、ここで、あなたは思います。
「気になっている相手が何が好きで、何が嫌いかわからないぞ」
「もし自分が選んだデート先が相手に喜んでもらえなかったらどうしよう」
そう思いながら、まずは「集合場所をきめないと」となりますね。
もしあなたなら、下の2つの選択肢のうち、どちらを集合場所に選びますか?
1.相手と自分の住んでいる最寄りの駅
2.相手と自分の住んでいる最寄りの映画館
どうでしょうか?
多くのかたは、1を選ばれたのではないでしょうか?
私なら、1を選びます。(2を選ばれた方すいません。)
もしも、その気になっている相手が、最近「○○っていう映画気になっているんだよね。」とか「映画好き」という情報を知っていた場合は、2を選ぶかもしれませんが、それでも、1の方がよいと思います。
その理由は、1の方が、集合した後の選択肢が、圧倒的に多いからです。
つまり、「自由度」が高いのです!
2を選んだ場合、映画館に来たのだから、「どの映画を見るか」という選択肢はありますが、選択肢が少ないですよね。
では、それを踏まえて、例えば、ランチの場所を考えましょう。
もしあなたなら、下の2つの選択肢のうち、どちらをランチに選びますか?
1.ファミリーレストラン
2.インド料理屋さん
「気になっている相手とデートするお店ならどっちも選ぶわけない!」と言わないでくださいね。(笑)
では、自由度の観点から見た場合、どちらの方が自由度が高いでしょうか?
答えは、1ですね。
ファミリーレストランの場合、いろんな国籍や種類のメニューが多く、選択肢が多いです。もちろん、先ほどの例のように、相手が「カレー大好き!」という方でしたら、問題ないでしょう。でも、ファミリーレストランのほうが、自由度としては高いと言えます。
このように、「どれだけ自由に決めることができるかの度合い」が自由度といえます。
しかし、これら例だけでは「自由度は高いほうがいいの?それとも低い方がいいの?」という質問には答えられていませんね(笑)
これらの例には、つっこみどころ満載ですから(笑)
もしかすると、いま空前のインド料理ブームで、だれもがインド料理屋さんに行きたいという状況でしたら、自由度の高低なんて関係ないですし。
では、統計の世界で「自由度」を考えてみようと思います。
t検定における自由度
例えば、t検定におけるt分布は「自由度」の影響を大きく受けます。
t検定とは、検定の中でよく使われるものの1つです。
検定ってなんだろう?という方は、ぜひこの下の記事も読んでみてください
では、そのt分布を見てみましょう。
この分布をみると自由度(V)の数値によって、形が変わっていますね。
実は、このt分布は、自由度が大きければ大きいほど、「正規分布」に近づきます。
そして、この「正規分布」は、統計においてめちゃくちゃ役に立つ相棒です
つまり、t分布に注目すると自由度は高いほど、「正規分布」に近づいてくれるので嬉しい。といえます。
しかし、注意が必要です。t分布における自由度の計算式は
(自由度)=(サンプル数)-1
です。
だからサンプル数をめちゃくちゃ増やせば、めちゃくちゃ自由度が上がります。しかし、t分布を用いて行うt検定をする際に、サンプル数が多きすぎると別の問題が生じるのです、、、
それを「第一種の過誤」というのですが、これについてはまた記事を書こうと思います。もし気になる方は、「第一種の過誤」や「検出力」と調べるといろいろ出てきます。
なんだか、小難しいことを書いていますが、要するに、「自由度が高ければ高いほどいい」という安直な答えではないよ。ということです。
また、自由度が低すぎる場合、分析の精度が落ちたり、そもそも分析できないとなったりします。
「自由すぎても、不自由すぎてもだめ」
ということですね。
なんだか、人間の本質的な哲学のような言葉でまとめになってしまいました。
自由度に関しては、学問によって捉え方が違ったり、統計の中の分析ごとに違ったりするので、そのつど、自由度の定義を確認することも大切です。
この記事が気に入ったらサポートをしてみませんか?