見出し画像

統計学の立場、事象について

統計学を学ぶにあたり、混乱ポイントは、①統計学の立場に関する概念整理、②確率に関する概念整理、③データ尺度に関する概念の整理 になるかと思います。今回は、①に関して記述します。

統計学の立場に関して、大きく3つの立場に分けるとわかりやすく整理することができます。すなわち、A:多量のデータを特徴的な量によってまとめて表現するための「記述統計」、B:ある仮説に基づき検討される確率分布モデルと実際のデータを統計量によって比較し、その仮説の棄却可能性を推定するための「推測統計」、そしてC:ある仮説(信念)に基づき確率分布を最初に設定し、これに対して新たに入手した情報を基にベイズ則に従って仮説を更新していく「ベイズ統計学」です。以下、私が過去にプレゼンで作ったスライドから引用した図です。間違いがあったら指摘ください。

無題

さて、主眼が「未知のデータに対する定量的な推測と判断」に置かれる機械学習分野においては、統計の中でも特に推測統計、ベイズ統計によって中身が記述されることが多いです。そこで、確率概念に関してまとめる必要が出てきますが、これにあたって先に事象という概念をまとめる必要が出てきます。というのは、「確率」という概念は、「事象」によって記述されるものだからです。

んで、事象について。具体例を考えながらの方が分かりやすいと思うので、正6面体のサイコロを振るケースを考えます。サイコロを振って出る目は、1、2、3、4、5、6の6通りが考えられます。これ以外の目が出る世界は基本あり得ない(少なくとも、常識的には考える必要がない)はずです。従い、サイコロを振った時に現れるこの6通りの世界をひっくるめて「全事象」と言います。また、「偶数の目が出た世界」や「奇数の目が出た世界」「1の目が出た世界」、「2の目が出た世界」など、全事象のうち、発生しうる可能性(ないしは試行した結果)の世界も存在します。これらは個別の事象となります。事象は集合として考えることが出来ますが、分割していくと必ずこれ以上分割できないような事象が出てきます。このような事象は、「要素」ないし「元」と呼ばれます。サイコロのケースでは、「1の目が出た世界」といった個別の目が出る世界がこれにあたります。

いいなと思ったら応援しよう!