ざっくりデータサイエンス(頻度主義とベイズ主義)
前に書いた記事でベイズ推定について触れなかったので、追補しておきます。
推測統計学には、大きく分けて頻度主義とベイズ主義という2つの主要なアプローチがあります。
(その他に尤度主義やフィデューシャル主義、ロバスト統計、決定理論的アプローチなどがあるそうですが、中身を知らないので名前だけ書いておきます)
頻度主義とは?
頻度主義は、数多くの観察結果から結論を導き出すアプローチです。
例:
サイコロを100回振って6の目が15回出たとします。この場合、6の目が出る確率は15/100 = 15%と計算されます。
ベイズ主義とは?
ベイズ主義は、最初にある予測(仮説)を立てておき、それを新しい情報によって更新していくアプローチです。
例:
サイコロの6の目が出る確率は1/6と予測します。その後、10回サイコロを振って6が5回出た場合、「このサイコロは6の目が出やすいかもしれない」と考え、最初の予測を更新します。
ベイズ推定の利点
ベイズ推定には以下のような利点があります:
少ないデータでも意味のある推論が可能(新しいデータで推定を更新できるため)
過去の経験や知識を取り入れることができる(経験や専門家の知識を活用できる)
結果を確率で表現できるため、現実世界の複雑さをより自然に捉えられる
ベイズの定理の歴史
ベイズの定理自体は18世紀に発表されましたが、当時はあまり注目されてい なかったそうです。
しかし、コンピュータが登場し複雑な計算が可能になると、ベイズ理論は実用的な手法として再評価され、現代の科学や技術に多大な影響を与えるようになりました。