統計分野の本の記述は、やはり少し変だ!ベイズ推定編②
ベイズ推定にて、何故過去に30回表が出た事が、次に60回表が出る確率分布に影響が出るか、理解出来ません。
何故ですか?
ベイズ推定における過去の情報の影響:詳細解説
ベイズ推定では、過去の情報は現在の推論に必ず影響を与えます。これは、ベイズ推定が確率分布を用いて不確実性を扱い、新しい情報に基づいて確率分布を更新する手法だからです。
100回のコイントスにおける例
例として、100回のコイントスにおける表が出る確率を推定してみましょう。
事前分布: 過去の30回のコイントスから、表が出る確率は0.5であると仮定します。
事後分布: 100回のコイントスを行い、60回表が出ました。
この場合、過去の30回のコイントス結果は、以下の2つの理由から、次の60回表が出る確率分布に影響を与えます。
情報量としての役割
過去の30回のコイントス結果は、コインの表が出る確率に関する情報です。
ベイズ推定では、新しい情報が入るたびに、確率分布を更新します。過去の30回のコイントス結果は、新しい情報として確率分布に反映されるのです。仮説に対する信念の変化
過去の30回のコイントス結果によって、コインの表が出る確率に関する信念が変化します。
今回の例では、30回のコイントスで表が出た回数が15回だった場合、表が出る確率は0.5よりも低いと考えるかもしれません。
一方、30回のコイントスで表が出た回数が25回だった場合、表が出る確率は0.5よりも高いと考えるかもしれません。
このように、過去の情報に基づいて、コインの表が出る確率に対する信念が変化し、それが次の60回表が出る確率分布に反映されます。
数学的な説明
ベイズ推定では、ベイズの定理を用いて、新しい情報に基づいて確率分布を更新します。
ベイズの定理は以下の式で表されます。
P(θ | X) ∝ P(X | θ) P(θ)
ここで、
P(θ | X): 事後分布 (コインの表が出る確率)
P(X | θ): 尤度関数 (100回のコイントスで60回表が出た確率)
P(θ): 事前分布 (コインの表が出る確率は0.5であるという仮定)
θ: 仮説 (コインの表が出る確率)
X: サンプルデータ (100回のコイントスで60回表が出たというデータ)
尤度関数は、特定の仮説の下で、観測されたデータが生じ る確率を表す関数です。この問題では、尤度関数は二項分布を用いて計算することができます。
事前分布は、推論を行う前の仮説に対する信念を表す確率分布です。今回の例では、事前分布はコインの表が出る確率が0.5であるという仮定に基づいて設定されています。
事後分布は、観測データに基づいて更新された仮説に対する確率分布です。ベイズの定理を用いて、事前分布と尤度関数から事後分布を算出することができます。
この式から分かるように、過去の30回のコイントス結果は、尤度関数を通じて、事後分布に影響を与えます。
具体的な計算
実際の計算には、統計ソフトを用いる必要があります。
例: Python の場合、以下のライブラリを用いて計算することができます。
import numpy as np
from scipy.stats import binom
事前分布
p_prior = 0.5
尤度関数
n = 100 # 試行回数
k = 60 # 成功回数 (表が出る回数)
p_likelihood = binom.pmf(k, n, p_prior)
事後分布
p_posterior = p_likelihood * p_prior / np.sum(p_likelihood * p_prior)
print(p_posterior)
このコードを実行すると、次の60回表が出る確率分布が出力されます。
まとめ
ベイズ推定では、過去の情報は現在の推論に必ず影響を与えます。これは、ベイズ推定が確率分布を用いて不確実性を扱い、**新しい情報に基づ
こう見てみると、ベイズ推定とは、何ら数学的な概念ではない。
が、数学的に記述可能な、しかも簡単に、数学的に記述の意味がなさそうに見える、数学的な概念だ!