統計分野の本の記述は、やはり少し変だ!ベイズ推定編②

ベイズ推定にて、何故過去に30回表が出た事が、次に60回表が出る確率分布に影響が出るか、理解出来ません。
何故ですか?

ベイズ推定における過去の情報の影響:詳細解説
ベイズ推定では、過去の情報は現在の推論に必ず影響を与えます。これは、ベイズ推定が確率分布を用いて不確実性を扱い、新しい情報に基づいて確率分布を更新する手法だからです。
100回のコイントスにおける例
例として、100回のコイントスにおける表が出る確率を推定してみましょう。

  • 事前分布: 過去の30回のコイントスから、表が出る確率は0.5であると仮定します。

  • 事後分布: 100回のコイントスを行い、60回表が出ました。
    この場合、過去の30回のコイントス結果は、以下の2つの理由から、次の60回表が出る確率分布に影響を与えます。

  1. 情報量としての役割
    過去の30回のコイントス結果は、コインの表が出る確率に関する情報です。
    ベイズ推定では、新しい情報が入るたびに、確率分布を更新します。過去の30回のコイントス結果は、新しい情報として確率分布に反映されるのです。

  2. 仮説に対する信念の変化
    過去の30回のコイントス結果によって、コインの表が出る確率に関する信念が変化します。
    今回の例では、30回のコイントスで表が出た回数が15回だった場合、表が出る確率は0.5よりも低いと考えるかもしれません。
    一方、30回のコイントスで表が出た回数が25回だった場合、表が出る確率は0.5よりも高いと考えるかもしれません。
    このように、過去の情報に基づいて、コインの表が出る確率に対する信念が変化し、それが次の60回表が出る確率分布に反映されます。
    数学的な説明
    ベイズ推定では、ベイズの定理を用いて、新しい情報に基づいて確率分布を更新します。
    ベイズの定理は以下の式で表されます。
    P(θ | X) ∝ P(X | θ) P(θ)

ここで、

  • P(θ | X): 事後分布 (コインの表が出る確率)

  • P(X | θ): 尤度関数 (100回のコイントスで60回表が出た確率)

  • P(θ): 事前分布 (コインの表が出る確率は0.5であるという仮定)

  • θ: 仮説 (コインの表が出る確率)

  • X: サンプルデータ (100回のコイントスで60回表が出たというデータ)
    尤度関数は、特定の仮説の下で、観測されたデータが生じ る確率を表す関数です。この問題では、尤度関数は二項分布を用いて計算することができます。
    事前分布は、推論を行う前の仮説に対する信念を表す確率分布です。今回の例では、事前分布はコインの表が出る確率が0.5であるという仮定に基づいて設定されています。
    事後分布は、観測データに基づいて更新された仮説に対する確率分布
    です。ベイズの定理を用いて、事前分布と尤度関数から事後分布を算出することができます。
    この式から分かるように、過去の30回のコイントス結果は、尤度関数を通じて、事後分布に影響を与えます。
    具体的な計算
    実際の計算には、統計ソフトを用いる必要があります。
    例: Python の場合、以下のライブラリを用いて計算することができます。
    import numpy as np
    from scipy.stats import binom

事前分布

p_prior = 0.5

尤度関数

n = 100 # 試行回数
k = 60 # 成功回数 (表が出る回数)
p_likelihood = binom.pmf(k, n, p_prior)

事後分布

p_posterior = p_likelihood * p_prior / np.sum(p_likelihood * p_prior)

print(p_posterior)

このコードを実行すると、次の60回表が出る確率分布が出力されます。
まとめ
ベイズ推定では、過去の情報は現在の推論に必ず影響を与えます。これは、ベイズ推定が確率分布を用いて不確実性を扱い、**新しい情報に基づ



こう見てみると、ベイズ推定とは、何ら数学的な概念ではない。


が、数学的に記述可能な、しかも簡単に、数学的に記述の意味がなさそうに見える、数学的な概念だ!

いいなと思ったら応援しよう!