見出し画像

情報理論(第7回 結合確率、条件付き確率、周辺確率、ベイズのルール その2)

阿坂先生
前回に引き続き結合確率条件付き確率周辺確率ベイズのルールを勉強しよう。今回は具体的な数字を入れて考えてみよう。

桂香助教
お題は天気の例にするわね。結合確率を以下の例とするわ。結合確率P(x,y)とはxであり、かつ、yである確率だったわね。

P(東晴,横晴)=0.5
P(東晴,横雨)=0.05
P(東雨,横晴)=0.15
P(東雨,横雨)=0.3

表で書くとこんな感じね。

画像1

麦わら君
はい。大丈夫です。

阿坂先生
では、ここから周辺確率P(東晴),P(東雨),P(横晴),P(横雨)を求めてみよう。周辺確率の求め方覚えているかな?

桂香助教
周辺確率P(東晴)は横浜の天気に無関係に晴れる確率だから

P(東晴) = P(東晴,横晴) +P(東晴,横雨) = 0.5 + 0.05 = 0.55 ​

になるわ。忘れた人は第6回を見たり参考書をめくってみてね。これを表で書くと以下になるわ。

画像2

麦わら君
横に足せばいいんだね。おー、そうすると他の周辺確率P(東雨),P(横晴),P(横雨)も縦や横に足せばよさそう。

画像3

阿坂先生
そのとおりじゃ。結合確率、周辺確率が分かったのでベイズのルールを用いて条件付き確率を求めてみよう。ベイズのルール覚えておるかな?

桂香助教
ベイズのルールは以下だったわね。

結合確率P(東晴,横晴)= 条件付き確率P(東晴|横晴)× 周辺確率P(横晴)

これを変形して

条件付き確率P(東晴|横晴)=結合確率P(東晴,横晴)/ 周辺確率P(横晴)

として、上の表を条件付き確率に変換してみる。まず、横浜の天気のほうを条件とすると

画像4

麦わら君
ほうほう、なるほど。では東京の天気のほうを条件とすると・・・

画像5

阿坂先生
計算された結合確率、条件付き確率、周辺確率を見比べたときに何か分かったことがあるかな?

麦わら君
結合確率と条件付き確率を比べると条件付き確率のほうが91%とか9%とか極端な確率になっていますね。

桂香助教
周辺確率と条件付き確率の関係を考えると意味が見えてくるわ。例えば、横浜の天気。晴れる確率は65%、雨の確率は35%よね。

麦わら君
これは周辺確率ですね。

桂香助教
ところが条件付き確率を見ると、東京が晴れだった場合の晴れる確率は91%、雨の確率は9%となる。この理由は何?

麦わら君
そりゃ、東京の天気と横浜の天気は似ていますからね。東京の天気を知れば横浜の天気は予想できます。

阿坂先生
そう!この考え方が大事なのじゃ。晴れの確率が65%だった横浜の天気が東京の天気が分かれば確率をアップグレードできるんじゃ。これがベイズのルールの真骨頂じゃ。

麦わら君
東京が晴れって分かれば、横浜が晴れている確率は91%。それが条件付き確率P(横晴|東晴)の意味だからか。

桂香助教
なにかの情報を得て、確率がアップデートされる。これって前にやった情報の量に関係してくると思わない?

麦わら君
あー確かに。この確率からエントロピーを求められるんじゃないかということ?

阿坂先生
素晴らしい!そうゆうことじゃ。条件付き確率に対応するものが条件付きエントロピー、結合確率に対応するものが結合エントロピーと言う。この関係は次回に勉強するぞい。

桂香助教
ここでは、もう少し確率に慣れ親しむためにもう1題例題を出すわ。条件付き確率が分かっているときに結合確率を求める問題。

道が混んでいるか空いているかの条件において、平日か休日かの条件付き確率が分かっているとする。例えば、道が混んでいる場合において休日である確率はP(日休|道混)=0.9とするいった感じよ。他の場合を以下の表とする。

画像6

このとき、結合確率を求めようという問題があったとする。できるかな?

麦わら君
結合確率P(日休,道混)ですよね。わかります!まずは結合確率はベイズのルールで

P(日休,道混)=P(日休|道混)×P(道混)=0.9×P(道混)
P(日休,道空)=P(日休|道空)×P(道空)=0.2×P(道空)=0.2×{1-P(道混)}
P(日平,道混)=P(日平|道混)×P(道混)=0.1×P(道混)
P(日平,道空)=P(日平|道空)×P(道空)=0.8×P(道空)=0.8×{1-P(道混)}   (1)式

となりますよね。

阿坂先生
ふむふむ。

麦わら君
そして、4つ(全パターン)の結合確率の和は1になるはずだから

P(日休,道混)+P(日休,道空)+P(日平,道混)+P(日平,道空)=1

ですよね。上式に(1)を代入すればP(道混)が求められて、結合確率P(日休,道混)も求められるんじゃないかな?

桂香助教
ほうほう。

麦わら君
では代入してみます。

0.9×P(道混)+0.2×{1-P(道混)}+0.1×P(道混)+0.8×{1-P(道混)}=1
0=0

あれ!!解けない?

桂香助教
ふふふ。解けないのよ。条件付き確率から結合確率は求めることはできない。求めるためにはもう1つ条件が必要なの。

阿坂先生
例えば、P(道混)=P(日休)という条件があれば解ける。どうやって解くか考えてみるぞぃ。

麦わら君
うーん。わかりません。

桂香助教
周辺確率の計算でこんな関係あったわよね。

P(日休) = P(日休,道混)+P(日休,道空)
     = P(日休|道混)×P(道混)+P(日休|道空)×P(道空)

麦わら君
たしかに!それでP(道混)=P(日休)を使えば

P(道混) = P(日休|道混)×P(道混)+P(日休|道空)×{1-P(道混)}
P(道混) = 0.9×P(道混)+0.2×{1-P(道混)}
P(道混) = 2/3

になる。だからP(道混) = 2/3を(1)式に代入すれば

P(日休,道混)=P(日休|道混)×P(道混)=0.9×2/3=0.6
P(日休,道空)=P(日休|道空)×P(道空)=0.2×P(道空)=0.2×1/3=0.067
P(日平,道混)=P(日平|道混)×P(道混)=0.1×2/3=0.067
P(日平,道空)=P(日平|道空)×P(道空)=0.8×P(道空)=0.8×1/3=0.267 

になるんだね。

阿坂先生
そのとおりじゃ。では次回からは条件付きエントロピー、結合エントロピーを求めてみよう!

これから記事を増やしていく予定です。