自由エネルギー原理について誰でもわかる、明快かつ深い解説 -2-
フリストン (K. J. Friston) の変分自由エネルギー原理(FEP)はどんな原理で、どんなご利益があるのかについて順次解説しています。
前回:自由エネルギー原理について誰でもわかる、明快かつ深い解説 -1-
3.変形2
前回は、変分自由エネルギー(VFE)の定義式からはじめて、変形1まで説明しました。今回はもう1つの変形に基づいて説明します。まず定義式は、
VFE(変分自由エネルギー)
= DKL [q(x) || p(x, s)] (1)
= Σ [q(x)・log {q(x)/p(x, s)}] (2)
= Eq(x) [log q(x) - log p(x, s)] (3)
でした。変形2は、p(x, s) = p(x | s) ・ p(s)の代わりに、後回しにしていた
p(x, s) = p(s | x) ・ p(x) を使います。登場する変数は変形1の時と同様で3つとなります。
Eq(x) [log q(x) - log p(x, s)] (3)
= Eq(x) [log q(x) – log {p(s | x)・p(x)}]
= Eq(x) [log q(x) – {log p(s | x) + log p(x)}]
= Eq(x) [log q(x) – log p(s | x) – log p(x)]
= Eq(x) [log q(x) – log p(x)] – Eq(x) [log p(s | x)] (7)
この変形によって、同時確率と推定値の関係を、変形1の時と同じく、
2つの項に分解することができました。
(7)式をカルバックライブラー情報量を使って表すと、
Eq(x) [log q(x) - log p(x)] – Eq(x) [log p(s | x)] (7)
= DKL [q(x) || p(x)] – Eq(x) [log p(s | x)] (8)
となります。
第1項は、complexity あるいは Bayesian surprise (2022/11/3削除)と呼ばれます。 p(x)は真の「泥棒がいる確率」です。本当は真の確率はわからないのですが、1時点前では、その時点のベストな推定として見積もったp(x)の推定値(=q(x)t-1)なので事前確率、q(x)は現時点でのp(x)の推定値(=q(x)t)ですから事後確率になります。事前と事後の情報量の差ですから情報利得(information gain)とも呼ばれます。
第2項 (Eq(x) [log p(s | x)]) は accuracy (正確性、精度)と呼ばれます。犬と泥棒の例で言えば、「泥棒が来た時に犬が吠える」確率(そして「泥棒がいない時に犬が吠えない」確率です。犬を警報機と考えれば、文字通り警報機の精度にあたります。
では、この場合フリストンが主張した「自己組織化システムはその自由エネルギーを最小にしなければならない」とはどういうことでしょうか。変形2では、自由エネルギーを下げるためには、(8)式の第1項と第2項を下げなければならないということになります。第2項については、精度をあげることになるので納得感があると思います。しかし、第1項については、情報利得を下げなければならないというのが、一見奇異に感じないでしょうか。しかし、次のように考えれば納得できるのではないかと思います。変形1では、内部モデルを更新することが、自由エネルギーを下げることになりました。内部モデルを更新すれば、推定値q(x)との差は縮小します(元々差を縮めるように内部モデルを変更したのです)。この縮小した差に対応して得られるのが情報利得です(2022/11/17追加)。差が縮小すれば、新たに得られるであろう情報利得は減少することになります。つまり、情報利得が減少するということは、モデルが真実に近づいていることに他なりません。例えを使えば、何かの本を読み始めた時点では、「先の楽しみ」はたくさん残っているが、読み進むうちに「先の楽しみ」は減ってくるということになるかと思います。
最後に、accuracyの反対は、「不正確さ(精度が低い)」になりますが、「不正確さ」と「不確実さ」および「複雑さ」の違いにご注意ください。「不確実さ」は、「複雑さ」と「不正確さ」の両方から成り立つ概念です。このことは、次回以降の解説で重要になってくるので、注意しておいてください。(2022/11/3 図8 追加変更 : inaccuracy にAmbiguity を追加)
ところで、警報機や精度といえば、信号検出理論が思い浮かんだ方もいると思います。前回q(x)の最初の説明が誤っており(修正済み)混乱させたしまったかと思います。言い訳ですがq(x)は簡単なようで説明が難しいので、コラム2で信号検出理論の用語と分割表による説明をしてみたいと思います。
これで、ひとまず変形2の説明を終わりたいと思います。まとめれば、自己組織化システムは、正確に、かつ真実に近づく(情報利得が減少する)ことにより、自由エネルギーを下げることを求められるということになるかと思います。
前回と今回で定義式から2つの変形を通して、自由エネルギーを減らす方法を見てきました。しかし、本当に自由エネルギーは減らすだけでよいのでしょうか。逆説的ですが、もし減らし切ってしまったら、もう減らす自由エネルギーは残っておらず、減らすことはできなくなります。次回はこの問題を考えていきたいと思います。(区切りの良さから今回はコラムにウェイトがかかり、本文が物足りなかったかもしれません。ただ、ここまで説明してきたことを信号検出理論という別の観点から見ると理解が進むと思いますので、ぜひコラムもお読みいただければと思います。)
参考文献
Friston, K. J. (2010) The free-energy principle: a unified brain theory?
磯村拓哉 自由エネルギー (2022) 脳科学辞典
自由エネルギー原理 - 脳科学辞典 (neuroinf.jp)
磯村拓哉 自由エネルギー原理の解説 (2018) 日本神経回路学会誌
https://www.jstage.jst.go.jp/article/jnns/25/3/25_71/_pdf
HEADBOOST「確率分布を誰でも理解できるようにわかりやすく解説」
https://www.headboost.jp/what-is-probability-distribution/
乾 敏郎 感情とはそもそも何なのか (2018) ミネルヴァ書房
乾 敏郎 坂口 豊 脳の大統一理論 (2020) 岩波書店
乾 敏郎 坂口 豊 自由エネルギー原理入門 岩波書店 (2021)
Thomas Parr, Giovanni Pezzulo, Karl J. Friston (2022) Active Inference
( 乾 敏郎(訳)能動的推論 (2022) )
国里愛彦 他 計算論的精神医学 (2019) 勁草書房
コラム2: 信号検出理論
信号検出理論全般については説明する余裕はありませんが、信号処理理論の用語と分割表を使って説明します。図9をご覧ください。今まで使ってきた犬と泥棒の例を示しています。「犬が吠えて泥棒がいる」のをhit、「犬が吠えず泥棒がいる」のをmiss、「犬が吠えて泥棒がいない」のをfalse alarm、「犬が吠えず泥棒がいない」のをcorrect rejectionと呼びます。hitとcorrect rejectionはそれぞれいわば正しい反応ですが、false alarmは偽陽性であり、統計学では第1種の過誤(あわて者の過誤)と言います。missは偽陰性であり、統計学では第2種の過誤(うっかり者の過誤)と言います。
図10は実際に仮の数字を入れたものです。「泥棒がいる」確率が0.1と推定されているとします。また、「泥棒がいる」時に「犬が吠える」(hit) 確率を0.8、「泥棒がいない」時に「犬が吠える」(false alarm) 確率を0.3とします。すると分割表の縦の周辺尤度(犬が吠える)は、0.1×0.8+0.9×0.3=0.35となります。
次に図11を見てください。これは、hit, miss, false alarm,
correct rejection のマスの確率を縦%で示したものです。例えばhitは図10から0.1×0.8=0.08(全確率)を得て、これを縦の周辺尤度0.35で割ったもので約0.229となります。この0.229が新たな(泥棒がいる)推定値となります。
さらにこの新たな(泥棒がいる)推定値0.229を、最初の推定値0.1の代わりに使って同様の計算をしたものが、図12です。泥棒がいる推定値は0.442となりました。
推定値は犬が吠えるたびに0.1→0.229→0.442と増加します。
ただし、このケースでは、泥棒がいるときの犬のhit率、泥棒がいない時の犬のcorrect rejection率が固定されていることに注意してください(つまり犬の正確さ=精度は一定のものとしています)。犬が吠えた時に(他の方法で)実際に泥棒がいるかどうか確かめてはいません。他の方法(例えば外に行ってみる)で泥棒がいるかどうか確かめることは能動的推論に当たります。
自由エネルギー原理について誰でもわかる、明快かつ深い解説 -3-
公開しました。