自由エネルギー原理の解説:知覚・行動・他者の思考の推論 2
自由エネルギー原理についての論文の概要
この論文は、自由エネルギー原理という脳の認知機能を説明するための理論について解説しています。この理論は、脳が外界の事象を理解し予測するために、生成モデルと呼ばれる内部モデルを利用すると仮定しています。そして、脳はこの生成モデルを最適化することで、感覚入力のサプライズ(予測誤差)を最小化していると主張しています。
問題設定:外界の生成過程についての概要
脳の理解は、得られた感覚情報から「このぐらいの確率でこうだろう」と予測しているとのこと。これは天気予報と非常によく似ています。
天気予報では、気象衛星やアメダスなどの観測データ(感覚情報)を元に、過去の天気のデータや物理法則に基づいた天気予報モデル(脳内のモデル)を用いて、未来の天気を予測します。このとき、「今日の天気は晴れです」と断言するのではなく、「降水確率30%」のように、確率で表現することが多いですよね。
脳もこれと全く同じように、過去の経験(学習)を通して得られた情報や、外界の法則性などを脳内にモデルとして構築しています。そして、五感を通して得られた感覚情報と、この脳内モデルを照らし合わせることで、「今、目の前で起こっていることは、こういうことだろう」と予測し、理解していると考えられています。
天気予報の精度が、観測データの質や天気予報モデルの精度によって変わるように、脳の理解の精度も、感覚情報の質や脳内モデルの精度によって変化します。自由エネルギー原理では、脳は感覚入力のサプライズを最小化するように、常に脳内モデルを更新し続けているとされています。
解説
自由エネルギー原理によれば、生き物は外の世界から得られる情報(感覚入力)を基に、その背後にある隠れた仕組みや原因を脳内で推測しようとします。この推測のプロセスを表したものが「外界の生成過程」です。つまり、脳は外の世界を理解するために、外界がどのように情報を生み出しているかを内部でシミュレーションしているのです。
生成モデル:外界を模倣する脳内モデル
生物は、外界の生成過程と同様の構造を持つ生成モデルを脳内に構築していると仮定されています。 この生成モデルは、感覚入力を生成するメカニズムを表現しており、外部環境を脳内に再現しようとする試みと言えます。
鳥の歌声を聞くと、私たちの脳はその背後にある要素、つまり鳥の発声器官の状態や、鳥がなぜ歌っているのかという理由(求愛や縄張り宣言など)を推測します。このプロセスは、外界の情報を基に内部でシミュレーションを行い、外界を理解しようとする一種の想像や推論のようなものです。
具体的には、鳥の歌声という感覚入力を受け取ると、脳はその音のパターンや特徴を分析します。そして、それがどのようにして生じたのか、つまりどのような隠れ状態(鳥の発声器官の状態)や原因(理由)があるのかを推測します。この過程を通じて、私たちは外界の出来事を理解し、解釈することができます。
生成過程とは、外界の出来事を説明するためのモデルで、主に「隠れ変数」と「パラメータ」という2つの要素から成り立っています。
まず、「隠れ変数」とは、直接観察できないけれど、外界の状態を決める重要な要素です。隠れ変数には「隠れ状態」と「原因」が含まれます。「隠れ状態」は、例えば鳥の歌の場合、その歌の背後にある鳥の発声器官の状態を指します。一方、「原因」は、その隠れ状態がなぜ生じたのかという背景の要因を指します。例えば、鳥が歌う理由(求愛や縄張り宣言など)がこれに該当します。
次に、「パラメータ」は、隠れ変数同士の関係や、隠れ変数から感覚入力への変換を決める要素です。例えば、鳥の発声器官の構造や機能がこれに当たります。
具体例として、鳥の歌を考えてみましょう。鳥の歌声が聞こえる背景には、いくつかの要素が絡み合っています。鳥の発声器官の状態(声帯の振動パターン)が「隠れ状態」であり、鳥が歌う理由(求愛や縄張り宣言)が「原因」です。そして、鳥の発声器官の構造や機能が「パラメータ」となります。
これらの要素が組み合わさることで、鳥の歌声という感覚入力が生まれます。生き物はこの歌声を聞いて、脳の中で生成モデルを使い、鳥の発声器官の状態や歌う理由を推測します。つまり、脳は外界の情報を基に内部でシミュレーションを行い、外界を理解しようとするのです。
生成モデルの数式表現
ソースでは、生成過程を数式で表現しています。数式自体は複雑ですが、重要なのは、観測できる情報 (感覚入力) から、観測できない情報 (隠れ変数、パラメータ) を確率的に推論しようとしている点です。
シャノンエントロピー:情報量の尺度
シャノンエントロピーは、ある事象の不確実さを表す尺度です。ソースでは、において「感覚入力の予測困難さ」を意味するものとして、シャノンエントロピーという用語が登場します。
情報量と予測困難さの関係
情報量は、ある事象が起こったときに、それがどれだけ「意外性」を持つか、言い換えれば、それが起こることを事前にどれだけ予測することが難しかったかで決まります。シャノンエントロピーは、この情報量の概念を数学的に定義したものであり、事象の予測困難さを定量化することができます。
シャノンエントロピーの計算方法
事象xが起こる確率をp(x)とすると、その事象のシャノンエントロピーH(x)は、以下の式で計算されます。
シャノンエントロピーの値と意味
シャノンエントロピーの値は、その事象の不確実さを表しています。
シャノンエントロピーが小さい: 事象の予測が容易であることを意味します。
シャノンエントロピーが大きい: 事象の予測が困難であることを意味します。
自由エネルギー原理におけるシャノンエントロピー
自由エネルギー原理において、生物は感覚入力のシャノンエントロピーを最小化するように、自身の内部モデルや行動を最適化するとされています。
内部モデルの最適化: 過去の感覚入力に基づいて、将来の感覚入力をより正確に予測できるよう、内部モデルを調整します。
行動の最適化: 環境に働きかけることで、予測しやすい感覚入力が得られるように、行動を変化させます。
これらの最適化を通して、生物は外界の不確実性を低減し、より適応的な行動をとることが可能になります。
脳の働きを式で表す
この論文は、脳の働きを「自由エネルギー原理」という考え方を使って説明しようとしています。難しい数式がたくさん出てきますが、簡単に言うと、脳は世界で起こる出来事を理解するために、頭の中で予測を立てながら、その予測と実際の体験とのズレを減らすように働いているということを説明しようとしているのです。
この論文では、世界の出来事をコンピュータで計算できるように、数式を使って表しています。
例えば、「鳥が歌を歌っている」という出来事を考えてみましょう。
●鳥の体の状態(隠れ状態): 鳥の喉の筋肉の状態や、口ばしの開き具合など、外からは直接見ることができないけれど、歌声に影響を与えている要素があります。このような要素を「隠れ状態」と呼び、x という記号で表します。
●鳥の歌声(感覚入力): 私たちが耳で聞くことができる鳥の歌声は、「感覚入力」と呼び、s という記号で表します。
Dx = f(x, v, θ, a) + z
s = g(x, v, θ, a) + ω
これらの式は、どちらも鳥が歌を歌っている様子を説明するために使われています。
1. 隠れ状態の変化を表す式: Dx = f(x, v, θ, a) + z
この式は、鳥の体の状態(隠れ状態 x)が、時間とともにどのように変化するかを表しています。
●Dx: 隠れ状態 x が時間とともにどのように変化するかを表しています。例えば、鳥の歌声がだんだん大きくなっていく様子は、Dx で表されます。●f(x, v, θ, a): x がどのように変化するかを決めるルールを表しています。
●v: 鳥が歌を歌う理由など、なぜそのような状態になっているのかを表しています。
●θ: 鳥の体の特徴など、状態変化に関わる様々な要素を表しています。
●a: 鳥がどんな行動をとっているか表しています。
●z: 予期せぬ出来事や、計算では表せない細かい要素を表しています。
この式は、「鳥の体の状態の変化は、鳥の状態や行動、周りの環境などによって決まるんだよ」ということを表しています。
2. 感覚入力を表す式: s = g(x, v, θ, a) + ω
この式は、鳥の体の状態 (隠れ状態 x) から、私たちが耳にする鳥の歌声 (感覚入力 s) がどのようにして聞こえてくるのかを、数式で表したものです。
●g(x, v, θ, a): 鳥の体の状態 (隠れ状態 x) が、どのように変化して歌声 (感覚入力 s) になるのかを決めるルールを表しています。
●v: 鳥が歌を歌う理由など、なぜそのような状態になっているのかを表しています。
●θ: 鳥の体の特徴など、状態変化に関わる様々な要素を表しています。
●a: 鳥がどんな行動をとっているか表しています。
●ω: マイクの性能など、計算では表せない細かい要素を表しています。
この式は、「鳥の歌声は、鳥の体の状態や、歌を歌う理由、周りの環境などによって決まるんだよ」ということを表しています。
脳は予測と現実のズレを減らそうとする
私たちの脳は、鳥の歌声を聞くと、頭の中で「鳥はこういう状態で、こんな理由で歌っているから、次はこんな声で鳴くはずだ!」と予測を立てます。そして、実際に聞こえてきた歌声と予測を比べて、違っていたら予測を修正していきます。
このように、脳は、感覚入力 s から、直接見ることができない隠れ状態 x や、その背後にあるルールを推測することで、世界の仕組みを理解しようとしているのです。
ポイント: 重要なのは、私たちが世界から受け取る情報は感覚入力 s だけですが、脳は、その背後にある、直接見ることができない情報 (隠れ状態 x 、パラメータ θ など) を推測することで、世界を理解しようとしているという点です。
脳の不思議:鳥の歌を例に確率で考えよう!
p(s, u, θ|m) = p(s|x, v, θ, m)p(x|v, θ, m)p(v|m)p(θ|m)
この式は 脳が鳥の歌をどのように理解しているのか で考えます。
脳は、推理するために、様々な手がかりを使います。
p(s, u, θ|m): 脳が「外界の仕組みはこうなっている」という仮説 (m) を持っている時に、 歌声 (s) 、隠れ変数 (u) 、パラメータ (θ) が同時に起こる確率 を表します。
p(s|x, v, θ, m): 脳が仮説 (m) と鳥の状態 (x, v, θ) を知っている時に、 どんな歌声 (s) が聞こえるのか 、その確率を表します。
p(x|v, θ, m): 脳が仮説 (m) と鳥が歌っている理由 (v) と鳥の種類 (θ) を知っている時に、 鳥の体の状態 (x) はどうなるのか 、その確率を表します。
p(v|m): 脳が仮説 (m) を持っている時に、 鳥がどんな理由 (v) で歌っているのか 、その確率を表します。
p(θ|m): 脳が仮説 (m) を持っている時に、 どんな種類の鳥 (θ) がいるのか 、その確率を表します。
s (感覚入力): あなたの耳に届いた 鳥の歌声 そのものです。
u (隠れ変数): 鳥の歌声を形作る、目には見えない要素です。
x (隠れ状態): 鳥の 喉の筋肉の動き や 口ばしの開き具合 など、歌声に直接影響を与える体の状態です。
v (原因): 鳥が なぜ歌っているのか 、その理由です。仲間を呼んでいる、敵を威嚇しているなど、色々な理由が考えられます。
θ (パラメータ): 鳥の歌声の 高さ や リズム など、鳥の種類によって異なる特徴です。
m (モデル構造): 脳が鳥の歌声を理解するために使う、 外界の仕組みについての仮説 のようなものです。
まとめ
脳は、これらの確率を計算することで、 不完全な情報から、最も可能性の高い解釈を導き出している と考えられています。
このモデルは、鳥の歌声だけでなく、 視覚、聴覚、触覚など、様々な感覚情報処理 にも応用できると考えられています。