
自由エネルギー原理による株投資の分析
または株投資を例とした自由エネルギーと期待自由エネルギーの数式を使わない理解
たくさんのみなさんに読んで欲しかったので、あえて優良誤認(商品の品質を実際より優れていると示す)気味のタイトルをつけてしまいました。
実は、これから紹介するのはあくまで株投資の分析であって必勝法ではありません。私は株に限らずギャンブルに必勝法はないと思います。そして実は視野を拡げれば株やギャンブルのみならず生命体や種、人生も然りだと思います。しかしながら必勝法のないこの世界でどう行動していくか、そのメカニズムを自由エネルギー原理で説明してみたいと思います。
フリストンの自由エネルギー原理 (A theory of cortical responses, Friston, K. J., 2006)は、脳の大統一理論とも言われていますが、熱力学というマクロの領域におけるヘルムホルツの自由エネルギーを、ミクロな情報理論から考察していること、また一見複雑に見える数式のため、慣れないと理解が進まないことがあります。特に期待自由エネルギーは、時間軸と因果の逆転から(ここは後に詳解します)難解ではあります。
そこで本稿では、よりなじみのある方が多い株投資を例として考えてみたいと思いました。本質を考えるために信用取引とか、レバレッジ、デリバティブ等ややこしいものは除き簡単な例で考えます。売買手数料もとりあえず無視します。
さて私が言うまでもなく、このような簡単な例で言えば、株は安い時に買って高い時に売れば儲かります。問題は今、目の前の株が高いのか安いのかです。もう少し正確に言うと目の前の株が今後上がるのか下がるのかです。つまり未来の株価を予測して、株を買ったり売ったりするわけです。少し専門的になりますが、ある株の株価が高いのか安いのかを判断する手法のうち、有名なものの1つは、PER(Price Earnings Ratio)と呼ばれるものです。PERは日本語で株価収益率を指し、1株あたりの純利益に対して株価が何倍であるかを測る指標です。PERが低ければ利益に対して株価が割安で株価に上昇余地がある、PERが高ければ相対的に上昇余地が少なく、場合によっては下降する可能性があるという風に使います。
上昇余地や下降可能性、つまり未来の予測は当たる時もあれば外れる時もあります。この予測と未来における実際の株価の差を自由エネルギー原理における予測誤差として考えてみます。
自由エネルギー原理については、
・自由エネルギー原理について誰でもわかる。明快かつ深い解説 -1- ~ -5-
のシリーズでも書いていますので、数式を含んだ情報理論面を知りたい方はご参照ください。これに対して本記事で一切数式は使いません。
さて、自由エネルギー原理では人間をはじめとするエージェントは、予測誤差を減らすように振る舞うとされています。株の売買で言えば、投資家は投資家がそれまでの経験から得た予測モデルに従い未来の株価を推定(上がるか上がらないか、いつごろまでにどのくらい変動するか)します。この推定株価と未来における実際の株価の差が予測誤差となります。
この誤差をできるだけ小さくすることが投資家の目標です。上がると思って買った株の株価が順調に上がれば予測誤差は縮小します。この時自由エネルギーが減少します。株価が当初予測した価格に達すれば、予測誤差は0となり、自由エネルギーは最小になります。目標達成です。
ただし、株取引を1回だけ行って満足し、以降取引を行わない人は非常に稀でしょう。もしこのような人がいたとしたら、この人は株取引に関しては暗室問題 (Dark Room Problem) に陥ったと言えます。暗室問題とは強化学習の言葉ですが、もし株取引で言えば自由エネルギーの最小化だけが目指された時、以降予測誤差が生じないように株取引を行わないことが、最も適応的であるという問題になります。これは極言すれば、そもそも株を買わないことであり、株を買わない人はたくさんいます。しかし、人生は、すべての人にとってすでに始まっている(株を買っている)ものですから、暗室問題は人生の継続を困難にする重大な問題です。
この暗室問題を根本的に解決するのが期待自由エネルギー (The free energy principle: a rough guide to the brain, Friston, K. J., 2009) です。
期待自由エネルギーは、未来の自由エネルギーであり、自由エネルギーが現在の予測誤差を最小にする指標であるのに対して、期待自由エネルギーは未来の予測誤差を最小にするための指標です。期待自由エネルギーは未来の予測誤差を最小にするために、現在の行動や意思決定を最適化するプロセスです。つまり、期待自由エネルギーの原点は未来にあり、これに対する現在を考えるという、時間軸に関して自由エネルギーとは逆向きの関係にあります(retrodiction)。期待自由エネルギー原理については、下記もご参照ください。
・自由エネルギー原理について誰でもわかる。明快かつ深い解説 -4-
・期待自由エネルギーと万有引力による位置エネルギーは圏同型-高校生でもわかる期待自由エネルギー
さて、さきほどとは逆に株価が思ったほど上がらなければ、予測誤差は拡大し、自由エネルギーは増加します。この株の持ち主にとっては望ましくない状況です。しかし、現在この株を持っておらず、株式を物色中の人にとってはどうでしょうか。株価が下がっているのはチャンスと呼べる状況とも言えます。もちろんより下がる可能性もありますが、今後回復して上がる可能性を考えれば下がった時は買いのチャンスなのです。
整理すると、成果(outcome)を現在に求める株の持ち主にとっては、値下がりは自由エネルギーを増加させる歓迎せざる事態ですが、成果を未来に求める現在この株を持っていない人にとっては、今この株を買えば未来の自由エネルギーつまり期待自由エネルギーが下がる可能性があるのです。
最初に申したように株の基本は、「安い時に買って高い時に売る」です(今は余計なことですが空売りやリバースファンドは逆)。つまり、持ち主(ホルダー)にとっては株価が高いほどよく、購入希望者にとっては安いほど良いのです。
持ち主(ホルダー)にとって、株価が高いということは(現在の)自由エネルギーが低いこと、購入希望者にとって現在の株価が安いということは、期待自由エネルギー(=未来の自由エネルギー)の下げ幅が大きくなることが期待できます。
つまり、いずれもFristonが最初に行ったように自由エネルギーを下げることが望まれるわけです。ただし、前向き(prediction) の自由エネルギーと後向き(retrodiction)の期待自由エネルギーでは、(南に1km進むことが北に-1km進むことと同じであるように)符号が反転する点に注意が必要です。
フリストンが、「環境と平衡状態にある自己組織化システムは、その自由エネルギーを最小にしなければならない」と言った時の自由エネルギーには、(変分)自由エネルギーだけでなく、期待自由エネルギーも含みます。従って下げるべき自由エネルギーは未来も考慮すれば、期待自由エネルギーの場合もあります。これが暗室問題から脱出する鍵になります。
強化学習に搾取と探索のトレードオフ(the trade-off between exploitation and exploration)という問題があります。私たちがいる世界を主体の側から見たものを環世界と言いますが、この環世界で(変分)自由エネルギーの極小化を目指すことは搾取(利用)にあたります。しかし利用のみを志向していては、やがて暗室問題に陥ります。ところが、生命体、あるいは種は、それまでの環境にとどまらずに、未来に向けて環世界を広げるという傾向を持っています。これは、期待自由エネルギーが下がるような方策(policy)をとることであり、これが探索です。この探索への志向が暗室問題を回避するのです。ただし、一般に探索行動は利用行動を妨げることが多く、逆に利用行動は探索行動を妨げます、これが探索と利用のトレードオフです。
人間が未来に向けて環世界を広げるという傾向は、ポジティブ心理学者のバーバラ・フレドリクソン (Fredrickson, Barbara 2001)。が提唱している理論です 。フレドリクソンは人間がポジティブな状態にあるとき(=利用が満たされているとき)におきる拡張効果について実験をし、拡張形成理論(Boerden-and-build theory)を発表しました。
このように暗室問題の回避、ならびに利用と探索のジレンマへの回答も、自由エネルギー原理から説明でき、そのためには期待自由エネルギーという見方を導入する必要があるのです。

①(変分)自由エネルギーは利用で下がる。②そこで次のエネルギー源を求める。③探索行動で期待自由エネルギーが下がる。④探索の結果を次のエネルギー源として利用する。
(変分)自由エネルギーは時間に順行し、期待エネルギーは時間軸の未来から現在を見ているので時間に逆行している。
参考文献
A theory of cortical responses, Friston, K. J., 2006
The free energy principle: a rough guide to the brain, Friston, K. J., 2009
乾 敏郎 坂口 豊 自由エネルギー原理入門 (2021) 岩波書店
Thomas Parr, Giovanni Pezzulo, Karl J. Friston (2022) Active Inference( 乾 敏郎(訳)能動的推論 (2022) )
The role of positive emotions in positive psychology: The broaden-and-build theory of positive emotions, Fredrickson, B. L., 2001