じゃんけんにおける非自明な統計的振る舞い【統計力学の不思議世界探索】#26

きょうはじゃんけんをするよ。
グー、チョキ、パーのうちすきな手をえらんで100万回くらいしょうぶをしてみよう!

統計力学の不思議世界探索、今回紹介する論文はこちら。
(今回も最新ではなく、むしろ古典と言ってもいい2001年の論文です。)
Rock–scissors–paper and the survival of the weakest
じゃんけんと最弱集団の生き残りhttps://homepages.ecs.vuw.ac.nz/~marcus/manuscripts/RSP.pdf

十分に大きなN人の集団があり、全員がそれぞれ、常にこれを出すというじゃんけんの手を決めているとする。N人のうちからランダムに2人選び、じゃんけんをさせて勝負がついた場合、グーが勝ったら確率Prで、チョキが勝ったら確率Psで、パーが勝ったら確率Ppで、負けたほうも同じ意見に染まるとする。あいこの場合は何も起きないとする。それぞれの確率の違いによって、各手に"強さ"の違いがあると解釈できる。(この確率の要素が入ると、じゃんけんというより、生態系の捕食-被捕食の関係と考えたほうがわかりやすいかもしれない。植物と草食動物と肉食動物の関係が概ねそれと考えられる。草食動物は植物を食べ、肉食動物は草食動物を食べ、肉食動物は植物に囲まれると食料となる草食動物がいなくなって死ぬ。↓この動画シリーズがわかりやすいかもしれない。https://www.nicovideo.jp/watch/sm25844619

そして各捕食は、出会ったら100%成功するわけではないし、捕食の成功確率の高さは"強さ"と解釈できる。)
N人からランダムに2人選んで勝負させるのをN×1万回くらい繰り返す。グー、チョキ、パーそれぞれの人口を$${n_r}$$, $${n_s}$$, $${n_p}$$とすると、それぞれの時間変化は平均的には次のように書ける。
$${\frac{dn_r}{dt}=n_r(n_sP_r-n_pP_p)}$$
$${\frac{dn_s}{dt}=n_s(n_pP_s-n_rP_r)}$$
$${\frac{dn_p}{dt}=n_p(n_rP_p-n_sP_s)}$$, (1)
それぞれ右辺1項目は、勝てる相手と出会った場合に人口が増え、2項目は負ける相手と出会った場合に人口が減るという意味である。
この微分方程式を解くと、図1aのように人口の時間変化の軌道を描くことができる。軌道は次のようなλの値によって決まる。
$${\lambda=(\frac{n_r}{R})^R(\frac{n_s}{S})^S(\frac{n_p}{P})^P}$$
R, S, Pはそれぞれ固定点の座標で、次のように求まる。
$${R=\alpha P_s}$$, $${S=\alpha P_p}$$, $${P=\alpha P_r}$$, $${\alpha=\frac{1}{P_r+P_s+P_p}}$$, (2)
λは0~1の値を取り、λ=1は3種とも人口の変化がない固定点(どの種も増える速さと減る速さが平衡している動的平衡の状態)、λ=0はいずれかの1種類だけになる絶滅パターン、その間の値なら図1aのようなグーが多い時期、パーが多い時期、チョキが多い時期を繰り返す周回軌道を描く。λが1から小さくなっていくと、同心円状に各軌道は重ならず玉ねぎ状に大きくなっていき、外側の三角形に近づく。固定点の位置によって、軌道全体での人口の偏りもその方向に引きずられる。
注目すべきは、固定点の人口は自らの強さではなく、勝てる相手の強さによって決まる。結果として、最も強い種が最も高い定点個体数を持つことはない。さらに、2つの種の強さが一定であれば、3番目の種の強さが低下すると、その種の定点個体数が増加する。これが、直観に反する最弱集団の生き残りである。


図1 個体数の変化 頂点に近いほどその個体数が多い
a. 微分方程式(1)から求まる軌道
b. 固定点近くからシミュレーションした実際の軌道
c. 各点からスタートしどこに落ち着くかを色で図示 赤はグー、青はチョキ、黄色はパー

図1bは、微分方程式ではなくN=1000人の集団でランダムに2人選んで勝負させるのを繰り返すのをシミュレーションして人口の変動を記録した結果である。実際には、2人組を選ぶときのランダム要素によって軌道はぶれ、中心付近から始めても螺旋を描いて軌道は大きくなり(人口変動は激しくなり)、最終的に全員グーになり、チョキとパーは絶滅してしまった。
図1cは、3種の強さが等しい場合、bのようなシミュレーションを三角形の中の各点から行い、最終的にどこに落ち着くかを図示したものである。

ここまでは平均場近似の(N人全員が、他の全員と勝負する可能性がある)場合であったが、ここからは2次元格子モデルを考える。
2次元格子状にr, s, pいずれかの状態のセルが敷き詰められているとする。縦横斜め8方向が隣り合っているとし、いずれかのペアをランダムに選んで勝負するのを繰り返す。
8近傍のみと反応する格子モデルでは、局所的に上述のような絶滅が起こっても、別のところで生き残ることがよくある。その効果によって、人口の変動は図2aのように逆に固定点に近づいて、変動が小さく安定していくようになる。固定点は上述の式(2)で求められる点と同じ座標である。
また、空間的パターンとしても面白いものがみられる。

図2 a. 2次元格子モデルでの典型的な人口変動の軌道パターン ★が初期位置
b~c 各種の強さを変えたときの500×500格子全体の様子 赤はグー、青はチョキ、黄色はパー
b. Pr=0.33, Ps=0.33, Pp=0.33 c. Pr=0.1, Ps=0.1, Pp=0.8 d. Pr=0.05, Ps=0.475, Pp=0.475
e. 各種の強さを各頂点に取り、チョキの人口の平均を色と等高線で図示 各種の強さは0.08以上(それ以下のものがあると変化が遅すぎて500×500のグリッドでは有意なデータは取れなくなる)

図2bでは、3種の強さは等しいために個体数100~1000程度の比較的均等な集団があちこちにできる。cでは、パーだけが圧倒的に強いために(固定点の座標の式(2)より)チョキの人口が一番多く、他は大きな孤島ができるパターンとなる。dでは、グーだけが圧倒的に弱いためにパーの人口が少なく、細い前線のような構造になっている。
eでは、各種の強さ三角形の座標のあらゆる点で変えてみて、人口変動が落ち着くときのチョキの人口を示したものである。固定点の座標の式(2)の通り、チョキの人口はパーの強さに比例するというのが見て取れる。0.7や0.2の等高線が右上がりになっているのは、右に行くとチョキが強くなり、それによってグーが増える効果が巡ってパーを減らしてしまうため、この図の右側は値が低くなるのである。ただしそれは、3頂点に近い(圧倒的に強いものがいる)場合の大きな孤島ができるパターンの時に、例外的に人口変動が大きくなる時のみである。頂点からある程度離れればかなりきれいに式(2)の通りである。

最後に、強さが適切な値になるように進化的に変化させてみる。
Pr=0.05, Ps=0.5, Pp=0.3から始めて、グーのみ進化させる。チョキに勝って新たにセルをグーにするとき、その新たなセルの強さは、勝ったグーの強さに±0.01の間のランダムな変動を入れる。そうしてシミュレーションを進めれば弱すぎるグーは広まらず、逆に強すぎるグーは式(2)により淘汰され、ちょうどいい強さに落ち着くだろうという実験である。その結果が図3。

図3 グーの強さ(competitiveness)と人口の時間変化
横軸は、ランダムに勝負させるのを全人口と同じ回数するのを1epochとする

人口は減るものの、かなり強く進化した。Ps=0.5, Pp=0.3に対してはPr=0.9もの強さが適切な強さとして動的平衡に至っている。

本論文のモデルは、じゃんけんを統計的にしてみるという動機ではなく、生態系のシミュレーション実験から、単純な三つ巴モデルが導入されることによって作られたものである。一般に、三つ巴のような競合があるシステムでは、ある種をコントロールしようとする素朴な試みは、意図したものとは正反対の効果をもたらすことがある。じゃんけんモデルは多人数の囚人のジレンマの1例であり、より攻撃的な戦略がより少ない総個体数の中でより大きなシェアを獲得する。囚人のジレンマの影響を示す最近の生態学的な例として、アルゼンチンアリの研究がある。もし、じゃんけんをしている3つの種がすべて進化すれば、強さはすべて同じになり、各種は最大限の攻撃によって資源の均等な分配を達成するようになる。囚人のジレンマは通常、種内競争が生態系の崩壊につながる「コモンズの悲劇」(Hardin 1968)と関連している。しかし、本論文のモデルでは、3つの個体群の間でバランスが保たれるというこれまた直観に反する興味深い結果が導かれる。

最後まで読んでいただきありがとうございます。気に入っていただけたら「スキ」ボタンを押したりフォローしたりしていただけますと私のモチベが上がります。内容についての質問や感想もお待ちしております。
また、研究機関には所属せずにやっておりますので、有料ジャーナルのアクセス料程度のサポートをいただけるとありがたいですし、今後の記事の質が上がるかもしれません。どうぞよろしくお願いいたします。

この記事が気に入ったらサポートをしてみませんか?