スキーマを広げる(7):ゲーム理論
囚人のジレンマ
▼いきなりですが,あなたと私は共同で犯罪を犯し,監獄に入れられることになった囚人です(笑)。それぞれ別の部屋で取り調べを受けています。そして,監獄の所長から次のような取引を持ち掛けられます。
「お前ら二人が黙秘し続けていれば,証拠不十分だから釈放してやるよ。でも,お前が黙っていても,あいつが自白したら,お前の罪は重くなるぞ…。懲役50年だ。その場合,あいつは先に自白したから罪を軽くしてやる。うん,懲役10年だ。おっと,お前ら二人とも自白した場合は,二人とも懲役15年な。」
▼これを整理すると以下のようになります。
①あなた=黙秘/私=黙秘
⇒二人とも無罪放免(懲役0年)。
②あなた=黙秘/私=自白
⇒あなたは懲役50年。私は懲役10年。
③あなた=自白/私=黙秘
⇒あなたは懲役10年。私は懲役50年。
④あなた=自白/私=自白
⇒二人とも懲役15年。
▼さて,懲役の年数で考えて,あなたと私のそれぞれにとって,都合の良い選択肢を順番に並べ替えてみましょう。
あなた:①(0年)→③(10年)→④(15年)→②(50年)
私 :①(0年)→②(10年)→④(15年)→④(50年)
▼二人とも,①が一番いいに決まっていますね。しかし,ここでふと心に疑念が浮かびます。
「俺は意志が固いから黙秘できるけどよぉ,あいつがもし先に自白しちまったら…,俺だけ懲役50年かよ! あいつ,口が軽そうだからヤバいな…」
▼当然,相手も同じように考えます。そして,疑心暗鬼となり,その結果,二人とも我先にと自白してしまい,④の懲役15年という状況が成立してしまうのです。
▼これは「囚人のジレンマ」と呼ばれるもので,ゲーム理論(game theory)の一つです。
ゲーム理論の出題例
▼ゲーム理論については,2004年度のセンター試験追試験第3問A問題で次のような英文が出題されています。
Game theory is a branch of mathematics that examines competitive situations, such as card games and chess matches. Although luck can be involved in a game, the result depends not only on what one player does but also on what all the others do. Thus , each player tries to guess the other players' next moves in order to determine his or her own best choice. Game theory, then, studies how the result of a game depends on one's own choices and on the choices made by the other players, as well as on chance in some cases.
(ゲーム理論とは,トランプやチェスの試合などのような競争的な状況を検証する数学の一部である。ゲームには運も含まれるが,その結果は一人のプレイヤーが行うことだけでなく,その他全員が行うことにも左右される。従って,各プレイヤーは自分の最善の選択を決定するために,その他のプレイヤーの次の動きを推測しようとする。そこで,ゲーム理論は,ゲームの結果がいくつかの場合には運に左右されるが,それだけでなく,自分自身の選択や他のプレイヤーによってなされる選択にどのように左右されるかを検証するのである。)
▼また,2020年青山学院大学経営学部第1問や2020年度慶應義塾大学看護医療学部第2問でも出題されたほか,冒頭で取り上げた囚人のジレンマについては,2003年度東京大学後期日程総合科目Ⅰ[理系]などでも出題されています。それぞれの英文の出典は以下の通りです。
・2020年度青山学院大学経営学部第1問出典
Steven D. Levitt, Stephen J. Dubner, Think Like a Freak: Secrets of the Rogue Economist, Penguin UK, 2014, Chapter 7
(ちなみに,出題された英文はソロモン王とヴァン・ヘイレンのデヴィッド・リー・ロスの共通点は何か,という部分で,とりわけ後者についてはなかなか面白い内容ですので,入手できれば読んでみてください。)
・2020年度慶應義塾大学看護医療学部第2問出典
Rolf Dobelli, The Art of the Good Life: Clear Thinking for Business and a Better Life, Hachette UK, 2017, Chapter 10
・2003年度東京大学後期日程総合科目Ⅰ[理系]出典
Eric Rasmusen, Games and Information: An Introduction to Game Theory Third Edition, Blackwell, 2001, Chapter 1
ゲーム理論とは何か
▼2003年度に東京大学で出題された英文の冒頭では,ゲーム理論について次のように定義がなされていました。
Game theory is concerned with the actions of decision makers who are conscious that their actions affect each other.
(ゲーム理論とは,自分たちの行動がお互いに影響を与えるということを意識している意思決定者の行動にかかわるものである。)
(Eric Rasmusen, Games and Information: An Introduction to Game Theory Third Edition, Blackwell, 2001, p.11)
▼ゲーム理論とは,冒頭の囚人のジレンマのように,自分が何かを決定する際に,相手の出方(についての予測)次第でどのような決定を下すのかが左右されるような行動モデル(戦略的状況:strategic situations)を対象とした理論のことです。数学者のジョン・フォン・ノイマン(John von Neumann,1903年12月28日 ー1957年2月8日)と,経済学者のオスカー・モルゲンシュテルン(Oskar Morgenstern,1902年1月24日ー1977年7月26日)が共著の本『ゲームの理論と経済行動』(Theory of Games and Economic Behaviour,1944年)で提唱したのが始まりとされています。
▼もともとは経済学における人間の行動モデルとして提唱されましたが,その後,社会学,経営学,法学,生物学,行動科学など様々な分野で用いられるようになりました。
パレート最適とナッシュ均衡
▼私たちは普段,自分にとって望ましい選択肢を選んで行動していると考えられます。しかし,その選択は必ずしも,自分のことだけを考えて選んでいるわけではありません。他者がどのような行動をとるかを考えて,それに応じて自分の選択を変えることがあります。
▼たとえば,初めてスマホを買う時,Android にするか iPhone にするか迷ったとしましょう。もちろん,自分の好きな方を選べばよいのですが,仮に,自分の恋人が iPhone を持っていたとしたら「本当は Android が欲しかったけれど,彼(彼女)と同じスマホにすれば操作がわからないときに教えてもらえることになっているから,iPhone にしよう」と考え,iPhone を購入した結果,二人の満足度が高まる(=利益が最大になる),という結果になるかもしれません。
▼このように,自分の行動が必ずしも自分の好み(preference:選好)だけで決定されているわけではない,ということは日常においてよくあるはずです。そして,このように二者にとって利益が最大になった状態のことをパレート最適(Paretian optimum)と呼びます。また,自分の選択を変えると利益が最大にならない状態,つまり,これ以上自分の選択を変えることのない安定した状態のことを,ナッシュ均衡(Nash equilibrium)と呼びます。
▼囚人のジレンマのように,互いが独立して協力することができない状態,つまり,非協力ゲーム(noncooperative game)においては,ナッシュ均衡とパレート最適の間で矛盾が生じます。
▼先ほど見たように,二人とも黙秘すれば証拠不十分で二人とも無罪放免というパレート最適が得られるはずであるにもかかわらず,相手が自白して自分だけ黙秘したら自分にきわめて不利な状態が訪れるため,結果的には二人とも自白して懲役15年になります(ナッシュ均衡)。
▼このように,個人が自分にとって合理的な選択を行った結果であるナッシュ均衡と,集団全体にとっては望ましい結果であるパレート最適が矛盾することを「ジレンマ」と呼んでいるわけです。