択ゲーのキホン!2×2問題をゲーム理論で考える
挨拶
お久しぶりの投稿です。もともとゲーム理論詳しくないのもあって数か月触って無かったら計算のやり方が怪しくなりつつあるぴらんです。計算のやり方が記憶の彼方なので、今回はもっとも基本的な択ゲーである、自分は2択相手も2択のゲームについてみっちり調べていこうと思います。
要約
最も基本的な択である2×2ゲームについて調べました。ミニマックス戦略を計算し、どのような選択肢を取るのが最適か、その時にどのような勝率になるか調べました。結果としてなるべく安定択を重点的に選ぶのが良いことがわかりました。
初めに
なんで択について調べるの?
「相手がAを出すと読んだからあの選択肢選んだけど、B出されて負けた。Aとわかっていればこの選択肢選んで勝てたのに~」、こういう状況は読み合いの概念があるゲームでは誰しも経験したことがあると思います。
こういう択になっている状況の勝敗をただ噛み合いが良かった/悪かったですませるのではなく、確率を使って考えることで意外と相手が合理的な選択肢を取っていることに気づけたり、勝率を高めるための方法を考えたりすることができるかもしれません。
いきなり実践的に色んなものを考慮した理論を考えるのは難しいので最も簡単な択ゲーから考えます。
最も単純な択ゲーとは
一番基本的な択になる状況とはどのような状況か考えてみましょう。自分の選択肢が一つだけだと手の出し方に悩みようがないので 自分が出せる選択肢は二つは必要です。また、相手の手が一つだけだと自分の最適手が確定してしまって同じく択になりません。したがって自分の手が二つ、相手の手が二つの2×2ゲームが最も単純な択になっている状況だといえます。
さらにいうと見かけ上2×2でも選択肢がグーとグーの下位互換の手グー’しかない、みたいな状況では実質的にグーしか出せなくなるので、択になるためには二つの選択肢が他方の下位互換になっていないという条件が必要になります(条件1:下位互換はダメ)。
問題設定
以上の条件を数式で表して知りたい問題を明確にします。
自分の選択肢が「上」と「下」の2択、相手の選択肢が「右」と「左」の2択であるとします。勝敗は自分か相手のどちらかが勝つしかないとし、自分と相手の出した手に応じて確率で勝ち負けが決まるとします。相手の勝率は100%-自分の勝率で出せるので、以後「勝率」は自分の勝率のことを指すこととします。
自分が上かつ相手が左を出した時の勝率をa、自分が下かつ相手が左を出した時の勝率をb、というように定めていって次のような行列で勝率が表せていることにします。
$$
\def\arraystretch{1.5}
\begin{array}{c|cc}
& 左 & 右 \\ \hline
上 & a & c \\
下 & b & d
\end{array}
$$
この時条件1(下位互換にならない条件)について考えましょう。選択肢上が選択肢下の下位互換にならず、かつ下が上の下位互換にならない条件はa-bとc-dの正負が逆になっていることです。つまり$${ (a-b)(c-d)<0 }$$です。
同様に右と左が下位互換にならないための条件は$${ (a-c)(b-d)<0 }$$
自分は勝率を最大化するように上下を出す比率を決定し、相手は勝率を最小化するように左右を出す比率を決定します。この時の勝率と選択肢を選ぶ比率を計算します。
計算
問題の単純化
上VS右の勝率を基準としてそこからの差分を考えることで計算を単純化できます。つまり以下の行列でゲームを考えた上で最終的な勝率には基準の勝率cを加えるという計算をします。
$$
\def\arraystretch{1.5}
\begin{array}{c|cc}
& 左 & 右 \\ \hline
上 & a-c & 0\\
下 & b-c & d-c
\end{array}
$$
$${ a'=a-c, b'=b-c, d'=d-c }$$と置きます。
$$
\def\arraystretch{1.5}
\begin{array}{c|cc}
& 左 & 右 \\ \hline
上 & a' & 0\\
下 & b'& d'
\end{array}
$$
条件1は$${(a'-b')d'>0}$$となります。
ミニマックス戦略の計算
上を出す比率を$${x}$$とします。この時相手が左を出した時の勝率は$${a'x+b'(1-x)}$$、右を出した時の勝率は$${d'(1-x)}$$となります。相手はこちらの勝率を最小化しようと動くので、$${a'x+b'(1-x)}$$と$${d'(1-x)}$$の低い方がこちらの勝率になるように選ばれます。
具体的にはxの値(=自分が上下をどのような比率で出すか)によって値が変わり、↓図の実戦部のようになります。
なお、グラフの傾きや切片はabcdによって異なりますが、条件1によってxが0~1の区間に交点を持ってそこで勝率最大になることは保証されています。
つまり$${a'x+b'(1-x)}$$と$${d'(1-x)}$$の交点、$${a'x+b'(1-x)=d'(1-x)}$$が成り立つような$${x}$$が適切な選択肢の比率になります。これを解くと$${x=\frac{d'-b'}{a'-b'+d'}}$$であり、比率は上:下=d'-b':a'となります。
勝率の計算
上述の戦略の時、勝率は$${a'x+b'(1-x)}$$か$${d'(1-x)}$$に計算した$${x}$$を代入して次になります。ここで、この勝率は上vs右を基準にした計算であったことは注意する必要があります。
$$
勝率(上VS右との差分)=d'(1-\frac{d'-b'}{a'-b'+d'})\\
=\frac{a'd'}{a'-b'+d'}
$$
元の問題に戻す
以上は上VS右を基準した相対的な計算だったので、これをもとに勝率の絶対値を計算します。上VS右の勝率はcの分を始めに引いていたので足し直します。
$$
勝率=c+\frac{a'd'}{a'-b'+d'}\\
=\frac{c(a-b-c+d)+(a-c)(d-c)}{a-b-c+d}\\
=\frac{ad-cb}{a-b-c+d}
$$
また上下の比率もcとの差分であるa'ではなく元のa等で表すと次のようになります。
$${x=\frac{d-b}{a-b-c+d}}$$
上:下=d-b:a-c
計算結果まとめ
以上の計算をまとめると次のようになります。
上下はd-b対a-cの比率で選択すると良い
上記の比率で出した場合、こちらの勝率は$${ \frac{ad-cb}{a-b-c+d} }$$
この時abcdは次のように定められています。
$$
\def\arraystretch{1.5}
\begin{array}{c|cc}
& 左 & 右 \\ \hline
上 & a & c \\
下 & b & d
\end{array}
$$
考察
上下の比率について
結果の数式がどういう意味をもっているか考えていきます。
上下の比率はd-bとa-cの比率で決まっていました。d-bは何かというと下の選択肢を選んだ時に相手の二つの選択肢で勝率がどれだけ変わるかを表しており、下がローリスクローリターンな安定択であるほどb-dは小さくなります。同様にa-cは選択肢上がハイリスクハイリターンな択であればあるほど高く、ローリスクローリターンな選択肢であるほど低くなります。
上:下がb-d:a-cですので下が安定択であればb-dが小さくなり、上の比率が下がります。つまり安定択があるとそれと逆の選択肢の比率がへり、高確率で安定択を選ぶような戦略が最適な戦略となります。
つまり端的に言い切ると「安定択を選びましょう」が結論となります。ただし、他方の選択肢の比率も0とはなっていないことに注意が必要です。たまにはリスクの高い択を選びましょう。
定量的には択ごとの安定性に比例した形で選択するのがふさわしいです。複雑な関数でなく比例という形であることは今後複雑な問題に取り組む際には重要になってくる点かと思います。
勝率について
勝率の関数を見て見ると、分母分子ともに対角成分が大きくなるほど大きくなり、非対角成分が大きくなるほど小さくなる関数形をしています。これだとどのような時に勝率が大きくなるか、非常に日本語にしにくいです。いい表現があったら募集中とさせてください。
まとめ
最も単純な択ゲーである2×2ゲームについて計算を行い、勝率と選択肢の選び方について計算しました。また、計算結果の考察から安定択を重点的に選ぶのがよく、その安定択が相手の選択肢に影響を受けにくい、より安定した選択肢であるほど安定択を重点的に選ぶことが良いことがわかりました。