経済学のためのゲーム理論入門 1.5 練習問題 1.1節
1.1
標準型のゲームでは、各プレイヤーが同時に戦略を選択し、その組み合わせが各プレイヤーの利得を決定する。 $${n}$$ 人のプレイヤーがいるとき、各プレイヤーの戦略空間を $${S_{1}, …, S_{n}}$$、利得関数を $${u_{1}, …, u_{n}}$$ と定めることを $${n}$$ 人ゲームの標準型による表現といい、ゲームは以下の表式で表される。
$$
G = \left\lbrace S_{1}, …, S_{n}; u_{1}, …, u_{n} \right\rbrace
$$
他のプレイヤーのどんな戦略の組み合わせに対しても、プレイヤー $${i}$$ が戦略 $${s_{i}'}$$ を選択した場合の利得が戦略 $${s_{i}''}$$ を選択した場合の利得よりも厳密に小さい時、「戦略 $${s_{i}'}$$ が戦略 $${s_{i}''}$$ によって強く支配されている」という。
つまり、プレイヤー $${i}$$ 以外のプレイヤーのどんな戦略の組み合わせ $${\left(s_{1}, …, s_{i-1}, s_{i+1}, …, s_{n}\right)}$$ についても
$$
u_{i}\left(s_{1}, …, s_{i-1}, s_{i}', s_{i+1}, …, s_{n}\right) < u_{i}\left(s_{1}, …, s_{i-1}, s_{i}'', s_{i+1}, …, s_{n}\right)
$$
が成り立つことをいう。
各プレイヤー $${i}$$ の戦略 $${s_{i}^{*}}$$ が他の $${n-1}$$ 人のプレイヤーの選択する戦略 $${\left(s_{1}^{*}, …, s_{i-1}^{*}, s_{i+1}^{*}, …, s_{n}^{*}\right)}$$ への最適反応になっている時、戦略 $${\left(s_{1}^{*}, …, s_{n}^{*}\right)}$$ がナッシュ均衡であるという。
このとき、どんな戦略 $${s_{i}}$$ についても
$$
u_{i}\left(s_{1}^{*}, …, s_{i-1}^{*}, s_{i}^{*}, s_{i+1}^{*}, …, s_{n}^{*}\right) \geq u_{i}\left(s_{1}^{*}, …, s_{i-1}^{*}, s_{i}, s_{i+1}^{*}, …, s_{n}^{*}\right)
$$
が成り立ち、$${s_{i}^{*}}$$ は以下の表式の解である。
$$
\underset{s_{i} \in S_{i}}{\max} u_{i}\left(s_{1}^{*}, …, s_{i-1}^{*}, s_{i}, s_{i+1}^{*}, …, s_{n}^{*}\right)
$$
1.2
$$
\begin{array}{c|c|c|c|}
& L & C & R \\ \hline
T & 2, 0 & 1, 1 & 4, 2 \\ \hline
M & 3, 4 & 1, 2 & 2, 3 \\ \hline
B & 1, 3 & 0, 2 & 3, 0 \\ \hline
\end{array}
$$
$${ s_{2} \in \left\lbrace L, C, R \right\rbrace }$$ に対して $${ u_{1} \left( B, s_{2} \right) < u_{1} \left( T, s_{2} \right) }$$ なので、
$$
\begin{array}{c|c|c|c|}
& L & C & R \\ \hline
T & 2, 0 & 1, 1 & 4, 2 \\ \hline
M & 3, 4 & 1, 2 & 2, 3 \\ \hline
\end{array}
$$
$${ s_{1} \in \left\lbrace T, M \right\rbrace }$$ に対して $${ u_{2} \left( s_{1}, C \right) < u_{2} \left( s_{1}, R \right) }$$ なので、
$$
\begin{array}{c|c|c|}
& L & R \\ \hline
T & 2, 0 & 4, 2 \\ \hline
M & 3, 4 & 2, 3 \\ \hline
\end{array}
$$
相手プレイヤーの各戦略に対する最適反応となる戦略に下線を引くと
$$
\begin{array}{c|c|c|}
& L & R \\ \hline
T & 2, 0 & \underline{4}, \underline{2} \\ \hline
M & \underline{3}, \underline{4} & 2, 3 \\ \hline
\end{array}
$$
となり、純粋戦略ナッシュ均衡の組み合わせは $${ (T, R), (M, L) }$$ の2つである。
1.3
1.1 節の範囲で解答したい。
$${s_{1}, s_{2}}$$ は $${[0,1]}$$ の範囲で連続な値をとることができるが、状況の把握のために $${0.25}$$ 刻みの利得表を作成する。
$$
\begin{array}{c|c|c|c|c|c|}
& 0 & 0.25 & 0.5 & 0.75 & 1 \\ \hline
0 & 0, 0 & 0, 0.25 & 0, 0.5 & 0, 0.75 & 0, 1 \\ \hline
0.25 & 0.25, 0 & 0.25, 0 & 0.25, 0.5 & 0.25, 0.75 & 0, 0 \\ \hline
0.5 & 0.5, 0 & 0.5, 0.25 & 0.5, 0.5 & 0, 0 & 0, 0 \\ \hline
0.75 & 0.75, 0 & 0.75, 0.25 & 0, 0 & 0, 0 & 0, 0 \\ \hline
1 & 1, 0 & 0, 0 & 0, 0 & 0, 0 & 0, 0 \\ \hline
\end{array}
$$
利得表から、相手プレイヤーの各戦略に対する最適反応を考える。
$$
\begin{array}{c|c|c|c|c|c|}
& 0 & 0.25 & 0.5 & 0.75 & 1 \\ \hline
0 & 0, 0 & 0, 0.25 & 0, 0.5 & 0, 0.75 & 0, \underline{1} \\ \hline
0.25 & 0.25, 0 & 0.25, 0 & 0.25, 0.5 & \underline{0.25}, \underline{0.75} & 0, 0 \\ \hline
0.5 & 0.5, 0 & 0.5, 0.25 & \underline{0.5}, \underline{0.5} & 0, 0 & 0, 0 \\ \hline
0.75 & 0.75, 0 & \underline{0.75}, \underline{0.25} & 0, 0 & 0, 0 & 0, 0 \\ \hline
1 & \underline{1}, 0 & 0, 0 & 0, 0 & 0, 0 & 0, 0 \\ \hline
\end{array}
$$
上の利得表をみると、$${s_{1}+s_{2}=1}$$ となるような組み合わせがナッシュ均衡の候補になりそうである(戦略の組 $${(0,1)}$$ と $${(1,0)}$$ については後述する)。つまり、プレイヤー1にとっての最適反応を$${1 - s_{2}}$$、プレイヤー2にとっての最適反応を$${1 - s_{1}}$$と仮定し、任意の小さい実数 $${\epsilon}$$ をおき、ナッシュ均衡の定義に照らして考えると、
$$
\begin{array}{ccc}
u_{1}\left((1 - s_{2}) + \epsilon, s_{2}\right)&\leq&u_{1}(1 - s_{2}, s_{2})\\
u_{1}\left(s_{1}, (1 - s_{1}) + \epsilon\right)&\leq&u_{2}(s_{1}, 1 - s_{1})
\end{array}
$$
が成立して欲しい。
仮にプレイヤー2が戦略 $${0.75}$$ を選択した場合、プレイヤー1が利得を最大になるための戦略は $${0.25}$$ であり、プレイヤー1が戦略 $${0.25}$$ の値を少しでも増すと利得は $${0}$$ になり、逆に減ずるとその分利得は減少するので、表式を満たす。
仮にプレイヤー2が戦略 $${1}$$ を選択した場合、プレイヤー1はどの戦略を選択しても利得は変わらず、これは表式の等式のケースを満たす。一方でプレイヤー1が戦略 $${0}$$ を選択した場合は、プレイヤー2の最適反応は戦略 $${1}$$ であり、戦略の組 $${(0,1)}$$ は表式を満たす。$${(1,0)}$$ についても同様。
従って、$${s_{1}+s_{2}=1}$$ を満たすような戦略の組 $${(s_{1}, s_{2})}$$ が純粋戦略ナッシュ均衡である。
注
問題文は著作物であると捉え、記載していません。
解答は誤りである可能性があります。誤りに気づかれた場合は、御指摘をいただけると助かります。
この記事が気に入ったらサポートをしてみませんか?