「継承の数理モデル」、均衡の存在証明~繰り返しゲームを使って:どうする独裁者 第8話ウェブ付録
「どうする独裁者」の第8話「継承の理」では、「能力均衡」と「継承均衡」の2つの均衡に着目して分析を行いました。このウェブ付録では、その均衡の存在証明と、そのために必要な繰り返しゲームの基礎の基礎を解説します。
*このウェブ付録のPDF版は【コチラ】からご覧いただけます。
*連載「どうする独裁者」の サポートサイト では、各回の付属情報や分析を再現するためのコード&データを提供中。ぜひご覧ください!
「どうする独裁者」の第8話では、Besley and Reynal-Querol (2017) に基づき、権力継承に関する数理モデルを紹介しました。そこでは、能力を重視して後継者を決める「能力均衡」と、政治指導者の子に継承させていく「継承均衡」の2つの均衡が存在することを、直観的説明のみを用いて指摘しました。この付録では、その詳細な存在証明を示していきます。
1 無限繰り返しゲーム事始め:
割引因子の計算方法
まず本節では、無限繰り返しゲームを分析する際に用いる計算方法を簡単に解説します。すでに無限繰り返しゲームの基礎を学んだことのある方は、次節から読んでください。また、ここでは本付録を理解するために最低限必要な知識のみを議論します。繰り返しゲームの詳細に関しては、浅古・図斎・森谷(2022)の第6章を参照してください。
無限繰り返しゲームとは、同じゲームを無限回繰り返し行うゲームのことを言います。一方で、「10回だけ同じゲームを行う」など、終わる時期が明確にわかっている繰り返しゲームのことを、有限繰り返しゲーム(finitely repeated game)と言います。有限繰り返しゲームでは、すべてのプレーヤーが何期後にゲームが終わるのか知っていることになります。一方、現実の政治体制はいつ崩壊するのか明確にはわかりません。終わりの時期が明確ではないため、有限繰り返しゲームを用いて分析することは適切ではないことになります。よって、終わりの時期が見えない状況は、無限繰り返しゲームで描く方が良いと言えます。しかし、無限回ゲームを繰り返すということは、プレーヤーは無限回利得を受け取ることになります。その利得を計算するのは大変そうに見えますが、割引因子を用いることで比較的簡単に計算していくことができます。
割引因子を$${\delta}$$とし($${0 < \delta < 1}$$)、かつ現在の期を0(ゼロ)期とした場合、$${t}$$期後に得る利得$${y}$$の現在における価値は$${\delta^{t}y}$$です。それでは、すべての期において利得$${y}$$を得る場合はどうなるでしょうか。0期に得る利得の現在における価値は$${y}$$です。1期後の利得の現在の価値は$${\delta y}$$であり、2期後は$${\delta^{2}y}$$であり、3期後は$${\delta^{3}y}$$です。無限期にわたり$${y}$$を得るため、各期に得る利得の現在の価値が永遠に並んでいくことになります。この各期の利得の現在における価値の総和を$${Y}$$とすると、以下のように示せます。
$$
Y = y + \delta y + \delta^{2}y + \delta^{3}y + \delta^{4}y + \cdots \qquad(A1)
$$
この式の$${\cdots}$$の部分は、永遠に$${\delta^{t}y}$$が続いていくことを意味します。これは、数学における総和の記号$${\sum}$$を使うと、$${Y = \sum_{t = 0}^{\infty}{\delta^{t}y}}$$と書けます。これでは計算がしにくそうですね。しかし、これを簡単に示す方法があります。まずは、式 (A1) の両辺に$${\delta}$$をかけてみましょう。すると、
$$
\delta Y = \delta y + \delta^{2}y + \delta^{3}y + \delta^{4}y + \delta^{5}y + \cdots \qquad(A2)
$$
になります。ここで式 (A2) の右辺は、式 (A1) の右辺の$${\delta y}$$以降と、まったく同じであることがわかります。よって、式 (A1) の両辺から式 (A2) の両辺を引くと、右辺の$${\delta y}$$以降はすべて消え、$${y}$$だけが残ることになります。つまり、
$$
Y - \delta Y = y
$$
と示せるということです。これを整理すると、
$$
Y = \dfrac{y}{1 - \delta}
$$
になります。これで計算しやすくなりましたね。割引因子を用いると「永遠に毎期$${y}$$を得る」ときの、各期の利得の現在における価値の総和は、各期の利得$${y}$$を$${1 - \delta}$$で割った数で示せるということです。この計算方法を用いて、能力均衡と継承均衡の存在証明をしていきましょう。
命題①(能力均衡)の証明
本節では能力均衡が常に存在することを証明していきます。ただし、能力均衡と継承均衡は部分ゲーム完全均衡です。ここで1つのことに注意してください。一般的な教科書で説明されている無限繰り返しゲームでは、両プレーヤーともに無限期間生きることになっています。しかし、第8話のゲームでは選択民は無限期間生きるものの、政治指導者は1期限りで引退すると仮定されていました。よって、前節の無限期間にわたる利得の総和の現在における価値を計算する対象は選択民のみであり、政治指導者の選択は1期限りとなります。
話を戻しましょう。能力均衡とは、第8話の2.2項で示した以下の均衡のことでした。毎期、指導者は能力の有無で選ばれるため、能力が高い子しか権力継承ができません。一方で、子への継承のことを諦めた政治指導者は、自身を利する政策$${x_{d}}$$を毎期選択し続けます。
命題①(能力均衡)
以下の均衡が常に存在する。
先代の子は、能力が高いタイプの場合にのみ次の政治指導者に選ばれる。能力が低いタイプの場合には、他の人間が政治指導者となる。政治指導者は常に、政治指導者を利する政策$${x_d}$$を選択する。
この命題の「常に存在する」とは、政治指導者が有能タイプのときの選択民の利得$${A > 0}$$や、$${x_{d}}$$が選ばれた場合の政治指導者の利得$${b > 0}$$などの変数がどのような値をとろうとも存在することを意味します。
まずは、政治指導者の選択から考えましょう。自身の子どもへの継承は、政治指導者の子の能力が高いときのみ可能です。政治指導者が現役で活躍しているときには子の能力は判明していません。継承する段階となる次の期になったときのみ、能力の有無がわかり、継承されるか否かがわかります。子が有能タイプである確率は0.5であり、子に継承できた場合に政治指導者が得られる利得は$${B > 0}$$であるため、政治指導者が子への継承から得られる期待利得は$${0.5B}$$になります。よって、政治指導者を利する政策$${x_{d}}$$を実行したときの期待利得は$${b + 0.5B}$$であり、選択民を利する政策$${x_{s}}$$を実行したときの期待利得は$${0.5B}$$のみです。以上から、政策$${x_{d}}$$を実行することが最適であることがわかります。
次に、選択民の選択を考えましょう。まず、この均衡では政治指導者は政策$${x_{d}}$$を実行するため、選択民は政策からの利得を得ることはできません。得られる利得は、政治指導者の利得のみです。選択民は、各期において政治指導者を誰にするか決定します。選択肢は、先代の子か、他の誰かかという2つです。他の誰かにした場合、能力が有能である確率は50%であるため、能力から得られる期待利得は$${0.5A - 0.5A = 0}$$です。一方で、有能な先代の子を政治指導者にした場合には$${A}$$の利得を、無能な先代の子を政治指導者にした場合には$${- A}$$の利得を得ます。これだけを見れば、「先代の子が有能な場合にのみ継承し、無能であった場合には他の人を選ぶ」が最適に見えます。
ただし、これはゲームを1回だけ行った場合の最適な戦略です。何度も繰り返されるゲームのことを、段階ゲーム(stage game)と言います。求めたい均衡は、段階ゲームを1回だけ行った場合の均衡ではなく、無限回繰り返し行った場合の均衡です。ゲーム理論で分析する際に、無限繰り返しゲームにおける戦略は、最初の期に今後どのような選択をしていくのか計画する予定表のようなものと考えます。よって、段階ゲームだけの利得ではなく、無期限にわたる期待利得をふまえた戦略の決定を分析しなければいけません。今期の選択が、来期以降の利得に影響を与える可能性もあります。よって、証明においては次期以降の利得も考えなければなりません。
次期において、50%の確率で今期の政治指導者の子が有能であれば、その子に継承させればAの利得を確実に得られます。しかし、残りの50%の確率で無能であれば、他の誰かを政治指導者に選ぶため期待利得は$${0.5A - 0.5A = 0}$$です。よって、次期において能力から得られる利得の期待値は$${0.5A + 0.5 \times 0 = 0.5A}$$です。この期待利得を、将来無限期間にわたって得られることが予想できます。その利得の総和の現在における価値は、前節で議論したように各期の期待利得を$${1 - \delta}$$で割った数で示せます。よって、
$$
\dfrac{0.5A}{1 - \delta} \qquad(A3)
$$
になります。この次期以降の期待利得の総和は、今期の選択民の選択が何であろうと変わることはありません。そのため、選択民は今期に得られる能力からの利得の最大化のみを考えることになります。
以上から、「先代の子が有能な場合にのみ継承させる」という選択は、選択民にとって最適であると言えます。これで能力均衡は、均衡として常に存在することが示されました。
命題②(継承均衡)の証明
次に、第8話の2.3項で示した以下の継承均衡の存在を考えていきましょう。
命題②(継承均衡)
2つの条件 (1) と (2) が満たされる場合、以下の均衡が存在する。
能力に関係なく先代の子が政治指導者に選ばれ、政治指導者は常に選択民を利する政策 を選択する。
$$
A \leq \dfrac{2}{2+\delta} \qquad (1)
$$
$$
B \ \geq 2b \qquad (2)
$$
まずは政治指導者の選択から考えましょう。この均衡通りに選択民を利する政策$${x_{s}}$$を選択した場合、政策からの利得は得られませんが、自身の子に権力継承をすることができるため、$${B}$$の利得を得ます。
一方で、政治指導者自身を利する政策$${x_{d}}$$を選択した場合、政策からの利得bを得ることができます。しかし、権力継承を自身の子にできない可能性が生じます。本文で解説した通り、継承均衡で選択民は「政策$${x_{s}}$$を選択している限り、先代の子に継承させる。ただし、政策$${x_{d}}$$を選択した場合には、その後の期は能力均衡に移行する」という戦略を選択しています。能力均衡に移行することを相手への脅しとして使い、政策$${x_{s}}$$を選択させようとしているわけです。このように、相手が別の戦略に変えることで協調関係を裏切った場合、二度と相手を許さず、永遠に利得の低い別の均衡に移る戦略のことを、ゲーム理論ではトリガー戦略(grim-trigger strategy)と言います。選択民はトリガー戦略をとっているわけですから、政治指導者が政策$${x_{d}}$$を選択した場合、次期以降は能力均衡に移行します。能力均衡下では、有能な先代の子しか権力継承をすることができないことになります。政治指導者が政策を決定する時点では、自身の子の能力はわかりません。政治指導者の子が有能な確率は0.5です。つまり、0.5の確率で$${B}$$を得ることができますが、残りの0.5の確率では$${B}$$を得ることはできません。よって、政策$${x_{d}}$$を選択した場合の政治指導者の期待利得は、$${b + 0.5B}$$になります。
政策$${x_{s}}$$を選択したときの利得が、政策$${x_{d}}$$を選択したときの利得を下回らない場合に、政治指導者は継承均衡の戦略を選ぶことが最適となります。つまり、
$$
B \geq b + 0.5B
$$
です。この式を書き換えると、命題②の条件(2)と同じ式を導出できます。条件(2)が成立している限り、政治指導者は継承均衡の戦略を選ぶインセンティブがあるわけです。
次に、選択民の選択を考えましょう。この均衡下では、必ずx_{s}が実行されます。よって、毎期政策からの利得1を得ることができます。その一方で、先代の子は必ず政治指導者にしなければなりません。問題は、先代の子が無能タイプであった時です。この場合、今期の政治指導者のタイプから得る利得は- Aになってしまいます。次期以降、政治指導者の能力は不確実であるため、政治指導者の能力から得られる期待利得は、$${0.5A - 0.5A = 0}$$になります。政策からの利得1は、この均衡にいる限りずっと得続けることができるため、各期に得る利得の合計は$${0 + 1 = 1}$$です。これを、次期以降毎期永遠に得ることになります。よって、今期において先代の子が無能タイプであった場合、継承均衡下での選択民の総期待利得は
$$
- A + 1 + \delta\dfrac{1}{1 - \delta}
$$
です。この3項目の$${1/(1 - \delta)}$$は、次期以降において各期に期待利得1を得る場合の利得の現在における価値の総和です。次期以降に得るため、1期分割り引くために$${\delta}$$をかけています。
ここで選択民が、政治指導者を裏切って先代の子を政治指導者にしなかったとしましょう。この場合、今期の政治指導者の能力から得る利得は、新たな政治指導者を選んだために0になります。その代わり、政策は$${x_{d}}$$を選ばれてしまうために、政策からの利得を得ることができません。また、次期以降は能力均衡に移行するため、得られる期待利得は式 (A3) で示したものになります。よって、先代の子を政治指導者にしなかった場合の、選択民の総期待利得は以下になります。
$$
0 + \delta\dfrac{0.5A}{1 - \delta}
$$
継承均衡の戦略を選んだときの総期待利得が、政治指導者を裏切り能力重視の継承を行ったときの総期待利得を下回らないとき、選択民は継承均衡の戦略を選ぶことが最適になります。つまり、下記の条件が満たされるときです。
$$
A + 1 + \delta\dfrac{1}{1 - \delta} \geq \delta \dfrac{0.5A}{1 - \delta} \qquad (A4)
$$
これを計算していくと、命題②の条件 (1) になります。
今期の先代の子が有能タイプであった場合、今期に得られる利得は$${- A + 1}$$ではなく、$${A + 1}$$になります。よって、有能タイプであった場合に継承均衡の戦略を選択することが最適となる条件は以下になります。
$$
A + 1 + \delta\dfrac{1}{1 - \delta} \geq \delta\dfrac{0.5A}{1 - \delta}
$$
条件 (A4) が満たされれば、この条件も必ず満たされます。よって、条件 (1) が満たされていれば、今期の先代の子が有能タイプでも無能タイプでも、継承均衡に従うインセンティブを選択民は有します。よって、命題②が正しいことが証明できました。
参考文献
浅古泰史・図斎大・森谷文利(2022)『活かすゲーム理論』有斐閣。
Besley, T. and Reynal-Querol, M. (2017) “The Logic of Hereditary Rule: Theory and Evidence,” Journal of Economic Growth, 22(2):123–144.
浅古泰史(2024年9月25日)
おわりに
「どうする独裁者」の第8話「継承の理」を収録した、『経済セミナー』2024年10・11月号の詳細情報とお求めは、以下をぜひご覧ください!(電子版もあります!)
サポートに限らず、どんなリアクションでも大変ありがたく思います。リクエスト等々もぜひお送りいただけたら幸いです。本誌とあわあせて、今後もコンテンツ充実に努めて参りますので、どうぞよろしくお願い申し上げます。