
【遊戯王】後攻デッキの台頭が招く「先攻ゲー」の進化 - 数学的考察
はじめに
本記事では、遊戯王マスターデュエルにおいて後攻デッキ(コイントスで勝っても後攻を選ぶデッキ)が環境に与える影響を、ゲーム理論等から数学的に考察します。より具体的に言えば、「直近の【天盃龍】環境では何が起こっていたのか」を理論的に理解することを目指しました。
最近の【天盃龍】環境を経験したデュエリストが感覚で理解したであろう環境の動態を、ゲーム理論等を使って紐解いて行きます。メタゲームが回るメカニズムを知って納得できる記事になっていたら幸いです。
ごく簡単な要点は以下です。
・後攻デッキが強ければ強いほど、先攻デッキは先攻に偏重する
・理想的な状況下では、先攻デッキと後攻デッキの対戦での勝率が5分5分になるまで先攻デッキは先攻への偏重傾向を強め、安定な状態となる
・結果、先攻デッキどうしの対戦は先攻が極端な有利なゲームとなる
・安定な状態に至るまでの間に、極端に先攻偏重のデッキが増えるような一過性の環境変化を辿ることがある
「先攻ゲー」たる遊戯王
一般に、現代遊戯王は先攻が有利とされている。現代における主戦場のメインフェイズを先に行うことができるからだ。先攻プレイヤーは自分のメインフェイズに有利な状況を整え、後攻プレイヤーのメインフェイズを妨害することが容易である。一方で、後攻プレイヤーが先攻1ターン目のメインフェイズを妨害する手段は手札誘発に限られてしまう。そのため、ほぼ全てのプレイヤーが先攻を欲しており、コイントスに負けることは自分が後攻になることとほぼ同義だった。
このようなゲーム性は"先攻ゲー"などと揶揄されることがある一方で、先攻で勝つことしか考えてないデッキが高い勝率を出すことは難しい。先攻で勝ち切ることはもちろん重要だが、それでもコインで負けると直ちに負けるデッキで勝ち越すのは不可能だ。つまり、みんな先攻を欲しがるからこそ、後攻を意識する必要があったのだ。
それが最近、後攻デッキである【天盃龍】が出現した時は状況が大きく変わった。そう、コインで勝っても後攻を敢えて取るデッキである。
天盃龍は法外な量の手札誘発や捲り札の採用によって、後攻からでも先攻の展開をねじ伏せることが可能であった。そのため、天盃龍以外のデッキは先攻で天盃龍に負けないようにしなければならなくなった。結果として、先攻を取るデッキでは後攻を見る余裕を無くし、先攻を取るデッキどうしの対戦では極端に先攻が有利となる環境となってしまった。下記のツイ…ポスト群はこの状況を非常に分かりやすく説明しているだろう。
元からだろというコメントが来るので前環境と前々環境の先手後手の勝率。3年くらい見守ってるけど先手の勝率は今までは55~65%の間で振れてます https://t.co/18HonYu3Gj pic.twitter.com/8n6KY483WC
— kinghalo (@kinghalo_dl) December 17, 2024
さて、実際のデータも合わせて強力な後攻デッキがもたらした影響はよく分かったと思う。本記事では、この動態やメカニズムを簡単なゲームを使って理解することを目指していく。
ゲームモデル
数学無理!簡単なところだけ教えて!という人はここ(記事内リンク)だけ読めばいいと思います。
シングル戦の勝敗をごく簡単に決めるシンプルなゲームを考えてみよう。デッキごとに先攻のパワーと後攻の「パワー」が決まっており、それぞれ先攻のパワー$${f}$$と後攻のパワー$${g}$$としよう。デッキ$${i}$$と$${j}$$がデュエルをしたとき、$${i}$$が先攻を取った時の$${i}$$の勝率は(1)式で、$${j}$$が先攻を取った時の$${i}$$の勝率は(2)式で決定されるとする。

例えば、$${i}$$は先攻パワー$${f_i}$$が6、後攻パワー$${g_i}$$が4だとする。$${j}$$の先攻のパワー$${f_j}$$は7で、後攻のパワー$${g_j}$$は3だとすると、$${i}$$の先攻勝率は$${\frac{6}{6+3}≒0.667}$$、$${i}$$の後攻勝率は$${\frac{4}{4+7}≒0.364}$$となる(このケースでは総合的にやや$${i}$$が有利)。
デッキの相性とか何も考慮されてないじゃん!そんな単純なゲームじゃない!というのはこちらも重々承知で、極端に簡単なモデルを提案している。
そして、この先は「先攻デッキ」(コインで勝てば先攻を選択するデッキ)として一括りにして考える。環境全体の先攻デッキの平均的な先攻のパワー$${f_{m}}$$と環境全体の先攻デッキの平均的な後攻パワー$${g_{m}}$$を考えればよく、デッキ相性を考えたところで結局のところ全体としてみれば同じような結果になるはずだ。
例えば、特定のデッキタイプAが強力で環境における比率を増やすと、そのデッキタイプAに対して勝ちやすいデッキタイプBが増えたり、そのデッキタイプAに対して有効な汎用札の採用が増えたりしてデッキタイプAは勝ちにくくなる。そして、Aに対する対策もBに対する対策も通用しにくいデッキタイプCが増える…などなど。
要は「多いデッキは対策される」「少ないデッキは対策されにくい」というごくシンプルなメカニズム(※)によって、ある程度の平衡に達するということである。誰もが最高の勝率を求めてデッキや採用カードを選択する理想的な状況下であれば、最終的には誰が採用カードを変えても、誰が握るデッキを変えても、勝率が向上しないナッシュ均衡と呼ばれる状態に行き着く。その結果として、環境全体の平均的なパワーが先攻で$${f_{m}=6}$$、後攻で$${g_{m}=4}$$になったと仮定することは十分に合理的だ(ちなみに、ナッシュ均衡においてすべてのデッキが同じ戦略を取る……つまり全員が同じデッキを握るという可能性はある)。
※少ないものが有利になるこの仕組みを、進化生物学や生態学の文脈では「負の頻度依存性」と呼んだりする。「良環境」「群雄割拠」と言われるような環境は、この負の頻度依存がうまく働いて多様なデッキがそれぞれ環境の一定のシェアを分け合っている状態と言えるだろう。逆に、いわゆる「一強環境」はあまりにも強力なパワーを持ったデッキがいるせいで、その一強デッキの負の頻度依存性があまり働かない環境のことだろう。
後攻デッキ「侵入」後
というわけで多様な、しかし全てのデッキが先攻デッキである環境ができあがり、ナッシュ均衡に達したとしよう。このとき、環境全体の先攻デッキの先攻のパワーは$${f_{m}=6}$$、後攻のパワーは$${g_{m}=4}$$となっている。
この平和(?)な先攻島に侵入者がやってくる。そう、後攻しか取らない強力な後攻デッキ$${T}$$の登場である($${T}$$、一体なんの略なんだろうな)。しかも、そのパワーは強力で後攻のパワー$${g_T}$$は7にも達すると仮定しよう。そうすると、$${g_T}$$は$${f_{m}}$$を上回り、安定して5割を超える勝率を叩き出せる。つまり、このまま先攻デッキが戦略を変えなければ、環境は$${T}$$一色に染まってしまう。
ここで、先攻デッキは戦略を調整し、後攻のパワーを落とすことで先攻のパワーを引き上げられると仮定しよう。例えば、《無限泡影》の採用を減らす代わりに《サモンリミッター》を投入すれば、後攻勝率は減少しつつも先攻勝率は向上するだろう。そこで、先攻デッキの後攻のパワーを$${g(x)=x (1\le x\le5)}$$とし、1以上5以下の範囲で後攻のパワーを自由に調整可能で、それに応じて先攻パワー$${f(x)}$$が変化するとしよう。この先断りなく$${x}$$や$${f(x)}$$という文字を何度も使うので、$${x}$$は先攻デッキの後攻のパワー、$${f(x)}$$は先攻デッキの先攻のパワーというのを覚えていてほしい。$${x}$$が大きいことは後手を捨てないことを意味し、$${x}$$が小さいことは後手を捨ててでも先手を取ることを意味する。$${f(x)}$$は1以上5以下の範囲で後攻パワー$${x}$$に関して単調減少であり、後攻を重視するほど先攻では弱く、先攻を重視するほど後攻では弱くなるものとする。
ここでは、$${f(x)}$$は以下の式(3)に従うものとして議論を進めたい。

都合のよい数式をでっち上げたなと不審に思った人もいるかもしれない。この$${f(x)}$$は以下の条件を満たすように設計されたものであり、肌感覚と合うように私がでっち上げた。でっち上げ万歳。式(3)のでっち上げ方については、一応付録Aに記載しておく。
・$${f(x)}$$は1以上5以下の範囲では後攻パワー$${x}$$に関して単調減少
・後攻デッキが不在で、先攻パワーが$${f(x)}$$、後攻パワーが$${x}$$に従うとき、ナッシュ均衡において先攻パワー$${f(x)=6}$$、$${x=4}$$となる。すなわち、後攻デッキ不在のとき、おしなべて先攻勝率は6割、後攻勝率は4割。
さて、これによって先攻デッキ側のデッキ調整を数学的に表現できた。これにより、強力な後攻パワーを持つ$${T}$$に対して先攻デッキは対抗できるようになる。では、後攻デッキが侵入してきた後の新しいナッシュ均衡でデッキ$${T}$$が占める比率はどれほどだろうか?先攻側の取る戦略$${x}$$はどれくらい先攻に偏ったのだろうか?今後の議論において、後攻デッキが全体に占める比率を$${s}$$と表記する。当然、先攻デッキの比率は$${1-s}$$となる。こちらも今後の議論で断りなく繰り返し出現するので覚えておいてほしい。
全プレイヤーが最大勝率を目指して最適なデッキ選択とデッキ調整を行う場合、ナッシュ均衡においては「どのプレイヤーが戦略を変えても勝率がそれ以上向上しない」状態となる。言い換えれば、全プレイヤーの勝率が0.5になることと同義である。先攻デッキどうしの対戦、後攻デッキどうしの対戦で勝率が0.5になると同時に、先攻デッキと後攻デッキが対戦した場合の勝率は0.5となる。先攻デッキどうしでは先攻が有利、後攻デッキどうしでは後攻が有利になるが、先攻デッキと後攻デッキの対戦では必ず先攻デッキの先攻、後攻デッキが後攻となり、この時の勝率がちょうど0.5になるわけだ。先攻デッキと後攻デッキの対戦での先攻デッキの勝率は$${\frac{f(x)}{f(x)+g_T}}$$となる。
そのため、ナッシュ均衡において先攻側の取る戦略$${x}$$は比較的簡単に求まり、侵入した後攻デッキのパワー$${g_T=7}$$に等しくなるように$${f(x)}$$が決定される。$${f(x) = -\frac{3}{2} x+12=7}$$から、$${x=3.33…}$$となり、先攻デッキの後攻パワーは$${g(x)=3.33…}$$まで落ちるわけだ。後攻デッキの侵入前は$${g(x)=4}$$だったので先攻デッキどうしの対戦でも後攻側が40%の勝率を得ていたのに対し、後攻デッキが侵入した後、先攻デッキどうしの対戦の後攻勝率は32%程度まで落ちてしまった。天盃龍環境で多くのデュエリストが経験したように、強力な後攻デッキに対抗するために先攻を重視した構築に変化することによって、先攻デッキどうしの対戦に占めるコイントスの重要性が格段に上がってしまったのだ。
さて、問題は後攻デッキ$${T}$$が占める比率$${s}$$である。上記の議論を見ると比率$${s}$$によらず先攻デッキの戦略$${x}$$が決まってしまったように見える(実際決まってはいる)が、$${x}$$に関する議論では、「誰かが$${x}$$を少し変えることで自分だけ勝率を増加できる可能性」を考えなくてはならない。例えば、後攻デッキの比率$${s}$$が極端に小さい状況では、$${f(x) =7}$$にするよりももっと後攻に重きを置いた方が個人の勝率は高くなる。なぜなら、あまりいない後攻デッキを意識するよりも、頻繁に当たる先攻デッキに対する後手を捨てないことが重要だからである。逆に、後攻デッキの比率$${s}$$が極端に大きい状況では$${f(x) =7}$$よりも先攻に重きを置いた方がいいだろう。ここで、環境全体における平均的な後攻パワー$${x}$$を$${x_m}$$とおいてみよう。そして、特定のプレイヤー$${p}$$に注目した$${x_p}$$を考え、$${x_p}$$を変化させることでその特定のプレイヤーの勝率が向上するかどうかを考える。このような「抜けがけ」行為が利益にならなくなるラインまで、$${s}$$が変化するというわけだ。
プレイヤー$${p}$$の勝率$${v(x_p)}$$は以下の式(4)で表せる。

第一項は$${p}$$がほかの先攻デッキと対戦したときの勝率であり、波括弧の中の第一項は対先攻デッキの先攻勝率、波括弧の中の第二項は対先攻デッキの後攻勝率だ。そして第二項は後攻デッキと対戦した時の勝率で、必ず$${p}$$が先攻となる。「抜けがけ」、言い換えれば特定のプレイヤーが戦略を変化させたときに勝率が向上する基準は、式(4)の$${x_p}$$での微分を考えればよい。式(4)の$${x_p}$$での微分、$${\frac{dv(x_p)}{dx_p}}$$は以下式(5)となる。

この式の値が正であれば、プレイヤー$${p}$$は後攻を今より重視した方が得である。逆に負であれば、プレイヤー$${p}$$は今よりも先攻偏重な構築にした方が良いだろう。ナッシュ均衡においては式(5)が0となるように、且つ$${x_p=x_m=3.33…}$$となるように$${s}$$が決定されるというわけだ。これを解くと、$${s=0.1488…}$$となり、後攻デッキのシェア率は15%程度で平衡に達することが分かった。もちろん、このシェア率は$${g_T=7}$$と決めたことや私がでっち上げた$${f(x)}$$に依存するため、値自体は全くもって重要ではない。とはいえ、環境に15%の比率で存在するデッキのために、先攻デッキどうしのゲームバランスが大きく変わってしまうのは注目すべき点かもしれない。
技術的な話をすると、式(5)を得るために行った、式(4)を$${x_p}$$のみで微分する処理がかなり肝だったりする。単純に式(4)を$${x}$$の式として書き下して$${x}$$で微分してしまうと、先攻デッキ全体の勝率を最大化するような状況(先攻デッキを握るプレイヤーどうしが謎に協力し合う状況)となってしまい明確な間違いである。あくまで個人個人が自分の利益を向上させるために$${x_p}$$を変動させ、結果的に全体としての$${x_m}$$も変化していくよね、という形で議論を進める必要があることに注意しよう。
また、ナッシュ均衡における後攻デッキのシェア率$${s}$$と先攻デッキの後攻パワー$${x}$$を$${s^*}$$、$${x^*}$$と表記することにする。
ここまでで、やや難解に見えるかもしれない議論を繰り広げてしまったので、状況を整理したい。
・どのプレイヤーが戦略(握るデッキやデッキの構成)を変えても勝率の向上が見込めない状態がナッシュ均衡である
・ナッシュ均衡において、先攻デッキは$${x}$$を$${x^*}$$まで下げる、つまり後攻をある程度捨てて先攻に偏重することで後攻デッキに対抗した
・ナッシュ均衡において、後攻デッキのシェア率は$${s^*}$$に落ち着く
数式を使わない説明
最終的に一定の均衡に達する過程を、数式を使わずにごく簡単に説明すると以下のようになるだろう。
~後攻デッキが環境に少なすぎる場合~
1. 先攻デッキの比率が多いため、先攻デッキは対先攻デッキを意識した、後攻も勝てる構築となっている($${s}$$が小さく、$${x}$$は大きい状態)
ex : 「後攻を捨てたくはない!Gは当然フル投入して、泡とヴェーラーも3枚積もう」
2. 先攻デッキの先攻が比較的弱い($${f(x)}$$が小さい)ため、後攻デッキの勝率が高くなり、後攻デッキを握る人が増える($${s}$$が大きくなる)
ex : 「テンパイめっちゃ勝てる もうテンパイでいいわ」
3. 後攻デッキを意識し、先攻デッキ側も先攻に偏らざるを得なくなる($${x}$$が小さくなる)
ex : 「テンパイ増えてきたな……。ヴェーラー刺さり悪いし、ヴェーラー抜いてセンサー挿しとくか…。」
4. やがて後攻デッキの割合は$${s^*}$$に、先攻デッキ側の後攻パワーは$${x^*}$$に落ち着く
~後攻デッキが環境に多すぎる場合~
1. 後攻デッキの比率が多いため、先攻デッキは後攻デッキを意識した、極端に先攻に偏重した構築となっている($${s}$$が大きく、$${x}$$は小さい状態)
ex : 「テンパイ多すぎ!神宣3枚積んじゃお」
2. 先攻デッキの先攻が強い($${f(x)}$$が大きい)ため、後攻デッキの勝率が低くなり、後攻デッキを握る人が減る($${s}$$が小さくなる)
ex : 「テンパイメタられ過ぎだなあ 粛声握るか…」
3. 後攻デッキの数が落ち着いてくると、先攻デッキ側の先攻への偏重がやや和らぐ($${x}$$が大きくなる)
ex : 「テンパイまだ多いけど、さすがに神宣積むほどの数じゃなくなったな…。とりあえずうさぎ入れて様子見るか」
4. やがて後攻デッキの割合は$${s^*}$$に、先攻デッキ側の後攻パワーは$${x^*}$$に落ち着く
環境変遷ダイナミクスの図解
均衡を一足飛びに求めてしまい、実際の動態の説明は省略してしまったので、少し補足したい。$${x}$$や$${s}$$の変化が連続時間でどうなるかは以下の図1のようになりそうである。

横軸xは先攻デッキ側の戦略、縦軸sは後攻デッキのシェア。青線はf(x)=gTとなるアイソクライン(境界線)であり、青線より右側では後攻デッキ勝率が5割を超えるため、後攻デッキのシェアが増加する。青線より左側では後攻デッキの勝率が5割を切る。橙線はdv(x)/dx(式5)が0になるアイソクラインであり、橙線より上側では先攻に偏った構築にした方が先攻デッキの勝率が向上する。逆に、橙線より下側では後攻も見る構築にした方が先攻デッキの勝率が向上する。実際の動態は、ぼくがフリーハンドで書いたへにょへにょ線みたいな経過を辿ってナッシュ均衡(x*, s*)に達することが期待される。
図1で示したように、先攻デッキがどれだけ後攻を見るかどうかの戦略は後攻デッキの勝率を左右することになる(青線より右か左かで後攻デッキのシェアの増減が決まる)。また、($${x}$$それ自体も関係するものの)おおよそ後攻デッキのシェア率$${s}$$が高いところでは先攻偏重にデッキ構築が偏り、低いところでは後攻も重視する構築が増えることが分かる。
こうして、先攻デッキの後攻パワー$${x}$$と後攻デッキのシェア$${s}$$が相互に作用しながら$${x^*}$$と$${s^*}$$に行き着く、という形となる。
そして重要な点は、後攻デッキのパワー$${g_T}$$が大きくなることは、$${f(x)=g_T}$$となるような$${x}$$が小さくなることを意味する。図1で言うと、青線が左にシフトするのだ(一応、橙線はわずかに下に動く)。ナッシュ均衡は青線と橙線の交点であるから、当然青線が左にシフトすれば後攻デッキのシェアは増え、先攻デッキの先攻偏重傾向は強まる。
天盃龍実装直後は、真新しさからかかなりの比率で天盃龍の使用者が多かった($${s}$$が大きい)ように思う。そして程なくして《神の宣告》等の極端な先攻札を見る機会が急増し、天盃龍の数が減少する。そして、先攻側の構築からも神宣などの極端なカードが抜けていったと記憶している。しかも、このような変化は追加の規制や新規カードの追加なしに起こり得るのだ。
先ほどの図に番号を追加した、下の図2を見て欲しい。

①の段階では、多くの先攻デッキが後攻も重視しており、後攻デッキにとって高い勝率を得やすい環境を示す。また、後攻デッキのシェア$${s}$$も大きい。これは天盃龍実装直後の状況とも解釈可能だろう。
②の段階では、あまりにも多い後攻デッキに対抗するため、急激に先攻に偏重する傾向が強まっていく。これは、《神の宣告》等の採用が増えたことと合致している。
③では、やがて後攻デッキへの風当たりが強まって後攻デッキが減り、先攻への偏重傾向がピークに達する。
④そして、ある程度後攻デッキの数と先攻デッキの構築の先攻後攻のバランスが落ち着き、ナッシュ均衡へと行きつく。
このように、追加カードや追加規制といった外部からの力なしに、環境が勝手に変遷する動態を、ある程度単純なモデルで再現できる。初期の状態から一直線にナッシュ均衡へ向かうのではなく、一過性の環境の変動を経験しながら、だんだんと落ち着いていくこともこのモデルで説明可能だ。
なお、明示的に時間変化に伴うダイナミクスを考慮した場合、ナッシュ均衡に必ず到達して安定にその状態が維持されるかどうかはそれほど自明ではない。安定になる条件をきっちり求めるのはめんどうなので省略するが、そこの解説は軽く付録Bに載せておく。
ということで、いろいろとでっち上げた数式をこねくり回したものの、結論はテンパイ環境でMDをやり込んだ人と変わらない。
強力な後攻デッキが存在する場合、先攻デッキは極端に先攻に偏重した構築となり、先攻デッキどうしの対戦での先攻勝率は非常に大きくなる。
Q&A
以下、一応予防線を張っておくコーナー。もしコメント等で質問あって重要そうなら追記するかもしれません。
Q. 実際には実力がばらつきあるし、勝率が5割を超え続ける人もいるけど安易に均衡する~なんて言っていいの?
A. 強い人も弱い人もひっくるめて平均し、巨視的な視点で見れば今までの議論の大部分に対して同じことが言えます。敢えてすごく悪い言い方をすれば、下手くそでもパワー高いデッキ握れば勝てるようになるよね。
Q. 実際には使用デッキに拘りがあったり、資産の関係でデッキ選択の幅が狭かったりするけど、全プレイヤーの最適行動を仮定していいの?
A. これは実際にこれまでの議論で考慮していない、重要な問題点だと思います。実際にはかなり雑多なデッキが存在するので、特にレート上位帯でもない限りは理論上のナッシュ均衡よりは余程マイルドな分布になっている可能性があります。つまり、ナッシュ均衡よりはパワーの低めな先攻デッキが多く、先攻デッキ側もある程度後攻を見る価値がある、などなど。
Q. 急にでっち上げた$${f(x)}$$の関数形もそうだけど、この数理モデリングは妥当なワケ?
A. 肌感覚としてはそんなにおかしくないと思います。……というよりは肌感覚に合うようにモデルの係数は決めました。後攻デッキ不在の状態で先攻勝率6割とか、そして後攻デッキを意識すると先攻デッキどうしの対戦で先攻勝率7割近くになるとか。妥当なんじゃないでしょうか。知らんけど。
Q. 結論が当たり前じゃない?そうモデル化すればそりゃそうなるでしょ、と思ったんだけど。
A. はい。すみません。
Q. 実データを出せ。
A. そこになければないですね
主観的な話
ここから先は筆者個人の主観が非常に大きいところなのでご理解ください。話の通じるレスバは大歓迎(?)なのでご意見あればtwi…Xにでも絡みに来てください。
さて、割とこの問題(強い後攻デッキがいると先攻デッキどうしの勝敗がコイントスで決まりがちな問題)は様々な意見がtwi…X上で見られたように思う。前々から先攻ゲー先攻ゲーと揶揄されてきたのが、いざ後攻で強いデッキが現れた途端により酷い『先攻ゲー』が始まってしまったのは皮肉なものである。
まあ、結局のところ実力が出るのは割と一部分で、どう転んでも運ゲーではあるというのは変わらないことだと思う。後手でもGがあったから強い、墓穴に貫通札がある先手が強い、などなど…。
とはいえ、実際にコイントスで負けて後攻が決定した途端に勝率が3割ほどですよ、なんてのはゲームとしてどうなんだという意見も一理あるとは思う。一方で、そもそもそれ言ったら初手5枚で戦局が大体決まるゲームなのも事実なので…。このクソゲーを、どんな環境でも楽しく遊べるデュエルゾンビになることこそが救いなのだと思う。本当か?
ちなみにこの記事で最適行動を仮定しまくってるけど、私はまるで最適とは程遠い行動をしている自信がある。地雷デッキ握って環境どもを負かすのは気持ちええのう。
後攻デッキに関するあれこれに関してKONAMIに望むことがあるとすれば……後攻デッキと一口で言っても、「色んな後攻デッキがあったら良かったなあ……」と。もし強い後攻デッキを刷るのであれば、同時にタイプの異なる複数の強力な後攻デッキを同時期に出してほしい。多様な後攻デッキが同時に存在すれば、単なる「後攻デッキを意識した構築」を組むにしてもバリエーションは生まれるはずだし、何よりゲーム体験が単調にならない。もちろん後攻デッキどうしの対戦や先攻デッキどうしの対戦は相変わらずコイントスが超重要になってしまうことには変わりないが。一応、後攻デッキが圧倒的な多数派となればコイントスの重要性は薄れ、先攻を意識した後攻デッキ(?)が強くなるだろうけど、流石になさそうだよね。
おわりに
本記事は、ゲーム理論を使ってテンパイ環境のメカニズムを理解することを目指す内容でした。いかがだったでしょうか。
正直なところ、多くの人にとっては呪文にしか見えない謎の数式まみれで咀嚼にカロリーが必要な記事になってしまったなというのは反省している。しかも、ゲーム理論やら力学系やらよくわからんツール群を持ち出した癖に、特に新情報や驚くべき結果が出てくるわけでもないので「はぁそうですか…」と思った人もいるだろう。まぁ、AIにしろ数理モデルにしろデータ分析にしろ、こういったツールは当たり前のことを証拠をもって示すことができることに留まりがちなので、この記事もそんなもんなんだなと思ってください。
それでも、なんとなくの感覚で理解したつもりでいた「環境の変遷」というものに対して、「こういう仕組みになっていたのか」と理屈での納得感がある記事になってたらいいなと思います。個人個人が自分の利益を優先した結果が全体を動かしていくのは本当に面白いことだと思っています。
この記事を読んでも環境デッキに対する誘発の打ちどころが分かるようになるわけではないしデッキ構築の参考にもならないのに、ここまで読んでくれて本当にありがとうございました。
それではみなさんも良きデュエルライフを。
付録
興味ある人だけ。
A 式(3)の導出
式(3)の導出は以下の式A1-A4を満たすような$${f(x)}$$のうち、一次関数のものを選んだ結果だ。(A.1)は、全プレイヤーが$${x=4}$$の戦略を取っている状況において、特定のプレイヤーが自分だけ$${x}$$を変化させても勝率が向上しない条件である。(A.3)はナッシュ均衡において先攻勝率が6割だと仮定した条件だ。そして、後攻パワーの増加に対して先攻パワーが単調減少すると仮定したのが(A.4)である。これらの条件を満たすものは一次関数でも可能だったので、最も単純な一次関数で表現してみた、というわけだ(一次関数だと一意に決まる。二次関数とかなら色々なパターンがあるよ)。それだけ単純化してもなおナッシュ均衡の計算が面倒くさすぎる…。もうちょいシンプルなモデル化の方法もある気がする。

B ナッシュ均衡に達するのは自明ではない?
~ここのパートは未整備です。あとでちゃんと数式付きで補足します~
ちゃんと戦略の変化のダイナミクスを考慮しようとすると、後攻デッキのシェアの変動はその勝率と0.5の差に比例し、先攻デッキの戦略の変動は戦略の変化による勝率向上の微分の値に比例するという形で定式化できるだろう。
2変数関数の常微分方程式系としてモデル化できそうだが、本文中の図1、図2で示した動態が本当に平衡点(ナッシュ均衡)に吸着されるかどうかは自明ではない。環境の変遷を繰り返しながらナッシュ均衡に達することなく、永遠にぐるぐる回っているかもしれないのだ。
永遠にぐるぐる回るのか、平衡点に吸い込まれていくのかは平衡点のまわりでの力学系と呼ばれるものを考えればよい。平衡点のごく近くで微小な変化が起こった時に、平衡点から離れる方向へ動くのか、あるいは平衡点に戻るように動くのかを測ればOKだ。
一応、めんどくさくてやってないだけ(あとでやろうと思っています……)で解析的に求めることが可能で、ナッシュ均衡となる平衡点まわりで2変数の常微分方程式系を線形とみなし(1次のテイラー展開)、その固有値を求めてやり、固有値がすべて負ならば局所安定となり吸着される。何言ってるかわからなかったらググるなりLLMに聞くなりしてください(丸投げ)。
ただこの辺の議論を厳密にやるご利益はあんまりないかなあ、というのが正直なところ。なぜなら、この定式化におけるxは「個人個人が、自分の利益向上のためにxを変化させるが、すべてのxが完全に同じように同時に動く」というシチュエーションになってしまっているからだ。実際にはいろんなxを採用するいろんな人が同時に動きつつ、平均値としては均衡に近づくよね、くらいの話だと思うので…。