【天鳳三麻】昇段確率の最大化

2024年11月8日 22:21

　天鳳三麻では, 以下の関係が成り立つ.

『昇段確率の最大化』＝『安定段位の最大化』
『昇段確率の最大化』≠『pt効率の最大化』

　これ自体は弊動画内で雑談として話した内容と同一であるが, 尺の都合で根拠を全く示していなかったので, 本記事にて改めて記載する.

　なお, 四麻に関しては安定段位以外に1位と2位の比率も若干ながら昇段確率に影響を及ぼすため完全な結論を出すことは出来ないが, 概ね同様の方針で打牌選択をすることで昇段確率の最大化が見込まれる.

1. 序論

　天鳳民の間では, 「十段配分だと降りた方が良さそう」といった会話が発生する場面がある. これは特にラス率のリスクを取るべきかどうかという状況で出てくる会話であるが, 本当に段位によって打牌を変えるべきなのかどうか疑問に思ったため, 実際に計算によって求めてみることとした.

　本記事では, まず昇段確率の理論値を求める手法を確立し, 実際の打牌選択にどのように影響するかを考察する.

2. 昇段確率の最大化

2.1. 昇段確率の理論値を求める

　シミュレーションでは1万回程度の試行だと結構ブレるが, ならばどれくらいの回数あれば信頼に足るのかと言われると専門的な知識が必要になる.

　大前提として, シミュレーションとは大まかな確率を知りたいときに用いるべきものであり, 求まった数値には多寡はあれど必ず誤差が含まれる. これでは, 微小な確率の差を比較するときには結論に影響を及ぼしかねない.

　この問題を解決するために, まずは昇段確率の理論値を求めることにした. ただし, ここで云う昇段確率とは, 昇段または降段するまで打ち続けた場合の昇段確率である.

　今回用いた手法は, 端的に言えば総当たりである. 段位とptを初期値として入力し, 指定した着順分布から1戦終了毎に所持ptの一覧とその確率分布を求める. これをほぼすべてのパターンが昇段または降段に収束するまで求め続けることで, 高精度の昇段確率を求めることが可能になる.

　厳密には無限の打数においても同じ段位を維持し続けることが可能なのでこの手法だけでは完全には求まらないが, 10桁程度の有効数字を出すことは容易に出来るため, 一旦これを理論値として扱うものとする.

　ここで, 2位を取った場合はptを維持したまま次の対局を迎えることになるが, この2位を取る前後で所持ptは変化していないのだから, 昇段確率も変化しないはずである. 実際, 今回の手法においては, 2位率を0とした順位分布と一般的な33%程度取る順位分布では収束に必要な対局数が変わるのみであり, 最終的な結果が同じになることは確認済みである.

　三鳳においては, 安定段位はトップ率とラス率の比率だけで求めることが可能である. 逆に言えば, 安定段位が分かればトップ率とラス率の比が分かることを意味する. 2位率が影響しないことは先述の通りなので, これを無視するとそれぞれの安定段位は一意のトップ率とラス率を持つように定義することが可能である. この2位率を無視したトップ率をT, ラス率をLとする.

　このとき, 以下の関係式が成り立つ.

T + L = 1
T = ( (安定段位) + 2 ) / ( (安定段位) + 11 )
L = 9 / ( (安定段位) + 11 )

　これは, 通常の順位分布における, 一度pt変動するまで打ち続けた場合のトップ率, ラス率と同義である. Tが求まればLも自動的に求まるため, 以降では記載の必要がある場合にはTのみを用いる.

　また, 三鳳十段原点を開始地点とした場合の安定段位別の昇段確率は以下の通りである.

$$
\begin{array}{}
& 7.0 &:& 2.2000\%& \\\
& 7.5 &:& 4.4075\%& \\\
& 8.0 &:& 8.3372\%& \\\
& 8.5 &:& 14.7745\%& \\\
& 9.0 &:& 24.2599\%& \\\
& 9.5 &:& 36.5224\%& \\\
&10.0 &:& 50.1810\%& \\\
&10.5 &:& 63.2665\%& \\\
&11.0 &:& 74.2381\%&
\end{array}
$$

　自明なこととして, 昇段確率は安定段位に応じて単調増加する. つまり, 安定段位が上の人の方が昇段確率は高いと言える.

2.2. 1戦単位での最適戦略を考える

　前項より, 安定段位が上昇すると昇段確率が上がることが分かった. しかし, これは長期的な視点によるものであり, 1戦単位での最適戦略が完全に同一であるかどうかは別途確かめる必要がある.

　現在, 1戦単位の戦略としては, pt効率を考慮した打牌選択が主流となっている. しかし, これは安定段位の最大化とは異なる場合があるため, どちらがより優れているのか検討しなければならない.

　まず, pt効率の最大化こそが昇段確率の最大化であると仮定する. この場合, pt効率上損である選択は, すべて昇段確率を下げるものでなければならない.

　ところで, 安定段位が8.0のとき, T = 10/19 ≒ 0.5263 である. この人が十段原点で打ち始めた場合, 昇段率は8.3372%である.

　ここで, 十段原点の状況で, オーラスに『ベタオリすると2着, 押すとトップ率55%ラス率45% (1)』の状況が発生したとする. ベタオリはpt期待値±0, 押した場合は-6.750ptであり, pt期待値上はベタオリ有利となる.

　ベタオリ時の昇段確率は十段2000ptのままであるため8.3372%だが, 押した場合の昇段確率を計算すると, 8.4150%と求まる. これは, pt効率上は損な選択であったにも関わらず, 昇段確率を上昇させていることを意味する.

　よって, 『pt効率の最大化こそが昇段確率の最大化である』とした仮定は誤りであったことが分かる.

　ところで, (1)の状況では, ベタオリの場合は T ≒ 0.5263, 押した場合は T = 0.5500 である. pt変動するならトップ率が高くラス率は低い方がいいため, これは後者の方が優れていると言える.

　押した場合の期待値は変えられないが, ベタオリ時の期待値は自身の実力次第で変動する. つまりこの場合, ベタオリ時にも T = 0.5500 になるような実力があれば, (1)では押しても降りてもよいということになる.

　T = 0.5500 となるような安定段位は9.0である. つまり, (1)の状況でベタオリ有利になるのは安定9.0以上の人のみだと言える.

　これは, 安定9.0相当の選択を取るのが得になるのは安定9.0未満の人で, 損になるのは安定9.0を超える人であるという非常にシンプルな話だが, これは安定段位を最大化する行動と完全に同義である.

　よって, ここでは『安定段位の最大化』=『昇段確率の最大化』であると結論付けるものとする.

3. 結論

　安定段位を最大化するのが昇段確率上は最善であり, これはpt配分の影響を受けない. よって, 段位によって打牌が変わる状況は存在しないと思われる.