見出し画像

「麻雀の強さパラメーター」による着順のモデリング

こんにちは、天鳳位の小江戸緑です。

先日、鉄強天鳳プレイヤーとして有名なおおわださんが以下のようなポストを投稿し、話題になりました。


この仮説を私なりに考察したので、本記事でその検証結果を示します。

結論から述べると、今回使用した数理モデルのもとでは、

・4人の固定メンツで卓を囲んだ場合、勝ち組である超鉄強と鉄強の間にも成績差は顕在化する

・4人の固定メンツの中で勝ち組になれるかは、自身の強さパラメータが卓平均強さパラメータを上回っているかが重要

ということが分かりました。

本記事は全文無料です。


仮説と検証事項

元ツイートに記載されている「100. 80. 50. 40」といった数値を「麻雀の強さパラメーター」と定義します。
これを基に、以下の仮説と検証事項について議論を進めます。

まず、元ツイート②の内容は明らかであるため、本記事では①の仮説に注目します。この仮説を要約すると、次のようになります。

仮説①:
1人の超強者・1人の強者・2人の中級者で卓を囲んだ場合、長期的には上位2人が勝ち越すものの、その成績差は大きく顕在化しにくい

また、この仮説を踏まえ、本記事では以下の問いを検証します。

検証事項:

  • 固定メンバーで長期的に勝ち越すためには、自身の強さパラメーターが卓の平均値より高いことが重要なのか?

  • あるいは、自身より弱いプレイヤー(強さパラメーターが低いプレイヤー)が複数人いることが重要なのか?

強さパラメータを用いた着順のモデリング

以下では、各プレイヤーの強さパラメータに応じて、着順が決定するモデルを組みました。
具体的には、以下のようなモデルを考えました。

Step1:
それぞれの強さパラメータに応じて、1着の人が決定します。

Step2:
残った3人で2着争いを行います。この際も、3人の強さパラメータに応じて2着の人が決定します。

Step3:
残った2人で3着争いを行います。同様に、2人の強さパラメータに応じて3着の人が決定し、最後に残った1人は4着になります。

つまり、強さパラメータに応じて1位→2位→3位→4位が順番に決まっていくモデルです。

1着から4着まで順に決定するモデルのイメージ

以下では数式が登場しますが、このモデルの概要を理解してもらえれば飛ばして頂いて問題ありません。
その場合は結果以降からお読みください。

強さパラメータはそのまま用いるのではなく、適切なスケーリングを施した上で指数変換しました。すなわち、元の強さパラメータ(100や50など)を$${\gamma}$$とすると、変換後の強さパラメータ$${\alpha}$$は、スケーリング係数$${\beta}$$を用いて以下のように変換しました。

$$
{\alpha = exp(\gamma / \beta)}
$$

$${\beta}$$は大きくすればするほど実力差が結果に影響しづらくなり、小さくすればするほど実力差が結果に大きく反映されます。
天下り的ではありますが、最適な$${\beta}$$をもとめることは本記事において重要ではないので、以下ではスケーリング係数$${\beta}$$を180と設定しました。
これは、結論から言えば、強さパラメータ100の人と40の人で平均順位に0.3程度差が生じる設定になっています。

以下では、変換後の強さパラメータ$${\alpha}$$を計算に用います。
「変換すると元のパラメータとは別物になってしまうのでは?」と思われるかもしれませんが、そもそも強さパラメータ自体に抽象的な意味合いが含まれる(例: 強さ80の人が40の人の"2倍"強いと解釈できるのか?)ため、変換処理を施すことに問題はないでしょう。

期待される着順分布の導出

1着率の導出

以下では、プレイヤー$${X (X=A, B, C, D)}$$が順位$${k (k = 1,2,3,4)}$$を取る確率を$${P(X = k)}$$と表記します。
また、各プレイヤーの変換後の強さパラメータを$${\alpha_X (X = A, B, C, D)}$$と表記します。

各プレイヤーの1着率は、それぞれの変換後の強さパラメータ$${\alpha_X}$$の比率に応じて決まるとします。
すなわち、以下によって求まります。

$$
{P(X = 1) = \frac{\alpha_X}{\alpha_A + \alpha_B + \alpha_C + \alpha_D}(X = A, B, C, D)}
$$


2着率の導出

例として、以下ではプレイヤーAの2着率$${P(A=2)}$$を求めます。

これは、A以外のプレイヤーXが1着かつAが2着の同時確率$${P(X = 1, A = 2) (X = B, C, D)}$$を足し合わせることにより求まります。
すなわち以下の等式が成り立ちます。

$${P(A=2) = P(B = 1, A = 2) + P(C = 1, A = 2) + P(D = 1, A = 2)}$$

さらにこの式は以下のように分解できます。

$${P(A = 2) = P(B = 1) \cdot P(A = 2 | B=1) + P(C = 1) \cdot P(A = 2 | C = 1) + P(D = 1) \cdot P(A = 2 | D = 1)}$$

仮にプレイヤーBが1着であった場合を考えると、この場合、プレイヤーA, C, Dで2着を争うことになり、この結果は先ほどと同様に各プレイヤーの強さパラメータに応じて決まると考えます。
すなわち、Bが1着の条件においてAが2着となる条件付き確率$${P(A = 2 | B = 1)}$$は以下によって求まります。

$$
{P(A = 2 | B = 1) = \frac{\alpha_A}{\alpha_A + \alpha_C + \alpha_D}}
$$

同様の計算を行うことから、各プレイヤーの2着率が求まります。


3着率の導出

例としてプレイヤーAの3着率$${P(A=3)}$$を考えます。
これは、A以外のプレイヤーが1着および2着であった時の6通りについて、プレイヤーAが3着となる同時確率を足し合わせることから算出できます。
すなわち以下の等式が成り立ちます。

$${p(A=3) = p(B=1,C=2)*p(A=3|B=1,C=2) + p(B=1,D=2)*p(A=3|B=1,D=2) + p(C=1,D=2)*p(A=3|C=1,D=2)+ p(C=1,B=2)*p(A=3|C=1,B=2) + p(D=1,B=2)*p(A=3|D=1,B=2) + p(D=1,C=2)*p(A=3|D=1,C=3)}$$

あとは2着率を求めたのと同様にして計算すれば良いです。


4着率の導出

各プレイヤーの1着率, 2着率, 3着率がもとまっているので、4着率は1からそれらを引けば算出できます。


結果:実際の期待着順分布の計算結果

上記の計算式を用いて、いろいろな強さパラメータについて実際に計算を行ってみました。


強さパラメータ[100, 80, 50, 40]の場合

おおわださんの元ツイートの例①にある、4者の強さパラメータが[100, 80, 50, 40]における結果は以下になりました。

強さパラメータ[100, 80, 50, 40]の4者で卓を囲んだ結果

4者の平均強さパラメータが67.5なので、プレイヤーAとBは平均以上、CとDは平均以下ということになり、実際にAとBの平均着順が2.5を下回っていることから勝ち越していると言えます。

プレイヤーAとBの平均着順には0.1以上の開きがあり、超鉄強のAと鉄強のBの間でも成績差は顕在化していると言えそうです。

結果:
同じ勝ち越し組でも、超鉄強Aと鉄強Bの間で成績差は顕在化する


強さパラメータ[100, 100, 80, 80]の場合

おおわださんの例②に当たります。おおわださんはこれを鳳凰卓想定と仰っていました。
結果は以下になりました。

強さパラメータ[100, 100, 80, 80]の4者で卓を囲んだ結果

鳳凰卓に当てはめれば、強さ100が十段、強さ80が七〜八段くらいですかね。
その4人で無限に卓を囲めば十段クラスのプレイヤーAとBの平着が2.45, 七〜八段クラスのプレイヤーCとDの平着が2.55と予想されました。
なんとなくありそうな数値ですね。


強さパラメータ[100, 70, 60, 50]の場合

4者の強さパラメータが[100, 70, 60, 50]の場合を調べました。
結果は以下になります。

強さパラメータ[100, 70, 60, 50]の4者で卓を囲んだ結果

4者の強さパラメータの平均が70なので、プレイヤーBは4者の中では2番目に強いが、強さパラメータは平均値」ということになります。

結果を見ると、プレイヤーBの平均着順はちょうど2.5となっており、勝っても負けてもいないことが分かります。

これがたまたまなのかどうか、別の例でも見てみましょう。


強さパラメータ[100, 40, 10, 10]の場合

4者の強さパラメータが[100, 40, 10, 10]の場合を調べました。
結果は以下になります。

強さパラメータ[100, 40, 10, 10]の4者で卓を囲んだ結果

超鉄強Aと初心者C・D, そして普通の雀力のBで卓を囲んでいるイメージでしょうか。

卓の平均強さパラメータは40であり、これはプレイヤーBの強さに一致します。
結果を見ると、これまたBの平着は2.5になっていることが分かります。

よって、以下の結論が導けます。

結果:
4人の固定メンツで勝ち組になれるかどうかは、4人の中で自分が何番目に強いかは重要ではなく、卓の平均強さパラメータに比べて自分の強さがどうかが重要である


考察とまとめ

今回のモデルを用いた結果としては、
同じ勝ち越し組でも、超鉄強Aと鉄強Bの間で成績差は顕在化する
という結論が導かれました。

これはおおわださんのツイートの仮説
1人の超強者・1人の強者・2人の中級者で卓を囲んだ場合、長期的には上位2人が勝ち越すものの、その成績差は大きく顕在化しにくい

に反する結果となりました。

ただし、今回のモデルでは強さパラメータに応じて着順が変化するモデルを立てました。
このようなモデルのもとでは、強さ100と強さ80の間でそれなりの成績差が出るのは、ある意味当たり前の結果とも言えます。

モデルとは、あくまでも現実の複雑な事象を簡略化したものです。
必ずしも本結果が正しいと鵜呑みにできるとは、私自身思っていません。その意味では、おおわださんの仮説が否定されたとも思いません。

モデルの是非について考えていくと、今回は強さパラメータを用いてモデル化しましたが、「強さの数値化って何…?」という哲学問題に入り込んでいくことが避けられないように感じます。
そしてこれは話が長くなりそうなのでここでは考察しないことにします。

あくまでも「本モデルのもとでは、同じ勝ち越し組でも超鉄強と鉄強の間で成績差は顕在化する」という結論が得られたと認識していただければと思います。

さて、もう一点興味深かったのは、固定メンツの中で勝ち組になれるかは「卓平均強さパラメータに比べて自分がそれを上回っているか」が重要ということでした。

その意味では、卓に一人鉄強がいるのがめちゃくちゃ損ということが分かります。
卓に一人いわゆる"カモ"がいるのを有り難いと思っている人がいるかもしれませんが、卓に鉄強を入れないことはそれと全く同様に重要ということですね。



いかがでしたでしょうか。

本noteは以上になります。

今回は愚直に順位期待値を計算しましたが、もっと上手くやれそうな気もしました。
計算についてのコメントや助言なども歓迎しています。

記事が面白かったという方は記事のご購入していただければ大変励みになります!

引き続きよろしくお願いいたします。

ここから先は

0字

¥ 100

期間限定!Amazon Payで支払うと抽選で
Amazonギフトカード5,000円分が当たる

この記事が気に入ったらチップで応援してみませんか?