麻雀におけるツモ和了確率に関する研究
Abstract
麻雀におけるテンパイした後の経過順目に対するツモ和了確率を数値計算によって調べた。その際、他家からのロン和了がない、他家の和了がないことを仮定して、ツモ和了する順目の確率分布をテンパイした順目と待牌数から構成した。数値計算の結果、先行研究で得られた結果とは異なる結果を得、その原因を先行研究では1回ツモるごとに減る山の牌数を正しく考慮できていなかったためだと特定した。また、期待値についても考察を行い、「自分がテンパイしてから何順目で和了することができるのか」について定量的に答えられるようになった。
Introduction
麻雀
麻雀は老若男女に楽しまれるボードゲームであり、近年Mリーグなどの設立によって世間的な盛り上がりを見せている。ゲーム理論の言葉では、麻雀は不完全情報ゲームと呼ばれる、意思決定を行う際に他のプレイヤーの行った意思決定を確認することができないゲームに分類される。さらに、将棋やオセロなどと違い、手牌やツモは確率的にランダムであるため、決定論的に勝敗は決まらない。それゆえ、プロと初心者が戦っても一局単位で見れば初心者が勝つことができる点、期待値的に不利な状況でも逆転することができる点が魅力的なゲームである。
麻雀は4人のプレイヤーが13枚の牌を持ち、順番に牌山から牌をツモり、1枚を捨てることを繰り返す。その中で特定の役を手牌で作ることで和了し、役に応じた点数を得ていくゲームである。よって、プレイヤーはなるべく早く和了し、かつ高い点数が得られるように手牌を組んでいく。
しかし、それだけではなく安全さを考えて手牌を組むことも必要である。なぜなら、自分が捨てた牌が相手の待牌である時には、点数を払わなければいけない「ロン和了」となってしまうからである。よって、プレイヤーはなるべく相手の待牌にならないような牌を切ることが求められる。これは、先の二つとは相反する要素であり、トレードオフの関係になる。
ここで、いくら安全さを考えていたとしても、危険な牌を切らなければならない状況がある。それがテンパイと呼ばれる、あと1牌で和了が成立する時である。よって、テンパイしている状況はできるだけ短い方がいい。
ツモ和了確率を考える意義
以上からプレイヤーは、究極的に、安全を一切捨ててテンパイの状況を維持するか和了の可能性を捨ててテンパイの状況を放棄するかを選択しなければならない。その時の判断材料として、待牌数がある。待牌数はテンパイ形や河にある枚数によって変化する。テンパイ形にはリャンメン待ち、カンチャン待ち、単騎待ちなどがある。以下はリャンメン待ち、単騎待ちの例である。
リャンメン待ちであれば、待牌数は最大で8枚である一方、単騎待ちであれば、待牌数は最大で3枚であり、前者の方がテンパイしてから和了するまでの順目は少ないと期待できる。待牌数はここから河にある待牌を除いた数になる。
先に述べたように、麻雀では手牌やツモは確率的であり、どれくらいの順目で和了できるかも確率的である。よって、テンパイしてから和了までの順目も決定論的ではない。待ちが悪くても(待牌数が少なくても)、テンパイしてから次の順目でテンパイするかもしれないし、待ちが良くても、全てのツモ回数(18回)をかけても和了することができない(流局)かもしれない。特に、順目が深くなると、ツモ回数が少ないために、いい待ちでも和了率は高くないことが予想される。
よって、テンパイしてからの和了率や和了時の点数期待値を考えることで、待牌数よりも精度良く意思決定を行うことができる。
先行研究
今回扱う「テンパイしてから何順で和了することができるか」という問いに対して、いくつかの先行研究がある。
アンモナイト鈴木は2021年に「鳴きや他家の和了、他家の放銃がない仮定の元でのツモ和了確率」を理論的に構成している。
そこでは、n枚の牌山にa枚のあがり牌がある時、r回のツモでツモ和了する確率を「和了しない事象(n枚からr回ツモった時にa枚あるあがり牌が1枚も入っていない確率)の余事象の確率」として定義している。
しかし、この余事象の中には、「複数のあたり牌をツモるという事象」も含まれているため、今考えている確率とは異なっていることが考えれられる。和了は、あたり牌を1回ツモった時点で発生し、それ以降はツモは行われないからである。
また、近年ではNAGAなどの麻雀AIが進歩している。麻雀AIは、熟練者の牌譜を学習することで、手牌や山の牌数、河などの複雑な入力から、切るべき牌や和了確率、和了時期待値を出力することができる。これによって、人間は定量的な指標に基づいて自分の戦略を評価できるようになり、雀力向上に役立てることができる。
しかし、AIの行なっていることはブラックボックス化されており、具体的な状況が与えられて初めて意味を持つ。これでは、AIを使うことができない状況(リアルでの麻雀)で判断材料にすることはできない。また、雀力を向上させるためには、出力を解釈する必要があり、結果定性的な理解にとどまってしまう。
本研究の意義
本研究は、これまでの課題であった
個人の雀力が求められる場合では、テンパイを維持するかどうかを判断する際の定量的な指標がない
正確な理論モデルが構築されていない
という問題点を解決することを目的とし、特定の仮定の元で、テンパイしてから和了するまでどれくらいかかるのかについての確率分布を構成した。これによって、
テンパイを維持した時にどれくらいの確率で和了することができるのか
和了時の点数期待値はどれくらいなのか
を事前に知ることができ、先の課題を解決することができる。特に、6順目、12順目でテンパイした時の各待牌数に応じた和了順目の期待値を知ることで、より精度良く意思決定をすることができるだろう。
本noteの構成
本noteは以下のように構成されている。Settings and Modelでは、今回の状況や仮定、確率分布の構成方法を定量的に示している。Results and discussionでは、構成した確率分布の値を数値的に解析した結果と、そこからわかることを述べた。
Settings and Model
今回考える状況・仮定は以下の通りである。
自分は東家
ツモ回数は18回
鳴きはない
他家は和了しない
他家は自分に放銃しない
ここで、ツモ順目を$${t (1\le t\le 18)}$$、自分がテンパイした順目を$${\tau}$$、待牌数を$${n}$$、順目$${t}$$の時の牌山の枚数を$${N_t}$$をする。
ツモ和了確率の構成
今回求めたい$${\tau}$$順目に待牌数$${n}$$のテンパイをしてから$${m}$$順目までに和了する確率を$${P(m;\tau,n)}$$と表す。ここで$${m}$$は$${1\le m\le 18-\tau}$$を満たす。
この時、$${P(m;\tau,n)}$$は「$${\tau}$$順目に待牌数$${n}$$のテンパイをしてから$${k}$$順目に初めて和了する確率」$${p(k;\tau,n)}$$の累積確率として書くことができる:
$$
P(m;\tau,n)=\sum_{k=1}^{m}p(k;\tau,n).
$$
ここで、$${p(k;\tau,n)}$$は「$${\tau}$$順目に待牌数$${n}$$のテンパイをしてから、$${1}$$から$${k-1}$$順目まではあたり牌をツモらず、$${k}$$順目にあたり牌をツモる確率」である。順目$${t}$$にあたり牌をツモる確率は$${\frac{n}{N_t}}$$、ツモらない確率はその余事象の確率なので$${1-\frac{n}{N_t}}$$である。よって
$$
p(k;\tau,n)=\frac{n}{N_{\tau+k}}\prod_{t=1}^{k-1}(1-\frac{n}{N_{\tau+t}})
$$
である。以上から、求める確率は
$$
P(m;\tau,n)=\sum_{k=1}^{m}\frac{n}{N_{\tau+k}}\prod_{t=1}^{k-1}(1-\frac{n}{N_{\tau+t}})
$$
であり、$${N_{t}=136-4(t+13)=84-4t}$$(牌全体から、4人分の捨てた河と手牌をのぞいたのが牌山数)であるから、$${\tau}$$順目に待牌数$${n}$$のテンパイをしてから$${m}$$順目までに和了する確率は
$$
P(m;\tau,n)=\sum_{k=1}^{m}\frac{n}{84-4(\tau+k)}\prod_{t=1}^{k-1}(1-\frac{n}{84-4(\tau+t)})
$$
である。特に、$${\tau}$$順目に待牌数$${n}$$のテンパイをした時、その局で和了する確率は$${P(\tau,n)=P(18-\tau;\tau,n)}$$とすればわかる。
ここで、一般には$${\sum_{k=1}^{18-\tau}p(k;\tau,n)\neq 1}$$である、すなわち$${p(k;\tau,n)}$$は確率分布の定義は満たしていないことに注意する必要がある。確率分布の定義を満たすようにするためには、例えば$${1\le k\le 19}$$に対して
$$
p(k;\tau,n)=
\begin{cases}
\frac{n}{136-4(\tau+k+13)}\prod_{t=1}^{k-1}(1-\frac{n}{136-4(\tau+t+13)})& 1\le k\le 18-\tau\\
1-\sum_{k=1}^{18-\tau}p(k;\tau,n) & k=19-\tau
\end{cases}
$$
と定義すればいい。この$${k=19-\tau}$$での確率は流局確率である。
和了順目の期待値の定義
和了順目の期待値を考えることは、テンパイ維持判断をする上では重要であった。ここで、和了順目の期待値の素朴な定義は次である:
$$
\mathbb{E}[k;\tau,n]=\sum_{k=1}^{18-\tau}kp(k;\tau,n).
$$
しかし、この定義には問題がある。それは、先に述べたように、一般に$${p(k;\tau,n)}$$が確率分布の性質を満たしていないことである。
流局したことの順目による評価値を$${k'}$$とすれば、和了順目の期待値の正確な定義が次のように書ける:
$$
\mathbb{E}[k;\tau,n]=\sum_{m=1}^{18-\tau}kp(m;\tau,n)+k'(1-\sum_{k=1}^{18-\tau}p(k;\tau,n)).
$$
$${k'}$$はあらかじめ決めておく必要があり、例えば$${k'=19-\tau}$$などとする。
条件付き期待値による和了順目の期待値の定義
先の和了順目の期待値の定義には、流局の順目による評価値$${k'}$$の不定性があった。これによって、結果にも不定性が生じるため、慎重に決定しなければならない。ここではそのような流局における不定性をなくすため和了した時の条件付き期待値を考える。これから、和了した時に自分は運が良かったのかを評価することができる。
$${\tau}$$順目に待牌数$${n}$$のテンパイをした時、その局で和了する確率は$${P(\tau,n)=P(18-\tau;\tau,n)}$$だったので、条件付き期待値は
$$
\mathbb{E}_A[k;\tau,n]=\frac{1}{\sum_{k=1}^{18-\tau}p(k;\tau,n)}\sum_{k=1}^{18-\tau}kp(k;\tau,n)
$$
である。
Results and discussion
ここでは次の結果を示す:
6順目にリャンメン待ち$${(\tau=6,n=8)}$$でテンパイした時のツモ和了確率の本研究の結果と先行研究での結果の比較
6順目、12順目$${(\tau=6,12)}$$にリャンメン待ち、単騎待ち$${(n=8,3)}$$でテンパイした時のツモ和了確率
6順目にリャンメン待ち$${(\tau=6,n=8)}$$でテンパイした時の和了順目の期待値と流局の順目による評価値$${k'}$$に対する依存性、条件付き期待値との比較
1.ツモ和了確率で見る本研究と先行研究の比較
6順目にリャンメン待ち$${(\tau=6,n=8)}$$でテンパイした時のツモ和了確率の本研究の結果と先行研究の結果は次のようになった。
これから先行研究の結果と本研究の結果には差があることがわかる。
どの順目においても本研究の結果が先行研究の結果より大きいことは、「先行研究で考えていた和了する事象の数は、複数の牌をツモる事象を含んでいるために、実際の事象の数よりも多い」ことと反している。
これを考察するために、簡単のため、$${\tau=1,n=2}$$の場合を考え、$${k=2}$$回のツモで和了しない確率を比較する。すなわち、本研究で考えている和了の余事象の確率が先行研究でのそれの余事象の確率より小さいことを理解できればいい。
先行研究での2回のツモで和了しない確率は
$$
\frac{_{N_{2}-2}C_2}{_{N_{2}}C_2}=\frac{(N_2-2)(N_2-3)}{N_2(N_2-1)}=(1-\frac{2}{N_2})(1-\frac{2}{N_2-1})
$$
である、本研究でのそれは「$${N_2}$$個の牌から2個のあたりをツモらず、$${N_3}$$個の牌から2個のあたりをツモらない確率」なので
$$
(1-\frac{2}{N_2})(1-\frac{2}{N_3})=(1-\frac{2}{N_2})(1-\frac{2}{N_2-4})
$$
である。
これらの比をとると
$$
\frac{1-\frac{2}{N_2-4}}{1-\frac{2}{N_2-1}}<1
$$
となるため、この場合、本研究で考えている和了の余事象の確率は先行研究で考えているそれよりも小さいことがわかる。より一般な場合でも同様の結果が得られることは$${\tau=1}$$の場合の式を考えれば良い。
先行研究での$${k}$$回ツモって和了しない確率:
$$
(1-\frac{n}{N_2})(1-\frac{n}{N_2-1})\cdots(1-\frac{n}{N_2-(k-1)})
$$
本研究での$${k}$$回ツモって和了しない確率:
$$
(1-\frac{n}{N_2})(1-\frac{n}{N_2-4})\cdots(1-\frac{n}{N_2-4(k-1)})
$$
において、$${i}$$番目の因子を比較すると
$$
1-\frac{n}{N_2-4(i-1)}\le 1-\frac{n}{N_2-(i-1)}
$$
であるため、本研究で考えている和了の余事象の確率は先行研究で考えているそれよりも小さい。また、ツモ回数$${k}$$が増えるほど、差が大きくなるというグラフの性質も理解できる。
先行研究では連続してツモっており、1回のツモ毎に山が1枚ずつしか減っていないのに対して、本研究では1回のツモ毎に山が4枚ずつ減っていくことを考えているために生じた差であることが考察できる。
2.各順目、各テンパイ形毎のツモ和了確率
6順目、12順目$${(\tau=6,12)}$$にリャンメン待ち、単騎待ち$${(n=8,3)}$$でテンパイした時のツモ和了確率は次のようになった。
これから次のことがわかる。
その局に和了できる確率は、6,12順目テンパイの場合どちらも、単騎待ちよりリャンメン待ちの方が1.5倍程度大きい。
6順目テンパイと12順目テンパイを比較すると、その局の和了率はおよそ0.1違う。
3.和了順目の期待値と流局の順目による評価値に対する依存性、条件付き期待値との比較
6順目にリャンメン待ち$${(\tau=6,n=8)}$$でテンパイした時の和了順目の期待値と流局の順目による評価値$${k'}$$に対する依存性と条件付き期待値は次のようになった。
これから次のことがわかる。
6順目のリャンメン待ちテンパイは5,6順後に上がることができる。
6順目のリャンメン待ちテンパイでは、条件付き期待値と不定性ありの期待値に差はない。
Conclusion
本研究では、麻雀におけるその局のツモ和了確率をテンパイした順目と待牌数から構成し、経過順目の期待値も定義した。これによって、今までブラックボック化していたテンパイ維持判断の根拠を定量的に考えることができるようになった。先行研究と比較・考察し、期待値の不定性や条件付き期待値の比較も行なった。
今後の展望としては、
テンパイした順目に対する和了確率をプロットすることで、経過順目が和了確率に与える影響について考察する
課した仮定を緩めていく
他家がテンパイしている時に、互いの待ちによって自分の和了率がどう変化するのかを考察する
がある。特に2つ目はモデル自体の複雑化が求められるため、定式化が困難になることが予想される。
何か疑問やコメントがあればぜひ!!