麻雀における正解
麻雀には正解がある。
偶に耳にする理由が説明できるならどの選択をしても正解というのははっきり言ってしまえば噓である。
だがこの言葉はただの出鱈目ではなく分かりやすくするために隠された真意があると思う。つまり本当は
「理由が説明された選択はその選択が間違いであると証明されない限り正解の候補の1つとして除外できない。」
これが正しい説明と言えるのではないだろうか。
では麻雀における正解とは何だろうか?少し考えてみよう。
GTO戦略
私が思うに麻雀の正解は2種類ある。
そのうちの一つがGTO戦略である。一般的に多くの人が想像する正解はこちらであるだろう。
GTO戦略とは簡単に言うと「その戦略に有利になる戦略が無い戦略」でありこれに勝ち越す戦略は理論上存在しない(最高で引き分け)。一般的に正解というとこれを指すことが多いかと思う。
例を挙げよう。
グーで勝つと3点チョキとパーで勝つと6点のへんてこジャンケンをする。このゲームのGTO戦略はグーチョキパーを2:2:1でランダムに出すことである。
つまり特定の戦略に対して最大限の利益を出す戦略ではなくどんな戦略に対しても負けない戦略がGTO戦略と言える。
では麻雀におけるGTO戦略とはどんなものになるか。
複雑すぎて解明されることは無いと思うが、もしGTO搭載のAIが作られたなら例えば70%1萬切り30%2筒切りのような回答を示すことになるだろう。
エクスプロイト戦略
もう一つの正解がこのエクスプロイト戦略である。
これは相手の弱点を突く戦略であり先のへんてこジャンケンだと「この相手チョキしか出さないじゃん、グーばっか出したろ」というのがエクスプロイトである。
つまり先に話した特定の戦略に対して最大限の利益を得ようとする戦略がエクスプロイト戦略の本質と言える。どんな戦略であってもそれをエクスプロイトする戦略で戦おうというのがもう1つの正解であり相手がGTO戦略でさえ無ければ理論上は成立する。
麻雀における期待値の最大化とは?
そもそも期待値とは何か?局収支なのか、半荘収支なのか色々あるのだが通常は局収支を期待値と呼ぶことが多い。
まず多くの人が実際期待値の数値として思い浮かべるのは昨今においては統計やシミュレーターによるものだ。局収支とはそれが(起こる確率)×(その報酬)の各事象の和であり報酬にはマイナスのものも含む(放銃とか)。なので和了率や放銃率、流局、横移動などの確率を算出するがその値が統計データからきている。
即ち「科学する麻雀」や「統計学の麻雀戦術」に見られる最善手は本質的にエクスプロイト戦略である。どの選択または戦略をエクスプロイトしているのかというと統計データ元のフィールドの平均の選択または戦略である。
この場合の局収支は対戦相手によって変動する。統計を取ったデータ元が天鳳の鳳凰卓なのか、雀魂の玉の間なのか、Mリーグなのか、特定の雀荘なのかによって恐らく局収支は変化するだろう。
よって期待値で麻雀を打つ(期待値を最大にする)のが正解というのは対戦相手を決めていない状態では現時点においては厳密には成立しない(実現できない)回答と思う。
統計視点の最善手と本当の最善手の比較
麻雀の正解は挙げた2種類のいずれも存在はするが現時点では解明できないと思う。では多くの人が正解を探る手段として用いる統計視点の選択(以下統計的選択と呼称する)は本当の正解にどのくらい近いのだろうか?
Mリーグはサンプル数が足りないし、この記事を読んでる人は多分Mリーガーじゃない(「私、Mリーガーです」って方がいらしたら申し訳ない)ので、戦場を天鳳鳳凰卓とし天鳳鳳凰卓の統計データやそれを元に作られたシミュレーターから得た統計データを用いて得た選択を考えてみる。ただしこれは十分に精査された完全なものという前提で話す。現時点で開示されたものも十分素晴らしいと思うが筆者の能力ではその完成度を評価できないからである。
私が考えるに統計的選択が完全な研究からくるなら例えばAIに搭載する思考としては正解か限りなくそれに近いものになると思われる。
もちろんフィールドの平均に対するエクスプロイトであるため打ち手が平均から離れるほど正解から離れる可能性は高まる。またこのAIの思考が開示されたならそのAIに対して有効なAIを開発することも理論上は可能になる。ただし統計的選択をするAIをエクスプロイトするAIは鳳凰卓での最善にはならない。さらに言うと鳳凰卓の打ち手の技術が変化すればこの統計的選択搭載AIはアップデートしないとエクスプロイト的最善からは外れてしまうだろう。
誤解無きよう言っておくとこれは研究が完全である場合であり現在の統計的選択は完全な研究からは遠いと思う。だから今のそれを正解と信じて他の考えを排するのは危険な思想だとも思う。ただし軽んじるのはいけない、現在の研究は少数の有志の方が多くの労力を持って光無き闇夜に松明を灯してくれたようなものだ。「妄信するな」「過信するな」と言っているのであって馬鹿にすることなど許されることではない。
統計的選択の先に真の強さを追い求めることは最強への道の1つだと私は思う。ただしそれはGTO戦略を正解とした時には恐らく正しくはならない。
私たちが強くなるために
では私たちは何を目指してどのように強くなるのが良いのか?
GTO戦略を探るのか?統計的に場をエクスプロイトするのか?個々人のデータを採取し全ての個人に対するエクスプロイトを目指すのか?それとも他にもっと良い道があるのか?
正直に言うと人それぞれだろうなと思う。間違った理論で無ければ如何なるアプローチも面白いし興味深い。
なら私自身はどうか?
私は全部を知りたいなと思っている。1つに依らず色々な理論を見たいし聞きたいし語りたい。
受け入れ枚数を数えたり、統計データをみて選択期待値を比較したり、牌譜を見たり、相手の捨牌から手牌を予測したり、選択理由を列挙してみたり。
だから間違いだと証明されない限りどんな話も聴きたいと思う。
だってそれ「正解」かもしれないんだもん。
まとめ
ごちゃごちゃに記載したため最後にまとめよう。
1、麻雀に正解はあり、GTOとエクスプロイトの2種類が考えられる
2、理論として正解足りうるGTOは複数の正解を示すことがある
3、統計的選択はエクスプロイト的な正解への道
4、今の我々にはいずれの方法でも正解を導き出すのは無理
正解が分からないから何でも正解なんて暴論だと思う。真面目に真摯に真剣に麻雀を勉強して研究している人達は正解なんて到底見えないのを承知の上で苦心したり楽しんだりしながらこの道を歩んでいるのだ。
ただ「お前の打ち方間違ってる」とか「下手くそ」とか安易に言っちゃう人は自分は麻雀をそんなに知っているのかと一度胸に手を当てて考えてみよう。
真剣だからそれを貶められるのが許せない事と真剣に何かを為そうとしている人を貶める事は同列じゃないと思う。
この記事が気に入ったらサポートをしてみませんか?