見出し画像

続・るなすぺ楽屋裏「NAGAとハサミは使いよう」

さて、だいぶ間隔が空いてしまったことですっかり忘れていたが、めでたく再びるなすぺのメンバーとなれたこともあって、こちらのシリーズもせっかくなので継続してみようと思っている。

今日のテーマはみんな大好き麻雀AIのNAGAの話。

新生るなすぺのメンバーを最初に見た時に抱いた率直な感想は、メンバー全体の最低ラインはある程度保証されている一方、突き抜けた鉄強みたいな存在がいるわけでもないので、安定してスコアを伸ばしていけるように全体能力の底上げを進めて平均値を上げる、という方針になりそうだな、というところだ。育成枠のねむちゃんも育成枠同士の比較で見れば相当強い方だと思っているし、他メンバーも極端な打ち方をする人も居ないので弱点らしい弱点は無い反面、はっきり言えば強烈な武器と言えるものも無い。だからこそメンバー全員を通した全ての打牌の「最低ライン」を上げることが重要になるし、逆を言えば突出した武器が無くとも、団体戦はそれだけで充分に勝機があると思っている。

この状況で一番最初に脳裏に過ったことは、ゆきさんとフレアさんを今より更に強く出来たらかなり全体戦力は上がりそうだけど、実際問題それを実現するのは結構難易度高そうだな、という悩みである。今だから言える話ではあるが、私は前期で同じ悩みに遭遇している。ゆきさんの打ち筋は、体系的にアドバイス出来るほどの目立った弱点のようなものは多くない。チーム力の底上げのためにも本人の地力向上に貢献出来ることが無いか、と何度か思案したことがあるが、最後まで体系的に理論立てて伝えられるようなものは出て来ず、場当たり的にバランスを補正するようなアドバイスばかりになってしまった(それでも本人が自分の糧として昇華出来ているのは素直に凄いことだと思う)。フレアさんも近しいタイプで、総合力が高く、過度なリスクを取るような脆さも無く、酷い牌はまず打たない。良く言えばバランスが良くまとまった打ち方と呼べるが、逆に言えば成長するためのポイントを見つけるのがなかなかに難しい。

更に困ったことに、同じく今期でチームメンバーになったさたん(あかさたさん)が、自分と丸被りに近いようなスタイルの「手組がちょっと雑だけど押し引きめっちゃ頑張ります」みたいなタイプだったこともあり、序盤の手組み辺りの話に関しては理論らしい理論を伝えられる人がチーム内に存在しない、という緊急事態を初手で迎えてしまっている。

この辺を外野に求めるのもまた一興、とも思ったりしたが、手組みの精密さでパッと思い付く人間だったりペンギンだったりは、ライバルチームに在籍していて表立って協力を求めるのも少し気が引けるということもあって、今回はNAGAの力を借りてみるという結論に至った。

大前提の話からするが、私はボードゲームのAIの中でも麻雀に関するものはまだまだかなり利用価値が限定的だと思っていて、その理由としては細かいことを書くと結構色々出て来るのだが、中でも「市場の中で一般化されたルールが存在せず、多種多様」という点が大きいと思っている。「将棋のAIはルールとして二歩を知らない。学習しているデータの中に二歩が存在しないために打たないだけ」という話は良く知られたものであるが、仮に将棋のルールの中に「二歩OK」「打ち歩詰めOK」、極端な例で言えば「八方桂」みたいなカスタムが一般的に存在する世界線の中に飛び込ませてしまうと、現行の将棋のAIは急激にその力が弱くなる、もしくはそもそもまるで使い物にならない可能性がある。何故かと言えば、歩を縦に二つ置かれた盤面のデータが一般的に棋譜として存在しないので、どんな挙動をするかが開発者側も想定出来ないからだ。将棋の例はまあちょっと極端な事例に聞こえるかもしれないが、麻雀ははっきり言ってそれより遥かにバランスが変わるようなルールで打っているケースが多くある。赤牌の有無や一発裏の有無だけでも、手役を残せるか、とか表ドラを持っている枚数のようなファクターの重みが全然違ってくるので、現行のAI(特に赤牌が存在することを前提として設計されたもの)はフィールド次第でははっきり言って全く役に立たないと言っても過言では無いだろう。

仮に赤牌の有無や一発裏などの基本ルールが似たようなパターンであっても、順位点に関しては主流どころだけでもかなりの種類があり、特に天鳳や雀魂(魂天を除く)の段位戦に代表されるような3着⇔4着間の順位点差が一番大きいルールと、トップにオカが付くMリーグルールのような極端な事例を比較すると、半荘後半の打牌選択はどうしてもまるで違うものになってしまう(もちろんこれはゲームとして健全だと思っている)

私自身の普段のフィールドで言えば、順位点差が2着⇔3着間が最も大きい段位戦と、トップにオカが付くリーグ戦となるため、天鳳の牌譜を深層学習に利用しているNAGAはそういった順位点に関わる条件を考慮する場面での選択においては微妙なジャッジをしてしまうかもしれない、といったリスクも想定出来る。が、そういった考え得るマイナス要素を全て込みで考えた上で、私はNAGAを利用して検討をすべきだと結論付けるに至った。

理由となったのは大きく分けて次の3つだ

①「抽出」のコストのショートカット
今回の狙いは自分の打牌のブラッシュアップももちろん要素として含まれているが、一番の狙いはチームの総合力の上昇である。打牌全打を検討するのは正直時間も掛かるし、人間の抽出よりNAGAにやってもらった方が漏れもないので、単純に洗い出しはNAGAに任せて、「これは人間は打てなくていいよ」という手と、「流石にこれは本当に大損だから変えよう」という手に仕分けが出来さえすればいいと考えている。大差損の抽出に関しては、間違いなく人間がやるより効率的に、正確にやってくれるだろう。

②精神的ダメージをNAGAに癒してもらえるケースもある
NAGAをちょっとだけ使ってみて最初に思ったのは、「放銃を肯定してくれる」という優しい側面である。人間が言う「今の放銃は仕方ない」という台詞には、多分に同情の意味合いだったり、心遣いだったりという情緒的な側面が含まれてしまう可能性があるが、NAGAが押せといったもので放銃した、となると途端にその根拠の強くなった気がしないだろうか。血も涙も無い蛇だからこそ見せる優しさがある、というのは個人的には大きな気付きだった。

③世間で言われるほどには順位点の規定が打牌選択を変える局面は多くないし、それは気付けるものでもある。
トップ取りの麻雀とラス回避の麻雀がまるで違うゲームのように捉えられることもあるが、実際問題、言うほどに打牌に影響はしていない、と私は考えている。というのも、実際に特南を打ち続けて十段まで至ったNAGAの実績を見ればわかる通り、ある程度現実的に取れるトップは取らなければならないし、連対が残せる時は残さなければならない。着順の分布で変えられる部分はそう大きくはない。もちろん分散を大きくするか小さくするかは打牌選択で制限出来る範囲ではあるので、ラスを引きたくないが故に期待値を犠牲にして分散を小さくする、といった行動は終盤に限れば日常的に取られるが、逆を言えば影響範囲はその程度である。半荘の頭からラスを回避しにいく人間はいないし、それはNAGAも同様である。トップを取りにいって、序盤で躓いたら取れる着順を取りにいく。その度合が、順位点によって多少変わる程度の話だ。ここに関しては人間の方が鳳凰卓の深層学習であるという前提にこだわり過ぎず、人間の方がもう少しフラットな目線で見て、使い方を考えてあげればいいだけだと思っている。

と、まあここまでがおおまかな導入の経緯になるわけだが、ここから、タイトル回収という程ではないが、ある程度使ってきて気になったNAGAの癖だったり、活かし方のコツみたいなものが若干見えてきた気がするので備忘録として記しておきたい。

場面の重要度がわかりにくい

知らんがな

これはNAGAを日常的に使ってる人あるあるだと思うのだが、字牌の切り順に結構うるさい。「役牌の中では自風を大事にした方がいい」くらいの、1年打ってたら何度かそれで損得分かれてくるような大きな要素を含んだものなら分かるが、オタ風とオタ風の順番なんてどうでもいいのでは?と言いたくなることがしばしばある。

これは「情報の重み付け」という観点でここは注意が必要だ。「これはNAGAが大差で損と言ってるんだから、きっと損なんだ!」と思い込んで、字牌の切り順にばかり意識を割いて序盤進行するところから手組みを覚えてしまうと、それは優先度を大幅に間違えてるぞ、という話になってしまう。厳密に言えばオタ風は鳴かれたら嫌なものから順に放すべきだ、という理屈は充分納得出来るものだが、数多くのエラーを抱える人間が、打順通りに見ていく場合、ここに目を止める時間がもったいない、と私個人は正直思う。

NAGAはその打牌が対局全体に対して影響を与える度合いが分かりやすい形では視覚化されていない(頑張って放銃率とか和了率の推移から逆算したら分かるかもしれないが)。このUIで特に何も意識せずに打牌の振り返りをすると、一つの場面の打牌の一致不一致のみにフォーカスしてしまって、場面自体の重要度という極めて大事な要素を容易に見落とす可能性がある、というデメリットがある。先述した字牌の切り順のケースはその典型で、勝敗にほとんど影響しないような場面の99対1で1を選択してしまっても、勝負に大きく関わる場面での60対40で60を選択出来た方がトータルで好成績に繋がりやすいのは自明の理である。

一致率を上げることを目的化しない

元々ここで書きたい内容が本旨、と言っても過言ではないくらいに重要な話なのだが、最近NAGA度という明確なベンチマークが出来てしまったが故に、尚更ここを盲信してしまう人が増えそうなので念押しで書いておきたい。これは敢えて有識者の見解を見るために数回に分けて似たような内容のツイートをして各所の反応を見ていたのだが、やはり天鳳で打ち慣れている人の中でもある程度の共通見解となってそうなので自信を持って書こうと思う。
NAGAとの打牌の一致率そのものを漠然と上げていこうとすると、一番合致させやすいのは第一打だ。立体の複雑な変数を考慮する必要が無いので、形の認識と方針を大きく間違えなければ、慣れてくるとNAGAの初打はかなりの確率で予測出来るようになる。そして2打目から中盤に入るに連れて分岐が増えるため一致率が徐々に下がり、終盤は終盤で行動が限定されてくるので大きく間違える頻度は下がる、という傾向が一般的ではないかと思う。しかしこれをひたすら追い続けてしまうと、序盤進行だけはNAGAに近しい行動が出来るものの、中盤でたまにミスをする、という傾向の打ち方になる可能性が高く、それはかなり大きなリスクを抱えたスタイルになりがちである、というのが主題である。
NAGAは基本的に、余程和了が遠い牌姿で無ければ目一杯に組み続けて、後手を踏んだら比較的マシな牌を切って放銃を回避したり、自分の和了確率がそこそこあると判断すれば直線的に押し返したり、逃げ切れると踏んだら中抜きしたり、という場当たり的な選択を好む。場当たり的と言うと聞こえが悪いが、これは瞬間的な期待値の最大化に他ならないので戦略として非常に強い。
しかしながら人間がこれを真似ようとすると、大きなリスクと共に過ごす時間が長くなり、中盤の分岐のミスの発生率が上昇しやすくなる。もちろんそれも承知の上で、少しずつ真似が出来る範囲、濃度を上げていくのもまた一つのルートではあるし、最終地点としてはかなり強くなりそうな予感はあるのだが、何しろこのルートは精神的にキツい。常に手詰まりと同居するような狂気の中に身を投じて、ツキ不ヅキによる激しい波を泳ぎこなして、中盤での打牌もある程度一致させられるようになった頃に急激に実績がついて来て急成長したように見えるという成長曲線になるのだが、個人的にはこのルートの成長過程を楽しめるのは究極的な研究者気質で、かなり客観的に麻雀を捉えられる人に限るのではないかと思う。何しろ、不運な偶然が多少連続した時に、凄まじい逆噴射を引き起こす。それでいてもまだこのゲームを楽しいと思えるのは、それ自体が既に一つの稀有な才能だ。これはただの推測になるが、このルートを選んでギブアップし、麻雀そのものから離れてしまった人も一定数いるのではないかと思っている。

脱線が長くなったが、本旨に戻ろう。ここで書きたいのは、「身の丈に合った範囲で参考にする」という考え方の重要性である。先述した通り、NAGAはどんなに煮詰まった、どんな難解な場面でも秒読みになることもなく即座に正着を選ぶ能力を持っている。しかし当然にしてそんなことが出来る人間はおらず、程度の差こそあれ、少なからず場面の難しさによって失着が増えたり、自分でもすぐに気付けるようなヒューマンエラーを起こしたりする。NAGAにとってみれば、どんなに難しい場面であろうとどんなに微差の選択の連続が続こうと、次の手番を打つのも自分なので一番期待値が高そうな選択を続けるのは当然であるが、我々にとっては次の手番を打つのも我々なのである。難しい判断が残る選択は潜在的なミスの元になりやすいし、多少期待値を下げてでも、その後にミスしにくい選択を取る、というのは戦略的に大いに肯定されるべきだと思う。

前置きが長くなったが、「ミスしにくい選択」とは何であるかという具体的な話をしよう。まず一番シンプルなもので言うと、「リーチを打つか打たないか」という選択である。NAGAはたまに、「それ正気ですか?」みたいな場面で微差のダマを選択することがある。恐らくは他家速度や自分の手替わり枚数や点数状況諸々の、色んな変数を組み込んだ上でギリギリダマにしているという理解をしているのだが、基本的にはNAGAでも若干迷いがあるくらいのダマは大体リーチを打って間違いない場面である、と解釈している。何故かと言えば、ダマった先はその先切られる牌であったり鳴きが入ったりリーチが入ったりという変数を元に、そのままダマ続行かモギリーか撤退かという選択を毎手番正解する必要があるが、リーチを打ってしまえばその先は間違えない。リーチに寄せることの大きなメリットの一つはここか、とNAGAでの解析を重ねる上で分かった大きな気付きであった。

次によくあるのは、既に書いた通りのブクブクノーガードをどこまで貫くかという葛藤に関してである。ここに関しては、本当に場面次第としか言えないくらいに微妙な話なのであまり強い言葉で書きたくないが、「これだけ持たせてくれ」と感じるような6、7巡目の全軒安牌などは、NAGAに否定されても持っていいんじゃないかと思うことがよくある。もちろん全速前進を選んだ結果が生還率を上げる、という麻雀で良く起き得る分岐に入ることもあるが、後手番になる度に一発目から難しい抽選を引かされるのはメンタル効率が良くない。「人間は後手で悩まされるのが体に毒なので1枚だけ持たせてください」と丁重に断りを入れながら、形が決まった後の余剰牌を守備駒に変える、といったスタイルはNAGAに否定されながらも私は貫き続けている(どう考えてもMAXに受けた方がいい、役無しドラ3みたいな例外はもちろんあるので本当に場況によるが)。

ここで再び脱線して、世界最強麻雀AIと謳われるsuphxの話に移るのだが、suphxはNAGAのようにプログラム自体が公開されているわけではないものの、牌譜と書籍で発表された内容を通してその打牌傾向が思いの外アナログ感を感じるような、人間臭いものであることが知られている。両面受け固定の序盤先切りや、中盤で押し返しように余剰牌を守備牌に切り替えるなど、もしかしたらNAGAに場面を読ませたら悪手扱いされる可能性もあるような行動を取っていることから、もしかしたらこの先NAGAのアップデートが続いた暁には、今は悪手扱いされているような打牌が場面次第では正着に変わる可能性もあるのかと思うと夢が膨らむ話である。

この項目だけ熱量が違ったせいで異常に長くなってしまったが、結論は既に書いた通りである。一致率を闇雲に追わず、身の丈に合った形で情報を取り入れていく意識付けが重要だと私は思う。

一つだけ蛇足として書いておくと、「一致率を追って一致率を上げる」ことには個人的には疑問が残るが、「正着を追い続けて研鑽をした結果一致率が上がる」ことは非常に喜ばしいことだと思っている(何しろNAGAとの打牌の一致率は天鳳の段位の高さと正相関しているという厳然たる事実がある)。ここの意識一つで、道具としてのNAGAに対する向き合い方が変わってくるのではないか、というところが私の個人的な意見だ。人が咀嚼して模倣出来る好手で無ければ、極端な話NAGAと打牌が一致することそのものには何の意味も無い。NAGAの解析を通して自手と相違のある手を選ばれていた際に、「人が咀嚼して考える」ことでようやく身になる知識になる、という捉え方が重要だろう。

さて、大体書きたかった内容については網羅出来たのでそろそろ結びとしたい。

AIという言葉の独り歩きが始まって久しい。私自身が近しい業界で働いているから、というバイアスもあるかもしれないが、「運用はAIに任せる」という謳い文句が、「ただの手抜き」という意味合いから「人智では及ばない何か素晴らしいもの」という意味を帯び始めた辺りから、言い方は悪いが「ほぼ人力やんけ!」みたいなものだったり、ただただルールに沿って動くワークフローとか(ひと昔前まではただ「プログラム」と呼んでいた部類のものだ)、質の低いものまで全てひっくるめて「AI」という名前を冠して売り出すようになってしまった。嘆かわしい限りだが、それも時代の趨勢ということだろう。
やれお絵描きAIだ、作曲AIだと様々な分野でその名前を聞くようになり、実際に既存産業に食い込むくらいの品質を見せているものも多いが、それでもまだ、利用価値は限定的で、使う人間の能力が問われるものは数多い。

NAGAに関してもそうだ。本論では扱わなかったが、コーナーケースは学習量的に全然足りてないため、見え見えの国士テンパイに4枚目の字牌を切ったり、緑一色が見える手格好から枚数優先で發を切って他の役牌を残そうとしたりする。この辺は「ルールを教えていない」ことの弊害ではあるが、設計思想上、そもそも「使う人間がカバー」しなければいけないものなのだ。こういった面に関しては「NAGAは使える」「NAGAは使えない」のような二元論に持ち込まず、「効果的な使い方をすべきだ」という一点に尽きる。

話をもっと広げると、これは麻雀学習一般にも言える話だ。どの本が分かりやすいとか、誰の動画がオススメだとか、麻雀の学習、上達を謳ったメソッドはもはや星の数ほど出て来ているが、盲目的に全てを受け入れてただなぞるだけで麻雀が強くなるような類の教材は(少なくとも私が知る限りは)存在しない。この理由は明白で、麻雀とは段階的に強くなっていくものではなく、各々がたまたま実戦上で遭遇した経験によって形作られたバランス、得意不得意の分野があり、それによって最適な教え方、フォローすべきポイントが変わってくるからである。万人に向いている学習メソッドなどそもそも存在しない、と言ってもいいかもしれない。

特に伸び悩みを抱えている時期だと、裏技みたいなものに飛びつきたくなる気持ちはどうしても湧いてくるものだ。身近なところから拾える有益な情報をうまく取捨し、自分の血肉となりそうなポイントをしっかり突いたものを選び取る力、それも上達への重要な素養と言えるだろう。ツールに文句を言わず、選び方や使い方を考えることも自分の責任、自分の自由と捉えて、上達の過程自体を楽しめる人が増えてくれたらうれしい限りだ。

スキだけでもとても喜びますが、サポートしていただけると執筆時に私が飲むコーヒーのクオリティが上がる仕組みになっています。