我們可以從麻將AI學到什麼

紅豆あずき

2025年2月4日 11:10

文章出處及聲明

本文章翻譯自 天鳳位小江戸緑 的note記事 (原文投稿日期2024年9月8日 13:41)

將文章公開已取得原作者的個人許可
並且紅豆將遵守以下規則

僅限免費文章
註記原本的note鏈結以及作者名稱
避免因為翻譯而產生的誤解

文章原本使用到的圖片引用也已獲得許可

若有任何內容與原文有出入，或其他的問題，請透過 X(@Jimmy_AZUKI) ，或 Discord(azuki0125) 聯絡紅豆。

透過Discord聯絡的情況，請先透過私訊功能表明來意。

備註

註1：這邊提到的下一篇文章，小江戸さん之前就已經做投稿了(下面的連結)，不過其為"付費文章"。基於僅限"免費內容"的約定，現階段不會做翻譯，若有興趣歡迎至小江戸さん的note購讀。

大家好，我是小江戸綠。

我有在用一種名為NAGA的麻將AI。
NAGA是透過天鳳牌譜來使用，由此告訴你麻將AI打牌選擇的牌譜解析服務。

從NAGA解析服務開始的2021年8月開始算，那之後雖然誕生了4個天鳳位，不過在那之中有持續一直在使用NAGA的大概只有我一個。

為此，或許我可以說是「AI世代」最初的天鳳位。

在本文章中，將由活用NAGA後得到天鳳位這個段位的我，以NAGA為例，對於「該如何與麻將AI磨合」這點，用我個人的見解來做說明。

更具體活用NAGA的場面預計於下次的文章做說明(註1)，
而這次會將NAGA也包含在內，關於麻將AI的價值我是怎麼想的，對其做表述。

內容整體比較抽象，而且沒什麼麻將場面的登場的關係，本文會設為免費閱讀。

因為本文章也含有我的麻將觀的內容，所以就算是沒有在用麻將AI的人，若是有興趣的話務必試著過目看看。

麻將的"損益觀"

麻將也被說是「追求期望値的遊戲」。
用選擇A跟選擇B來做比較，判斷出哪邊能夠得到更多的分數，大概是這樣。

不過與「追求期待值」這句話正好相反，玩家在實戰中基本上不會做那麼具體的計算。
這邊想表達重點是，像這樣的選擇比較，通常是透過感覺來進行處理。

引用自天牌(来賀友志・嶺岸信明) 809話「感覚と勘」
對話框:(不過，絕不能忘記收住4m的感覺)

如果只是簡單的狀況的話，「透過向對手的立直對攻時的和了率，還有防守時被自摸率去做概算」藉此在選擇的損益間去做比較是可以辦到的。
不過，要是強者來看判斷也相當有分歧的情況的話，這種時候基本上很難辦到像前述那樣去做計算。

到最後，要讓雀力提升這件事，除了磨練判斷支出及收入的感覺(這邊稱為損益觀)以外別無他法。

要是沒有別的途徑，損益觀也就只能自己去追求、自己去感受了。

明明是為了變強，卻和你說「對局數就是正義」正是因為這樣。

「在過去遇到同樣的狀況，立直之後成功(失敗)了」之類的體驗，在現在或是之後，不管是有意識還是無意識的，都會成為自己做出選擇的教材。

麻將AI的作用

戰術書和麻將AI的不同之處

要從零開始自己去調整損益觀，除了相當有天分的人以外，基本上會耗費非常多時間。
而能夠對應多數人的需求指出方向、方針的，就是戰術書（最近來說則是影片教材）。

戰術書的主要作用，是對於某個主題(亦或是選擇)的優點與缺點進行解說。
「如果照著這本書的內容去做的話，能夠成功的可能性較高」書能給我們的，就是類似於這樣的方針。

不過另一方面來說，單一戰術並不能完全對應所有狀況，因此透過損益觀去做微調這部分，考驗的正是玩家自身的經驗。

也就意味著，單靠「學習」是沒辦法變強的。

在這點上，我認為NAGA等等的麻將AI服務的崛起是非常革新的。
因為麻將AI「會把現在這邊的何切」用明確的標示做回答。

------

解釋AI打牌選擇的理由

NAGA是透過天鳳位等等的強者他們的牌譜來做參照，然後做出打牌選擇。
而自我對戰型的AI會透過非常大量的自我對局，透過結論來做出打牌選擇。
不過或許也存在著這兩種方式混用的AI。

但不管是哪一種，麻將AI都不會將選擇的理由（即戰術）給說明出來。
麻將AI會給你看到的，只有他的損益觀而已。

麻將AI會透過他們擁有的龐大的經驗中，參考類似的情況來做選擇，而在那之中並沒有什麼明確的意圖。

不過，要想利用麻將AI的服務來提升自己的能力的話，找出其選擇中的意圖是必要的。
而這件事也可以說是根據現有的戰術去對AI的選擇做解釋，類似於翻譯作業。
（若仍有意圖不明的選擇的話，意味著要麼是BUG，要麼是還未知的戰術。）

因此為了能更加有效的活用麻將AI服務，充分的理解麻將基本戰術可以說是必要的先決條件。

但幸好，想要好好理解麻將的基本戰術並不是那麼困難的事。

稍微舉些戰術的例子，像是「平和寶1基本上立直」，或「沒有安牌的話就試著拆暗刻」之類的基礎方法論。

這樣的內容在某種程度來說幾乎是已經窮盡的話題，因此大概看過幾本麻將的戰術書就能將其網羅了。

------

利用麻將AI來打磨"損益觀"

損益觀的提示，特別對於「麻將的基本戰術基本上都知道」的中級者以上的玩家來說，是非常有用的。

在麻將AI出現以前，只有透過大量的試誤來磨練損得觀的這個方法，但是現在AI會把選擇間的差異以數值顯現出來。

比方說下面這個曾經引發話題的局面。

這邊來看看NAGA的意見。
參照的對象是我覺得跟自己比較相似的防守型（ガンマ）跟平衡型（ニシキ）這兩類型。

防守型（ガンマ）「打3p跟打8p一半一半。打3p時默聽（※）」
平衡型（ニシキ）「只有打3p立直一擇」

（※）
（防守型(ガンマ)因為他的選擇是打8p的關係，所以看不到打3p立直的推薦度，也因此，其推薦度不明。
透過牌譜編輯，把對家牌河的6s換成6p這樣比較可以接受打3p的情況後，防守型（ガンマ）變成推薦打3p默聽了。
藉此推斷，如果現在這個場面防守型（ガンマ）如果打3p的話或許也會選擇默聽。）

以上總結下來後得到
「打3p立直・打3p默聽・打8p防守」很難判斷出他們作為選擇的優劣
這樣的結論。

我舉出這個例子想說的，並不是想闡明哪個選擇才明確是最好的答案。

麻將的實力取決於，是否能保持「將自己的損益觀用最佳的平衡融入思考及選擇」的這個狀態。

也就是說，抱持著「要分出上面三個選擇的優劣很困難」的這種平衡及感覺，是真的很重要的一件事。而能夠將其明確表示出來正是麻將AI的一大好處。

實際遇到和這次類似的情況後，
在那時嘗試「打3p立直」「打3p默聽」「打8p防守」其中的某個選擇，試完後透過牌譜回顧…將這樣的流程不斷重複。要想以這個方式得出哪個選擇比較好的依據，在這只有一次的人生來說時間恐怕不太夠。

而在這點上，有自我對戰等等的對局經驗豐富的AI，或許也是在參照了過去類似的狀況後，給出了「很難對這些選擇分出優劣」的這個解析。

要我說的話大概就像是，AI給我們的提議，就類似於活了非常久的老人級人物作出的建議那樣的東西。

我自己並不是對AI給的建議完全的信任，也有覺得他的提案很奇怪的時候。
將那樣的要素也包和在內，「AI的意見是大前輩的意見」這樣的認知我想或許是正好的。

結果說到底，麻將還是靠直覺

總的來看，麻將想要變強來說，大致上能分為兩個必要的階段。

① 習得並理解全部的基本戰術
② 配合損益觀作調整

在②這個階段基本上都非常花時間，在這點上會很直接地給我們損益觀提示的麻將AI，對我們來說是很有利用價值的。

到最後「損益觀」會成為一種感覺，也就是被作為「直覺」來掌握。

引用自天牌(来賀友志・嶺岸信明) 809話「感覚と勘」
↓對話框↓
右:(老夫也是只靠直覺一路過來的男人)
左:(基本上不會錯)

因為自己的個性相對起來比較完美主義，以前也有過「打100次能做出100次同樣選擇的再現性很重要」這樣的想法，不過到最後麻將都還是得靠感覺打的遊戲，後來自己悟到這件事大概是沒辦法辦到的。

不如說現在，以好的方面來說，我是把麻將當作享受當下那個場面的遊戲來認知的。

沒什麼再現性也沒有關係。
「看不懂啦，但是立直！」然後走到了好的世界線也儘管開心吧。
真正重要的是正確認知立直跟默聽的損益只是微差的能力，剩下就順其自然的去見證那可能一喜一憂的結果，這部分我覺得正是麻將的有趣之處。

在這次文章中，寫了麻將AI在哪些點上是比較創新的，同時對我們來說是有用的內容。

而下一次的note文章(註1)，我會對於「自己是如何使用NAGA，還有可以信賴NAGA的哪些地方」這些點，同時用上具體的麻將場面來闡述我的想法。