我們可以從麻將AI學到什麼
文章出處及聲明
本文章翻譯自 天鳳位小江戸緑 的note記事 (原文投稿日期2024年9月8日 13:41)
將文章公開已取得原作者的個人許可
並且紅豆將遵守以下規則
僅限免費文章
註記原本的note鏈結以及作者名稱
避免因為翻譯而產生的誤解
文章原本使用到的圖片引用也已獲得許可
若有任何內容與原文有出入,或其他的問題,請透過 X(@Jimmy_AZUKI) ,或 Discord(azuki0125) 聯絡紅豆。
透過Discord聯絡的情況,請先透過私訊功能表明來意。
備註
註1:這邊提到的下一篇文章,小江戸さん之前就已經做投稿了(下面的連結),不過其為"付費文章"。基於僅限"免費內容"的約定,現階段不會做翻譯,若有興趣歡迎至小江戸さん的note購讀。
大家好,我是小江戸綠。
我有在用一種名為NAGA的麻將AI。
NAGA是透過天鳳牌譜來使用,由此告訴你麻將AI打牌選擇的牌譜解析服務。
從NAGA解析服務開始的2021年8月開始算,那之後雖然誕生了4個天鳳位,不過在那之中有持續一直在使用NAGA的大概只有我一個。
為此,或許我可以說是「AI世代」最初的天鳳位。
在本文章中,將由活用NAGA後得到天鳳位這個段位的我,以NAGA為例,對於「該如何與麻將AI磨合」這點,用我個人的見解來做說明。
更具體活用NAGA的場面預計於下次的文章做說明(註1),
而這次會將NAGA也包含在內,關於麻將AI的價值我是怎麼想的,對其做表述。
內容整體比較抽象,而且沒什麼麻將場面的登場的關係,本文會設為免費閱讀。
因為本文章也含有我的麻將觀的內容,所以就算是沒有在用麻將AI的人,若是有興趣的話務必試著過目看看。
麻將的"損益觀"
麻將也被說是「追求期望値的遊戲」。
用選擇A跟選擇B來做比較,判斷出哪邊能夠得到更多的分數,大概是這樣。
不過與「追求期待值」這句話正好相反,玩家在實戰中基本上不會做那麼具體的計算。
這邊想表達重點是,像這樣的選擇比較,通常是透過感覺來進行處理。
如果只是簡單的狀況的話,「透過向對手的立直對攻時的和了率,還有防守時被自摸率去做概算」藉此在選擇的損益間去做比較是可以辦到的。
不過,要是強者來看判斷也相當有分歧的情況的話,這種時候基本上很難辦到像前述那樣去做計算。
到最後,要讓雀力提升這件事,除了磨練判斷支出及收入的感覺(這邊稱為損益觀)以外別無他法。
要是沒有別的途徑,損益觀也就只能自己去追求、自己去感受了。
明明是為了變強,卻和你說「對局數就是正義」正是因為這樣。
「在過去遇到同樣的狀況,立直之後成功(失敗)了」之類的體驗,在現在或是之後,不管是有意識還是無意識的,都會成為自己做出選擇的教材。
麻將AI的作用
戰術書和麻將AI的不同之處
要從零開始自己去調整損益觀,除了相當有天分的人以外,基本上會耗費非常多時間。
而能夠對應多數人的需求指出方向、方針的,就是戰術書(最近來說則是影片教材)。
戰術書的主要作用,是對於某個主題(亦或是選擇)的優點與缺點進行解說。
「如果照著這本書的內容去做的話,能夠成功的可能性較高」書能給我們的,就是類似於這樣的方針。
不過另一方面來說,單一戰術並不能完全對應所有狀況,因此透過損益觀去做微調這部分,考驗的正是玩家自身的經驗。
也就意味著,單靠「學習」是沒辦法變強的。
在這點上,我認為NAGA等等的麻將AI服務的崛起是非常革新的。
因為麻將AI「會把現在這邊的何切」用明確的標示做回答。
------
解釋AI打牌選擇的理由
NAGA是透過天鳳位等等的強者他們的牌譜來做參照,然後做出打牌選擇。
而自我對戰型的AI會透過非常大量的自我對局,透過結論來做出打牌選擇。
不過或許也存在著這兩種方式混用的AI。
但不管是哪一種,麻將AI都不會將選擇的理由(即戰術)給說明出來。
麻將AI會給你看到的,只有他的損益觀而已。
麻將AI會透過他們擁有的龐大的經驗中,參考類似的情況來做選擇,而在那之中並沒有什麼明確的意圖。
不過,要想利用麻將AI的服務來提升自己的能力的話,找出其選擇中的意圖是必要的。
而這件事也可以說是根據現有的戰術去對AI的選擇做解釋,類似於翻譯作業。
(若仍有意圖不明的選擇的話,意味著要麼是BUG,要麼是還未知的戰術。)
因此為了能更加有效的活用麻將AI服務,充分的理解麻將基本戰術可以說是必要的先決條件。
但幸好,想要好好理解麻將的基本戰術並不是那麼困難的事。
稍微舉些戰術的例子,像是「平和寶1基本上立直」,或「沒有安牌的話就試著拆暗刻」之類的基礎方法論。
這樣的內容在某種程度來說幾乎是已經窮盡的話題,因此大概看過幾本麻將的戰術書就能將其網羅了。
------
利用麻將AI來打磨"損益觀"
損益觀的提示,特別對於「麻將的基本戰術基本上都知道」的中級者以上的玩家來說,是非常有用的。
在麻將AI出現以前,只有透過大量的試誤來磨練損得觀的這個方法,但是現在AI會把選擇間的差異以數值顯現出來。
比方說下面這個曾經引發話題的局面。
這邊來看看NAGA的意見。
參照的對象是我覺得跟自己比較相似的防守型(ガンマ)跟平衡型(ニシキ)這兩類型。
防守型(ガンマ)「打3p跟打8p一半一半。打3p時默聽(※)」
平衡型(ニシキ)「只有打3p立直一擇」
(※)
(防守型(ガンマ)因為他的選擇是打8p的關係,所以看不到打3p立直的推薦度,也因此,其推薦度不明。
透過牌譜編輯,把對家牌河的6s換成6p這樣比較可以接受打3p的情況後,防守型(ガンマ)變成推薦打3p默聽了。
藉此推斷,如果現在這個場面防守型(ガンマ)如果打3p的話或許也會選擇默聽。)
以上總結下來後得到
「打3p立直・打3p默聽・打8p防守」很難判斷出他們作為選擇的優劣
這樣的結論。
我舉出這個例子想說的,並不是想闡明哪個選擇才明確是最好的答案。
麻將的實力取決於,是否能保持「將自己的損益觀用最佳的平衡融入思考及選擇」的這個狀態。
也就是說,抱持著「要分出上面三個選擇的優劣很困難」的這種平衡及感覺,是真的很重要的一件事。而能夠將其明確表示出來正是麻將AI的一大好處。
實際遇到和這次類似的情況後,
在那時嘗試「打3p立直」「打3p默聽」「打8p防守」其中的某個選擇,試完後透過牌譜回顧…將這樣的流程不斷重複。要想以這個方式得出哪個選擇比較好的依據,在這只有一次的人生來說時間恐怕不太夠。
而在這點上,有自我對戰等等的對局經驗豐富的AI,或許也是在參照了過去類似的狀況後,給出了「很難對這些選擇分出優劣」的這個解析。
要我說的話大概就像是,AI給我們的提議,就類似於活了非常久的老人級人物作出的建議那樣的東西。
我自己並不是對AI給的建議完全的信任,也有覺得他的提案很奇怪的時候。
將那樣的要素也包和在內,「AI的意見是大前輩的意見」這樣的認知我想或許是正好的。
結果說到底,麻將還是靠直覺
總的來看,麻將想要變強來說,大致上能分為兩個必要的階段。
① 習得並理解全部的基本戰術
② 配合損益觀作調整
在②這個階段基本上都非常花時間,在這點上會很直接地給我們損益觀提示的麻將AI,對我們來說是很有利用價值的。
到最後「損益觀」會成為一種感覺,也就是被作為「直覺」來掌握。
因為自己的個性相對起來比較完美主義,以前也有過「打100次能做出100次同樣選擇的再現性很重要」這樣的想法,不過到最後麻將都還是得靠感覺打的遊戲,後來自己悟到這件事大概是沒辦法辦到的。
不如說現在,以好的方面來說,我是把麻將當作享受當下那個場面的遊戲來認知的。
沒什麼再現性也沒有關係。
「看不懂啦,但是立直!」然後走到了好的世界線也儘管開心吧。
真正重要的是正確認知立直跟默聽的損益只是微差的能力,剩下就順其自然的去見證那可能一喜一憂的結果,這部分我覺得正是麻將的有趣之處。
在這次文章中,寫了麻將AI在哪些點上是比較創新的,同時對我們來說是有用的內容。
而下一次的note文章(註1),我會對於「自己是如何使用NAGA,還有可以信賴NAGA的哪些地方」這些點,同時用上具體的麻將場面來闡述我的想法。