見出し画像

[翻訳] GTOとエクスプロイト: 2つのプレイスタイルを使い分ける by Saulo Costa

GTO戦略かエクスプロイト戦略か、というテーマは頻繁にポーカー界で話題になるテーマです。
そもそもこの2つは表裏一体であり、どちらか一方を選択するものではない、ということは別の記事で以前取り上げました。

今回は「GTOにおける均衡の再現を目指すか」「相手を最大限エクスプロイトすることを目指すか」という2つのプレイスタイルの違いについて、Saulo Costaが投稿したニュースレターを取り上げます。

Saulo Costa @sauloCostaPoker


GTOとエクスプロイト: あなたにとってベストなスタイルはどちらか

GTO x Exploitative: which is best FOR YOU?

ポーカー界において昔から最も白熱する議題のひとつをこのニュースレターで取り上げよう。

結局のところ、セオリー重視のスタイルと、一人ひとりの相手をエクスプロイトしていくスタイルとではどちらが優れているのか。

この議論について、私は多くの洞察を提供できると思う。私は何年もの間、非常にエクスプロイト的なスタイルのポーカーで大成功を収めてきた。しかし私はある時、文字通り一夜にして、自分のアプローチを全く反対のものに変更し、テーブルでのすべての意思決定をランダマイズした。そして、それでも私は勝ちを続けた。
私は世界最高のプレーヤーたちの傾向や理論から乖離する点を研究してきた。また、GTOボットを開発し、GTOの動作を研究するために何十万ものハンドヒストリーをシミュレートした。私自身、両方のスタイルで何百人もの生徒を個人的に教えてきたし、彼らの成長と結果を時間をかけて見てきた。

今回は、これまでの知識をすべてまとめて、あなたにとってどちらのアプローチがより良い結果をもたらす可能性が高いかを判断できるようにしたいと思う。

私の物語 ― 現実におけるGTOとエクスプロイト

それは2019年の8月のことだった。1年以上の期間で200zをクラッシュし、十分なバンクロールを構築した後、私は500zをメインゲームにすることを目標に、ショットテイクを始めた。Otb_RedBaron、ishter11、king10clubsなどのアイドルと対戦しているスクリーンショットを何枚も撮るほど、そのステップアップに興奮したことを覚えている。

5年前にオンラインポーカーをプレイしていなかった人には、これらの名前はあまりピンと来ないかもしれない。しかし、2016年に5zをプレイしながら、インターネット上のあらゆるポーカーフォーラムで彼らのブログを読んでいた私にとって、彼らは本物のアイドルだった。

私は彼らに憧れて育ち、ポーカーを始めてからわずか3年後には、多くの人が世界で最も過酷なオンラインゲームであると考えていたPokerStars 500z(当時は毎日卓が立っていた)で彼らと戦うことになったのだ。あの卓は特別なオーラをまとっていて、私はそこで自分の力を証明したかった。

その頃の私は、200zを約6bb/100でクラッシュしていたにも関わらず、自分のプレイにいくつか不満な点があった。私は非常にエクスプロイト的なスタイルでプレイしていた。ポピュレーションの傾向を研究し、その頻度をソルバーの頻度と比較し、発見したアンバランスを攻撃するMESモデルを構築していた。結果が示しているように、全体的にはすべてがうまくいっていたが、一部の相手が私の戦略に対抗してアジャストし始めているように感じていた。

私が非常にアンバランスだった特定のラインがひとつあり、それはSRP IPでのトリプルバレルだった。数年後、そのラインのレンジ構成を確認したとき、自分のベットレンジの約60%がブラフだったことを覚えている。これはもちろん意図したもので、当時のREGがそのラインにおいてソルバーと比べてoverfoldしていたからだ(これは今も変わらない)。その時の私はチャンスがあればいつでも大幅にアグレッシブにoverbluffをしていた。それだけでなく、Riverでたくさんバレルを打つため、Turnからブラフハンドをさらに多くRiverへ持ち込むようなことまでしていた。

問題は、何人かが私のトリプルバレルを通常よりライトにコールしていることに気づいたのだ。私が弱いと思っていたプレイヤーも抵抗し始めていた。通常なら必ずフォールドすると私が予想していたハンドをショーダウンする人もいた。

最初はそれほど気にしていなかった。気づいてはいたが、私は自分のプランを実行し続けた。結局のところ、私のアプローチがうまく機能していることを結果が示していた。私は何百万ものハンドのデータを研究し、人々がoverfoldしていることを自分の目で見ていた。私は正しくoverbluffをしていた。

しかし、ブラフが失敗するたびに、私の頭の中で混乱が増大していった。超マージナルなブラフキャッチャーにコールされることがますます多くなり、私のエクスプロイトがもう機能していないという証拠を目にするようになった。 ― 何が正しい?戦略を変更するべきなのか?変えたところでうまくいくのか?でもみんなコールされてるじゃないか!

この混乱は、ゲームツリーの他のスポットで行っていた他のエクスプロイトラインにも広がり始めた。私は自分自身を再考し、全体的なゲームプランの有効性を疑い始めた。
同時に、自分の戦略が足りないという思いも抱きはじめた。たとえば、私はほとんどのFlopテクスチャーでレンジCBを打っていた。これは、十分XRが行われていないプールに対して有効なエクスプロイトであるだけでなく、戦略の実行が簡単だという考えのもとだった。しかし、私は特定のテクスチャーごとに最適なベット戦略を選択できるだけの理論的知識があるという自信があったために、自分の可能性や能力を下回るプレーしているように感じていた。

加えて、平均的な200z REGよりも大幅に強いであろう500zに移行したいという願望もあった。 超エクスプロイト的プレイへの自信がなくなっていたので、200zで通用したスタイルでも、500zでは通用しないだろうと感じていた。

私はいつでも大きな変化を起こせる人間だ。たとえ180度反対だとしても、そちらが進むべき道だと信じたら躊躇しない。私は、もっとソルバーのようにプレイするよう変わらなければいけないことは明白だった。

私は、一切ランダマイズしない超アグレッシブなエクスプロイトスタイルから、すべての意思決定でRNG(乱数)を使って可能な限りバランスを取るプレイへ、文字通り一夜にして変わった。

その時の私のスタッツを見て欲しい。 2019年8月、私はPostflopのアグレッション頻度は 42/35/34 だった。

Flop Agg%: 42 - Turn Agg%: 35 - River Agg%: 34

2019年9月、私は自分のスタイルを完全に変え、アグレッション頻度は 38/30/30 まで下がった。

Flop Agg%: 38 - Turn Agg%: 30 - River Agg%: 30

38/30/30 は、疑似GTOプレイヤーとしてはそれほど良い数値ではない。 GTOボットであれば 38/32/39 に近い値になる。しかし重要なのは、私が勝ち続けながらも、テーブルでのアプローチを完全に変えることができたということだ。相手の戦略の弱点を突こうとせずとも、私は勝ち続けることができた。GTO戦略はアンバランスな人間に対して明らかに有利なので、こうなる可能性があることはわかっていた。しかし、これほど大胆にプレイを変えても、すぐに結果が出たことで、私の自信はかつてないほど高まっていた。

私がプレイを変えた9月に200zで結果が出た後、10月に500zへ移行し、このような結果となった。

Flop Agg%: 38 - Turn Agg%: 30 - River Agg%: 33

疑似GTOの精度はわずかに向上してAgg%は38/30/33となり、その月もまたクラッシュできた。私は一夜にして疑似GTO指向REGに変身したが、PokerStarsで夢のステークスである500zを、世界最高のプレーヤーたちを相手に比較的楽に勝っていたのだ。

それは夢のようだった。

"イカれたアグレREG" から "パッシブ疑似GTOボット" に変わって学んだ4つの教訓

この経験は、私に信じられないほどの教訓を与えた。私がポーカープレイヤーとして成長するにつれて、何がエッジを生み出すのか、どちらのスタイルが最適なのか、そしてその両方を実行する方法を自分の目で見ることができた。それらの教訓について話そう。

教訓1: 疑似GTOプレイはエクスプロイトプレイより簡単

これは私にとって本当に驚きだった。プレイを変える前、私はGTOスタイルでプレイするのは非常に難しいものであり、それを試みる人はみんな時間を無駄にしていると確信していた。しかし実際はGTOスタイルのほうがエクスプロイトプレイよりもはるかに簡単だった。

非常にエクスプロイト的な戦略でプレイする場合、最も気にしなければいけないことのひとつはゲームダイナミクスおよびメタゲームだ。 エクスプロイトポーカーで成功するには、多くのことを同時に行う必要があり、それによって多くの時間とエネルギーを消費する。

疑似GTOをプレイしているとき、気にするのは自分の戦略だけだ。各スポットでできる限りセオリーに近似した戦略を考え、RNGを見て、番号が指した選択肢を実行するだけ。あまりに簡単だ。疑似GTOスタイルに移行してから一日中グラインドした後、どれほど疲労が軽減されたかを今でも覚えている。それは全く別物に感じられた。

もちろん、GTOを実行するのは簡単だからと言って、一切ミスをしないわけではないということは明らかだ。
実際、ソルバーのようにプレイするのは間違いなく難しい。しかし、プレイヤー全員をエクスプロイトしようとするプロセスに比べればはるかに簡単だ。

これは、GTOスタイルでプレイすることの大きな利点だ。なぜなら、疲れている時こそ、私たちは感情に乗っ取られて大きなミスを犯してしまうものだからだ。疲労が軽減されることで、ハイレベルでの実践をより長い時間維持できるようになり、それがwinrateの上昇に繋がる。

教訓2: 人間のGTO近似プレイは本来のGTOよりはるかにパッシブ

これは実戦の中ですぐに確認された。ソルバーのようにプレイしようとしても、ソルバーと比べて私のプレイははるかにパッシブだった。

数年後、私の生徒たちにも同じことが起こるのを見た。 2022年にグラインド・シミュレーターというGTOの練習をするためにボットと対戦できるプログラムを開発したとき、実戦では高いレッドラインを持つ超アグレッシブなプレイヤーたちが、ソルバーに近いプレーをしようとするとWWSF 47のニットになるのを目の当たりにした。

技術的、心理的な様々な理由により、バランスのとれた戦略に対する私たちの直観的な認識は、真にバランスのとれた戦略よりもはるかにパッシブだったのだ。ソルバーを模倣しようとする人は、本来よりブラフを減らし、レイズを少なく、フォールドを多く、ベットサイズも小さくしてしまう。

セオリー志向のプレイヤーも依然として非常にエクスプロイトされやすいのだ。これは事実であり、今後も私の意見は変わらないだろう。

教訓3: 固定的なGTOスタイルでのプレイは退屈

非常に厳格なGTOスタイルを数か月間プレイした後、たとえ勝っていたとしても、私はポーカーを楽しめなくなり始めた。私はいつも好んでたくさんのハンドをプレイしていたが、1~100の乱数を使ってGTOを大まかに近似するプレイで金を稼げるようになると、グラインドするのが少し退屈になっていった。

これは非常に個人的な見解であり、ソルバーを可能な限り模倣する体験が非常に楽しくて魅力的だと感じる人もいるだろう。しかし私は違った。ポーカーが色を失ったような気がした。

一方、エクスプロイトは、他のプレイヤーを上回るための絶え間ない試みとダイナミクスで、ゲームが何倍も楽しくなる。疲れはするが、他のプレイヤーに対してエッジを生み出し、誰かをうまくエクスプロイトできたとき、非常にやりがいを感じる。

教訓4: どんなプレイスタイルでも勝つことができる

成功するために努力をすれば、どんなプレイスタイルでも成功することはできる。

私自身もこれを経験したし、全く異なるスタイルでプレイする多くのクラッシャーたちを研究してきた。私の生徒の中には非常にエクスプロイト的なレッドラインクラッシャーもいたし、セオリー重視でレッドラインが大きく下がっているクラッシャーもいた。

ポーカーでエッジを見つける方法はたくさんあり、成功する方法がひとつしかないと考えるべきではない。可能性は無限にある。

結論

他にもたくさんのメリット、デメリットを挙げることはできるが、結論は変わらないだろう。
GTOかエクスプロイトか ー 2024年現在、どちらか一方のアプローチを選択しなければならないという考えを持つのは愚かだ。どちらにもメリットがあり、最も重要なのはどちらにも適したタイミングがあるということだ。

おそらく、超ぬるいテーブルではできる限りエクスプロイト的なプレイをしたほうがよいだろうし、REGとの3人卓ではできるだけバランスを取ってプレイするのがよいだろう。

さらに深掘りすると、エクスプロイトされるリスクを軽減するために、ゲームツリーの中で頻出するノードではバランスを取ったプレイをすることが合理的だろう。そしておそらく、何十万ハンドの中でも滅多に繰り返されることのないスポットでは、本能に従って自分なりにプレイするのがよいだろう。

とは言え、私が何年もプレーとコーチングをしてきた経験を通じて言えることとして、性格とリスク回避 (risk aversion) の特性により、あなたはどちらかひとつのアプローチに惹かれる可能性が非常に高い。
理想的には、どちらのアプローチが自分に適しているかを理解するために、まずは自己認識を高めたい。その上で、自分の思考プロセスに逆のアプローチをより頻繁に取り込むように意識するのだ。

人生のほとんどのことと同様に、極端なことは避けたほうがよい。すべてのノードでバランスをとることにこだわるのは確かに不健全で、EVを最大化するのに役立たないだろう(そして非常に退屈だと思う)。同時に、あらゆるスポットで全員を上回ろうとしてカウンターエクスプロイトされるリスクを負うことも理想的ではない。

私が長い間実践し、非常によく機能してきたフレームワークを紹介しよう。それは、前半のストリート(PreflopとFlop)ではやや厳密にGTO指向でプレイし、後半のストリート(TurnとRiver)ではもう少し柔軟でエクスプロイト的にプレイするというものだ。

序盤のストリートにおいて安定した戦略を維持することで、頻繁に繰り返し発生するスポットでエクスプロイトされることを避けるだけでなく、後半ストリートに到達した時のレンジの見通しをよくすることができる。

そして、後半のストリートに到達したら、GTOから逸脱し始め、相手のアンバランスを攻撃し、より多くのEVを獲得する。通常、後半ストリートのノードはポットが大きくなるため、重大なエッジを生み出す機会が増える。同時に、前半ストリートと比べて、そのようなスポットが発生する頻度は低いので、カウンターエクスプロイトされることも少ないだろう。

このアプローチでは、セッション中の意思決定の大部分を占める序盤のストリートで疲労が非常に少ないため、多くのエネルギーを節約することができる。そこで節約したエネルギーを相手のリークが最も大きくなるノードにおいて高度なエクスプロイトを実行するために使うことができるのだ。

Source: #20 GTO x Exploitative: which is best FOR YOU? – Poker Made Simple


翻訳は以上です。読んで頂いてありがとうございました!

この翻訳noteは、皆様からのリアクションがモチベーションになっています。ぜひスキ・フォロー・拡散・サポートで応援お願いします!


スキ・拡散・サポートで応援して頂けるととても助かります。サポートは100円でもいいです。先に言っておきますが、ありがとうございます。