見出し画像

ライブポーカーでの過激なエクスプロイト 〜検証編〜(後編)

割引あり

前記事の続きです。
”必ず”前編を読んでから、本記事を読んでください。

後編では実践で行ったエクスプロイト戦略について、

・確からしさの検証
・最大搾取が可能な戦略
・想定リークとエクスプロイト戦略の組が正しいのか?

などについての考察などを行います。

本記事の内容はすべてのプレイヤーに通用するものではありません。
それぞれに相手が抱えているリークは異なるためです。
エクスプロイト戦略に一般論はありません。

本記事の内容が、読者のみなさまのエクスプロイト戦略の引出しの一つになれば幸いです。

記事の都合上、紹介しきれないノードがあります。気になった点は、DMなどで質問いただければと思います。



対象とするスポット(再掲)

まず初めに取り扱うスポットについて記載します。

EF 100bb (NL 50 想定)
(rake 5% 4bb cap)

CO 2.5bb
BB call (hero 64s♦︎)

・Flop 9♦︎8♦︎5♤

check / check

・Turn A♦︎ (5.5bb)

BB bet 14bb (約250%)
CO call

・River 9♤ (33.5bb)

BB bet 16bb (約50%)
CO fold (Q♦︎J♤)

ボード

検証方法

GTO wizard の solve AI を使用する。

フロップ、ターン、リバー でそれぞれ想定していた相手のリークをノードロックして、エクスプロイト戦略についての検証を行う。

具体的な設定内容

Bet types : Dynamic 
Number of bets : 2
Number of raises : 1


エクスプロイトの想定の振り返り

・Flop
「checkレンジ」にリークがありそう。
「ドンクに対する戦略」は未知である。


・Turn
「over betに対するコールレンジ」に弾力性が無さそう。


・River
「スモールベットに対するブラフ」と「チェックレンジに対するブラフ」、どちらともブラフ過多の戦略をとりそう。

・Flop戦略

Flop

相手のFlop CB戦略の想定

相手プレーヤーの特徴はアグレッシブであることだ。
そのため、Flop では
アグレッシブな方向でハンドが実行したいことをする!」
といった戦略構築する傾向
にあると想定していた。
(例 → Aハイ・ツーオーバーは check 優勢、ドローハンドは bet 優勢)

相手の戦略の想定
相手の戦略のイメージ図

相手のずれた戦略に対する搾取解の想定

・CB打たれた世界

相手のCBレンジが均衡戦略と比較して強いレンジ構成になっていると想定していた。
そのため、call 頻度を減少させてraise or foldの戦略と取る予定であった。
実際フラッシュドローは高頻度で check raise をしようと考えていた。

ただし、相手のbet size・Flop 3bet 頻度などによっては戦略を変更すべき必要がある。これほど細かく・精度を高くしてノードまで言及しても出現頻度の低さの観点から効率的な学習にならず、EVに大きな差をもたらすことはないため、本記事では割愛する。興味がある方は検証してみてください。

・checkされた世界

ターンに移行するため、ターンの章で記載。


CBレンジのノードロックの設定

solve AIを使用して、相手のリークをノードロックする。
※結果だけ知りたい方は飛ばしてもらって大丈夫です。
だたし、ノード内容が変わるとエクスプロイト戦略の大きく変化します。

ツーペア以上:ラージ50% : スモール40% : check 10%
フラッシュドロー:ラージ50% : スモール40% : check 10%
トップペア&オーバーペア:ラージ40% : スモール40% : check 10%
Aハイ:ラージ10% : スモール20% : check 70%
 
※Aハイフラッシュドローのような複合系のハンド群は、フラッシュドローとして扱った。
※その他の指定していないハンドは特にノードロックをせず、上記のノードを設定後に、Lock Allした。

ノードロックの内容
レンジ比較

ここからは、上記のノードをかけた上での最適なエクスプロイト戦略について考察を進める。

FlopでBBができるエクスプロイト戦略は大きく分けて2つある。

・ドンクベット
・相手のCBに対しての戦略変更(defense戦略)

これに加えて、COのミスによってBBが得られるEVを評価する。


・ドンクベットの有無について

COのプレイヤーのCBレンジがリークを持っており、Flopの戦略決定をするたびにCOはEVロスをすることになる。

それ故、BB側はCOがCBを打つたびに追加のEVを得ることができる。したがって、BBは全レンジをチェックし、リークのあるスポットの発生回数を増加させることで、EVを最大化できる。
簡単にいえば、相手がミスするスポットにいこう!ということである。

ドンクベットの戦略
左:GTO戦略 右:エクスプロイト戦略

相手の戦略にリークが発生するスポットへ誘導することが、エクスプロイト戦略を考える上で非常に大切である。

また、対戦相手にドンクベットに対するリークは観測で来ていなかった。もちろん、完璧な相手などいないため、何かしらのリークが存在するはずではある。
しかし、それを自信をもって観測していない以上、相手がより多くのミスする世界はCB skipした世界である。
そのため、check EVの方が優勢で間違えないだろう。


・相手のCBに対してのdefense戦略

少し本題と逸れるが、別の世界線でのエクスプロイト戦略についても軽く触れておく。

相手のCBレンジが強い世界において、BBはどのように抵抗するのが良いだろうか?

COのCBレンジは、ブラフハンド・バリューハンド共に多くのEQを持っている。ブラフハンドのEQが高すぎると、ブラフキャッチャーとなるハンド群のEVは 0 からマイナスに転じる。

レンジ全体として、コールで抵抗したいハンドの総数が減少するため、
call 頻度を減少させてraise or foldでベットに対して抵抗する。
この理由は説明すると長くなるため、割愛する。

下記のようなレンジ全体の戦略が最適な応答である。

COにlargeベットされたときの
BBのエクスプロイト戦略

参考:COのEVロス

COのEVの比較
左:均衡戦略、右:リーク有戦略

COはレンジEVを0.4bbロスしている。

COのEVロスの源泉について簡単に解説しておく。

COのベットレンジはノードロックの影響で非常に強くなっている。一方で、checkレンジが大きく弱体化してしまっており、またレンジの多様性も失われている。

この影響で、BBはベットされた場合に、たくさんFoldすることで簡単にエクスプロイトできてしまう。
また、チェックした世界において弱体化したレンジをBBに虐められてしまう。

そのため、COはベットした世界、checkした世界の両方でEVを損失する。これがレンジ全体で0.4 bb のEVロスがある理由である。

Flop戦略 まとめ

・想定 「check EV > ドンクベット EV」
結果 「check EV > ドンクベット EV」
 
エクスプロイト戦略としてのミスはないと言えるだろう。


・ターン戦略

Turn

ターンでフラッシュを引くことができた。

ここからは、レンジ全体のエクスプロイト戦略・ハンド単体のエクスプロイト戦略の両方の考察を進める。

相手の弱いcheckレンジに対してエクスプロイト戦略を実行できなければ、相手のEVロスの恩恵を受けられなくなってしまう。

相手がEVロスしても、しっかりと攻撃できなれば意味がないのである。


※少しでも一般的に使用できるエクスプロイト戦略の考察を行う目的で、ターン以降はノードロックをせず検証する。
ここからは、Flopでアグレッシブにベットしてくる相手に対する一般的なエクスプロイトの考察である。

※GTO wizard の AI solve の弱点について
ストリートを跨ぐノードロックは、前のストリートで考慮されない。
そのため、ターン・リバーのリークを正確に攻撃するためには pio solver , GTO+ などの CFR アルゴリズムベース の solver が必要である。

この2つの理由から、ターン以降の相手の戦略をノードロックしても、学習効率が低いためターン以降はノードロックなしで検証を進めていく。


・レンジ全体のエクスプロイト戦略

ここから先は

3,078字 / 14画像
この記事のみ ¥ 680〜
期間限定!Amazon Payで支払うと抽選で
Amazonギフトカード5,000円分が当たる

この記事が気に入ったらチップで応援してみませんか?