見出し画像

エクスプロイティブポーカーの5つの不均衡

ポーカーにおける現代の大きな論争のひとつに、GTO対Exploitative戦略というものがある。
これは驚くほど両極端な議論になることがあり、それぞれの戦略方法論には敬虔な信奉者がいて、もう一方を否定する。
しかし実際には、GTOとExploitative pokerは同じコインの裏表である。

  • 理性的なエクスプロイトプレーヤーは、GTOをリークを特定する手段として、またリークに対するエクスプロイトとして逸脱するための基本戦略として使用する。

  • 反面、GTO戦略は、それに対して使用される可能性のある潜在的なエクスプロイトから情報を得ている。 不必要な損失を避けることを目標に展開する。

エクスプロイティブポーカーは、より攻撃的でダイナミックなスタイルで、脆弱性を攻撃するが、自ら脆弱性を露呈することによって攻撃する。

脆弱性を公開して戦う理由は、より大きなダメージを与えることができ、より高い勝率を得ることができるからだ。

しかし、より大きな報酬には、より大きなリスクが伴うのが普通だ。
この場合、反撃の可能性だ。

GTOポーカーは、まるで全身を鎧で覆ったかのようにリークを最小限に抑えるという概念に基づいて作られているという意味で、より守備的で静的なスタイルだが、アップサイドには上限がある。

その代わり、相手の戦略に関係なく確実に効果を発揮する。
「守備的」は受動的という意味ではないことに注意してほしい。
GTOは可能な限りEVを節約することを目的として、非常にアグレッシブになることができる。

私が言いたいのは、もう一方のポーカーを理解せずに、一方のポーカーのスタイルを本当に理解することはできないということだ。

今日は、ポーカーにおける5つの基本的な不均衡に焦点を当て、それを利用した戦略を紹介する。
プレイヤーが持つリークはすべて、これらのカテゴリーのどれかに当てはまる。

  1. ベッティングボリューム - 各ラインに投入される総額。

  2. エクイティマネジメント - 各ラインに投入されるエクイティの総量。

  3. ポラリティ(両極性) - 強いハンドと弱いハンドの間で、どの程度レンジが二極化されているか。

  4. エラスティシティ(弾力性) - ベットサイジングに対して、どの程度敏感で順応性があるか。

  5. ボードカバレッジ - ボードやボードのランアウトとの相互作用という点で、どの程度レンジを構築しているか。

エクスプロイトポーカーはインセンティブが重要である。

このリストを見ながら、これらのアンバランスが、特定のエクスプロイトに傾倒するインセンティブや理由をどのように与えるか考えてみよう。


1.ベッティングボリューム

ベッティングボリュームとは、特定のノードまたは一連のノード(ライン)にベットされた金額の総量を指します

エクスプロイティブフレームワークは、ベッティングボリュームというレンズを通して相手の戦略を分析します。

ベッティングボリュームの間違いとは、特定のベッティング(またはレイズ)ラインにお金を入れすぎる(または少なすぎる)ことです。
私たちがプレイヤーをニット、コーリングステーション、マニアックに分類するのは、ベッティングボリュームのミスに基づいているのです。

相手のベッティングボリュームが最も高い場所はどこでも、あなたのバリュー、特にナッツハンドを実現したい場所です。
一般的に言って、あなたのナッツハンドが、エクスプロイト戦略を含むあなたの戦略を決定します。

エクスプロイト対オーバーブラフ - スロープレイやチェック/レイズをするために自分のバリューでチェックすること。
エクスプロイト対オーバーコール - バリューのためにベットを薄くし、ナッツのあるハンドでサイズを大きくすること。
エクスプロイト対オーバーフォルド - ナッツのあるハンドでサイズを小さくするかチェックすることで、相手を早く怖がらせてバリューを失うのを避けること。 フォールド・エクイティが高くなるので、ブラフもうまくいくようになる。

実用的なものにするために、簡単な例で検討してみよう。
この記事では、アンバランスの種類ごとに同じハンドの例を使うことにする。
これはBB対CO、シングルレイズポット、60bbスタック、9♥6♦4♣のフロップである。
BBが100%チェックした場合、これがCOの均衡戦略となる。

フロップ964rボードにおける、BBに対するCOのCベット戦略(GTO)

この戦略ではチェックとベットが混在していることがわかります。
ベットサイズはまちまちだが、ほとんどがオーバーベットかラージベットで、33%のポットベットはわずかとなります。

GTO上ではCOのEVは3.7bbもあります。
特定のハンド(例えばT9s)にカーソルを合わせると、各ラインのEVが表示されます。

T9のすべての組み合わせに対するすべてのアクションの期待値:(GTO)

T9はほとんどオーバーベットだが、基本的にEVが同じなのですべてのアクションをミックスします。

しかし、もしここでBBがベッティングボリュームのリークを起こしていたらどうだろう?

BBが33%のポットベットに決してフォールドしないようにハンドをロックしてみよう。

BBはこのような小さなベットは「弱い」と考えるプレイヤーであり、ベットした人はハンドの後半でアウトプレイされる可能性がある。
私たちはフォールディングの頻度をゼロに変更し、GTOウィザードのAIにコールやレイズのレンジを決めさせました。

COの33%ポットCベットに対する、BBの(頻度による)ノールドロックレスポンス

また、ハンドの開始時に100%チェックをロックした。
これらの情報を頭に入れた上で、COのCベット戦略にどのような影響があるか見てみよう。

フロップ964rにおけるBBに対するCOのCベットフ戦略(エクスプロイト)

COはめったにスモールベットしないミックス戦略から、100%スモールベットするようになりました。
セットやオーバーペアのような非常に強いハンドでさえ、スモールサイズにベットするようになっています。

特にT9sを見直すと、オーバーベットの平均EVは~7.2bbだが、33%ポットをベットした場合の平均EVはさらに高く、~8.6bbである。

T9のすべての組み合わせに対するすべてのアクションの期待値(エクスプロイティブ)

ここには明らかなベットボリュームの誤りがあります。

BBは33%のポットベットラインに対して資金を入れすぎているので、COは自分のレンジ全体にそのサイジングを使う動機付けがあるのです。

ノーフォールド対ベットのダイナミックさは、ターンでの優位性を実質的に失うことなく、フロップで勝つのに有利なポットを大きくすることを可能にする(新しいカードによる)。

J5sのような非常に弱い手でも、BBのコーリングレンジを十分に破っている。
BBがオーバーベットをペイオフする(=弱いハンドもコールする)という事実があるにもかかわらず、である。

オーバーペアやトップペアのような、通常はオーバーベットすることを勧められる非常に強いハンドでさえ、コールされることが保証されているため、スモールベットラインを選択しています。

ハンドの開始時、COはGTO上3.75bbを稼ぐが、ノードロック戦略では全体で4.71bbを稼ぎ、これは大幅な増加となる。

2.エクイティマネジメント

ポーカーにおけるエクイティ・マネジメントとは、「プレイヤーが、様々なエクイティ・バケットから生まれる全ての可能なハンドをどのように管理するか」を指します。

このトピックは次の2つのパートに分けられます。

  • ナッツの配分 - ナッツのついたエクイティの高い手札をどうするのか? スモールベットするのか、オーバーベットするのか、チェックするのか? 最も低いエクイティーの手でブラフをするか、メイドハンドをブラフに変えるか?

  • ハンドの評価 - 彼らは異なるハンドクラスをどのように評価するか? トップペアを他のプレイヤーがセットをプレイするのと同じようにプレイするプレイヤーもいる。 あるプレイヤーはAxタイプのハンドを過大評価したり、スモールスーテッドトコネクターを好んだりする。

エクイティ・マネジメントのミスとは、特定のハンドを過大評価したり過小評価したりすることである。

典型的な実例としては、弱いペアでのオーバーコールやシンバリューの見逃しなどがある。
9♥6♦4♣のハンドに戻ろう。
COがオーバーベットした場合のBBのGTOベースの反応です。

COの125%ポットCベットに対するBB の反応(GTO)

チェック/レイズのレンジは小さいことがわかります(~6%)。
バリューはほとんどトップペアかツーペアで、ブラフはほとんどガットショットかバックドアドローとなっています。
セットもオープンエンドストレートドローもコールするだけです。

エクイティマネジメントの誤りは、この場でのオーバーブラフでしょう。
BBが100%の確率でオープンエンドストレートドローをチェック/レイズし、50%の確率でガットショットやバックドアドローをチェック/レイズするようにノードロックして検証してみましょう。

COの125%ポットCベットに対する、BBの(ノードロック:セミブラフヘビー)反応

この状態ではチェック/レイズは約23%の確率まで上昇します。

GTOウィザードでプレイする場合は、最初にレンジをロックすることを忘れないこと。
そうしないと、ソルバーはアンバランスを補い、バリューレンジを守るためにチェック/レイズするハンドの数を増やします。

セミブラフヘビーになったこのチェック/レイズに対して最適化するために、COの反応がどう変るかを比較してみましょう。

まずは、COの元のGTOの反応から。

バランスされたBBのチェック/レイズに対する、COの反応(GTO)

次は、ノードロックされたシミュレーションでのCOの反応です。

BBのアンバランスなチェック/レイズに対する、COの反応(エクスプロイト)

GTO上ではCOは38.2%の確率でフォールドすべきだが、ノードロック・ソリューションのケースではフォールドは論外となります。

彼らはコールするインセンティブもなく、もっぱらブラフの多いレンジを利用するためにレイズするのです。
ここでは2つのレイズサイズが使われ、ショッブはトップペアヘビーで、オールインでないレイズレンジはセカンドペアに偏っていることがわかります。

レンジの内訳:左=レイズ124%(オールイン)、右=レイズ66%

GTOの例では、COのレイズは慎重に選ばれます。

レイズを9xで行う場合、コールする9xの多くのペアをアウトキックするA9かK9、あるいはリバーでストレートかフラッシュをメイクできるT9s/98s/97sとなります。

それに対してブラフは、JTsやQTsのようなブロードウェイ・オーバーカードで、これらはランナーランナーストレートやフラッシュを作ることができ、9xに対してペアアウトもできます。

ノードロックの例では、BBのレンジがブラフに偏りすぎているため、ほとんど全てをレイズします。
これはエクスプロイティブポーカー戦略で繰り返されるテーマです。

相手が大きくバランスを崩している場合、微妙なバランスを保つために自分のディフェンスレンジを注意深く調整する必要性がなくなるのです。

ほとんどの場合、手札のインセンティブに従って行動すればよくなります。

  • ハンドの開始時、GTO上ではCOは平均して約3.7bbを稼ぐ。

  • このノードロックの例では、平均して約4.5bbを稼ぐ。

3.ポラリティ(両極性)

ポーカーにおけるポラリティとは、「強い手と弱い手の間でレンジが二極化している度合い」、または「中程度の手により集中している度合い」を指します。

ポラリティのアンバランスとは、基本的にレンジの形態を理解しておらず、レンジの形状に対して間違った戦略を使うことを指します

相手がナッツやブラフの多いポーラライズドレンジなのか、それとも中程度の強さのハンドやドローの多いコンデンスドレンジなのか。

キャップレンジでありながらベッティングリードを取るのは、このアンバランスの一例です。
ポラリティのあるレンジで小さくベットしたり、コンデンスドレンジでオーバーベットしたりするのもその一例です。

ポラリティのアンバランスを利用する方法は、アンバランスの方向性によって異なります。

  • 相手のレンジがキャップされていたり、凝縮されすぎていたりする場合は、大きなサイズでそのレンジを攻撃すべきだ。

  • 相手がポーラライズドレンジを持っている場合、小さなベットサイズで攻めたい。 ポーラライズドレンジはコールするのに苦労するため、小さなベットでレイズやオーバーフォールドに追い込むことができるからだ。 ただし、相手が完全なポーラライズドレンジを持っている場合(ナッツしか持っていないか、純粋なブラフを持っている場合)には攻めたくない。 その代わり、ブラフキャッチで対抗すべきである。そうしないと、相手はあなたに対してナッツで勝負を続けるだけだからである。

もう一度9♥6♦4♣の手を見てみよう。
これが均衡状態でのBBチェックに対する CO の反応です。

フロップ964rの場合のBBに対するCO Cベット戦略(GTO)

約42%のハンドがチェックします。
トップペアのハンドの中にはプロテクションのためにチェックするものもあるが、ほとんどの場合、チェックするのはローワーペアとエースハイである。
86sのようなハンドは現在エクイティが高いが、コーリングレンジに対してはエクイティが低いので、チェックするインセンティブがある

ここでよくあるポラリティに関するミスは、COがポーラライズドレンジでレンジベットすることです。
これはよくあるミスで、特にオンライン黎明期のプレイヤーは、純粋にフロップごとにCベットすることで自動利益を得ていたことがあるためです。

次の画像は、チェックするという選択肢をなくした場合に、ソルバーがCOの戦略を調整したケースです。

チェックが許されない場合のCOの調整済みCベットフロップ戦略

下のノード比較では、上記のようなオーバーベットに対するBBの反応を対比しています。

オーバーベットに直面したBBの対応:エクスプロイト(左)対GTO(右)

まず注目すべきは、ノードロックの例ではフォールドがかなり少ないことです。
BBがフォールドするのは約48%であるのに対し、約58%です。

その他の顕著な違いは、チェック/レイズの頻度が倍増していることです。
これはよくある悪用の組み合わせとなります。

誰かが頻繁にベットしすぎている場合、彼らがミスをさせるインセンティブが生まれたり、広くブラフキャッチしたり、通常よりも多くチェック/レイズで襲いかかることができます

ハンドの開始時、BBの理論的EVは約2.1bbです。
ノードロックの例では、BBのEVは約2.2bbとなります。
大きな増加ではないが、大きなサンプルに拡大すると~10bb/100エラーの誤差となります。

4.エラスティシティ(弾力性)

ポーカーにおけるエラスティシティ(弾力性)とは、プレイヤーがベットサイジング(プライシング)に対してどれだけ敏感で、適応的であるかを意味します

ハイエラスティシティとは、プライシングに非常に敏感であることを意味し、ローエラスティシティとは、プライシングに鈍感であることを意味します。

WSOPメインイベントを初めてプレイするサテライトの勝者は、バストアウトを恐れて、プライシングやオーバーフォールドができないかもしれません。
実際、毎年、アマチュアは最初のレベルで、他のプレイヤーがオールインした場合、AAをプリフロップでフォールドすることのメリットについて議論します。

バストを恐れるあまり、80%以上の勝率でフェイバリットなのに、$10,000を手に入れる方が、巨大な+EVの命題に対して優先されてしまうのです。
これが典型的な「ビビり金」のステレオタイプです。

彼らにとって低すぎる賭け金でギャンブルをする裕福なプレイヤーは、あまりにもエラスティシティのないリークを持つプレイヤーの典型的な例です。

このようなプレイヤーは遊び半分で2枚のカードでオールインをコールし、ブラフに抵抗もありません。
もうお分かりでしょう。

もう一度9♥6♦4♣のボードを出してみます。
これはBBからのバランスチェックに対するCOの反応となります。

フロップ964rの場合のBBに対するCO Cベット戦略(GTO)

これは典型的なオーバーベットスポットです。

彼らはこのフロップに対して非常に強いハンドを持っているか(トップペア以上)、あるいはこのフロップを完全にミスしているかのどちらかです。
オーバーベットがなされたときにBBがすべきことは次のとおり。

BB(GTO)の反応 vs COの125%ポットCベット

フォールドはたくさんあるが、BBはエクスプロイトされるのを避けるためにエースハイのような弱いハンドでコールしなければならない。

しかし、もしBBがプライシングに過敏で、セカンドペア以下のオーバーベットを絶対にコールしないとしたらどうだろうか?

これが、上記のリークでロックしたときにフロップでBBチェック時のCOのアクションです。

フロップ964rのCOのCベット(エクスプロイト)戦略 vs BB戦略(オーバーセンシティブ:125%のポットにオーバーフォールド)

COはベット率約58%~76%になりました。
また、82%のベットサイズを完全に使用しなくなっています。

彼らのオーバーベット頻度は52%から66%に跳ね上がっています。
BBはプライシングに過敏であり、オーバーベットに対してオーバーフォールドをするため、COはオーバーベットの頻度を上げるインセンティブがあります。

さらに不思議な調整として、33%のベットサイズも頻度が上がっています(3%から9%)。
これは、BBにオーバーフォールドされたくないレンジのハンドがあるためです。

特に、セットが均衡時にオーバーベットすることが多い場合、この戦略をとります。

例えば,99 は,ロックされていない GTO の解では、チェック、スモールベット、オーバーベットのいずれでも約 14.5bb の利益を上げています。

しかしこのノ ードロックの例では,オーバーベットでは約10.5bb にしかなりませんが、スモールベットでは約13.8bb に改善されます。

次に、BBをプライスインセンシティブにモデル化し、どんなペアやエースハイもコールするようにするとどうなるかを観察してみましょう。

これはオーバーベットにオーバーコールするギャンブラーです。
想定されるエラスティシティの誤差を考慮した、フロップチェック後のCOのプレイです。

フロップ964rの、CO Cベット(エクスプロイティブ)戦略 vs BB (プライシングに敏感でない)

ベットの頻度はGTOの例と大きく変わっていないが、ベットレンジはもっぱらオーバーベットになっています。

相手が最大のベットサイズにフォールドしないのであれば、そのベットサイズを全バリューで使う方がベストになります。

GTOの例では、ハンドの開始時にBBは平均して約2.1bbを稼いでいましたが、 ノードロックの例の、プライシングに敏感な例では約1.85bb、プライシングに鈍感な例では約1.8bbを稼いでいました。

5.ボードカバレッジ

ポーカーにおけるボードカバレッジとは、幅広いボードテクスチャーの中で強いハンドを作る能力のことです。

バランスレンジはボードカバレッジがあり、どのフロップでもヒットする可能性があるようになっています。

ほとんどのオープニングレンジは、A3sのようなAxの手札をほとんど含んでいます、これはボードカバレッジを達成するために利益的な方法だからです。

タイトなオープニングレンジでも3♥2♦3♦のフロップをヒットできるのは、ボードカバレッジを念頭に置いて構築されているからです。
ボードカバレッジはフロップに限った話ではなく、ランアウト(ターンとリバーで完成されるハンドのこと。ランナーランナーと同義。)カバレッジの側面もあります。

分かりやすい例としては、フロップでフラッシュドローの可能性がある場合です。

チェックするときもベットするときもフラッシュドローを維持したいので、ターンでフラッシュを完成させるカードが来たら、両方のシナリオでフラッシュドローを主張することができるのです。

ボードカバレッジエラーは、ラインが特定のタイプのハンドで過飽和または過少である場合に生じる。

フロップでエースハイでCベットしないプレイヤーは、ターンのエースでバレルした時にフォールドが少なくなるはずである。

プレーヤーがペアをチェックバックしない場合、ターンでボードがペアになったときにハンドから押し出されやすくなる。

さっきの9♥6♦4♣の手を見てみよう。
万が一忘れていたかもしれないが、チェックされたときのCOのGTOフロップ戦略を覚えておこう。

フロップがチェックアラウンドで、ターンがA♠だったとしよう。
次の画像がBBからの最初のアクションです。

COのフロップチェック vs BBのターン戦略(GTO)

COがチェックすることで自分のレンジを弱めたため、リードすることも少しはあるが、ほとんどの場合BBは再びチェックします。

もしCOのCベット戦略を更新して、様々なサイジングで常にエースハイでブラフをかけるようにしたらどうだろう?

COがフロップをチェックし、ターンでA♠が来たとき、BBの調整は以下のようになります。

フロップチェック時のCOのノードロック vs BBのターン戦略(エクスプロイト)

BBは6%の確率でリードしていたのが、70%の確率でリードするようになりました。

なぜかというと、フロップで全てのAxをベットすることにより、フロップでチェックしたCOはターンでAが出た際に、レンジがキャップされてしまっているのです。

GTOの例では、ターンでAが落ちればランアウトカバレッジを与えられるので、COはフロップで多くのAxのハンドをチェックします。
しかし、この例では、BBはCOがトップペアを持っていないことを知っているので、たくさんベットして罰したのです。

ボードカバレッジエラーによる問題は、アンダーリプレゼンテッド・ボードカードが配られたときに顕在化する。

上記の例では、エースが配られた時、COはそのカードを主張することができず、BBは70%の確率でリードで攻撃することができるのです。

あるいは、フロップがチェック・ベット・コールになったときに、ターンでエースをヒットすると、COはインプライドオッズを失うことになります。
なぜなら、Axの手札が多すぎて、BBからペイオフを受けることができないからです。

これが、私たちがアクションをミックスする理由であり、そうすることで、あらゆる可能なラインにおけるあらゆる可能なランアウトでバリュー(とブラフ)を主張することができるのです。

ボードカバレッジのアンバランスは、注意深いプレイヤーに、落ちたカードが対戦相手のハンドを向上させた(あるいは向上させなかった)かどうかを見分ける透視能力を与えることになるのです。

GTOの例では、ターンでCOは平均して約3.8bbを稼ぎます。
ノードロックの例では、その期待値は約2.4bbに下がります。

6.まとめ

これは、エクスプロイトポーカーのスタートガイドです。

あなたがテーブルで気づいたリーク、GTOから逸脱したプレイには、これらのアンバランスのどれかがあるはずです。
もちろん、あるプレイヤーが同時に複数のアンバランスを持っている場合もあります。

タイトなプレイヤーはアンダーブラフで、A3sのようなロースーツのAxハンドを持っていないかもしれない。
ルーズなプレイヤーは、ポーラライズドレンジを持つボードでも常にCベットし、リレイズには決してフォールドしないかもしれない。

GTOウィザードAIのノードロック機能は、これらのプレイヤーに適応する方法を示してくれます。
また、あなたがモデル化した特定の最適でない相手とプレイした場合と比較して、GTOのコンテキストにおけるラインのEVがどの程度かを示すこともできます。

上で見たように、あるエラーは他のエラーよりも代償が大きくなるのです。

この記事が気に入ったらサポートをしてみませんか?