ポーカーにおける利益の根源はどこにある
再開後の1記事目です。
ただ今回はこんな背景で記事を書いてるので、計算ツールなどを使った検証は抜きの”思考整理”的な内容です。
https://twitter.com/NER_EBOK_/status/1478389344578981891
今回は下記をテーマに書いていきます。
①【ポーカーにおける利益の根源】
我々はなぜGTOを勉強するのか。
ポーカーはなぜ長期的に勝つ人と負ける人が存在するのか、
その秘密を探るべく我々はアマゾンの奥地へと向かうことはなくPCの前にいます。
①-1:-戦略の差異-
ずばり、ポーカーにおいて利益が出るのは、戦略(もしくは選択)の差異によるものです。
当たり前の話ですが、全員が全てのスポットで同じ選択をする場合、全員のEVが+-0になります。(レーキを除く)
ですが、ミスをする人がいればいるほど、ミスをしない人のEVが向上する可能性があります。
”可能性があります”という表現をしたのは、内容によっては「相手がミスをしただけではこちらのEVが向上するとは限らない」スポットが存在するためです。
①-2:IP:"AAorQQ" vs "KK"
具体的な例を挙げます。
33322というボードで
IP:AA(6コンボ)、QQ(6コンボ)
OOP:KK(6コンボ)
potが$100でお互いの残りスタックも$100だとします。
※わかりやすいように極端な例示をしていますが、
"お互いのEQは50%vs50%でIPはバリューorブラフ/OOPはブラフキャッチャーを持っている"
というシチュエーションは現実にもよくあるのではないかと思います。
①-3:GTO解とミスの定義
このシチュエーションにおいて、GTO解は一つしかないはずです。
結論から言います。
OOP:check100%
IP:$100bet75%
(AA:100%=6コンボ QQ:50%=3コンボを$100ベット、QQ50%=3コンボをチェック。トータル9コンボ中/12コンボを$100ベット。)
OOP:Call 50%
になるはずです。
IPのEVが+$75
OOPのEVが+$25
になるかと思います。(手計算なので間違っていたら後日訂正します。)
(※なぜこれだけがGTO解だと言い切れるの?EVの手計算ってどうやるの?
といった質問などがある場合、本題とは離れてしまうので、1人でも要望を頂いたら後日別途記事にします。コメント欄かTwitterで教えてください。(Twitterのリンクを文末に貼ります。))
この場合、お互いは戦略を変更することによってEVを増やすことができない(=ナッシュ均衡)状態であると言えます。
このシチュエーションにおいて、下記のアクションを”ミス”と定義することができます。
1,IPがAAをチェックバックする(たとえ100回に1回でも)
2,IPのベットサイズがオールイン未満になる
3,OOPが100%check以外の戦略を取る
4,IPがQQを50%未満もしくは50%より高い頻度でベットする
5,OOPが50%未満もしくは50%より高い頻度でコールする
この時、例えばIP側が1番や2番のミスをした場合、OOP側は戦略を変更しなくてもEVが向上します。
3番は少し例外なので置いといて、問題は4番と5番です。
①-3の冒頭で記載した戦略が唯一の均衡解であるため、4と5はどちらもミスであると言えます。
しかし、ミスを犯したにも関わらず、もう片方が戦略を変更しなければ双方のEVに変化はありません。
これが①-1で書いた「相手がミスをしただけではこちらのEVが向上するとは限らない」スポットに当てはまります。
②【利益を得る戦略】
②-1:頻度ミスによる利益を得る方法
双方のEVが変化しないのであれば、それも一つの均衡解なのでは?と思う方もいるかもしれませんが、
OOPのコール頻度が50%未満の場合、IPはQQのベット頻度を上げ、反対に50%より大きい場合、QQのベット頻度を下げることでOOPをExploitすることができます。
また、IPのQQベット頻度が50%より大きい場合、OOPはコール頻度を上げ、50%未満の場合、コール頻度を下げることでIPをExploitすることができます。
そのため、上記は均衡解ではありません。
②-2:現実的な利益
先程定義した1~3のミスを相手がした場合、こちらが利益を得る方法は難しくないと思います。
そして下記のミスから、前述した方法で利益を得ることの方が難易度が高いと思います。
前提としてOOPのコール頻度やIPのブラフ頻度を適切に把握してなければならない上に、
この戦略変更を行った場合、相手がもう一度戦略を変更しExploitし返されてしまうリスクもあります。
相手の頻度を間違えてリーディングしていた場合、こちらが一方的にミスをしていることにさえなりかねません。
②-2:つまり
今回のテーマに対する結論は
ポーカーにおいて利益は
・相手がミスをすること
・相手のミスに合わせて戦略を変更すること
によって得ることができると言えると思います。
③【今後のテーマ】
あくまで現段階での仮説ではありますが、以上のことを踏まえると、
1.アグレッサー側はベットサイズの選択とベットレンジの構成
2,ディフェンス側はディフェンス頻度の調整
によってEVを大きく変動させることになると考えています。
そのため、今後まずは
「アグレッサーはリバーに向けてどのようにレンジを構成させていくか」
「ディフェンス側はどのような頻度でトリプルバレルを耐え抜くか」
といったことを重点的に学んでいきたいと思います。
そのためにはプリフロップのレンジも同時に重要になってきますので、
そのへんについても同時進行で少しずつ記事を投稿していきたいと思います。
このnoteは今後も自学のために投稿していきます。
ご意見ご感想、間違いの指摘や質問など、ぜひぜひお気軽にお寄せください。