Hypergeometricサイズ:相手にdraw outsがある場合のbetサイズについて

文責:しぐま (Twitter: link)


1. 導入:More than geometric? Less than geometric?

一般的に、staticなboardで自レンジにnuttishハンドが存在する場合にはgeometricサイズを用いたpolarize戦略が用いられることがあります。では、boardがdynamicになった場合にはgeometricサイズより大きいサイズを用いるでしょうか?それとも小さいサイズを用いるでしょうか?

ある人は小さいサイズと答えるかもしれません。理由は例えば、先のstreetで相手のdrawハンドに捲られてしまう可能性があるためall inを見据えたサイズを打ってpotを焚くのは危険だからなどでしょうか。
またある人は大きいサイズと答えるかもしれません。理由は例えば、相手のdrawハンドがcallできないようなoddsになるように大きいbetを打てばそれらのハンドに対してequity denialさせることができるからなどでしょうか。

このように少なくともbetサイズを大きくも小さくもする誘因があると言えます。しかし、実際にプレイする場合にgeometricサイズより大きいサイズ(= hypergeometricサイズ)を意図的に用いるプレイヤーはごくわずかです。
以下では相手にdraw outsがある場合のbetサイズ選択(特にhypergeometricサイズ)についてmodel計算を通して理解を深めてゆきます。

第2章のmodel計算をフォローするにはAKQ model(やその亜種)に対するGTO  solutionの計算や数学的な手続きにある程度慣れている必要があるため、一部の読者には難易度が高い可能性があります。
その場合には、第3章のhypergeometricサイズが用いられる実際のスポットとmodel計算の結果との比較に進んでください。


2. Model計算

2.1. 1つ目のmodel:"Pseudodynamic" 2-street AKQ model

はじめに、次のようなdraw outs有りbetサイズ可変2-street AKQ modelを考える。

OOP:AまたはQ(等しい確率で配られる)
IP:K
・SPR:$${S}$$
・2 streetに亘ってbetが可能(それぞれのstreetをturnとriverと呼ぶ)。
・RiverではKまたは2がcommunity cardとして開かれる(それぞれの出現確率を$${p, 1-p}$$とし、$${p}$$は十分小さいとする)。
・Raiseは禁止とする(禁止する必要はないが議論の簡単のためにそのようにする)。
・Bet size:Turnでは$${r\in[0,S]}$$、riverでは$${r'\in[0,S']}$$とする(ただし、$${S'}$$はriver突入時のSPRとする)。

このmodelに対するGTO戦略として以下を仮定する。

Turn
・OOP:Aをpureにbetし、Qを$${x}$$の頻度でbetする。ここで$${x\in[0,1]}$$はIPのKをcall or foldのindifferentにする値に設定する。
・IP:Kはcall or foldのindifferentになる。

River(turnでbet→call後)
・OOP:RiverでKが落ちた場合にはrange check、2が落ちた場合にはAをpure bet、Qを$${\frac{r'}{1+r'}=:\alpha'}$$の頻度でbetする(ことでIPのKをindifferentにする)。
・IP:2が落ちた場合にはKはbetに対してcall or foldのindifferentになる。

IPのKのcall頻度(fold頻度)はOOPのQがbet or checkのindifferentになる条件から決まるが、この後の議論には影響しないため割愛する。

Turnのbetに対してIPのKがcall or foldのindifferentになることを利用するとKがpureにfoldすると思ってOOPのEVを計算することができて、

$$
\begin{align*}
\mathrm{EV}_{\mathrm{OOP}}=(\text{Turn OOPのbet頻度})\times (\text{Pot size})=\frac{1+x}{2}\times 1
\end{align*}
$$

となる。
従って、Qのbet頻度$${x}$$を求めればEVを計算することができる。
IPのKがturnのbetに対してcall or foldのindifferentになるという条件から、

$$
\begin{align*}
&(\text{KのFold EV}) = (\text{KのCall EV}) \\
\Leftrightarrow {}& 0 = -r + p(1+2r)+(1-p)\frac{\frac{1}{2}(x-\alpha')}{\frac{1}{2}(1+x)}(1+2r)\quad\quad(1)
\end{align*}
$$

が成り立つ。
右辺第1項はturnのbetに対してcallするのに必要な額。第2項はriverでKが落ちる場合で、$${(\text{Kが落ちる確率})\times(\text{Kが落ちた場合のIPのEV}[=\text{Pot size}])}$$となっている。第3項はriverで2が落ちる場合で、$${(\text{2が落ちる確率})\times(\text{2が落ちた場合のIPのEV}[=(\text{OOPがcheckする確率})\times(\text{Pot size})])}$$で計算される。

ここで、OOPがriverでcheckする確率が正になることを暗に仮定している。つまり、

$$
\begin{align*}
x\geq\alpha'
\end{align*}
$$

を課す。
式(1)を解けば、

$$
\begin{align*}
x=(1-p)(\alpha'+(1+\alpha')\alpha)-p \quad\quad(2)
\end{align*}
$$

となる。ただし、$${\alpha:=\frac{r}{1+r}}$$はbetサイズ$${r}$$に対するアルファである。

特に$${p=0}$$の時(riverで2が必ず落ちる時)、$${x=\alpha'+(1+\alpha')\alpha}$$となって通常のstaticな2-street AKQ modelの場合を再現する。この場合、OOPはriverで使うbluff(Q)のbet頻度$${\alpha'}$$に加えて、turnではriverでbetするハンドを全てvalueだと思った時のアルファ($${=(1+\alpha')\alpha}$$)をbetする。

式(2)を見ると、dynamicな場合のbluff頻度$${x}$$はstaticな場合に対して補正を加えた形になっている。式(2)の第1項は、staticな場合のbluff頻度にriverで2が落ちる確率を掛けて補正している。第2項は、riverでKが落ちる場合を考慮してbluff頻度を減らす役割をしている。

$${r}$$と$${r'}$$を動かして$${x}$$を最大化すればOOPのEVを最大化できるが、式(2)の第1項はstaticな場合($${p=0}$$)のbluff頻度に対応していることから、よく知られたstaticな場合の2-street AKQ modelの結果から

$$
\begin{align*}
r=r'=\frac{-1+\sqrt{1+2S}}{2}
\end{align*}
$$

が$${x}$$の最大値を与えることがわかる。

従って、このmodelは相手にdraw outsがあるというdynamicな状況を考えているにも拘らず、staticな場合と同様geometricサイズが肯定される結果を与える。これはturnとriverのbetサイズに関する対称性が破れないためである。
また、このmodelはdrawが完成した時(Kの場合)にIPが一方的に勝ってしまい(意味のある)betがお互いに発生せず、riverカードがragの時(2の場合)には両者のレンジのEQが保存されるというような"pseudodynamic"なmodelになっている。そこで以下では真にdynamicな状況を作るための工夫を加えた別のmodelを考える。

2.2. 2つ目のmodel:Dynamic 2-street AKQ model

新たなmodelとして、次のようなdraw outs有りbetサイズ可変2-street modelを扱う。

OOP:Aまたは2(等しい確率で配られる)
IP:$${X_1, X_2, \cdots, X_N}$$(等しい確率で配られる)
・$${\{X_i\}}$$はAより弱く2より強い相異なるハンド群とする。$${N=4}$$なら例えば$${X_1=K, X_2=Q, X_3=J, X_4=T}$$などと考えれば良い。
・SPR:$${S}$$
・2 streetに亘ってbetが可能(それぞれのstreetをturnとriverと呼ぶ)
・Riverでは$${{\{X_i|i=1, \cdots,N}\}}$$が一様に出現する。
・Raiseを許す。
・Bet size:Turnでは$${r\in[0,S]}$$、riverでは$${r'\in[0,S']}$$とする(ただし、$${S'}$$はriver突入時のSPRとする)。

このmodelでは、IPのレンジの$${\frac{1}{N}}$$の割合がriverでdrawを完成させてnutsに昇格し、残りの$${\frac{N-1}{N}}$$はOOPのAと2の間の強さを保つという状況を作り出している。$${N}$$は十分大きいとし、このmodelに対するGTO戦略として以下を仮定する。

Turn
・OOP:Aをpureにbetし、2を$${x}$$の頻度でbetする。ここで$${x\in[0,1]}$$はIPの$${\{X_i\}}$$をcall or foldのindifferentにする値に設定する。
・IP:$${\{X_i\}}$$は全てcall or foldのindifferentになる。

River(turnでbet→call後、riverカード$${X_j}$$)
・OOP:Aをpure bet、2を$${\frac{r'}{1+r'}=:\alpha'}$$の頻度でbetする(ことでIPの$${\{X_i|i\neq j\}}$$をindifferentにする)。
・IP:Betに対して$${X_j}$$をpure raise all in、$${\{X_i|i\neq j\}}$$を適切な頻度でraiseし、残りを(適切な頻度で)callまたはfoldする。

TurnでIPの$${\{X_i\}}$$がcall or foldのindifferentになる条件から、

$$
\begin{align*}
0=-r+(1+2r-\mathrm{EV}_{\mathrm{OOP}}^{(\mathrm{river})})\quad\quad (3)
\end{align*}
$$

を得る。ただし、$${\mathrm{EV}_{\mathrm{OOP}}^{(\mathrm{river})}}$$はriver突入時のOOPのEVである。RiverにおけるIPのdrawの完成確率を$${p:=\frac{1}{N}}$$と置いてこれを計算すると、

$$
\begin{align*}
\mathrm{EV}_{\mathrm{OOP}}^{(\mathrm{river})}&=(\text{Bet頻度})\times(\text{Bet EV}) \\
&=\frac{1+\alpha'}{1+x}((1-p\beta'')(1+2r)+p\beta''(1+2r)(-r')) \\
&=\frac{\beta'}{1+x}(1+2r)(1-p\beta''(1+r')) \quad\quad (4)
\end{align*}
$$

となる。ただし、riverのraiseをraise $${r''\,[100\,\%]}$$とし、$${\beta'':=\frac{1+2r''}{1+r''}}$$, $${\beta':=\frac{1+2r'}{1+r'}= 1+\alpha'}$$と定義している。Riverのraiseはall inであることから、

$$
\begin{align*}
(1+2r)r'+(1+2r)(1+2r')r''=S-r\end{align*}\quad\quad (5)
$$

が成り立つ。
式(3)と式(4)から、

$$
\begin{align*}
x&=-1+\beta\beta'(1-p(1+r')\beta'') \\
&=\alpha'+(1+\alpha')\alpha-p\beta\beta'\beta''(1+r') \quad\quad (6)
\end{align*}
$$

が導かれる。ここで、$${\alpha:=\frac{r}{1+r}}$$はbetサイズ$${r}$$に対するアルファ、$${\beta:=\frac{1+2r}{1+r}=1+\alpha}$$である。
式(6)の第1項は通常のstaticな場合の2-street AKQ modelにおけるbluff頻度に等しく、第2項がdraw outsが存在することによる補正項である。

式(5)を整理して式(6)に代入すると、

$$
\begin{align*}
x=-1+\beta\beta'\left(1-p(1+r')\frac{2(\frac{S-r}{1+2r}-r')+1}{\frac{S-r}{1+2r}-r'+1}\right)\quad\quad (7)
\end{align*}
$$

となる。
OOPのEVは、$${\mathrm{EV}_{\mathrm{OOP}}=\frac{1+x}{2}}$$と書けるから、$${x}$$を最大化するように$${r,r'}$$を取れば$${\mathrm{EV}_{\mathrm{OOP}}}$$は最大化される。
式(7)は補正項のために$${r}$$と$${r'}$$に関する対称性が破れている。そのため、geometricサイズとは異なるサイズが肯定されることが期待される。$${x}$$の最大値を与える$${r,r'}$$は式(7)を順次偏微分することで求めることができるが、一般の$${S}$$と$${p}$$について解析的にこれを実行することは困難である。そこで、$${p\sim0}$$の時にbetサイズがgeometricサイズよりも大きくなるのか小さくなるのかを摂動的に調べる。

まず、$${p\ll 1}$$を仮定して、

$$
\begin{align*}
r&\simeq r_g+p\Delta r_1+p^2\Delta r_2 \\
r'&\simeq r_g+p\Delta r_1'+p^2\Delta r_2' \\
\end{align*}
$$

と$${r}$$と$${r'}$$を$${p}$$に関して2次まで展開する。ただし、$${r_g=\frac{-1+\sqrt{1+2S}}{2}}$$はgeometricサイズである。
$${p}$$が十分小さいとすると、riverのOOPのbetはall inが選択される(という予備計算)から$${r''=0}$$として式(5)に$${r}$$と$${r'}$$の展開した表式を代入して$${p}$$の係数を比べることで、

$$
\begin{align*}
\Delta r_1+\Delta r_1'&=0 \\
\Delta r_2 + \Delta r_2' + \frac{\Delta r_1^2}{r_g} &= 0 \\
\end{align*}
$$

を得る。
さらに、$${\beta}$$の$${p}$$に関するTaylor展開から

$$
\begin{align*}
\beta \simeq \beta_g + \frac{\Delta r_1}{(1+r_g)^2}p - \frac{\Delta r_1^2}{(1+r_g)^3}p^2 + \frac{\Delta r_2}{(1+r_g)^2}p^2
\end{align*}
$$

が導かれる。ここで、$${\beta_g:=\frac{1+2r_g}{1+r_g}}$$である。
従って、

$$
\begin{align*}
\beta\beta' &\simeq \beta_g^2 +\beta_g\frac{\Delta r_1+\Delta r_1'}{(1+r_g)^2}p + \frac{\Delta r_1\Delta r_1'}{(1+r_g)^4}p^2 - \beta_g \frac{\Delta r_1^2+\Delta r_1'^2}{(1+r_g)^3}p^2 + \beta_g \frac{\Delta r_2+\Delta r_2'}{(1+r_g)^2}p^2 \\
&= \beta_g^2-\frac{3S^2+1}{(1+r_g)^4r_g}p^2\Delta r_1^2
\end{align*}
$$

より、

$$
\begin{align*}
x &\simeq -1 + \left(\beta_g^2 - \frac{3S^2+1}{(1+r_g)^4r_g}p^2\Delta r_1^2 \right)(1-p(1+r_g-p\Delta r_1)) \\
&\simeq -1+\beta_g^2 - (1+r_g)\beta_g^2 p + \left(\beta_g^2\Delta r_1-\frac{3S^2+1}{(1+r_g)^4r_g}\Delta r_1^2\right)p^2
\end{align*}
$$

となる。
$${x}$$の最大値を与える$${\Delta r_1}$$は、$${p^2}$$の項の係数を平方完成することで、

$$
\begin{align*}
\Delta r_1 = \frac{1}{2}\beta_g^2 \frac{(1+r_g)^4r_g}{3S^2+1} >0
\end{align*}
$$

と得られる。
この値は常に正であるから、(少なくとも$${p}$$が十分小さい限りは)turnにおけるbetサイズはgeometricサイズよりも大きいサイズとなる。

数値計算(Mathematica)により式(7)の最大値を与える$${r, r'}$$を求めると、例えば、$${S=2, p=10^{-4}}$$の場合に

$$
\begin{align*}
r &= 0.6183 \\
r' &= 0.6177
\end{align*}
$$

となり、確かに$${r > r_g=0.6180 > r'}$$が成立している。

よりdraw outsが多い場合、例えば$${S=2, p=1/4}$$では、

$$
\begin{align*}
r &= 1.422 \\
r' &= 0.1503
\end{align*}
$$

となり、やはり$${r > r_g > r'}$$が成立する。

このmodelはturnのbetサイズとしてgeometricサイズよりも大きなhypergeometricサイズを肯定するmodelになっている。

3. Hypergeometricサイズが用いられるスポットとmodelとの比較

上記の2つ目のmodelでは、riverでdraw outsがある場合に(draw完成の確率が十分低いという条件の下で)outsが多くなればなるほど大きなhypergeometric sizeが有用であるということが示唆された。

以上の観察を踏まえて、最後にhypergeometricサイズが使用される具体的な状況を眺めてこのmodelと比較する。

以下にGTO WizardによるCO vs. SB 3bet potのsolution(Cash 100bb, 6max, NL50, open: 2.5bb, 3bet: GTO)を示す。

Flop KsTh5sのtwotone boardでSBが33%のCBを打ってCOがcallし、turnでAhが落ちてdouble-FD boardになった状況を考える[図1]。

[図1] CO vs. SB 3bet pot KsTh5s Ah。

Turn時点で両者のSPRは1.92となっており、turn-riverの2eのgeometricサイズは60.0%である。このスポットではb 75%とb 125%の頻度がそれぞれ11.5%と14.5%とメインサイズに据えられており、hypergeometricサイズが用いられている場面となっている。

図2のturn開始時のEQ bucketを見ると、EQ70%以上のハンド群(two pair, set, straight)はSBが一方的に多く所持していて、COはそれ以下のEQの比較的marginalなハンドがレンジの大半を占めている(hitまたはhit+drawがほとんど)。

[図2] Turn開始時におけるレンジ(左:SB、右:CO)とEQ bucket。

SBはb 125%にvalueとして主にtwo pair+(色なしのみ選択するなどの注意点がある)を用いて、hit+GSSDのTXなどを(semi) bluffとして用いる。このb 125%に対してCOは、FDの付かないhit+GSSDがfoldになるだけでなく、hit+FD+GSSDのようなハンドもcall or foldのindifferentになる(大きいbetに対してimplied oddsが非常に低い)[図3]。

[図3] Turn 125% DBに対するCOの戦略。

この時COのcallレンジは図4のEQ bucketからわかる通り、ほとんどがcombo drawから構成されている。Flushのみに注目して大雑把にoutsの数を考えると、レンジの半分がハートのFD、もう半分がスペードのFDであるため、それぞれにflush完成の9枚ずつのoutsがあるとして、$${\frac{1}{2}\times18\,\%+\frac{1}{2}\times18\,\%=18\,\%}$$の確率でCOはriverでdrawを完成させることができる。実際にはstraightの完成によるoutsもあるためそれも考慮すると、(かなり粗い見積もりで)25%程度の確率でdrawを完成させられる。

[図4] Turn 125% DBを打った直後のレンジ(左:SB、右:CO)とEQ bucket。なお、COに関してはcallレンジのみ表示している(対応してEQ bucketもcallレンジに関するものとなっている)。

すると、このスポットは前に見た$${S=2, p=1/4}$$の状況に似通っていると言える。結果を再掲すると、

$$
\begin{align*}
r &= 1.422 \\
r' &= 0.1503
\end{align*}
$$

で、この時のbluff頻度$${x}$$は、

$$
\begin{align*}
x=0.2784
\end{align*}
$$

となる。

まず、modelから導かれる適切なbetサイズはturn 142.2% - river 15.03%で、GTO solutionのturn 125% - river 19%のメインプレイラインを支持する。さらに、modelのturnのbluff頻度27.84%はGTO solutionのturnのbluff頻度($${\sim 26.4\,\%}$$)と非常に近くなっている(50%以下のEQのハンドをbluffとして計上した)。一般的に、betサイズが大きくなればなるほどbluffを多く注ぎ込む必要があるが、このようにdraw-heavyな状況においてはbluff頻度は通常よりも小さくなりうる(b 125%に対するアルファ(bluff頻度)は55.5%)。

以上の観察をまとめると、IPにdrawが存在するような場合には、OOPからhypergeometricサイズを用いてIPのdrawハンドからEQを奪ってpositionの不利を軽減することが有益になりうるということである。

[図5] Turn開始時のレンジ(左:SB、右:CO)とEQ bucket。なお、SBに関してはb 125%レンジのみ表示している(対応してEQ bucketもb 125%レンジに関するものとなっている)。

もちろん、modelとこのスポットのGTO solutionは異なる点も多く存在しており(例えば、turnのCOのraise all inなど)、より精巧にmodel化するのであればOOP(SB)のmarginalなハンドの存在やIPのhigh-EQハンドの存在などを考慮する必要があると考えられる。しかし、今回のmodelは(少し数値計算を借りて)手で解けるレベルの簡単なものであるにも拘らず、hypergeometricサイズを用いる状況を上手く再現しており非常に有用であると言える。


最後にSPRのPRの部分をさせていただきますが、GTO Wizard partnerのArash! (Twitter: link)が主催するポーカーサークルSeeker Startは目黒にて毎週リング形式の勉強会【鉄強会】を行っております。ハンドショウを基本として議論や思考の共有を重視しています。また、月に1度は初級者向けの座学講習も開催しておりますので詳しくはスケジュールをご確認ください(link)。

なお、記事内にGTO Wizardのsolutionを引用することについてGTO Wizard Japan運営に確認をとっております。

以下の部分には内容はありません。Noteが良かったと思ってくださる方がいらっしゃいましたら寄付のつもりで購入していただけますと幸いです。部分ツイートが一つ書いてあります。


ここから先は

59字

¥ 300

この記事が気に入ったらチップで応援してみませんか?