HUDのスタッツの信頼性
はじめに
ポーカーで勝つためには相手をエクスプロイトすることが非常に重要であり、そのためにHUDのスタッツを参考にしている人は多いと思います。例として架空の会話を載せてみます。
A:昨日ちょっと気になったハンドがあるんだけど、聞いてくれる?
B:いいよ。
A:相手は100NLzのレギュラーなんだけど、スタッツが300ハンドでフロップのチェックレイズ率18%とかで、ちょっとアグレッシブすぎる感じだったのね。だから、相手のチェックレイズをエクスプロイトしようと思って…
B:うーん、エクスプロイトしようとしたのは分かるけど、さすがにハンド数が少なすぎてそのスタッツ自体は参考にならないと思うな。
(数か月後)
A:そういえば以前アグレッシブだと思ってたレギュラーだけど、1000ハンドまで貯まった時点でスタッツ見たら、チェックレイズ率9%とかになってた。別にそんなアグレッシブじゃなかった。
B:うん。
A:さっきテーブルにVPIP 70のプレイヤーがいたんだけど、ハンド数がまだ100しかなかったから、もうちょっと様子を見ないと分からないよね。いいハンドが直近でたくさん配られて、たまたま高い数字に表示されてただけかもしれないし。
B:いや、VPIPが異常に高いのは間違いないと思うよ。
HUDのスタッツにはハンド数がある程度必要、というのは常識ですが、実際どれくらいのハンド数があればスタッツを信頼してよいのでしょうか。
この疑問に答えるため、PokerStarsのハンドヒストリーのログからデータを収集し、簡単な検証を行ってみました。
方法
PokerStars 6max 25NLz~500NLzまででLillian(nekochan0214)が過去にプレイした全ハンド履歴を使って、対戦相手から見たLillianのスタッツを計算します。Lillianのスタッツが相手によってどれくらい異なる値に見えてしまっているかを解析します。
結果
①ハンド数100以上300未満の相手
まずトータルVPIP、トータルPFR、フロップCB率という3つの項目について、分布をヒストグラムで示してみました。横軸が各スタッツの値で、縦軸がその値の範囲に表示されている相手がどれだけいるかの頻度です。狭くて高い山になっているのは、相手から見えている値が狭い範囲に限定されていることを示しています。それに対して、広い山になっている項目は、相手によってさまざまな値が表示されています。
より分かりやすくするために、スタッツの項目ごとに、バラつきの範囲を表で示します。中央付近の70%の相手には、ここに示す下限から上限までの範囲のスタッツが表示されています。
VPIP 20 27
VPIP_UTG 10 26
VPIP_MP 12 28
VPIP_CO 14 30
VPIP_BTN 21 39
VPIP_SB 14 32
VPIP_BB 18 41
PFR 15 22
PFR_UTG 10 26
PFR_MP 11 27
PFR_CO 11 28
PFR_BTN 17 34
PFR_SB 11 27
PFR_BB 0 14
AF 1.4 3.8
Agg 28 44
WTSD 20 41
W$SD 33 75
Flop CB 50 83
Flop CBF 0 100
Flop XF 0 71
Flop XR 0 25
Turn CB 0 67
Turn CBF 0 0
Turn XF 0 100
Turn XR 0 17
River CB 0 100
River CBF 0 0
River XF 0 100
River XR 0 0
ここで表示しているスタッツは上から順に以下の通りです。
・VPIP(%): トータルと各ポジションごと
・PFR(%): トータルと各ポジションごと
・AF: ポストフロップ全体の(Bet + Raise) / Call
・Agg(%): ポストフロップ全体の(Bet + Raise) / (Bet + Raise + Call + Check)
・WTSD(%): ポストフロップに進んだ場合に、ショーダウンになった頻度
・W$SD(%): ショーダウンした場合に、勝っていた頻度
・CB(%): 各ストリートでCBを打てる場面で、CBを打った頻度
・CBF(%): 各ストリートでCBを打って、レイズされた場合のFold率
・XF(%): 各ストリートでチェックして、ベットされたときのフォールド率
・XR(%): 各ストリートでチェックして、ベットされたときのレイズ率
この結果から、100~300程度のハンド数において役に立つスタッツはトータルVPIPとトータルPFRくらいだと言ってしまえると思います。ハンド数が100しかなくてもVPIPが40もあれば、そのプレイヤーの参加率が異常に高いことは確信が持てます。しかしポジションごとのVPIPやPFRは、それぞれのポジションをプレイした回数が少ないためにバラつきが広すぎて、信頼できる値とは言えません。UTGからのVPIPが10しかなくても、たまたまそういう値になることはよくあるので、本当にタイトなプレイヤーかどうか分かりません。
AFやWTSD、W$SDのバラつきはかなり大きく、フロップ以降の各アクション頻度はどれもほとんど参考にできません。
②ハンド数300以上1000未満の相手
ハンド数100~300の場合と比較して、VPIPとPFRの値はかなり狭い範囲にまとまっています。フロップCB率も、分布が少しまとまってきたようです。
先ほどと同じようにスタッツの項目ごとに、バラつきの範囲を表で示します。70%の相手には、この範囲のスタッツが表示されています。
VPIP 22 26
VPIP_UTG 13 23
VPIP_MP 16 24
VPIP_CO 17 28
VPIP_BTN 24 35
VPIP_SB 18 29
VPIP_BB 23 39
PFR 17 21
PFR_UTG 13 23
PFR_MP 15 23
PFR_CO 16 25
PFR_BTN 21 31
PFR_SB 14 24
PFR_BB 5 12
AF 1.6 2.8
Agg 30 40
WTSD 25 37
W$SD 41 65
Flop CB 58 78
Flop CBF 0 79
Flop XF 29 56
Flop XR 0 20
Turn CB 27 57
Turn CBF 0 50
Turn XF 33 71
Turn XR 0 16
River CB 20 71
River CBF 0 0
River XF 21 100
River XR 0 14
前回の表と比較して、ハンド数300~1000ではトータルVPIPとトータルPFRのバラつきがさらに小さくなっています。とはいえ各ポジションごとのVPIPやPFRはまだ信頼性が低い値で、極端な値でない限りはエクスプロイトを考える根拠にはならないでしょう。AFやWTSD、W$SD、フロップ以降の各アクション頻度もやはり信用できません。
③ハンド数1000以上3000未満の相手
ハンド数がここまで増えると、分布もかなり狭い範囲にまとまってきます。スタッツの項目ごとに、バラつきの範囲を表で示します。70%の相手には、この範囲のスタッツが表示されています。
VPIP 23 26
VPIP_UTG 15 22
VPIP_MP 18 22
VPIP_CO 20 25
VPIP_BTN 28 33
VPIP_SB 21 26
VPIP_BB 29 37
PFR 18 20
PFR_UTG 15 22
PFR_MP 17 21
PFR_CO 18 25
PFR_BTN 24 29
PFR_SB 15 21
PFR_BB 7 11
AF 1.7 2.5
Agg 32 39
WTSD 27 34
W$SD 47 60
Flop CB 64 78
Flop CBF 29 57
Flop XF 31 48
Flop XR 8 18
Turn CB 35 48
Turn CBF 0 100
Turn XF 39 69
Turn XR 0 9
River CB 38 57
River CBF 0 50
River XF 46 65
River XR 0 15
ようやくそれぞれのスタッツがちゃんと使えるようになってきました。細かい値には意味がないですが、相手のプレイの傾向を大まかにとらえることはできそうです。
たとえばフロップXR率が3%しかなかったり、フロップCBF率が80%もあったりすれば、それらをリークと考えてエクスプロイトしにいくべきでしょう。
しかし、ターン以降のアクション頻度はまだ信頼性が低いです。例えばターンCBF率は0-100%になってしまっています。HUDに表示される値がたまたま0%になったり、100%になってしまうことが十分あり得るわけで、まったく信頼することができません。
フロップ、ターン、リバーと進むにつれて、スタッツを計算するためのサンプル数が全然貯まらなくなってきます。なので、よほどハンド数が増えてこないとターンやリバーのスタッツは役に立ちません。ターンやリバーにリークがある相手も多いので、スタッツだけで見分けることができれば嬉しいですが、実際はハンド数が1000-3000程度あっても難しいです。
考察
HUDのスタッツの値はかなり偶然に左右されます。
本当の相手のプレイの傾向を知るためには、お互いにかなりのハンド数をプレイしていてHUDのハンド数が十分に貯まっているか、相手のスタッツがよほど極端であるかのどちらかが必要です。
項目によって、スタッツが信頼できる値に落ち着くためのハンド数が大きく異なります。ハンド数が100程度あればトータルVPIPとトータルPFRに関しては信頼できる値が得られます。極端に参加率が高い相手がいれば、すぐに見分けて、エクスプロイトを考えることができます。
それに対してポストフロップのアクション頻度は、サンプル数が比較的貯まりやすいフロップですら、信頼性はかなり低いです。最低でもハンド数1000は欲しいです。ターン以降はそれでも足りない印象です。
今回選んだスタッツは代表的な指標でしたが、サンプル数がもっと限定されるような特定のラインに限定されたスタッツを知りたいと思ったら、とてつもないハンド数が必要になるでしょう。
また、今回の検証とは話題がずれますが、HUDに表示される相手のスタッツは過去の値なので、時間経過とともに相手のプレイの傾向が変化している可能性もあります。1~2年かけて相手のハンド数をたくさん集めたとしても、目の前の相手の現在のプレイの傾向とは異なっているかもしれません。
個人的な意見ですが、HUDは極端なスタッツを取る相手を見分ける簡易的な指標に過ぎず、実戦のプレイの中で相手の戦略とGTO戦略との乖離を実際に見つけることがエクスプロイトを考える上で最も役に立つと思います。特にショーダウンしたハンドをいくつか見ることで、相手のプレイの傾向を細かく推測していくことができます。
私は相手のスタッツをHUDに表示させてはいますが、上記の理由から極端な場合以外、ほとんどはそれ単独で判断の根拠にはしません。たくさんのスタッツを表示させて、それだけでアクションの判断の根拠にしてしまうプレイヤーは、相手の本当の姿を見誤って、エクスプロイトを意識したつもりでかえって損をするリスクを抱えるでしょう。
HUDの細かい指標は、自分が過去にプレイした数十万ハンドの履歴に対しては十分に信頼できる値になるので、自分自身のプレイの傾向を知るために役立てると良いと思います。
今回の記事はここまでです。
スタッツを勉強すれば明日から勝ち組!みたいな安易な内容ではなく、むしろ有用性の限界を示したので、読んだ満足度は低かったかもしれません。
しかし、読んでくださった方が、HUDのスタッツを慎重に解釈し、正しくエクスプロイトを考えるきっかけになれば嬉しいです。
読んでいただき、ありがとうございました!
わたしのポーカー研究や執筆活動を支援いただける方は、少額でもサポートいただけるととても嬉しいです!