【経営学者の競馬予想】予想モデルの精度と回収率が高くなる条件 part1
こんにちは,yoshiです。
この記事では,私の予測モデルの精度について分析した結果を説明させていただきたいと思います。また,予測モデルには競馬の条件によって得意不得意があります。そのため,期待値が高くなる条件についても紹介させていただきます(この記事は3,119文字です)。
私の競馬予想のご利用などにお役立ていただけましたら幸いです。
私の予想モデルは継続的に改良しております。そのため,今回の結果は2021年10月5日現在のものとなります。モデルの改良が一段落付き,結果をまとめる度に新しい記事にしていきたいと思います。
分析期間は,
期待勝率の計算に用いたデータは2015年1月1日~2020年10月1日
検証に用いた過去のデータを使ったバックテストについては2020年10月1日~2021年10月1日(3,207レース)
となっております。
全体の成績
まずは予想モデルが算出した各レースの期待勝率1位と1番人気馬の成績を見てみましょう。
表1 期待勝率1位の成績
期待勝率1位の勝率は29%,複勝率は60%となっており,どちらも1番人気馬の勝率よりも低くなっています。
しかし,重要なのは回収率です。期待勝率1位の単勝回収率は92%,複勝回収率は95%であり,これは1番人気馬の回収率やランダムに馬券を買った場合の回収率80%をを10%前後上回っています。
「回収率100%超えていないから損しちゃうじゃん」と思った方もいらっしゃるかも知れませんが,我慢してもう少し読み進めてください。
次に,期待勝率順位別の勝率・回収率を示したグラフ1です。
グラフ1 期待勝率順位別の勝率・回収率
期待勝率順位が高くなるにつれて勝率・複勝率が高くなっています。これは,モデルが上手く推定できていることを意味します。とくに,予想勝率13位以下の馬は回収率が著しく下がっているため,非推奨です。
回収率は基本的には右肩下がりとなっていますが,勝率ほどは綺麗なグラフになっていません。この理由は,期待勝率と期待値は別であり,それぞれの順位にオッズの過小評価されている馬・過大評価されている馬が混じっていることによるものです。
私の競馬予想の特徴は期待勝率から算出された期待オッズも公開していることです。モデルの精度が高ければ期待オッズよりも実際のオッズが高い馬(過小評価されている馬)を買うことによって理論上は回収率が100%を超えるはずです。
オッズで場合分けした成績
では,オッズで場合分けした成績を見てみましょう。ここでは,
期待オッズ>実際のオッズ:過大評価されている馬
期待オッズ<実際のオッズ:過小評価されている馬
と考えてください。過小評価されている馬の期待値は高いと考えられます。
表2 期待勝率1位馬をオッズで場合分けした成績
表3を見ていただけると分かるように,過小評価されている馬を買った場合,単勝回収率が104%,複勝回収率が103%と回収率100%を超えています。
また面白い点は,過大評価されている馬も,単勝回収率は80%と低めですが,勝率38%,複勝率68%となっており,1番人気馬を買うよりも的中率が上がっています(表1 それぞれ33%,64%)。
そのため,馬券を買う際,基本的には過小評価されている馬を買うべきですが,レースによっては軸馬を「期待勝率1位馬かつ,期待オッズが実際のオッズを上回る過大評価馬」とし,ヒモとして「過小評価馬」を買うという買い目をしても面白いかもしれません。
条件別の成績
統計を使った予想モデルは様々なファクターを総合的・相対的に勘案しますが,状況・条件によってそれらのファクターの勝率に対する影響が変化するため,得意な条件・不得意な条件があります。
そこで,次は条件別の成績を見てみましょう。まずはクラス別成績です(表3)。
表3 クラス別期待勝率1位馬の成績
嬉しいのは重賞の回収率が高いことですね。おそらく(1)重賞に出る馬は過去成績に関する情報が豊富にあり,予測モデルの得意分野であること,(2)競馬ファンの方々の思い入れのある馬が多く,バイアスや応援馬券などによってオッズが歪んでしまっていることが理由だと思います。
また,新馬戦も回収率が高くなっています。これは,新馬戦はデータが少ないため,実力とオッズに歪みが大きく,血統・兄弟馬に関する豊富なデータを総合的・相対的に扱っている予測モデルの方が適切に期待勝率を算出できているためであると思われます。
ただし,未勝利戦や2勝3勝クラスはレース数が多いにもかかわらず回収率は低めです。理由はまだ分かりません。とくにレース数の多い未勝利戦で回収率が引くことは全体の回収率を下げる大きな要因となっています。どなたか未勝利戦や3勝クラスのレースの特徴をお教えいただけると幸いです。
とりあえずは,私の予想を利用される場合はこれらのクラスでは馬券を買わないことを推奨いたします。
続いては,芝・ダート別期待勝率1位の成績です(表4)
表4 芝・ダート別期待勝率1位の成績
芝の成績はあまりよくありませんが,ダートの単勝回収率は107%と高いですね。芝よりもダートの方が馬の実力通りの結果になるため,予想モデルの成績が良くなるということは様々なAI競馬予想家さんがおっしゃっており,私のモデルでも同様のことが起きているのだと思います。
最後に,期待勝率1位の重量種別毎の成績を見てみましょう(表5)
表5 期待勝率1位の重量種別毎の成績
ハンデ戦と別定戦の成績が低いです。おそらく,斤量によるハンデをモデル(私)が上手く扱えていないことが理由だと思います。斤量が重ければタイムは早くなるはずですが,斤量はそもそもの実力が強い馬・騎手ほど重く設定される傾向があるので統計上の扱いが非常に難しいです。たとえば,私の分析では,単純に(他の馬の強さや実績を無視して)斤量とタイムの関係を分析すると,斤量が重いほど相対的に早いタイムとなります。これは今後の課題ですね。
私の予想を利用される際にはハンデ戦や別定戦もなるべく避けることをオススメします。
まとめ
私の予想モデルの特徴をまとめると次のようになります。
(1)期待勝率1位馬の単勝回収率は92%だが,過小評価されているという条件を付ければ104%となる。
(2)過大評価馬でも期待勝率1位であれば軸馬とするのはおもしろいかも。
(3)期待勝率13位以下の馬は非推奨。
(4)未勝利戦,2勝3勝クラスは回収率が低い。
(5)ダート戦推奨
(6)ハンデ戦・別定戦も回収率が低め。
期待勝率1位かつ過小評価馬でも104%の回収率となっていますが,馬券裁判の卍さんがおっしゃるように,期待値の取れる馬を組み合わせた馬券を買うことによって回収率はさらに上がります。
ただ,私は馬券下手ですし,適切な馬券を選択するための予想モデルもまだ構築できていません。そのため,まだ推奨買い目の情報は予想記事に載せておりません。買い目を選択する際には私の予想はあくまで参考とし,皆さんの予想と組み合わせて馬券を購入されることをオススメします。
これも逆に買い目に悩むという競馬で面白い作業が残っているとメリットとして捉えていただけると幸いです。馬券上手の皆さんでしたら,適切な買い目で104%以上の回収率を達成することも可能です!
また,さらに条件を組み合わせいくことで,とても高い回収率をとなる条件も存在します。たとえば「期待勝率1位×過小評価馬×ダート」という条件では,単勝回収率は124%となります。皆さんの得意な条件と私の予想を組み合わせるとより高い回収率になるはずです。
ただ,私の予想はあくまでも過去のデータから得られた傾向に基づく予想であり,将来の予想の的中・回収率を保証するものではないという点にはお気を付けください。馬券の購入はあくまで自己責任でお願いいたします。
また,上記の分析からも分かるように,過小評価馬の回収率は高いいですが,的中率は比較的低くなる傾向があります。そのため,短期的には不的中が続く可能性があります。
私の予想を用いて馬券を買われて一時的に損してしまっても,長期的な観点でご検討いただけましたら幸いです。
最後までお読みいただきありがとうございました。
精度の高い予想や皆さんのお役に立てるような記事を作成できるよう努力しますので,スキ・フォロー・サポートなどいただけますととても嬉しいです。
とくに,「こういった分析をして欲しい」「このファクターが本当に勝率に影響しているか分析してほしい」などのご要望あればお気軽にコメントしてください。
今後ともよろしくお願いします。
【私が予想モデルを使って具体的にどのように馬券を買っているかについては下記の記事をご参照ください】
【私の予想がどのような形式で公開されるかについては下記の記事をご参考ください】