見出し画像

回収率100%超えデータ集|JRA-VAN最強の組み合わせは?

「回収率100%超えデータ集」の要点

  1. 天気が「雪」の開催時は通常の予想が機能しないことから回収率が100%を超える

  2. 300m以上の距離短縮は、その馬の本来の適性距離に合致する可能性があり、回収率100%に迫る

  3. ランダムフォレストによる探索によると、「斤量体重比<=11.2% & 馬体重<=489kg」のファクターの組み合わせが回収率107.1%となった

  4. 老調教師の過信は禁物、、、


■分析データ概要

  • 2020年から2024年の5年間

  • 障害戦および取消・除外馬は除く

  • オッズ50倍を超える馬は除く(傾向を安定させるため)

回収率100%超えデータ

唯一シングルファクターで回収率が100%を超えたのは天気が雪のとき。
サンプルは少ないが、一定の合理性があると思えるなら狙ってみるのも手。

①シングルファクター:天気

天気が「小雪」「雪」の条件で回収率が100%を超える。

馬場状態の変化:雪が降ると馬場状態が大きく変わり、通常とは異なる条件下でのレースとなる。ダート馬場では、凍結防止剤の散布により馬場の性質が変化する。芝馬場でも、雪や雨の影響で馬場が重くなる。

パワー型の馬が有利に:雪や凍結防止剤の影響で、特にダート馬場ではパワーのある馬、体重の重い馬の好走率が上がる。

脚質の変化:冬季のダート競馬では、馬場状態の変化により有利な脚質の傾向が変わる。特に12月、1月は差し・追い込み馬が有利。

予想の難しさ:馬場状態の変化が大きいため、過去のデータの信頼性が著しく下がる。馬の適性や調子が通常とは異なる形で現れることが多い。

安定的な高回収率データ

シングルファクターのみで回収率100%を超えるものは少ないため、条件次第で使えそうな「距離変化」を提示する。

②シングルファクター:距離変化

300m以上の距離短縮で安定的に高い回収率を示しており、400mでは単勝回収率が98.1%。

距離短縮のメリット:走る距離が短くなることでスタミナの影響が少なくなるため馬にとっては前走よりも楽に感じる。

心理的効果:距離短縮は馬に対して心理的な効果をもたらす。前走よりもゴールが近いと感じることで馬がより積極的に走る。

適性の発見:特に400m以上の大幅な距離短縮の場合、馬の適性を探っている可能性が高い。前走で大敗した馬が距離短縮によって能力を発揮し、予想外の好走をすることも。

オッズへの影響:大幅に距離短縮をする馬は、前走の成績が悪いことが多く、オッズが本来の能力よりも過小評価る。

馬の成長段階との関係:デビューから数戦の間に行われる距離短縮は、馬の適性を見出す過程と考えられる。よって馬の能力が開花するきっかけとなる可能性が高い。

データによる裏付け:500m以上距離短縮する馬で、デビューからキャリア7戦までの馬に限定すると、単勝回収率が93%まで上昇する。さらに、前走の馬体重が460kg以上の馬に絞ると、単勝回収率が114%になるというデータがある。

③シングルファクター優先順位

ファクターの優先順位を提示する。ひとつのファクターで回収率100%超えは難しいが、まずはその説明力の強さを頭に入れておこう。

クリックして拡大

【ファクター対応表】

回収率100%超えデータ(ファクターの組み合わせ)

ランダムフォレストを用いて回収率100%を超えるファクターの組み合わせを探索する。

④回収率100%超えのファクターの組み合わせ

組み合わせ(回収率107.1%)斤量体重比<=11.2% & 馬体重<=489kg

馬体重と斤量の関係:馬体重に対する騎手の斤量比率の低さは、馬の負担が軽い。特に11.2%以下はかなり軽い部類に入る。

軽量馬の特性:馬体重が489kg以下の馬は、比較的軽量な馬と考えられ、俊敏性が高く加速力に優れる。

有利な条件の組み合わせ:上記の二つの条件が組み合わさることで、以下のような利点が生まれる。

  1. 軽量馬の特性を最大限に活かせる

  2. 斤量の負担が少ないため、馬本来の能力を発揮しやすい

  3. レース後半まで力を温存できる可能性が高い

オッズへの影響:この条件に合致する馬は、必ずしも人気馬とは限らない。たとえば見習い騎手が騎乗したり、500kgを超える大型馬(大型馬の方が有利と考えている競馬ファンは多い)が多数出走すると相対的にオッズ高くなる。この2つのファクターで横の比較をすると効果が高いだろう。

おまけ回収率データ集

ファクターの基本傾向を把握しておいて損はないので、興味を引きそうなデータを厳選して提供。ただし、ファクターは合理的な組み合わせによって優位性を導くものなので、傾向を過信しないよう。

⑤取引価格

市場での取引価格は的中率からも競走馬の強さを表現するが、その強さは織り込み済み。

⑥調教師年齢

若い調教師の方が勝っている傾向があり、わずかながら回収率も高い。
年配の調教師は最新のトレーニング技術についていけていないのか、はたまた野村監督のように弱い馬を再生させる担当になるのか?

⑦馬場状態

これは想定通り不良馬場でレースが荒れて回収率が上がる。
ただし、重馬場までは傾向は変わらずなので過信しないよう。

⑧年齢限定

2歳馬は強さが定まっていないせいか、意外な馬が飛び込んできて回収率が高まるのだろう。
ただ、それだけ難易度も高いとも言える。(分析すべきデータも少ない)

⑨馬齢

7歳を超えると目に見えて回収率が下がる。
力の衰えに加え、古いファンが過剰に賭けるためか。

「回収率100%超えデータ」の豆知識

知っておくと便利かつ競馬仲間と話すネタとしても面白い「回収率100%超えデータ」に関する豆知識をご紹介。

ディープラーニングさえあれば競馬で回収率100%を超えられる?

ディープラーニングを使って競馬の回収率100%を超えることは可能だが、簡単でない。

ディープラーニングの可能性

  • ある研究では、ディープラーニングを用いて複勝馬券で回収率200%以上を達成したという報告がある。

  • この研究では、2010〜2017年のデータで学習し、2018〜2019年のデータで検証を行った。

押さえるべきポイント

  1. データの選択

    • 3着指数とオッズの関係性に着目

    • 中間的なオッズ(55〜60倍程度)の馬に絞る

  2. 予測精度の向上

    • 3着指数が60以上の馬に絞る

  3. 長期的な検証

    • 2年間(約22ヶ月)のデータで検証

  • 2年間のシミュレーションで以下の結果を得た

    • 購入数: 99 / 的中数: 19

    • 的中率: 19.2% / 回収率: 202.63%

注意点

  • この方法は特定の条件下での結果であり、すべてのレースや状況で同様の結果が得られるとは限らない。

  • ディープラーニングモデルの構築や適切なデータの選択には専門知識が必要。

JRA-VANのデータマイニングの回収率は?

JRA-VANのデータマイニングを単純に利用しただけでは、高い回収率を得ることは難しい。

  • データマイニングで最も優れている馬(マイニング1位)の単勝を5年分全レース購入した場合:回収率は約79%

  • 重賞レースのみに絞った場合:回収率は約86%

これらの数字は、JRAの払戻率(単勝の場合80%)とほぼ同等か、わずかに上回る程度。

データマイニングの結果に、いくつかの条件を追加することで回収率を改善できる可能性あり。

  • マイニング1位の馬で、1〜10番人気・単勝オッズ5倍以上という条件を追加した場合:
    回収率は約104%

この方法で回収率が100%を超えているが、著者は「この程度では安定して利益を出すことはできません」と述べている。

JRA-VANのデータマイニングだけでは、安定した高い回収率を得ることは困難であると考えられる。データマイニングの結果は、馬券購入の際の一つの指標として利用できるが、それだけで勝ち続けることは難しいだろう。

この記事が気に入ったらサポートをしてみませんか?