【馬券データ分析】傾向の見極め
こんにちは。キラリです。
今回は「傾向の見極め」というテーマについて、個人的に文章化しておきたかった内容をまとめさせていただきました。
それは傾向と呼べるのか
私は競馬予想を行うときにいろいろなデータを分析して、回収率などの「傾向」を見つける作業をずっとやってきたのですが
そのような作業のなかで、かなり誤解しやすいというか、
「パッと見た感じは "傾向がある" と感じるのですが、よく見るとなにも傾向がなかった」というケースが結構あると考えています。
今回は、そういった「誤解しやすいケース」と私が「これは傾向があるなと感じるケース」を具体例で紹介してみたいと思います。
傾向を誤解しやすいケース
芝スタートのダートは外枠有利か
私は過去の記事で「芝スタートのダートは外枠有利か」という記事を書かせていただいたことがあるのですが、
例えば、直近5年分の中央競馬のデータを「芝スタートのダートコース」に絞って
馬番:1~5 → 内枠
馬番:6~10 → 中枠
馬番:11~16 → 外枠
というように「内枠/中枠/外枠」を定義して回収率を集計すると以下のようになります。
上の表を、確立収束の早い複勝回収率(赤枠)で見ていきますと、内枠が最も回収率が低く、外枠が最も回収率が高いため、一見すると外枠の回収率が高いように見えます。
しかしこれを、より細かく馬番ごとに集計すると以下のようになります。
上の表を見ますと、赤枠の1番、2番は確かに他と比べて回収率が一段低くなっていると感じますが、青枠の3番と16番を比較すると同程度の値になっています。
そして、4~15番の数字を見ると、おおむね65%~71%の値がならんでいるため
私は上記のような結果を見ますと、「外枠の回収率が高い傾向にある」とはあまり感じられません。(有利か不利かでいうと有利だと思いますが、優位性がすでにオッズに反映されてしまっていると思います。)
4~15番の中には、間にポツポツと6番、10番、15番のように回収率が高まっている箇所がありますが、これは偶然その番号に先行しやすい馬などが集中していて上振れしているだけではないかと思います。(緑枠)
このような形で、実際は3~16番の回収率はほとんど変わらないのですが、データを大枠で見てしまうと「外枠の回収率が高い傾向にある」ように解釈しやすいのではないかと思います。
いろんなデータを見ていく過程で、同じようなことが発生している可能性があるため注意が必要だと考えています。
毛色
次の例も過去記事のネタで恐縮ですが、直近10年間の毛色ごとの回収率を集計すると以下のようになります。
上の表を見ると、青枠の「青毛(あおげ)」の馬が単勝回収率でも複勝回収率でも最下位となっており、赤枠の「栃栗毛(とちくりげ)」の回収率が単勝回収率でも複勝回収率でも1位となっています。
上の結果を見ると、単勝回収率と複勝回収率の傾向に一貫性があり、他の毛色との回収率の差もかなりあるため、
機械的に判断してしまうと「青毛の馬は弱く、栃栗毛の馬は強い傾向にある」と解釈しやすいのではないかと思います。
しかし実際は、青毛の馬が弱い理由も、栃栗毛の馬が強い理由も思いつかないですし、年別の回収率で見ると年によってかなりバラツキがあるため、上記のような傾向は無いかなと思っています。
ただし難しいのは、私の知識や確認が不足しているだけで、本当は傾向が存在するのかもしれません。
上記の表から傾向を見つけるかたもいらっしゃるかと思います。
言いたいこととしては、やはり「データを見てどう感じるか、という人間の主観」を抜きにして、機械的に傾向を見極めるというのは非常に難しく、なおかつ主観というのは人によって異なるため「絶対的な正解」というものは存在しないケースもあると思っています。
傾向を認識しやすいケース
馬齢
馬齢ごとに、直近10年間の回収率を集計すると以下のようになります。
上の結果を見ますと、多少数字にデコボコがあったとしても、馬齢による回収率というのは赤枠の4~5歳をピークとして、6歳以上になると高齢になるほど回収率が低下する傾向にあるのかなと感じます。(青枠)
このように、多少数字のデコボコがあったとしても、「俯瞰して見たときに、なだらかに数字が変化しているか」が一つのポイントになってくると思います。
なお、馬齢についての詳細なデータは以下の記事にまとめていますので、よければそちらもご覧ください。
*******************
【馬券データ分析】馬齢
*******************
ダートの牝馬
次に、直近10年間のデータから牝馬限定戦を除いて、芝/ダートに分けて性別ごとの回収率を集計した結果が下の表になります。
上の結果を見ますと、比較対象は少なくても、赤枠のダートでの牝馬の回収率は極端に低いですし
赤字で記載した「複勝回収率の差」を見ていただくと、「芝では牡馬/セン馬と牝馬の回収率は拮抗していて、ダートでは牡馬/セン馬に比べて牝馬の回収率が低い」という傾向が感じられます。
これはやはり、「ダートはパワーが必要で、芝は軽い」「牝馬よりも牡馬/セン馬の方がパワーがある」ということをなんとなく認識しているために傾向を感じるのだと思います。
なお、ダートの牝馬についての詳細なデータは以下の記事にまとめていますので、よければそちらもご覧ください。
*******************
【馬券データ分析】芝/ダート×性別
*******************
結論
結論をまとめますと
傾向を見極めるためには、「データを俯瞰して見たときに、なだらかに数字が変化しているか」が一つのポイントになります。
ただし、必ずしもそのようなデータを扱えるわけではなく、データを見たときにどのように感じるかは人それぞれで、なおかつ「傾向」という曖昧なものを人間の主観抜きにして機械的に判断するのは難しいため、自分なりの判断が必要になるケースも存在すると考えています。
私は、できるだけ主観を排除して、客観的なものを頼りにしたかったのでデータ分析を始めたのですが、結局のところ主観を完全に排除することはできないという😅
煮え切らない結論で恐縮ですが、書きたかったこととしては以上となります。
読んでいただいた方ありがとうございます。
******************
記事の全体図はこちら
******************