指数についての説明
僕は競馬と同じくらい野球が好きです。横浜ベイスターズのファンを20年来やってます。僕にとってこの2つは非常に近しいものです。
データを収集し加工することで新しいデータを作成できること。そのデータを用いて結果の予測ができること。そして、正解がないこと。どれをとっても魅力的でいくらでも考えていられます。
サイバーメトリクスが日本でも浸透し始めて久しくなりますが、その中で最も有名なものはOPSでしょう。出塁率と長打率の合計ですが評価の違う確率と確率を足し合わせるという実によくわからない計算ですがこれが実によくできている。
そんな感じのものを作りたくて色々やった結果が今回載せていこうと思っているものです。今まで使用していた指数のパターンをから確率を計算しそれらを足しました。
X軸に指数をとりました。4つの確率の合計なので理論的な最大値は4になりますが2015~2020年のデータでは3.39が最大なので3.4まで。青が右軸で複勝率、灰色が左軸で指数の個数になります。確率はほぼ指数と相関がみられるように見えます。左にいくにつれバラつきが多くなりますがこれは絶対値に少なさによる揺らぎだと思われます。続いて人気毎のグラフになります。
1番人気
2番人気
3番人気
4番人気
5番人気
6番人気
7番人気
8番人気
9番人気
10番人気
11番人気
12番人気
13番人気
14番人気
15番人気
16番人気
17番人気
18番人気
オレンジ色の線は各人気の平均複勝率になります。当然ですが下の人気になればなるほど安定しなくなりますが概ね各人気毎にみても指数との相関があるとみても良いかと思います。
これらを各レース毎に載せていこうと思ってます。どうすればわかりやすいものができるかを探りながらやっていこうと思うのでご要望などあれば是非ともコメントをください。
この記事が気に入ったらサポートをしてみませんか?