
【機械学習+競輪予想】人気通りに買える安定したレース場はどこかを計算で割り出す
というわけで、予想印通りに着順が決まりやすいレース場を探します。
偏差値
全体で20177レース
これの着順の平均を出しておく。
###########全体平均
grouped_mean_all = df.groupby(["予"]).mean()
print(grouped_mean_all.head(20))
予 result
無印 5.874988
× 4.084528
▲ 4.939109
△ 4.565171
○ 3.750135
◎ 2.709216
注 5.524945
これで予想印のパワーが分かる。
無印はなかなか買えない。
◎の偏差値
◎だけの全体の着順平均を出す。
df_q = df.query("予=='◎'")
grouped_mean_all = df_q.mean()
print(grouped_mean_all.head(20))
result 2.709216
合っている。
レース場ごとの◎の着順平均を出す。
grouped_mean = df_q.groupby(["レース場","予"]).mean()
print(grouped_mean.head(20))
レース場 予
aomori ◎ 2.478618
beppu ◎ 2.540264
fukui ◎ 2.765586
gifu ◎ 2.701657
hakodate ◎ 2.697674
hiratsuka ◎ 2.791423
hiroshima ◎ 2.632517
hofu ◎ 2.703448
ito ◎ 2.828512
iwakitaira ◎ 2.713080
kawasaki ◎ 2.609589
keiokaku ◎ 2.644592
kishiwada ◎ 2.630170
kochi ◎ 2.605863
kokura ◎ 2.572477
komatsushima ◎ 2.960843
kurume ◎ 2.756646
maebashi ◎ 2.765683
matsudo ◎ 3.039557
matsusaka ◎ 2.607438
こんな感じ。
これが高いほど、一番人気が負けやすい。
ただこれだと、各レース場の母数が違うので、レース数が少ないところと多いところを、同じものとして評価してしまう。
1票の格差的なものとして、、、(違う?)
ここからは情報の取捨選択に自信がある方のみ、御覧ください。
どのレース場が人気通りになるのか計算で推測しています。
※計算間違いがある可能性も含みます。予めご了承ください。
「全体の◎予想の着順」の平均と標準偏差を出す
ここから先は
3,368字
¥ 111
いつもお読みいただき、ありがとうございます。 書くだけでなく読みたいので、コメント欄で記事名入れてもらうと見に行きます。