見出し画像

【AI競輪予想】高配当予報と超高配当予報についての詳細


実際の高配当割合と予報下での割合

こんにちは、kokurenです。
競輪のレースを機械学習ベースで予想しています。

具体的には、高配当と思われるレースに絞りこみ、穴を当てる手法です。

しかし、実際のところどれだけ高配当を絞りこめているのかが気になると思います。

そこで、過去一年分(2023年9月頭から2024年9月頭までの約27000レース)のデータをもとに、どれだけ高配当の事前確率を上げれているかを確認しましょう。

いきなりですが、レース全体に対する10万車券の割合は以下のようになっています。

three_car_singleが10万以上の数: 631
three_car_singleが10万未満の数: 27007

割合としては2.3%ほどです。ネットで「10万車券 確率」と調べると約2.8%と出てくるので、だいたい間違っていないでしょう。

しかし、競輪は主には7車立てのレース、たまに5-6など、大きめのレースでは最大9車立てとなっています。

当たり前ですが9車立ての方が買い目の組み合わせ数が多いため、高配当が出やすいと考えられます。実際9車立てのレースについて、過去一年では以下のようになっています。

three_car_singleが10万以上の数: 164
three_car_singleが10万未満の数: 2108

164割ることの(164+2108)で、10万車券割合は約7.2%です。

ここで、高配当予報を適用してみます。

three_car_singleが10万以上の数: 49
three_car_singleが10万未満の数: 520

49割ることの(49+520)で、10万車券割合は約8.6%です。

ここで、高配当予報とは別に超高配当予報単体を見てみましょう。

three_car_singleが10万以上の数: 27
three_car_singleが10万未満の数: 213

27割ることの(27+213)で、10万車券割合は約11.2%です。

最後に、高配当予報と超高配当予報が合致する場合を見てみましょう。

three_car_singleが10万以上の数: 17
three_car_singleが10万未満の数: 111

17割ることの(17+111)で、10万車券割合は約13.2%です。

実際の9車立てレースから、10万車券事前確率を6%ほど引き上げられていることがわかります。

実際の9車立てレースの10万車券割合が7%程度というのは、以下のサイトでも確認でき、間違いなさそうです。

高配当予報と超高配当予報って何?

具体的に高配当予報と超高配当予報って何をしているのという話です。

ぶっちゃけてしまうと、配当金を目的変数として機械学習モデルを構築しています。

具体的には配当金が10000円以上のレースを予測するモデルと、100000以上のレースを予測するモデルを独自に組んでいます。

配当金が10000円以上のレースは実際にどれぐらいあるかというと、以下のようになっています。

three_car_singleが1万以上の数: 7403
three_car_singleが1万未満の数: 20235

7403割ることの(7403+20235)で、約26.7%です。

ここに、高配当予報を適用します。

three_car_singleが1万以上の数: 356
three_car_singleが1万未満の数: 327

356割ることの(356+327)で、約52.1%です。
かなり厳しい閾値となっていますが、事前確率が半分を超えます。

次に、超高配当予報を単体で適用します。

three_car_singleが1万以上の数: 131
three_car_singleが1万未満の数: 109

131割ることの(131+109)で、約54.6%です。

最後に、両方を適用してみましょう。

three_car_singleが1万以上の数: 72
three_car_singleが1万未満の数: 56

72割ることの(72+56)で、約56.3%です。
前述のとおり、1万を超えた72個のうち、17個は10万車券です。

上記までで、激熱AI競輪予報がどれだけ効果的にレースを絞り込めているかがわかると思います。(10万超え車券の割合が13%!)

※追記
9車立てのレースに絞ると配当金が10000以上のものはそもそも46~47%ほどあるようです。上記の絞り込みではそもそも9車立て前提の場合、10000円以上かどうかについては+10%ほど上乗せしているようです。

予報値と閾値

少し迷ったのですが、これから高配当予報や超高配当予報を公開していく上で、信頼性のためにも実際の予報値と閾値についても公開してしまおうと思います。

例として、高配当予報は以下のようになっています。

date,place,race_num,predicted_probability,predicted_class
20230901,aomori,1,0.3411757044222137,0
20230901,aomori,2,0.4751988466940276,0
20230901,aomori,3,0.2970204007908828,0
20230901,aomori,4,0.45854451722850803,0
20230901,aomori,5,0.5007305893393081,0

今までの計算やシミュレーションは、すべて閾値は0.7としています。
(0.7以上で高配当予報ということです。)

超高配当予報は以下のようになっています。

date,place,race_num,predicted_probability,predicted_class
20230901,aomori,1,0.08560635378314552,0
20230901,aomori,2,0.15204318484449356,0
20230901,aomori,3,0.14282408723421144,0
20230901,aomori,4,0.14920612812238618,0
20230901,aomori,5,0.09329183120448038,0

超高配当予報の閾値は0.4としています。

モデルの訓練時には7車立てのレースも9車立てのレースもすべて含めているため、当たり前ですが7車立てレースの方が低く見積もられています。(そもそも、実際の平均は低いです。)

ここには若干のゆがみがあると思うので、この予報値についても予想の参考にしていただければと思います。

最後に

激熱AI競輪予報(具体的には高配当予報値が0.7を超え、超高配当予報値が0.4を超える場合)が出たときのみ、有償で買い目予想とともに公開しようと思います。

しかし、それ以外の普段の場合については、毎日の終わりごろに、noteで予報値を公開していくつもりであります。

これからもよろしくお願いいたします。

いいなと思ったら応援しよう!