【AI競輪予想】機械学習で最適なレース選択と車券購入【回収率120%超】
AIによる競輪予想
こんにちは。kokurenと申します。
この度、機械学習ベースでの競輪予想の公開を始めていこうと思ったため、その旨について書き記そうと思います。
最近の競輪サイト(例:ウィンチケットなど)では、すでに公式のAI予想が公開されており、それらを参考にする方も多いと思います。
しかし、当然ですがその通りに買い続けたとしても、回収率が100を上回ることはありません。
ウィンチケットではその時点での的中率や回収率が公開されていますが、回収率はほぼ60-80であり、予想の参考にはなるし、短期的に儲かる可能性はありますが、長期的に稼ぐことは不可能と考えられます。
そこで、もういっそ自身で予想AIやシステムを開発してしまおうと思い立ち、試行錯誤の末、妥当な賭け方が見つかったので、シミュレーション結果の公開、および今後の予想公開についての説明をしようと思います。
3年分のシミュレーション結果
まず、学習データは2014-2023の9年分のレースデータです。
検証に用いたのは2023-2024の最近のデータ約30000レースほどに、2012-2014の約60000レースを加えた3年分87000レースのデータになります。
※学習データとシミュレーションデータを混ぜるわけにはいかないため、このようなデータ比率となりましたが、過去一年の結果でも回収率120%ほどです。
結論から申し上げますと、87000レースのうち、実際に購入したのは325レースだけです。その購入シミュレーション結果が以下になります。
縦軸が純利益、横軸がレース数でのプロットです。
初期資金0円計算なので、はじめだけマイナスに振れますが、長期的にみると3年間で2000000万円のプラスになっています。なお、これは1つの買い目に対して100円ずつ賭けている場合の計算です。
回収率: 122.15%
総コスト: 8692100円, 総配当金: 10617700.0円
ウィンチケットであればポイントの還元率が3~4%になるはずなので、実質的にはより回収率が上がるはずです。
回収率120%超えのワケ
こちらも結論から申し上げます。超高配当、穴を狙いに行ってます。
そんなの普通は無理だと思うでしょうが、機械学習ベースでレースを絞りに絞り込むことで、超高配当となる確率を上げることができました。
こちらも実際のデータを交えて説明します。
net_profitとは純利益のことです。
net_profitの平均値: 5924.923076923077
net_profitの中央値: -17240.0
net_profitの最大値: 923920.0
net_profitが10万を超える数: 18
net_profitが5万から10万の範囲の数: 19
net_profitが3万から5万の範囲の数: 15
net_profitが1万から3万の範囲の数: 16
net_profitが5千から1万の範囲の数: 5
net_profitが1千から5千の範囲の数: 6
net_profitが0を超える数: 82
net_profitがマイナスの数: 243
配当金が10万を超える数: 27
総レース数: 325
当たったレース数: 231
実際にかけたレースが87000レース中325レースであり、そのうち当たったレースが231レース、当たったレースのうち10万車券がでたレースが27レースもあります。
少しややこしいですが、当たったレースのうち、約10%以上で10万以上の配当金を得られています。
そもそも、競輪全体のレースのうち10万以上の配当が出るレースの割合は2~3%と言われているので、これは優位に高い値です。
前述のとおり、過去一年分だけでシミュレーションした場合も同じような結果でしたので、ある程度再現性は担保されていると思われます。
一方で、net_profitの中央値はマイナスで、実際賭けたレースの2/3程度はマイナスの結果となっています。実際のヒストグラムで見てみましょう。
この手法では、100円賭けであっても100~300通りほどの組み合わせに賭けることになります。
そのため、ほとんどはマイナスですが、前提として機械学習ベースで高配当が出ると考えられるレースに絞り込んでいるため、当てたときの上がり幅が大きいです。
詳しい購入シミュレーションの結果(購入金額"cost"と純利益"net_profit"など)は以下のcsvファイルを見てもらえればと思います。
購入する車券の組み合わせも、機械学習ベースで、ある範囲の車券を購入しています。
予想の公開について
前述のとおり、高配当と考えられるレースを絞りに絞り込むことで、この回収率は成り立っています。
具体的には、絞り込むために二つのモデル、仮に高配当予想モデル、超高配当予想モデルとします。この二つのモデルによる予想が一致したレースだけ購入するようにしています。
これが片方だけだとダメなのですが、ある程度の信頼度はあるため、両モデルの予想が一致しなかった場合でも、「高配当予報」、「超高配当予報」として、X(@wangoroge333)で公開し、1日の終わりに実際の配当はどうだったのかをnoteにまとめようと思います。
問題は、両モデルの予報が一致した場合です。つまり、今回のシミュレーションと同じ条件のレースのときです。
この場合は、有料noteとして1000円前後で「激熱AI競輪予報」として、予想買い目とともに公開する予定です。なお、その日が終わったら、その結果がどうだったのかも無料で見れる形でnoteで公開する予定です。
みなさんお楽しみに。
Q&A
Q. 自分で秘密にしちゃえばいいのにどうして予想を公開するの?
A. このストラテジーでは、最低でも一度に10000~30000円程度の賭け金が発生し、かつ長期的な目線で勝つ戦略です。単純に軍資金を用意できるだけの資金力が学生の身分である今の私にはないので、予想を有償公開しようと思いたった次第です。
Q. 「高配当予報」や「激熱AI競輪予報」はどこで見れる?
A. 高配当予報と超高配当予報が重複しなかった場合は、X(@wangoroge333)の方で無償公開をし、マガジン「競輪高配当予報」に結果をまとめようと思います。「激熱AI競輪予報」については、有償記事として公開をいたします。
Q. 予想通りに買ったのに外れた/損したんだけど!
A. 実際の購入は自己責任でお願いいたします。前後の通り、中央値はマイナスなので、「激熱AI競輪予報」通りに1回だけ買ったとしても短期的には負ける確率が高いです。長期的なストラテジーであることや、確実性が担保されたものではないことをご了承ください。
以下に3年間分のデータでシミュレーションした際の純利益のボックスプロット(箱ひげ図)を提示します。ほとんどがマイナスである代わりに、とんでもない利益の値が無視できない数混ざっているのが確認できると思います。