見出し画像

【競馬AI開発#15】騎手と調教師の過去成績を特徴量に追加する

この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。

■今回やること
現バージョンの競馬AI(v3.0.3)では、netkeiba.comから取得した5年分のデータから以下のような107個の特徴量(=機械学習モデルにインプットする予測材料)を作成し、着順を予測しています。

horse_id                            ・・・ 馬ID
jockey_id                           ・・・ 騎手ID
trainer_id                          ・・・ 調教師ID
umaban                              ・・・ 馬番
wakuban                             ・・・ 枠番
tansho_odds                         ・・・ 単勝オッズ
popularity                          ・・・ 人気
impost                              ・・・ 斤量
sex                                 ・・・ 性別
age                                 ・・・ 年齢
weight                              ・・・ 体重
weight_diff                         ・・・ 体重差
race_type                           ・・・ レース種別(芝・ダート)
around                              ・・・ 周り(右回り・左回り)
course_len                          ・・・ コース長
weather                             ・・・ 天候
ground_state                        ・・・ 馬場状態
race_class                          ・・・ レース階級
place                               ・・・ 開催場所
rank_3races                         ・・・ その馬の過去3レースの平均順位
prize_3races                        ・・・ その馬の過去3レースの平均賞金
rank_5races                         ・・・ その馬の過去5レースの平均順位
prize_5races                        ・・・ その馬の過去5レースの平均賞金
rank_10races                        ・・・ その馬の過去10レースの平均順位
prize_10races                       ・・・ その馬の過去10レースの平均賞金
rank_1000races                      ・・・ その馬の過去1000レースの平均順位
prize_1000races                     ・・・ その馬の過去1000レースの平均賞金

...省略...

rank_diff_median_2races_relative    ・・・ その馬の過去2レースの着差中央値(レース内相対値に変換)

...省略...

今回はここに、騎手の過去成績調教師の過去成績を使った特徴量をさらに追加し、競馬予想AIの精度向上を目指していきます。

使用するソースコードは、下に進んでダウンロード・解凍すればそのまま使うことができるので、適宜手元で参照・実行しながらお読みください。


定期購読をすると、今月更新される記事に加えて#1〜#4の記事が980円で全て読めるので、単品購入より圧倒的にお得です。

ソースコードのダウンロード

ここから先は

46,985字 / 17画像 / 1ファイル
この記事のみ ¥ 1,000

この記事が気に入ったらチップで応援してみませんか?