【競馬AI開発#15】騎手と調教師の過去成績を特徴量に追加する
この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。
■今回やること
現バージョンの競馬AI(v3.0.3)では、netkeiba.comから取得した5年分のデータから以下のような107個の特徴量(=機械学習モデルにインプットする予測材料)を作成し、着順を予測しています。
horse_id ・・・ 馬ID
jockey_id ・・・ 騎手ID
trainer_id ・・・ 調教師ID
umaban ・・・ 馬番
wakuban ・・・ 枠番
tansho_odds ・・・ 単勝オッズ
popularity ・・・ 人気
impost ・・・ 斤量
sex ・・・ 性別
age ・・・ 年齢
weight ・・・ 体重
weight_diff ・・・ 体重差
race_type ・・・ レース種別(芝・ダート)
around ・・・ 周り(右回り・左回り)
course_len ・・・ コース長
weather ・・・ 天候
ground_state ・・・ 馬場状態
race_class ・・・ レース階級
place ・・・ 開催場所
rank_3races ・・・ その馬の過去3レースの平均順位
prize_3races ・・・ その馬の過去3レースの平均賞金
rank_5races ・・・ その馬の過去5レースの平均順位
prize_5races ・・・ その馬の過去5レースの平均賞金
rank_10races ・・・ その馬の過去10レースの平均順位
prize_10races ・・・ その馬の過去10レースの平均賞金
rank_1000races ・・・ その馬の過去1000レースの平均順位
prize_1000races ・・・ その馬の過去1000レースの平均賞金
...省略...
rank_diff_median_2races_relative ・・・ その馬の過去2レースの着差中央値(レース内相対値に変換)
...省略...
今回はここに、騎手の過去成績と調教師の過去成績を使った特徴量をさらに追加し、競馬予想AIの精度向上を目指していきます。
使用するソースコードは、下に進んでダウンロード・解凍すればそのまま使うことができるので、適宜手元で参照・実行しながらお読みください。
定期購読をすると、今月更新される記事に加えて#1〜#4の記事が980円で全て読めるので、単品購入より圧倒的にお得です。
ソースコードのダウンロード
この記事が気に入ったらチップで応援してみませんか?