【競馬AI開発#5】取得したレース結果テーブル・馬の過去成績テーブルを加工する
この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。
■今回やること
今回は、netkeiba.comから取得した「レース結果テーブル」と「馬の過去成績テーブル」を前処理して、機械学習モデルにインプットできる形に加工していきます。
今回のコードを実行することで、上のrawデータが加工され、CSVで保存されるようになります。
import preprocessing
# レース結果テーブルの前処理
results_preprocessed = preprocessing.process_results()
# 馬の過去成績テーブルの前処理
horse_results_preprocessed = preprocessing.process_horse_results()
【動画(概要編)】
今回やることの概要や、前半部分の解説をしています。
■動画中の実行環境
・OS: Mac OS 14.2.1
・言語: Python 3.11.4
・エディタ: VSCode 1.87.0
VSCodeやPythonのインストール方法については様々な記事で紹介されているので、適宜参照して設定してください。
また、以下のライブラリを使用しています。
beautifulsoup4==4.12.3
pandas==2.2.1
selenium==4.18.1
tqdm==4.66.1
webdriver_manager==4.0.1
■筆者のプロフィール
東京大学大学院卒業後、データサイエンティストとしてWEBマーケティング調査会社でWEB上の消費者行動ログ分析などを経験。
現在は、大手IT系事業会社で、転職サイトのレコメンドシステムの開発を行っています。
定期購読をすると、今月更新される記事に加えて#1〜#4の記事が980円で全て読めるので、単品購入より圧倒的にお得です。
動画中のソースコード
この記事が気に入ったらチップで応援してみませんか?