見出し画像

【競馬AI開発#5】取得したレース結果テーブル・馬の過去成績テーブルを加工する

この【競馬AI開発】シリーズでは、競馬予想AIを作ることを通して、機械学習・データサイエンスの勉強になるコンテンツの発信や、筆者が行った実験の共有などを行っていきます。

■今回やること

今回は、netkeiba.comから取得した「レース結果テーブル」「馬の過去成績テーブル」を前処理して、機械学習モデルにインプットできる形に加工していきます。

レース結果テーブルのrawデータ
馬の過去成績テーブルのrawデータ

今回のコードを実行することで、上のrawデータが加工され、CSVで保存されるようになります。

import preprocessing


# レース結果テーブルの前処理
results_preprocessed = preprocessing.process_results()
# 馬の過去成績テーブルの前処理
horse_results_preprocessed = preprocessing.process_horse_results()
results_preprocessedの中身
horse_results_preprocessedの中身

【動画(概要編)】

今回やることの概要や、前半部分の解説をしています。

■動画中の実行環境

・OS: Mac OS 14.2.1
・言語: Python 3.11.4
・エディタ: VSCode 1.87.0

VSCodeやPythonのインストール方法については様々な記事で紹介されているので、適宜参照して設定してください。

また、以下のライブラリを使用しています。

beautifulsoup4==4.12.3
pandas==2.2.1
selenium==4.18.1
tqdm==4.66.1
webdriver_manager==4.0.1

■筆者のプロフィール

東京大学大学院卒業後、データサイエンティストとしてWEBマーケティング調査会社でWEB上の消費者行動ログ分析などを経験。
現在は、大手IT系事業会社で、転職サイトのレコメンドシステムの開発を行っています。


定期購読をすると、今月更新される記事に加えて#1〜#4の記事が980円で全て読めるので、単品購入より圧倒的にお得です。

動画中のソースコード

ここから先は

12,931字 / 12画像 / 1ファイル
この記事のみ ¥ 1,000

この記事が気に入ったらチップで応援してみませんか?