真面目に統計で競馬を考える「闘計馬」の状況報告(2022/06/27)
Targetから予想に使えそうな全項目の10年分のCSV落としました。
94MBです。
今回のデータをデータベースにするときに助かるのが
血統登録番号、騎手コード、調教師コード、レースIDの項目があるので
これらにインデックス貼ると
検索・集計が早くなりそうなことですね。
騎手ごとに騎手が出場したレースの出走頭数を集計するのに
日時・場所・レースでグルーピングして件数カウントするのは
時間的に明らかに無理がありそうだったので、これは助かりますね。
DBに登録するのが大変ですが、こういうデータを登録する手間も
「なんか俺統計してる!」って気がして
プログラム書くのと違う感覚で楽しいです。
ちょっと話変わりますが仮想通貨の自動取引プログラムを
一時AIでやろうとして、あの時は統計っぽかったですが
AIはやめて計算式でやろうとしてました。
まあ今はデータ通信量大杉問題で頓挫してます。
通信環境が整うまで「闘計馬」頑張りますよ!