見出し画像

競馬botterになるための第一歩~JRDBからデータを収集して機械学習できるようにする方法と特典

※本noteは予告なしに価格変更、販売終了を行うことがあります点をご了承ください。

2021/1/16コードとテーブル定義書の配布に伴い44,800円から値上げしました

競馬bot作成において心が折られる最初の関門-データ理解と収集、整形

以前ツイートでこのようにつぶやきました。

自分的に競馬bot作る時に超えるべき壁はめちゃくちゃあってざっくり言うと
気付き、行動、データ把握、データ取得、データ分析、モデル構築(ベット戦略等含む)、テスト、自動投票
JRDBのデータを理解して自動取得して、機械学習モデルにぶち込める状態にするまでってのは敵を作りづらい割に価値が高い

上記ツイートの通りJRDBのデータを機械学習モデルに読み込ませる状態にするまでの内容です。

年に一度くらいはフォロワーの皆さまに何か提供出来たらなーと思っていて、丁度良さそうなのがこの競馬bot作成の手助けnoteでした。

去年はビットコインの機械学習を用いた高頻度取引botの作り方を販売しました。
今読んでもめちゃくちゃいい内容で、自画自賛してます。
このnote買ってキチンと努力した人で回収できなかった人いるの?ってレベルだと思ってます。

会社辞めて専業になった人がいるのも観測してます。笑

めちゃくちゃ時間をかけて、素晴らしい内容になったのにたった49,800円で販売してるの本当にバグですね。笑
レバ規制が強くなっていて、ボラも小さかったので「よし、別の事業を始めよう!」って卒業を決めなかったら絶対販売してませんでした。
最近めちゃくちゃボラが大きいので再参入を考えてますが、そうなった場合は販売中止させてください。

…脱線しましたが、今回販売するnoteの内容は現在も運用中の競馬botに関するものなので利益相反にならないか最後まで販売を悩みました。利益相反になる場合は胸を張って販売できる内容にできないからです。

考えた結果「JRDBデータ取得&整形のコードと定義書とおまけ」なら利益相反にならないと結論がでたのでこうして無事販売に至りました。

今回は世の中にほとんど情報がない内容を販売します。

そもそも競馬予測botの情報自体がめちゃくちゃ少ないです。
あったとしてもQiitaなどの技術系サイトで「ディープラーニングを使って競馬予測をしたら回収率が100%を超えました」とか言ってる記事ばっかりです。

そして、そのような情報のほとんどはプログラムのミスによる幻の利益や1Rのみの情報です。はっきり言って参考にならない記事ばかりです。

競馬予測botを作成するなら当然使うであろうJRDBのデータについての話はほとんど出てこず、無料サイトからとれる情報のみで予測してます。

本noteでは競馬予測bot作成における最初の関門JRDBデータの整形に主眼を置きました。
今まで数多くの人が本格的に競馬予測botを作ろうとし、JRDBデータを機械学習できる形に持っていくことができず屍になってきたのかわからないです。
それくらい面倒くさい部分です。

そもそもJRDBデータって何か?

JRDBが提供するIDM、パドック情報、基準オッズなどの情報データのことです。他のサイトでは公開していないような独自データを豊富に提供しており、本格的に競馬予測システムを開発するなら必須と言っても過言ではないです。※詳細な仕様は以下のリンクを参照

データの詳細な仕様

価格も月額1,980~2,480円で契約できます。このJRDBのデータは馬券裁判で有名な卍氏も使っていたと著書に書かれていました。

※株式会社AlphaImpact様も使用していると記載していましたが、それは誤りで使用していません
私の確認不足によりご迷惑をお掛けした皆様、大変申し訳ございませんでした。

なんでJRDBデータの整形が難しいのか

JRDBのデータはURLを直接クリックしてlzh形式に圧縮された固定長テキストデータをダウンロードして取得します。
この固定長テキストファイルを読み込んで、自分の望むように項目を分割するというのが面倒くさいです。
厳密に言うと、項目を分割するためにデータを整理してテーブル定義書を作るのが面倒くさいです。

データの詳細な仕様から分かるように、JRDBのデータは超豊富です。
その豊富さが面倒くさい原因になっています。ですが、整形プログラムは一回作っちゃえばOKですし、この面倒くさいデータだからこそ競馬予測システムにおいて非常に役立ちます。

このnoteに含まれる内容

このnoteの有料部分には以下の内容が含まれます。

・競馬予測bot作成において最初に躓くであろうJRDBデータの収集における情報
・JRDBデータを機械学習できる状態に整形するためのコード
・JRDBデータを整形するために必要なテーブル定義書(どのファイルにどの内容が含まれているか整理したエクセルファイル)
・私が競馬予測botを作成するにあたって有益だった情報ソース(書籍、Webサイトなど)

ほとんどの人はデータを整形するために必要なテーブル定義書作成の途方もなさに心が折れています。イメージ図↓

画像1

これが2284行あります。これを作る労力がなくなるというだけで購入価格以上の価値があります。

このテーブル定義書に加えて、データを収集するためのpythonプログラム、データを整形・結合して機械学習できる状態にするためのコードもついています。
業者に委託してコードを書いてもらうことを考えたら、コードだけでも十分元が取れます。

これだけでも十分価値がありますが、更に!
私自身が競馬予測bot作成するにあたって有益だった情報ソース(書籍、Webサイトなど)も特典として付けます。

この有益だった情報ソースは大きく以下の3つに分類されます。

・競馬独自の特徴量作成のための情報
・機械学習全体の特徴量作成のための情報
・統計的な知見を得るための情報

競馬独自の特徴量作成のための情報

競馬予測bot作成に当たって、13冊ほど競馬関連の書籍を購入しました。
13冊の中で役に立ったのは3冊だけです。
この役に立った3冊と、役に立たなかった10冊についてお伝えします。

それに加えて、Web上の情報から役に立った日本語のサイトを2サイト紹介します。

機械学習全体の知識のための情報

私自身CS分野の大学院を卒業しており、社会人になってからも機械学習を用いた高頻度取引botを作成していましたが、その時に役に立った書籍を4冊紹介します。

統計的な知見を得るための情報

結局数学や統計的な知識はあったほうが良いです。
特に統計を学ぶためにおすすめの本が2冊あるのでそれを紹介します。

【注意事項・免責事項】

・pythonプログラムを実行するための環境構築やサポートは本noteの対象外です。
・本noteやプログラムコードにより被る損失や被害について、筆者は一切の責任を負うことはできません。ご承知おきください。
・本noteは購入するだけで利益が生まれることを保証する類の商品ではありません。
・JRDBデータの収集には別途JRDBへの有料会員登録が必要です。
・プログラムによりデータを取得する際は利用規約を守り、サーバに負荷がかからないようにご注意ください。

本格的に競馬予測botを作成して回収率を高めたいと考えている人だけが購入してください

本noteでは本格的に競馬予測botを作ろうとしたときに最初に躓くJRDBデータを収集し、整形・結合し機械学習可能な状態にするコード、テーブル定義書、競馬予測botを作成するために有益だった情報ソースが含まれています。

ただ、競馬予測botを作りたいと考えている人以外には無価値なnoteです。買う価値はありません。
しかし競馬予測botを作って回収率を高めたいと考えている人には、クソ面倒くさい部分をスキップできる内容です。

テーブル定義書単体でも5万円以上の価値はありますし、収集・整形・結合するコード単体でも5万円以上の価値があります。
そのくらい労力がかかりますし、外注しようにも面倒くさい部分だと思います。

販売価格について

自分が競馬予測bot作成を始めた当時にこのnoteに出せる金額を考えました(価値ベース)。

・コードはかけるけど本質的じゃない部分に時間と労力をかけたくなかった
・テーブル定義書に至っては量と面倒くささに絶望してた
・競馬本にはいいことが書いてあるんだろうなという期待を裏切る結果ばかり(金も時間も無駄にした)

これらの事情を鑑みると129,800万円くらいなら出したかな、と思います。外注するときの費用ベースで考えてもコードとテーブル定義書だけで上記金額はかかりそう。

だからと言って、noteを分割して高額で販売してるとお年玉企画の意味ないし圧倒的に価値が釣り合ってない2020年の機械学習noteも49,800円だったので49,800円で販売します。

※まだコードや上記定義書の整理ができていないので先行購入価格として44,800円で販売します。→コードと定義書が整理できてアップロード次第49,800円に値上げします。
2021/1/15日にはコードと定義書を整理してアップロードできるようにします。

これ以下にすることはないです。
元々、競馬予測botっていう超ニッチな分野の超ニッチな需要を満たしに行ってるのでただでさえ出ない利益がさらに低くなってしまいますし。

お年玉企画とは言ってるけど、やっぱり自分にもお年玉くらいの利益は欲しいじゃないですか?笑

有料部分は情報ソースのみで、残りのコードとテーブル定義書はZipファイルとして添付しておきます。

【見てくれた人へのお礼】2021年1月中に限り29,800円する聖杯noteが無料特典ついてくるマガジン作成しました。

このnoteを購入するのではなく、以下のマガジンを購入してください。

ここから先は

2,142字 / 2画像 / 1ファイル

¥ 49,800

この記事が気に入ったらサポートをしてみませんか?