見出し画像

四季報データのスクレイピングがムズイことを逆手に取る


本日の結果と実践累積損益

コメント

株のファクターモデルを構築する上で四季報データは結構有用。

四季報のコンセンサスが市場のコンセンサスになっている銘柄などもあるので、織り込み具合などが説明力が高かったりする。

ただ、四季報オンラインはスクレイピング対策を施しており、一般的なPythonのライブラリなどではデータを抜けないようにしてある。

昔であればCD-ROMからごっそり抜く方法があったのだが、今はCD-ROMが売られていないのでその手順は使えない。

四季報オンラインは一度に表示できるデータが限られていたり、画面のコピペもできなかったりとかなり徹底している。
(アタック並みにスクレイピングされていたのだろう、、、)

画面をキャプチャしてChatGPTに画像認識させてみたが、表形式のデータなのに認識ミスが多く使い物にならなかった。

データ抽出が困難ということは、逆に考えれば四季報ファクターの説明力がまだ生きている可能性があるので、根性がある方は銘柄やファクターを絞ったうえで手で入力するのもありだと思う。

システムのパフォーマンス

参加を検討される方は上記参照のこと

翌営業日の売買判定

ここから先は

144字 / 2画像

¥ 300