二値分類の過学習対策 AIを使って日経平均株価の予測に挑戦 一目均衡表の遅行スパン問題検討編
一目均衡表の遅行スパンに関する取扱いについて
前回の記事にて、一目均衡表の遅行スパンの影響により、日経平均株価の予測を行うことができない問題点が明らかになりました。
詳細は、下記の記事を参照ください。
今回は、一目均衡表の遅行スパンをどう扱えば良いのかについて検討していきたいと思います。
とりあえず、私が思いついたのが下記の2通りです。
一目均衡表の遅行スパンに対する取扱い案
学習データおよび評価データから全ての遅行スパンを削除する
遅行スパンのデータが欠落している箇所に対して最後の終値をコピーする
上記の2案でAIモデルの学習および評価を行ってみて、その結果から判断したいと思います。
ちなみに、今回の検証で使用するAIモデルは、前回の検証で予測精度(Accuracy)が高かった4層Affine構造を使用します。
また、学習データおよび評価データに含ませる要素については、下記の全てとします。
学習データおよび評価データに含ませる要素
ローソク足データ
SMA
ボリンジャーバンド
MACD
一目均衡表(遅行スパンなし or 遅行スパンの欠落データ補完)
RSI
ストキャスティクス
案1: 学習データおよび評価データから全ての遅行スパンを削除する
学習データおよび評価データから全ての遅行スパンを削除して、AIモデルの学習および評価を行った結果を以下に示します。
先ずは、学習曲線です。
続いて、混同行列です。
前回の記事で行ったAIモデルの評価ではAccuracyが61.2%でした。
それと比べると、今回はAccuracyが53.2%なので、結果が悪化していることが確認できます。
案2: 遅行スパンのデータが欠落している箇所に対して最後の終値をコピーする
遅行スパンのデータが欠落している箇所に対して最後の終値をコピーして、AIモデルの学習および評価を行った結果を以下に示します。
先ずは、学習曲線です。
続いて、混同行列です。
遅行スパンのデータが欠落している箇所に対して最後の終値をコピーした場合、Accuracyが60.4%となりました。
結論
以上の結果より、私は、一目均衡表の遅行スパンに関する取扱いについて、遅行スパンのデータが欠落している箇所に対して最後の終値をコピーする方法が妥当だと考えます。
また、今回の結論に基づいて、前回作成したPythonプログラムを修正しました。
Pythonプログラムの詳細については、下記の記事を参照ください。