ConvolutionレイヤーのKernelShapeとOutMapsをアレコレ設定するとどうなるの?

2025年1月4日 19:38

Convolutionレイヤーのパラメータと予測精度、等の関係を確認します

今回は、Convolutionレイヤーの代表的なパラメータであるKernelShapeとOutMapsをアレコレ設定したらどうなるのかを確認します。

ただし、KernelShapeの設定は、1次元に限定します。

つまり、1D CNNです。

今回の確認において、Convolutionレイヤーの各パラメータ設定値は、以下の通りです。

KernelShapeとOutMaps以外は、上記のパラメータで固定します。

今回の確認で使用するAIモデルの構成は、下記の通りです。

Inputレイヤーに代入される説明変数は、30日分の日経平均株価(始値、高値、安値、終値)およびVIX指数(始値、高値、安値、終値)です。

また、目的変数は、翌営業日の日経平均株価のローソク足が陽線か陰線かを表す0(陰線) or 1(陽線)のデータです。

先ずは、KernelShapeと予測精度、学習曲線および混同行列の関係について確認したいと思います。

下記は、OutMapsを1に固定し、KernelShapeを10～80とした場合の予測精度、学習曲線および混同行列です。

予測精度(ACC)は、KernelShapeの設定によらず、50.0%前後で一定となりました。

VALIDATION ERRORの最小値
- KernelShape = 10 → 0.691771
- KernelShape = 20 → 0.691339
- KernelShape = 40 → 0.691638
- KernelShape = 80 → 0.692925

VALIDATION ERRORの最小値には、大きな差分は見られませんでした。

しかし、学習曲線は、KernelShapeの設定値による特徴が確認できました。

KernelShapeが10および20の場合は、VALIDATION ERRORが0.700辺りでほぼ一定となっています。

しかし、KernelShapeが40および80の場合は、始めこそVALIDATION ERRORが一定を保ちますが、途中から右肩上がり、つまり、過学習が進むことが確認できました。

混同行列もKernelShapeの設定値による特徴が確認できました。

KernelShapeが10および20の場合は、AIモデルの予測値はy'=0(翌営業日のローソク足が陰線と予測)に偏っています。

しかし、KernelShapeが40および80の場合は、AIモデルの予測がy'=0および1にバラつくことが確認できました。

特に、KernelShapeが80の場合は、y'=0および1に対する分布のバランスが良くなっています。

以上の結果から、1D CNNに対するKernelShapeの設定値は、ある程度大きい数値が望ましいことが確認できました。

続いて、OutMapsと予測精度、学習曲線および混同行列の関係について確認したいと思います。

下記は、KernelShapeを10に固定し、OutMapsを1～8とした場合の予測精度、学習曲線および混同行列です。

予測精度(ACC)は、OutMapsを増やすと低下することが確認できました。

VALIDATION ERRORの最小値
- OutMaps = 1 → 0.691971
- OutMaps = 2 → 0.691385
- OutMaps = 4 → 0.693197
- OutMaps = 8 → 0.694121

VALIDATION ERRORの最小値には、大きな差分は見られませんでした。

また、学習曲線より、OutMapsが2以上で過学習が進むことが確認できました。

VALIDATION ERRORの曲線に着目すると、OutMapsの設定値によって挙動が変化しています。

そして、VALIDATION ERRORは、あるレベルまで上昇した後、頭打ちとなることが分かりました。

OutMapsが2以上では、AIモデルの予測がy'=0および1にバラつくことが確認できました。

AIモデルの予測のバラつきの観点から、OutMapsの設定値は2以上が望ましいと考えます。

しかし、予測精度の観点では、OutMapsを増やすことで予測精度が低下してしまうため、悩ましいところです。