ファイナンス機械学習:特徴量の重要度 練習問題 PCA変換後のMDI ,MDA,SFI
スニペット8.7で人工データセットを作成し、PCAで直交化した特徴量で重要度を測定する。
スニペット8.9のtestFuncを変更し、PCA=Trueでデータセットの特徴量を変換し、重要度測定関数getFeatImportancesに渡すように変更する。PCA変換で、有益特徴量、冗長特徴量、ノイズ特徴量の情報は書き換えられ、固有値の大きさで順番付けられている。



理論的に、特徴量の固有値の大きさは、その特徴量の持つ説明力の量を表している。MDI ,MDA,SFIのどの方法でも、固有値の大きいORT_0,ORT_1,ORT_2を重要度が高いと判断している。