アセットマネージャーのためのファイナンス機械学習:特徴量の重要度分析 クラスターMDI、クラスターMDA
前記事で作成したデータセットの特徴量をクラスタにまとめてから、MDIとMDAを適用する。
import ONC as onc
corr0,clstrs,silh=onc.clusterKMeansBase(X.corr(),maxNumClusters=10,n_init=10)
sns.heatmap(corr0,cmap='viridis')
ここでは、特徴量の相関行列で、ONCではなく、KMean法を使ったクラスタリングを使用した。
クラスタリングの結果は以下のようになった。
雑音がクラスタ2にまとめられている。
このクラスタにクラスタMDIを適用した。
同様にクラスタMDAを適用した。
クラスタ3がMDIとMDAの両方で最も重要と判断されている。ノイズの入ったクラスタ2が共に重要度が低いとも判断されている。