ラビットチャレンジ_機械学習4
・主成分分析(PCA)
・教師なし学習の1つで、次元削減を行う際に使用する。
・分散が最大になるように次元削減をする
⇒分散が最大 = データの情報が一番残っている
・目的関数に制約条件(ノルムが1になるものs以下考えない)を付加した
ラグランジュ関数を微分して分散が最大になる点を見つける
・寄与率:第k主成分の分散の全分散に対する割合
・累積寄与率:第1-k主成分まで八淑した際の情報損失量の割合
演習:乳がん検査データを利用しロジスティック回帰モデルを作成
主成分を利用し2次元空間上に次元圧縮
課題:32次元のデータを2次元上に次元圧縮した際に、
うまく判別できるか確認する
説明変数30個でロジスティック回帰モデルを用いて分類した結果
⇒97.2%で分類できている
2次元に圧縮した結果
⇒分類できている
メリット:分類できていることを図で確認できるため説明に説得力がでる
この記事が気に入ったらサポートをしてみませんか?