マガジンのカバー画像

教師なし学習(scikit-learn)

3
運営しているクリエイター

記事一覧

PCA【Principal Component Analysis】

〇PCAとは?

→相関のある多数の変数から相関のない小数で全体のばらつきを最もよく表す主成分と呼ばれる変数を合成する多変量解析手法の1つ

 -教師なし学習の1つ
 -データの特徴が判断しやすくなる。

〇次元圧縮を行う流れ
 1.データの重心を求める。
 2.重心からデータの分散が最大となる方向を見つける。
 3.2で求めた方向を新たな基底とする。
 4.3で作成した基底と直行する方向に対して

もっとみる

K-means法

〇K-means法とは?
 →異なる性質が混在している集団から、互いに似た性質をもつものを集め、クラスターを作る手法。

〇クラスタリングの流れ
 1.ランダムにクラスタリングしたい数の点をプロット
 2.割り振ったデータをもとに各クラスタのクラスを推定
 3.推定したクラスごとの重心を算出する
 4.1~2をリピート

〇K-means法をPythonで使う方法
 <手順①>ライブラリのインポー

もっとみる

t-SNEとは?

データの可視化のため、低次元空間へ埋め込みに適切な非線形次元削減手法の1つ。

 - 教師なし学習の1つ
 - SNEという次元削減アルゴリズムを改良した手法

〇t=SNEの使い方 <手順①>ライブラリのインポート
   from sklearn.manifold import TSNE

 <手順②>インスタンス作成
   tsne = TSNE( )

 <手順③>次元削減
   tsne.

もっとみる