見出し画像

scikit-learn機械学習㉙k-meansクラスタリング

前回までは、scikit-learnの「教師あり学習」モデルに焦点を当ててきましたが、今回は「教師なし学習」の世界に一歩踏み込みます。取り上げるのは、クラスタリングのアルゴリズムの中でも広く使われている k-means(k-平均法) です。

kーMeansは1967年に発表されたアルゴリズムですが、基本的なアイデア自体はさらに前から存在していました。

当時の機械学習の進歩は目覚ましく、例えば1958年にはパーセプトロンロジスティック回帰、1963年には決定木(Decision Tree)や線形サポートベクトルマシン(Linear SVM)が登場しています。これらのモデルは第1次AIブームの中で生まれ、現在の古典的機械学習の基盤となっているものが多いです。

古い技術であるにもかかわらず、k-meansは今なおもデータのパターンやグループを見つけるためのツールとして役立っています。

ちなみに、k近傍法とk平均法は名前が似ていますが、全くの別物です。また、英語表記だと、k-NNとk-meansなので名前自体が全然違います。なお、k近傍法についてはこちらで解説しています。

今回は、k-meansの理論的な仕組みを解説します。


ここから先は

6,805字 / 6画像

キカベン・読み放題

¥1,000 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらチップで応援してみませんか?