scikit-learn機械学習㉙k-meansクラスタリング
前回までは、scikit-learnの「教師あり学習」モデルに焦点を当ててきましたが、今回は「教師なし学習」の世界に一歩踏み込みます。取り上げるのは、クラスタリングのアルゴリズムの中でも広く使われている k-means(k-平均法) です。
kーMeansは1967年に発表されたアルゴリズムですが、基本的なアイデア自体はさらに前から存在していました。
当時の機械学習の進歩は目覚ましく、例えば1958年にはパーセプトロンとロジスティック回帰、1963年には決定木(Decision Tree)や線形サポートベクトルマシン(Linear SVM)が登場しています。これらのモデルは第1次AIブームの中で生まれ、現在の古典的機械学習の基盤となっているものが多いです。
古い技術であるにもかかわらず、k-meansは今なおもデータのパターンやグループを見つけるためのツールとして役立っています。
今回は、k-meansの理論的な仕組みを解説します。
この記事が気に入ったらチップで応援してみませんか?