scikit-learn機械学習㉙k-meansクラスタリング

2024年10月25日 21:09

前回までは、scikit-learnの「教師あり学習」モデルに焦点を当ててきましたが、今回は「教師なし学習」の世界に一歩踏み込みます。取り上げるのは、クラスタリングのアルゴリズムの中でも広く使われている k-means（k-平均法）です。

kーMeansは1967年に発表されたアルゴリズムですが、基本的なアイデア自体はさらに前から存在していました。

当時の機械学習の進歩は目覚ましく、例えば1958年にはパーセプトロンとロジスティック回帰、1963年には決定木（Decision Tree）や線形サポートベクトルマシン（Linear SVM）が登場しています。これらのモデルは第１次AIブームの中で生まれ、現在の古典的機械学習の基盤となっているものが多いです。

古い技術であるにもかかわらず、k-meansは今なおもデータのパターンやグループを見つけるためのツールとして役立っています。

ちなみに、k近傍法とk平均法は名前が似ていますが、全くの別物です。また、英語表記だと、k-NNとk-meansなので名前自体が全然違います。なお、k近傍法についてはこちらで解説しています。

今回は、k-meansの理論的な仕組みを解説します。

ここから先は

6,805字 / 6画像

¥1,000 / 月

初月無料

アルゴリズム、機械学習、深層学習、強化学習、量子技術をわかりやすく

この記事が気に入ったらチップで応援してみませんか？