『Pythonデータ解析入門』 第8章 クラスタリング
本章ではクラスタリングの基礎について学びます.クラスタリングを用いると,たとえばマーケティングのための顧客のセグメント,商品推薦のための嗜好が類似するユーザの抽出,遺伝子発現パターンのグループ化などの応用例のように,データセットから類似した特徴を持つ事例をまとめてグループ分けを行うことができるようになります.
まず,クラスタリングの基本的な考え方について学んだ上で,具体的な手法として階層化クラスタリングについて学びます.次に,クラスタリングの別の手法としてK-means法によるクラスタリングについて学びます.また,発展的な内容として混合確率分布のモデルによりK-means法を解釈することを学びます.
プログラミング演習では,クラスタリング手法をプログラムとして実装した上で,実際のデータとして都道府県の気象に関するデータをもとにクラスタリングによって都道府県のグループを抽出します.
本章の学習を通して,クラスタリングの基本的な考え方および具体的な手法として階層化クラスタリングとK-means法について理解し,実データに対してそれらの手法を実際に適用することができるようになることを目標とします.
8.1 クラスタリング
8.2 階層化クラスタリング
8.3 K-means 法
8.4 【発展】確率分布モデルによる K-means 法の解釈
8.5 プログラミング