イラストで学ぶ人工知能概論を再度勉強する　第11章　クラスタリングと教師なし学習

2025年2月13日 05:40

はじめに

とある理由で
「二重文節構造」のアイデアに触れた時から大ファンになった
谷口忠大先生の名著「イラストで学ぶ人工知能概論」を
じっくり勉強しなおしたくなって
改訂第2版を購入しなおした。

本noteは、その備忘録

講義スライドと谷口忠大先生本人の講義動画が
谷口忠大先生から提供されています

クラスタリング：データの集まりを、類似度に従っていくつかのグループに分類する、
クラスタリング結果は「特徴空間」の設計によって変わる

ｋ個の代表点を初期化し、代表点に近いデータ点の情報を使ってデータ点の座標を更新していく手法

混合分布モデル：確率的生成モデル
生成モデルを仮定し、そこに潜在変数ｚを置き、ｚを観測ｘごとにベイズ推定することで、クラスタリングを行う

表現学習：ある観測データをいくつかの潜在的な特徴表現に分類して
表現するアプローチ
高次元のデータをできるだけデータ欠損を起こさずに低次元のベクトル表現にする場合によく使用される

・確率的生成モデル（ベイズの理論）を用いてクラスタリングを行う「混合分布モデル」を学習した
・観測データを複数要素のベクトルで表現する「表現学習」とその応用例を学習した

2012年の「Googleの猫」（深層ニューラルネットワークを用いて、大量の画像から教師なし学習で分類された画像が、誰が見ても「猫」の画像にしか見えなかった　を想起させる章だった。

本noteは私の備忘録ですが、自由に読んでくださいサポートは、興味を持ったnote投稿の購読に使用させていただきます