見出し画像

イラストで学ぶ人工知能概論を再度勉強する 第11章 クラスタリングと教師なし学習

はじめに

とある理由で
「二重文節構造」のアイデアに触れた時から大ファンになった
谷口忠大先生の名著「イラストで学ぶ人工知能概論」を
じっくり勉強しなおしたくなって
改訂第2版を購入しなおした。

本noteは、その備忘録

ホイールダック2号、宝箱やゴールを見分ける

第11章 クラスタリングと教師なし学習

講義スライドと谷口忠大先生本人の講義動画が
谷口忠大先生から提供されています

講義スライド

11.1 クラスタリングとは何か?

クラスタリング:データの集まりを、類似度に従っていくつかのグループに分類する、
クラスタリング結果は「特徴空間」の設計によって変わる

11.2 k-means法

k個の代表点を初期化し、代表点に近いデータ点の情報を使ってデータ点の座標を更新していく手法

11.3 混合分布モデルによるアプローチ

混合分布モデル:確率的生成モデル
生成モデルを仮定し、そこに潜在変数zを置き、zを観測xごとにベイズ推定することで、クラスタリングを行う

11.4 表現学習

表現学習:ある観測データをいくつかの潜在的な特徴表現に分類して
表現するアプローチ
高次元のデータをできるだけデータ欠損を起こさずに低次元のベクトル表現にする場合によく使用される

本章の最重要ポイント

・確率的生成モデル(ベイズの理論)を用いてクラスタリングを行う「混合分布モデル」を学習した
・観測データを複数要素のベクトルで表現する「表現学習」とその応用例を学習した

おわりに

2012年の「Googleの猫」(深層ニューラルネットワークを用いて、大量の画像から教師なし学習で分類された画像が、誰が見ても「猫」の画像にしか見えなかった を想起させる章だった。



いいなと思ったら応援しよう!

YANO Tomoaki@
本noteは私の備忘録ですが、自由に読んでください サポートは、興味を持ったnote投稿の購読に使用させていただきます