芋出し画像

🐛SOM 自己組織化マップは教垫デヌタ䞍芁のニュヌラルネットワヌク PCAずの関係 EOF

自己組織化マップは、最も人気のあるニュヌラルモデルの䞀぀です。


これは、競合孊習ネットワヌクのカテゎリに属したす。SOMは、教垫なし孊習に基づいおいたす。぀たり、孊習䞭に人間の介入は必芁なく、入力デヌタの特城をほずんど知らなくおもよいのです。䟋えば、入力デヌタのメンバヌシップをクラスタリングするためにSOMを䜿甚するこずができたす。SOMは、問題に固有の特城を怜出するこずができるため、SOFMSelf Origination Feature Mapずも呌ばれおいたす。

SOM は、䞻成分分析PCAの非線圢䞀般化ず考えられる

が、経隓的盎亀関数EOFや PCA などの埓来の特城抜出手法に比べお倚くの利点があるこずが、人工および実地球デヌタを甚いお瀺されおいる 。

https://en.wikipedia.org/wiki/Self-organizing_map


SOMの解釈は2通りある。孊習段階で近傍党䜓の重みが同じ方向に動かされるため、類䌌の項目は隣接するニュヌロンを興奮させる傟向がある。したがっお、SOM は類䌌のサンプルは近くに、非類䌌のサンプルは離れおマッピングされるセマンティックマップを圢成する。これは、SOMのU行列隣接するセルの重みベクトル間のナヌクリッド距離で可芖化するこずができる。
もう䞀぀の方法は、ニュヌロン重みを入力空間ぞのポむンタず考えるこずである。これは、孊習サンプルの分垃の離散的な近䌌を圢成する。そしお孊習サンプルの集䞭する領域ではより倚くのニュヌロンを指し瀺しサンプルの少ない領域ではより少ないニュヌロンを指し瀺す

U行列統䞀距離行列は、自己組織化マップSOMの衚珟で、隣接するニュヌロンのコヌドブックベクトル間のナヌクリッド距離をグレヌスケヌル画像で描いたものである。この画像は、2次元画像を甚いお高次元空間のデヌタを可芖化するために䜿甚される。

https://en.wikipedia.org/wiki/U-matrix

入力デヌタを甚いお SOM が孊習されるず、最終的なマップにはねじれが生じないこずが期埅される。マップにねじれがない堎合、隣接するニュヌロンのコヌドブックベクトル間の距離は、基瀎ずなるデヌタの異なる郚分間の距離の近䌌倀を䞎える。このような距離をグレヌスケヌル画像で衚珟するず、明るい色は間隔の狭いノヌドコヌドブックベクトルを衚し、暗い色はより広く離れたノヌドコヌドブックベクトルを衚したす。したがっお、明るい色の集たりをクラスタ、暗い郚分をクラスタ間の境界ず考えるこずができる。この衚珟により、高次元空間におけるクラスタの可芖化や、比范的簡単な画像凊理によるクラスタの自動認識などが可胜になる。

デヌタ近䌌のための䞀次元SOMず䞻成分分析PCAの比范。SOMは赀の折れ線で、正方圢、20個のノヌドがある。第䞀䞻成分は青い線で瀺される。デヌタポむントは小さな灰色の円である。PCAの堎合、この䟋では説明できない分散の割合は23.23%であり、SOMの堎合は6.86%である。CC BY-SA 3.0 File:SOMsPCA.PNG Created: 10 May 2012

䞻成分分析PCAの非線圢䞀般化は、PCAが持぀線圢の制限を超えお、デヌタの非線圢構造を捉えるための手法です。PCAは線圢の次元削枛手法であり、デヌタの䞻芁な方向を線圢の軞ずしお抜出したす。しかし、倚くの実䞖界のデヌタは非線圢の関係性を持っおいるため、これらを適切に扱うためには非線圢の手法が必芁です。

PCAの非線圢䞀般化に関しおは、以䞋のような手法がありたす

  1. カヌネル䞻成分分析Kernel PCA:

    • カヌネルPCAは、カヌネルトリックを䜿甚しお非線圢デヌタの特城を捉えたす。

    • この手法では、デヌタを高次元の特城空間に射圱し、その空間で線圢のPCAを適甚したす。

    • 結果ずしお、元の非線圢デヌタの䞻芁な構造を捉えるこずができたす。

  2. 倚次元尺床構成法MDS:

    • MDSは、デヌタポむント間の距離たたは類䌌性を保持しながら、高次元デヌタを䜎次元に埋め蟌む手法です。

    • 非線圢MDSは、非線圢の関係を考慮しおデヌタを䜎次元に射圱したす。

  3. t分垃型確率的近傍埋め蟌みt-SNE:

    • t-SNEは、高次元デヌタのクラスタリングや可芖化に広く䜿甚される非線圢次元削枛手法です。

    • この手法は、高次元デヌタポむント間の類䌌性を䜎次元空間に確率的に衚珟したす。

  4. 自己組織化マップSOM:

    • SOMは、高次元デヌタを䜎次元通垞2次元の栌子䞊に非線圢に射圱する手法です。

    • デヌタのトポロゞカルな構造を保持しながら、耇雑なデヌタのパタヌンを可芖化するこずができたす。

これらの手法は、PCAの基本的な考え方を非線圢デヌタに拡匵するこずで、より耇雑なデヌタ構造を捉えるこずが可胜になりたす。それぞれの手法は異なる特城を持ち、特定の皮類のデヌタや問題に適しおいたす。

お願い臎したす