![見出し画像](https://assets.st-note.com/production/uploads/images/122024467/rectangle_large_type_2_56e6dd472869e5739ce5502edef6dd21.jpeg?width=1200)
データ全体の世界地図を作る~自己組織化マップ入門
これまでのコラムでは、「教師付き学習」の話を主にして参りました。
すなわち、外部からネットワークに対して望ましい出力(教師信号)を与えて、ネットワークに同じ出力を返すように学習させるもので、パーセプトロンやバックプロパゲーションが知られています。
一方、明示的な教師信号を用いない「教師なし学習」と呼ばれるものがあります。
代表的なものとして、自己組織化マップ(Self-Organizing Map, SOM)があります[1][2]。
SOMは、フィンランドのヘルシンキ大学コホーネン教授により1981年頃に発表されたニューラルネットワークで[3],大脳皮質(特に視覚野の自己組織化)をモデルにしたニューラルネットの一つです。
その特徴は、N次元のレコード群を、レコード間の類似度を保ちながら、低次元へ情報を集約することが出来る点です。
例えば、顧客情報データベースで定義されている顧客属性(年齢、性別、職業、家族構成、等々)がN項目あったとしましょう。
この場合、各属性(変数)をN次元空間のそれぞれ独立な軸に対応させた場合、各レコードはその空間の1点となります。また、レコード間の”類似度”とは、その2点間の”距離”に対応することが分かります。
企業のマーケティング担当者は、優良顧客を見分けるために、顧客属性の類似度でグルーピングしたいわけですが、難しいのは、それがN次元であるため、直感的に把握できないことによります。
そこで、SOMの適用によるデータの集約(低次元化。例えば2次元)により、データ間の類似性を直接"見る"ことができるようになります。SOMによる応用や適用時の注意点について、次回のコラムでもう一歩踏み込んでみたいと思います。
[1] ニューラルワークスPredictでは、トップメニュー画面の
「データのクラスタ性の発見と解析」
を選択し、ウィザードに従って構築します。
[2] Professional II/PLUSでは、InstaNetの「Self Organizing Map」を選択します。
[3] 参考文献としては、
Teuvo Kohonen 著,徳高 平蔵,大薮 又茂,堀尾 恵一,藤村 喜久郎,
大北 正昭監修:'自己組織化マップ',シュプリンガー・ジャパン,2005年6月。
※弊社では、データ分析プロジェクトにまつわる様々なご相談に、過去20年以上に渡るプロジェクト経験に基づき、ご支援しています。社内セミナーの企画等、お気軽にご相談いただければ幸いです。
製品カタログ