[プログラム・コード公開] コピペだけで実用的かつ実践的なGenerative Topographic Mapping(GTM)の自動的パラメータ最適化
[New] 実業家として有名な堀江貴文さん(ホリエモン)のメルマガ[Vol.359]における副業紹介において、このプログラム・コード販売が、なんと 1番 に紹介され評価していただきました!
こんにちは!大学教員ブロガーのねこしです。http://univprof.com/
仕事や研究において、Generative Topographic Mapping(GTM)によってデータセットを見える化・可視化をする方もいらっしゃいます。GTMによってデータセット内の非線形な関係をふまえて見える化・可視化することができます。GTMの実用的かつ実践的な方法はこちらに書きました。
http://univprof.com/archives/17-01-16-10824075.html
GTMの教科書はこちらをご覧ください。
しかし、GTMを実行するときは
■マップサイズ
■動径基底関数(Radial Basis Function, RBF)の数
■ガウス関数の分散の値
■EMアルゴリズムにおけるパラメータλの値
といった4つのパラメータを事前に決めなければなりません。試行錯誤して決めるやり方もありますが、何を基準に選べばよいかわかりませんよね。
そこで、近いサンプルの間の中点を使って4つのパラメータを自動的に最適化するプログラムを作りました。データを準備するだけで、R言語でGTMの4つのパラメータが最適化され、最適なパラメータにおけるGTMの可視化結果が得られます。
近いサンプルの間の中点をつかった見える化・可視化の性能の評価についてはこちらをご覧ください。
http://univprof.com/archives/16-06-27-4280228.html
データ形式・必要なソフトウェア
以下の記事に示す形式のデータ(data.csv)さえ準備すれば、R言語でGTMの自動的パラメータ最適化を実行することが可能です。
R言語のために必要なソフトウェアは以下の記事をご覧ください。
実行結果
実行結果を下に示します。最後に以下のcsvファイルが同じディレクトリ(フォルダ)に保存されます。
■PointsOnGTMmapMode.csv・・・各サンプルの最適化されたGTMマップ上での座標[mode](各サンプルに対応した)ニューロンのグリッド座標
■PointsOnGTMmapMean.csv・・・各サンプルの最適化されたGTMマップ上での座標[mean](各サンプルに対応した)ニューロンのグリッド座標
このプログラムからスタートしてさらにプログラミングを進めたいと考えている方にもぜひ利用していただければと思います。
プログラム公開
ここまでお読みいただきありがとうございます。
R言語のプログラムは有料コンテンツとします。ただこれにより、データセットを準備するだけでGTMの4つのパラメータを自動的に最適化し、最適なパラメータにおけるGTMの可視化結果を得ることができます。
こちらからプログラムのzipファイル自体はダウンロードできます。
http://univprofblog.html.xdomain.jp/code/gtmopt_analysis_all_e_r_pass.zip
購入していただくと解凍のためのパスワードがありますのでそちらをご利用ください。
またこちらのzipファイルに必要なスクリプトと関数があります。パスワードはかけていません。購入後に使い方の説明があります。
http://univprofblog.html.xdomain.jp/code/R_scripts_functions.zip
ここから先は
¥ 1,480
Amazonギフトカード5,000円分が当たる
この記事が気に入ったらチップで応援してみませんか?