単語のイメージ可視化
きっかけ
展望・目標
言葉の響きをパラメータ化できるか?
単語のイメージを可視化できるか?
このように抽象的な言葉のイメージを可視化するにはどうしよう?
と思ったときに、私が真っ先に思いついたのが 言葉をベクトル化して扱う W2Vでした。
Word2Vecを用いて単語に各要素の類似度を抽出する
学習済 W2Vのモデルを活用。
▽Chive
GitHub – WorksApplications/chiVe: Japanese word embedding with Sudachi and NWJC
サイズが軽い、v1.2 mc90 版を拝借。
W2Vの、特定のワードに対する類似度を出力する機能を活用してみる。
Wiktionary:日本語の基本語彙1000 から、直観的にイメージしやすそうな単語のピックアップなどをして約260単語を選別しました。
▽参考元
Wiktionary:日本語の基本語彙1000 – ウィクショナリー日本語版
それに対して類似度を測る要素として「ふわふわ」「カチカチ」などオノマトペや「温かい」「冷たい」など形容詞や色や感情などの要素を選別してみました。
↓単語と各要素の類似度をW2Vにて調査
このような感じで、『もちもち』→ ワッフル 『ぽかぽか』→ 天気 『ぴかぴか』→ 宝石 あたりは、まあなんかよさそうな気もします。
ただ、比較的上記はよく出ているように見えますが、中位・下位 はだいぶ微妙という感じがしました。
それと、『ぽかぽか』 → 冬 というように、『冬は寒いから暖をとってぽかぽかする』というように、
『寒いか熱いかどっちか』 というような感じじゃなくて、『寒いも熱いもどっちも』イメージされる事が考えられる。
なので 寒い←普通→熱い というように1つの項目として1軸で図化したいときに、足枷になりそう。
要素間の相関を見てみる
主成分分析をしてみる
2次元可視化
EXCELのグラフで2次元+各単語の色イメージで表現。
(EXCELで頑張れば、下記のように散布図に文字を色付きで入れられるんですね。)
3次元可視化
X(かたさ)・Y(あたたかさ)・Z(ポジティブ度)+単語の色イメージで、3次元可視化を行ってみる。
BlenderでPythonスクリプトを実行して3次元空間に描画する。