見出し画像

単語のイメージ可視化

きっかけ

展望・目標

言葉の響きをパラメータ化できるか?

単語のイメージを可視化できるか?

このように抽象的な言葉のイメージを可視化するにはどうしよう?
と思ったときに、私が真っ先に思いついたのが 言葉をベクトル化して扱う W2Vでした。

Word2Vecを用いて単語に各要素の類似度を抽出する

学習済 W2Vのモデルを活用。
▽Chive
GitHub – WorksApplications/chiVe: Japanese word embedding with Sudachi and NWJC
サイズが軽い、v1.2 mc90 版を拝借。
W2Vの、特定のワードに対する類似度を出力する機能を活用してみる。

Wiktionary:日本語の基本語彙1000 から、直観的にイメージしやすそうな単語のピックアップなどをして約260単語を選別しました。
▽参考元
Wiktionary:日本語の基本語彙1000 – ウィクショナリー日本語版

それに対して類似度を測る要素として「ふわふわ」「カチカチ」などオノマトペや「温かい」「冷たい」など形容詞や色や感情などの要素を選別してみました。

↓単語と各要素の類似度をW2Vにて調査

このような感じで、『もちもち』→ ワッフル  『ぽかぽか』→ 天気 『ぴかぴか』→ 宝石 あたりは、まあなんかよさそうな気もします。
ただ、比較的上記はよく出ているように見えますが、中位・下位 はだいぶ微妙という感じがしました。
それと、『ぽかぽか』 → 冬 というように、『冬は寒いから暖をとってぽかぽかする』というように、
『寒いか熱いかどっちか』 というような感じじゃなくて、『寒いも熱いもどっちも』イメージされる事が考えられる。
なので 寒い←普通→熱い というように1つの項目として1軸で図化したいときに、足枷になりそう。

要素間の相関を見てみる

主成分分析をしてみる

2次元可視化

EXCELのグラフで2次元+各単語の色イメージで表現。
(EXCELで頑張れば、下記のように散布図に文字を色付きで入れられるんですね。)

3次元可視化

X(かたさ)・Y(あたたかさ)・Z(ポジティブ度)+単語の色イメージで、3次元可視化を行ってみる。
BlenderでPythonスクリプトを実行して3次元空間に描画する。


いいなと思ったら応援しよう!