なぜGoogle Imagen3がバズった?「不気味の谷」現象から考察
絵を描くのが下手すぎて、小学生の時に先生に『Key君は絵じゃなくて文章を書く方が向いているよ』と言われたKey君です。 みなさん、最近話題のGoogleのImagen 3って知っていますか?イラスト生成AIの注目株として、Xやニュース記事でたくさん紹介されています。でも、ちょっと待ってください。イラスト生成AIってたくさんあるのに、なぜImagen 3だけがこんなにバズっているんでしょうか?
この記事(チャンネル)では、ツールの使い方だけでなく、それがなぜ話題になったかの心理面も含めて考察していきたいと思います!
イラスト生成AIがたくさんあるのに、なぜImagen 3だけがバズった?
ひと言で言うと、「日本文化」に対する理解度が高いです。
日本人の特徴を捉えている
Imagen 3は日本人の顔立ち、髪型、体型などを正確に再現し、日本人らしさを表現できているんです。他のイラスト生成AIだと、「これ、中国人?韓国人?」ってなることが多かったんですよね。でも、Imagen 3は違う。「あ、これ日本人だ」ってわかるんです。
地域特有の風景の再現
富士山や京都の寺社仏閣など、日本を代表する風景を高い精度で生成できるんです。しかも、都市部から田舎まで、日本人から見ると「エモく」感じるノスタルジックな画像も生成可能。これ、めちゃくちゃすごくないですか?
日本語テキストのより正確な描画
看板や標識などに日本語を自然に組み込むことがたまにできるんです。漢字、ひらがな、カタカナを正しく表示する可能性があります。ただしガチャゲーです。
不気味の谷現象から考察
ここで、ちょっと難しい話になりますが、「不気味の谷現象」というのを知っていますか?
不気味の谷現象は、人間に似せた造形物が人間らしくなるにつれて好感度が上がるんですが、ある一点で急激に不気味さや嫌悪感を感じさせる現象を指すんです。1970年に日本のロボット工学者、森政弘さんが提唱したのです。
従来のイラストAIは、アニメイラストはまだ良いものの、実写になるとどうしてもこの不気味の谷現象に引っかかってしまうんです。でも、Imagen 3がバズった理由は、この「不気味の谷現象をほぼ乗り越えたのではないか」というのが、自分の仮説です。
写実精度が高い Imagen 3の高品質な画像生成能力は、人間の目にも自然に見える画像を作り出せるようになったんです。これって、不気味の谷を超えて、人間が違和感なく受け入れられるレベルに達した可能性があるんですよ。少なくても私がぱっと見てAIだと気付かなかったです。
文化的影響 不気味の谷現象の感じ方には個人差や文化的影響があるんです。Imagen 3の文化多様性を考慮した幅広い学習データのおかげで、様々な文化圏でのユーザーの受容性を高める可能性があります。特に日本文化をよく理解できるAIだと、この文化性による不気味さを大幅に軽減できるんです。
検閲が厳しい Googleは検閲が厳しいことで知られています。彼らが不適切なコンテンツ生成を防ぐことで、ユーザーに不快感を与える可能性を低減しているではないかと思われます。これは間接的に不気味の谷を回避することにつながる可能性があります。
実際にImagen 3を使ってみるとわかるんですが、「生成してくれない」という時が多いんです。これって、Googleがうまいこと不快になりそうなコンテンツをブロックし、良いもののみ出力するガードレールがよくできているからかもしれないんですよね。
終わりに
イラストに限らず、テキストや動画生成のAIが「不気味の谷現象」を乗り越えた日から、真の意味で人間社会に溶け込めるのではないかと思います。
みなさんはどう思いますか?AIが人間社会に溶け込むことに期待していますか?それとも不安を感じますか?コメント欄で教えてください!
#Google
#生成AI
#AIとやってみた
#Claude
#ChatGPT
#Gemini
#プロンプト
#プロンプトエンジニアリング
#AI創作
#AIライティング
#Imagen3
#イラストAI
#不気味の谷現象