この絵の感想を述べよ→ローカルLLM vs ChatGPT-4o vs Claude3 Opus vs Gemini 1.5Advance

なすたろう

2024年5月22日 10:58

　以前 StableDiffusionで生成した絵を、マルチモーダル対応のLLMに食わせたところ、そこそこよい結果が得られました
　最新の商用AIではどうでしょうか
　質問は以下の通りです

Q. この絵をできる限り詳細に説明してください。また人がこの絵を見た時に受け取る感想も予想してみてください

結論から書きますと

Claude3 Opus : 文章の組み立てがうまいなぁ。元気や希望を与えとか解析してきたよ
ChatGPT-4o : ロジカルに説明してくる。でも十分ポイントはおさえている
Gemini 1.5Pro: ええ...Googleは日本を下に見ているのがまるわかり

画像はこちら

ローカル llava-v1.5-13b-f16 の感想(macOS LMStudio)

13bでここまでやってくれるのはすごいなぁ。WindowsもAI PCに行くようなので期待

　おお、この画像にはアニメをテーマにしたような女の子が写っています。
　彼女は青い髪をしており、目を閉じて微笑んでいます。おそらく彼女が変な顔をしているか、幸せを表現していることを示しています。
　このシーンには、彼女を取り囲むさまざまな形やサイズの星の小さな画像が多数含まれており、主人公に視覚的に興味深い背景を追加しています。
　お茶目なポーズと魅惑的な表情で注目を集めながら写真を撮っているようです

Claude3 Opus

　この絵は、青緑色の長い髪を持つアニメ調の女の子が中心に描かれています。彼女は制服のようなシャツを着ており、ハートマークのネクタイをしています。背景には夜空に浮かぶカラフルな惑星や星々が描かれ、ファンタジックな雰囲気を醸し出しています。
　女の子は両手でハートマークを作っており、そのハートマークからは星のようなキラキラとした光が放たれています。また、彼女の周りには半透明の青いリボンが舞っており、動きのあるダイナミックな構図となっています。
　全体的に、この絵からは明るく前向きなエネルギーが感じられます。女の子の笑顔と星空の組み合わせが、夢や希望、ロマンスといったポジティブなテーマを連想させるでしょう。また、ハートマークのモチーフが繰り返し使われていることから、愛や友情、絆といったメッセージも込められているように見えます。
　絵のスタイルはアニメ調で、色使いも明るく鮮やかです。これにより、若い世代の観る人を中心に親しみやすさや共感を呼ぶことができるでしょう。特に少女漫画やアニメが好きな人には強く訴求するイラストだと思います。
　また、ファンタジックな宇宙空間を背景に用いることで、現実離れした非日常的な世界観を演出しています。観る人の想像力を刺激し、自由な解釈や物語を紡ぎ出すきっかけになるかもしれません。
　総じて、この絵は視覚的なインパクトが強く、ポジティブで夢のあるメッセージ性を持った作品だと言えます。多くの人に元気や希望を与え、共感を呼ぶイラストではないでしょうか。

ChatGPT-4o

画面の説明も、感想項目も箇条書きではあるけど、十分よい回答です

この絵について詳細に説明します。
**画像の特徴**:
- **キャラクター**:
- 青いツインテールの髪型をした女の子が描かれています。
- 笑顔でウインクしており、手でハートの形を作っています。
- 青い目が輝いており、元気な表情をしています。
- キャラクターの服装は、青と白を基調としたサイバー風のデザインで、アームバンドやアクセサリーが特徴的です。

- **背景**:
- 背景は宇宙を思わせる夜空で、星や惑星が散りばめられています。
- 黄色やオレンジ色の惑星が浮かんでおり、いくつかはリングを持っています。
- 星や光がきらめく中、全体的に明るくポジティブな雰囲気を醸し出しています。

**人がこの絵を見た時の感想の予想**:
- **可愛さと元気さ**:
- キャラクターの表情やポーズがとても可愛らしく、見る人に元気を与えるでしょう。
- 鮮やかな色使いやディテールの細かさが視覚的に魅力的です。

- **未来感とサイバー感**:
- キャラクターの服装や背景のデザインから、近未来的でサイバーな雰囲気を感じ取ることができます。
- 宇宙の背景が夢幻的な印象を強調し、想像力をかきたてます。

- **ポジティブな気持ち**:
- 明るい色使いとキャラクターの笑顔が、見る人をポジティブな気持ちにさせるでしょう。
- 楽しげな雰囲気が伝わり、心が軽くなるような感覚を受けるかもしれません。

このような詳細な説明で、絵の魅力や人々の反応を予測することができます。いかがでしょうか？

Gemini Advance (Gemini1.5Pro)

塩回答ww

人物の画像についてはまだ対応していません。ご理解いただけますようお願いいたします。

ちなみに英語で質問すると返してきます。
Describe this picture in as much detail as possible. Also try to predict what people will think when they see this picture.

　説明はChatGPT-4oやOpusより詳しいですね。高性能です。
　文章はまぁAIだけど必要にして十分な感じ。
　Gemini は英語で質問して、もう片方のウインドウで和訳する使い方のほうがいいかも。(めんどくせぇ)

　ターコイズブルーの鮮やかなツインテールが長く流れ、若い少女が描かれています。
　右目でウィンクし、明るく元気な表情を見せています。
　大きく青い瞳は、生き生きとした輝きを放っています。
胸の前で手でハートの形を作り、中央には光るハートのシンボルがあります。
　衣装は未来的なデザインでカラフル、ライトブルーと白を基調とし、ピンクと黄色のディテールがアクセントになっています。
　袖なしのトップスには、ボタン、ストラップ、デジタルパターンなど、ハイテクでSF的な要素が取り入れられています。
　袖は本体から独立しており、サイバーパンクな雰囲気を醸し出し、ピンクのストライプとデジタルシンボルが施されています。
　腰回りには、青、ピンク、白の色合いのカラフルなスカートがあり、彼女の鮮やかな外見を引き立てています。

背景:
　深い青色で星が散りばめられた宇宙空間が描かれています。
　さまざまな大きさや色の惑星や天体が浮かんでおり、主に黄色やオレンジの色合いです。
　土星のように、いくつかの惑星には輪があります。
　明るい星や輝く粒子が空全体に散らばり、魔法のような別世界的な雰囲気を強めています。
　いくつかの抽象的で光るシンボルや線が存在し、背景に未来的でデジタルなタッチを加えています。

予想される反応:
アートスタイルへの称賛:
　鮮やかな色彩と複雑なディテールを用いた高品質で詳細なアートスタイルは、見る人の注目と称賛を集めるでしょう。

ポジティブな感情:
　キャラクターの明るい表情と生き生きとしたポーズは、見る人にポジティブな感情を呼び起こすでしょう。彼女の笑顔とハートのシンボルは、人々を幸せで元気にすることができます。

未来的で幻想的な雰囲気:
　キャラクターの衣装や宇宙の背景にある未来的要素は、見る人にファンタジーやSFのテーマへの不思議さと魅力を感じさせるでしょう。

可愛くて元気:
　遊び心のあるポーズと明るい色使いは、彼女の可愛らしさをより一層引き立てます。多くの人が、このキャラクターを非常に可愛くて元気だと感じるでしょう。アニメやデジタルアートのファンに共感を得るはずです。
アニメファンのノスタルジア:
　アニメや関連ジャンルのファンは、日本のアニメーションでよく見られるキャラクターのスタイルやテーマを認識し、ノスタルジアや繋がりを感じるかもしれません。
　全体的に、この画像は見る人に強く、ポジティブな印象を残す可能性が高く、鮮やかな色彩、明るいキャラクター、そして詳細で幻想的な背景で人々を引きつけるでしょう。