見出し画像

GPT-4-TurboとGemini 1.5 ProとClaude3 Opusのマルチモーダル機能を使ってみた。

KingJoeBot(LINE Chat Bot)で複数のAIを実験中です。今回、Claude3のAPIを組み込めたので、三大AI(私の勝手な評価)でマルチモーダル機能を試してみた。

読み込ませた画像がこちら。照明が微妙なので肉眼でもちょっと見づらいなと思えるようなソースに対して、
「この写真について、解説を簡潔にお願いします。」
と同じプロンプトを入力してみた。

認識対象の画像

GPT-4-Turboの回答

この写真は、青色のパッケージに白い模様が描かれた「TEREA for IQOS ILUMA」と書かれた製品の箱です。IQOS ILUMAは加熱式タバコのデバイスで、TEREAはそのための専用スティックです。箱の下部には日本語で警告文が記載されており、「加熱式たばこの葉(茎)は、副流の煙の発生が完全ではありません。健康被害の可能性が否定できないため、使用中は周囲に注意してください」と書かれています。これは、製品が完全に無害ではないことを使用者に警告しているものです。

gpt-4-turbo

Gemini 1.5 Proの回答

## 写真の解説

この写真は、加熱式タバコ「IQOS ILUMA」用のタバコスティック「TEREA」のパッケージです。

パッケージには以下のような注意書きが記載されています。

* **加熱式たばこの煙(蒸気)は、周りの人の健康への悪影響が否定できません。**
* **健康増進法で禁じられている場所では喫煙できません。**

つまり、加熱式タバコであっても周囲への健康被害のリスクがあり、喫煙が禁止されている場所では使用できないことを警告しています。

gemini-1.5-pro-latest

Claude 3 Opusの回答

この写真は、IQOS ILUMAという加熱式たばこ製品のパッケージを撮影したものです。

パッケージには「TEREA for IQOS ILUMA」と書かれており、ブランド名と製品名が明記されています。

また、パッケージの説明文には「加熱式たばこの煙(蒸気)は、周りの人の健康への悪影響が否定できません。健康増進法で禁じられている場所では喫煙できません。」と書かれており、加熱式たばこの使用上の注意点が示されています。

パッケージのデザインは青を基調としたシンプルなものになっており、中央に渦巻き状の模様が描かれています。全体的に洗練された印象を受けるパッケージデザインだと言えます。

claude-3-opus-20240229

感想

 3つのAIとも優秀で、「IQOS ILUMA」の「TEREA」というのをしっかりと認識しています。ラベルにある通り、「TEREA for IQOS ILUMA」を示しているのは、GPTとClaudeです。
 GPTのみ「煙(蒸気)」を「葉(茎)」読み間違えていますが、”たばこ”→”植物”→葉と関連付けたのかなと邪推してます。
 パッケージから読み取った文章から、GPTとGeminiは、"警告"と表現していますが、Claudeは"注意点"にとどめています。細かい差異ではありますが、個人的には、"警告"のほうが適当かなと思います。
 特に感心したのは、Geminiの「つまり、~」の文章。パッケージに記載された内容を咀嚼し、とても分かりやすく説明がなされていると感じました。
GPTやClaudeも"淡々"と正確に情報を伝えているかと思いますが、解釈をしっかり説明できているのは、Geminiかなと思います。
 逆に、Geminiのみ「見た目」に関する説明が抜けているのが面白いと思います。「見た目」を示しているGPTとClaudeでも、GPTは「青色のパッケージに白い模様が描かれた」少々淡白な表現に留めているのに対し、Claudeは、「全体的に洗練された印象を受ける」と感情的(?)な表現もしている。プロンプトでは、「簡潔に」と指示を出しているので、それに対して忠実に答えているのは、GPTかなと思います。

LINEで試している様子

この記事が気に入ったらサポートをしてみませんか?