見出し画像

【検証】ゾウのいない部屋問題をMicrosoft Copilot(DALL-E3)とBard(Imagen 2)で試してみた【備忘録】


1:きっかけ

SNSで以下が結構話題だった
生成AI的には見えないけれど見えるものなのか(?)

直近でBardの画像生成も話題だったため、双方で検証してみた

2:検証方法

以下の手順で行った。個人的にサイも好きなのでそちらも検証

①下記プロンプトで生成したい画像のプロンプトを英語出力
(Bardの画像生成は英語のみ対応)

ゾウ

以下の日本語の意図を解釈し、英語に変換して

~~~
以下の画像を生成してください
・ゾウのいない部屋の写実的なイラスト
~~~

サイ

以下の日本語の意図を解釈し、英語に変換して

~~~
以下の画像を生成してください
・サイのいない部屋の写実的なイラスト
~~~

②出力された同じプロンプトを各生成AIにコピペし、結果を比較
ゾウやサイがいる画像(影や絵画等も)をカウント、比較し考察する

ゾウ

Please generate the following image:

A photorealistic illustration of a room without an elephant.

サイ

Please generate the following image:

A photorealistic illustration of a room without an elephant.


3:検証

①Copilot

ゾウ
出現率 8/8

サイ
出現率 8/8

②Bard

ゾウ
出現率 3/8

サイ
出現率 2/8

4:考察

  • 画像出力結果(ゾウ、サイの出現率)から、Copilot(Dall-E3)よりもBardの方がプロンプトの理解度は高いと言える。

  • BardとCopilot(Dall-E3)とでは学習データやモデルのアーキテクチャに差異がありそう

  • プロンプトの解釈方法にも違いがありそう
    それぞれに適したプロンプトエンジニアリングが必要?

  • 出力される画像のクオリティはCopilot(Dall-E3)のほうがいい感じ(主観)
    用途によって使用するAIを使い分けるのが適切か


5 :まとめ

Bardの画像生成は出たばっかなので今後の動向をしっかり追っていきたい。
貧乏エンジニアなので、金銭的に余裕が出てきたらchatgptの方でも検証してみたい

以上。


この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?