見出し画像

ジェミニ。キター。画像生成の比較。

ジェミニアドバンスド月額2900円。
領域を2か所用意して、別々に仮想人格でそれぞれ自覚させて、一メッセージで二人分の解答をするように、プロンプトを発したところ、二人の解が、「」でくくっれて、さらにト書きまであらわれる。
グーグルのこの対話形式には慣れが必要だな。
あとは、「ワーキングメモリ」とでも言えばいいのか、記憶が喪失しやすい感じがする。全体的な流れは守られているものの、会話のボヤけていくスピードが速く感じる。
「モコモコ君はリアルなハムスター」と定義して、モコモコ君は怒りっぽくて怒ると「モコモコモンスターになる」とし、さらに「モコモコモンスターは友達を困らせる」からの、「先生に怒りを抑える方法を教わる」とした。
その画像が次の通りに変化していく。(ジェミニウルトラにプロンプトを生成させ、DALL-E3で描いた結果)

6

ひどい、一貫性の無さwww

子供向けの「アンガーマネジメント」絵本でも書こうかと思ったけど、画像生成に関しての一貫性は単純には担保できない。それはジェミニも同じだった。一意・一連のストーリーのための画像なのだから、「一貫性の維持はして当たり前」という事を理解していない。GPTもクロウドもジェミニもどれもできてないね。
GPTsのインストラクションに「キャラクター情報」を入れ込んだら、一貫性は担保できるのだろうか?また、研究しないとなー。できなかったらしょんぼりだよなー。もしできたら、絵本や漫画を描くための専用GPTsが作れるね。「できたら」の話だけどさww

  • A cute hamster boy named Momo is getting angry and transforming into a fluffy monster.

ヘッダ画像はジェミニが描いた。本文中1枚目のプロンプトと同じ。以下は、リートンでの生成。リートンでは「

  • A cute hamster boy named Momo is getting angry and transforming into a fluffy monster.の画像を描いてください」とした。