見出し画像

画像生成AI DALL-E3で同じキャラクターの画像を生成する方法


はじめに

漫画、アニメ、LINEスタンプなど
同じキャラクターを表情やポーズを変えて作成したいことはよくあると思いますが、

実はこれ、案外難しいです。

AIで画像生成したことがあればわかると思いますが、
どの画像生成AI使ってもこの問題に直面します。

大体こんな風に全然違う画像になってしまいます・・・

↓↓

なんとか連続した同じキャラクターを生成できないかと
OPEN AI社のDALL-E3でやり方を考えたので紹介します。


今回のサンプル画像


使用したプロンプトはこちらです。

Please translate the following prompt into English and then use it as a prompt to generate an image.
"""
prompt:
「アニメ調の美女の正面画像を生成して、服装はカジュアルで」

ちなみにこれは
英語の方が精度が上がるということなので
一旦英語に翻訳してから英語でプロンプト入力をするというやり方です。

テクニック① 本当のプロンプトとSEED値を取得する

今回私は、
「アニメ調の美女の正面画像を生成して、服装はカジュアルで」
とプロンプトを入力しましたが、

実は、
実際にChatGPTが使ったプロンプトは別なんです。

それは英語に翻訳してから送信したからではなく、
違う文章が送られていることが多いです。

ですので本当のプロンプトを取得してやる必要があります。

そしてその際に、生成された画像のSEED値も取得してやりましょう!

※SEED値とは、画像生成した際にランダムに割り振られる値です。

プロンプトは裏側ではJSON形式で処理されているので
下記のように入力します。

生成した画像のためにDALL-Eに送信した指示をJSON形式で、シード値を含めて出力して。

このような形式で返ってくると思います。

{
  "prompt": "A front-facing image of a beautiful woman in anime style, dressed casually. She has a friendly expression, medium-length hair, and is wearing a casual outfit that includes a t-shirt and jeans. The background is simple, focusing on her character.",
  "size": "1024x1024",
  "seed": 2893694650
}

これらの情報を活用してこれから画像を生成していきます。

テクニック② 指示以外プロンプトを変更させない。

できるだけ同じキャラクターを保つためには
最初に使ったプロンプトを可能な限り保持することが重要です。

だからこのような書き方で指示します。

○○にだけ変更。それ以外いかなる理由があっても、プロンプトを変更しないでください

英語で入力したいのでプロンプトは下記のようになります。

Change only to ○○. Do not change the prompt for any other reason!

○○の部分は指示したい内容に変更してください。

たとえば、

  • 笑顔:smile face

  • 座っている:setting pose

  • 怒っている:angry face

というような形です。

英語がわからない時はDeepLなどで翻訳しましょう。

そしてこのようにその英文をプロンプトの先頭に貼り付けます。

{
  "prompt": Change only to an angry face. Do not change the prompt for any other reason! A front-facing image of a beautiful woman in anime style, dressed casually. She has a friendly expression, medium-length hair, and is wearing a casual outfit that includes a t-shirt and jeans. The background is simple, focusing on her character.",
  "size": "1024x1024",
  "seed": 2893694650
}


生成した画像

座っている(setting)
話している(talking)
怒っている(angry face)
照れている(embarrassed face)
横を向いている(profile in color)*colorは白黒で生成されたため指定


是非試してみてください!


この記事が気に入ったらサポートをしてみませんか?