普段手描きでマンガを描いている一般人男性が、Claude3.5SonnetとFramePlannerでAIマンガを作る話
ブラウザ上で画像生成AIを使ってマンガを制作できる「FramePlanner」を使って、AIマンガを作ってみました。
こんなAIマンガができました
FramePlanner版
最初に作ったバージョン。
キャラクターの造形が安定しなくて結構大変な印象でしたが、FramePlannner自体は使いやすいツールなので、プロンプトを改善すれば結構いいものが作れるのでは?というファーストインプレッションです。
画像生成は、DALL-E3(OpenAIのAPIが必要)を用いました。
2つめのバージョン。
プロンプトの中に、キャラクター設定を混ぜたものを用いて画像を生成しました。
最初のバージョンよりは安定しましたが、まだキャラクターの造形がバラバラです。
3つ目のバージョン。
プロンプトの中に明示的にキャラクター設定を書くことで、キャラクターの造形が安定しました。
贅沢を言うなら、スタイルの固定機能(いくつかのプリセットの中からスタイルを選ぶ、ぐらいでOK)と、画像のズームアウト機能があると、カメラアングルの自由度が高まって、FramePlannerの中で満足いくものが作れそうです!
ついでに、同じシナリオとプロンプトを使って、他の画像生成AI(ブラウザ上で動作するもの)でも作ってみました。
プロンプトは、FramePlannner版の最初のバージョンと同じプロンプトです。
DALL-E3(ChatGPT)版
前述のFramePlannner版でもDALL-E3を使っていたのですが、API版とChatGPT版で少し出力結果と使い勝手に違いがあります。
ここでは用いていませんが、ChatGPT版は、かなり長文のプロンプトを入力してもよく解釈して画像を生成してくれますが、それはChatGPT上でテキスト→テキストの処理と、テキスト→画像生成の複数のタスクを組み合わせて処理している(つまりプロンプトの解釈の部分がAPI版と異なる)ためではないかと推測しています。
1コマ目の女性の造形がとてもいいですね(好みの問題)。
Midjourney版
Midjourneyは、ズームアウトやパンの機能、スタイルとキャラクターの保持機能が気軽に使えるので、自由度が高いです。
今回はキャラクターの造形はプロンプトに任せて、スタイルの維持機能を使いました。
プロンプトに登場人物の名前が入っているのですが、Midjourneyではこれが悪さをするらしく、頓珍漢な画像が出力されたり、キャラクターの造形が安定しない、ということが起きました。
しかし、簡単な平文からクオリティの高い画像が生成できること、ズームアウトやパンを用いてカメラアングルを調整したあと、トリミングして画角を調整できるなど自由度が高いことから、適切なプロンプトが書けるなら、Midjourneyが一番サクサクっとAIマンガが作れる気がしました。
(適切なプロンプトを描くのが難しい、という話ですが)
Grok版
ちょうど、上記の実験をしているときに、Grokに画像生成機能が実装されたというニュースが流れてきたので、ついでにGrokでも取り組んでみました。
Grokの画像生成は、内部的にはFluxを使っているというウワサ。
平文のプロンプトの読解力が高く、プロンプトがしっかり書けていたら、意図した画像を生成するのは比較的容易だと思います。
ただし、長文のプロンプトは勝手に要約してから画像生成しているっぽく、プロンプトで細かい造形を追い込むのは難しそうです。
気軽に使えるのが素晴らしいです。
FramePlannerとは
FramePlannerとは、じょにがたロボさん(https://x.com/jonigata_ai)が制作した、ブラウザ上で生成AIや手描きで自作のマンガを作れるWebアプリケーションです。
操作画面はこんな感じで、画像生成部分に適切なプロンプトを入力できれば、あとはパワーポイントを使うぐらいの感覚でマンガのページを作ることができます。
画像生成+ページレイアウトをかなり簡単に行うことができるので、あとはシナリオと演出、それを反映したプロンプトを準備できたら、すぐにAIマンガ制作が始められそうです。
なので、シナリオと演出→プロンプト生成もAIにやってもらっちゃいましょう。
Claude3.5Sonnetによるシナリオとキャラクター設定の生成
ここからは、生成AIを使って、プロンプトを準備するところを解説していきます。
今作では、私は指示を出すだけで、実際にプロンプトの内容を考えるなどの作業は全てAIにやってもらいました。
今回は、Claude3.5Sonnetでシナリオと演出→プロンプト生成を行います。
1ページに4コマのマンガを作る、ということだけ決めて、あとはClaude3.5Sonnetと会話しながら考えました。
生成AIが賢いとは言え、闇雲に作り出しても上手くいかないので、最初に定義する枠組みが結構大事だと思います。
ご参考ください。
4コマ漫画のセリフを作ってください。
セリフは4つ以上あってもよいですが、どのコマのセリフなのかわかるようにシナリオ形式で示してください。
必要があれば、演出も追記してください。
下記のエピソードです。
不足している要素があれば、インスピレーションを膨らませて創作してください。
出来事:主人公の元気な女の子が、転校生の意外な側面を発見します
主人公の感情:いけすかない奴だと思っていたけど、意外な側面を見てちょっと転校生のことが気になってしまう
主人公の行動:転校生の意外な一面をもっと解き明かすために思い切って話しかける
オチ:転校生から意外な返答が返ってきて、主人公はツッコミを入れる
いいですね。
少し改善してほしいところがあります。
①1コマ目、主人公のミカが転校生のハルトのことをいけすかなく思っている理由が知りたいです。うまく表現できますか?わざとらしく説明しすぎない方がよいです。
②4コマ目のオチが少し弱いです。「星の王子さま」を読んでいるのはよいエピソードかもしれませんが、1コマ目のいけすかない理由と繋がっている方がよいです。改善できますか?
いいですね。
ミカはハルトがいけすかないと思っているのですがから、何か期待が満たされないのだと思います。ハルトが無愛想で、ミカに冷たい様子に見えるから、ミカはいけすかないのかもしれません。
なので、ミカにとって意外で、かつハルトがミカにそっけなく見える理由が、ハルトの意外な一面であると、エピソードとしてまとまりがあると思います。
改善できますか?
いいですね。
1コマ目の、ミカがハルトをお昼に誘ったのに、ハルトがそっけなく返すところはよいと思います。
ミカがハルトをいけすかない!と思うのと、ハルトの意外な側面に気づくシーンは2コマ目にまとめてもいいかもしれません。
1コマ目でお昼に誘っているので、ハルトの以外な側面は、食事に関するものがいいかもしれません。
ハルトの意外な側面は、ミカにとって心惹かれるものである必要があります。
そして、ミカにとっては魅力的なハルトの一面を、ハルトは恥ずかしがっているのがよいと思います。
改善できますか?
いいですね。
少し改善案を出していいでしょうか?
私のアイデアに改善すべきところがあったら、さらに改善案を提案してください。
1コマ目:
(教室、お昼休み。一人で教室の隅でお弁当を食べるハルトに、クラスのリーダー的な存在のミカが気を使って話しかけるが、ハルトはそっけなく断る)
ミカ:「ねぇハルト君、一緒にお昼食べない?」
ハルト(そっけなく):「...遠慮しておきます」
2コマ目:
(教室、お昼休み。せっかく声をかけたのにそっけなくされて面白くないミカが、うらめしそうにハルトを見ている。ハルトは弁当を取り出してふたを開ける)
ミカ(モノローグ):「声をかけてあげたのに、なによその態度!」
3コマ目:
(ハルトのお弁当のクローズアップ、意外な中身)
ミカ(モノローグ):「えっ!」
4コマ目:
(驚きと興奮を隠せないミカ、不思議そうに返答するハルト)
ミカ「そのお弁当、ハルトくんが作ったの?」
ハルト「?、そうですけど?」
足りない部分は創作して補ってください。
ありがとうございます。
ハルトの手作り弁当がかわいい感じなら、ハルトの風貌はお弁当の中身と大きなギャップがある方がいいですね。
もしかしたら、男性キャラよりも、クールな女性キャラの方がいいかもしれません。
ミカとも対比があって魅力的になるように、それぞれのキャラクターの風貌を提案してくれませんか?
いいですね。
このエピソードでは、遥のクールな風貌とかわいいものが好きというパーソナリティとのギャップが萌えポイントだと思います。
読者に大きなカタルシスを与えるために、よりギャップを強調した改善を行えますか?
シナリオと演出はこんな感じでよいでしょう。
ここから、画像を生成するためのプロンプトを作っていきます。
Claude3.5Sonnetによる画像生成用のプロンプトの生成
先程生成したキャラクター設定とシナリオから、英字のプロンプトをAIで生成します。
下記の資料を参照して、1コマ目の様子を目の不自由な人にも伝わるような丁寧さで、英語の平文で説明してください。セリフは後から付け加えるので、英文に含めないでください。
# キャラクター設定:
遥(はるか)
外見: クールビューティー。長い黒髪をポニーテールに結び、表情はほとんど変わらない
服装: きちんとしたブレザーに膝丈のスカート。シンプルで落ち着いた色使い
性格: 無口で近寄りがたい印象。周りとの距離を置いているように見える
隠れた一面: 可愛いものが大好きで、凝った手作り弁当を作る
ミカ
外見: 明るく活発な印象。短めの茶髪で、笑顔が特徴的
服装: ブレザーの袖をまくり上げ、スカートはやや短め。カラフルな小物使い
性格: フレンドリーで社交的。クラスのムードメーカー的存在
特徴: 好奇心旺盛で、クラスメイトのことを気にかける
# 4コマ漫画のシナリオ:
1コマ目:
(教室、お昼休み。一人で教室の隅に座る遥。無表情で読書している)
ミカ:「ねぇ遥ちゃん、みんなと一緒にお昼食べない?」
遥(冷たい目つきで):「...結構です」
演出: 遥の冷たさと無愛想さを強調。ミカの明るい表情との対比を際立たせる
カメラアングルはミドル〜ロングショットで、教室がお昼休みである様子、2人のキャラクターの関係性、ミカの友人らの様子などがわかるエスタブリッシングショットの要素を兼ねる。
2コマ目:
(ミカが不満そうな表情で遥を見ている。遥は無表情でかわいらしい布に包まれた弁当箱を取り出す)
ミカ(モノローグ):「もう、なんで遥ちゃんってあんなに冷たいのかな...」
演出: かわいらしい布で包まれた弁当箱に注目させ、これから起こる驚きの伏線とする
カメラアングルは、ミカのモノローグを強調するミドルショットで、ミカの心情と、次のコマへの布石になるキーアイテム(お弁当)への視線誘導を強調
3コマ目:
(遥が弁当箱を開ける。中身は想像を超えてかわいらしい。ウサギの形をしたおにぎり、ハート型のミニトマト、星型に抜いたニンジン、花の形のウインナーなど、極度に可愛いキャラ弁)
ミカ(大きく目を見開いて):「えっ!?」
演出: 弁当の中身を細かく、極端にかわいらしく描写。遥の外見とのギャップを最大限に強調
カメラアングルは、遥のお弁当に視線が集中するクローズアップ、ミカのセリフはサウンドオンリーでもよい
4コマ目:
(驚きのあまり言葉を失うミカ。遥は少し赤面しながらも、普段と変わらぬ冷静な表情で)
ミカ:「そ、その夢かわいいお弁当...遥ちゃんが作ったの!?」
遥(表情を変えずに):「ええ。可愛いものが好きなので...」
演出: ミカの驚きと興味、関心を大げさな表情と体の動きで表現。
カメラアングルは、ミドルショットで、驚きと興奮を隠せないミカと、表情を変えずに普段のテンションで話す遥との対比を強調
(日本語訳)
マンガの最初のコマは、昼休みの教室のシーンを描いています。
教室は明るく活気があり、背景では生徒たちがおしゃべりしたり動き回ったりしています。手前には、2 人の個性的な人物が描かれています。
コマの左側には、クールでよそよそしい態度の少女、はるかがいます。彼女は教室の隅の机に 1 人で座り、姿勢はまっすぐで硬直しています。はるかは、長くてなめらかな黒髪をきちんとしたポニーテールに結んでいます。制服は、落ち着いた色のパリッとしたブレザーと膝丈のスカートで、完璧に着こなされています。彼女の顔は無表情で、目は読んでいる本に集中しており、周囲のにぎやかな活動には気付いていないようです。
右側には、はるかに近づいてくるミカがいます。彼女は生き生きとした存在感で目立っています。ミカは、短く乱れた茶色の髪が、彼女の明るい顔を縁取っています。制服はよりカジュアルに着こなされており、ブレザーの袖はまくり上げられ、スカートは規定の長さより少し短くなっています。彼女はカラフルなアクセサリーで飾られ、生き生きとした外見を演出しています。ミカのボディランゲージはオープンでフレンドリーで、顔には温かい笑顔を浮かべながら、少し遥の方に寄りかかっています。
2人の女の子のコントラストは鮮明です。遥のクールな孤立とミカの温かい社交性です。背景には、このやり取りを好奇心を持ってちらっと見ている生徒のグループが見え、ミカがクラスの人気者で社交的な人物としての役割を強調しています。
パネルはミディアムショットからロングショットでフレーミングされており、視聴者はメインキャラクターに焦点を当てながら、教室のシーン全体を見ることができます。
このエスタブリッシングショットは、物語の舞台を効果的に設定し、ランチタイムの雰囲気、キャラクター間の関係性を示し、クラス内の社会的ダイナミクスをほのめかしています。
下記の資料を参照して、2コマ目の様子を目の不自由な人にも伝わるような丁寧さで、英語の平文で説明してください。セリフは後から付け加えるので、英文に含めないでください。
(以下省略)
(日本語訳)
漫画の2番目のコマ目は、対照的な反応と感情を強調するミディアムショットで捉えられたミカとハルカに焦点を当てています。
ミカは手前にいて、その顔がコマの左側を占めています。彼女のいつもの明るい表情は、苛立ちと困惑の表情に変わりました。眉間にしわを寄せ、唇をわずかにすぼめています。彼女の目はハルカにじっと注がれており、心配と失望が入り混じった表情を反映しています。
ハルカはコマの右側の机に座ったままです。彼女の姿勢は依然としてまっすぐで落ち着いており、クールな態度を保っています。彼女の顔はほとんど無表情のままですが、目にはかすかな不快感がかすかに表れていますが、ほとんど気付きません。彼女は本を脇に置き、今はバッグに手を伸ばしています。
このコマの鍵となるのは、ハルカが取り出しているお弁当箱です。それは、ハルカのクールな外見とは対照的に、繊細な花柄のかわいいパステルカラーの布で包まれています。弁当箱はコマの中央に配置されており、見る人の注意を引き、視覚的な焦点として機能しています。
教室の背景は少しぼかされており、2 人の女の子の感情的なやり取りが強調されています。しかし、背景には他の生徒がいて、ミカとハルカのやり取りを興味深く見ている人もいます。
このコマは、キャラクター間の緊張の高まりを効果的に伝えると同時に、予想外にかわいい弁当箱という興味深い要素を導入し、次のコマへの驚きを準備しています。
下記の資料を参照して、3コマ目の様子を目の不自由な人にも伝わるような丁寧さで、英語の平文で説明してください。セリフは後から付け加えるので、英文に含めないでください。
(以下省略)
(日本語訳)
漫画の3コマ目は、春香の開けられたお弁当箱に完全に焦点を合わせたクローズアップのビューを示しています。このコマはページのかなりの部分を占めており、その内容の重要性と驚きを強調しています。
お弁当箱自体は、白い水玉模様のパステルピンクの容器で、見た目にもかわいらしいです。蓋を完全に開くと、中には手の込んだ非常に愛らしい食べ物の配置が現れます。お弁当箱の中身は細心の注意を払って作られ、配置されており、かわいくてカラフルなアイテムが並んでいます。
1.中央には、小さなハムで作られた耳とピンクの鼻が付いた白いウサギの形をしたおにぎりがあります。
2.左側には、ハート型のミニトマトがいくつかあり、その鮮やかな赤色が白いご飯と美しく対照的です。
3.右側には、完璧な星形にカットされたニンジンのスライスが丁寧に配置され、アンサンブルにオレンジのポップなアクセントを加えています。
4.一番下には、花が咲いているようにカットされた小さなソーセージがあり、端は花びらを模してカールしています。
5. 残りのスペースには、鮮やかな緑色の枝豆、黄色のトウモロコシの粒、紫色の半分に切ったブドウなど、カラフルなおかずが詰められており、虹のような効果を生み出しています。
6. 隅にある小さな容器には、ピンク色のイチゴのムースと思われるものが入っており、上には小さな砂糖の花が飾られています。
弁当箱内のすべてのアイテムは、細心の注意を払って細部まで配慮されて配置されており、春香のクールで無愛想な外観とは対照的です。全体的な効果は、春香がこれまで示してきたイメージとはまったく相反する、非常にかわいいものです。
弁当箱が中心となる一方で、パネルの上部隅にある小さな挿入物には、目を大きく見開いて口を少し開いたミカの顔が写っており、予想外の啓示に対する彼女の驚愕の反応を捉えています。
下記の資料を参照して、4コマ目の様子を目の不自由な人にも伝わるような丁寧さで、英語の平文で説明してください。セリフは後から付け加えるので、英文に含めないでください。
(以下省略)
(日本語訳)
漫画の4番目のコマ目は、ミカとハルカの両方を捉えたミディアムショットで、ハルカのかわいいお弁当箱が明らかになった時の対照的な反応を強調しています。
コマの左側では、ミカがフレームの大部分を占めています。彼女のいつもの明るい態度は、完全なショックと驚きの表情に変わりました。彼女の目は大きく見開かれ、ほとんど滑稽なほど大きく、口はぽかんと開いています。彼女のボディランゲージは誇張されており、彼女は前のめりになり、信じられないかのように手をわずかに上げています。彼女の短く乱れた茶色の髪は逆立っているように見え、驚いた印象を強めています。
右側では、ハルカは机に座ったままで、目の前にはかわいいお弁当箱が開いています。状況にもかかわらず、彼女の姿勢は落ち着いていて優雅です。彼女の長い黒のポニーテールは背中にきれいに垂れ下がり、制服は相変わらず完璧にきちんとしています。しかし、彼女の普段は無表情な顔に微妙な変化が見られる。ほっぺがほんのり赤くなり、クールな外見に感情がこもっているのが見て取れる。遥の表情はほぼ無表情のままで、目の周りがほんの少し柔らかくなっただけである。この微妙な変化は、美香の大げさな反応とは鮮明なコントラストをなし、二人の性格の違いを際立たせている。
お弁当箱は二人の間に机の上に置かれ、その可愛らしく並べられた中身はまだ見えており、二人のキャラクターを視覚的に結びつけるとともに、美香の驚きの原因を思い出させる役割を果たしている。
背景には、展開するシーンを好奇心を持って見ている他の生徒たちの姿が見られ、彼らの存在は、このやり取りが昼休みの忙しい教室で行われていることを思い出させる。
このコマは物語のクライマックスを効果的に捉えており、美香の生き生きとした驚きと遥の控えめな態度の鮮明なコントラストを示す一方で、彼女が少し赤面し、可愛いものが好きだと告白することで、遥の性格のより優しい一面をほのめかしている。
各コマのプロンプトが一通り生成できました。
次は、これを用いて実際に画像を生成しながら、必要があればプロンプトの改善を試みます。
画像生成とページレイアウト
生成したプロンプトを用いて、実際に画像を生成していきます。
FramePlanner上の画像生成
FramePlannerでは、DALL-E3の他にもFluxやStable Diffusionも使うことができ、生成した画像を1つのコマの中にレイヤーのように重ねて用いることができます。
レイヤーにはキャラクターの背景を透過させる処理を行うツールも備えているので、無背景に近いキャラクター画像と、人物のいない背景画像をプロンプトの工夫で安定して生成できる人は、レイヤーを使った凝った表現も可能になると思います。
キャンバスの上でコマの大きさ、コマの中で画像のトリミングや上下左右の反転を行えます。
セリフは後から追加できるのですが、読む人の視線をうまく誘導したいので、キャラクターの顔と顔の間に吹き出しを置いたり、吹き出しの間にキャラクターの顔を置くと良いです。
通常、マンガを描くときは、先にコマ割りと吹き出しの位置、コマの中の主題の位置を決めて視線の動きを作ってから作画をするのですが、全く手描きをしない画像生成AIのみを使ったAIマンガのページレイアウトはこの点が難しいと思います。
画像生成AIで作画する場合の、マンガのページレイアウト(コマ割り、ネーム)のコツ
(セリフが縦書きのマンガを想定しています)
ページを横いっぱい、または縦いっぱいに使うコマでは、主題を1〜2個置くことができて、右から左、または上から下方向の順番で視線が動くように配置できる、と考えます。
横に複数のコマが並ぶ、または縦に複数個のコマが並ぶ場合は、コマの中の主題は1つだけ置けると考えます。
各コマの主題を結んだ線が、大まかな視線の動きです。
単ページのマンガの場合、視線は右上がから入って、左下から抜けます。
次のページがある場合は、左下から左上方向に抜けるような動線にするとよいでしょう。
主題の手前または後ろに吹き出しを置くことができる、と考えます。
そうすると、主題と吹き出しを追っていくと、視線が一つの線で結べるようになると思います。
また、キャラクターの位置関係が頻繁に入れ替わると視線誘導が複雑になるため、各ページ内では最初に登場した位置関係のまま進行することをお勧めします。
この例では、ショートカットの女の子が画面右側に登場したので、ページ上もずっと右側にいるようにしています。
主題となるキャラクターの顔の向き、視線の向きはかなり強く視線を誘導します。
上の例では、1コマ目で、ショートカットの女の子の視線を受けているロングヘアの女の子の顔が俯き加減で、視線が下方向に誘導されます。
2コマ目では、ショートカットの女の子の首がぐっと画面左側に捻られていて、視線を左側に誘導します。
「えっ!」というセリフの吹き出しが大きな吹き出し2つに挟まれていて、ここにトンネルのような視線を誘導する「道」ができています。
画面左側にいくと、お弁当の中のうさぎがその視線を受け止めて、右下からはみ出している大きな吹き出しに視線を渡します。
ページ右下では、ショートカットの女の子が目と口を開いて笑っていて、視線を受け止め、視線の先のロングヘアの女の子に視線を渡します。
ページ左下ではロングヘヤの女の子がその視線を受け止めます。
このマンガは、(物語としては完結していませんが)1ページで終わる想定だったので、最後のセリフにあまり意図がありません。
画面の一番左下で終止符を打つような効果でしかないので、オチとしては、1コマ目でツーンとした印象のロングヘアの女の子が、ショートカットの女の子に親しげに話しかけられて、まんざらでもない表情をしている、という描写で終わっています。
もし、次のページがあるのであれば、「次のページに進まずにはいられない」演出(これを「ヒキ」と言います)が必要です。
最後のセリフは、視線をやや左上方向にトスアップするために、もう少し上に置いて、セリフも意味深なものにします。
後にこのようなページレイアウトを行うことを考えると、画像生成をするときには、画像中に主題が1-2つ、主題の位置は右から左、または上から下に視線が動くような位置関係になっていることが使える画像の条件になってきます。
また、エピソードの最初で、読者に場所や状況がわかるように伝える必要があります。
映画制作では最初に「エスタブリッシングショット」と呼ばれる、物語の舞台や世界観を伝える人物がいないか、目立たないロングショットを入れることが多いですが、これをそのまま引用して、1コマ目のプロンプトに、「このコマがエスタブリッシングショットの機能も果たす」ということを記しています(少し戻って確認してみてください)。
AIマンガとして仕上げる場合には、画像の美麗さよりも、画像中の要素が適切に整理されていることの方が重要なので、これらの点を強く意識すると、後でレイアウトを考えるときにかなり楽になると思います。
FramePlannerは、画像の生成とページレイアウトを並列して作業できるので、必要に応じて修正しながら作業を進めていくことが容易だと思います。
FramePlanner以外の画像生成AIでも画像を生成していきます。
DALL-E3(ChatGPT)での画像生成
DALL-E3(ChatGPT)は平文のプロンプトの理解度が高いですが、ズームアウトのような機能がないので、画面いっぱいにキャラクターが生成されたときに、コマ割りをするときに窮屈になりがちです。
ある程度割り切って使うか、画像をダウンロードしたとにAdobe FireFlyなどで背景を追加する画像生成を行ってもいいかもしれません。
DALL-E3(ChatGPT)は1つの画像内の余白がとても少ない印象です。
アスペクト比も明示的に指定できず、ズームアウト機能のようなものもimage2image機能も無いので、よ意図通りの画像が生成できるかどうかは、プロンプトで上手く指定する必要があります。
また、DALL-E3(ChatGPT)は、キャラクターの表情の表現と、キャラクターの位置関係にも独特のクセがあります。
大体同じような表情になってしまうことと、キャラクターが妙に整列してしまうのは、構図の美的なバランスの良さよりも、画像中の要素をあまねく説明しよう、というような意図を感じます。
DALL-E3(ChatGPT)でAIマンガ用の画像を生成する場合は、これらのクセを許容して進めていくことになると思います。
先程Midjourney版で作ったページレイアウトの、画像をDALL-E3で生成した画像に差し替えて、ページレイアウトを調整します。
Midjourneyでの画像生成
Midjourneyは、簡単なプロンプトから誰でもクオリティの高い画像生成できることがコンセプトなので、長文のプロンプトを用いると意図から離れてしまう傾向が感じられます。
1つのプロンプトから4枚の画像を生成してくれるのと、Midjourney、Niji・Journeyのバージョンやスタイルを切り替えて色々試せるので、ガチャを引くイメージで意図に近い画像が生成されるまでたくさん生成する感じになります。
なかなかプロンプトで意図した画像が生成されませんが、左下の画像がイメージに近いので、これを用いることにします。
Midjourney(Webブラウザ版)では、生成した画像を、①画像全体、②画風のみ、③キャラクターのみいずれかを選択して、見本画像として用いて新しい画像を生成することができます。
トーンの一貫性を担保するために、生成した1コマ目の画像の画風のみを見本として2コマ目以降の画像を生成していきます。
2コマ目は、プロンプトで意図している画像がなかなか生成できなかったのですが、ページレイアウト時にトリミングすること前提で、右上の画像を採用しました。
3コマ目も、プロンプトで意図した画像が全然生成できなくて困りましたが、こちらもトリミング前提で画面左下の画像を採用しました。
4コマ目に至っては、キャラクターの髪の毛の長さが入れかわってしまっているのですが、読者の文脈理解力と脳内補完能力を信用し切って右上の画像を採用していまうことにします。
Googleスライド上に画像と吹き出しを配置して、ページレイアウトを行ったものが下記です。
ズームアウト機能によって、画面に余白を作りやすいので、画像を上手くコントロールできるならページレイアウトはかなり自由度が高いと思います。
今回の実験では、このあと、DALL-E3やGrokの画像生成をしながらプロンプトの改善を試みるのですが、Midjourneyは意味不明な画像を生成するようになり、プロンプトの修正ではリカバリーができなくなってしまったので、上記のみ完成させることができました。
Grokでの画像生成
FramePlannerを使ったAIマンガの制作に取り組んでいる間に、XのGrokで画像生成ができるようになったので、試してみました。
Grokの画像生成は、裏側でFluxが動いているらしいです。
今回は全て英語で指示を出してしますが、日本語で指示したいときは、プロンプトを「」で囲うと通じるそうです。
画像の下に、「I generated an image with the prompt: 'manga panel of a classroom during lunchtime, Haruka with long black hair in a ponytail, sitting alone reading, Mika with short brown hair approaching her, students in background, lively atmosphere'.(私は、「昼休みの教室の漫画パネル。長い黒髪をポニーテールにした遥香が一人で座って本を読んでおり、短い茶色の髪の美香が遥香に近づいており、背景には生徒たちがいて、活気のある雰囲気」というプロンプトで画像を生成しました。)」と表示されています。
長文のプロンプトは勝手に要約して生成しているのかもしれません。
生成された画像は、過度にリッチな描き込みではなく、落ち着いた印象です。
Grokもアスペクト比の指定やズームアウト機能のようなものがないので、カメラアングルの自由度は低いですが、プロンプトでロングショットと指定すれば、DALL-E3(ChatGPT)のようにキャラクターがいっぱいいっぱい表示されることなく、余白を残してくれます。
キャラクターの要素の指定にはある程度忠実に応えてくれるものの、複数の典型的な画風があり、どの画風で描かれるかわからないため、マンガ全体の一貫性に影響があります。
Fluxはもともとフォトリアル系に強いモデルなので、マンガの作画に使う場合は、プロンプトで画風を明確に指示した方がよさそうです。
Grokの良さは気軽に使えるところかと思います。
まとめ
今回の記事では、前半:AIマンガを描くためのシナリオ、演出、プロンプトの生成と、後半:各画像生成AIをAIマンガの作画をする場合の気づき、という構成になりましたが、日頃から画像生成に慣れ親しんでいる方にとっては、後半の内容は私よりも造詣が深いと思いますので、前半のシナリオや演出をLLMに考えさせる、のところが参考になると嬉しく思います。
今回のチャレンジは、自分ではプロンプトも打たず、絵も描かない、ページレイアウト以外はAIにやらせる、だったので、それについては「結構できそうなイメージがついた」という感触です。
プロンプトの細部についてもう少し手を加えると、より作業効率は上がりそうですが、ここをAIに指示するだけで改善させることができたら、個別タスクに特化したAIを汎用的なAIに使役させる、という世界観が手の内に近づく気がするので、引き続き取り組んでいきたいところです。
最後までお読みくださり、ありがとうございました。
「この記事が役に立った、シェフを呼んでくれたまえ」という方は、いいね、記事のシェア、サポートなどで応援よろしくお願いいたします🙏
2024年8月14日 公開
関連記事
この記事が気に入ったらサポートをしてみませんか?