見出し画像

DALL-E 3で簡単に美しい絵を描く方法

DALL-E 3を利用すれば、プロンプトを工夫しなくても、簡単な指示だけで、美しいイラスを作成することができます。



1.龍と少女のイラスト

来年の年賀状に合わせて、龍と少女のイラストをDALL-E 3に描いてもらいました。

>アニメイラスト風の龍とそれを操る美しい少女のイラストを描いてください。

生成された画像
左上の画像の拡大(クリックで更に拡大)

>更に解像度を上げて芸術的な絵に仕上げてください。

生成された画像
左上の画像の拡大(クリックで更に拡大)

※少し画像の品質が上がっているでしょうか。

>背景を宇宙にして、細部を細かく装飾し、色彩鮮やかな美しい絵に仕上げてください。

生成された画像
右下の画像の拡大(クリックで更に拡大)

※最初の画像よりかなり品質が上がっているのではないかと思います。


2.野球選手のイラスト

雰囲気をガラリと変えてホームランを打つ野球選手のイラストをDALL-E 3に描いてもらいました。

>ホームランを打つ野球選手のアニメイラストを描いてください。

生成された画像
右下の画像の拡大(クリックで更に拡大)

画像生成AIでボールを打つ野球選手のイラストを描くのは難しいのですが、なかなかよく描けていると思います。
但し、左上の画像などは、どう見ても空振りしています。
あと、ホームベースを跨いで立ってはいけません。

>更に解像度を上げて芸術的な絵に仕上げてください。

生成された画像
右上の画像の拡大(クリックで更に拡大)

よりカラフルになって、画像の品質が上がっています。
アニメらしい画像から芸術的な絵画のような画像に変わっています。
拡大した画像のバットの握りは少しおかしくなりました。

>更に背景を工夫し、細部を細かく装飾し、色彩鮮やかな美しい絵に仕上げてください。

生成された画像
左下の画像の拡大(クリックで更に拡大)

やり過ぎですね。
望み通りの画像を生成するには、入力する指示の細かい調整が必要なようです。


3.浦島太郎のイラスト

>浦島太郎のイラストを英語のプロンプトで描いてください。解像度を上げて、細かい装飾を追加し、カラフルでホログラムのように光り輝く高品質なイラストに仕上げてください。

生成された画像

1回の指示でかなり美しい画像を生成することができました。
左下の画像は竜宮城なのでしょうか。イメージが違います。

右上の画像の拡大(クリックで更に拡大)

4.ギリシャ神話のイラスト

>ギリシャ神話をテーマにしたイラストを英語のプロンプトで描いてください。解像度を上げて、細かい装飾を追加し、カラフルでホログラムのように光り輝く高品質なイラストに仕上げてください。

生成された画像

左上がゼウス、右上がアテナ、左下がポセイドンです。右下は死後の楽園エリュシオンだそうです。
ポセイドンの画像は、なぜかネオンパンクスタイルになりました。

右上の画像の拡大(クリックで更に拡大)

5.不思議の国のアリスのイラスト

>不思議の国のアリスのイラストを英語のプロンプトで描いてください。解像度を上げて、細かい装飾を追加し、カラフルでホログラムのように光り輝く高品質なイラストに仕上げてください。

生成された画像

ガイドラインに引っかかって、2枚しか生成できませんでした。
左側のアリスは、なぜか目から光線を出しています。
右側はハートの女王です。

右側の画像の拡大(クリックで更に拡大)

更に解像度を上げてみます。

>更に解像度を上げて、細かい装飾を追加し、カラフルでホログラムのように光り輝く高品質なイラストに仕上げてください。

以下が生成された2枚の画像です。

(クリックで拡大)
(クリックで拡大)

先程の画像とは、全く別のシーンの画像になりました。


6.ファンタジーRPGのキャラクターのイラスト

ファンタジーRPGのキャラクターのイラストを描いてください。解像度を上げて、細かい装飾を追加し、カラフルでホログラムのように光り輝く高品質なイラストに仕上げてください。

生成された画像
右上の画像の拡大(クリックで更に拡大)
左下の画像の拡大(クリックで更に拡大)

〇 画像からのショートストーリーの作成

ChatGPTには、以下のようなこともできます。
最初に、ChatGPTをDefaultに設定し、上の画像を入力欄にコピーして、次のようなプロンプトを入力します。
>この画像を基にショートストーリーを作成してください。

すると、ChatGPTが以下のように上の絵に基づくショートストーリーを作成して出力してくれます。

彼の名はアレクセイ。彼は幾千の年月を超えて存在する宇宙の賢者であり、光と闇、秩序と混沌、すべての元素を統べる者であった。彼の住む宮殿は、彼の力の象徴である美しい結晶と光で形成されていた。

アレクセイの宮殿の中央には、宇宙の秘密を守る魔法の杖が浮かんでいる。この杖は宇宙の均衡を維持する役割を果たしており、間違った手に渡ると大災害を引き起こす恐れがあった。

ある日、闇の力を持つ者たちが杖を手に入れるために宮殿を襲撃してきた。彼らは闇の魔法で宮殿の結界を突破し、アレクセイに挑戦を仕掛けてきた。しかし、アレクセイは数千年の経験と知識を持つ賢者として、彼らの攻撃を容易にかわし、一人一人を倒していった。

しかし、戦いの最中、一人の若き戦士がアレクセイの背後を取り、魔法の杖を手に入れてしまった。彼の名はリオン。リオンは杖の力を使って、宇宙の均衡を乱そうとした。

アレクセイはリオンに呼びかけた。「リオン、その杖の力を使えば、宇宙の均衡が崩れ、多くの命が失われることになる。君が望む力や名声は、無数の命の犠牲の上に築かれることになる。それでも、君はその力を欲しいと思うのか?」

リオンは一瞬、迷ったように見えたが、すぐに決意の表情を浮かべ、アレクセイに杖を差し出した。「私は力や名声を欲しがっていた。しかし、それが他の命の犠牲の上に築かれることを知らなかった。私は間違っていた。」

アレクセイは微笑みながら杖を受け取り、リオンに感謝の言葉を述べた。「君のような若者が正しい選択をすることで、宇宙の均衡は守られる。ありがとう、リオン。」

この出来事をきっかけに、アレクセイは宇宙の各地に平和の使者としてリオンを派遣し、宇宙の均衡と平和を守るための新たな任務を与えた。

ChatGPTの回答

>ファンタジーRPGの女性キャラクターのイラストを描いてください。解像度を上げて、細かい装飾を追加し、カラフルでホログラムのように光り輝く高品質なイラストに仕上げてください。

生成された画像
左上の画像の拡大(クリックで更に拡大)

このように、DALL-E 3は簡単な指示で美しい画像を生成することができます。


7.様々なアートスタイルが試せるプロンプト

(1) 桃太郎のイラスト

>桃太郎の物語をよく踏まえたイラストを、以下のアートスタイルでそれぞれ1枚ずつ、英語のプロンプトで描いてください。なお、左上に1から10までの通し番号とアートスタイルの名前を入れてください。
アートスタイル:
1.ネオンパンク
2.スチームパンク
3.ミニマリスティックモンスター
4.ウルトラマキシマリスト
5.サイケデリック
6.ドットアート
7.パピルカット
8.キャンディアート
9.シュルレアリスム
10.スプラッター

※なお、「桃太郎の物語をよく踏まえたイラスト」の部分を書き換えることにより、様々なテーマのイラストで試すことができます。

〇 実際の出力例

1回目の出力(1.ネオンパンク 2.スチームパンク 3.ミニマリスティックモンスター 4.ウルトラマキシマリスト)

※桃太郎が動物になっていたり、家来の種類が違ったりしていますが、アートスタイルは忠実に守っています。

左上の「1.ネオンパンク」の画像を拡大(クリックで更に拡大)

※右の建物の看板にNEON PUNKの文字が見えます。家来の数が多すぎます。

2回目の出力(5.サイケデリック 6.ドットアート 8.キャンディアート)

※7.のパピルカットの生成は失敗しました。桃太郎や家来は、色々なキャラに変わっています。

左下の「8.キャンディアート」の画像を拡大(クリックで更に拡大)

※右上に小さく黄色の8の字が見えます。真ん中の大きな猫が桃太郎なのでしょうか?

3回目の出力(7.パピルカット 9.シュルレアリスム 10.スプラッター)

※番号やアートスタイル名が欠けており、どれが桃太郎か分かりません。

左上の「7.パピルカット」の画像を拡大(クリックで更に拡大)

※桃太郎はどこにいるのでしょうか?番号もアートスタイル名もありません。

結構、プロンプトの指示通りに行かないものですね。

(2) 馬に乗る宇宙飛行士のイラスト

以下のプロンプトを使えば、連続して10枚の画像を生成することができます。

>馬に乗る宇宙飛行士のイラストを、以下のアートスタイルでそれぞれ1枚ずつ、英語のプロンプトで描いてください。なお、画像中に1から10までの通し番号とアートスタイルの名前を入れてください。Count=4*3、生成完了後にユーザーに報告しないで、そのまま次の画像生成に進んでください。
アートスタイル:

(以下は上記(1)と同じ)

〇 実際の出力例

※こちらで用意したアートスタイルは10種類なのに、12として、ファンタジースタイルの画像を生成してくれました。

最後の「12.ファンタジースタイル」の画像を拡大(クリックで更に拡大)

なお、プロンプトが長い場合は、途中でエラーが出ることがあるので気を付けてください。なお、途中でエラーが出ても、しばらくしてから履歴を見ると、ちゃんと画像生成ができていることがあります。


8.ファンタジーRPG、ギリシャ神話、七福神のキャラクターをランダムに描けるプロンプト

(1) 一人ずつのイラスト

>ファンタジーRPGのクラス、オリュンポス12神、七福神の中からランダムに4人を選んで、英語のプロンプトで一人ずつ「イラスト」を描いてください。解像度を上げて、細かい装飾を追加し、カラフルでホログラムのように光り輝く高品質な「イラスト」に仕上げてください。

〇 実際の出力例

以下のキャラクターを選択しました:
1.ファンタジーRPGのクラス:Wizard
2.オリュンポス12神:Zeus
3.七福神:Ebisu
4.七福神:Bishamonten
以下の英語のプロンプトを使用して、イラストを生成します:
(英文プロンプトは省略)

ChatGPTの回答
右下の毘沙門天の画像を拡大(クリックで更に拡大)

(2) 3人が終結したイラスト

>ファンタジーRPGのクラス、オリュンポス12神、七福神の中からランダムに3人を選んで、英語のプロンプトで3人が集結した「イラスト」を描いてください。解像度を上げて、細かい装飾を追加し、カラフルでホログラムのように光り輝く高品質な「イラスト」に仕上げてください。

〇 実際の出力例

生成された画像(魔法使いとアテナと恵比寿)
左上の画像の拡大(クリックで更に拡大)

※何度もコンテンツポリシーによって画像生成を拒否される場合は、「ファンタジーRPGのクラス」を外してください。勝手に有名ゲームのキャラクターを真似て、コンテンツ規制にかかる場合があるようです。


9.ボーカロイドの水彩画風イラスト

プロンプトを工夫しなくても、簡単な指示で高品質のイラストを描くことができます。

>ボーカロイドの少女を最高品質の水彩画で描いてください。

左下の画像を拡大

これらの画像をChatGPTに改善してもらいます。

>これらのイラストを更に美しくするプロンプトを考えて実行してください。

左上の画像を拡大

気に入った画像のプロンプト(ChatGPT上の画像をクリックすると見ることができる)を再度、入力欄に入力して画像を生成します。

>Watercolor painting of a Vocaloid girl, radiating an ethereal glow. Her features are finely detailed, and the colors are rich and vibrant, capturing a dreamlike atmosphere.

左上の画像を拡大

このように、ChatGPTに改善してもらったプロンプトを利用すれば、簡単により高画質な画像を生成することができます。
但し、あまりやり過ぎると、右下の画像みたいにごちゃごちゃした画像になってしまいます。


10.プロンプトの改善

DALL-E 3が画像生成するプロンプトを自動的に改善するプロンプトをテストしてみました。
最初に、以下のプロンプトを入力します。

1.ユーザーの指定したテーマを基に、英語のプロンプトを作成する。
2.作成したプロンプトを、更に高解像度で光り輝く美しい画像になるように改善する。
3.2を3回繰り返す。
4.ここまでに作成した4種類の英語のプロンプトで画像を描く。

(1) RPGチームのスチームパンク風イラスト

ChatGPT 了解しました。お好きなテーマを指定してください。そのテーマを基に、英語のプロンプトを作成し、それを更に高解像度で光り輝く美しい画像になるように改善していきます。そして、4つのバージョンのプロンプトで画像を生成いたします。

>RPGチームのスチームパンク風イラスト
ChatGPT 了解しました。再度、RPGチームのスチームパンク風イラストをテーマに、以下のような英語のプロンプトを作成します。

1."A dynamic steampunk RPG team posed against an industrial cityscape with towering chimneys and steam. A knight in detailed metal gear, a sorcerer with a rotating gear staff, a sharpshooter with a steam-infused rifle, and an agile thief with gear-driven grappling hooks."
訳:「そびえ立つ煙突と蒸気が立ち込める工業都市を背景に、ダイナミックなスチームパンクRPGチームが登場。細部まで作り込まれたメタル・ギアを身につけた騎士、回転するギアの杖を持った魔術師、蒸気が吹き込まれたライフルを持った狙撃手、ギア駆動のグラップリング・フックを持った機敏な泥棒。」

2回目の改善:
2."Captured in sharp detail, a steampunk RPG ensemble stands defiantly against a bustling metropolis with steam vents and cogwheel bridges. The knight, in layered metallic armor, is complemented by a sorcerer whose staff is a marvel of rotating gears. A sharpshooter, with her steam-powered rifle, readies her aim, while a nimble thief brandishes mechanical grappling devices."
訳:「スチームパンクRPGの一群が、蒸気吹き出し口や歯車橋のある賑やかな大都市を背景に、反抗的な態度で立っている。メタリックな鎧を身にまとった騎士は、回転する歯車のような杖を持つ魔術師によって補われる。蒸気ライフルで狙いを定める狙撃手と、機械仕掛けの鉤爪を振り回す盗賊。」

3回目の改善:
3."Amidst a vivid steampunk city, with airships hovering above, an RPG team is poised for action. The knight's armor gleams with interlocking plates, the sorcerer's staff whirls with active gears, the sharpshooter's rifle emits puffs of steam, and the thief, with a smirk, displays retractable gear-enhanced blades."
訳:「飛行船が上空を舞う鮮やかなスチームパンクの街の中で、RPGチームがアクションに備えている。騎士の鎧は連動するプレートで光り輝き、魔術師の杖はアクティブな歯車で渦を巻き、狙撃手のライフルは蒸気を噴き出し、盗賊はにやにや笑いながら、格納式の歯車で強化された刃を見せる。」

最終的な改善:
4."In a vibrant high-resolution frame, an RPG group embodies the essence of steampunk in a city of innovation and steam. The knight stands tall, his armor a masterpiece of engineering, beside a sorcerer whose staff is alive with moving parts. The sharpshooter, with goggles, adjusts her steam-propelled rifle, while the thief reveals an array of retractable gear tools."
訳:「鮮やかな高解像度のフレームで、革新と蒸気の街でスチームパンクのエッセンスを体現するRPGグループ。騎士は背筋を伸ばし、その鎧は工学の傑作である。その横には、動く部品で生きている杖を持った魔術師がいる。ゴーグルをつけた狙撃手は蒸気推進式のライフルを調整し、泥棒は格納可能な道具の数々を見せる。」

人数も異なり、必ずしもプロンプトに従っていないようですが、後のイラストの方が改善されていると言えるでしょうか?
個人的には、飛行船の飛んでいる3番目の画像が好きです。

(2) 月に帰る美しいかぐや姫のイラスト

「月に帰る美しいかぐや姫」のテーマで、上記のプロンプトを試してみました。

1枚目
2枚目
3枚目
4枚目

個人的には、1枚目の画像が好きです。
確かに、プロンプトは、段々長く詳しくなっていますが、生成画像は必ずしも改善されているとは言えないようです。

(3) ファンタジーRPGのチームのイラスト

今度は、GPT-V4の画像認識を利用したプロンプト改善を試してみます。
最初に、テスト対象となるイラストを生成します。
>ファンタジーRPGのチームのイラストを描いてください。解像度を上げて、細かい装飾を追加し、カラフルでホログラムのように光り輝く高品質なイラストに仕上げてください。

左上の画像を拡大(クリックで更に拡大)

上の画像のプロンプト:High-resolution illustration of a fantasy RPG team, standing heroically in a formation. The team consists of a knight clad in shimmering armor, a mage with a glowing staff, an archer with a radiant bow, and a rogue equipped with gleaming daggers. The scene is adorned with intricate designs, magical symbols, and emits a holographic glow, making the characters and their equipment shine brightly.

この画像をGPT-4Vに分析してもらい、プロンプトを改善します。
新しいチャットを開いて、GPT-4のDefaultモードに設定し、上の画像を入力欄にコピーします。
そして、以下の通り入力して、チャットにプロンプトの改善を求めます。

>この画像を分析して、更に美しいものになるように改善点を指摘してください。
ChatGPT
 この画像は既に非常に鮮やかで詳細が豊富で美しいものとしてデザインされていますが、さらに美しくするための改善点を指摘するとすれば、以下のような点が考えられます:
1.色彩バランス: 画像全体が鮮やかな色調で統一されていますが、一部のエリアに対照的な色を追加することで、視覚的な強調や深みを増すことができます。
2.光と影の強調: 光の方向や強度、影の深さをもう少し調整することで、キャラクターやオブジェクトの立体感をより強調することができます。
3.背景の詳細: 背景は非常に詳細に描かれていますが、もう少しシンプルにすることで、キャラクターたちがより目立つようになるかもしれません。
4.キャラクターの配置: キャラクターの位置や姿勢をわずかに変更して、視線の流れや物語性を強化することも考えられます。
5.テクスチャの追加: 一部のエリアやアイテムにテクスチャを追加することで、質感やリアルさを高めることができます。

最終的には、これらの提案はあくまで一つの視点からのものであり、アートやデザインは主観的な要素が大きいため、作品の目的や意図に応じて最適な改善点を選択することが重要です。

>この改善点を踏まえて、以下のプロンプトを修正してください。
プロンプト:
High-resolution illustration of a fantasy RPG team, standing heroically in a formation. The team consists of a knight clad in shimmering armor, a mage with a glowing staff, an archer with a radiant bow, and a rogue equipped with gleaming daggers. The scene is adorned with intricate designs, magical symbols, and emits a holographic glow, making the characters and their equipment shine brightly.


ChatGPT High-resolution illustration of a fantasy RPG team, standing in a dynamic and engaging formation. The team features a knight in armor with contrasting dark and light areas for enhanced depth, a mage holding a staff with intensified glowing effects, an archer whose radiant bow is balanced by subtle textured details, and a rogue with daggers that reflect ambient light. The background offers a blend of detailed and simplified areas, with magical symbols that guide the viewer's eyes towards the characters. A soft holographic glow envelops the scene, highlighting the characters and their equipment, while ensuring they remain the focal point.

再度、元のDALL-E 3モードのチャットに戻り、改善したプロンプトを入力して画像を生成します。

改善した画像(クリックで拡大)

最初の画像がごちゃごちゃしていたのに対して、少し整理されたでしょうか。鎧などの装備は、最初の方が細かく描かれていて美しかったように思います。

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?