見出し画像

コラム Preliminary Sketch AIと遊ぼう 其の伍


 この連載企画の4回目からかなり時間が経っていて、気がつくとちょうど本日で一年になりました。
 生成AIを取り巻く環境はこの一年の間に劇的な進歩を遂げています。一年前はPCやGPUなど生成環境を整えるのが結構大変だったのですが、今はスマホとChatGPTでガシガシ生成出来るようになりました🤣
 という事で今回の企画はChatGPTの開発元であるOpenAIの高性能な画像生成AIのDALL-E3を、しかもスマホで触ってみようって企画です。(昨年やったスマホのAI生成画像とは比べ物にならないくらい進化していてビックリですよ!)
 今回紹介するOpenAIのDALL-E3も以前ここでも紹介したイギリスのスタートアップ企業Stability AIが開発した画像生成AIサービスのStable Diffusionと同じくDiffusion Transformer(拡散トランスフォーマー)という仕組みを用いて、精密な絵を描くのが得意なコンピュータープログラム(AI)です。
OpenAIにマイクロソフトが出資している関係もあってか、マイクロソフト謹製のウェブ閲覧アプリケーションのEdgeや検索エンジンのBingでChatGPT-4やDALL-E3が利用出来るのもありがたいです。そのお陰で、一年前みたいにGPUなどのパソコン周りの環境を整えなくても、手持ちの安価なパソコンやスマホで高画質な画像生成が可能になりました。
 
 という事で早速やってみましょう!
 まずは、スマホで(Androidにて説明しますね) PlayストアでBingを検索します。見つけたらインストールします。下にそのスクリーンショットを表示します。
 私は既に入れているので「アンインストール」「更新」と表示されていますが、初めての人は「インストール」という大きなボタンのみが表示されているはずですので、クリックしてください。

Playストア内のBingアプリ

 インストール完了したらBingを開いてみましょう。開くと文章で「AIを使用して単語から画像を作成する」と書いてある大きなボタンがありますので、それをクリックします。すると下のようなCopilot | デザイナーの画面が表示されます。
この上の入力欄に自分が描き出したい画像について具体的に文章で説明を入力する事でAIによって画像だ生成されます。
最初のうちは思い通りの絵が生成されないかも知れませんが、説明を追加したり変更したりを繰り返していると、やっているうちにだんだんコツがつかめてきて欲しい絵が生成出来るようになると思います。

Copilotの画面

 では文字の入力欄にとりあえず「夏のお花畑でミニチュアダックスと戯れているおさげ髪の女の子を描いてください。」と入力してみます。
 そしたらそのまま下の「作成」ボタンを押して絵が生成されるまでしばらく待ちましょう。すると以下の4枚の絵が生成されました。

 ちゃんとミニチュアダックスとおさげ髪の女の子が生成されましたね。
ただし、絵のスタイルとか何も指定していないのでそれぞれ画風が全然違う描き方をされてしまいました。
 では次に「夏のお花畑でミニチュアダックスと戯れているおさげ髪の女の子をアニメのセル画スタイルで描いてください。」と修正して入力してみます。すると、生成された4枚は以下のような絵になりました。

 ちゃんと指定した「セル画スタイル」を反映して生成されていますね。
 こんな感じで細かい指示を付け加えていく事でより自分の欲しい絵に近づいていきます。
 あと、指示(実はプロンプトという呼び名があります)が日本語で入力出来るのが嬉しいですね。また、文章じゃなくても箇条書きで条件を書いて入力する事でも全然大丈夫です。
 まあ、以前紹介したStable Diffusionなんかは英語でプロンプト入力するのが標準ですが、コレも英語で入れても同じように生成します。(実は仕組みとして日本語入力したものを内部で英語に変換してDALL-E3に送っているので、その分英語の方が的確な指示が出来る可能性もありますね)
 さて、ここnoteで自分が書いている『小説-DAWN OF AKARI-奏撃の い・ろ・は』

の主人公”AKARI”を生成AIで描いてみましょう。
プロンプトは英語で条件を羅列しています。

black outfit, best quality, beautiful mature woman, short hair, black hair, purple eyes, Right eye with visual recognition device eye patch, simple clothes, tactical gear, full body (Head-to-toe) shot, postapoAI, Trigger, Apocalypse, cel-shaded anime aesthetic.

って感じです。


まあ、全体的な雰囲気はこんなイメージですよね❤️
アイパッチの部分の生成はイマイチでまだまだ思い通りじゃないですが、ご愛嬌でお願いします🤣

 で、実はこれプロンプトを条件羅列でやったんだけど、文章化して入力すると何故だかキャラクターの性格が変わる気がします。条件羅列だとツンデレな感じで文章化するとおとなしい感じのお上品なキャラクターになっちゃうんですね。何ででしょう?🤣
 以下が文章化したプロンプト

"Generate an image of a beautiful mature woman with short black hair and purple eyes. She is wearing a black outfit consisting of simple clothes combined with tactical gear. The image should be a full body (head-to-toe) shot in a post-apocalyptic setting. Her right eye has a visual recognition device eye patch. The style should be a cel-shaded anime aesthetic."

 これだと生成結果はこうなります。

 お目ぱっちりの、あまり陰を引きずってない素直な女性像ですね🤣🤣
 まあ、条件項目の順番もあるのかな?とりあえず違いが出るのがわかったので今後の参考にします。
 とまあこんな感じで誰でもDALL-E3のAI画像生成は簡単にやれるので是非ともチャレンジしてみてくださいね。 ではまた次回に❗️


この記事が気に入ったらサポートをしてみませんか?