見出し画像

DALL-E 3 を使ってみよう






登録・基本操作

この記事がわかりにくいと感じた場合、IT naviさんが DALL-E 3 をとてもわかりやすく解説してくださっているので、ぜひ参考にしてほしい。




とりあえず、DALL-E 3を使ってみる

OpenAI が新たにリリースした「DALL-E 3」という名の生成AIが最近話題になっている。テキストが画像に入力できたり、場合によっては Midojourney より精度が高いとか?
そんなツイートを見て、実際にDALL-E 3 を使ってみたくなった今日この頃。DALL-E 自体、半年以上使っていないので、なんだか新鮮な気分。

完全に余談だが、DALL-Eという名前の由来は、僕が好きなシュルレアリストのサルバドール・ダリとピクサーアニメ映画の『ウォーリー』(WALL-E)のキャラクター名から。

DALL-E 3 と Midjourney V5.2の比較になると思うので、参考になれば!




DALL-E 3 / Midjourney V5.2 比較

抽象的

DALL-E 3 / Midjourney V5.2
diaphanous landscapes, wihite blue and purple, abstract paintings, graphic design

個人的によく使用する「diaphanous landscapes」というおすすめプロンプト。これだけではあまりわからないが、抽象度で言うと DALL-E 3 の方が高いかも?


DALL-E 3 / Midjourney V5.2
abstract architectural drawings, abstract forms, silky material

うーん、どちらかと言えば、プロンプトに忠実なのはDALL-E 3なのか?
「abstract」なので白黒で生成してくれてるのか。



文字生成

DALL-E 3 / Midjourney V5.2
Sketch titled "Museum", with the title written in large letters at the bottom, architectural drawings, museum sketches, silky material, fluid form

どちらも2.3回か生成したが、「MUSEUM」の文字を入れてくれるのはDALL-E 3であった。Midjourney V5.2 で上記のプロンプトを試したが、文字は生成されなかった。


DALL-E 3 / Midjourney V5.2
A Japanese-style room with a hanging scroll named "YUGO", a room where a surrealist lives, a pixel-art style photo in dot style

自分の名前の掛け軸が生成できるかの検証。どちらもそれぞれ3.4回くらい生成した。「シュルレアリストの住む部屋」に対し、「ドット絵風のピクセルアートの写真」と矛盾していることをプロンプトとして入力しているが、いい感じの画像が生成できた。DALL-E 3 すごい!



生物的建築

DALL-E 3 / Midjourney V5.2
Unrealistic spinal organism-like architecture, chaotic architecture, speculative looking, noisy textured photo

どちらも個人的に好きで、甲乙つけがたい…笑


DALL-E 3 / Midjourney V5.2
abstract forms of fermented architecture, fungi, noise materials

「発酵」や「菌類」からキノコのような画像が生成されるのは想像できたが、より抽象的な「発酵」のイメージをDALL-E 3では生成できる。いいね!


DALL-E 3 / Midjourney V5.2
bird's-eye view perspective, grotesque appearance, Bio-architecture, monster fusion look, colorful and pop in the 1990s, Abstract Monster Architectural Forms

プロンプトもめちゃくちゃだが、どちらもポップな画像を生成してくれた。ありがとう。
「一見、モンスターにも見える建築っぽい何か」を生成しようとした自分としては、DALL-E 3の方が優秀である。Midojourney V5.2 はやはり、「colorful」、「monster」という単語の影響力が強く、モンスターに階段や窓が付いた画像になってしまう。

Midjourneyの「/shorten」で見ると、プロンプトの影響力がわかる



建築パース

DALL-E 3 / Midjourney V5.2
One Japanese woman standing alone in a room, a bed room, an empty apartment room, a white wall, background is white, in the style of japanese contemporary, window, scenery, curtains, lamp, indoors, sunlight, day, flower potmodular construction, zeiss batis 18mm f/2.8, high quality photo, airy and light

「女性が部屋に立っている」という指示の後に、「ベッドルーム」と入力して、その指示通り生成してくれているのはDALL-E 3だ。
Midjourney V5.2 には、Vary(Region) という強力な塗りつぶし機能があるが、それにしても、DALL-E 3とはいい友達になれそう。


DALL-E 3 / Midjourney V5.2
Tokyo in the year 2100, a city that has fallen into disrepair due to the development of skyscrapers, a tired office worker sitting on the street, a photo taken with a film camera

写実的でリアルな画像を生成するのは、Midjourney V5.2 の方が得意そう。


DALL-E 3 / Midjourney V5.2
a modern wooden home in the middle of the grass, in the style of contemporary glass, 32k uhd, minimalist purity, dutch tradition, monochrome palette, timeless elegance, outdoor art


DALL-E 3 / Midjourney V5.2
Exterior of the villa, modern surrealism style, light black and light red, graphical, muted colors, ektar magazine aesthetic

「シュルレアリスム」といったアートは Midjourney V5.2 の方が得意そう。




まとめ

DALL-E 3
初期のコンセプトや単語の連想ゲームでイメージを拡張したい画像を生成する時に使用する

Midjourney V5.2
写実的でリアルな画像を生成する時に使用する

DALL-E 3 はとても簡単に思い通りの画像が生成される。プロンプト構文のようなものを気にしなくても、大体の単語の羅列で生成できるのはとても魅力的だ。Midjouney はコンセプチュアルな画像や抽象的な画像を生成しにくいのに対し、DALL-E 3 は(生物的建築といった)イメージを拡張するような画像を生成してくれる。これは、Midjourney にはないメリットだと思う。Midjourney は良くも悪くもプロンプトに左右されやすい。また、DALL-E 3 は、テキストを入力できるので、漫画や資料作成には役立つだろう。

ここまで、DALL-E 3 のメリットを述べたが、Midjourney V5.2 にもパラメータといった魅力的な機能があり、どちらも一長一短である。

とりあえず、生成AIは使用して何に役立つかを考えることが大切である。この記事で興味を持った方は、ぜひ一緒に生成AIと友達になろう!

また、何か疑問点や困ったことがあれば、TwitterのDMを開放しているので気軽にメッセージを送ってください。サポートいたします!




おまけ:『建築と生成AI』の展示会します!


【東京でアーキディスコ開催決定!】

僕が所属している「and_d」主催の展示会「アーキディスコ」が、今度は大阪ではなく東京で行われます!

期間:11月3-5日
場所:「テリトリー・ギャラリー」東京都渋谷区千駄ヶ谷1-23-6 サンビューハイツ北参道101号室

建築におけるAIの可能性を模索し、建築として未来を語る展示にしたいので、お楽しみに!


この記事が気に入ったらサポートをしてみませんか?