見出し画像

DALL-E 3対Midjourney: 競争相手としての登場?驚きの実験データ

先月末、Bingは大きなアップデートを行い、Dall-Eが新しいバージョン「Dall-E 3」にアップデートされました。

去年からMidjourneyを使っており、Dall-Eのアップデートがあるたびに試してみています。しかし、結果を見ると、やはりMidjourneyから離れられないのですが、今回はどうでしょうか。

DALL-E 3の特徴

DALL-E 3はOpenAIによるテキストから画像への変換モデルの新バージョンで、以前のバージョンに比べてより高解像度でリアルな画像を生成することができます。

また、以下の新機能が追加されています:

①アウトペインティング: DALL-E 3は、既存の画像を拡張し、シーンに新しい要素を追加したり、視点を変えたりすることができます。
②インペインティング: DALL-E 3は、画像の欠落部分を埋めたり、不要なオブジェクトを削除したり、損傷したエリアを修復したりすることもできます。
テキスト編集: DALL-E 3は、複数の文や複雑な指示を含むテキストの説明から画像を生成することができます。
リアルな画像の向上: DALL-E 3は、複雑または難しいプロンプトでも、以前のバージョンよりもリアルな画像を生成することができます。
画像の生成が速くなりました: DALL-E 3は、以前のバージョンよりも画像を速く生成することができるため、実際のアプリケーションでの使用がより実用的になりました。

これらの新機能に加えて、DALL-E 3はOpenAIのGPT-3言語モデルとも統合されており、ユーザーはテキストの説明からより自然で会話的な方法で画像を生成することができます。



今回の実験では、同じプロンプトを使ってMidjourneyとDALL-E 3を比較してみましょう!

① 2つ以上のキャラクターを別々に理解する!

他の生成ツールでは1つのキャラクターは理解できても、2つ以上のキャラクターを理解するのは難しいです。しかし、Dall-E 3では、プロンプトで二つのキャラクターについて述べた場合、それぞれをきちんと分けて、そのように絵で表示します。

以下のプロンプトのように、左と右にどのキャラクターが、どのような服装やデザインが記載されているかを考慮して、うまく生成できるツールはどれでしょうか。

プロンプト
A young woman in the left in a flowing white gown and a wise old wizard in the right in a long blue cloak standing on a clifftop, looking out at a vast ocean of clouds.

Midjourneyでは全体的にイメージできたがキャラの位置を見るとDall-E 3が勝ち!

②文字を表示できます!


他の画像生成ツールでは文字を表示することはできるものの、意味のない言葉や、存在しない言語のような文字が表示されることがあります。しかし、DALL-E 3では、画像と文字を一緒に表示することができ、新たなクリエイティブな作品を制作することが可能です!

プロンプト
The words "Every apple has a story" in between Newton and Steve standing side by side. Newton, with thick curly hair and 17th-century attire, holds a red apple. Beside him, Steve, in his iconic black turtleneck and glasses, holds a sleek iPad.

MidjourneyがリングとiPadがなんとなくイメージできたが
Dall-E 3を見ると完璧出来たではないでしょうか!

Midjourney対DALL-E 3

それでは、早速Midjourneyで使ったプロンプトをDALL-E 3でどのように生成するのか確認してみましょう!

①SELFIE

プロンプト
lots of young and cute boys taking a selfie while smiling and having fun in Shibuya, hyper realistic photograph, hyper detailed, wide angle, Directional Light, Soft Lighting, Cinematic Hyperrealistic, 8k, Extremely Detailed, Panoramic, Dramatic, Landscape , realistic, cinematic light , 8k

Midjourneyの方が顔のバリエーションができました。

②ゲームシーン

プロンプト
Barbarian in cold scenario carrying a flippy axe, muscle, wearing helmet with horns, in front of him a big dragon throwing fire from its mouth, surrounded by powerful enemies, cinematic light, 8k, hyper detailed, like a game promotion poster design

ビジュアル的にDALL-Eのがかっこいいが元々希望キャラクターの位置など
バトルっぽくなくてMidjourneyの勝ちです。
※ツールによる理解できない言葉あるのでもしかして今回その理由でした。

③アニメ

プロンプト
cover for the art v comic, in the style of chromatic aberration, close-up intensity, light gray and dark crimson, prismatic portraits, raw versus finished, neo-mosaic, anime-influenced

残念ながらこちらではMidjourneyのが勝ち!

プロンプト
anime characters with superhuman elemental powers, in the style of chinese calligraphy influence, shining colorful colors, harajuku style, super thick online, black outline, official art, interactive, like anime magazine design style

アニメキャラクターのコンセプトできているがDALL-E 3の方が
ゲームキャラに近いと思います。どっちでもクオリティー高いと感じます。

プロンプト
anime wallpaper, girl animated, anime, anime wallpaper, in the style of dark turquoise and light green, hyper-realistic pop-art fusion, luminous lighting, fluid and organic, vibrant portraits, neon art nouveau, light green and amber

DALL-Eが一部の色とスタイルが理解できなかった気がする。でもデザインがかっこいい!

プロンプト
A photograph of a girl embarrased expression face, cant look at the viewer, 8k, hyper detailed, hyper realistic photograph, amazing shot, manga anime style

コンセプトができたが漫画・アニメスタイルが理解できなくて、DALL-Eもしかして
最初に書く文字しか把握できない可能性が高いと感じました。

プロンプト
anime chibi chara boy and girl, anime world, firecore, systems art, forced perspective, full body, vector, flat, white background

ちびキャラができたがコンセプトではMidjourneyの方がきちんと描いている!


ちびキャラデザインのプロンプトでエラー画像が何回も表示しました。
プロンプトはそんな難しくではなかったのでちびキャラコンセプトないのかしら。

④漫画

プロンプト
[cute vampire chibi character] comic strip with animated cartoons in strips, in the style of pop culture mashup, pop art satire, vampire teeth, playful expressions, dark atmosphere

二つのツールともコンセプトが理解できているが漫画と漫画と考えたら
Midjourneyの方がクオリティー高いだと思います。

プロンプト
A photograph of a sexy man smiling to viewer, design like BL style, 8k, super thick outline, black outline, hyper detailed, hyper realistic photograph, amazing shot, manga anime style,

DALLEはBL漫画のコンセプトが完璧すぎて驚いた!

プロンプト
design like a korean girl wearing 90s pop style colorful clothes, webtoon manga anime style, 8k, like manga poster, like paint in the wall as background

Midjourneyの方が可愛いがプロンプトの内容を見るとDALLEの方がきちんと表しています!

⑤ブランド商品

プロンプト
LOREAL :: 1 liquid eyeliner LOREAL > text product photo, High Details, HD, on white background front view, shot with Kodak gold 200, Spell words precisely

Midjourneyで上の画像ができるまでに結構時間がかかりますがDALL-Eは
一回だけでこんなアーティスティックな広告できていて素晴らしい!

⑥建築

プロンプト
architecture, japanese modern design house, in front of the sea, 8k, hyper detailed, real state promotion image

こちらではどっちでも行ける都思います。その後どこまで細かく必要による
プロンプトを修正すれば良いだと思います。

結論

どれが良いかもちろん個人差があると思いますがMidjourneyは1年間以上活動していて、取得しているデータ量がDALL-Eより多いと思う!
Midjourneyは現在5.2バージョンになっていて、DALL-Eまだ3になっていますので比較してもフェアではないとも感じています。

でも比較必用であれば下記のポイントになります↓

■Midjourney

★メリット
・商用利用OK
・どんなジャンルの絵でも上手く生成できる。
・画像の品質とテクスチャーがDALL-Eより高い!
・画像生成の速度が速い!

☆デメリット
・有料
・細かいプロンプトを理解できない時があります。
・文字を表示できない。

DALL-E 3
★メリット
・無料
・初心者向けの画像AI生成ツール。
・細かいプロントはMidjourneyより把握する。
・文字を表示できます。
・ブランド画像、漫画のが得意!

☆デメリット
・商用利用NG
・内容によるプロンプトをうまく理解できない時があります。
・画像生成のがまだ遅いです。
・画像を修正できないので外部ツール使用必用になります。

個人的な意見を聞くと個人・AI生成をテストしたいがお金使いたくない場合はDALL-Eのがベストがビジネスで使用希望企業ならMidjourneyかStable Diffusionの方がおすすめ!

AI生成ビジネスなら合同会社MetAIにお任せ!
自分のビジネスでAI生成を利用必用場合はぜひ弊社合同会社MetAIにお任せてください!テキストだけではなく、画像、動画、音声、音楽などコンテンツは国内初対応可能企業です!
お問い合わせは debitto@met-ai.jp までにご連絡お願いいたします。

Twitter:https://twitter.com/debichanchan
Instagram:https://www.instagram.com/metaijp/

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?