先月末、Bingは大きなアップデートを行い、Dall-Eが新しいバージョン「Dall-E 3」にアップデートされました。
去年からMidjourneyを使っており、Dall-Eのアップデートがあるたびに試してみています。しかし、結果を見ると、やはりMidjourneyから離れられないのですが、今回はどうでしょうか。
DALL-E 3の特徴
DALL-E 3はOpenAIによるテキストから画像への変換モデルの新バージョンで、以前のバージョンに比べてより高解像度でリアルな画像を生成することができます。
また、以下の新機能が追加されています:
①アウトペインティング: DALL-E 3は、既存の画像を拡張し、シーンに新しい要素を追加したり、視点を変えたりすることができます。
②インペインティング: DALL-E 3は、画像の欠落部分を埋めたり、不要なオブジェクトを削除したり、損傷したエリアを修復したりすることもできます。
③テキスト編集: DALL-E 3は、複数の文や複雑な指示を含むテキストの説明から画像を生成することができます。
④リアルな画像の向上: DALL-E 3は、複雑または難しいプロンプトでも、以前のバージョンよりもリアルな画像を生成することができます。
⑤画像の生成が速くなりました: DALL-E 3は、以前のバージョンよりも画像を速く生成することができるため、実際のアプリケーションでの使用がより実用的になりました。
これらの新機能に加えて、DALL-E 3はOpenAIのGPT-3言語モデルとも統合されており、ユーザーはテキストの説明からより自然で会話的な方法で画像を生成することができます。
今回の実験では、同じプロンプトを使ってMidjourneyとDALL-E 3を比較してみましょう!
① 2つ以上のキャラクターを別々に理解する!
他の生成ツールでは1つのキャラクターは理解できても、2つ以上のキャラクターを理解するのは難しいです。しかし、Dall-E 3では、プロンプトで二つのキャラクターについて述べた場合、それぞれをきちんと分けて、そのように絵で表示します。
以下のプロンプトのように、左と右にどのキャラクターが、どのような服装やデザインが記載されているかを考慮して、うまく生成できるツールはどれでしょうか。
②文字を表示できます!
他の画像生成ツールでは文字を表示することはできるものの、意味のない言葉や、存在しない言語のような文字が表示されることがあります。しかし、DALL-E 3では、画像と文字を一緒に表示することができ、新たなクリエイティブな作品を制作することが可能です!
Midjourney対DALL-E 3
それでは、早速Midjourneyで使ったプロンプトをDALL-E 3でどのように生成するのか確認してみましょう!
①SELFIE
②ゲームシーン
③アニメ
④漫画
⑤ブランド商品
⑥建築
結論
どれが良いかもちろん個人差があると思いますがMidjourneyは1年間以上活動していて、取得しているデータ量がDALL-Eより多いと思う!
Midjourneyは現在5.2バージョンになっていて、DALL-Eまだ3になっていますので比較してもフェアではないとも感じています。
でも比較必用であれば下記のポイントになります↓
■Midjourney
★メリット
・商用利用OK
・どんなジャンルの絵でも上手く生成できる。
・画像の品質とテクスチャーがDALL-Eより高い!
・画像生成の速度が速い!
☆デメリット
・有料
・細かいプロンプトを理解できない時があります。
・文字を表示できない。
DALL-E 3
★メリット
・無料
・初心者向けの画像AI生成ツール。
・細かいプロントはMidjourneyより把握する。
・文字を表示できます。
・ブランド画像、漫画のが得意!
☆デメリット
・商用利用NG
・内容によるプロンプトをうまく理解できない時があります。
・画像生成のがまだ遅いです。
・画像を修正できないので外部ツール使用必用になります。
個人的な意見を聞くと個人・AI生成をテストしたいがお金使いたくない場合はDALL-Eのがベストがビジネスで使用希望企業ならMidjourneyかStable Diffusionの方がおすすめ!