Midjourneyで画像生成やってみた!!
今日は「Midjourney」というAI画層生成サービスを紹介してみたいと思います。画像生成サービスと言えば以前「DALL-E2」を紹介してみましたが、AI画像生成サービスはたくさんあるので、そちらもちゃんと体験してみようということで察sp区レポートしてみたいと思います。
Midjouenerって何?
Midjourneyはテキストの説明文から画像を作成するAIプログラムで、同名の研究所がサービス提供をしています。DALL-E2に送れすことわずか2ヶ月くらいの2022年7月13日にオープンベータ版が公開されています。
MIdjourneyはコミュニケーションサービスであるDiscode上で動作するため、Discodeでのアカウント作成が必須になります。
Midjourneyは美しい画像を生成することが出来ますが、その学習にはインターネット上にある様々なイラストレーターの作品が使われており著作権に関する訴訟も抱えているようです。
Midjourneyをはじめてみる
Midjourneyを利用するにはDiscodeが必要
MIdjourneyを利用するためにはDiscodeのインストールをあらかじめしておく必要があります。
今回はDiscodeのインストールは省略しますが、認証や名前表示のための項目くらいで、登録しないといけない個人情報はあまりないので利用のハードルは非常に低いツールです。Webバンでも使用できますし、WindowsやMac、Chromebook、iPhone、Androidそれぞれのアプリもあります。
MidjourneyのWebサイトから登録
とはいえ、Midjourneyの利用を開始するためにはMIdjourneyのWebサイトから始めます。
以下のようなサイトが表示されますので、右下の
右下にある「join the beta」をクリックします。
Discodeが立ち上がり、以下の招待画面になります。「招待を受ける」バーをクリックして先に進みます。
ロボットではない確認をして先に進むと、以下の画面になります。2つの質問(性別と住んでいる地域)がされますので回答します。
Discode上のMidjourneyのサーバー画面(チャンネル的なもの)が表示されます。
ここから実際に利用するには画像を生成するボットが仕込まれたルームに参加しないといけません。
「NEWCOMER ROOMS」に数字がついたいくつものルーム(newbies-XX)が表示されますので、それらのどこかに入室してください。
入室するとチャットの画面になります。
他の人と共通の部屋になりますので、プロンプトの文章も作ってもらった作品もすべて公共の場にさらされることになります。恥ずかしい内容や公共の利益に思いっきり反するリクエストはしないほうが身のためです。
プロンプト(指示文)を投入する。
Midjourneyは日本語対応はしていません。ですからMidjourneyに対するリクエスト(プロンプトと呼ぶらしい)は英語で入力しないといけません。英語がわからないという人はDeepLとかGoogle先生の準備をしておきましょう。
DALL-E2と比べてみる
プロンプトは具体的であればあるほど、的確なイラストが生成されます。
でも、まずはDALL-E2との比較もあるので、DALL-E2で使った言葉を使ってみます。
「老朽化した大型タンカーが海に沈む様子(A dilapidated large tanker sinking in the sea)」で生成してみます。
ちなみにDALL-E2で生成した画像はこんな感じになりました。
この英文をDiscodeのテキストチャットに入力してみます。
まずは「/imagine」とチャットに入力します。
「/imagine prompt:」と表示されるのでその後ろに英文を入れます。
チョットこの辺はDALL-E2よりも厳しいですね。
文系バリバリな人はコマンド的な入力を極端に嫌う傾向がありますので、ちょっとこれは壁かな・・・・と感じます。
しばらくするとボットから返事がありました。
DALL-E2と比べてみましょう。
・・・他の人の作品の人物の美しさに比べると微妙な感じです。MidjourneyはWeb上のイラストレーターの作品を学習しているので、ネタが少なそうなイラストは厳しいのかもしれません。とはいえもう一回リクエストしてみました。
イラストの下のリロードを押してみました。
美しい絵ではあるのですが、いまひとつタンカーっぽくないですね。
得意そうな分野のプロンプトにしてみる
すこし、色々やってみましたがあまり成果が出てこないので、一旦諦めることにします。
今度はおそらくネットにあふれているであろう「美少女」ものでやってみたいと思います。
人格が疑われない程度のプロンプトにしてみました。
神社の前にいる高校生位の年齢の美少女で和服を着ています。
A beautiful girl of high school age in front of the shrine, wearing Japanese clothes.
さっそくやってみます。
ワクワクしますね
出来上がりました!!
DALL-E2は本物のサルバトール・ダリとは違う可愛いけどシンプルなイラストを描いてくれましたが、Midjourneyは本当のプロみたいなクオリティです。・・・・人間の絵師と同じように得意不得意があるのかもしれませんね。
ほんとえげつないクオリティです
ちなみに同じプロンプトをDALL-E2に投入したら、こんな感じになります。
感想
今回はDALL-E2に続いてMidjourneyというサービスで画像生成しましたが、気がついたのは2点ですね。MidjourneyはDiscode上でコマンドを叩いて使用するので、いまのところはハードルが高いです。(それでも簡単ですが)
それとジャンルによっては非常にクオリティが高いイラストが出来上がります。やはり学習した画像によってかなり性格というか特徴がでるようです。このへんは人間と同じですね。
おそらくサービスごとに得意ジャンルや画風が分かれてきて、利用者はそれを意識しながらサービスやメニューを選ぶ事になりそうです。
いらすとやの画像をひたすら学習させた「いらすとやAI」なんかが出たら面白そうですね。