Midjourneyに課金して二日経過しました。

ﾖﾙﾐﾁ

2023年4月12日 21:13

画像生成AIのMidjourney に課金して二日使った所感をまとめました。
ホラーが好きで、趣味でPhotoshopをつかってホラー画像を作ったり、時々なにかを納品したりしています。（本業はホラーとは全く関係ない仕事です。）

課金の動機

無料版が使い物にならなかったからです。
何度アクセスしても「混んでるから無料ユーザーは待っててね！」で、一向に生成する機会が得られず、痺れを切らしてサブスクを見たら、なんと年間10,000円前後という破格だった。

月1000円なら、趣味の出費としても相当安い。ので即課金しました。

ウェブサービスとか運営している人は商品の魅力を上げまくり、無料版にアクセスしたユーザーを辛辣に扱えば、あーら不思議！有料化！みたいな魔法が使えるのかもしれない。

使用感

使用感ははっきりいってよくない。
まずDiscordにわざわざアカウントを作らなきゃいけなかった。
Midjourneyに課金するために、discord、Midjourney、Linkという3つのサービスへの登録が必須になる。
普段使いのツール以外にアカウントが増えるのはストレスに感じた。

あと、英語がわからないとか、苦労して生成した画像の細部がぐちゃぐちゃだとか、解像度が低いとか、細かい不満はありつつ、特に大きな不満は2つ。

求める画像に必要なプロンプトが読めない
微調整ができない

というところが、自分が感じた不満のメインだった。

求める画像に必要なプロンプトが読めない

まず、僕は英語ができなくて、「本棚の隙間から目が合う」を英語に訳することができない。
なので、当然翻訳ツールを使ったりするのだけど、これが面倒。
1度や2度ならいいのかもしれないけど、まず一度や二度の生成で期待通りの画像が出てくることはまずない。（少なくとも僕の場合）

求める画像を生成するのには何回も生成する必要があるので、都度プロンプトを変更する必要があり、そこで翻訳が発生したりする。
時には中学英語レベルの単語でやりつつ、翻訳画面を見つつ、そして生成を待つ…　というこれまでになかった手間がかかる。
（ただ、この過程は面倒な反面楽しい。）

さらに、そうまでして生成した画像は全く意図しないものだったりする。

AIとの解釈違いだ。

従来のストックフォトサービスを使いなれていると、これら一連の行動はすごく手間で回りくどい上、AIの解釈違いを解消するプロンプトはわからない。
僕みたいに、Midjourney を趣味の一つで楽しもう　という人でないと扱いは難しいと思う。

商用で、バナーを作るとか、サムネを作るとか、AIとのやりとりに5時間つかって妥協するなら、他人を5時間雇いたい、という人もいるだろうなとおもった。

微調整ができない

正直なところ、本当にこれがきつい。

ぱっと見で、お！いい感じじゃん！　と思っても、

あと少しだけ顔をこちらに向けて…
バストアップではなく全身で…

みたいな差分に全く対応してくれない。

プロンプトに、Whole of body , stand up , とか追加したら、もう全く別の画像になってしまう。

もともと、バリエーションを生成する機能がついているのだけど、それを使っても上記のような差分が現れることはないし、バリエーションになると途端にディテールがめちゃくちゃに崩れて、画像として全く使い物にならなくなる。

上記の例では、バリエーション側はあきらかに顔が崩れてしまっている。
解像度を上げて生成しても崩れは治らない。

Midjouneyのいいところは

思いもよらない画像を出力してくるとこ　な気がする。
例えば、「graduation trip , japanese , high school , photo , taking picture ,scare , horror,」で生成したのがタイトル画像なのだけど、めちゃくちゃ面白い。

もっと、「JKの撮ったセルフィーが心霊写真でした」みたいのを想定したプロンプトだったのだけど、全然違うのができている。

まとめ

現時点では、自分のプロンプトをする？スキルがすごく低いし、「Midjourneyの使いこなし方」みたいなナレッジも吸収できてない。
だから、上記のような不満は限定的なものなのかもしれない。

ただ、TwitterのTLでは毎日AIのすごさに拍手喝采の状況で、それと現実を比較すると、「実際の使用感とはかなり違うのになぁ」というのが個人的な本音だった。

ストックフォトサービスなら、ユーザーが検索するであろう1語か2語の単語に対して、ちゃんと「こういうのでしょ？」というのを出してくれるし、
用意されている画像もユースケースを捉えて差分がたくさん用意されているし、色や人種、画像の種類で絞り込みがかけれる。
こういう細かいUIにとても助けられていたんだなぁと改めて思った。

このあたり、adobe fire fry は微調整ができるかもしれないと思うので、とても期待してしまってる。（事前登録して待機中）