画像生成AIを使って思ったこと

2023年7月30日 08:29

生成AIというと「プログラマーいらなくなる」だとか「デザイナーいらなくなる」だとか好き放題言われがちだ。

自分はプログラマーなのでプログラマーがいらなくなるわけではないと感覚値でわかるが、デザイナーはどうなのかな？と思って画像生成AIを10時間以上試してみた。

その中で見えてきたことをまとめる。

無限のパラメータが出力に与える影響を身体で覚える必要がある

生成AIというといかに効果的なプロンプトを知っているかで差別化されるように思われがちだ。
しかし画像生成AIにおいてはLORA、ControlNetにSampler、Step数、ImageToImageにStrength、Negative Promptと設定可能な項目は無限にある。
こうした各設定の違いを文章で理解することにほぼ意味はない。たとえば『マスピ顔』という言葉があるが、これはプロンプトにmasterpieceを入れたときにありがちな顔のことだ。
同じようにこの設定だとこんな感じのアウトプットになるよねってのを、無限の試行錯誤を繰り返して身体で覚えていく必要がある。

さらにその挙動がモデルによっても大きく変わっていく。
それも1回の試行錯誤に何十秒かかかるから、かけた時間に比例してスキルが上がっていく愚直な世界だ。

もちろん自分で絵を描くより参入障壁は低い

もちろん、自分で絵を習って描けるようになるのには何年もかかるため比べ物にはならない。
画像生成AIはガチャであたりさえ引けば初めてでも良い絵は出力できるし、10時間程度でも最初よりだいぶ癖がわかってきたのですごく簡単にスキルが身に付く世界ではある。

とはいえGoogleアカウントの作成がビジネスになってるように、その10時間をかけるよりお金払って誰かに頼んだほうが良いって人が世の中の大半だ。
つまり今までより格段に敷居は下がるが、欲しい絵を誰かに依頼する風潮は変わらないだろうなと思う。

生成AIが苦手なもの

生成AIはなんとなく遠目で見たらそれっぽい絵は出力できるが、細部もちゃんと描こうとするとハードルが格段に上がる。
指の数は有名だが、ボールとか、動物とか、要素が増えれば増えるほどどこかで違和感のあるものができあがりやすい。
要素ごとにガチャで正解を引く必要がある感じだ。

なので人が沢山いる絵とか、ハグとか殴り合いみたいに人が重なり合う絵とかで、違和感のない絵を出力するにはとてつもないハードルがある。
（すごいAI絵師はどうやってそうした画像をAIで作ってるのか知りたい）

あと画像が大きくなればなるほど時間もかかるし要素が増えるので、ハードルは上がっていく。

結局Photoshopは使えたほうが良い

「白目剥いてるけど他は完璧」「指が1本多いけど他は完璧」「この黒い斑点だけ消したい」みたいなときに自分で修正できたほうが良いので、結局Photoshopなどのスキルはあったほうが良いと感じた。

こだわらない力

どちらにしろ脳内に欲しいイメージがあってその通りに出したいってときはあまり使えない。
本当に絵心全くない人がデザイナーに発注するように、「田舎で働いてる人たちの絵が欲しい」と打ち込んで、「おーこれこれ！」と思ったり、「なんか違うなぁ」と思うぐらいがちょうどいい。

著作権問題

脳内イメージがあるときに手っ取り早くそれを実現するのはそのイメージ通りの写真や絵を元にImageToImageする方法だ。

たとえばデザイナーとして発注受けて「こんな感じの絵が欲しい」って言われたらその絵をImageToImageしたくなるなーと思うと、著作権問題につながりやすそうだなと感じる。
まぁもともとトレパクなんかはよく言われる問題ではあるので本質は一緒だけど、生成AIでもそれは変わらなそうだ。

まとめ

なんだかんだハードルはあるから画像生成の民主化は起きなよね、と思いつつハードルは低いのでクラスに何人か画像生成AIが使いこなせる人がいる感じにはなりそう。

と思うとデザイナーを雇わなくても画像生成AI使いこなして生成できる人がなんとなくいる、みたいな世界線にはなりえるか。

それに従来の比ではないぐらい生産性は上がってるし参入障壁は下がってるので、１画像あたりの単価は間違いなく下がるだろうな。

とはいえ少なくとも画像生成AIを使いこなせる人は重宝されそうではある。