AIお絵かきはいかにして一人の絵下手オタクを救ったか

2022年9月20日 19:36

前置き

この記事は技術的な解説や知見を一切含みません。ヨドコロちゃんの個人的な人生と体験、その感想を綴ったただの雑記です。
解説記事はQiitaの方に書いたからそういうのが知りたい人は良かったらそっちを見てみてね。

はじまり

人類は道具を作ることができる。あらゆる脅威を無力化し、あらゆる欲望を叶える道具を。
棒っ切れを初めて「槍」と認識したその日から、人類の歴史は道具の歴史だった。
いわゆる「AIお絵かき」は、このアプローチの延長線上にある。

そんなわけでAIお絵かきの代表例となったStableDiffusionを、このヨドコロちゃんも使ってみたのだ。
きわめて素晴らしいです。全く新しい概念であり、戸惑う人がいるのもわかる。でももうここにあるのだ。後戻りはできない。

めかにゃんこ様のファンアートをAIを駆使して錬成しました。やっっっっとあまなつちゃんっぽい雰囲気を出せた。生成500枚を超える試行錯誤の果ての成果を見て欲しい！ pic.twitter.com/HhAYicPZrk
— ヨドコロちゃん (@Yodokor0) September 17, 2022

オタクと絵画

オタクとお絵かきは切っても切れない関係にある。漫画、アニメ、ゲーム、どれも絵を扱うコンテンツだ。
小説でさえ表紙や挿絵の良し悪しで売り上げが変わるというのだから、オタクの文化は絵の文化といっても過言ではない。

ヨドコロちゃんは幼少期をファミコンと64と共に過ごし、中学時代に漫画のオタクになり、そのアニメ化を機にアニメのオタクになり、色々拗らせた結果自分でゲームを作る人になりかけたりやめたりして今に至るというまあまあ年季の入ったオタクである。
そういう人生の中で常に憧れの対象だったのが、「絵がうまい人」だった。

絵がうまい人は絵がうまい。可愛いものやかっこいいものを紙の上に表現できる。すごすぎる。ヨドコロちゃんもあれになりたい。なりたかった。
なりたければたくさん描いて練習せよという。描いてみた。楽しくない。何枚描こうが一向にうまくならないし、スケッチも色塗りも苦痛に満ちた作業だった。そうして頑張って描いても、出来上がるのはクソみたいな落書きなのだ。
何故たくさん描いて練習するモチベーションが生まれるのかと尋ねた。彼らは描くのが楽しいからだと答えた。
わからん。文化が違う！　ヨドコロちゃんは諦めた。時折思い出したように何枚か描いては苦しみ、今度こそ諦めたと宣言し、しかし結局は絵がうまい人への言葉にできないコンプレックスを腹の底に抱えたまま終わりのない畏怖と嫉妬と憧憬の日々を送っていた。

プログラミングに初めて触れた時、面白くてたまらなかった。全てを自分の思い通りにできると思った。思い付いたアイデアをコードに実装するのはとてつもない喜びだった。
しかし、他の多くの人にとってはそうではないようだった。彼らにとってプログラミングは苦痛であり、退屈な勉強らしい。
絵がうまい人にとっての絵を描くというのはこういうことなのだろうと腑に落ちた。
彼らがプログラミングの楽しみを理解できないように、ヨドコロちゃんも絵描きの楽しみは理解できないのだろう。
絵がうまい人への妬みはこのエピソードによってかなり軽減された。ヨドコロちゃんにはプログラミングがある。しかしやはり「思い通りに絵が描けたら楽しいだろうな」という羨望の意識は依然として残り続けた。

それからn年───

Midjourneyが、そしてStableDiffusionが、突如として立て続けにやってきた。
その背後にある技術はディープラーニングであり、ヨドコロちゃんもよく知っているテクノロジーの結晶だった。

Diffusion

diffusion[名]
1.拡散、発散
2.〔知識などの〕普及、流布
3.〔言葉の〕冗長さ、冗漫さ

英辞郎 on the WEB

Midjourneyはまあよくできていたが、有料サービスで、しかもNGワードや検閲Banなどの不確定要素があったので「ふーん」という気持ちだった。
登場以前からDALL-E miniという類似のサービスがもうあったし、拡張性に乏しかったからだ。
しかしStable Diffusionがオープンソースとして登場した時、本当に度肝を抜かれた。そして世界がそれに迅速に反応し次々と改良を加え始めたのを見てもう一度度肝を抜かれた。
これが扱いやすくなるまで黙って見送るのはエンジニア失格だと思った。そしてStableDiffusionをインストールし、promptを入力した。

その感触は、素晴らしいの一言だった。
場所、モチーフ、構図、画風、それらの全てを一貫性のあるプロトコルで指示すると、画像がアウトプットされる。
その全てが、ローカルで動作している！　ヤバい！
最初のモデルは二次元風の人物画が不得意だった。しかしすぐにWaifu Diffusionという改良版が生み出され、誰でも可愛い二次元美少女が高打率で描けるようになった。
楽しい。自分の力で、二次元美少女画像を生み出すことができるのは本当に楽しい。髪の色も、瞳の色も、髪形も、服装も、背景も、シチュエーションも、自由自在だ。
更にいいのは、「顧客自身がどんな絵が欲しかったのかを説明できない」問題を自然と解決していることだ。
どんなポーズを描けば「いい感じ」になるかなど素人のヨドコロちゃんが知るわけがない。Waifu Diffusionが勝手に「こんなのどう？」と提案してくれる。こっちは選ぶだけだ。エクセレント。

ファンアートを描く、それは絵下手オタクの夢　しかしWaifu Diffusionとﾌｮﾄｼｮｯﾍﾟを使えばこの通りというわけですよ。やったぜ。 pic.twitter.com/L48uVY0ywu
— ヨドコロちゃん (@Yodokor0) September 13, 2022

一方で、絵を生成すればするほど、その限界も見えてきた。「髪はピンク」と指示すればピンクにしてくれるが、一言にピンクといっても幅がある。
「ツインテ」と言えばツインテにしてくれるが、よくわかっていないのか、ただのロングヘアもしばしば出してくる。
欲しいものがはっきりしていればいるほど、逆にそこに近づけるのが難しくなっていく。
じゃあどうすればいいかというと、promptではなく画像で指示をするのだ。img2imgという機能がAIを使った「二次創作」を可能にしている。

画像で指示をする。気軽に言ってくれるが、そもそも画像が欲しくても自分で作れないからAIに頼んでるのに、なんで画像をこっちが用意せねばならんのだ。
Stable Diffusionの限界はここにあった。

本当に欲しいもの、本当にすごいものを作ろうと思ったら、結局は画力が必要なのだった。まあ当然といえば当然である。

道具は所詮道具であり、うまく扱うには結局別の技術が要る。
そしてその道具が出る前にもその仕事をしていた人は、その道具をうまく扱うためのノウハウを最初から持っている。
チェーンソーがあれば木こりでなくても木は切れるだろうが、どの木を切るか、どの角度からどう切るか、そういう知恵と経験は依然として必要とされる。
AIが「いい感じの背景」を勝手に描いてくれるようになったとしても、そこに一貫性のあるモチーフを描いたり、前後関係を繋げて漫画にしたり、そういうことは(まだ)人間にしかできそうにない。
そこには依然として「絵描きのノウハウ」「漫画家のノウハウ」が必要とされ続けているし、一朝一夕に身に付くものでもない。

AIはめちゃくちゃすごい筆、というたとえをtwitterで見たが、言い得て妙だと思う。所詮は筆。
めちゃくちゃすごい筆なので素人にもなんとなくいいものを作れてしまうが、「なんとなくいいもの」の一線を超えることはできないし、元々凄い人が使えばそれはもうとんでもないことになる。

エンジニアリング的手法が用いられていることを指して、これは創作活動ではない、という人がいるが、彼らは多分StableDiffusionを試してもいないだろう。
モデルやpromptを選定し、試行錯誤し、己のセンスを満足させるものを作り出せるまで繰り返す。これを創作活動と言わずしてなんというのか。
Midjourneyが出て来た最初期らへんの「呪文を唱えると勝手にすごい絵が出てくる」のイメージをいつまでも引きずっているのかもしれない。取り残されてますよ！
これは偏見だけど、彼らは多分、ペイントツールによるデジタル絵画が発展していた時にも同じことを言っていただろう。人の温かみがないとか言って。
今じゃCtrl+Zのないお絵かきなんて考えられないだろうに。

Stable Diffusionは、1週間で世界の在り方を変えたのだ。

神絵師の肉

さて、そんなわけで、さすがに何でも描ける夢の技術とまではいかなかったものの、「なんとなくいい絵」までならヨドコロちゃんにも描けるようになった。
その時、ヨドコロちゃんの中でずっと燻っていた「絵がうまい人へのコンプレックス」が、すっかりなくなっていることに気が付いた。

ヨドコロちゃんは、神絵師になりたかったわけではない。ただ、こういうの可愛いよね、とか、こういうシチュいいよね、という想いを、一目瞭然に"図示"したかったのだ。
ただ"図示"したいだけなのに、なんで苦しみながら何百枚も練習しないといけないんだ。CADがあるのに紙で製図するようなものだ。そんな苦労は、しなくて済むならしない方がいいに決まっている。
Stable Diffusionはその苦労を省略する手段の一つを用意してくれたのだ。

言ってみれば、義手や車椅子のようなものかもしれない。
絵を描く過程に楽しみを見いだせない人間には、画力がない、"図示"したいのに画力を手に入れる方法がないというのは、歩きたくても足がないようなものだ。
車椅子に座っていてはエベレスト単独登頂！などできないかもしれないが、自力で買い物に行くくらいはできるようになる。
Stable Diffusionを使えるくらいでは絵を仕事にすることなどできるはずがない。しかし自力で友人にちょっとしたファンアートを贈るくらいはできるようになる。
両者に何の違いもありはしない。なんて素晴らしいんだろう。もはやオタク向けの福祉じゃないのかこれ。

神絵師の肉を食べると画力が上がるというジョークがある。神絵師の絵をディープラーニングで取り込んだAIお絵かきはまさしく神絵師の肉だ。
食べれば一定の画力は上がる。上がるだけだ。それをどう生かすか、可能性を伸ばしていけるかは、結局食べた者の実力に委ねられている。
絵を仕事にしている人の平均レベルはこれから一気に底上げされることになるだろう。素人目線では、これから本当にすごい創作がたくさん出てくるんだろうなあと素朴に楽しみにしている。

世界がそんな風に変わっていくのを横目に、ヨドコロちゃんは今日も推しの絵をWaifu Diffusionに描いてもらっている。色んなお姿があるタイプの推しなのでどのお姿を描いてもらうか悩ましい。そして微妙に違う絵が出てくる度に「ここはこうなんだよ！！」と無い画力を振り絞ってわちゃわちゃしている。
人生楽しいなぁ～。みんなも神絵師の肉を食って推しの絵を描いてハッピーになろうよ。

カリンちゃんverのファンアートもAIに描かせたよ。　めすがきっさの輝ける星！　これはどう見てもめかにゃんこ様ですよね。ヨシ。 pic.twitter.com/AgGDZH8xWs
— ヨドコロちゃん (@Yodokor0) September 18, 2022

おわり。