昨今流行りのお絵描きAI

ジョルダン乗換案内【公式】🚉

2022年11月9日 16:47

乗換案内「エンジン」担当です。

宝塚歌劇団宙組トップスター、真風涼帆さんの退団が発表されました。いつかはくることですが、喪失感でいっぱいです…😭

さて、本日の話題は、ここ数か月noteやTwitterを騒がせているお絵描きAIについてです。
AIは弊社の本業ではないですが、弊社もIT企業なのでAIやNFTなど、最新の技術動向には無関心でいられません。

お絵描きAIがどういう技術なのかについては、ここでは触れません。
ここではイチITエンジニアからみたお絵描きAIについての所見について書きますので、かる～い読み物程度に思っていただければ。

お絵描きAIってなーに？

絵を描くAIは、サービスとしても以前からありますが、ここではこの数か月で話題になっているお絵描きAI（DALL E2、midjourney、Stable Diffusion）についてです。

これらお絵描きAIが話題になったのは、次の要素が大きいと思います。

お絵描きAIが一般公開され、SNSにAIで描かれた人目を惹く絵が大量に投稿された
テキストで指定して絵が出力されるという手軽さ

もともと日本では、Twitterが絵の投稿先として主流なSNSになっていたこともあり、注目されたというのはあると思います。

物は試しというか、実例を。

この記事の見出し画像、真っ赤に燃える紅葉がキレイですね。
これ、AIです。

DALL E2に「photography of Cherry Blossom, very up, bluesky background, japan, photo magazine」と指定して生成させてます。

これは写真風ですが、それ以外にもゲームのコンセプトアートのようなデジタル絵や、油絵、水彩画、ゴッホ風やルノワール風の絵、漫画やアニメ風の絵など、様々な風合いで絵を描かせることができます。

いくつかDALL E2とmidjourneyで描いた絵を載せてみます（Stable Diffusionはあまり良い絵がなかったので割愛…）。

そのほか、下絵を入力して絵を完成させる機能(image2image)や、絵柄を学び直す機能(ファインチューニング)があります。

と、絵心のない私でもこのような絵を作れるようになるのがお絵描きAIです(AIに出力させるのを作るというのか？という議論はありますが😅)。

お絵描きAIのここ数か月の動きまとめ

これらお絵描きAIが一気に大衆化したのは、2022年8月初頭からです。
そのあたりの動きをGoogleトレンドで追ってみます。

Googleトレンドでmidjourneyが一気に上がっていますが、これが8/1～3にかけての動きです。
このあたりでTwitterにmidjourneyで生成された絵の投稿が増え、その精細さが注目されました。
このころにはmidjourneyの始め方などの記事が出始めており、私もそれらを参考に遊んでいました。

8/22にはStabiility AIがStable Diffusionをオープンソース化したこと、midjourneyでは難しかった作風がStable Diffusionではできるという投稿もあり、Stable Diffusionのトレンドが上がっています。

8/31には、アメリカでデジタルアートのコンテストにて、AIが描いた絵が優勝して賛否両論の議論が生じました。

8月から9月頭には、Kindleで個人が出しているAI画集が早々と登場。
9/22には、日本初(Amazonで取り扱う商業出版の紙書籍版として)のAI画集が発売されています。

10月下旬時点のトレンドは、NovelAI Diffusionになります。
これはオープンソース化されたStable Diffusionを使っており、二次元絵に強いという特徴があります。

そのほか、今のトレンドとしては、言葉を指定して動画を生成するAIなんてのもすでに出てきてます。

Stable Diffusionの衝撃

エンジニア的には、Stable Diffusionのオープンソース化の衝撃が大きかったです。

これ、何がすごいかっていうと、お絵描きAIのサービスを自分で構築できるようになるところなんです。

実を言えばmidjourneyやDALL E2のようなサービスを作り上げることは、原理上はだれにでも可能です。
もともと人が作ったものなので他人にも作れない理由はありません。

しかし、実際にそれを行うのは難しいでしょう。
たとえばStable Diffusionは20億枚もの絵を学習させているといわれています。ほかにも学習には256台ものGPUを使っているそうです。
これだけの環境は容易には準備できません。

そこまでして作ったプログラム、データなのですから、通常は秘中の秘です。
DALL E2やmidjourneyにしろ絵を描くAPIは公開していても、絵を描くAIの中心部分は公開していません。そこが彼らがお金を儲ける場所だからです。
私たちジョルダンも乗換案内のAPIは提供していますが、ソースやデータは保護しています。そこに資金を費やし、そこから売り上げをあげているからです。

Stable Diffusionはそれをあっさりと無償で公開しました。
これには開発に関わったStability AI社のCEOであるエマド・モスターク氏の信条（技術が誰にでもオープンで公開されている場合にAIは人類の課題を解決する）によるもののようです。

要は開発会社の中でしか使えないと、開発会社が意図したことしかできないが、誰でも使えるようになれば、誰かが思いもよらないことをやってくれて、それこそが進化である、ということですね。

それにより通常、GoogleやMeta(旧Facebook)といったIT大手やAIに特化して巨大な資金を調達したベンチャーでないと作れないお絵描きAIが誰でも作れるようになりました。

事実、Stable Diffusionが公開されてから、それを使ったサービスが続々と誕生しました。

AI画像生成サービスが安価にできるということは、画像生成AIを作れる企業の特権的地位が崩壊し、サービスの競争が激化することを意味します。
単に絵が描けるAIというだけでは市場的価値はなく、どういう付加価値のある絵を描かせるかや、どういう場面で使わせるかといった点での競争が必要になってきます。

今はまだNobelAIのように特色はあるが絵を描くAIの域を出たサービスはありませんが、今後、様々な人々・企業が使うにつれ、今は存在しないようなサービスが登場するかもしれません。

AIが絵を描く時代に人はどう向き合うのか？

さて、今お絵描きAIをめぐる議論には下記のようなものがあります。

お絵描きAIは絵描きの仕事を奪うか否か？
AI絵を出力する専門家（プロンプトエンジニア）は成り立つか？
絵をAIに学習させるのは著作権を侵害しているのではないか？
AIが出力した絵の著作権はどうなるのか？
AIが出力した絵の責任はだれがとるのか？
AIが描いた絵に価値を認めるのか？
人間が描いた絵を基にしたAIで商売することの倫理性は？

一つずつエンジン担当の見解を書いていくと文量が増えちゃうので、ここでは上2つについての見解を述べたいと思います。

お絵描きAIは絵描きの仕事を奪うか否か？

奪わないと思います。
ただ、市場は狭まるので生存競争がシビアになるとは思います（それを奪うというなら奪う）。

お絵描きAIと絵描き（絵を描くことを稼業とする人の総称）を絵を作成する商業サービスという観点で比べると、お絵描きAIには、以下の特徴があります。

手軽
- 絵を描くスキルが不要
- 絵描きを探したり、頼み方を調べたり、交渉もいらない
安い
早い
そこそこの品質
- AIの描く絵は精細ではありますが、人の手がおかしいなど細部はおかしいところがあり、それらは人なら間違えないところです
- その品質コントロールが難しいという意味で「そこそこ」です

まるっきり冷凍食品かインスタント食品ですね。あるいはファストフード。
じゃあ、高級レストラン無くなっていますか？というのがこのセクションの問いの答えです。

なくなっていないです。
なので、人じゃないと描けない絵の市場、この仕事はあなたに任せたいといわれる人は大丈夫でしょう。

逆に言うと、インスタントでいいよ（そこそこだけど、手軽で安くて早いい）というレベルの市場は狭くなります。
（たとえば、アイコン作成、YouTubeのサムネなどの作成など）

また、早い・安いの強みを持つサービスは、必然的に量をこなすことができます。

学習元になる絵だけ数枚～十数枚描いてもらって、あとはファインチューニングしてその作風の絵を生成するというのも可能なので、一定の作風で大量の絵を要する業種というものがあれば、そうした業種向けのサービスが成立しうる余地はあるかなと思います。

たとえばですが、いらすとやのように特徴的な作風を持つフリー素材集や、ライトノベル・新文芸のイラスト生成サービス、ゲームのアセットは成り立つ可能性があります。

そうしたサービス向けに基になる絵を描く人というのが絵描きの一種として成り立つかもしれません。それが成り立つなら基になる絵＝データセットを売り買いするマーケットプレイスもでてくるでしょう。

また今は「人間が描いてこそ」と思われているものも、実は人間が描く必要はないものも少なからずあるはずです。
そうしたものはいずれ、これまではイラストレータなどに依頼してたけど、社内のだれかに任せればいいや的な感じになります。
こうした実は人が描く必要がなかったレベルの市場も徐々に狭まっていくと思います（一部はすでにフリー素材に置き換わってるかも？）。

AI絵を出力する専門家（プロンプトエンジニア）は成り立つか？

現状、AIに狙った絵を描かせるには、指示する文章を練りこんで、あとは運任せみたいなところがあり、実は結構難しいです。

ここではその難しい作業をこなすプロンプトエンジニアを「依頼主に代わってAIに指示をして絵を出させる専門家」とし、それが職業が成り立つかを考えてみます。

以下の理由で成り立たないのでは？と思います。

職業としての専門性が低い(私見ですがExcel程度)
- だれでも始められ、やり直しが容易
- 知見がネットに蓄積している（もうすでに入門書もある）
- プロンプト生成サービスの発展の方が早い（すでにそういうサービスはある）
- プロンプトだけでなく、絵を清書できるので、落書き程度の絵でもそれなりの絵が得られる
- AIに求められるインスタントなニーズに対して、そこまで高度な絵が要求されない
AIの早い、安い、大量というメリットは、既存の絵描きも授受でき、上位互換となる
- 絵を描くスキルが高いので、AI絵の出力も品質が安定するし、加筆・修正のスキルもあるのでさらに品質が高い
- 自分の絵柄を学習させれば絵柄を安定させて大量に作れる
- ゆえに「品質はそこそこだけどAIでいいなら、早くて安くしますよ」が成り立つ
- 早い、安い、大量に加え、絵を描くスキル＋その人ならではの作風もあり、完全にプロンプトでしか絵を描けない人の上位互換となる
- 今は心情的な反発もありますが、それが落ち着けばAIを作画のサポートにする絵描きさんはでるでしょう
人でないと駄目な絵は、これまで通り絵描きが受注する

成り立つ要素を考察すると、下記でしょうか。

私の想定以上にプロンプトの作成が高度に専門的かつ、出力結果に人間の思考の介在余地があり、専門家として成り立つ
人間はものぐさな生き物なので、プロンプトを練るのが面倒でそこも人任せにしたい需要が想像以上に高い
- ただし、その場合、あまり高単価な職種にはならないと思います
- 「言葉で指示する」が別の入力行為に置き換わる方向に行く気が…

なおすでにAI絵師を名乗る人や、PixivにAI出力の絵を載せている人がいます。FANBOXもしていれば商業的な活動といえますが、これらは上で述べたプロンプトエンジニアに含めていません。
なぜなら、「依頼主の要望を叶える目的で絵を生成している」(絵を描くスキルを売っている)か不明なためです。

もし、AI絵でもこの人の絵は好き！とSkebやFANBOXが成り立つなら、それは「その人が持っているイメージを具現化した絵が好き」であって、これはむしろ「プロンプトアーティスト」と呼ぶべきでしょう。
（念のため補足しますと、SkebはAIで生成された絵の納品は禁じられています。参考）

言葉の意味が変わりそう

現在、絵という名詞に対して使われる動詞は、「描く」です。
私はこの記事を描くにあたり、絵に対して「出力する」「生成する」という動詞を使っている場面があります。

おそらく10年後の辞書には、【絵】の項目に対して「（AIを用いて）～を出力する」といった例文が記載されるのでないでしょうか？

ほか、現在インターネット上で検索をする行為を「ググる」といいますが、同じようにAIで絵を描く行為を「イマジる」「ドリる」というようになるかもしれません。
（midjourneyで絵を生成するコマンドが「imagen」、Dream Studioで「Dream」なので。DALL E2は「Create」）

最後に

ここではお絵描きAIについて、おおざっぱなまとめと、将来についてのいくつかの考察をしてみました。

考察については当たるかもしれませんし、当たらないかもしれません。
今の市場をもとにした将来ではありますが、世の中は私が知っている以上に広く、深いので、私が知らないような事情で考察が外れる可能性も十分あります。

また私では発想できない発想による予測はできません。

私の子どもはAIネイティブの世代で、私の子どもはすでにパソコンを「ぶーぶー（クルマのこと）の絵や写真をいくらでも見せてくれるもの」と認識している節があります。

彼らの世代は、今の私にはない発想をして、新しい職業を生み出してくれるでしょう。

その未来が怖いような楽しみなような…
というあたりで今回の記事は締めたいと思います。