『AIが自動生成するジェネラティブNFTの可能性』～【新しいWeb3ビジネスのアイディアのタネ】2022.8.5

2022年8月5日 12:01

■アップルが文章や画像から3次元シーンの映像を生成する技術を発表

OpenAIが開発した「DALL・E 2」で一気に有名になった感がある「文章をもとにAIに絵を描かせる」技術にAppleも参入です。

Appleが発表したのは「GAUDI」。

「GAUDI」では、入力された文章から3次元シーンを移動する映像を生成できます、例えば「Go up stairs(階段を上がる)」という文章を入力すると階段を上がっていくカメラワークの映像を生成できます（アイキャッチ画像の中央列の画像）。「Walk out of the bedroom and into the living room(寝室から出てリビングルームに入る)」のように、カメラの経路を文章で指示することもできます。また、画像を入力して、入力画像に似た景色の映像を生成したり、入力なしでランダムに３次元シーンの映像を生成することもできます。

これまでは2Dでも3Dでも1枚の静止画を作ることがメインでした。GAUDIでは3Dでカメラワークを伴った映像を自動生成できます。

生成できる尺の長さはまだ短いようですが、将来は映画のシナリオ1本食わせれば粗編集版が作れたり、ロケハンに行かなくても雰囲気が確認できたりするようになるかもしれませんね。

■ジェネラティブNFTでも「文章から生成」が流行するか

ジェネラティブアート、ジェネレーティブアートというランダム性をアートに生かすジャンルは古来からあります。藍染の染模様もその一種と捉えることができます。

CGやNFTの場合のジェネラティブアートの作り方はざっくり2種類あります。

・計算式で絵柄を変える
・あらかじめ用意したパーツ画像を組み合わせる

最近のNFTアート、特に人間や動物などのキャラクターがモチーフのものでは後者の、パーツ画像をレイヤーで持っておいて重ね合わせて1枚の画像を作る方法がメジャーです。

「素体」と呼ばれるベースキャラクターに、部分的に違うパーツをランダムに当てはめることで多数の異なる画像を作り出します。

前者の計算式で絵柄を変えるものは

この本の表紙のような絵柄を生み出すのに向いているとされ、キャラクターデザインを無数に生み出すには向いていないと考えられていました。

しかし今回のAppleのGAUDIやOpenAIのDALL-E2のような技術を使えば、パーツの組み合わせ以上に複雑で深みのある、ランダムに生成されたキャラクターデザインが可能になるはずです。

■「AIをうまく操作するための上手なテキストの書き方」が商売に

↑をぜひ開いて見てほしいのですが、DALL-E2にうまく指示をするとMetaMaskのポリゴンキツネ風のテイストでほかの動物を量産できたりします。ポリゴンキツネの絵柄は↓

このPromptBaseというサイトではPrompt Marketplaceと銘打って、DALL-E2に狙い通りの画像を生成させられるテキスト、Promptを有償販売しています。

DALL-E2自体も登場して間もないのに、さらにその上でビジネスが動き始めています。素晴らしいスピードです。

■DALL-E2で大量生成するのにいくらかかる？

「ベータ版」のリリースに伴い、以前は無料で利用可能だったDALL-E 2は、クレジットベースの価格設定モデルを採用します。新規ユーザーは、写真の作成、編集、または変更に使用できる一定数のクレジットを受け取ります。（世代は4つの画像を生成しますが、編集とバリアントは3つです。）クレジットは15ドル単位で追加できます。または、2か月目に15、最初の月に50の割合で毎月リロードされます。

初月200 images無料、additional $15/460 imagesという料金体系です。1万枚の生成をする場合は単純計算で330ドルです。

狙い通りにならない画像がどのくらいの割合含まれてしまうのかの歩留まり率はやってみないとわかりませんが、これまでのようにイラストレーターの人に素体とジェネラティブパーツを描いてもらい、画像合成エンジンを開発して、とやるより遥かに安価で済みそうです。

■AIが作った画像の著作権問題

GAUDIやDALL-E2のようなAIで作られた画像の著作権者は誰なのでしょうか？

アメリカ合衆国著作権局は2022年2月14日に、「Creativity Machine」と名付けられたアルゴリズムが生成した絵画に著作権を認めるよう求めた申請を却下したことを発表しました。発表の中で同局は、「AIが生成した画像には著作権によって保護されるのに必要な基準である『人間の著作権』の要素が含まれていない」と決定したことを表明しています。

アメリカ著作権局はAIの人格権を否定しています。
使い方によってはAIで作られたジェネラティブNFTが勝手にCC0化してしまい、その後にキャラクター版権ビジネスをやろうとしても認められないということもあり得るかもしれません。

ただし、ベースとなる画像が明確にあり、そのベース画像に著作権者が存在する場合は著作権的な保護対象になると考えるのが常識的だろうと思います。

「ミッキーマウスが宇宙でかき氷を食べている」のような指示で作成された画像で、絵柄的にどう見てもミッキーマウスに見えるものが映っていれば、それはきっとディズニーから訴えられます。似ているってだけでも訴えられるので、Promptに「ミッキーマウス」と書いてあればそれが証拠となってしまうでしょう。

国によっても解釈は異なるようです。
オーストラリアではAIを発明者として人格権を認める方向のようです。

もしジェネラティブNFTに用いるなら、
・素体はオリジナルデザインを作っておき、ジェネラティブバリエーションにAIを使うことで「素体の著作権」を持っておく
・逆に、素体に他人の著作物を使わない
ということが工夫ポイントになりそうです。

■AIによるジェネラティブの可能性追求

AIに雑な下絵をわたして、「続きを描いておいて」という実験をしている。
わりと面白い成果がでてる。 pic.twitter.com/FvnstrljJs
— 深津貴之 / THE GUILD / note.com (@fladdict) August 2, 2022

深津貴之さんの研究が非常に興味深いです。
雑な元画像を与えてAIで美しく仕上げる、であるとか、少しずつ動かしてアニメーションやカメラワークを再現するなど、AIジェネラティブの可能性にトライされています。

どういう指示を出すと上手に使いこなせるのかや、今は思いつかないすごい使い方、Loot NFTプロジェクトと組み合わせてPrompt側のテキストをNFTにしてしまうなど、今後もすごいことが起きそうです。

「デザイナーの仕事がなくなる」というようなディストピア史観もささやかれていますが、こういう新しい技術はおもしろく使いこなしてナンボ。先進技術の可能性を追求する側にポジションを取って先駆者になってしまいましょう。