思考実験 - AI生成画像とQRコードは違うの?
※本記事は不正確な知識にもとづいて適当言っている。法律に関して正確な知識が必要なら弁護士にあたるように。
まずもって文章に著作権があるのは間違いないだろう。言語の著作物だ。文字列ならなんでも創作性があるわけではなく、たとえばURL https://note.com を著作物と主張されたら日本中大混乱である。
ソースコードにも著作権は認められている。オープンソースだって「著作権を保持したまま」再配布や改変について条件付きで許諾を与えるのが目的だ。バイナリコードはソースコードの複製物と見做される。言語ではなくプログラムの著作物として特別に扱われているのに注意。
図面も著作物になるが、図面に従って作ったものが著作物なのかどうかは別のレイヤの話なのが難しい。変哲もない三角コーンはだめだろうが東京ビッグサイトは保護されるだろう。工業製品と建築の著作物と美術の著作物があって、扱いが異なる。
では、AI生成画像は? t2iではプロンプトと呼ばれる文章を画像生成サービス(ないしプログラム)に与えて画像を出力する。ソースコードとバイナリコードの関係から類推していいのか、図面と建築物の関係を当てはめていいのか、楽譜と演奏なのか、微妙なところだ。
沢山生成した中から選んだから創作物だと主張するのは短絡的な考えだ。数々の名画からモナリザをピックアップしたとしても、モナリザは変わらずレオナルドダヴィンチの作である。好きなカタカナをピックアップする場合も同様。河原の石を並べるのは創作だが、石単体を取り出してみれば自然物に戻ってしまう。
僅かな加筆修正でモナリザへの創作的寄与を主張するのもナンセンスだ。左下にサインしたり目尻に皺を描いたりしたからといって、そういう微修正を慎重にキャンセルして得られたモナリザは、ただのレオナルドダヴィンチのモナリザに戻っている。このモナリザはキャンバスと言い換えてもいい。
工程を「プロンプトの工夫」→「画像への変換」→「加筆修正」とみれば明らかなようにプロンプトの工夫と加筆修正との間には機械的な切断が存在する。切断面を無視して前後の活動を一塊として扱うのが誤謬の原因だ。「木箱の図面」と「木箱に描いた絵」の関係を想像してみてほしい。木箱はどこにある?
美術的な意味での著作権が、中段のt2i生成画像に認められる未来はないと思っている。機械側の寄与を際限なく大きく想定できてしまうからだ。加筆修正を除く全ての創意工夫はプロンプトに還元される。
逆に言うと、工夫を凝らしたプロンプト自体には創作性を認めるのが妥当ということになる。少なくとも明らかに著作物である文章をプロンプトとして突っ込むことはできる。
あれ、生成画像が入力テキストを記録しているとしたら?
プロンプトと生成画像の情報を問う
“A framed paint, in gallery, art museum, from distance”というプロンプトを用意した。拙いプロンプトだが、Bing Image Creatorは気を利かせて以下のような画像を出力してくれた。バッチリ欲しかった画像!
別のサービスで同じ文字列を与えると、こういう画像が得られた。
QRコードは(株)デンソーウェーブの登録商標です。
AI生成画像とQRコードはどちらも文字列から変換した画像だ。
QRコード側は僅かにデザインの幅(色やドットの打ち方)があるだけで、同じ文字列から同じ画像が出力されて、逆に画像から文字列を取り戻せる。プロンプトと生成画像の関係は明白だ。要するにプロンプトを紙に印刷したのと全く同じなのだから。元の文章が著作物であれば、保護されたQRコードを錬成できる。
重要なのは情報を復元可能な形で保存している点だ。保存する情報は言語の著作物に限らず、ソースコードかもしれないし、ベースエンコードされたイラストかもしれない。
QRコードとAI生成画像が同じ性質を持っていると示せれば、AI生成画像を利用するのにプロンプト由来の制限をかけられるわけだ。(この場合「加筆修正」は「真ん中に置いたアイコン」くらいの意味合いになる)
画像ファイルの中にメタデータを埋め込む因習については、ここでは考慮しなくていい。どのようにメタデータを仕込んだとしても、除去した残りの成分について考えることができるからだ。イラスト上の署名を塗りつぶしたとしても残りの部分の著作権が失われないのと同じ理屈で、あくまで全体としてプロンプトの情報を伝達しているか=除去したら全部吹っ飛ぶか。