生成AIにおける「著作物データのライセンス市場」論に基づく著作権侵害の考え方
1.結論
生成AIでの機械学習用の著作物データのライセンス市場が現に存在している以上、著作物データは単体で将来的に生成AIでの機械学習用のライセンス市場で販売され得るものと見なすことができるため、当該著作物データを許諾なしで生成AIでの機械学習に使用する行為は直接的に著作物データのライセンス市場での販売を阻害し、または将来における潜在的販路を阻害し、著作物の対価回収の機会を損ない、著作権者の利益を不当に害することとなるため、著作権法第30条の4の但し書きに該当し、権利制限の対象外となり、著作権侵害となり得る。したがって、著作物データを許諾なしで生成AIでの機械学習に使用する行為は合法とは言えない。
なお、上記の判断においては、当該行為が著作物の表現の「享受」目的にあたるか否かや、当該行為の結果として生成されたAI生成物が当該著作物データの本質的特徴と類似するか否か等は論点とはならない。著作物データの生成AIでの機械学習用のライセンス市場での販売を阻害し、または将来における潜在的販路を阻害することをもって、著作権者の利益を不当に害し、権利制限の対象外となると判断するに足る根拠となり得る。
2.前提
・著作権法30条の4の条文
https://laws.e-gov.go.jp/law/345AC0000000048
「第三十条の四
著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合
三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合」
・著作権法第30条の4の但し書き「著作権者の利益を不当に害することとなる場合」の適用においては、「著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から判断される」とした文化庁解釈。
https://www.bunka.go.jp/seisaku/chosakuken/hokaisei/h30_hokaisei/pdf/r1406693_17.pdf
・著作権者が生成AIでの機械学習用のデータベースの著作物(データセット)を販売している場合、当該データベースの著作物を許諾なしで生成AIの機械学習で使用する行為は「著作権者の利益を不当に害することとなる場合」に該当し、著作権侵害となり得ることを示した文化庁解釈。
https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/seisaku/r06_02/pdf/94089701_05.pdf
「◆ 「AI学習等の情報解析に活用できる形で整理されたデータベースの著作物」 (AI学習用データベース)が販売されている場合、「このAI学習用データベースを、AI学習等の情報解析目的で複製等すること」は、著作権法第30条の4が適用されない「著作権者の利益を不当に害することとなる場合」に当たるため、このAI学習用データベースを許諾なくAI学習データとして収集・保存(複製)すれば、原則として著作権侵害*となります。
* 他の権利制限規定が適用される場合を除く
◆ そのため、権利者としては、インターネット上に自らの作品を公開する場合、その作品を含んだ自らの作品群がAI学習用データベース(データセット)を、AI学習等の情報解析目的で販売(ライセンス提供)するようにしておくことで、無許諾で学習されることを法的に防ぐことが可能です。」
・著作権法第30条の4の但し書き「著作権者の利益を不当に害することとなる場合」の適用においては、データベースの著作物に限定されるものではないことを示した文化庁解釈。
https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/pdf/94037901_01.pdf
「27 上記(ウ)及び後掲(エ)は、本ただし書に該当すると考えられる例として「基本的な考え方」で既に示している「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物」の例についての具体的な考え方に関する記載であり、「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物」の例以外は本ただし書に該当しないといったことを必ずしも示唆するものではなく、この点は個別具体的な事案に応じて判断される。」
・生成AIでの機械学習用の著作物データのライセンス市場が現に存在することの実例。
大手生成AI企業が生成AIでの機械学習用の動画コンテンツデータを報酬を支払って買取りを実施したとの報道。
契約金額は、45分間の動画1本あたり平均約18,000円程度の金額。動画100本で約180万円の対価が見込まれることになる。
https://www.bloomberg.co.jp/news/articles/2024-04-11/SBR0HIT0G1KW00
大手生成AI企業が出版社と生成AIでの機械学習用の書籍データを報酬を支払って使用するライセンス契約を結んだ事例。
契約金額は、書籍1冊あたり3年間で約75万円程度の金額。書籍1冊30年で約750万円、書籍10冊30年で約7,500万円の対価が見込まれることになる。(契約金額は出版社と著者で折半。※割合は交渉可とのこと)
また、生成AIに対し、以下の条項を定める。
・海賊版サイトのデータは生成AIで使用禁止
・生成AIでの出力時は200語/全体の5%以内とする
https://authorsguild.org/news/harpercollins-ai-licensing-deal/
https://gigazine.net/news/20241120-microsoft-ai-training-deal-harpercollins/
大手新聞社が生成AIでの機械学習用の著作物データのライセンス契約を結んだ事例。
https://www.nikkei.com/article/DGXZQOGN2308C0T20C24A5000000/
日本の大手声優事務所が生成AI企業と提携し、声優の音声データを用いたAIアシスタントやナレーション用の外国語のAI音声を提供すると発表。
https://prtimes.jp/main/html/rd/p/000000089.000078329.html
生成AIでの機械学習用の著作物データのライセンスのマーケットプレイス「Human Native AI」。
https://techcrunch.com/2024/06/08/deal-dive-human-native-ai-is-building-the-marketplace-for-ai-training-licensing-deals/
・米著作権法第107条におけるフェアユース(権利制限)規定では、4つの条件を満たさなければフェアユースは適用されないとしている。
https://www.cric.or.jp/db/world/america/america_c1a.html#107
「第107条 排他的権利の制限:フェア・ユース
第106条および第106A条の規定にかかわらず、批評、解説、ニュース報道、教授(教室における使用のために複数のコピーを作成する行為を含む)、研究または調査等を目的とする著作権のある著作物のフェア・ユース(コピーまたはレコードへの複製その他第106条に定める手段による使用を含む)は、著作権の侵害とならない。著作物の使用がフェア・ユースとなるか否かを判断する場合に考慮すべき要素は、以下のものを含む。
(1)使用の目的および性質(使用が商業性を有するかまたは非営利的教育目的かを含む)。
(2)著作権のある著作物の性質。
(3)著作権のある著作物全体との関連における使用された部分の量および実質性、および
(4)著作権のある著作物の潜在的市場または価値に対する使用の影響。
上記のすべての要素を考慮してフェア・ユースが認定された場合、著作物が未発行であるという事実自体は、かかる認定を妨げない。」
・米の現代アーティストのアンディ・ウォーホルの作品で写真家の写真を無断使用して加工した作品を、ウォーホル財団が雑誌にライセンス供与した行為に対して写真家が提訴した裁判で、当該行為はフェアユースにはあたらないとした最高裁判決についてのWIPO(国連の世界知的所有権機関)のサイトの解説記事。なお、生成AI企業に対する著作権侵害訴訟においても、この判決が引用されている。
https://www.wipo.int/wipo_magazine/ja/2023/04/article_0006.html
「著作物を複製して学習データにすることが「変容的な」フェアユースであるかどうかに限って言えば、ウォーホル事件は、学習データのコンテンツのライセンス市場が存在するかどうかによって分析が左右される可能性を示唆しています。
そのような市場は、質の高い信頼できるデータについて (特にニュースメディアにおいて) 実際に存在します。その場合、たとえアウトプットが特定のインプットの権利を侵害しないとしても、(少なくとも) 学習データを作成するための商業的複製については目的が同じため、ウォーホル事件後のフェアユースの第一要素の検討ではフェアユースとみなされない可能性があります。」
本件についての別の解説記事
https://gigazine.net/news/20230519-supreme-court-andy-warhol-prince-art-copyright-infringement/
・SNS上で無料で公開されている著作物を他人が無断でサイト上に転載した行為について、無料で公開されていたとしても「第三者が無断で利用することを許諾しているとはいえない」として著作権侵害が認定された裁判例。
https://www.sankei.com/article/20181029-EJRPGTBJRFLK5CNBWSWU4OOBHE/
・著作物データに生成AIでの機械学習での使用の不許可等のライセンス情報と来歴情報をC2PA等の規格に準拠して埋め込む技術(いわゆる電子透かし)を実用化したアプリ「Overlai」が登場。
https://petapixel.com/2024/08/27/photographers-can-protect-their-images-against-ai-with-overlai-app/
Adobe社も、上記と同様の仕組みで、著作物データにライセンス情報と来歴情報を埋め込む技術(電子透かし)を実用化したアプリ「Content Authenticity」を提供する予定を発表。
https://www.adobe.com/jp/news-room/news/202410/20241009_adobe-content-authenticity.html
・著作権の国際ルールを定めるベルヌ条約において、著作権者の権利を国内法で権利制限する場合には、以下の条件を満たすことが義務付けられている。(3ステップテスト)
1.特別な場合であること
2.著作物の通常の利用を妨げないこと
3.著作者の利益を不当に害さないこと
https://www.cric.or.jp/db/treaty/t1_index.html
「ベルヌ条約
第九条 〔複製権〕
(1)文学的及び美術的著作物の著作者でこの条約によつて保護されるものは、それらの著作物の複製(その方法及び形式のいかんを問わない。)を許諾する排他的権利を享有する。
(2)特別の場合について(1)の著作物の複製を認める権能は、同盟国の立法に留保される。ただし、そのような複製が当該著作物の通常の利用を妨げず、かつ、その著作者の正当な利益を不当に害しないことを条件とする。
(3)録音及び録画は、この条約の適用上、複製とみなす。」
・伊国でのG7競争サミットにおいて、「デジタル競争共同宣言」が発表され、その中で、「生成AIシステムは、創作者及びイノベーターの成果物への十分な補償がないまま、人間による創造力とイノベーションを抑圧する形で、彼らの利益を侵害する可能性がある。」「著作権が付与されるインプット・データに関する競争的な市場を支援することによって、補償と同意モデルの構築をより確実にすることで、信頼可能で、安全かつ安心なAIシステムをトレーニングするための材料へのより一層の投資及び創出をさらに促す可能性がある。」などとして、生成AIの機械学習用の著作物データのライセンス市場に言及する内容が盛り込まれている。
G7競争サミット・デジタル競争共同宣言
https://www.jftc.go.jp/houdou/pressrelease/2024/oct/241007G7_result1-2_JP.pdf
・「生成AIの機械学習用の著作物のライセンス市場が現に存在する以上、著作物を生成AIの機械学習で無断使用する行為は、著作物のライセンス市場での販売または潜在的販路を阻害し、著作権者の利益を不当に害する」理論については、
米イェール大学の教授の論文と、米ヴァンダービルト大学の教授らの論文においても言及されている。
Jacqueline C. Charlesworth. (2024). Generative AI’s Illusory Case for Fair Use.
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4924997
DANIEL GERVAIS, HARALAMBOS MARMANIS, NOAM SHEMTOV, & CATHERINE ZALLER ROWLAND. (2024). THE HEART OF THE MATTER: COPYRIGHT, AI TRAINING, AND LLMS.
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4963711
・著作権者から許諾を得た著作物を使用した権利的にクリーンな生成AIを標榜する事業者
産総研
https://www.nikkei.com/article/DGXZQOUA3045L0Q4A130C2000000/
ProRata
https://www.wired.com/story/bill-gross-prorata-generative-ai-business/
Getty Images
https://prtimes.jp/main/html/rd/p/000000033.000018083.html
アニメチェーン構想
https://prtimes.jp/main/html/rd/p/000000001.000135092.html
3.解説
著作権法第30条の4の権利制限規定における「著作権者の利益を不当に害することとなる場合」の適用においては、「著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から判断される」とされています。
現に生成AIでの機械学習用の著作物データのライセンス市場において著作権者が著作物データをライセンス販売している場合において、第三者が当該著作物データを何らかの方法で収集し、著作権者の許諾なしで生成AIでの機械学習に使用する行為は直接的に当該著作物データのライセンス市場での販売を阻害し、著作物の対価回収の機会を損ない、著作権者の利益を不当に害することとなることは自明でしょう。
また、現時点では生成AIでの機械学習用の著作物データのライセンス市場においてライセンス販売されていない著作物データの場合でも、「将来的に生成AIでの機械学習用のライセンス市場で販売され得るものと見なす」ことができますので、当該著作物データを許諾なしで生成AIでの機械学習に使用する行為は当該著作物データのライセンス市場での「将来における潜在的販路を阻害」し、著作権者の利益を不当に害することとなると考えられるでしょう。したがって、著作物データを許諾なしで生成AIでの機械学習に使用する行為は合法とは言えないでしょう。
著作権者が生成AIでの機械学習用のデータベースの著作物(データセット)を販売している場合において、当該データベースの著作物を許諾なしで生成AIの機械学習で使用する行為は「著作権者の利益を不当に害することとなる場合」に該当し、著作権侵害となり得るという文化庁解釈がありますが、これは上記の「著作物データのライセンス市場」論に基づく著作権侵害の考え方に近いと思われますが、
「著作権者の利益を不当に害することとなる場合」の適用においてはデータベースの著作物に限定されるものではない、ということも文化庁解釈で示されていますので、
現に生成AIでの機械学習用の著作物データ単体でのライセンス市場が存在している以上、著作物データのライセンス市場の対象をデータベースの著作物に限定することは適切ではないでしょう。
なお、SNS上で無料で公開されている著作物を他人が無断でサイト上に転載した行為について、無料で公開されていたとしても「第三者が無断で利用することを許諾しているとはいえない」として著作権侵害が認定された裁判例がありますので、当該著作物データがSNS等で無料で公開されていたとしても、「第三者の生成AIの機械学習での使用を許諾しているとはいえない」でしょう。
この点について、生成AIの機械学習での使用の不許可等のライセンス情報と来歴情報をC2PA等の規格に準拠して著作物データに埋め込む技術(いわゆる電子透かし)を実用化したアプリもリリースされていますので、何も対応しなくても「生成AIの機械学習での使用を許諾しているとはいえない」ですが、上記のようなアプリ等を使用してライセンス情報を著作物データに埋め込むことで、「著作物データの生成AIの機械学習での使用の不許可」をさらに明示することができますので、そのような事実は著作権侵害訴訟等において「将来的に生成AIでの機械学習用のライセンス市場で販売され得る著作物データを第三者が許諾なしで生成AIでの機械学習に使用した事実」を認定する上で、法的にも勘案されることになろうかと思われますね。
著作物のライセンスと著作権法のフェアユース(権利制限)の関係については、米での事案になりますが参照すべき事案として、現代アートのアンディ・ウォーホルの作品で写真家の著作物を無断使用した作品をウォーホル財団が雑誌にライセンス提供した行為が著作権侵害であると認定された米最高裁判決があります。
現代アートの巨匠として知られるウォーホル作品において写真家の著作物を無断使用した作品をウォーホル財団が雑誌にライセンス提供した行為がフェアユースにあたるか否かが争点となりましたが、当該ウォーホル作品の芸術的価値や写真家の著作物との類似性、二次的著作物を作成することの是非等についての検討は回避した上で、専らウォーホル財団が作品の雑誌での使用をライセンス提供した行為について写真家による著作物のライセンスの提供の権利への侵害性を検討することに論点を絞り、フェアユースの条件である「(1)使用の目的および性質(使用が商業性を有するかまたは非営利的教育目的かを含む)」に照らして、雑誌に掲載するという使用の目的が同一であることや商業的性質等を理由にフェアユースを認めない最高裁判決が下されています。
これを生成AIに当てはめて考えると、WIPO(国連の世界知的所有権機関)のサイトの解説記事でも指摘されているように、生成AIでの機械学習用の著作物データのライセンス市場において将来的にライセンス販売され得る場合には、当該行為が著作物の表現の「享受」目的にあたるか否かや、当該行為の結果として生成されたAI生成物が当該著作物データの本質的特徴と類似するか否か等を検討する必要はなく、著作物データを許諾なしで生成AIでの機械学習で使用する行為の目的および商業的性質が、生成AIでの機械学習用の著作物データのライセンス市場において将来的にライセンス販売され得る著作物データの目的と同一であり、商業的性質を持つ行為であるならば、フェアユース(権利制限)には該当しない可能性が高いという結論が導かれると思われます。
もっとも、日本の著作権法では「著作権者の利益を不当に害することとなる場合」が主要な争点となるでしょうから、米著作権法のフェアユース規定における「(4)著作権のある著作物の潜在的市場または価値に対する使用の影響」の方が日本では争点となりそうですので、上記の「著作物データのライセンス市場」論に基づく著作権侵害の考え方においても、「著作権者の利益を不当に害することとなる場合」を論点としています。
ただし、著作権の国際条約であるベルヌ条約において、著作権者の権利を国内法で権利制限する場合には、「1.特別な場合であること」「2.著作物の通常の利用を妨げないこと」「3.著作者の利益を不当に害さないこと」の3つの条件(3ステップテスト)を満たすことが義務付けられており、日本の著作権法もこの条件を満たす必要がありますので、
ベルヌ条約における「2.著作物の通常の利用を妨げないこと」の条件が、著作物の「使用の目的および性質」を含むものであるとすれば、上記で検討されたように、当該行為の「目的および商業的性質」が、ライセンス市場において将来的にライセンス販売され得る著作物データの目的と同一であり、商業的性質を持つ行為であるならば、ベルヌ条約における「2.著作物の通常の利用を妨げないこと」の条件に違反する、とする見方もできると思われますが、この点については更なる検討が必要になりますね。
4.G7競争サミット「デジタル競争共同宣言」
2024年10月7日、伊国でのG7競争サミットにおいて、「デジタル競争共同宣言」が発表されました。
その中で、「生成AIシステムは、創作者及びイノベーターの成果物への十分な補償がないまま、人間による創造力とイノベーションを抑圧する形で、彼らの利益を侵害する可能性がある。」「著作権が付与されるインプット・データに関する競争的な市場を支援することによって、補償と同意モデルの構築をより確実にすることで、信頼可能で、安全かつ安心なAIシステムをトレーニングするための材料へのより一層の投資及び創出をさらに促す可能性がある。」などとして、生成AIの機械学習用の著作物のライセンス市場に言及する内容が盛り込まれています。
国家間の共同宣言は国際的な約束であり、参加国はこれを遵守することが求められます。
・G7競争サミット・デジタル競争共同宣言
https://www.jftc.go.jp/houdou/pressrelease/2024/oct/241007G7_result1-2_JP.pdf
(抜粋)
「・人間によるイノベーションと著作権
生成AIシステムのトレーニングは、知識、アート、文章、アイディア等の人間の創作物に強く依存している。その関係性の下、生成AIシステムは、創作者及びイノベーターの成果物への十分な補償がないまま、人間による創造力とイノベーションを抑圧する形で、彼らの利益を侵害する可能性がある。
また、AI企業が創作者の創作物の使用に対し買い手独占力を行使したり、より小規模なAI企業の当該創作物へのアクセスを防いだりして、競争が十分働かないようにすることにより、 侵害のリスクが高まるかもしれない。
他方、著作権が付与されるインプット・データに関する競争的な市場を支援することによって、補償と同意モデルの構築をより確実にすることで、信頼可能で、安全かつ安心なAIシステムをトレーニングするための材料へのより一層の投資及び創出をさらに促す可能性がある。
・消費者保護
AIが生成したものは、消費者を誤った方向に導き、消費者の嗜好を形成し、消費者の情報に基づく選択を阻害する可能性がある。誤った又はミスリードな情報を通じてAIシステムが消費者の意思決定プロセスを歪めないことを確実にすることが、消費者の信頼維持と健全な競争環境の促進に欠かせない。
・プライバシーとデータ保護
AIシステムの開発及び学習には、しばしば、膨大な量の個人データの収集、統合、 処理及び使用が必要となる。それらのデータの取扱いは既存のプライバシーに係る規則及び法に完全に準拠しなくてはならない。個人データの保護は公共の信頼を維持し、個人の権利を尊重するAI開発のために重要である。AI関連市場における健全な競争は、有害な行動を抑え、プライバシー保護を推進することを可能とする。
・公平なアクセスと機会
市場における参入障壁の範囲は、AI市場におけるビジネスの機会、イノベーション及び成長に影響をもたらす。AIスタック全体(AIチップ、基盤モデルから下流のアプリケーションまで)における AIシステムの開発及び実装のためには、重要なインプットへの公平なアクセスの確保が必要である。
トレーニングデータなど、AIモデルのいくつかの要素のセットを公にして利用可能とすることの要求により、新規参入と機会創出を促進し得る。競合するAIシステム間の切り替えやそれらの複数利用のための柔軟性は、消費者、企業、競争及びイノベーションに恩恵をもたらすこととなる。」
5.先行研究
上述の「生成AIの機械学習用の著作物のライセンス市場が現に存在する以上、著作物を生成AIの機械学習で無断使用する行為は、著作物のライセンス市場での販売または潜在的販路を阻害し、著作権者の利益を不当に害する」理論については、
米イェール大学の教授の論文と、米ヴァンダービルト大学の教授らの論文においても言及されています。
同じような理論を考えている方々は、法学者にもおられるということになりますね。
・Jacqueline C. Charlesworth. (2024). Generative AI’s Illusory Case for Fair Use.
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4924997
・DANIEL GERVAIS, HARALAMBOS MARMANIS, NOAM SHEMTOV, & CATHERINE ZALLER ROWLAND. (2024). THE HEART OF THE MATTER: COPYRIGHT, AI TRAINING, AND LLMS.
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4963711
以上