生成AIにおける「著作物データのライセンス市場」論に基づく著作権侵害の考え方

1.結論

生成AIでの機械学習用の著作物データのライセンス市場が現に存在している以上、著作物データは単体で将来的に生成AIでの機械学習用のライセンス市場で販売され得るものと見なすことができるため、当該著作物データを許諾なしで生成AIでの機械学習に使用する行為は直接的に著作物データのライセンス市場での販売を阻害し、または将来における潜在的販路を阻害し、著作物の対価回収の機会を損ない、著作権者の利益を不当に害することとなるため、著作権法第30条の4の但し書きに該当し、権利制限の対象外となり、著作権侵害となり得る。したがって、著作物データを許諾なしで生成AIでの機械学習に使用する行為は合法とは言えない。

なお、上記の判断においては、当該行為が著作物の表現の「享受」目的にあたるか否かや、当該行為の結果として生成されたAI生成物が当該著作物データの本質的特徴と類似するか否か等は論点とはならない。著作物データの生成AIでの機械学習用のライセンス市場での販売を阻害し、または将来における潜在的販路を阻害することをもって、著作権者の利益を不当に害し、権利制限の対象外となると判断するに足る根拠となり得る。

2.前提

・著作権法30条の4の条文
https://laws.e-gov.go.jp/law/345AC0000000048

「第三十条の四
著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合
三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合」

・著作権法第30条の4の但し書き「著作権者の利益を不当に害することとなる場合」の適用においては、「著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から判断される」とした文化庁解釈。
https://www.bunka.go.jp/seisaku/chosakuken/hokaisei/h30_hokaisei/pdf/r1406693_17.pdf

・著作権者が生成AIでの機械学習用のデータベースの著作物(データセット)を販売している場合、当該データベースの著作物を許諾なしで生成AIの機械学習で使用する行為は「著作権者の利益を不当に害することとなる場合」に該当し、著作権侵害となり得ることを示した文化庁解釈。
https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/seisaku/r06_02/pdf/94089701_05.pdf

「◆ 「AI学習等の情報解析に活用できる形で整理されたデータベースの著作物」 (AI学習用データベース)が販売されている場合、「このAI学習用データベースを、AI学習等の情報解析目的で複製等すること」は、著作権法第30条の4が適用されない「著作権者の利益を不当に害することとなる場合」に当たるため、このAI学習用データベースを許諾なくAI学習データとして収集・保存(複製)すれば、原則として著作権侵害*となります。 
 * 他の権利制限規定が適用される場合を除く
◆ そのため、権利者としては、インターネット上に自らの作品を公開する場合、その作品を含んだ自らの作品群がAI学習用データベース(データセット)を、AI学習等の情報解析目的で販売(ライセンス提供)するようにしておくことで、無許諾で学習されることを法的に防ぐことが可能です。」

・著作権法第30条の4の但し書き「著作権者の利益を不当に害することとなる場合」の適用においては、データベースの著作物に限定されるものではないことを示した文化庁解釈。
https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/pdf/94037901_01.pdf

「27 上記(ウ)及び後掲(エ)は、本ただし書に該当すると考えられる例として「基本的な考え方」で既に示している「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物」の例についての具体的な考え方に関する記載であり、「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物」の例以外は本ただし書に該当しないといったことを必ずしも示唆するものではなく、この点は個別具体的な事案に応じて判断される。」

・生成AIでの機械学習用の著作物データのライセンス市場が現に存在することの実例。

大手生成AI企業が生成AIでの機械学習用の動画コンテンツデータを報酬を支払って買取りを実施したとの報道。
契約金額は、45分間の動画1本あたり平均約18,000円程度の金額。動画100本で約180万円の対価が見込まれることになる。
https://www.bloomberg.co.jp/news/articles/2024-04-11/SBR0HIT0G1KW00

大手生成AI企業が出版社と生成AIでの機械学習用の書籍データを報酬を支払って使用するライセンス契約を結んだ事例。
契約金額は、書籍1冊あたり3年間で約75万円程度の金額。書籍1冊30年で約750万円、書籍10冊30年で約7,500万円の対価が見込まれることになる。(契約金額は出版社と著者で折半。※割合は交渉可とのこと)
また、生成AIに対し、以下の条項を定める。
・海賊版サイトのデータは生成AIで使用禁止
・生成AIでの出力時は200語/全体の5%以内とする
https://authorsguild.org/news/harpercollins-ai-licensing-deal/

https://gigazine.net/news/20241120-microsoft-ai-training-deal-harpercollins/

大手新聞社が生成AIでの機械学習用の著作物データのライセンス契約を結んだ事例。
https://www.nikkei.com/article/DGXZQOGN2308C0T20C24A5000000/

日本の大手声優事務所が生成AI企業と提携し、声優の音声データを用いたAIアシスタントやナレーション用の外国語のAI音声を提供すると発表。
https://prtimes.jp/main/html/rd/p/000000089.000078329.html

生成AIでの機械学習用の著作物データのライセンスのマーケットプレイス「Human Native AI」。
https://techcrunch.com/2024/06/08/deal-dive-human-native-ai-is-building-the-marketplace-for-ai-training-licensing-deals/

・米著作権法第107条におけるフェアユース(権利制限)規定では、4つの条件を満たさなければフェアユースは適用されないとしている。
https://www.cric.or.jp/db/world/america/america_c1a.html#107

「第107条 排他的権利の制限:フェア・ユース
第106条および第106A条の規定にかかわらず、批評、解説、ニュース報道、教授(教室における使用のために複数のコピーを作成する行為を含む)、研究または調査等を目的とする著作権のある著作物のフェア・ユース(コピーまたはレコードへの複製その他第106条に定める手段による使用を含む)は、著作権の侵害とならない。著作物の使用がフェア・ユースとなるか否かを判断する場合に考慮すべき要素は、以下のものを含む。
(1)使用の目的および性質(使用が商業性を有するかまたは非営利的教育目的かを含む)。
(2)著作権のある著作物の性質。
(3)著作権のある著作物全体との関連における使用された部分の量および実質性、および
(4)著作権のある著作物の潜在的市場または価値に対する使用の影響。
上記のすべての要素を考慮してフェア・ユースが認定された場合、著作物が未発行であるという事実自体は、かかる認定を妨げない。」

・米の現代アーティストのアンディ・ウォーホルの作品で写真家の写真を無断使用して加工した作品を、ウォーホル財団が雑誌にライセンス供与した行為に対して写真家が提訴した裁判で、当該行為はフェアユースにはあたらないとした最高裁判決についてのWIPO(国連の世界知的所有権機関)のサイトの解説記事。なお、生成AI企業に対する著作権侵害訴訟においても、この判決が引用されている。
https://www.wipo.int/wipo_magazine/ja/2023/04/article_0006.html

「著作物を複製して学習データにすることが「変容的な」フェアユースであるかどうかに限って言えば、ウォーホル事件は、学習データのコンテンツのライセンス市場が存在するかどうかによって分析が左右される可能性を示唆しています。
そのような市場は、質の高い信頼できるデータについて (特にニュースメディアにおいて) 実際に存在します。その場合、たとえアウトプットが特定のインプットの権利を侵害しないとしても、(少なくとも) 学習データを作成するための商業的複製については目的が同じため、ウォーホル事件後のフェアユースの第一要素の検討ではフェアユースとみなされない可能性があります。」

本件についての別の解説記事
https://gigazine.net/news/20230519-supreme-court-andy-warhol-prince-art-copyright-infringement/

・SNS上で無料で公開されている著作物を他人が無断でサイト上に転載した行為について、無料で公開されていたとしても「第三者が無断で利用することを許諾しているとはいえない」として著作権侵害が認定された裁判例。
https://www.sankei.com/article/20181029-EJRPGTBJRFLK5CNBWSWU4OOBHE/

・著作物データに生成AIでの機械学習での使用の不許可等のライセンス情報と来歴情報をC2PA等の規格に準拠して埋め込む技術(いわゆる電子透かし)を実用化したアプリ「Overlai」が登場。
https://petapixel.com/2024/08/27/photographers-can-protect-their-images-against-ai-with-overlai-app/

Adobe社も、上記と同様の仕組みで、著作物データにライセンス情報と来歴情報を埋め込む技術(電子透かし)を実用化したアプリ「Content Authenticity」を提供する予定を発表。
https://www.adobe.com/jp/news-room/news/202410/20241009_adobe-content-authenticity.html

・著作権の国際ルールを定めるベルヌ条約において、著作権者の権利を国内法で権利制限する場合には、以下の条件を満たすことが義務付けられている。(3ステップテスト)
1.特別な場合であること
2.著作物の通常の利用を妨げないこと
3.著作者の利益を不当に害さないこと
https://www.cric.or.jp/db/treaty/t1_index.html

「ベルヌ条約
第九条 〔複製権〕
(1)文学的及び美術的著作物の著作者でこの条約によつて保護されるものは、それらの著作物の複製(その方法及び形式のいかんを問わない。)を許諾する排他的権利を享有する。
(2)特別の場合について(1)の著作物の複製を認める権能は、同盟国の立法に留保される。ただし、そのような複製が当該著作物の通常の利用を妨げず、かつ、その著作者の正当な利益を不当に害しないことを条件とする。
(3)録音及び録画は、この条約の適用上、複製とみなす。」

・伊国でのG7競争サミットにおいて、「デジタル競争共同宣言」が発表され、その中で、「生成AIシステムは、創作者及びイノベーターの成果物への十分な補償がないまま、人間による創造力とイノベーションを抑圧する形で、彼らの利益を侵害する可能性がある。」「著作権が付与されるインプット・データに関する競争的な市場を支援することによって、補償と同意モデルの構築をより確実にすることで、信頼可能で、安全かつ安心なAIシステムをトレーニングするための材料へのより一層の投資及び創出をさらに促す可能性がある。」などとして、生成AIの機械学習用の著作物データのライセンス市場に言及する内容が盛り込まれている。

G7競争サミット・デジタル競争共同宣言
https://www.jftc.go.jp/houdou/pressrelease/2024/oct/241007G7_result1-2_JP.pdf

・「生成AIの機械学習用の著作物のライセンス市場が現に存在する以上、著作物を生成AIの機械学習で無断使用する行為は、著作物のライセンス市場での販売または潜在的販路を阻害し、著作権者の利益を不当に害する」理論については、
米イェール大学の教授の論文と、米ヴァンダービルト大学の教授らの論文においても言及されている。

Jacqueline C. Charlesworth. (2024). Generative AI’s Illusory Case for Fair Use.
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4924997

DANIEL GERVAIS, HARALAMBOS MARMANIS, NOAM SHEMTOV, & CATHERINE ZALLER ROWLAND. (2024). THE HEART OF THE MATTER: COPYRIGHT, AI TRAINING, AND LLMS.
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4963711

・著作権者から許諾を得た著作物を使用した権利的にクリーンな生成AIを標榜する事業者

絵藍ミツア
https://elanmitsua.com

産総研
https://www.nikkei.com/article/DGXZQOUA3045L0Q4A130C2000000/

ProRata
https://www.wired.com/story/bill-gross-prorata-generative-ai-business/

Getty Images
https://prtimes.jp/main/html/rd/p/000000033.000018083.html

アニメチェーン構想
https://prtimes.jp/main/html/rd/p/000000001.000135092.html

3.解説

著作権法第30条の4の権利制限規定における「著作権者の利益を不当に害することとなる場合」の適用においては、「著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から判断される」とされています。

現に生成AIでの機械学習用の著作物データのライセンス市場において著作権者が著作物データをライセンス販売している場合において、第三者が当該著作物データを何らかの方法で収集し、著作権者の許諾なしで生成AIでの機械学習に使用する行為は直接的に当該著作物データのライセンス市場での販売を阻害し、著作物の対価回収の機会を損ない、著作権者の利益を不当に害することとなることは自明でしょう。
また、現時点では生成AIでの機械学習用の著作物データのライセンス市場においてライセンス販売されていない著作物データの場合でも、「将来的に生成AIでの機械学習用のライセンス市場で販売され得るものと見なす」ことができますので、当該著作物データを許諾なしで生成AIでの機械学習に使用する行為は当該著作物データのライセンス市場での「将来における潜在的販路を阻害」し、著作権者の利益を不当に害することとなると考えられるでしょう。したがって、著作物データを許諾なしで生成AIでの機械学習に使用する行為は合法とは言えないでしょう。

著作権者が生成AIでの機械学習用のデータベースの著作物(データセット)を販売している場合において、当該データベースの著作物を許諾なしで生成AIの機械学習で使用する行為は「著作権者の利益を不当に害することとなる場合」に該当し、著作権侵害となり得るという文化庁解釈がありますが、これは上記の「著作物データのライセンス市場」論に基づく著作権侵害の考え方に近いと思われますが、
「著作権者の利益を不当に害することとなる場合」の適用においてはデータベースの著作物に限定されるものではない、ということも文化庁解釈で示されていますので、
現に生成AIでの機械学習用の著作物データ単体でのライセンス市場が存在している以上、著作物データのライセンス市場の対象をデータベースの著作物に限定することは適切ではないでしょう。

なお、SNS上で無料で公開されている著作物を他人が無断でサイト上に転載した行為について、無料で公開されていたとしても「第三者が無断で利用することを許諾しているとはいえない」として著作権侵害が認定された裁判例がありますので、当該著作物データがSNS等で無料で公開されていたとしても、「第三者の生成AIの機械学習での使用を許諾しているとはいえない」でしょう。
この点について、生成AIの機械学習での使用の不許可等のライセンス情報と来歴情報をC2PA等の規格に準拠して著作物データに埋め込む技術(いわゆる電子透かし)を実用化したアプリもリリースされていますので、何も対応しなくても「生成AIの機械学習での使用を許諾しているとはいえない」ですが、上記のようなアプリ等を使用してライセンス情報を著作物データに埋め込むことで、「著作物データの生成AIの機械学習での使用の不許可」をさらに明示することができますので、そのような事実は著作権侵害訴訟等において「将来的に生成AIでの機械学習用のライセンス市場で販売され得る著作物データを第三者が許諾なしで生成AIでの機械学習に使用した事実」を認定する上で、法的にも勘案されることになろうかと思われますね。

著作物のライセンスと著作権法のフェアユース(権利制限)の関係については、米での事案になりますが参照すべき事案として、現代アートのアンディ・ウォーホルの作品で写真家の著作物を無断使用した作品をウォーホル財団が雑誌にライセンス提供した行為が著作権侵害であると認定された米最高裁判決があります。
現代アートの巨匠として知られるウォーホル作品において写真家の著作物を無断使用した作品をウォーホル財団が雑誌にライセンス提供した行為がフェアユースにあたるか否かが争点となりましたが、当該ウォーホル作品の芸術的価値や写真家の著作物との類似性、二次的著作物を作成することの是非等についての検討は回避した上で、専らウォーホル財団が作品の雑誌での使用をライセンス提供した行為について写真家による著作物のライセンスの提供の権利への侵害性を検討することに論点を絞り、フェアユースの条件である「(1)使用の目的および性質(使用が商業性を有するかまたは非営利的教育目的かを含む)」に照らして、雑誌に掲載するという使用の目的が同一であることや商業的性質等を理由にフェアユースを認めない最高裁判決が下されています。

これを生成AIに当てはめて考えると、WIPO(国連の世界知的所有権機関)のサイトの解説記事でも指摘されているように、生成AIでの機械学習用の著作物データのライセンス市場において将来的にライセンス販売され得る場合には、当該行為が著作物の表現の「享受」目的にあたるか否かや、当該行為の結果として生成されたAI生成物が当該著作物データの本質的特徴と類似するか否か等を検討する必要はなく、著作物データを許諾なしで生成AIでの機械学習で使用する行為の目的および商業的性質が、生成AIでの機械学習用の著作物データのライセンス市場において将来的にライセンス販売され得る著作物データの目的と同一であり、商業的性質を持つ行為であるならば、フェアユース(権利制限)には該当しない可能性が高いという結論が導かれると思われます。

もっとも、日本の著作権法では「著作権者の利益を不当に害することとなる場合」が主要な争点となるでしょうから、米著作権法のフェアユース規定における「(4)著作権のある著作物の潜在的市場または価値に対する使用の影響」の方が日本では争点となりそうですので、上記の「著作物データのライセンス市場」論に基づく著作権侵害の考え方においても、「著作権者の利益を不当に害することとなる場合」を論点としています。
ただし、著作権の国際条約であるベルヌ条約において、著作権者の権利を国内法で権利制限する場合には、「1.特別な場合であること」「2.著作物の通常の利用を妨げないこと」「3.著作者の利益を不当に害さないこと」の3つの条件(3ステップテスト)を満たすことが義務付けられており、日本の著作権法もこの条件を満たす必要がありますので、
ベルヌ条約における「2.著作物の通常の利用を妨げないこと」の条件が、著作物の「使用の目的および性質」を含むものであるとすれば、上記で検討されたように、当該行為の「目的および商業的性質」が、ライセンス市場において将来的にライセンス販売され得る著作物データの目的と同一であり、商業的性質を持つ行為であるならば、ベルヌ条約における「2.著作物の通常の利用を妨げないこと」の条件に違反する、とする見方もできると思われますが、この点については更なる検討が必要になりますね。

4.G7競争サミット「デジタル競争共同宣言」

2024年10月7日、伊国でのG7競争サミットにおいて、「デジタル競争共同宣言」が発表されました。
その中で、「生成AIシステムは、創作者及びイノベーターの成果物への十分な補償がないまま、人間による創造力とイノベーションを抑圧する形で、彼らの利益を侵害する可能性がある。」「著作権が付与されるインプット・データに関する競争的な市場を支援することによって、補償と同意モデルの構築をより確実にすることで、信頼可能で、安全かつ安心なAIシステムをトレーニングするための材料へのより一層の投資及び創出をさらに促す可能性がある。」などとして、生成AIの機械学習用の著作物のライセンス市場に言及する内容が盛り込まれています。
国家間の共同宣言は国際的な約束であり、参加国はこれを遵守することが求められます。

・G7競争サミット・デジタル競争共同宣言
https://www.jftc.go.jp/houdou/pressrelease/2024/oct/241007G7_result1-2_JP.pdf

(抜粋)
「・人間によるイノベーションと著作権
生成AIシステムのトレーニングは、知識、アート、文章、アイディア等の人間の創作物に強く依存している。その関係性の下、生成AIシステムは、創作者及びイノベーターの成果物への十分な補償がないまま、人間による創造力とイノベーションを抑圧する形で、彼らの利益を侵害する可能性がある。
また、AI企業が創作者の創作物の使用に対し買い手独占力を行使したり、より小規模なAI企業の当該創作物へのアクセスを防いだりして、競争が十分働かないようにすることにより、 侵害のリスクが高まるかもしれない。
他方、著作権が付与されるインプット・データに関する競争的な市場を支援することによって、補償と同意モデルの構築をより確実にすることで、信頼可能で、安全かつ安心なAIシステムをトレーニングするための材料へのより一層の投資及び創出をさらに促す可能性がある。

・消費者保護
AIが生成したものは、消費者を誤った方向に導き、消費者の嗜好を形成し、消費者の情報に基づく選択を阻害する可能性がある。誤った又はミスリードな情報を通じてAIシステムが消費者の意思決定プロセスを歪めないことを確実にすることが、消費者の信頼維持と健全な競争環境の促進に欠かせない。

・プライバシーとデータ保護
AIシステムの開発及び学習には、しばしば、膨大な量の個人データの収集、統合、 処理及び使用が必要となる。それらのデータの取扱いは既存のプライバシーに係る規則及び法に完全に準拠しなくてはならない。個人データの保護は公共の信頼を維持し、個人の権利を尊重するAI開発のために重要である。AI関連市場における健全な競争は、有害な行動を抑え、プライバシー保護を推進することを可能とする。

・公平なアクセスと機会
市場における参入障壁の範囲は、AI市場におけるビジネスの機会、イノベーション及び成長に影響をもたらす。AIスタック全体(AIチップ、基盤モデルから下流のアプリケーションまで)における AIシステムの開発及び実装のためには、重要なインプットへの公平なアクセスの確保が必要である。
トレーニングデータなど、AIモデルのいくつかの要素のセットを公にして利用可能とすることの要求により、新規参入と機会創出を促進し得る。競合するAIシステム間の切り替えやそれらの複数利用のための柔軟性は、消費者、企業、競争及びイノベーションに恩恵をもたらすこととなる。」

5.先行研究

上述の「生成AIの機械学習用の著作物のライセンス市場が現に存在する以上、著作物を生成AIの機械学習で無断使用する行為は、著作物のライセンス市場での販売または潜在的販路を阻害し、著作権者の利益を不当に害する」理論については、
米イェール大学の教授の論文と、米ヴァンダービルト大学の教授らの論文においても言及されています。
同じような理論を考えている方々は、法学者にもおられるということになりますね。

・Jacqueline C. Charlesworth. (2024). Generative AI’s Illusory Case for Fair Use.
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4924997

(抄訳)
The narrative being promoted by AI companies and their defenders is that licensing content to train and develop AI systems is “impossible.”
But AI companies have demonstrated that they are capable of entering into license arrangements when they see value in the licensed content.
We are still in the early days of generative AI licensing, so the market is not yet mature. But it is active.
In addition to licensing deals for large corpora of works, we will likely see growth in niche markets for specialized content and works of individual creators who choose to participate.
AI企業とその擁護者により宣伝されている物語は、機械学習とAIシステムの開発のためのコンテンツのライセンスは「不可能」であるということです。
しかしながら、AI企業は、彼らがライセンスされたコンテンツの価値を見出した時に、ライセンスを取得する能力があることが実証されています。
作品の膨大な集積のためのライセンス取引に加えて、専門的なコンテンツと、(ライセンス取引に)参加することを選んだ独自性のあるアーティストの作品のためのニッチな市場が成長していることを見ることができるでしょう。

AI advocates have been known to assert that the appropriation of copyrighted works to develop
and operate AI models does not interfere with copyright owners’ legitimate economic interests
because the authors of books, movies and music did not produce those works with the intent of populating generative models.
AI擁護者は、著作権で保護された著作物を流用してAI開発をしており、本や映画や音楽の著作者は生成モデルに著作物を意図的に入れるように制作しているのではないから、AIモデルの利用は著作権者の正当な経済的利益を害さない、と主張することで知られています。

While such an assertion may be true as far as it goes, the claim is unconvincing.
Authors and artists of just a few decades ago likely did not anticipate that their works would be accessed and consumed through mobile phones or watches.
But no doubt they expected their copyrights to continue to protect the expressive content embodied in those works even if that content was exploited through means yet to be known.
そのような主張はそれが続く限りは本当なのかもしれませんが、説得力がありません。
たった数十年前の著者やアーティストは、彼らの作品が携帯電話や時計を通じてアクセスされ消費されることも予期していなかったでしょう。
しかしながら、たとえ知られていなかった不当な利用においても、著作者は彼らの著作権が彼らの作品の中で表現された創作的なコンテンツを保護し続けることを期待していたことは間違いないでしょう。

In evaluating market impact, it is critical to assess not only existing modes of exploitation, but future markets as well.As the Supreme Court has emphasized, the statutory mandate is to consider “‘the effect of the use upon the potential market for or value of the copyrighted work’” —not just the current market—including opportunities “that creators of original works would in general develop or license others to develop.”This includes potential markets for derivative uses.In other words, any potential market, including a nascent or still-developing market, is to be considered.
市場の影響の評価において、現に存在する利用形態だけではなく、将来における市場も重大です。最高裁が強調したように、法令の命令は「著作物の潜在的市場または価値に対する使用の影響」を考慮することであり、――現状の市場だけではなく――「オリジナルの作品の作者が通常の制作または他者に制作をライセンスすること」の機会を含みます。これは(著作物の)派生的な使用のための潜在的市場を含みます。言い換えれば、どの潜在的市場も、発生初期または発展途上の市場を含めて、考慮されます。

In American Geophysical Union v. Texaco Inc., for instance, the Second Circuit rejected Texaco’s fair use defense to unlicensed copying of journal articles for internal research purposes when licenses were available from the copyright owners.
The court determined that publishers’ lost licensing revenues would result in “substantial harm to the value of their copyrights.”
米ジオフィジカル・ユニオンとテキサコ社の訴訟において、たとえば、第二巡回裁判所は、著作権者からライセンスを得ることが可能であった場合に、テキサコ社が許諾なしで雑誌記事を複製した行為はフェアユースであるというテキサコ社の主張を否定しました。
裁判所は、出版社が逸失したライセンス収入は「彼らの著作物の価値に対する重大な侵害」となると決定しました。

As the Second Circuit has repeatedly affirmed, “‘[i]t is indisputable that, as a general matter, a copyright holder is entitled to demand a royalty for licensing others to use its copyrighted work, and that the impact on potential licensing revenues is a proper subject for consideration in assessing the fourth factor.’”
第二巡回裁判所が繰り返し断言しているように、「通常の問題として、著作権者が著作物を他者にライセンスすることに対する報酬を求める資格が与えられていることは自明であり、潜在的なライセンス収入は(フェアユースの4条件の)4番目の条件の評価において考慮される妥当な議題である」としています。

The licensing market for AI training materials is already far from hypothetical.
The fact that AI companies are commercially motivated entities, many with significant economic resources, points to continued growth in this area. The existence of a rapidly evolving market for materials to build and operate AI systems weighs powerfully against a finding of fair use that could extinguish that market.
AI機械学習の素材のためのライセンス市場は、すでに仮定の域から脱しています。
AI企業は商業的な動機のある存在であり、多くは大きな経済的資源を有しているという事実は、この分野で成長し続けていることを示しています。
AIシステムを開発および利用するための素材の市場が急速に発展していることは、その市場を消滅させることができるフェアユースの判定に強く反対することに影響します。

・DANIEL GERVAIS, HARALAMBOS MARMANIS, NOAM SHEMTOV, & CATHERINE ZALLER ROWLAND. (2024). THE HEART OF THE MATTER: COPYRIGHT, AI TRAINING, AND LLMS.
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4963711

(抄訳)
Finally, it should be noted that the reliance of AI companies on the contested use being transformative appears less tenable in light of the recent Supreme Court decision in Warhol.
In that case, the Supreme Court suggested that the key determination under fair use’s first factor relates to the nature of the challenged use.
最後に、最近のウォーホル裁判における最高裁判決に照らせば、(著作物との)競合した利用において変容性に依存したAI企業の主張は批判に耐え得るものではないように見えることは特筆すべきです。
そのケースでは、最高裁は、問題となった利用の性質に関連するフェアユースの第1条件において、鍵となる決定を示しました。

The fact that such use may be commercial in nature is also important; while not a decisive issue, commercial use weighs against fair use.
Importantly, according to Warhol when it comes to the nature of the challenged use, it is necessary to determine its purpose.
そのような利用は、おそらく経済的な性質もまた重要あり、決定的な問題ではないですが、経済的な利用はフェアユースに反するものとして影響します。
重要なことに、ウォーホル裁判によれば、問題となった利用の性質については、その目的を決定することが不可欠です。

If the challenged use has a similar purpose to that of the original, the entire first factor is likely to weigh against fair use.
As mentioned, the reason of ingesting copyrighted works into the encoder layer of an AI model is directly and unequivocally due to its expressive and aesthetic value.
It is due to their expressive and aesthetic value that such works are put into the marketplace.
Hence, the decision in Warhol further complicates the position of AI companies under the first fair use factor.
問題となった利用がオリジナルの著作物と同様の目的を持っている場合、(フェアユースの)第1条件においてフェアユースに反することに影響する可能性があります。
上述のように、AIモデルのエンコーダーレイヤーに著作物を取り込む理由は、直接的および明確に、その創作的、美術的な価値のためにあります。
そのような作品が市場に投入されるのは、それらの作品の創作的、美術的な価値によります。
従って、ウォーホル裁判の判決は、AI企業のフェアユースの第1条件における立場をさらに難しくします。

This position does not necessarily improve upon assessing the three remaining fair use factors.
The second and third factors, the nature of the copyrighted work and the amount and substantiality of the portion used, appear to weigh clearly against fair use.
The works in question are mostly highly expressive works and are copied and ingested in full.
この立場は、フェアユースの残りの3つの条件における評価をしても必ずしも改善することはありません。
フェアユースの第2条件および第3条件において、(AIモデルで使用された)著作物の性質と使用された部分の量と実質性は、明らかにフェアユースに反することに影響するようです。
問題となっている作品のほとんどは高度に創作的な作品であり、完全に複製され、(AIモデルに)取り込まれています。

Lastly “the effect of the use on the potential market for or value of the work,” could also weigh against fair use.
This is particularly so in light of the availability of licenses and AI companies’ growing tendencies to enter licensing arrangements with copyright holders.
最後に、(フェアユースの第4条件の)「著作物の潜在的市場または価値に対する使用の影響」もまた、フェアユースに反することに影響する可能性があります。
特に、(著作物の)ライセンスが利用可能であることと、AI企業が著作権者とライセンス契約を結ぶ傾向が高まっていることに顕著です。

For example, it has been widely reported that OpenAI entered a license with Axel Springer, News Corp, and Associated Press to use their articles in its products.
Such practices make any argument as to lack of impact on the plaintiff’s market less convincing.
If there is a market for licensing copyrighted work for ingestion in AI models, as clearly there is, then using such works in that way and without authorization clearly deprives the rightsholder of potential licensing fees.
たとえば、OpenAI社がアクセル・シュプリンガー社、ニュース・コープ社、AP通信社との間で記事を(生成AIの)製品に使用するライセンスを取得したことは広く報道されています。
そのような行為は、原告の市場への影響の欠如についての主張の説得力をなくします。
もし、AIモデルに取り込むための著作物のライセンス市場が存在した場合、明らかであるように、そのような作品を許諾なくその方法で使用することは、著作権者の潜在的なライセンス報酬を明らかに奪うことになります。

Notably, it was reported that OpenAI and the New York Times engaged in discussions to reach a commercial agreement for the use of New York Times content.
However, unlike the cases mentioned earlier, these negotiations were unsuccessful. As a result, the New York Times sued OpenAI and Microsoft for copyright infringement.
特に、OpenAIとニューヨーク・タイムズ社は、ニューヨーク・タイムズ社のコンテンツの利用についての経済的な合意に達することを議論していると報道されていました。
しかしながら、上記のケースとは違って、この交渉は失敗に終わりました。結果として、ニューヨーク・タイムズ社はOpenAI社とマイクロソフト社を著作権侵害で提訴しました。

In sum, while we are probably years away from peremptory rulings in some of the disputes that are presently pending, AI companies’ position under the fair use doctrine appears to be precarious, taking into account fair use jurisprudence and AI companies’ technological and business model.
要するに、私たちは、現状で未確定の論争のいくつかにおける絶対的な判決からはおそらく何年も離れていますが、
フェアユース法理とAI企業の技術的およびビジネスのモデルを考慮すると、フェアユース原則におけるAI企業の立場は不安定のように見えます。

 
以上