LAION-5Bと写真家の争い―ドイツ・ハンブルク地方裁判所判決(LG Hamburg, Urteil vom 27.09.2024 - 310 O 227/23)の私訳
※写真はブランデンブルグゲートです。
はじめに
海外ではニュースになっている、LAION-5Bによる機械学習(正確にはテキスト・データマイニング)のための著作物の複製行為が著作権者の複製権を侵害するか、それともテキスト・データマイニングのための複製として権利制限が認められて侵害を構成しないのかという事件。
2024年9月29日に判決が出たところ、結論としてはLAIONは著作権を侵害していないという判断でした。
これを報じる日本語メディアはあまりなく、また海外の記事でもブログや要約など判決文本文を忠実に日本語訳したものは見られないため、この記事で扱ってみようと思います!
判決文本文は以下のリンクから読むことができます。
翻訳上の注意
〇 「・・・」の部分はマスキングされています。具体的な名称が入りますので、原告(写真家)か被告(LAION)その他従業員を適宜補って読んでください。
〇「訴訟物である」(Streitgegenständlich)とはドイツ民事訴訟法上の用語のため直訳していますが、一般に読むときは「訴訟の対象となる」「争いの対象となる」あるいは「本件」と読み替えてもらっても差し支えありません。
※訴訟物理論については民事訴訟法の基本書を参照いただけますと幸いです。
〇その他、原語の直訳では意味が通りにくいものは括弧書きで対象となる語句を示しています。
※誤訳等あれば忌憚なくご指摘ください。
☆参照条文は長いので、本文を先に読みたい方はここをクリック。
参照条文
ドイツ著作権法
邦訳は公益社団法人著作権センター(CRIC)ホームページのドイツ著作権法のものを引用しています。https://www.cric.or.jp/db/world/germany/germany_c1a.html#1_3
DSM指令(2019/790/EU)
邦訳は公益社団法人著作権センター(CRIC)ホームページの「デジタル単一市場における著作権および隣接権に関するならびに指令96/9 / ECおよび2001/29 / ECを修正する2019年4月17日の欧州議会および欧州理事会指令(EU)」(https://www.cric.or.jp/db/world/EU/EU_I_index_02.html)を引用しています。
InfoSoc指令(2001/29/EC)
邦訳は、夏井高人「情報社会指令 2001/29/EC [参考訳]」法と情報雑誌第 2 巻第 11 号(2017 年11 月)を引用しています。
欧州AI法(53条1項)
判決文本文
主文
1 1.請求を棄却する。
2 2.訴訟費用は原告が負担する。
3 3.この判決は仮に執行することができる。 原告は、被告が強制執行前に執行されるべき金額の110%に相当する保証金を供託しない限り、判決に基づき執行可能な金額の110%に相当する保証金を供託することで、被告の強制執行を回避することができる。
事実関係
4 被告は、2021年7月7日の設立総会で設立された協会である(議事録は別添B7、定款は別添B1)。被告の活動の具体的な方向性[Zweckrichtung]は、当事者間で争われている。
5 被告は、いわゆる画像とテキストのペアからなるデータセットを「...」という名称で一般に無料で公開して利用可能にしている。そこでは、インターネット上で一般に公開されている画像または画像ファイルへのハイパーリンクを含む、一種のスプレッドシート文書や、画像の説明(代替テキストともいう)など、対応する画像に関する追加情報も含まれていることが問題となっている。このデータセットは、58億5000万の対応する画像とテキストのペアで構成されている。このデータセットは、いわゆる生成AIの学習に使用することができる。
6 このデータセットは、被告が2021年後半に設立された後に作成されたものである。この作成のために、被告は、インターネット上で見つかる画像のランダムなサンプル[zufällige Querschnitt]として、それぞれの画像コンテンツのテキストによる説明とともにそれぞれのURLが記載された、米国の既存のデータセット(www...org)にアクセスしていた。その後被告は、このデータセットから画像のURLを抽出し、それぞれの保存場所から画像をダウンロードした。次に、被告においてソフトウェアにより、既存のデータセットにすでに存在する画像コンテンツの説明が、実際に画像に表示されているコンテンツと一致しているかどうかが検査され、テキストと画像の内容が十分に一致しない画像は除外された。残った画像については、特に画像の保存場所のURLと画像の説明を含むメタデータが抽出され、新たに作成されたデータセットに追加された。ダウンロードされた画像ファイルがその後削除されたかどうかについて-少なくとも係争中の写真に関して—は、当事者間で争いがある。
7 前述の過程において、紛争の対象となっている画像もまた取得、ダウンロード、分析され、そのメタデータとともに当該データセット…に含まれていた。ダウンロードされたのは、具体的には画像エージェンシー[Bildagentur]のウェブサイトである、…(https://www...com)に掲載され、フォト・エージェンシーのウォーターマークが付与された画像ファイルであった。
8 画像エージェンシーのウェブサイトでは、少なくとも2021年1月13日以降、https://www...com/de/usage.htmlのサブページに以下のテキストが掲載されている。
9 「制限事項
禁止事項:
(...)
18. 自動化されたプログラム、アップレット、ボット、または同様のものを使用して、...comのウェブサイトまたはそのコンテンツにアクセスすること。これには、例えば、コンテンツのダウンロード、ウェブサイト上のコンテンツのインデックス作成、スクレイピング、またはキャッシュなどが含まれるが、これらに限定されるものではない。
10 原告は、分析過程の枠組において、被告による無許可複製という形で、争いの対象となっている写真の著作権を侵害したと非難した[rügt]。
11 原告は、主文の対象となっている写真の著作者であると主張している。…社は、ウェブサイト… .com上で係争中の写真を提供および表示する権利を有しており、また、その写真のライセンスを提供する権利も有していたという。なお、この点において、…社は単純なサブライセンス可能な利用権の保有者であった。
12 分析過程中に生じた—当事者間では争いのない—複製は、ドイツ著作権法(UrhG)16条による原告の権利を侵害しており、とりわけ複製権について、以下の通りドイツ著作権法44a条、44b条、60d条の権利制限には該当しないという。
13 すなわち、写真の独自なダウンロードは、この規範の意味における一時的行為ではないため、ドイツ著作権法44a条には該当しない。
14 また、この複製はドイツ著作権法第44b条の適用対象にもならない。AI学習を目的としたデータの集積は、ドイツ著作権法44b条の定義するテキスト・データマイニングには該当しないという。欧州あるいはドイツの立法者は、DSM指令第4条あるいはドイツ著作権法44b条の権利制限を定めた際には、このような利用を「想定」していないという。ドイツ著作権法44b条に定義されるテキスト・データマイニングは、「データの中に隠された情報」のみが「アクセスされるべきであるが、精神的な創作物の内容は使用されるべきではない」とされている。しかしながら、ここでのいわゆる「AIウェブスクレイピング」の場合、まさに学習目的で使用される作品の精神的な内容、そして「最終的には、同一あるいは類似した内容を持つ競合作品[Konkurrenzerzeugnisse]が創作されること」が問題であるとされる。さらに、被告自身の免責事項(47ページに印刷)によると、データセットは「キュレーションされていない」という。最後に、並列アーカイブの作成のための収集と保存は、立法者の明示的な意思に従って、ドイツ著作権法44b条の権利制限規定から除外されているという。
15 さらに、「生成AIの枠組における学習目的の著作権法上保護される著作物の大量取込[massenhafte Einverleben]」は、多くの場合において著作者(ら)に代わる、あるいは少なくとも自由な競業取引[Konkurrenzangebot]により著作物の利用を著しく困難にする前提を作出するため、著作物の通常の利用を損なうという。しかし、このことは、DSM指令第7条2項およびInfoSoc指令5条5項により、権利制限の適用と矛盾する。
16 いずれにしても、ドイツ著作権法44b条3項に従い、ウェブサイトであるwww.bigstockphoto.comで宣言された利用の留保により、複製は認められないという。画像エージェンシーによる同様の宣言は、原告に帰属するものとみなされるという。なぜなら、同エージェンシーは原告のために問題の写真を販売しているからである。被告の見解とは逆に、この留保はドイツ著作権法44b条3項2文の意味において機械可読なものでもある。この点に関する諸要件は、人間による機械可読の要件よりも高いものではない。しかし、留保条項は活字体で書かれている。付言すると、このテキストはコンピュータプログラムについての留保であることが認識できる。…サービスは、対応する留保を認識することができ、WebOpt-Outなどの特定のツールは、...comなどの留保を認識することができたものとされる。
17 さらに被告は、ドイツ著作権法60d条の例外を適用することもできないという。原告は、被告がドイツ著作権法60d条の要件を実際に満たしているかどうかについて異議を唱えている。すなわち、
18 ― すなわち、ここで問題となっている複製行為の時点で、被告が「協会登録簿に登録されていた」こと、
19 ― 被告によって提出された文書B1が、被告の有効な社団定款[Vereinssatzung]を表しているか、あるいは具体的な複製が行われた時点でこれが提示されていたこと、
20 ― 協会会員および理事会が名誉職として活動している、あるいは問題となっている複製行為時にそうであったこと、
21 ― 被告が専ら研究活動に従事している、もしくは具体的な複製行為時にそうであった、あるいは被告が科学的研究を行い、非営利目的を追求し、利益のすべてを科学的研究に再投資している、あるいは国家が承認した契約の枠組における公益活動に従事していること、そして被告が提出した定款によると、被告の目的は「研究の促進」のみであり、「研究」そのものではないこと、(争いなく)他社が利用可能な状態であった被告が作成したコレクション[Sammlung]にどのような研究が含まれるとされるのかも不明であること。
22 ― 被告が、AI技術の可能性をさらに探求するために、学習データに基づいて独自のAIモデルを作成し、これをテストしていること、
23 ― 学習データセットの一般に利用可能にするための提供[Zurverfügungstellen]は、他の研究者やステークホルダに独自のAIモデルを学習させる機会を提供することを目的としていること、被告自身の説明によれば争いの対象となっているデータセットは、学習にも使用されていた …社のサービス…、…、…の学習にも使用される予定であった。しかし、これらは(純粋な)営利企業によって運営されている。被告が最初の2つのサービスの学習を否定している限りでも、いずれにせよデータセットを使用することは可能であったはずである。
24 さらに、被告はドイツ著作権法第60d条2項3文に基づき、同法第60d条の特権を主張することはできなかったという。被告は明らかに営利目的のAIプロバイダーと密接に協力していたという。
25 ― 例えば、問題となるデータセットへの資金提供や、被告の関連する地位に自社の従業員を配置することで、被告に直接的な影響力を行使している民間企業…との協力関係があるようである。例えば、…は、創設者兼最高経営責任者との面談後に…データセットへの資金提供を行ったとされる。
26 ― さらに、被告の「Teams」のメンバーは、大規模なテクノロジー企業である…で従業員として働くなど、同じ分野で「多くの場所」で商業的に活動していた。
27 ― また、被告の共同設立者である…は、プラットフォーム「…」上のチャットで、2021年9月28日までに「…」の完成を急ぐよう被告に催促していた。なぜなら、彼らは「…」ないしその企業から5,000ドルの資金提供を受けていたからである。ここでは、データセットがまだ一般公開できない場合でも、データが(すでに)利用可能であったとされるべきであろう。上述の「…」とは、商業用AIのプロバイダーにおける従業員…のことである。
28 最後に、被告はいわゆる「単なる同意[schlichte Einwilligung]」を主張することはできてはいない。原告は、問題となる写真を自由にアクセスできるようにしたのではなく、有料のライセンス付与機関である…を通じて提供していた。
29 複製禁止に加え、原告は当初、写真が使用された範囲についての情報を請求していた。当事者らは合意の上で、この情報照会の請求は2024年7月11日の口頭弁論手続を期日にして決することを宣言した。
30 原告は現在もなお、
31 データセットの製造の枠組みにおいて生じた…のように、AI学習データセットの作成のために複製すること、および/または複製させることについて、個別の違反行為ごとに以下に示す写真の使用を、25万ユーロ以下の秩序金[Ordnungsgelds:「過料」に近い]、あるいは6か月以下の秩序拘禁[Ordnungshaft]を課すことを条件に、これを差し止めるよう被告に命じることを求める。
32 被告は、
33 訴えの棄却を求める。
34 被告は、原告が自ら問題の画像を作成した、あるいは、他の理由により画像にかかる権利を有している、原告が自身の名において侵害を主張する権利を有している、もしくは、被告が画像をキャプチャした時点で、原告が自身の名において問題の画像に関する侵害を主張する権利を有していた、という原告の主張に異議を唱えている。
35 しかし、とりわけデータセット作成の枠組における対象の画像の(1回限りの)ダウンロードは、著作権に関連する複製にあたるが、これは以下に示すようにドイツ著作権法の44a条、44b条、60d条の権利制限規定および原告の単なる同意によってカバーされる。
36 一方において、行われた複製はドイツ著作権法44a条の権利制限規定の対象となるという。被告は画像を恒久的に保存したわけではなく、むしろこの画像は分析のために短時間のみ使用されただけで、その後即時に、自動的かつ不可逆的に削除された。ここで、その複製には独立した経済的意義はないという。
37 ドイツ著作権法44b条の権利制限規定も適用されるという。画像ファイルの分析およびAI学習のためのメタデータの抽出は、立法者によると、テキストおよびデータマイニングの主な用途である。ダウンロードされた画像は恒久的に保存されることはなく、ハイパーリンクのみが含まれるため、デジタル並列アーカイブの作成も行われない。[そのため、]ドイツ著作権法44b条第3項の例外要件[Ausnahmetatbestand]は適用されない。
38 — 原告の主張によると、権利保有者である原告自身ではなく、第三者であるウェブサイト www...com の運営者がこの留保を宣言したという。原告自身は、2023年2月13日付の電子メール(添付資料 B5)で、利用留保を宣言するための資格も経済的手段も有していないことを明確に表明していた。
39 — さらに、ウェブサイト www...com の記載は一般的な文言にとどまり、さまざまな禁止行為が列挙されているため、留保は明示的に行われていません。テキストマイニングやデータマイニングも、複製も明示的に言及されていない。
40 — また、機械可読性のメルクマールも欠如している。自然言語で書かれた条項は、通常、ドイツ著作権法44b条3項の意味における機械可読性を有さない。この意味での機械可読性要件は、その条項がソフトウェアによって自動的に処理されうることであり、そのためには、対応する情報が符号化されていることが前提である。いずれにしても、「データマイニング」などの特定のキーワードが少なくともテキストに含まれていることが必要であるという。
41 — また、その留保はドイツ著作権法44b条3項に定める留保とは明確に異なるものである。原告主張によると、この条項は2021年1月13日にはすでにこの形でウェブサイトに存在していたはずであるという事情が明らかであるから、この条項が「ドイツ著作権法44b条3項の規定を考慮して」作成された可能性はないだろう。なぜなら、その時点ではまだこの法律上の規定は発効していなかったからである。付言すると、米国のプロバイダーが-ドイツ法に基づく―利用の留保を主張するのも「信頼することもできない」とされた。
42 いずれにしても-被告は-ドイツ著作権法の60d条の権利制限規定を主張できる。
43 被告は研究者からなる非営利団体であり、その団体規約(付録 B1)によると、研究に専念してきており、特に、人工知能の観点から自己学習アルゴリズムをさらに発展させ、それを一般に公開するという意味で、これを使命としている。この目的のために、データセットとモデルを無料で提供し、学習データに基づいて独自のAIモデルを作成し、テストも行っている。
44 -被告の活動は「研究」でもある。学習データセットがどのように作成されたかをインターネット上で公開することによってのみ、被告はAIの学習に関する知見の獲得に寄与しているという。このようにして、他の研究者はデータセットの作成手順を理解し、それを基に構築することができる。さらに、被告は…という係争中のデータセットに関する科学論文「…」を2022年9月17日に初めて発表した(別紙B8)。2024年4月5日までに、当該論文は他の科学論文で合計1403回引用され、さらに別の賞も受賞した。
45 -また、被告は、適切な学習によってAIをどのように改善できるかについての知見を得るために、自ら作成したデータセットに基づいて独自のAIモデルを学習させている。
46 -被告に所属する自然人、すなわち取締役およびその他の団体構成員も「研究者」である。原告が大手テクノロジー企業で同じ分野に従事するチームメンバー個人について言及していることは、被告自身が商業的活動に従事しているかどうかという問題とは無関係である。さらに、その関係者は被告でボランティアとして働いているため、生計は別の場所で得なければならないという。
47 被告により一般に利用可能となっているデータセットが商業的サービス提供者によっても利用されているという事情は、ドイツ著作権法第60b条の権利制限規定の介入とは関係がない。それを措くとしても、サービス…および…は、実際には被告のデータセットで学習されたものではない。
48 ドイツ著作権法60d条2項3文で規定されている再例外[Rückausnahme]は、本件にも適用されない。確かに、…社は、実際には設立段階において計算リソースを被告に利用可能な状態にしたが、…によって同様に提供されたという。被告は…から金銭による経済的支援を受けていない。また、この企業とのさらなる協力関係もなかったという。いずれにしても、…は研究成果への優先的なアクセス権を有していない。また、…は…社に決定的な影響力を持っているわけではない。同社およびその法定代理人はいずれも被告の構成員ではない。
49 最後に、原告は被告による使用について、いわゆる単なる同意を与えているという。問題となる複製は、通例的な利用行為に分類される。
50 付言すると、原告自身がAI生成画像で金銭的収益を得ていることは指摘されるべきである。これは、原告の「権利保護の必要性[Rechtsschutzbedürfnis]」を疑問視させるものであるという。
51 当事者の提出書類の詳細に関しては、口頭弁論の対象となっている限りにおいて、訴状およびファイルに追加された添付書類、ならびに2024年7月11日の審理記録(120~123ページ)を参照されたい。
52 当事者は、2024年8月29日および9月11日付(原告)ならびに9月20日付(被告)の未確定の答弁書をファイルに提出した。
理由
53 Ⅰ.
54 [本件において]許容された訴訟は、本件においては認められない。被告は訴訟物である写真を複製することで、確かに原告の利用権を侵害した。しかし、この侵害は、ドイツ著作権法60d条に規定された権利制限に該当する。被告がドイツ著作権法44b条の権利制限規定を補充的に援用できるかどうかは、この観点から見て最終的な評価を必要としない。
55 いずれにしても、訴訟物である写真は、ドイツ著作権法 72条1項 に基づき、写真[Lichtbild]として保護されている。原告のラップトップの生データを観察した結果、裁判所は、原告がドイツ著作権法72条2項による写真家の身分について疑いを差しはさむ余地はない。原告は、ドイツ著作権法97条に基づく侵害[回復]請求権[Verletzungsansprüchen]の行使についても積極的に認められ、同条1項に基づく不作為請求権[Unterlassungsanspruch]も含まれる。被告は、原告がフォト・エージェンシー…に(サブライセンス可能な)単なる利用権より広範な利用権を認めたとは説明していない。フォト・エージェンシー…は、ウォーターマーク入りの写真を提供しており、これはドイツ著作権法23条1項1文の意味での自由ではない改作にあたるため、その利用には原則として著作者としての原告の同意も必要であった。ダウンロードの過程において、被告はその版[Fassung]につき、原告の同意を得ることなく、ドイツ著作権法16条1項の意味での複製を行ったのである。
56 もっとも、これについて被告は法律上の許可により、その行為をする権利を有していた。当該複製はドイツ著作権法44a条の権利制限規定(以下1.)の対象とはならず、さらに被告にドイツ著作権法44b条の権利制限規定(以下2.)を適用できるかどうかは疑わしいように思われる。しかし、後者は本件において最終的な判断を必要としない。なぜならば、当該複製はいずれにしてもドイツ著作権法60d条の権利制限規定の対象となるからである(以下3.)。
57 1.
58 行われた複製は、ドイツ著作権法44a条の権利制限規定の対象とはならない。
59 それよると、過渡的または付随的で、技術的過程の不可欠かつ本質的な一部を表し、仲介者を通じた第三者間のネットワーク上での送信あるいは著作物またはその他の保護対象物の合法的な利用で、独立した経済的意義を持たないことを唯一の目的とする、一時的な複製行為[vorübergehende Vervielfältigungshandlungen]は許される。
60 本件においてなされた複製は、もはや一時的でも付随的でもない。
61 a)
62 ドイツ著作権法44a条における一時的とは、当該技術的過程の適切な機能に必要なものに限定される場合の複製であり、この過程は、当該過程を可能にする機能が果たされた時点で、自動的に、すなわち自然人による関与なしに消去されるように自動化されていれなければならない(EuGH, Urt. v. 16.07.2009, Az. C-5/08 – Infopaq/Danske Dagblades Forening, Rn. 64 (juris) zu Art. 5 Abs. 1 DSM-RL) 。
63 この点において、被告が実施した分析過程のなかで「自動的に」ファイルが消去されたと主張する限りにおいて、これに前述の意味における複製の一時性を根拠づけることはできない。被告がその保存の具体的期間に関する情報を一切提供していないということ措くとしても、その消去は「ユーザー依存ではない」ものではなく、むしろ被告がそれと知りながら対応する分析過程をプログラムしたことによる結果である。
64 b)
65 ドイツ著作権法44a条の意味における付随的とは、その一部となる技術的過程から独立していなければ、ある独立した目的に資するでもない場合における複製である。 (EuGH, Urt. v. 05.06.2014, Az. C-360/13, Rn. 43 (juris).
66 本件においては、特定のソフトウェアを使用して分析するためにその画像ファイルの意図的なダウンロードがなされた。そのため、このダウンロードは行われた分析の単なる付随的過程ではなく、分析に先立って意識的かつ能動的に制御された入手プロセス[Beschaffungprozess]である。
67 2.
68 被告がドイツ著作権法44b条の権利制限規定を援用できるかどうかについて本件では、まったくもって疑わしいものと思われる。被告のダウンロードは、原則としてドイツ著作権法44b条2項の権利制限規定の対象となるが、特に、ドイツ著作権法44b条1項に定めるテキストおよびデータマイニングの目的で実施された(以下、a))。もっとも、― このことをもって本件における最終的決定を求めるものではないが ― 44b条3項の意味における有効に宣言された利用の留保に基づき、この複製行為はドイツ著作権法の第44b条2項ではすでに許容されるものではないといういくつかの事項がある(以下、b))。
69 a)
70 訴訟物たる複製行為は、原則としてドイツ著作権法44b条2項の権利制限規定の対象となる。
71 (1) 訴訟物であるダウンロードは、ドイツ著作権法44b条1項にいうテキスト・データマイニングの目的で行われたものである。これによると、テキスト・データマイニングとは、特にパターン、傾向、相関関係に関する情報を得るために、1つあるいは複数のデジタル作品あるいはデジタル化された作品を自動的に分析することである。これは、訴訟物である本件複製行為については、いかなる場合でも肯定されるべきである(以下(a))。その限りにおいて、権利制限要件の範囲を目的論的に縮減することは考慮されない(以下(b))。
72 したがって、本件では、AIの学習全体がドイツ著作権法44b条の権利制限規定の対象となるか否かという、文献で詳細に議論されているさらなる問題について判断する必要はない(見解の立場についての詳細な議論については、BeckOK UrhR/Bomhard, 42. Ed. 15.2.2024, UrhG § 44b Rn. 11a-11b m.w.N.; この点については、Initiative Urheberrechtの委託による研究である「Urheberrecht & Training generativer KI-technologische und rechtliche Grundlagen」という、別紙K11も参照のこと)。
73 (a) 被告は、ドイツ著作権法44b条1項の文言上の意味における「相関関係」についての情報を取得する目的で複製行為を行った。被告は、すでに利用可能なソフトウェア― …から…を利用したのだろう― を使用して、テキスト用にすでに保存されている画像説明と画像内容を比較するために、訴訟物である写真を元の保存場所からダウンロードした。既存の画像説明の比較のための画像データ分析は、容易に「相関関係」(すなわち、画像と画像説明の一致/不一致の問題)に関する情報を取得するための分析を表している。被告がデータセットに含まれる画像をこのように分析したという事実は、原告側においては特に争われてはいない。
74 ドイツ著作権法第44b条1項の適用可能性は、 ―原告の見解(答弁書13頁以下、訴訟記録47頁以下)とは逆に― 被告により…というデータセットに対して表明された「免責条項[Disclaimer]」によると、被告が「管理して[kuratiert]」いるわけではない。原告側が引用した免責条項は、データセットが「不適切な内容[verstörenden Inhalten]」等が検索されたものによらないという警告のみに言及している。しかし、作成されるデータセットに―追加の―フィルタリングを行うことは、ドイツ著作権法44b条1項の適用要件ではなく、ダウンロードされた画像が―前述の通り―画像内容と画像説明の相関関係について分析されたという想定を妨げるものではない。
75 (b) 訴訟物である複製行為は、ドイツ著作権法44b条の権利制限規定の目的論的な縮減によってその適用を排除することはできない。
76 ドイツ著作権法44b条が「データに埋め込まれた情報」の解明のみを対象とし、「精神的創作の内容」の利用は対象としていないという、文献において時折根拠をもって説明される目的論的還元法で、AI学習を目的としたデータの複製の削除を把握する限りで(Schack, NJW 2024, 113;同じ方向づけとして意味論と統語論の区別も行うDormis/Stober, Urheberrecht und Training generativer KI-Modelle, Anlage K11, S. 67 ff.も)、これが説得的なものでありうるかどうかは疑問がある。なぜなら、デジタル化された著作物において「データに埋め込まれた情報」と「精神的創作の内容」の差異が存在するのが十分に明確ではないからである。
77 さらに、「AIウェブスクレイピング」は、学習目的で使用される著作物の精神的内容に関するものであり、「最終的には」同一あるいは類似の競合作品を創出することに関するものであると補足的に述べる限りで(Schack, a.a.O[前掲]) 、この論証は委員会の見解によれば、この主張は厳密に区別するには不十分であるという。すなわち、
78 -一方では、AI学習—にも―使用できる(ここでただ一つの訴訟物である)データセットの作成、
79 -他方では、このデータセットを使用した人工ニューラルネットワークの以後の学習、
80 -そして第三に、学習済みのAIを使用した新しい画像コンテンツの作成、である。
81 この最後の機能性は、確かに学習データセットを作成する時点で既に目的となっているかもしれない。しかしながら、学習データセットが編成される時点では、第2段階(学習)が成功するかどうか、また第3段階(AIが使用される場合)で学習されたAIがどのような具体的なコンテンツを生成できるかを予見することはなおできない。AIのような急速に発展する技術の具体的な利用可能性は、学習データセットが作成された時点では完全に予測することはできず、それにゆえに法的安定を確立させることできない。このような法的不確実性があるため、学習データセットを作成する際に将来的にAIが生成するコンテンツを取得しようとするという当初の一般的な意図のみでは、学習データセットの作成それ自体の法的許容を評価する基準としては適切ではない。
82 最後に、ドイツ著作権法44b条の権利制限規定の目的論的縮減に関しては、その基礎となる指令規定(DSM指令第4条)が2019年に創設された際、欧州の立法者は「AI問題」が「まったく画面上に[auf dem Schrim]」映っていなかったという主張(Schack, a.a.O.; AIモデルの学習についてはDormis/Stober, a.a.O., S. 71 ff., 87 ff.も同様)について、この所見だけで目的論的縮減については明らかに不十分である。ここではとりわけ、2019年以降、いわゆるAIの領域における技術開発は、学習データの入手のための(訴訟物となっている)データマイニングの性質や範囲よりも、むしろそのデータで学習された人工ニューラルネットワークの性能に関わるものとなっていることを顧慮すべきである (これに対応して、Dormis/Stober, a.a.O., S. 95も、「実際の学習に先立って」学習データセットを単に作成するだけでも、TDM [テキストデータマイニング]-権利制限に該当するだろうと想定している)。また、被告がアクセスしたCommon Crawl Foundationデータベースは2008年(!)から設立されていることも留意すべきであろう(https://commoncrawl.org/overviewを参照)。
83 いずれにせよ、そこから出発して、現在の欧州のAI規制(2024年6月13日規則(EU) 2024/1689、2024年7月12日付官報, 1頁). 人工ニューラルネットワークの学習を目的としたデータセットの作成も、DSM指令第4条の権利制限規定の対象となることを疑いなく明確に表明した。これは、欧州AI法53条1項c号によると、汎用AIモデルの提供者は、DSM指令第4条3項に基づく権利留保を決定し、遵守するためのストラテジーを提供することが義務付けられているためである。
84 付言すると、人工ニューラルネットワークの学習を目的としたデータセットの作成も、DSM指令第4条の権利制限規定の対象となるという事実も、2021年に前述した権利制限規定が実施されるという枠組におけるドイツの立法者の評価と一致している(Begr. RegE BT-Drs. 19/27426, p. 60)。
85 (c) (DSM指令7条2項1文と関連する)Infosoc指令5条5項に定められるいわゆる3段階テストも、最終的には他の評価を正当化するものではない。したがって、著作物あるいはその他の保護対象物の通常の利用で[権利を]侵害しない標準化された例外は、かつ権利保有者の正当な利益が不当に害されないような特定の特別事例にのみ適用される。本件では、これらの要件は満たされている。
86 本件の著作権法で関連する複製は、既存の画像の説明との適合性について画像ファイルを分析し、後続するデータセット作成を目的とするものに限定されている。この使用によって問題となっている著作物の利用可能性が侵害されることは明白ではなく、原告側によって主張されているわけでもない。
87 確かに、この態様で作成されたデータセットは、その後、人工ニューラルネットワークの学習に使用される可能性があり、その過程で生成されたAI生成コンテンツが(人間の)著作者の著作物と競合するだろう。しかしこれだけでは、学習用データセット作成の段階で、Infosoc指令5条5項の意味での著作物の利用権の侵害とも見なすことはできない。このことは、まだ詳細に予見できない将来の技術的発展を顧慮するだけでは許容される使用と許容されない使用の法的確実な区別ができないという理由のみをもって妥当するものでなければならない(上記(b)も参照)。
88 現在の技術開発を踏まえると、テキスト・データマイニングによって得られた知見が人工ニューラルネットワークの学習に使用され、著作者と競合する可能性が排除されることは決してありえないため、このような反論的解釈[Gegenauffassung]は、最終帰結において、ドイツ著作権法44b条の規定に基づくテキスト・データマイニングは、究極的には全面的に禁止しなければならない。しかし、このような権利制限規定の全面的な停止は、明らかに立法者の意図に反するものであり、したがって、正当な解釈とはなり得ない。
89 (2) 被告がダウンロードした画像ファイルは、―ちなみに、原告が異議を唱えていないが―ドイツ著作権法44b条 2 項 1 文の意味で適法にアクセスされたものでもある。
90 この意味において、特にインターネット上で自由にアクセス可能な作品は「適法にアクセス可能」である(Begr. RegE BT-Drucks. 19/27426, p. 88)。
91 ここから、被告によってダウンロードした画像についても当てはまるものである。原告側の当初の申立とは異なり、被告は、請求理由で最初に作成された不作為申立書に複製された—ライセンスを購入していればフォト・エージェンシー…から入手可能だったであろう―「オリジナル画像」をダウンロードしたわけではなく、画像エージェンシーのウォーターマークが入った画像のバージョンであった。ここでは、明らかに広告目的で言わばエージェンシーのウェブサイトに掲載されたプレビュー画像である。しかし、代理店はウォーターマーク入りのこのプレビュー画像をインターネット上で自由にアクセスできるようにした。
92 b)
93 もっとも、ドイツ著作権法44b条2項の権利制限規定が―最終決定を必要とせずに―本件には適用されないことを示すいくつかの兆候がある。なぜなら、規則第3項に定める使用予約が有効に宣言されていたためである。特に、ウェブサイト...com上で宣言された利用の留保は、ドイツ著作権法44b条3項2文の機械可読性の要件を満たしていることは明白である。
94 (1) エージェンシーのウェブサイトに記載された利用の留保は、この権限を有する人物によって記載されたものであり、原告も自身の権利保護のためにこれを利用できるということは幾許有利なものとなっている。
95 ドイツ著作権法44b条3項の文言によると、「権利保有者」は利用の留保を記載できる。したがって、著作者自身の留保の宣言だけでなく、その後の権利保有者、すなわち権利承継者あるいは著作者から派生した権利保有者の宣言も考慮すべきである。原告の最終的な申立によると(Protokoll v. 11.07.2024 S. 3, Bl. 122 d.A.) 、原告は写真エージェンシー...にオリジナル画像のサブライセンス可能な単純な利用権を写真代理店に付与している。 それゆえ写真エージェンシーは、自らのサイトに掲載された画像の権利者であったため、ドイツ著作権法44b条3項に従って利用の留保を容易に表明することができたのである。その限りで、原告と写真エージェンシー間の契約関係における物権的に作用する協定がこれを妨げたということが、明白なものでもなければ主張もされていない。
96 また原告は、ライセンシーによる留保の宣言を引き合いに出す権利も有している。経済的に考慮すると、訴訟物であるオリジナルの写真は、エージェンシーによって利用されたものである。それとともに、実際にはどの第三者にどのような方法で写真を利用する権限を与えるかを具体的に決定する責任はエージェンシーにあり、エージェンシーには締結義務はなかった。このような状況において、当裁判所は、著作者が自身に残された禁止権を主張する際に、ドイツ著作権法44b条3項に従って、ライセンシーが宣言した留保を援用することが許されると考える。
97 (2) 被告の異議は、普通約款取引においてエージェンシーがその顧客に対して明記されたウェブクローラの使用禁止が、「ドイツ著作権法第44b条3項に関して」時間的に定められたものではないという点も無関係である。 この宣言の法的効果には、特定の法律のバージョンを意識して行われることは前提とされない。
98 (3) 留保もまた、十分な明確性をもって定められている。DSM指令第4条3項は、利用留保を明示的に宣言することを求めている。したがって、この明示性要件は、指令に適合するドイツ著作権法44b条3項の解釈においても考慮されなければならない(Begr. RegE BT-Drs. 19/27426, 89も参照)。それゆえに明示的な留保は、(推断的[konkludent]ではなく)明記[expressis verbis]されなければならず、また、特定の内容と特定の用途を明確にカバーするよう、明確(かつ具体的で個別に)宣言されなければならない(Hamann, ZGE 16 (2024), p. 134)。 画像エージェンシー…のウェブサイト上で定められた利用の留保は、これらの要件を容易に満たしている。
99 さらに、ウェブサイトに掲載されたすべての作品に対する権利留保の宣言は、ドイツ著作権法第44b条3項の明示性の要件に反するという主張(自身の抽象的導出の延長においてHamann, a.a.O., S.148のようなもの)は説得的ではないだろう。なぜならウェブサイトに掲載されたすべての著作物について明示的に宣言されている権利留保の範囲と内容は疑いの余地なく決定できるため、明示的に宣言されているからである。
100 (4) 最後に、利用の留保がドイツ著作権法第40b条3項2文の意味における機械可読性の要件を満たしていることを示す証拠もあるかもしれない。
101 ここで「機械可読性」という概念は、確かにウェブクローラによる自動クエリを可能にするという立法者意思を踏まえ(Begr. RegE BT-Drucks. 19/2 7426, S.89)、「機械理解可能性」という意味で解釈されるべきである(意見の立場の詳細な議論については Hamann a.a.O., S. 113, 128 ff.)。
102 むろん、裁判所は「自然言語」のみで定式化された利用の留保も「機械が理解できる」とみなす傾向にある(文献における一般的な見解とは対照的である。s. Hamann, a.a.O., S. 131 ff., 146 ff. m.w.N。 意見の立場の状況については、被告代理人であるAkinci/Heidrichによる寄稿(IPRB 2023, 270, 272)を参照されたい。同寄稿は、どうやら法廷見解も代表しているようである。もっとも、判決が下されるまでに、当裁判所はその寄稿に直接アクセスできなかった)。しかし、「自然言語」で表明された留保が、どのような特定の条件のもとで「機械が理解できる」ものともみなされるかという問題については、常に、使用時点での技術開発の状況との関連で回答しなければならないものである。
103 それに対応して、欧州の立法者はAI規則においても、AIモデルの提供者は、特にDSM指令4条3項に従って主張される権利留保を決定し、これを遵守するためのストラテジーを策定しなければならないと規定している(欧州AI法53条1項c号)。しかし、これらの「最先端技術[modernsten Technologien]」については、自然言語で記述されたテキストを内容上把握できるAIアプリケーションが明確に含まれるものである(ちなみに、当裁判所は直接入手できなかった当該被告の支持者であるAkinci/Heidrichによる寄稿であるIPRB 2023, 270, 272やここで引用したHamann, a.a.O. S. 148によると、後者は技術観点から原則としてこの可能性を肯定している。a.a.O.)この限りにおいて欧州AI法の立法者は「最先端技術」に言及することで、まさにこのようなAIアプリケーションを念頭に置いていたことが示唆される。
104 このような見解に反対する意見もある。すなわち、循環論法につながるというのだ。テキスト・データマイニングの運用者[Betreiber]が、利用留保が宣言されているかどうかを確認するためにAIアプリケーションを使用することが求められる場合、このAIベースの検索は、自らの側でドイツ著作権法44b条1項の意味におけるテキスト・データマイニングの要件をすでに満たしているパターン分析を必要とする。 すなわち、その利用が許容されるかどうかは、権利制限規定の適用によって決定される(Hamann, a.a.O., S. 148)。当裁判所はこの評価に同意しない。著作権法に関連し、正当化を必要とする利用行為は、前述の意見とは逆に、それ自体が「パターン分析」の実行ではなく、ドイツ著作権法16条の意味における著作権上保護される著作物の複製である。インターネット上でそのような著作物を事前に発見し、ドイツ著作権法第44b条3項2号の意味における留保が宣言されているかどうかを確認することは、必ずしも、ドイツ著作権法第44b条1号の意味における、さらに上流のテキスト・データマイニングを必要とするわけではない。なぜなら、すでにドイツ著作権法44a条のもとで正当化される過渡的かつ付随的な複製において、ウェブクローラを使用したウェブサイトコンテンツの処理を特に考慮する必要があるからである。
105 さらに、当裁判所が検討した「機械可読性」概念のさらなる理解についても異議が唱えられている。この概念は、欧州の立法者によって異なる連関でより狭義に解釈される。この関連で、PSI指令(指令(EU)2019/1024)の35項を引用すると、この指令の意味における「機械可読性」には「単純な」認識可能性が特に必要であると規定されている(BeckOK UrhR/Bomhard, 42. Ed. 15.2.2024, UrhG § 44b Rn. 31 m.w.Nなど)。自然言語のみで表現された留保については、このことを想定することはできない。むろん、このような論証は、両指令の概念性が同じように理解されなければならないことを前提としている。当裁判所は、このような概念の同一視が説得力を持つかどうか疑問を抱いている。なぜなら、両指令の目的が以下のように異なるからである。すなわち、PSI指令が公衆の純粋一方的な情報へのアクセスあるいは公的部門[öffentlichen Hand]の純粋一方的な特定の情報を公開する義務を対象とするに対し、DSM指令4条3項は、テキスト・データマイニングの利用者の利益(これを可能な限り単純かつ法的確実に運用できるようにすること)と権利保有者の利益(その権利を可能な限り単純かつ効果的に保護すること)のバランスを考慮している。裁判所の解釈によれば、利用者にとって最も単純な技術的解決は、表明された利用の留保の有効性で足りるとみなすことによって、これら利益衡量はテキスト・データマイニングの利用者に有利な形で片面的に解消することはできない。このような理解は、前文[Erwägungsgrund]の18項において、留保の明示を「可能な限り単純に読み取れる方法」を求めてはおらず、単に「適切な方法」を求めるにすぎないDSM指令の立法者の評価とも矛盾する。また、ドイツの導入立法者[Umsetzungsgesetzgeber]も、「テキスト・データマイニングにおける自動化プロセスに適した」方法での宣言のみを求めている(Begr. RegE BT-Drucks. 19/27426, S. 89)。
106 さらに、当裁判所の見解では、AIモデルの提供者により強力なテキスト理解およびテキスト生成型AIモデルの開発を許可することは、一方でドイツ著作権法44b条2項の権利制限によって、より計算性能のあるテキスト理解・テキスト作出型AIモデルの開発が可能となるが、他方でドイツ著作権法44b条3項2文の権利制限の枠組においては既存のAIモデルの使用を要求しない。
107 2021年の訴訟物である複製行為の時点で、訴訟物である利用の留保を自動的にコンテンツに関連付けて記録するのに十分な技術がすでに利用可能であったかどうか、またどの程度利用可能であったかについては、原告はまだ立証していない。この点について、原告は2023年に利用可能なサービスについて言及しているだけである(事件記録14頁以下, 48頁以下)。むろん、被告がすでに適した技術を自由に利用できる状態にあったことを示す兆候がある。なぜなら、被告自身の提出書類によると、データセット…の作成の範囲で行われた分析は、 既存の画像説明と画像コンテンツの比較という形式で、明白かつまさに、使用されたソフトウェアを通じてこれらの画像説明の内容を把握することが必要とされたからである。こうした背景から、そのいくつかは―特に被告に対して―自然言語で表現された利用の留保を自動的に把握できるシステムが2021年にはすでに利用可能であったことを示すものとなっている。
108 3.
109 しかしながら被告は、訴訟物である複製に関して、ドイツ著作権法60d条の権利制限規定を援用することができる。
110 それによると、研究機関による学術研究の目的のためのテキスト・データマイニングのための複製は許される。
111 a)
112 ―前述の通り―その複製はドイツ著作権法44b条1項の意味でのテキスト・データマイニングの目的で行われた。さらに、ドイツ著作権法第60d条1項の意味での学術研究の目的でも行われた。
113 学術研究とは一般的に、方法的かつ体系的に新しい知識を探求することを指すものである(Spindler/Schuster/Anton, 4. Aufl. 2019, UrhG § 60c Rn. 3; BeckOK UrhR/Grübler, 42. Ed. 1.5.2024, UrhG § 60c Rn. 5; Dreier/Schulze/Dreier, 7. Aufl. 2022, UrhG § 60c Rn. 1)。「学術研究」という概念は、すでに新たな知見を得るための方法的かつ体系的な「探求[Streben]」で十分とされることにより、知見獲得に結び付く作業段階のみをカバーするように狭義に解するべきではない。むしろ、問題となっている作業段階が(後の)知見獲得を目的としているだけで十分である。例えば、後に経験的な推論を導くためには、まずは多数のデータ収集を行わなければならない場合などである。特に、学術研究概念は、その後の研究の成功を前提としていない。
114 したがって―原告の主張とは反対に―AIシステムの学習の基礎となりうる、訴訟物であるのデータセットの作成も、すでに上記の意味での学術研究とみなすことができる。データセットの作成自体は、確かにまだ知見の獲得とは紐づいていないかもしれないが、それは、後に知見を得る目的でデータセットを使用することを目的とした基礎的な作業段階である。このような目的設定が本件においても存在していたことは肯定できる。これについては、データセットが―争いなく―無償で公開され、それにより人工ニューラルネットワークの分野の研究者らに(も)利用可能となったことだけで十分である。データセットが―原告がサービスに関して主張しているように― 営利企業がAIシステムの学習あるいはさらなる開発にデータセットを使用しているかどうかは、営利企業の研究も依然として研究であるため、―それ自体としてドイツ著作権法60c条により特権化されてもいない場合は―重要ではない。
115 この背景において、被告が、対応するデータセットの作成に加えて、独自のAIモデルの開発という形での科学研究も行っているかどうかという、当事者間で争われている問題は重要ではない。
116 b)
117 被告は、ドイツ著作権法第60d条2項1号の意味における商業目的も追求していない。
118 研究が非商業的であるか否かは、具体的なの学術活動の種類のみに従事することのみが重要であり、研究実施機関の組織や資金調達は考慮されない(InfoSoc指令前文第42項)。
119 被告が訴訟物であるデータセット…を作成する目的が非商業的であることは、被告が争いなく無料で一般に公開し利用可能にしているという事実から明らかである。また、訴訟物であるデータセットの開発は、少なくとも被告自身の商業的オファーの開発にも資するという事実(この基準についてはBeckOK IT-Recht/Paul, 14. Ed. 1.4.2024, UrhG § 60d Rn. 10を参照)については、原告側も主張していなければ、いまだ明白でもない。訴訟物であるデータセットが商業的企業によるAIシステムの学習やさらなる開発にも使用される可能性があるという事実は、被告の活動の分類には関係しない。被告の個々の構成員が、団体での業務に加えて、そのような企業のために有償的活動も行っているという事情だけでは、これら企業の活動を被告自身の活動に帰するには不十分である。
120 c)
121 被告は、ドイツ著作権法60d条の権利制限を援用することは、同規定の2項3文によっても妨げられない。
122 これによると、一定の影響を研究機関に与え、学術研究の成果に優先してアクセスできる私企業と協働する研究機関はドイツ著作権法60d条の権利制限を援用することはできないドイツ著作権法第60d条2項3文に基づく反対除外[Gegenausschlusses]の事実上の要件に関する立証負担は、規範の文言に従えば、原告にある。
123 (1) 当初、原告が答弁で指摘したように、…社が訴訟物であるデータセットの資金提供と自社の従業員による被告の「関連ポスト」への配置を通じて、被告に直接的な影響力を行使しているという点について(Replik S. 18, Bl. 52 d.A.)、この主張には実質において欠陥がある。
124 この点について原告は、被告の共同設立者の1人である…氏が、…を「機械学習業務部長[Head of Machine Learning Operations]」として任用したこと、および被告の従業員の別の構成員である…氏が…を「リサーチ・サイエンティスト[Research Scientist]」として任用したことを指摘しているにすぎない(Replik S. 4 f., Bl. 38 f. d.A.)。しかし、2人の団体構成員が…社において従事しているという事実だけでは、その企業が被告研究業務に決定的な影響力を持っていることを裏付けるものではない。
125 それを措いても、原告は被告が…社に、学術研究結果、すなわち訴訟物であるデータセットへの優先的アクセスを認めたと主張さえもしていない。むしろ、この点においては、…が訴訟物であるデータセットの助けを得て、サービス…を学習したと主張されているのみである(Replik S. 8 f., Bl. 42 f. d.A.)。
126 (2) 原告が2024年7月3日付書面で、2021年に…のプラットフォーム上で交わされたチャットについて言及している点において、それによれば、被告の共同創設者である…氏は、5,000ドルの出資を条件に、同社に(当時より規模の小さい)データセットへの早期のアクセス権を与えることに同意したとされている。しかし、この申立も、ドイツ著作権法第60d条第2項第3文の例外規定を満たしていない。
127 ここでは、—被告はこのことを争っていないが(vgl. Schriftsatz vom 09.07.2024 S. 3, Bl. 112 d.A.)―チャット履歴が原告の解釈を裏付けるかどうかは未確定である。同様に、早期アクセスを許可する意思の宣言が、—原告は実際に許可されたかどうかについては主張していないが―ドイツ著作権法60d条2項2文の意味における研究結果への優先的アクセスを許可するのに十分でありうるかどうかについても未確定である。
128 ゆえに、いずれにしても、原告側によって示されたわけでもなく、また、それ以外にも明らかではないが、…社が被告に決定的な影響を及ぼすことはない。総じて、被告とAI業界の企業との人的な関連[personelle Verflechtungen]が示されている限りにおいて、…社と…の問題となる(Replik S. 4 ff., Bl. 38 ff. d.A.)。
129 II.
130 訴訟費用に関する決定は、ドイツ民事訴訟法91条1項、91a条1項1文による。
131 仮執行可能性に関する決定は、ドイツ民事訴訟法708条11号、711条、709条による。
まとめ
本件訴訟において争点となったのは、被告による原告写真の複製利用については原告の複製権が及ぶとしたうえで、この複製行為が、
①一時的複製(ドイツ著作権法44a条)
②テキスト・データマイニング(ドイツ著作権法44b条)
③学術目的テキスト・データマイニング(ドイツ著作権法60d条)
のいずれかに権利制限規定該当するかが問題となりました。これに対して裁判所は・・・
①一時的複製(ドイツ著作権法44a条)
❶被告が実施した分析過程のなかで「自動的に」ファイルが消去された事実
→「過渡的」には該当せず。
❷特定のソフトウェアを使用して分析するためにその画像ファイルの意図的なダウンロードがなされた。
→これは行われた分析の単なる付随的過程ではなく、分析に先立って意識的かつ能動的に制御された入手プロセスであり「付随的」ではない。
⇒ 一時的複製には該当しない。
②テキスト・データマイニング(ドイツ著作権法44b条)
●単一の又は複数のデジタルの又はデジタル化された著作物の自動化された分析で、それにより、パターン、傾向及び相関関係に関する情報を得るために複製する行為(1項&2項)
→いかなる場合でも制限されるべきではない。
●機械可読な方法での権利保有者による利用の留保がなされているか?(3項)
❶ウェブサイトに掲載されたすべての著作物について明示的に宣言されている権利留保の範囲と内容は疑いの余地なく決定できるため明示的に宣言されているといえる。
❷反対説はあるものの、裁判所は「自然言語」のみで定式化された利用の留保も「機械が理解できる」とみなす傾向にある。
→被告提出書類によると、そのいくつかは―特に被告に対して―自然言語で表現された利用の留保を自動的に把握できるシステムが2021年にはすでに利用可能であったことを示すものとなっている。
※ただし、機械可読性判断については言及を避けている。
③学術目的テキスト・データマイニング(ドイツ著作権法60d条)
❶「学術研究」という概念は、すでに新たな知見を得るための方法的かつ体系的な」で十分とされる。
→データセットの作成自体は、確かにまだ知見の獲得とは紐づいていないと思われるが後に知見を得る目的でデータセットを使用することを目的とした基礎的な作業段階。
→このような目的設定が本件においても存在していたことは肯定できる。
∵データセットが無償で公開され、それにより人工ニューラルネットワークの分野の研究者らにも利用可能となったから。
※営利企業がAIシステムの学習・開発にデータセットを使用しているかどうかは、営利企業の研究も依然として研究であるため、60c条(以下参照)にも該当していないため関係はない。
❷被告は、複製権を持たない、その研究機関に対し決定的な影響力を有し、かつ当該学術の研究の成果に対する優先的なアクセスを有する私企業と協働する研究機関ではないか?(60d条3項2文)
→その証明責任は原告。(権利制限規定の適用を排除するものだから)
*原告の主張は有効なものであるか?
⑴原告は、
と主張したが…
・被告の従業員を「機械学習業務部長[Head of Machine Learning Operations]」として任用したこと
・被告の別の従業員である…氏が「リサーチ・サイエンティスト[Research Scientist]」として任用したこと
を指摘しているにすぎず、2人の団体構成員がある営利企業において従事しているという事実だけでは、その企業が被告研究業務に決定的な影響力を持っていることを裏付けない。
※裁判所は、原告側が「被告がある営利企業に対してデータセットの優先的アクセス権を与えた」とも主張していないことは指摘。
⑵原告は2024年7月3日付書面で、
と主張した。
But ドイツ著作権法第60d条第2項第3文の例外規定を満たすものではない。
※裁判所の意見として…
・チャット履歴が原告の解釈を裏付けるかどうかは未確定。
・早期アクセスを許可する意思の宣言が、ドイツ著作権法60d条2項2文の意味における研究結果への優先的アクセスを許可するのに十分であるかどうかは未確定(※原告は実際に許可されたかどうかについては主張していない)
⇒ 原告によって示されたわけでもなく、明らかではないために、ある営利企業が被告に決定的な影響を及ぼすことはないと認められる。
*被告とAI業界の企業との人的な関連性が示されていなければ、ある営利企業との関係は認められない。
ゆえに、被告の複製行為はドイツ著作権法60d条の学術目的テキスト・データマイニングに該当する。
→ 原告は被告の複製につき複製権侵害を主張できない。
コメントとその後
本件訴訟では、生成AIの基盤となるデータセット作成にかかる複製についてテキスト・データマイニングの権利制限が及ぶか否かがメインで争われました。
特に争点となりそうなのは、①一般のテキスト・データマイニングの制限要件となる機械可読な権利留保の明示に自然言語(文字)で示された権利留保表示は該当するか、②学術目的テキスト・データマイニングの制限要件となる当該研究機関に対し決定的な影響力を有する私企業に優先的アクセスを与えて協働する学術機関であるかどうかでした。
①については、原告写真において権利留保が文字(自然言語)で示されていても機械可読性要件は満たす可能性はあるが判断は保留し、
②については、人材を派遣し、特定のポストに着任しているという事実では決定的な影響力を有するとは言えないし、過去に共同創設者が私企業に対して5000$の資金提供とともに現在よりも小規模のデータセットへの早期アクセス権を与えたというチャットメッセージだけでは優先的アクセスを与えたとはいえないと認定しています。原告の主張した事実だけでは権利制限規定の適用を排除する要件に足りないとされました。
なおその後、原告のSNSによると、
のため、控訴するには十分な証拠があるとコメントしています。(以下リンク参照)
確かに、裁判所が著作権侵害でないという心証を形成した以上はいずれかの権利制限規定該当性を言えばよいためすべてを丁寧に考察する必要もありませんし、口頭弁論が十分に尽くされていなかったと主張することはありうるものです。(この点はドイツの民事訴訟制度の知見がいるのですが、詳しい人がいたら教えてください)
控訴するかどうかは注目です。