この記事は自分のホームページに掲載された内容を周知目的で改変し転載しました。
前回の続き
文化庁パブコメに向けた「AI と著作権に関する考え方について(素案)」の論点整理~【 「非享受目的」に該当する場合について】
文化庁が「「AIと著作権に関する考え方について(素案)」に関する意見募集の実施について」というパブリックコメントを行っているため
そのパブコメを送るための「AI と著作権に関する考え方について(素案)」の論点整理を行うための論点整理を目的としてコラムを書きました。
筆者は締切日2024年2月12日ギリギリまで粘ってパブコメの内容を考えることにします。
なお筆者は法の専門家ではなく、あくまで自身のパブコメのために資料を理解するためにこのコラムを執筆したにすぎませことは了承して下さい。
とりあえず、資料の中でも自分が注目している部分だけピックアップしています。また検索拡張生成(RAG)に関しては自身の知識不足なため意図的に省いています。
エ 著作権者の利益を不当に害することとなる場合の具体例について
(ア)法第 30 条の4ただし書の解釈に関する考え方について
ベルヌ条約等では権利制限を設けるにあたり
・特別の場合
・著作物の通常の利用を妨げず
・著作者の正当な利益を不当に害しない
といった3ステップ・テストを設定しています。
法30条の4の但し書きの「当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。」の内容はこの3ステップ・テストの1つである「その著作者の正当な利益を不当に害しないこと」に該当します。
法30条の4は法35条の1項等の権利制限と同様に「著作権者の著作物の利用市場と衝突するか,あるいは将来における著作物の潜在的市場を阻害するかという観点から判断されることになる。」という観点から判断されることが明言されています。
ここで言う35条1項とは
法35条1項の但し書きは法30条の4と違って細かく該当例が載っています
2020 年 4 月 16 日,改正著作権法第35条運用指針(令和 2(2020)年度版).著作物の教育利用に関する関係者フォーラム,⑨ 「著作権者の利益を不当に害することとなる場合」
平成21年度改正著作権法において旧法47条の7 「電子計算機による情報解析のための複製等」が追加されそこから10年の時を経て、現在の「著作物に表現された思想又は感情の享受を目的としない利用」が制定されました。
法30条の4の但し書きはこの「電子計算機による情報解析のための複製等」の但し書き「ただし、情報解析を行う者の用に供するために作成されたデータベースの著作物については、この限りでない。」を引き継いでいます。
(イ)アイデア等が類似するにとどまるものが大量に生成されることについて
アイデアと表現の二分論は前回記述しましたので省略します。→【 「非享受目的」に該当する場合について】
作風や画風などの著作権法が保護する利益でないアイデア等が類似しているにすぎない状態では例え特定クリエイターの市場を圧迫する事態になっても但し書きに該当することは無いことを明記しています。
ただし、創作的表現が一致している場合もあることに配慮するべきであることを呼び掛けています(ここらへん抽象的)
著作権法上問題の無いアイデアにとどまる生成物でもそれを使って営業妨害や嫌がらせをしだしたら民法上の不法行為に訴えることも考えられます。
(ウ)情報解析に活用できる形で整理したデータベースの著作物の例について
ここでは但し書きの例に出てくるデータベースの著作物の複製等について詳しく解釈を掘り下げています。
販売されている場合に
当該データベースを情報解析目的で複製等する行為
この但し書きの解釈は3つに分けられます
1つ目は①大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物ですが必ずしも情報解析を目的のデータベース作成を行う必要は無いみたいです。
ここでデータベースまたはデータベースの著作物の定義について確認していきます。
著作権法上の「データベース」は情報の集合物として定義されていて、素材には特定の制限がありません。論文、数値、図形など、著作物であれ非著作物であれ、人間にとって意味のある内容を持つ情報が含まれます。後半部分で述べられているように、データベースに含まれる情報は検索可能でなければならず、それ自体に独立性と意味を持つ必要があります。また、情報を検索するためのコンピュータープログラムは、データの集合体とは異なり、独立した創作物として扱われます。
さらに「電子計算機を用いて検索することができるように体系的に構成したもの」と呼べる必要があり、例え情報の集まりであっても、電子計算機を用いた検索が不可能なものはデータベースとはみなされません。そのため、データベースとして扱われるためには、通常、デジタル化されている必要があるとされていますが、一部の見解では、必ずしも機械可読形式である必要はないとされています。しかし、機械が読み取れないものは、編集物として扱うのが適当であり、データベースには該当しないと理解されます。法律上、「編集物」の定義はないが、データベースは編集物には含まれないと規定されているため、非電子的なものは編集物とされます。
さらに、データベースと認められるためには、検索可能な状態で体系的に構成されていることが求められます。「体系的構成」とは、収集した情報を整理し、項目や構造形式を定めたフォーマットを作成することを指す。これは物理的な配置や、編集物における「配列」とは異なる概念である。現代では、デジタル化された情報は、整理や体系化されていなくても検索可能なことが多いが、キーワードの付与、情報のグルーピング、フィールドの指定などの整理・体系化の存在により、データベースとみなされることになる。」という表現になります。
著作権法第二条 十の三 データベース
次に「データベースの著作物」とは
データベースであり、情報の選択または体系的構成に創作性があり著作物として保護されるものです
データベースの著作物の例として
データベースが取り扱う「情報」は著作物でも非著作物でも該当します。ただし法2条の定義的から、個別の情報を検索可能にするための独立性が必要とされています。本条からデータベースが著作物として著作権保護されるためには情報の選択または体系的構成に創作性が必要です。
データベースに人間の創作性を有することに肯定的な判決も多く。他の著作物と比較しても著作物性に高い基準を持っているかどうかは考慮する余地があります。また、著作権法では創作的表現の保護を原則としていますので、データベースの著作物においては情報の選択や体系的構成が創作性の部分にあたり、情報の収集やデジタル化などを保護することを設定するのは困難になります。
データベースの著作物の創作性については
データベースが著作権保護を受けるための創作性は情報の選択または体系的な構成のどちらかが認められれば十分です。
データベースの場合、情報の選択よりも体系的構成が創作性の基準になる事例が多いです。これは情報収集においてその選択は誰でも同じ結果になる場合が多いため情報の選択の方が創作性を認められることが困難だからです。
ただし、体系的構成は認識が困難であることから、「アイデア」と「表現」を区別することについて判断が分かれることになります。また、データベースが情報の集合物であることだけではなく、体系的な構成による保護が認められることが重要であるとして、類似性の判断に情報が異なることを基準に入れることを疑問視する学説も存在します。
また、データベースの定義から、情報とは編集体系下の集合物であつて、個別に検索可能にすることが前提とされています。そのため、データベースを構成する要素自体は情報の定義に該当すると判断するのは困難です。
データベースの著作物の保護範囲として
データベースの著作物と認められれば、そのデータベースの全体の利用に対して侵害における類似性が肯定されると解釈することは問題ではありませんが、他方、データベースの一部の情報のみが利用された場合に侵害が成立するかが問題になってきます。この場合データベースの著作物の創作性の部分に注目し著作物を用いることがどのような場合かを明確化する必要があります。
データベースの著作物に修正または増減が行われた場合に、データベースに蓄積された情報を利用されている場合でも、情報の選択や体系的構成などのデータベースの創作性が異なっている場合が存在します。
そのため、目に見えて両者に共通する部分のみならず、両データベースを比較することによって情報の選択方針や体系的構成などの共通点を検討する必要があります。
著作権法 第十二条の二 データベースの著作物
データベースの著作物に関する今まで説明した内容を考慮に入れてこの解説を見てみます。
データベースの創作的表現の部分は情報の選択または体系的構成です。データベース作成の際その情報収集つまり情報の選択は誰がやっても同じありふれたものになるため創作性が出にくいです。それなのでデータベースの著作物の創作性はもっぱら体系的構成の部分が評価されます。
データベースの一部の情報のみが利用された場合には両データベースを比較して情報の選択や体系的構成など創作的表現部分の共通点を検討する必要があります。
但し書きの解釈を現実に当てはめてさらに具体的にした例を挙げています。
データベースの著作物から容易に情報解析に活用できる形で整理されたデータを取得できる API が有償で提供されている場合において
当該 API を有償で利用することなく、当該ウェブサイトに閲覧用に掲載された記事等のデータから、当該データベースの著作物の創作的表現が認められる一定の情報のまとまりを情報解析目的で複製する行為
これらのAPIが「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物」に該当するかどうか検討する必要があるみたいです
これに該当する具体的な例として
・学術論文の出版社が論文データについてテキスト・データマイニング用ライセンス及び API を提供している事例
・新聞社が記事データについて同様のライセンス及び API を提供している事例
の2つを上げていますが「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物」に当たるとは限らないようです。どっちだよ。
そもそもこの2つは情報解析に適した形で整理したデータベースと呼べるのでしょうか。仮にそのようなデータベースを作成していたとしても果たして著作物性があるのでしょうか。
但し書きに該当するのは論文データや記事データのような言語の著作物等を指しているのではなく、その情報を選択し、検索可能な形に体系的な構成にまとめたデータベースの著作物の複製等です。
果たしてただ論文や新聞のデータを網羅的にまとめたデータベースに情報の選択や体系的な構成などといったデータベースの著作物の創作性の部分(情報の選択、体系的構成)が評価されるかおおいに疑問です。
(エ)本ただし書に該当し得る上記(ウ)の具体例について(学習のための複製等を防止する技術的な措置が施されている場合等の考え方)
権利制限は著作権者の権利を制限するものであり、ごく一部の例外(法32条の二項、法39条、47条の5など)を除けば著作権者の反対の意思表示だけで権利制限の対象から除外される解釈されるのは困難です。そのため意思表示だけで法30条の4の但し書きに該当するとは考えられません。それもAI学習のための情報収集はスクレイピングによって集めるのが前提です。その意思表示はクローラが読み取ってくれるでしょうか?
機械可読可能な形での技術的な措置でデータベースの販売に伴う措置や又は販売の準備行為としての措置として推認するのはかなり無理があると思います。
例えば、法47条の5(電子計算機による情報処理及びその結果の提供に付随する軽微利用等)には(当該行為の一部を行う者を含み、当該行為を政令で定める基準に従つて行う者に限る。)というかっこ書きがあります。
この「政令で定める基準」とは
もし法30条の4も同じく「robots.txt」などで防ぐようにしたいのなら、法47条の5のようにその旨を明記すべきです。それなのに但し書きの解釈に一任することは果たして正しいでしょうか?
ここでEUの機械学習に関するDSM(デジタル単一市場における著作権指令)を見ていきます。
EUは機械学習などデータマイニングを行う際、オプトアウト(正確には機械判読可能な状態で権利留保)しなければいけませんが、学術研究目的ではそのような項目は無く使い放題です。
日本が「robots.txt」などでこれを防げるようになったら、AI開発において学術研究目的なら著作物を使い放題EUよりも厳しい国家になる可能性もあります。
「情報解析に活用できる形で整理したデータベースの著作物が将来販売される予定があることが推認される場合」は新聞などの報道機関は考慮に入れません。
新聞社が記事データを「robots.txt」で防げると思って、それにAI開発企業が従ってしまったら日本のAI開発(特に大規模言語モデル)は大きく遅れることになります。
技術的保護手段はコピーコントロールもしくは一部アクセスコントロールを含みますが、「robots.txt」は複製等の著作物利用を防いでいるわけではないので技術的保護手段には含まれないと思います。もし含むなら法47条の5で「robots.txt」を「政令で定める基準」なんて回りくどい言い方をせず、法30条私的複製のように技術的保護手段と明記すればいいだけだと思います。
(エ)海賊版等の権利侵害複製物を AI 学習のため複製することについて
AI学習に海賊版を利用することについて2つの条文を見てもらいたいです。
法30条では二項、法47条の5では但し書きに違法アップロードした著作物のデータを知っていながら利用することを権利制限対象外としています。
しかし、法30条の4にはこのような記述は見られません。
このように他の権利制限との兼ね合いから海賊版をAI学習に利用することについて、それを曖昧な但し書きの解釈に一任して除外することは無理があります。
条文上だけではなく現実的にもネット上の著作物データが果たして適法なのか違法なのかを判読することは困難で現実的ではなく、大量のデータをスクレイピングで集めることが前提の生成AI開発ではこれが足かせになってしまう可能性が高くなります。
海賊版を利用することは法的解釈上は問題ないですが、海賊版ウェブサイトからデータ収集をすることは海賊版サイトの広告収入を潤したり、開発自身が権利侵害の主体になるリスクがあるから慎むべきといったことがずらーっと書かれています
妥当な解釈だと思います。侵害に対する措置はのちの項目で扱います。
→【侵害に対する措置について】に続く
参考資料
条解著作権法(小泉直樹他、弘文堂、2023年6月15日
著作権法(第4版),中山信弘,有斐閣,2014年10月25日,
文化庁「「AIと著作権に関する考え方について(素案)」