生成AIにまつわる著作権侵害の訴訟と対策について
昨今、大きく話題になっている生成AIの世界は、インターネットで入手できるデータを情報源としてます。基本的に公開されているデータではありながらも、一部はプライベートなデータソースもAIのトレーニングに使われている、という事も知られていて、そこが訴訟の原因をつくってます。この訓練データには、OpenAIが権利を持っていない情報が含まれており、画像、個人データ、著作権付きの資料などが含まれていました。
OpenAI社は、個人や企業から数十億ドルに及ぶ訴訟を受けていて、それが話題になってます。
次のがその訴訟の代表的なもの(他にも探せばいっぱいあります)。
マイクロソフト社、GitHub社とOpenAI社に対する集団訴訟(2022年11月)
インターネット上に存在するデータ/プログラム/作品は、ほとんどが11個のオープンソースライセンスに基づいて投稿/掲載されていて、そのライセンスには作者名、コピーライト、の併記が義務付けられている。OpenAIを通して生成されるAIは、この義務を怠っている、という点が論点。
Getty Images社が生成AIベンダー、Stable Diffusion社を著作権侵害で訴訟(2023年2月)
https://www.theverge.com/2023/2/6/23587393/ai-art-copyright-lawsuit-getty-images-stable-diffusion
Getty Images社の著作権のある作品1200万点を同社の許可なく、AIモデルトレーニングの素材として使用した、という内容の訴訟
EUのAI Act:世界初のAIの使用規制に関する法律(2023年6月)
AIにより生成される情報の安全性、透明性、トレース可能性、平等性、環境保全性などを保証するための条例を作る、という動き。特に生成AIで作られたデータは必ず生成AIによるもの、と明記される事が義務付けられる、など
こういった訴訟に対して、各社は対応を発表していて、下記が代表的な企業によるもの。
ChatGPT/CoPilotの使用に対してマイクロソフト社は著作権侵害の保護を保障する、と発表(2023年9月)
https://blogs.microsoft.com/on-the-issues/2023/09/07/copilot-copyright-commitment-ai-legal-concerns/
著作権侵害に関する心配をせずに自由に生成AIを利用できる、という保証を発表
Adobe社が自社の生成AIサービス、Fireflyのコンテンツに関しては100%ライセンス取得したものである、と保証した上で、著作権侵害の訴訟が起きた際にはその補償もする、と発表。(2023年6月)
Fireflyがベースとしているコンテンツは全てAdobe社が権利を取得したものである、という点が主張
Google社が自社のAIサービスのコンテンツに関する外部からの訴訟の保護をする、と発表(2023年10月)
IBMが自社のGraniteをはじめとしたAIサービスに関する著作権の保護を発表(2023年10月)
IBMのデータに関しては、そのソースを公開していて、誰でもレビュー可能である、という点を主張。
生成AIは要はインターネット上のデータを集めたものなので、Googleサーチと同じで、正しい情報、安全な情報、著作権の侵害、などは使う人が責任持って判断しないといけない、という事なんです。AIはすごく親切に語りかけてくれるからつい信用してしまいがちですが。。。