権利情報をトラッキングできる画像生成AI「Generight」の技術的アプローチ
はじめに
近年、画像生成AIの技術が急速に発展し、誰もが簡単に高品質な画像を生成できるようになりました。しかし、AIが学習に使用したデータの権利関係や、生成された画像の利用における法的問題など、企業にとって課題も浮上しています。
こうした中、株式会社リワイアは、画像生成AIの可能性を信じつつも、権利者の権利がAIによって侵害されたり、AI画像を利用する企業が意図せずに権利侵害を引き起こす可能性を危惧しています。こうした権利問題によって、創作活動の制限やAI関連市場の成長が阻害されることを懸念し、この課題解決に取り組んでまいりました。その第一歩として、画像生成AIの健全な発展とクリエイティブ産業の持続可能な成長を目指す新サービス「Generight(ジェネライト)」の提供を開始しました。
Generightは、画像生成AIの追加学習に使用される画像データの権利状況を追跡し、管理するトレーサビリティシステムを提供します。これにより、生成された画像が権利処理済みのデータに基づいていることを証明できるようになります。また、追加学習用画像データの提供者に対する公正な対価分配システムを導入し、権利者の権利保護と継続的な創作活動の支援に取り組んでいます。
サービスサイト:https://generight.ai/
本記事では、Generightが権利問題の解決に向けて採用している技術的なアプローチについて詳しく解説します。Generightの技術的な実現方法に焦点を当てて説明することで、読者の皆様に当社のサービスへの理解を深めていただくことを目的としています。
画像生成AIに興味を持つ企業の皆様にとって、権利問題は大きな障壁となっています。Generightの技術的アプローチをご理解いただくことで、生成AIを安心して活用できる環境づくりに向けた一歩を踏み出していただければ幸いです。
画像生成AIにおける権利問題の背景
近年、画像生成AIの登場により、誰もが高品質な画像を生成できるようになりました。しかし、学習に使用される画像データの権利処理状況が不透明であるため、生成された画像を商用利用する際に、意図せず著作権や肖像権を侵害するリスクがあります。
Generightでは、これらの学習データのうち、特に追加学習で使用されたデータに着目し、その権利処理状況の透明化を目指しています。これは、サービスのリリース初期段階における重点的な取り組みです。
将来的には、追加学習データだけでなく、基盤モデルの学習データも含めた全面的な権利問題の解決に取り組むことで、画像生成AIの健全な発展を支援していきたいと考えています。
学習データの権利関係が不明確であることは、著作権・肖像権侵害のリスクや、企業の法的リスク、創作活動の萎縮などを引き起こします。Generightは、こうした権利問題に着目し、学習用画像データの権利処理状況を追跡・管理するシステムを提供することで、これらの課題解決を目指します。
Generightの技術的アプローチ
Generightは、以下の3つのステップを踏むことで、画像生成AIにおける権利問題の解決を実現しています。このアプローチは現在特許出願中のものになります。
学習データ情報の取得ステップ
Generightは、学習時に機械学習による学習モデルの作成に使用される教師データ(画像群)に関連する情報を取得します。この関連情報には、画像群の権利者情報や利用条件、関係する契約書などが含まれます。さらに、学習モデルの追加学習により生じる複数のバージョン間の関係性を示す接続情報も取得します。
例えば、モデルv1.3を作成する場合、追加学習元がv1.2であるため、v1→v1.1→v1.2というモデルの派生関係を示す接続情報を取得します。この情報により、モデルの派生関係を追跡することが可能になります。
生成画像へのメタデータ付与ステップ
画像生成のステップにおいては、機械学習を行った結果作成される学習モデルが画像を生成します。Generightは、生成された画像に対して、使用された教師データと紐づくメタ情報を付与します。このメタ情報は、学習に利用されたデータセットや画像の出力元のモデルに関する情報を取得するためのキーとなります。
具体的には、生成された画像には、ユニークなIDが付与されます。このIDを使用することで、学習に使用された画像群の権利情報や、モデルの派生関係を追跡することが可能になります。
学習モデルの履歴情報出力ステップ
Generightは、取得した接続情報を使って、あるバージョンの学習モデルが追加学習で使用した画像データと、その学習モデルの追加学習元となった旧バージョンの学習モデルの情報を取得できます。
例えば、モデルv1.3の履歴情報を出力する場合、v1.3の直接の追加学習元であるv1.2の情報に加えて、v1.2の追加学習元であるv1.1、さらにv1.1の追加学習元であるv1の情報も取得できます。これにより、モデルの派生関係と、各バージョンで使用された教師データの権利情報を追跡することが可能になります。
以上の3つのステップにより、Generightは画像生成AIの学習データとなる画像群の権利情報を管理し、生成された画像に対してその情報と紐づくメタデータを付与します。これにより、ユーザーは生成された画像に付与されたメタデータを通じて、その画像生成AIの学習に使用された学習データや、それに関連する権利情報を確認することができるようになります。
これらの技術的アプローチにより、Generightは画像生成AIにおける権利問題の解決を目指すとともに、ユーザーが生成された画像の背景にある学習データや権利情報を透明性高く確認できる環境の実現を目指しています。
今後の展望
Generightは、現在の追加学習データの権利管理に加えて、将来的には基盤モデル自体の学習データの権利問題にも取り組み、AIモデルの学習に使用された全てのデータの権利関係を明確にすることを目指します。また、Generightの権利管理システムは、画像生成AIだけでなく、動画生成などの他の生成AIにも応用可能であり、あらゆる生成AIにおける権利問題の解決に貢献できる可能性を秘めています。
Generightは、権利問題の解決を通じて、企業が安心して生成AIを活用できる環境を整備し、生成AIの社会実装を促進していきたいと考えています。
おわりに
本記事では、Generightの技術的な側面に焦点を当て、画像生成AIにおける権利問題の解決に向けた当社の取り組みをご紹介しました。学習データ情報の取得、生成画像へのメタデータ付与、学習モデルの履歴情報出力という3つのステップを踏むことで、Generightは教師データの権利管理、生成画像とメタデータの紐付け、学習モデルの履歴情報の追跡を実現しています。
現状、Generightは主に追加学習データの権利管理に注力しているため、このサービスだけですべての権利問題のリスクを取り除くことは難しいかもしれません。しかし、私たちは、この取り組みを出発点として、生成AIにおける権利問題の解決に向けた歩みを着実に進めていきます。
この記事が気に入ったらサポートをしてみませんか?