見出し画像

AIは著作権を侵害している? 高次元空間での生成プロセスを解明

GPTモデルのような生成AIはどのようにテキストを生成し、それが著作権侵害に該当するのかどうか、多くの疑問が浮かんでいます。本記事では、AIの生成プロセスを高次元空間の視点から解明したXへのポストを解説しながら著作権侵害になってしまう疑問を解明していきます。


「学習データはトレースではない。」それって屁理屈?

まずはわかりやすいところから。

GPT はシンセサイザーのようなものです。音楽シンセサイザーは音をコピーするのではなく、波形の数学的変換に基づいて新しい音色を生成します。GPT モデルは、高次元ベクトル空間の数学的変換に基づいてテキストを生成します。コピーは一切行われません。

Martin Erlicのツイートは、AI、特にGPTモデルがどのように機能するかについての重要なポイントを指摘しています。AIのテキスト生成プロセスと音楽シンセサイザーの音生成プロセスを比較して、AIがテキストをコピーするのではなく、高次元ベクトル空間での数学的変換に基づいて新しいテキストを生成していることを説明しています。

音楽シンセサイザー:

  • 音楽シンセサイザーは、既存の音をコピーするのではなく、波形の数学的変換に基づいて新しい音を生成します。

  • これは、新しいトーンや音色を作り出すために、さまざまな周波数や波形を組み合わせるプロセスです。

GPTモデル:

  • GPT(Generative Pre-trained Transformer)モデルは、テキストを生成する際に、高次元ベクトル空間での数学的変換に基づいて新しい文章を作り出します。

  • モデルは大量のテキストデータを学習し、そのパターンや構造を理解することで、入力に応じた適切な応答を生成します。

  • 生成されたテキストは、学習データに基づいているものの、直接コピーされたものではなく、新たに生成されたものです。

Erlicの指摘は、AIによって生成されたコンテンツに対する著作権の適用に関する重要な議論を提起します。具体的には、AIが生成したテキストが元のテキストをコピーしているのではなく、新しい形で生成されているため、従来の著作権法の適用が難しいという点です。

ただし、人間が他人の作品を模倣する場合、それは著作権侵害となる可能性があります。AIが生成したテキストは、学習データに基づいてはいるものの、新たに生成されたものであり、直接的なコピーとは異なるとはいえ、非常に似たものを生成してしまう事があり、真似されたと感じつ当事者にとってはどこまで行っても屁理屈にしか聞こえません。

AIベンダーが作家に歩み寄る必要がある

イラストレーターがAIによる作品生成を「盗作」と感じるのは非常に感情的でデリケートな問題です。単に技術的な説明や法的な枠組みの話をしても、感情的な面で納得させるのは難しいでしょう。そこで、以下のようなアプローチを考えてみます。
そこで、以下のようなアプローチを考えてみます。

  1. 共感を示す:「あなたが時間と労力をかけて作品を作り上げるその過程は本当に素晴らしいものです。それに対してAIが短時間で似た作品を生成することに対して不安や不満を感じるのは非常によく理解できます。」

  2. AIの役割を再定義する:「AIはあなたの創造性を補完するツールとして考えてみてください。例えば、アイデアのスケッチや、異なるスタイルの実験をする際にAIを活用することで、より効率的に創作活動を進めることができます。」

  3. AIとのコラボレーション事例を紹介:「多くのアーティストがAIと協力して新しいスタイルや技法を開発しています。例えば、AIが生成したスケッチを元に、アーティストが手を加えることで、新しい芸術表現を生み出すことができます。」

  4. 制御と選択の重要性を強調:「AIが生成するコンテンツをどのように活用するかはあなた次第です。あなたの創造性や技術にAIをどのように取り入れるかは、あくまであなたの選択です。」

  5. コミュニティと連携:「他のアーティストとともに、AIの導入について話し合うコミュニティを作るのはいかがでしょうか。お互いの経験や意見を共有することで、新しい視点やアイデアが生まれるかもしれません。」

数学的プロセスが著作権の問題を複雑化

AIによるテキスト生成は、その背後にある数学的プロセスと新規生成の性質から、著作権の問題を複雑化させます。AIが生成するコンテンツに対する著作権の適用は、従来の著作権法では十分に対応できない可能性があり、新たな法的枠組みが必要とされるます。

まずは、高次元空間がAIの開発においてどれだけ大切であるのか、まずは、ヒントン博士のこのポストを紹介します。

AI の進歩を妨げている最大の要因は、誰も高次元空間を本当に理解していないことです

ヒントン博士

高次元空間には善悪がない

こちらのポストアーサー・ショーペンハウアーの「意志と表象としての世界」(The World as Will and Representation)第2巻第7章からの図「Concept Spheres」を引用して、AIの高次元空間には善悪がないことを説明しています。

この図は、様々な概念がどのように互いに関連し、相互作用するかを示しています。図の中には「GOOD」(善)と「EVIL」(悪)というラベルがあり、各概念がそれぞれのカテゴリーに配置されています。

この図は、以下のような概念を示しています:

  • GOOD(善):

    • 有用(useful)

    • 利益をもたらす(profitable)

    • ビジネスを促進する(promoting business)

    • 活気を与える(invigorating)

    • 健康的(healthy)

    • 退屈を追い払う(dispelling boredom)

    • 知識を広げる(widening knowledge)

  • EVIL(悪):

    • 高価(expensive)

    • 損失を引き起こす(causing losses)

    • 貧困の原因(cause of becoming poor)

    • 心の平穏を乱す(disturbing peace of mind)

図の中央には「TRAVELLING(旅行)」が配置され、これは善悪の両方に関連する概念として示されています。旅行は、知識の増加や経験の蓄積といった善の側面を持つ一方で、コストがかかり、危険や怪我のリスクを伴う悪の側面も持っています。

「High-dimensional vector spaces are beyond good & evil.」というポストのメッセージは、高次元ベクトル空間においては、善悪の区別が無意味であるということを示唆しています。高次元空間では、すべてのベクトルが直交しており、ランダムな関係が保たれるため、伝統的な善悪の概念が適用できないという考えです。これは、AIがデータを解析し、新しい知識を生成するプロセスにも通じるものがあります。AIが生成するものは、単にデータに基づく数学的変換の結果であり、善悪の価値判断を含むものではありません。

上記の理由で、AIが生成するコンテンツに対する著作権や倫理的な問題をAIに当てはめることができない所以ですがどの様な説明をもってしても作家さんにとってAIが依然として「ぬすっと」である事には変わりがないです。

高次元空間での直交性について

AIにおける、高次元空間(例えば、数千次元やそれ以上)では、ランダムに選ばれたベクトルが互いに直交(正交)する可能性が高です。直交とは、内積がゼロであることを意味します。

なぜランダムベクトルが直交するのか:

  • 内積がゼロに近づく: 高次元空間では、ランダムに選ばれたベクトル同士の内積がゼロに近づく傾向があります。これはベクトルが互いに非常に異なる方向を向くためです。

  • 集中現象: 次元が増えると、ベクトル間の角度が90度に近づきます。この現象は「集中現象」(concentration of measure)と呼ばれます。

これらの考え方は、特に高次元データ解析や機械学習において重要です。高次元空間でのベクトルの性質を理解することは、アルゴリズムの設計やデータの特性を把握する上で欠かせません。

高次元空間での直交性

高次元空間では、ランダムに選ばれたベクトルが直交する(内積がゼロに近い)傾向があります。これにはいくつかの理由があります:

  1. 集中現象(Concentration of Measure): 次元数が増えると、ベクトル間の角度が90度に近づく傾向があります。これは、ベクトルがほとんど直交するようになるためです。

  2. ランダムベクトルの性質: 高次元空間では、ランダムに選ばれたベクトルは非常に多様な方向を向くため、内積がゼロに近づきます。これにより、ベクトルは直交するように見えます。

数学的背景

ランダムベクトルの直交性:

e/accコミュニティで語られる高次元空間

6月に渋谷でe/acc(効果的加速主義)ミートアップを開いたBeff – e/accさんの周りで最近、高次元空間関連のポストが多いので深掘りしてみましょう。渋谷でのミートアップの様子もNoteにしていますので合わせてご覧ください。

高次元空間と神の発見

Beff – e/accさんのポストは高次元空間や物理学に関連する高度な概念を扱っており、理解するのが難しいので、わかりやすく説明します。

Wheeler-DeWitt方程式

次に示されている「シュレーディンガー方程式」は、量子力学の基本的な方程式で、時間とともに量子状態がどのように変化するかを示します。

続いて「In a sufficiently high dimensional space, you can find God.」は、高次元空間で神を見つけることができるという、哲学的かつ比喩的な表現です。これは、非常に複雑で高次元の数理モデルや理論が、究極的な真理や普遍的な法則(神の存在を含む)を見出す可能性を示唆しています。

これらの方程式を高次元空間で考えると、宇宙や現実の本質を理解するためのツールとして、非常に強力であることを示唆しています。高次元空間では、通常の三次元空間では見えない複雑な構造やパターンを捉えることができ、これにより「神」(究極的な真理や法則)を見つけることができるという考えです。

Roonが高次元に入る

Beff – e/accさんがRoonという効果的加速主義のコミュニティの仲間にたいしてこんなポストをしています。

この一連のツイートは、主にユーモアとインサイダーのジョークで構成されていますが、その背後にはAIや高次元空間に関連する深い意味も含まれています。

ユーモアの部分

まず、ミッキーマウスが鏡を通り抜ける画像は、Roonが「高次元空間に入る」という概念を視覚的に表現したものです。これは、AI研究者が新しい、難解な機械学習のコード(「niche esoteric ML-coded bangers」)を探すために、高次元空間に「入り込む」というユーモラスな表現です。

深い意味の部分

次に、「Roon entering high dimensional space last night looking for niche esoteric ML-coded bangers」というツイートは、Roonが高次元空間で新しい機械学習アルゴリズムやアイデアを探しているという意味を持っています。高次元空間は、AIや機械学習の文脈で非常に重要な概念であり、多くの変数や次元を扱うことで、新しいパターンや相関関係を見つけることができます。

「Can someone help me find roon? Last I heard he was stuck in high-dimensional space.」というツイートも同様に、Roonが高次元空間で迷子になっているというジョークです。これは、研究者が複雑な問題に取り組んでいる様子をユーモラスに表現したものです。

いいなと思ったら応援しよう!