見出し画像

OpenAI対Deepseek:『彼らが我々をコピーした証拠がある!』

5,109 文字

Deepseekが OpenAIのモデルから知識を抽出したという実質的な証拠があり、OpenAIはこの状況に決して満足していないと思います。そしてここで、OpenAIはDeepseekが不正を働いたという証拠を持っていると主張しています。これは重要なニュースです。なぜなら、モデルの作成コストに対するDeepseekのパフォーマンスが株式市場で興味深い動きを引き起こしたからです。このニュースは、OpenAIがDeepseekを知的財産権侵害で訴える可能性を開くという点で特に重要です。
本題に入る前に、私の新しいチャンネル「Vision Actu」の立ち上げをお知らせしたいと思います。そこで私は地政学的および金融的なトレンドを分析しています。実は、このDeepseekの話は、そこで私が詳しく取り上げているテーマに直接関連しています。リンクは説明欄にあります。
では本日のトピックに移りましょう。現在インターネット上で出回っている重要な証拠の一つが、ある示唆的なスクリーンショットです。Deepseekに自身について尋ねると、しばしばOpenAIによって開発された大規模言語モデルだと自己紹介します。これは、あるモデルがOpenAIのモデルの出力で訓練された場合、その識別応答を再現し、OpenAIによって開発された人工知能として自己紹介するという事実によって説明できます。
もしDeepseekがオリジナルのモデルで、OpenAIの出力で訓練されていなければ、Deepseek社によって開発されたモデルとして自己紹介するはずです。しかし、多くの場合、OpenAIによって開発されたモデルとして自己紹介していました。
最近、Deepseekはこれを変更しました。現在、開発者について尋ねると、Deepseekによって開発されたと答えるようになりましたが、以前は確かにOpenAIによって開発された大規模言語モデルとして自己紹介していました。おそらく、OpenAIの出力で訓練されていたからでしょう。
OpenAIは、中国のスタートアップDeepseekが彼らの独自モデルを訓練するために、OpenAIの独自モデルを使用したという他の証拠も発見したと主張しており、これは知的財産権侵害の可能性について懸念を引き起こしています。
OpenAIは、モデルの蒸留の証拠を見たと主張しています。これは機械学習の一つのプロセスで、大規模なモデルの能力をより小さなモデルに移転することです。より小さく、リソース効率の良い学習モデルは、教師モデルの出力を使用して訓練され、その出力分布を模倣し、学習した微妙な情報を取り込むように調整されます。この場合、OpenAIのモデルが対象となります。
OpenAI自身もこの技術を使用しており、GPT-5やOrionのような非常に知的な内部モデルを、GPT-4のようなモデルに蒸留して、より低コストで提供できるようにしています。
Grockのジョナサン・ロスCEOは、DeepseekがOpenAIから急速にAI能力を進歩させることができた方法を説明しています:「すでに非常に優れたモデルが存在する場合、そのモデルにデータを生成させるだけで、そのレベルに到達できます。これが彼らがまさに行ったことです。確かに、訓練には約600万ドルを費やしましたが、OpenAIモデルの蒸留または抽出にはそれ以上を費やしました。
OpenAIは意図せずにこのモデルの訓練を補助していたことになります。なぜなら、彼らのサービスを使用していたからです。噂によると、OpenAIはまだAPIの各トークンで完全に採算が取れていないかもしれません。サブスクリプションではあるかもしれませんが、APIではありません。つまり、生成のたびに、DeepseekがAIを訓練している間、少しずつお金を失っていたことになります。」
DeepseekはOpenAIから盗んだように見えますが、記事では、より大きなモデルの出力を使用してより小さなモデルでより良いパフォーマンスを得るためにこの技術を使用することは、業界では一般的な慣行であると指摘しています。問題は、DeepseekがこれをOpenAIの利用規約に反して、独自の競合モデルを構築するために使用していたことです。
最も驚くべきことは、OpenAIが証拠の詳細を提供したがらないことです。彼らのサービス規約では、明確に競合することを禁止しているにもかかわらず、おそらくDeepseekが証拠を消去できないようにするためです。例えば、Deepseekはすでに自己紹介の方法を変更し、現在はDeepseekによって開発されたと述べています。しかし、これは重要な証拠として残ります。なぜなら、自己訓練されたモデルはOpenAIによって開発されたと自己紹介するはずがないからです。
彼らは良い防御を持っているでしょう。特に、OpenAIモデルのテキストを自然に含むインターネットの大部分で訓練を行ったという点です。
AIの政策と規制を監督する政府責任者のデビッド・サックスは、最近のインタビューで興味深い発言をしました。彼は、これがまさにDeepseekが現在の能力を得るために行った可能性があると説明しました:「AIで蒸留と呼ばれる技術があり、これについて多く耳にすることになるでしょう。これは、あるAIモデルが別のモデルから学習する場合です。具体的には、学習モデルが親モデルに多くの質問をする、人間が学習するのと少し似ています。しかし、AIは数百万の質問をすることができ、そうして親モデルから学んだ推論プロセスを模倣し、ある意味でその知識を吸収するのです。
これがまさにDeepseekが行ったことを示す実質的な証拠があります。彼らはOpenAIモデルの知識を蒸留し、OpenAIはこれを喜んでいないと思います。今後数ヶ月で、主要なAI企業が蒸留を防ごうとする措置を講じるのを見ることになるでしょう。もし彼らが第三者企業による蒸留を防ぐことに成功すれば、確実に模倣者の速度を遅くすることができるでしょう。」
OpenAIの利用規約では、競合モデルを開発するために彼らの出力を使用することは明確に禁止されています。しかし、それを見る前に、私の現在の新しいプロジェクトについて手短にお話ししたいと思います。
ご存知の通り、このチャンネルではAIに関連するすべての出力とニュースを分析しています。私の目的は、この素晴らしい技術をできるだけ多くの人々に知ってもらい、何よりもAIについての意識を高めることです。私だけかもしれませんが、周りの人々と話すと、彼らはAIが何であるかを本当に理解していません。AIが社会に与える影響、その巨大な影響を認識していません。
すでに申し上げましたが、このチャンネルでは商品プレイスメントは行っていません。できるだけ本物らしさを保ちたいと思っています。そのため、私はトレーニングコースを作成しました。
あなたの人生のあらゆる分野でAIを使用する方法を学びたい場合、この動画をご覧になっているということは、すでにChat GPTなどのAIを使用している可能性が非常に高いと思います。もし、あなたの思考をさらに深め、すべてのAIツールの使用方法を学び、それらを人生のあらゆる分野にどのように正確に適用するかを知りたいのであれば、動画の下にピン留めされたコメントにリンクを残しておきますので、興味がある方はぜひチェックしてみてください。
また、Vision AI コミュニティへのアクセスも得られることをお伝えしたいと思います。プロジェクトを開始してからまだ間もないですが、すでに100人以上の方がトレーニングを購入してくださっています。素晴らしいのは、皆さんが様々な分野から来ていることです。学んだツールを特定の分野にどのように適用するかについて、定期的に皆さんと議論するのが大好きです。本当に興味深いです。
申し訳ありません、少し話が逸れましたが、これ以上時間を取らないようにします。すべてのリンクは説明欄または動画のコメントにあることを改めてお伝えします。
この場合、DeepseekがOpenAIの直接の競合であるため、OpenAIは複数の理由で訴訟を起こす可能性があります。利用規約では、リバースエンジニアリング、デコンパイル、またはモデルやアルゴリズムを含むサービスの根底にあるソースコードやコンポーネントの発見を支援することも禁止されています。
これは明らかに利用規約の違反であり、記事は、スタートアップや学術機関がChat GPTなどの商用LLMの出力を使用して他のモデルを訓練することは一般的な慣行であると付け加えています。カリフォルニア大学バークレー校の研究者によると、これにより人間のフィードバックを無料で得ることができ、Deepseekが同じことを行っている可能性があるのは驚くべきことではありません。
この慣行を停止することは困難です。難しい点は、単にモデルと対話している人と、独自のモデルを構築するために特定の出力を得るためにそれを使用している人を区別することです。OpenAIは単に制限を課すことはできません。それは開発者にとってサービスを使用不可能にしてしまうからです。
個人がどのように進めているかを正確に判断するのは困難でしょう。記事によると、中国企業やその他の企業が常に主要なアメリカ企業のモデル、特にOpenAIのモデルを蒸留しようとしているとのことです。
OpenAIは、公開されたモデルに含める最先端の機能を慎重に選択するプロセスなど、知的財産を保護するための対策を講じていると述べ、アメリカ政府と密接に協力していると発表しました。
中国がアメリカの技術をコピーするのは、これが初めてではありません。様々な手段による営業秘密の窃盗は数多くありました。2024年3月7日、元Googleエンジニアが、秘密裏に2つの中国企業のために働いていた際にAIに関連する500以上の機密ファイルを盗んだとして起訴されました。
したがって、中国がこのように行動するのは初めてではなく、公開されているモデルから情報を盗むか蒸留することに成功したとしても驚くことではありません。
しかし、このすべての情報の中で、皮肉なことが起きています。多くの人々は、OpenAIが最近、訓練データに関する訴訟で潜在的な証拠を誤って削除したことを考えると、本当に不平を言えるのかと疑問に思っています。
状況を理解するために:OpenAIはDeepseekがデータをコピーしたと非難していますが、ほとんどの人々は「ちょっと待って、OpenAI自身が誰にも支払うことなく、インターネット上で公開されているすべてのデータを単に吸い上げただけではないか」と反論しています。さらに、彼らは訓練データに関するこの訴訟で重要な証拠を誤って消去してしまいました。これは現在のAI分野において非常に信じがたい状況です。
もう一つの興味深い側面は、特にLMSISのチャットボットアリーナなど、ベンチマーク評価に関するものです。これは実際の人間の対話に基づく比較的独立した評価を提供します。仕組みは簡単で、質問を入力すると2つの回答を受け取り、どのモデルが生成したかを知らずにブラインドで、あなたが最も良いと思う方を評価します。
現在、DeepseekはChat GPTと新しいGeminiモデルと並んで1位を分け合っており、これはかなり優れたモデルであることを示しています。ただし、私は一部の評価に懐疑的です。
SimpleBenchのような一部のテストでは、「氷が溶けるのにどのくらい時間がかかるか」といった単純な質問で人間の推論を評価します。人間のベースラインレベルは約85%ですが、Deepseekは他のモデルよりもはるかに遅れて30%程度に過ぎません。したがって、私は彼らがAI分野で信じられないほどの習熟度を証明したと思いますが、まだ道のりは長いと言えます。
この分析に興味を持ち、現在の地政学的な課題についてさらに深く理解したい方は、私の新しいチャンネル「Vision Actu」をチェックしてみてください。そこでは、この話題や、私たちの現在と未来を形作る他の多くの話題について詳しい分析を見つけることができます。
両方のチャンネルをチッカク登録して、新しい分析を見逃さないようにしましょう。新しい分析でまた会いましょう。

いいなと思ったら応援しよう!