見出し画像

DeepSeekがOpenAIの技術を盗用か...しかし新しいAIが両者を凌駕

6,922 文字

MicrosoftとOpenAIは現在、DeepSeekによる技術盗用の疑惑について調査を進めています。この調査は、この中国のスタートアップ企業がR1モデルをリリースした直後に始まりました。R1は強力なAIで、OpenAIのGPT4の開発費用のほんの一部で開発されたにもかかわらず、OpenAI o1と同等かそれ以上のパフォーマンスを発揮すると言われています。
そしてさらに驚くべきことに、アリババが参入し、彼らの新しいQwen 2.5モデルがベンチマークテストでDeepSeekとOpenAIの両方を上回ったと主張しています。AIウォーズが本格化したのです。では、この驚くべき展開を詳しく見ていきましょう。
まず、なぜMicrosoft(OpenAIの主要投資家の一つ)がこれほど懸念しているのでしょうか。Bloombergの報道によると、Microsoftのセキュリティ研究者たちは、DeepSeekと関連があると思われるグループの不審な活動を発見しました。昨年秋、これらの個人がOpenAIのAPIから大量のデータを抽出していたとされています。このAPIは、開発者がOpenAIに料金を支払って自社のアプリやサービスを動かすために使用するもので、主要な収益源となっています。Microsoftがこれらの警告サインを察知するとすぐにOpenAIに通報し、調査が開始されました。
重要な問題は、DeepSeekが実際にOpenAIのモデルから価値のあるものを盗んだかどうかです。ホワイトハウスのいわゆるAI・暗号担当者であるデビッド・サックスは、Fox Newsに対して、DeepSeekが基本的にOpenAIの知識を自社のシステムに蒸留したという実質的な証拠があると述べました。蒸留とは、AIの用語としては、あるモデルが別のモデルの出力から学習し、実質的にその能力を圧縮またはコピーする技術です。もしそれが本当だとすれば、特に米中間の先端技術をめぐる緊張が高まっている中で、知的財産権の観点から大きな問題となります。
さらに興味深いことに、1月初めにDeepSeekの無料AIアシスタントは、米国のAppleのApp Storeでチャットジーピーティーを追い抜いてトップの無料アプリとなり、他の数十カ国でも1位を獲得しています。このような成功は当然ながら疑問を呼び起こします。どうしてこの中国のスタートアップが、突如として現れ、ダウンロード数で米国のAI大手をすべて凌駕することができたのでしょうか。
この話は月曜日に実際にテクノロジー株の売り込みを引き起こすほど大きなものとなり、投資家たちはAI市場の支配者に関する市場の幻想が崩壊するかもしれないと慌てふためきました。DeepSeekの主張によると、彼らはR1と呼ばれる大規模言語モデルを構築し、OpenAIが提供できる最高レベルと競争できる推論能力を持っているとのことです。しかも、同じ数十億ドルの投資を必要とせずにです。
実際、同社は研究論文で、2,000台のNVIDIA H800 GPUを使用して基盤となるV3と呼ばれるモデルの訓練に約560万ドルしかかからなかったと発表しています。比較のために言えば、OpenAIのサム・アルトマンはGPT4の開発費用が1億ドルを優に超え、おそらく25,000台のH100 GPUを使用したことを示唆しています。
では、どうやってDeepSeekはこれほど少ないリソースで同じレベルに到達できたのでしょうか。これを信じない人もいます。例えば、Oculus VRの創設者であるパーマー・ラッキーは、DeepSeekの数字を偽りだと呼び、中国のプロパガンダだとまで言い切りました。さらに、米国のテクノロジー投資を混乱させたり、株式市場の特定のショートポジションを操作するために設計された詐欺かもしれないとも示唆しています。
ドナルド・トランプ大統領と親密な関係にあるイーロン・マスクも懐疑的で、DeepSeekが高度なハードウェアに隠れてアクセスしていたという示唆に対して、ソーシャルメディアで「明らかだ」と応じています。一方、Scale AIのアレクサンダー・ワンは、DeepSeekが秘密裏に50,000台のH100 GPUのような、はるかに高度なハードウェアを入手した可能性があると考えています。確固たる証拠は提供していませんが、この噂は十分に強く、DeepSeekの少額予算の話にいくつかの詳細が欠けているのではないかという憶測を煽り続けています。
結局のところ、これらの企業は本当に技術の盗用を懸念しているのでしょうか。それとも、より小規模なプレイヤーが数十億ドルの資金を必要とせずに彼らを上回るパフォーマンスを示したことに苦々しい思いをしているだけなのでしょうか。DeepSeekは投資家に無制限の資金を求めず、OpenAIやGoogleと同じ道筋を辿らなかったにもかかわらず、最高レベルで競争できるAIモデルを作り出すことができました。
これらの告発をしているのが主に自社のAIプロジェクトが影を薄めた企業であることを考えると、知的財産の盗用についてであれ、DeepSeekがどれほど効率的にそれを実現したかを疑問視するにせよ、彼らが批判を投げかけるのも当然かもしれません。
不確実性について語る中で、仕事の安定性はこれまで以上に脆弱になっているため、将来の収入を確保できるスキルを身につけることが重要です。そのため、この動画ではGrowth Schoolと提携して、この急速に進化する環境で成功するのに役立つ、本当に価値のあるものをお届けします。
2024年は目まぐるしい年で、新しい仕事が次々と生まれる一方で、レイオフも同じくらい一般的です。今は安定していると感じても、次に何が起こるかわかりません。だからこそ、複数の収入源を持つことは賢明どころか、不可欠だと思います。
ここでAIの出番です。適切なツールとスキルがあれば、月額11万ドルの追加収入を本気で得ることができます。始め方を知りたい方のために、Growth Schoolは素晴らしい機会を用意しています。25以上の強力なAIツールの使い方を学べる3時間の実践AIトレーニングを提供しています。通常は有料ですが、最初の1,000人のAI Revolutionの視聴者は、説明欄のリンクから無料で参加できます。さらに、登録するだけで500ドル相当のボーナスリソースも手に入ります。
トレーニングは、求職のコツ、給与交渉、Excelの習得、コンテンツ制作まで、すべてをカバーしています。これはテクノロジーの専門家だけのものではありません。金融、営業、マーケティング、人事の分野にいる方、さらには学生の方でも活用できます。Growth Schoolはすでに何百万人もの人々のレベルアップを支援してきました。AI主導の世界で先を行くチャンスかもしれません。
興味がある方は、下のリンクをクリックして無料の枠を確保してください。また、Growth SchoolのWhatsAppコミュニティへの参加もお忘れなく。AIに飛び込む他の人々とつながれる素晴らしい場所です。
さて、AIの対決に話を戻しましょう。論争が続く中、実世界のベンチマークは、DeepSeekが実際に競合他社とどのように比較されるかを多く語っています。DeepSeekのR1がチャットGPTの最新のo1モデルとo1 Proと並んでタスクをどれだけうまく処理できるかを比較する直接的なテストもいくつかあります。結果はほぼ競争力のあるものでした。
あるテストでは、各モデルのクリエイティブな文章作成、数学、論理などの能力を測定しました。DeepSeekのR1は、10億番目の素数の特定や特定のクリエイティブな段落の作成といったタスクではチャットGPTを上回りましたが、特定の複雑な指示や隠されたコードの課題などでは若干劣っていました。DeepSeekがグローバルシーンに登場して間もないことを考えると、R1がOpenAIの最高レベルと同じ土俵にいるということは、かなり驚くべきことです。
そしてさらにドラマティックなことに、DeepSeekの成功の一部は、ファーウェイのハードウェアのおかげかもしれないことがわかりました。R1モデルはNVIDIA H100またはH800で訓練されましたが、推論、つまりモデルがユーザーのクエリに応答する実行段階では、ファーウェイのAscend 910c AIチップで動作しているとされています。
これらのチップはNVIDIAのトップクラスのものほど強力ではありませんが、推論にはそれほど多くの生の計算能力は必要ありません。そのため、訓練はNVIDIAに依存できますが、いったんモデルが訓練されれば、より安価な、または規制の少ないハードウェアで実行できます。米国が中国の先端チップへのアクセスを制限しようとしていることを考えると、この詳細は大きな地政学的影響も持っています。
これらの衝撃的な発表の後、AIウォーズはさらなる展開を見せました。アリババが参入し、Qwen 2.5という、同社が様々なベンチマークでGPT4oとDeepSeek V3の両方を上回ると主張するAIモデルを発表しました。また、複雑なテキスト、画像分析、ビデオ分析を処理できる、非常に多機能なAIであるQwen 2.5 VLというモデルもリリースしました。
興味深いことに、アリババがこの発表をすると同時に、株価は約3%上昇しました。これは、DeepSeekがR1モデルを発表した際にNVIDIAの株価が反応し、一日で6,000億ドルという米国史上最大の時価総額の損失を記録したのとは対照的です。まさに目が回るような展開です。
アリババはまた、教師あり微調整と人間のフィードバックから強化学習と呼ばれるものを組み合わせて、なんと20兆のトークンでQwen 2.5 Maxのような、さらに大きなモデルを訓練していると主張しています。これがOpenAIのやり方に疑わしいほど似ていると思うなら、あなたは一人ではありません。しかし同時に、これらの企業はすべて、これらのよく知られた技術を使用しています。
アリババの違いは、規模とエコシステムにあるかもしれません。彼らは中国最大のクラウドビジネスの一つを所有しており、2025年第2四半期には42億ドル以上の収益を上げています。そのため、このテクノロジーを押し進める力は確実にあります。
さらに追い打ちをかけるように、TikTokを所有するByteDanceは、DeepSeek R1のリリースからわずか数日後に、自社の主力AIモデルのアップデートをリリースする完璧なタイミングを見計らいました。彼らも既存の米国のシステムよりも優れたパフォーマンスを主張しています。
そう、今や中国ではまさにAI軍拡競争が繰り広げられています。誰もが、OpenAIやGoogleが持っているような途方もない予算がなくても、強力な、少なくとも非常にコスト効率の良いAIを開発できることを証明しようと競い合っています。
一方、ユーザーサイドも忘れてはいけません。DeepSeekは51カ国でiOSのApp Storeのトップにいます。R1チャットボットをテストした人々は、それがかなり印象的だと言っています。ただし、特定のトピックは検閲されています。同時に、OpenAIのチャットGPTは特に企業顧客の間で依然として強力であり、一夜にしてすべての人が乗り換えるわけではありません。さらにチャットGPTにはMicrosoftの巨大なインフラという利点があります。
また、より大きな地政学的な側面もあります。米国政府は中国への先端AIチップの輸出を制限していますが、明らかにNVIDIA H800やファーウェイのAscend 910cのような制限付きチップでも、ある程度は仕事をこなせています。これは疑問を投げかけます。トップクラスのチップを制限することで本当に中国のAI進歩を妨げることができるのでしょうか。それとも、彼らは単に若干劣るハードウェアでも、より効率的なソフトウェアで対応する方法を見つけ出すのでしょうか。後者が真実だとすれば、それは明らかに米国の貿易とテクノロジー管理に関する立場にとって頭痛の種となります。
純粋に技術的な観点から見ると、興味深い比較の一つは、DeepSeek R1とチャットGPTが10億番目の素数を求めようとしたテストでした。チャットGPTは基本的に、通常行われるように素数定理プラス誤差の範囲で大まかな理論的推定を行いました。しかしDeepSeek R1は、Prime Gridを引用して正確な値22,801,763,489を示しました。これは、アメリカのモデルがより正確だと思い込んでいた人々にとって大きな衝撃の瞬間でした。
とはいえ、R1は各文の2番目の文字を使って隠されたメッセージを符号化するようなパズルなど、より単純な指示では失敗することもありました。つまり完璧ではないということです。
最近の最大の衝撃は、アリババが新しいバージョンのQwen 2.5、またはQwen 2.5 MaxがGPT4o、DeepSeek V3、Llama 345bをすべての分野で上回ると主張したことです。これは同社からの直接の引用です。この発表は、DeepSeekの低コストアプローチに関する騒動の直後に行われました。
特にByteDanceも参入した後、中国のAI領域で明確な挑戦状を叩きつけています。一部のアナリストは、アリババがこの発表のタイミングを最大限の注目を集めるように設定したと考えています。中国では旧正月で、人々は家族と一緒に過ごしながらインターネットやスマートフォンのアプリを閲覧していたことでしょう。そのため、アリババの発表が通常の忙しい平日に埋もれてしまうことはありませんでした。
では、これによって私たちはどこに向かうのでしょうか。基本的にAIの景観全体が流動的です。Microsoft支援のOpenAI、Google、Metaという確立された大手プレイヤーがいる一方で、DeepSeek、ByteDance、アリババなど、中国からの挑戦者がいます。最大の疑問は、DeepSeekが実際に知的財産を盗んだのか、あるいはOpenAIのトップレベルモデルを複製するために何らかの巧妙な方法を使用したのかということです。
調査は進行中で、MicrosoftとOpenAIはまだ公式な爆弾は投下していません。しかし、明らかにワシントンは認識しており、デビッド・サックスはDeepSeekがおそらくGPT4の出力から知識を得たと公然と示唆しています。これが証明されるか、何らかの和解に達した場合、大きな見出しになることが予想されます。
一方、AI軍拡競争は前進し続けており、今や最高のモデルを作れるかだけでなく、誰が安価に作れるか、誰が早くロールアウトできるか、誰がデータセキュリティと検閲に関する公衆の懸念に対処できるかという競争になっています。
結論としては、AI部門は新しいプレイヤーと論争で絶対的に活気づいています。DeepSeekの申し立てられたデータ漏洩は、これらの大規模言語モデルがいかに価値があるかを証明しています。OpenAIがGPT4の訓練に推定1億ドル以上を費やし、他の誰かが600万ドル未満でそれを複製できるとすれば、それは合法であると仮定してゲームチェンジャーです。
しかし、アリババの新しい主張、つまり「私たちはOpenAIとDeepSeekの両方を打ち負かした」という発言は、さらに刺激的な要素を加えます。明らかに業界は、さらなるブレークスルー、さらなる懐疑論、そして大量の競争に備えています。
MicrosoftとOpenAI対DeepSeekの調査には注目し続けます。なぜなら、次に何が起こるにせよ、これらの企業がセキュリティと大規模なモデルのライセンス供与にどのようにアプローチするかを変える可能性があるからです。また、アリババのQwenモデルについても、特に彼らの株価が上昇傾向にあることから、さらに多くの話を聞くことになるでしょう。騒動が収まり、人々がより徹底的なテストを行えば、これらの主張が実際に維持されるかどうかがわかるでしょう。
以上が今日の分析です。AIウォーズがいかに急速に変化するかは狂気じみています。ある瞬間はアメリカの巨人だけがリードできると思っていたのに、次の瞬間には中国のスタートアップや、アリババのような大手が crazy な新しいアプローチで殴り込んでくるのです。コメント欄で教えてください。DeepSeekは本当にOpenAIの技術を盗んだと思いますか?視聴ありがとうございました。AIに関するホットな話題の続報を見逃さないよう、チャンネル登録をお願いします。

いいなと思ったら応援しよう!