見出し画像

DeepSeek R1 - AI業界全体を震撼させた中国の「サイドプロジェクト」

5,170 文字

AI業界に大地震が起き、市場は下落しました。その説明をしましょう。中国企業のDeepSeekが、市場に存在する全てを凌駕するAIモデルを発表しました。最も驚くべきことは、開発費用がわずか500万ドルだったことです。CNBCのアナリストたちは、これは革命的だと断言しています。その性能は非常に印象的で、AI用チップの巨人NVIDIAの株価はたった1日で12%も下落しました。
その理由は、DeepSeekが米国の巨人たちの予算のわずか0.01%でも世界クラスのAIを作れることを証明したからです。本題に入る前に、私の新しいチャンネル「Vision Actu」の立ち上げをお知らせしたいと思います。そこでは地政学的・金融的トレンドを分析しています。このDeepSeekの話は、そこで詳しく取り上げている問題に直接関連しています。リンクは説明欄にあります。
この話が特に興味深いのは、このモデルがほぼ偶然に開発されたということです。定量的トレーディングを専門とする企業DeepSeekは、予備のコンピューターを使って余暇の時間に開発したとされています。
状況を把握するために:Microsoftは800億ドルのAI投資を発表し、米国政府はAIインフラのためにスターゲートプロジェクトで5000億ドルを投入しています。その一方で、定量的トレーディングを専門とする数学者チームが、ほぼ偶然に世界で最も進んだAIモデルの一つとなり得るものを開発しました。コストはたった500万ドル、つまりスターゲートプロジェクトの投資額の0.001%です。
数字は明白です。NVIDIA株は12%下落、半導体セクター全体が暴落、ASML Holdingsも大きな影響を受けています。DeepSeek R1はApp StoreでChatGPTを上回り1位になりましたが、これは氷山の一角に過ぎません。
シリコンバレーの伝説的人物マーク・アンドリーセンは、これをAIの「スプートニク・モーメント」と評しました。なぜなら、DeepSeekは限られたリソースで不可能を可能にしたからです。あるバイラルツイートが彼らの秘密を明らかにしました。通常は定量的トレーディング用の予備のGPUを使用したのです。まるで、ガレージで見つけた部品でフェラーリを作るようなものです。
ダボス会議で、Scale AIのCEOアレクサンダー・ワンは衝撃的な発言をしました。DeepSeekは秘密裏に50,000個のNVIDIAチップを所有している可能性があるというのです。これらのチップは、AIのために世界で最も進んだものですが、問題は米国の制限により中国への輸出が禁止されていることです。
ユーザーテストの結果は驚異的でした。CNBCのプレゼンターは、DeepSeek R1を週末中テストした後、「より速いだけでなく、より人間らしかった。推論は衝撃的で、『なんてこと!』と思う瞬間がありました。ユーザーとして根本的な変化を感じることができました」と述べています。
あるTwitterユーザーは「DeepSeekのAPIに20万件以上のリクエストを送信しましたが、総コストは50セントで、スループット制限もありませんでした」と報告しています。この革新の規模を理解するために、同じリクエストをOpenAIで行うと数千ドルかかることを知っておく必要があります。
この状況は特別な文脈で起きています。米国はスターゲートプロジェクトで5000億ドルの投資を発表し、Microsoftは800億ドルを投じると約束しました。そして突然、中国企業が500万ドルでより良いものを作れることを実証したのです。
数時間前にMicrosoftのCEOサティア・ナデラがツイートしたように、「ジェボンのパラドックスが再び現れています。人工知能がより効率的で利用しやすくなるにつれ、その使用は急増し、コモディティ化していくでしょう」。
誰もが気になっている質問は「どうやってやったのか?」です。理論は飛び交っています。前例のない最適化の成果だと言う人もいれば、秘密の技術の存在を示唆する人もいます。アレクサンダー・ワンは、隠された50,000個のH100チップを所有している可能性があると主張しています。真実は人工知能の未来を再定義する可能性があり、これは魅力的な物語の始まりに過ぎません。
DeepSeekが革新的な理由をより深く掘り下げてみましょう。数字は雄弁に物語っています。あるユーザーは、APIに数時間で20万件以上のリクエストを送信し、スループット制限もなく、コストはわずか50セント程度だったと報告しています。これは業界では前例のないことです。
これを理解するために、何十億ドルもの資金を持つAnthropicのような大手企業でさえ、有料顧客のトラフィックの管理に苦心している一方で、DeepSeekは最小限のインフラで大規模なバイラルトラフィックを処理しているのです。
タイミングが特に印象的です。この発表は、米国のAIインフラに5000億ドルを投資するスターゲートプロジェクトの立ち上げ直後に行われました。テック業界の大物たちがこの発表に集まりました。OpenAIのサム・アルトマン、Oracleの創業者、そして他の多くの業界リーダーたちです。
Stability AIの創業者のEmadは、DeepSeekの主張を裏付ける詳細な技術分析を行いました。彼の計算によると、最適化されたH100は実際に250万ドル未満でこのトレーニングを実行できるとのことです。これらの数字は、観察されたデータ構造とアクティブパラメータに完全に一致します。
ダボス会議に出席したCEOたちは、テック大手にとって懸念される傾向を明らかにしました。現在、多くの企業がOpenAIやAnthropicを一時的な解決策として使用しながら、MetaのLlamaのようなオープンソースの代替案を積極的に探っています。なぜでしょうか?単にコストが法外になってきているからです。
MetaのAIディレクター、ヤン・ルクンは、この状況をオープンソースアプローチの検証と見ています。「重要なのは中国が米国のAIを追い越したということではなく、オープンソースモデルが独自モデルを追い越したということです」。この発言は、DeepSeek R1の性能を見ると非常に意味を持ちます。
億万長者のChamath Palihapitiyaは、テック業界の7つの巨人「マグニフィセント7」の状況について鋭い分析を提供しました。ただし、その前に現在進行中の新しいプロジェクトについてお話ししたいと思います。
ご存知の通り、このチャンネルではAIに関する全ての新製品とニュースを分析しています。私の目標は、この素晴らしい技術をできるだけ多くの人に知ってもらい、何よりもAIに対する意識を高めることです。私の周りの人々はAIの影響力を本当には理解していないようです。社会に与える影響は途方もなく大きいものになるでしょう。
すでに申し上げましたが、このチャンネルでは商品のプロモーションはしていません。できるだけ真摯であり続けたいと思います。そのため、トレーニングコースを作成しました。あなたの生活のあらゆる面でAIを使用する方法を学びたい方のためです。
この動画をご覧の方は、すでにChatGPTなどのAIを使用している可能性が非常に高いと思います。もしあなたの考えをさらに深め、全てのAIツールの使用方法を学び、生活のあらゆる面にどのように適用するかを正確に知りたい場合は、動画の下にピン留めされているコメントのリンクをご覧ください。
また、Vision AI コミュニティにもアクセスできることをお知らせしたいと思います。このプロジェクトを開始してからまだ間もないですが、すでに100人以上の方がトレーニングを購入してくださいました。素晴らしいことに、皆さんは様々な分野から参加されており、学んだツールを各自の特定の分野にどのように適用するかについて、定期的に議論できることを楽しんでいます。
申し訳ありません、少し話が逸れました。これ以上時間を取らずに、全てのリンクは動画の説明欄またはコメント欄にあることをお伝えしておきます。
Palihapitiyaによると、Teslaはパラドックスにも、この破壊的イノベーションの影響を最も受けにない企業だとされています。それは、まだ従来のAIインフラに大規模な投資をしていないからです。数週間前には不利に見えたポジションが、突然戦略的なものとなりました。
半導体業界への影響は甚大です。考えてみてください。もしDeepSeekが通常のリソースのごく一部で同様の結果を得られるなら、AI用チップの需要予測はどうなるでしょうか。NVIDIAとASML Holdingsはすでに株式市場でその影響を受けています。
ユーザーテストは例外的な性能を確認しています。あるデベロッパーは結果を共有し、DeepSeekはより速いだけでなく、文脈をより良く理解し、ChatGPTよりも適切な回答を提供すると報告しています。別の証言では、APIがより高性能なだけでなく、信じられないほど安価だと強調しています。
Neil Kuchharは挑発的な質問を投げかけました。もしこれが全て意図的な経済戦略だったらどうでしょうか?彼は、DeepSeekが市場を安定させるために意図的にコストを過小評価している可能性を示唆しています。この理論はテックコミュニティによって即座に反論されましたが、このイノベーションが提起する疑問の規模を示しています。
Scale AIのアレクサンダー・ワンは自身の立場を維持しています。DeepSeekは発表されているよりもはるかに多くのリソースを持っている可能性が高く、米国の輸出規制にもかかわらず、約50,000個のH100チップにアクセスできる可能性があると推測しています。もしこれが事実であれば、重大な地政学的問題を提起することになるでしょう。
利用データは急速な普及を示しています。DeepSeekは1週間もかからずにApp StoreでChatGPTとClaudeを上回り、最もダウンロードされたAIアプリケーションとなりました。速度と回答の質に関するユーザーの評価は一致して優れていると報告しています。
この革命が未来に何を意味するのかに焦点を当ててみましょう。Y CombinatorのプレジデントであるGarry Tanは重要な洞察を提供しました。技術は直線的に進歩するわけではなく、時にイノベーションが完全にゲームを変えることがあり、DeepSeekで起きているのはまさにそれだと述べています。
技術的なベンチマークは、これまでにない性能を示しています:GPT-4の3倍の処理速度、既存の全モデルを上回る96%の回答精度、70%削減されたエネルギー消費、大規模な負荷下でも安定した性能を維持。
大手企業の反応は素早かったです。GoogleはAI戦略の完全な見直しを発表し、MetaはLlama 3の開発を加速させています。AI競争では比較的控えめだったAmazonでさえ、効率性研究に大規模な投資を行って参入しています。
技術的な詳細分析から興味深い側面が浮かび上がってきています。スタンフォード大学の研究者によると、DeepSeekは計算能力を単に増強するのではなく、ニューラルネットワークのアーキテクチャ自体を再考することで、新しいモデル最適化アプローチを開発したとされています。これは2017年のTransformerの発明よりも重要な進歩である可能性があります。
産業への影響はテック分野を超えています。最近の報告によると、自動車業界はDeepSeekを自律システムに統合し始めており、金融機関はリスク分析への活用を探り、医療分野は画像分析への採用を検討しています。
ガートナーの新しいレポートは、2026年までにフォーチュン500企業の60%が同様の最適化されたモデルを使用するようになり、AIインフラのコストは80%下落する可能性があると予測しています。エネルギー効率はAI開発の主要な基準となるでしょう。
この分析に興味を持ち、現在の地政学的課題についてさらに深く理解したい方は、私の新しいチャンネル「Vision Actu」をご覧ください。そこでは、この話題や、私たちの現在と未来を形作る他の多くの問題について詳細な分析を見つけることができます。二つのチャンネルの両方をぜひチャンネル登録して、最新情報をお見逃しなく。新しい分析でまたお会いしましょう。

いいなと思ったら応援しよう!