DEEPSEEK社長の衝撃的インタビュー: AIの未来を予測、備えよ!
10,005 文字
今日は、私の登録者のLoloから提供された魅力的なインタビューを探っていきます。このインタビューは、人工知能の最先端を行く中国企業であるDeepseekの世界へと私たちを導きます。同社のCEOである梁文峰氏は、中国におけるAIの発展と、同社を導く哲学について独自の視点を語ってくれました。AIモデルの価格競争から、彼らのユニークなイノベーションへのアプローチまで、この対話は業界で最も興味深い企業の一つの舞台裏を垣間見せてくれます。
本題に入る前に、私の新チャンネル「Vision Actu」の立ち上げをお知らせしたいと思います。そこでは地政学的、金融的なトレンドを分析しています。このDeepseekの話は、そこで詳しく取り上げている問題に直接関連しています。リンクは説明欄にあります。
さて、本題に入りましょう。Deepseek 2.02モデルのリリース後、大規模モデル分野で激しい価格競争が急速に巻き起こりました。
「あなたたちは業界を揺るがすドジョウだと言われていますが」
「ドジョウになるつもりはありませんでした。偶然そうなってしまったのです。この結果には非常に驚きました。価格がみんなにとってそれほど敏感だとは思っていませんでした。私たちは単に自分たちのペースで進み、コストに基づいて価格を計算しただけです。私たちの原則は、損失を出さないが過剰な利益も出さないということです。この価格には単にコストの上に小さなマージンが含まれているだけです」
5日後、Jipu AIが追随し、その後ByteDance、Alibaba、Baidu、Tencentなどの大企業が続きました。Jipu AIはエントリーモデルの価格を下げましたが、私たちのレベルのモデルは依然として非常に高額です。ByteDanceが最初に本当の意味で追随し、フラッグシップモデルを私たちと同じ価格まで下げ、これが他の大企業の値下げを引き起こしました。
「彼らのモデルコストは私たちよりもはるかに高いので、誰かが損失を出してまでこれをするとは思っていませんでした。しかし、これはインターネット時代のような補助金の論理に変わってしまいました」
「外から見ると、価格引き下げはインターネット時代によく見られたようなユーザー獲得競争に見えます」
「ユーザーを引き付けることは私たちの主な目的ではありませんでした。価格を下げたのは、一つには次世代モデルの構造を探ることでコストを削減できたからであり、もう一つはAPIもAIも誰もが利用できる手頃な価格であるべきだと考えたからです」
「それ以前は、ほとんどの中国企業がこの世代のLLaMA構造を直接コピーしてアプリケーションを作っていました。なぜモデル構造に集中することを選んだのですか?」
「目的がアプリケーションを作ることなら、LLaMA構造を使って製品を素早く立ち上げるのは理にかなった選択です。しかし、私たちの目標はAGIです。これは、限られたリソースでより強力な能力を得るために、新しいモデル構造を研究する必要があることを意味します。これは、より大きなモデルへと進化するために必要な基礎研究の一つです。モデル構造以外にも、データ構築や、モデルをより人間らしくする方法など、多くの研究を行ってきました。これらはすべて、私たちが公開するモデルに反映されています」
「さらに、LLaMA構造は、訓練効率と推論コストの面で、国際的な先進レベルと比べておそらく2世代遅れています」
「この世代間のギャップは主にどこから来ているのですか?」
「まず、訓練効率にギャップがあります。中国の最高レベルと国際的な最高レベルの間には、モデル構造と訓練ダイナミクスにおいて2倍の差があると推定しています。これは、同じ効果を得るために2倍の計算能力を消費しなければならないことを意味します。さらに、データ効率にも2倍の差があると思われます。これは、同じ効果を得るために2倍の訓練データと計算能力を消費しなければならないことを意味します。合計すると、4倍の計算能力の差になります。私たちの仕事は、これらのギャップを常に縮めていくことです」
「ほとんどの中国企業がモデルとアプリケーションの両方を行うことを選んでいます。なぜDeepseekは現時点で研究と探索にのみ集中することを選んだのですか?」
「今最も重要なのは、グローバルなイノベーションの波に参加することだと考えているからです。長年にわたり、中国企業は他者が技術革新を行い、私たちはそれを使ってビジネスアプリケーションを作るということに慣れてきました。しかし、これは自明のことではありません。この波において、私たちの出発点は素早くお金を稼ぐことではなく、技術の最前線に行ってエコシステム全体を前進させることです」
「インターネットとモバイルインターネットの時代は、ほとんどの人に、アメリカは技術革新に優れ、中国はアプリケーションに優れているという印象を残しました。私たちは、経済発展とともに、中国は徐々に他者の恩恵を受けるだけでなく、貢献者にならなければならないと考えています」
「過去30年のAIの波において、私たちは実質的な技術革新にほとんど参加してきませんでした。ムーアの法則が天から降ってくるのを待ち、18ヶ月ごとにより良いハードウェアとソフトウェアが現れるのを座って待つことに慣れてしまいました。スケーリング則も同じように扱われていますが、実際にはこれは西洋の技術コミュニティが世代を重ねて粘り強く作り出してきたものです。以前このプロセスに参加していなかったからこそ、私たちはその存在を無視してきました」
「アメリカでは、これは毎日起こる多くのイノベーションの中の非常に普通のものです。彼らが驚いているのは、中国企業がイノベーションの貢献者としてゲームに加わったからです。結局のところ、ほとんどの中国企業はイノベーションよりも追従することに慣れています」
「しかし、中国のコンテキストでは、この選択は非常に贅沢にも見えます。大規模モデルは多額の投資を必要とするゲームです。すべての企業が最初から商業化を考えずに研究イノベーションにのみ集中する余裕があるわけではありません」
「イノベーションのコストは確かに高く、過去のすべてを輸入するという習慣も当時の国内の条件と関係していました。しかし今や、中国経済の規模やByteDance、Tencentなどの大企業の利益は、世界的に見ても決して低くありません。イノベーションに必要なのは確実に資本ではなく、高密度の人材を組織して効果的なイノベーションを実現するための自信とノウハウです」
「なぜ中国企業は、お金に困っていない大企業を含めて、素早い商業化を最優先事項として簡単に考えてしまうのでしょうか?」
「過去30年間、私たちはイノベーションを軽視してお金にのみ重点を置いてきました。イノベーションは商業的な動機だけでは不十分で、好奇心と創造への欲求も必要です。私たちは単に過去の慣性に縛られているだけです。しかし、これも一つの段階です」
「あなたは公的研究機関ではなく商業企業です。例えば、5月に新しいMLAアーキテクチャを作成したとき、他の企業がすぐにコピーできるように、すべてのイノベーションをオープンソースで共有する場合、どのようにして商業的利益を保護するのですか?」
「破壊的な技術に直面したとき、クローズドコードによって作られる障壁は一時的なものです。OpenAIでさえ、クローズドコードにもかかわらず、他者に追いつかれるのを防ぐことはできません。したがって、私たちは価値をチームに根付かせています。私たちの同僚はこのプロセスで成長し、多くのノウハウを蓄積し、イノベーションができる組織と文化を形成しています。それが私たちの障壁です」
「オープンソースと論文の公開は、実際には何も失うものはありません。技術者にとって、フォローされることは非常に満足のいくことです。実際、オープンソースは商業的な行動というよりも文化的な行動です。与えることは追加の名誉の形です。このような企業は文化的な魅力も持っています」
「Zhu Zhuのような市場主義者の視点をどのように見ていますか?」
「Zhu Zhuは一貫していますが、彼のアプローチは素早くお金を稼ぎたい企業に適しています。アメリカの最も収益性の高い企業を見ると、すべてゆっくりと蓄積してから突破した技術企業です。しかし、大規模モデルでは、単なる技術的優位性は絶対的な優位性を形成することは困難です」
「より大きな何に賭けているのですか?」
「中国のAIが永遠にフォロワーの立場にとどまることはできないと考えています。中国のAIはアメリカに1、2年遅れていると言われますが、真のギャップはオリジナルと模倣の間にあります。これが変わらなければ、中国は常にフォロワーでしかありません。したがって、一定の探索は避けられません」
「NVIDIAのリーダーシップは、一企業の努力だけでなく、西洋の技術コミュニティと産業全体の共同努力の結果です。彼らは次世代の技術トレンドを見通し、ロードマップを手にしています。中国のAI開発もそのようなエコシステムを必要としています。多くの国産チップも、支援する技術コミュニティの欠如と二次情報しか得られないことにより、発展していません。したがって、中国は必然的に技術の最前線に立つ者を必要としています」
「現在のDeepseekは、OpenAIの初期を思わせる種のイデアリズムを持ち、オープンソースでもあります。後にクローズドソースになることを選びますか?」
「OpenAIとMistralは両方ともオープンソースからクローズドソースに移行しましたが、私たちはクローズドソースにはなりません。まず強力な技術エコシステムを持つことの方が重要だと考えています」
「資金調達の計画はありますか?一部のメディアによると、Ubiquantはディープシークから独立したIPOを計画しており、シリコンバレーのAIスタートアップはすべて最終的に大企業と提携しなければならなくなっています」
「短期的な資金調達計画はありません。私たちの問題は決してお金ではなく、ハイエンドチップへの規制です」
「多くの人は、AGIを作ることと定量的トレーディングを行うことは全く異なる2つのことだと考えています。定量的トレーディングは静かに行うことができますが、AGIはおそらく投資を増やすためにより多くの可視性と提携を必要とするかもしれません」
「より多くの投資が必然的により多くのイノベーションを生むわけではありません。そうでなければ、大企業がすべてのイノベーションを独占できるはずです」
「現在アプリケーションを作っていないのは、運営の遺伝子を持っていないからですか?」
「現在の段階は技術の爆発期であり、アプリケーションの爆発期ではないと考えています。長期的には、産業界が直接私たちの技術と製品を使用するエコシステムの形成を望んでいます。私たちは基本モデルと最先端のイノベーションのみを担当し、他の企業がDeepseekをベースにB2BとB2Cのビジネスを構築します」
「上流と下流の完全な産業チェーンを形成できれば、私たち自身がアプリケーションを作る必要はありません。もちろん、必要であればアプリケーションを作ることに障害はありませんが、研究と技術革新は常に私たちの最優先事項となります」
「AGIを選んだ場合、なぜ大企業ではなくDeepseekを選ぶのでしょうか?」
「将来の世界はおそらく専門的な分業に基づいているでしょう。基本的な大規模モデルは継続的なイノベーションを必要とし、大企業には能力の限界があります。それは必ずしも彼らに適していないかもしれません」
「しかし、技術は本当にギャップを生み出すことができるのでしょうか?あなたも絶対的な技術の秘密は存在しないと言っていました」
「技術に秘密はありませんが、再構築には時間とコストがかかります。NVIDIAのグラフィックカードは理論的には技術的な秘密はなく、コピーも簡単ですが、チームを再編成し、次世代の技術に追いつくには時間がかかります。したがって、実際の障壁はまだ非常に大きいのです」
「価格引き下げの後、ByteDanceが最初に追随し、ある種の脅威を感じていることを示しました。大企業と競合するスタートアップの新しいソリューションをどのように見ていますか?」
「正直なところ、私たちはそれをあまり気にしていません。ただ通り過ぎに行っただけです。クラウドサービスを提供することは私たちの主な目的ではありません。私たちの目標は依然としてAGIを実現することです」
「現時点で新しいソリューションは見えませんが、大企業にも明確な優位性はありません。彼らは既存のユーザーを持っていますが、彼らのキャッシュフローも彼らの重荷であり、破壊的イノベーションに対して脆弱になる可能性があります」
「Deepseek以外の6つの大規模モデルスタートアップの最終的な運命をどのように見ていますか?」
「おそらく2~3社が生き残るでしょう。現在、彼らはすべて資金を燃やしている段階にあります。したがって、明確な位置付けを持ち、より洗練された方法で運営できる企業の方が生き残るチャンスが大きいです。他の企業は変態する可能性があります。価値のあるものは煙のように消えることはありませんが、異なる形を取るでしょう」
「Ubiquantの時代、競争に対するあなたの態度は自分の声に従うものとされ、水平比較をほとんど気にしませんでした。競争について考えるときの出発点は何ですか?」
「私はよく、何かが社会の運営効率を高めることができるかどうか、そしてその産業分業の連鎖の中で卓越できる位置を見つけることができるかどうかを考えます。最終的な結果が社会的効率を高めるものであれば、それは価値があります。途中の多くのことは一時的なものであり、それらに過度に焦点を当てると私たちを迷わせるだけです」
「OpenAIの元ポリシー責任者でAnthropicの共同創設者であるJack Clarkは、Deepseekが神秘的な天才のグループを雇ったと考えています。Deepseek V2を作ったのはどのような人々ですか?」
「神秘的な天才はいません。それは単に名門大学の最近の卒業生、まだ卒業していない4年目や5年目の博士課程の学生、そして数年の職業経験しかない若者たちです」
「多くの大規模モデル企業が海外の人材の採用に力を入れており、この分野のトップ50の人材は中国企業にはいないかもしれないと多くの人が考えています。あなたの従業員はどこから来ているのですか?」
「V2モデルは海外から戻った人々によって作られたわけではありません。全員が現地の人材です。トップ50の人材は中国にいないかもしれませんが、おそらく私たちはそのような人々を自分たちで育てることができます」
「このMLAイノベーションはどのように生まれたのですか?」
「もともとは若い研究者の個人的な興味から生まれたと言われています。注意アーキテクチャの進化の主要なトレンドをまとめた後、代替案を設計するという突然のアイデアを思いついたのです。しかし、アイデアから実現までは長いプロセスです。私たちはそのためにチームを編成し、それを機能させるのに数ヶ月かかりました」
「このような発散的なインスピレーションの誕生は、あなたの完全に革新的な組織構造と密接に関連しています。Ubiquantの時代には、めったに上から下へ目標や任務を割り当てることはありませんでしたが、不確実性に満ちたAGIの探求にはより多くの管理行動が必要ではないですか?」
「Deepseekも完全にボトムアップで運営されており、通常、事前に任務を割り当てることはありません。これは自然な分業です。各人が独自の経歴を持ち、自分のアイデアを持ってきます。探求のプロセスで押す必要はなく、問題に直面したとき、自然に人々を探して議論します」
「しかし、アイデアが可能性を示したとき、私たちも上から下へリソースを配分します」
「Deepseekは、GPUカードとスタッフの配分において非常に柔軟だと言われています」
「私たちは誰に対してもカードとスタッフの使用に制限を設けていません。誰かがアイデアを持っていれば、承認なしにトレーニングクラスタを使用できます。さらに、階層や部門がないため、相手も興味があれば柔軟に誰にでも声をかけることができます」
「柔軟な管理スタイルは、情熱に強く動機付けられた人々のグループを選んだことにも依存しています。あなたは非伝統的な基準で優秀な人材を選ぶ細部を見ることに長けていると言われています」
「私たちの選考基準は常に情熱と好奇心でした。そのため、多くの人々が特別な経験を持っています。それは非常に興味深いことです。多くの人々はお金への関心をはるかに超えた研究への欲求を持っています」
「TransformerはGoogleのDeepMind研究所で生まれ、ChatGPTはOpenAIで生まれました。イノベーションの価値の面で、大企業のAI研究所とスタートアップの間にどのような違いを見ていますか?」
「GoogleやOpenAIの研究所、あるいは中国の大企業のAI研究所でさえ、すべて価値があります。それがOpenAIだったのも歴史的な偶然の部分があります」
「イノベーションは大きく偶然の問題なのでしょうか?あなたのオフィスの真ん中の会議室のドアが両側から自由に開けられるようになっていることに気づきました。同僚たちは、それは偶然のための余地を残すためだと言っています」
「Transformerの創造には、偶然通りかかった誰かが議論を聞いて、最終的にそれを普遍的なフレームワークにしたという話があります。私はイノベーションはまず信念の問題だと思います」
「シリコンバレーがなぜそれほど革新的なのでしょうか?まず、彼らは敢えて挑戦するからです。ChatGPTが登場したとき、国全体が最先端のイノベーションに自信を失っていました。投資家から大企業まで、誰もがギャップが大きすぎると考え、アプリケーションに集中した方がよいと思っていました。しかし、イノベーションにはまず自信が必要です」
「この自信は通常、若者の間でより明確です」
「しかし、あなたは資金調達に参加せず、外部とのコミュニケーションも少なく、社会的存在感は確実に資金調達に積極的な企業よりも小さいです。大規模モデルに取り組む人々にとってDeepseekが最初の選択肢であり続けることをどのように確保していますか?」
「なぜなら、私たちは最も困難なことをしているからです。最高レベルの人材を最も引き付けるのは、確実に世界で最も困難な問題を解決することです。実際、高レベルの人材は中国で過小評価されています。なぜなら、社会レベルでの基礎的なイノベーションが少なすぎて、彼らが識別される機会がないからです。私たちは最も困難なことを行っており、それが彼らを引き付けるのです」
「最近のOpenAIのリリースがGPT-5ではなかったことで、多くの人が技術曲線が減速している明確な兆候だと考え、スケーリング則を疑い始めています。これについてどう思いますか?」
「私たちはかなり楽観的です。業界全体が期待に沿っているように見えます。OpenAIも神ではありません。彼らは常にトップにいることはできません」
「AGIの実現にはどのくらいの時間がかかると思いますか?Deepseek V2を公開する前に、あなたはコード生成モデルと数学モデルを公開し、DANモデルからMoEに移行しました。では、AGIへのロードマップはどのようなものですか?」
「おそらく2年、5年、あるいは10年かもしれません。いずれにせよ、私たちの生きている間に実現されるでしょう。ロードマップについては、私たちの会社内でも意見は一致していませんが、実際に3つの方向に賭けています」
「第一は数学とコード、第二はマルチモーダル、第三は自然言語そのものです。数学とコードはAGIの自然な実験場です。囲碁のように、それは閉じた検証可能なシステムであり、自律学習によって非常に高い知性が実現される可能性があります。一方で、マルチモーダルと人間の実世界での学習への参加もAGIには必要かもしれません。私たちはすべての可能性に対してオープンです」
「大規模モデルの最終的な姿はどのようなものになると思いますか?」
「基本的なモデルとサービスを提供する専門企業が存在し、長い専門的な分業の連鎖があるでしょう。より多くの人々がその上に構築し、社会全体の多様なニーズに応えることになるでしょう」
「昨年、中国の大規模モデルスタートアップには多くの変化がありました。例えば、昨年初めに非常に活発だった王文文は途中で撤退し、後から参入した企業は差別化を示し始めました」
「王文文はすべての損失を引き受け、他の人々が無傷で撤退することを可能にしました。彼は自分にとって最も不利だが、皆にとって良い選択をしました。だから彼は非常に誠実な人であり、私はそのことを大いに尊敬しています」
「現在、あなたは最もエネルギーを何に集中していますか?」
「主に次世代の大規模モデルの研究にエネルギーを集中しています。まだ多くの未解決の問題があります」
「他の大規模モデルのスタートアップはすべて何でもやろうとし続けています。結局のところ、技術は永続的な優位性をもたらさず、技術的優位性を製品に変換する時間的な窓を掴むことも重要です」
「Deepseekがモデル研究に集中する勇気があるのは、モデルの能力がまだ十分でないからですか?」
「すべてのアプローチは前の世代の産物です。それらは将来的に必ずしも有効ではないでしょう。インターネットのビジネスロジックを使ってAIの将来の利益モデルを議論するのは、ソニーが会社を設立したときにゼネラル・エレクトリックとコカ・コーラを議論するようなものです。それはおそらく時代遅れのアプローチです」
「過去にUbiquantはすでに強い技術とイノベーションの遺伝子を持っており、その成長はかなり順調でした。これがあなたの楽観主義の理由ですか?」
「Ubiquantは技術革新への私たちの自信をある程度強化しましたが、それも平坦な道ではありませんでした。私たちは長い蓄積のプロセスを経てきました。外部の人々は2015年以降のUbiquantしか見ていませんが、実際には16年間働いてきました」
「オリジナルのイノベーションの話に戻りましょう。経済が不況に入り始め、資本が寒冷サイクルに入るにつれて、これはオリジナルのイノベーションにより多くの制限をもたらすでしょうか?」
「必ずしもそうは思いません。中国の産業構造の調整は、より基礎的な技術革新に依存するでしょう。多くの人々が、過去の素早い金儲けはおそらく時代の運によるものだったことを発見すると、彼らは本物のイノベーションを行うためにより多く身を屈めるようになるでしょう」
「あなたはこのことについても楽観的なのですね」
「私は80年代に広東の五線級の都市で育ちました。父は小学校の教師でした。90年代、広東では多くのお金を稼ぐ機会がありました。当時、多くの親が私の家に来て、基本的に勉強は無意味だと考えていました。しかし今、振り返ってみると、考え方は変わってきています。なぜなら、もはやお金を稼ぐのが簡単ではないからです。タクシーを運転する機会さえ、もう一世代で存在しないかもしれません」
「すべてが変わりました。将来はますます基礎的なイノベーションが増えていくでしょう。これは今はまだ理解するのが難しいかもしれません。なぜなら、社会全体が事実によって教育される必要があるからです。この社会が基礎的なイノベーターの成功と有名になることを可能にするとき、集団的なメンタリティは変化するでしょう。私たちはただ一連の事実とプロセスを必要としているだけです」
もしこの分析に興味を持ち、現在の地政学的な課題についてさらに深く理解したい場合は、私の新チャンネル『Vision Actu』をぜひご覧ください。そこでは、この話題や、私たちの現在と未来を形作る他のトピックについての詳細な分析を見つけることができます。両方のチャンネルの登録をお忘れなく。新しい分析でまた近いうちにお会いしましょう。