見出し画像

DeepSeekへの見方が変わる創業者インタビューまとめ

DeepSeekショックを起こして一躍時の人となったDeepSeek創業者の梁文锋。

昨日いつものように香港のニュースを見ていたらヘッドラインで報道されていて、自分でもいろいろと調べてみましたが思ったよりも先進的な考え方に驚かされました

2019年講演時の梁文峰

世間で話題になったのはアップルストアで1位に踊り出たことですが、「ユーザー獲得は目的ではない」と言い放ったり、「(中国人は)金儲けだけを重視し、イノベーションを軽視してきた」という発言は拝金主義(失礼)という「かの国」のイメージとはかけ離れたものです。

テクノリバタリアン的すぎる考え方に「木秀于林,风必摧之」(出る杭は打たれる)にならないかと心配になるほどで、理想に燃えるベンチャー起業家という表現がぴったりですが、海千山千の魑魅魍魎がうごめく中で無事に才能を発揮してくれるよう応援したくなります。

メディア嫌いでもあるのか、中国国内の情報でも露出が少なく、その中で見つけたのが36Krが行った独占インタビューでした。梁文峰は2023年5月と2024年7月の2回、36Krのインタビューを受けています。

36Kr(36氪)は、中国のテクノロジーと金融に特化したメディア企業。起業家や投資家にとって重要な情報源となっていて、中国版TechCrunchとも呼ばれています。

前回のnoteで略歴については触れましたが、幻方量化(ハイフライヤークオンツ)の時代から舞台裏で技術研究に打ち込んできて、DeepSeek時代でもその控えめなスタイルを続けています。表舞台に姿を見せず、論文を読み、コードを書き、グループディスカッションに参加する毎日だそうです。

他のクオンツファンドの創設者は、海外で専門的な研究をしたり、海外のヘッジファンドでの経験があったりしますが、梁文锋は中国生まれ中国育ち(「土生土長」)で若い頃に浙江大学の電子工学部で人工知能を学んだ経歴を持ちます。

このインタビューが掲載されたのは2024年7月21日。同年5月にDeepSeek V2がオープンソースモデルとしてリリースされ、中国国内にAI価格競争を巻き起こしたときでした。「AI界のピンドゥオドゥオ」(“AI界拼多多”)と呼ばれ、バイトダンス、テンセント、バイドゥー、アリババ(字节、腾讯、百度、阿里巴巴)などの大手企業を値下げ競争に巻き込みました。

ピンドゥオドゥオ(Pinduoduo)は中国のEC企業で、低価格を売りにアメリカ市場でシェアを伸ばしたTemu(テム)の運営会社

今回のR1発表による世界的な価格競争ショックはV2のときと同じ状況であり、このインタビューの中でその背景が語られています。

ちなみに長いインタビューなのでまとめていますが、それでも長くなっているので太字部分を拾っていただくと考え方や人となりがうかがえると思います。🙇‍♂️


梁文鋒インタビュー

価格戦争の最初の一撃はどのように放たれたか

記者:DeepSeek V2モデルがリリースされた後、すぐに大規模なモデルの価格競争が勃発し、業界のナマズだと言う人もいます。

梁文鋒:私たちはナマズになるつもりはなかったのですが、偶然ナマズになってしまったのです。

記者:この結果に驚きましたか?

梁文鋒:とても予想外でした。その価格がみなさんをそこまで敏感にするとは予想していませんでした。私たちは自分たちのペースで物事を進め、その後コストと価格を決定します。私たちの原則は、お金を失ったり、暴利を得ないことです。この価格も原価より若干の利益があります。

記者:5日後、智谱AI(Zhipu AI)がこれに続き、ByteDance、Alibaba、Baidu、Tencentなどの大企業が続きましたが。

梁文鋒:智谱AIはエントリーレベルの製品であり、当社製品と同レベルのモデルはまだ非常に高価です。 バイトダンスは最初に追随してきました。主力モデルの価格が当社製品と同じ価格まで下がり、他の大手メーカーも値下げに踏み切りました。大企業のモデルコストは我々よりもはるかに高いため、損をしてまで値下げするとは私たちは思ってませんでした。結局、インターネット時代の、損を補助金で補うロジックが使われました。

記者:外部から見ると、値下げはユーザーを奪い取ろうとする試みのように見えますが、これはインターネット時代の価格競争ではよくあることです。

梁文鋒:私たちの主な目的はユーザーを獲得することではありません。次世代モデルの構造を模索しながらコストを削減してきたため、価格を下げました。一方で、APIとAIは誰もがアクセスでき、誰もが手頃な価格で利用できるべきだとも考えています。

記者:これまで、ほとんどの中国企業は、この世代のLlama構造をそのままコピーして適用していました。なぜモデル構造から始めたのですか?

LlamaはMeta(フェイスブックの親会社)が開発しているソースアベイラブル(ソースコードは公開されているがオープンソースとは違い商用利用には条件がある)の大規模言語モデル(LLM)。Alpaca、Stability AI、サイバーエージェント、Sakana AIなどがLlamaをベースにAIを作成している。

梁文鋒:アプリケーションの開発が目標であれば、Llama構造を引き続き使用し、製品を迅速かつ効率的にリリースするのが合理的な選択です。しかし、私たちの目標はAGI(汎用人工知能)であり、限られたリソースでより強力なモデル機能を実現するために、新しいモデル構造を研究する必要があることを意味します。これは、より大きなモデルに拡張するために行う必要がある基礎研究の1つです。

モデル構造以外にも、データの構築方法やモデルをより人間らしくする方法など、さまざまな研究を行っており、リリースしたモデルにはそのすべてが反映されています。さらに、Llamaの構造は、トレーニング効率と推論コストの点で、先進的な外国のレベルより2世代遅れていると推定されます。

記者:ほとんどの中国企業はモデルとアプリケーションの両方の開発を選択しています。DeepSeekが現在、研究と探索のみを選択しているのはなぜですか?

梁文鋒:今最も重要なことは世界的なイノベーションの波に参加することだと考えているからです。過去何年もの間、中国企業は他社が技術革新を起こし、それを盗用してアプリケーションを収益化することに慣れてきましたが、これは当然のことではありません。この波において、私たちの出発点は、大金を稼ぐチャンスを利用することではなく、テクノロジーの最前線に立ち、エコシステム全体の発展を促進することです。

記者:インターネット時代とモバイル時代を経て、ほとんどの人の一貫した認識は、米国は技術革新に優れ、中国は応用に優れているというものです。

梁文鋒:経済が発展するにつれ、中国はただのフリーライダーではなく、徐々に貢献者にならなければならないと私たちは考えています。過去30年間のITブームにおいて、私たちは基本的に本当の技術革新に参加してきませんでした。ムーアの法則が突然現れ、18か月も経たないうちに、より優れたハードウェアやソフトウェアが登場するという状況に私たちは慣れてしまっています。スケーリング則もこのように扱われています。

しかし実際には、これは西洋が支配するテクノロジーコミュニティによって何世代にもわたってたゆまぬ努力で生み出されてきたものです。私たちがその存在を無視したのは、これまでこのプロセスに参加していなかったからに過ぎません。

本当の差は1年や2年ではなく、オリジナリティと模倣の違い

記者:DeepSeek V2がシリコンバレーの多くの人々を驚かせたのはなぜでしょうか?

梁文鋒:米国では毎日多くのイノベーションが起きています。これはとても一般的なことですが、彼らは、革新的な貢献者として中国企業が彼らのゲームに参加してきたことに驚きました。結局のところ、ほとんどの中国企業は革新よりも追随することに慣れているのです

記者:しかし中国の状況ではその選択ができるのは贅沢すぎます。多額の投資を要する大規模モデルの開発競争では、商業化を考慮せずにイノベーションを研究するだけの資本をすべての企業が持っているわけではありません。

梁文鋒:イノベーションのコストは決して低くはなく、過去の盗作の習慣も当時の国家状況に関係しています。しかし今では、中国の経済規模も、バイトダンスやテンセントのような大企業の利益も、世界的に見て決して低くないことがわかります。イノベーションに欠けているのは、間違いなく資本ではなく、効果的なイノベーションを達成するために高密度の才能を組織化する方法に関する自信と知識の欠如です。

記者:資金に困らない大企業を含む中国企業はなぜ、急速な商業化を最優先事項とみなすのですか?

梁文鋒:過去30年間、私たちは金儲けだけを重視し、イノベーションを軽視してきました。イノベーションは完全にビジネス主導で行われるものではなく、好奇心と創造性も必要です。私たちは過去の慣性に縛られているだけですが、それは一時的なものでもあります。

記者:しかし、あなた方は結局のところ営利組織であり、公共福祉研究機関ではありません。オープンソースを通じて革新し、それを共有することを選んでいます。では、どこに堀(差別化)を築くのですか? 2024年5月のMLA アーキテクチャのようなイノベーションも、すぐに他の企業に模倣されるのではないでしょうか。

梁文鋒:ゲームチェンジャーとなるような技術に直面して、クローズドソースによって形成された堀は長続きしません。 OpenAIがソースコードを非公開にしたとしても、他社に追い抜かれるのを防ぐことはできない。そのため、当社はチームを重視しています。その過程で仲間が成長し、多くのノウハウを蓄積し、革新できる組織と文化を形成します。これが当社の堀です。

ソースコードを公開して論文を公開しても、実際には何も失うものはありません。技術者にとって、フォローされることは非常にやりがいのあることです。実際、オープンソースは商業的な行動というよりも、文化的な行動に近いものです。与えることは実は特別な名誉なのです。企業にとって、これを実行すれば文化的な魅力も生まれます。

記者:朱啸虎のような市場信奉者についてどう思いますか?

朱啸虎(Allen Zhu)氏は、中国の著名なベンチャーキャピタリストです。金沙江資本(Jinshajiang Venture Capital)の創設者で、中国版Uberの滴滴出行(DiDi Chuxing)、中国版Uber Eatsの饿了么、動画投稿SNSの小紅書(Xiaohongshu)などのスタートアップ企業に投資を行ってきました。

梁文鋒:朱啸虎は一貫していますが、彼のやり方はすぐに利益を上げる企業に適しています。米国で最も利益を上げている企業を見ると、それらはすべて時間をかけて力を蓄えてきたハイテク企業です。

記者:でも、大型モデルを作るとなると、技術でリードするだけでは絶対的な優位性は難しいですよね。それよりも大きな賭けは何ですか?

梁文鋒:私たちが見ているのは、中国のAIが常に追随者の立場に留まることはできないということです。中国のAIと米国のAIの間には1年か2年の差があるとよく言われますが、本当の差は独創性と模倣性の違いです。これが変わらなければ、中国は常に追随者であり続けるため、ある程度の探究は避けられないと思います。

Nvidiaのリーダーシップは、単なる1つの企業の努力の結果ではなく、西側諸国のテクノロジーコミュニティと業界全体の共同の努力の結果です。次世代のテクノロジートレンドを把握し、ロードマップを作成できます。中国におけるAIの発展にも、このようなエコシステムが必要です。多くの国産チップは、技術コミュニティのサポートが不足し、間接的な情報しか得られず開発できないため、中国には技術の最前線に立つ人物が必要です。

投資が増えてもイノベーションが増えるとは限らない

記者:現在の DeepSeekには、OpenAIの初期の頃からある種の理想主義的な気質があり、オープンソースでもあります。将来的にはクローズドソースを選択しますか?OpenAI と Mistral はどちらも、オープンソースからクローズドソースへ移行するプロセスを経ています。

梁文鋒:クローズドソースにはしません。私たちは、まず強力な技術エコシステムを構築することがより重要であると考えています。

記者:資金計画はありますか?メディアの報道によると、幻方はDeepSeekを独立させて上場する計画を立てており、シリコンバレーのAIスタートアップは最終的には大手メーカーに束縛されることは避けられないという。

梁文鋒:短期的な資金調達計画はありません。私たちが直面している問題は決してお金ではなく、ハイエンドチップの禁輸です。

記者:AGIの実行と定量化の実行はまったく別のことであると多くの人が信じています。定量化は静かに実行できますが、AGIにはより高レベルの取り組みと連携が必要になる可能性があり、そのために投資が増加する可能性があります。

梁文鋒:投資が増えても、必ずしもイノベーションが増えるわけではありません。そうしないと、大手メーカーがすべてのイノベーションを引き継いでしまう可能性があります。

記者:今はアプリケーションを作らないのは、運営するノウハウがないからですか?

梁文鋒:私たちは、現段階は技術革新の爆発期であって、応用の爆発期ではないと考えています。長期的には、業界が当社のテクノロジーと成果物を直接使用するエコシステムを形成したいと考えています。当社は基本的なモデルと最先端のイノベーションのみを担当し、その後は他の企業がDeepSeekをベースに企業向けおよび個人向けビジネスを構築します。川上と川下の完全な産業が形成できれば、自分たちでアプリケーションを作る必要はありません。もちろん、必要に応じて適用することには何の支障もありませんが、研究と技術革新は常に最優先事項です。

記者:あなたが価格を下げた後、バイトダンスが最初に追随しました。これは、彼らが依然として何らかの脅威を感じていることを示しています。スタートアップが大企業と競争するための新しいソリューションについてどう思いますか?

梁文鋒:正直に言うと、私たちはこの件についてはあまり気にしていません。たまたまやっただけです。クラウドサービスを提供することが私たちの主な目標ではありません。私たちの目標は依然としてAGIを達成することです。

「とんでもない」ことをする若者たちの集団

記者:OpenAIの元ポリシーディレクターであり、Anthropicの共同創設者でもあるJack Clark氏は、DeepSeekには「計り知れないほどの天才たちの集団」が雇用されていると考えています。DeepSeek-V2はどのような人たちが作ったのでしょうか?

梁文鋒:謎の天才はいません。彼らは皆、一流大学を卒業したばかりの人、博士課程の4年目や5年目のまだ卒業していないインターン、そして数年前に卒業したばかりの若者たちです。

記者:多くの大手モデル企業は海外からの人材採用に熱心です。この分野のトップ50の人材は中国企業にはいないだろうと多くの人が考えています。あなたの会社の人材はどこから来ているのですか?

梁文鋒:V2モデルには海外から戻ってきた人はいません。全員国内の人です。トップ50の才能は中国にはないかもしれませんが、私たち自身で生み出すことができるかもしれません。

記者:緩やかな運営方法も、強い愛に突き動かされる人々のグループを選択することにかかっています。細部にわたる人材採用が得意で、従来とは異なる評価指標で優秀な人材を選出できると聞きました。

梁文鋒:私たちの人選基準は常に愛と好奇心です。そのため、多くの人がユニークな経験をすることになり、非常に興味深いです。多くの人はお金のことよりもはるかに研究をしたいと考えています。

記者:本来のイノベーションの話題に戻ります。経済が低迷し、資本が冷え込みに入った今、本来のイノベーションにさらなる制約がもたらされるのでしょうか?

梁文鋒:それはないと思います。中国の産業構造の調整は、よりコア技術の革新に依存することになるでしょう。多くの人が、過去に手っ取り早くお金を稼げたのはおそらく時代のおかげだったと気づくと、より喜んで身を乗り出して真のイノベーションを行うようになるでしょう。

記者:では、あなたもこの件については楽観的ですか?

梁文鋒:私は1980年代に広東省の五級都市で育ちました。私の父は小学校の教師でした。1990年代、広東省にはお金を稼ぐ機会がたくさんあり、多くの親が勉強は無駄だと考えていました。が、今ではその考えは通用しなくなりました。お金を稼ぐのは難しく、タクシー運転手になる機会さえないかもしれません。一世代で変わってしまいました。

将来的には、より多くのイノベーションが起こるでしょう。社会集団全体がその事実について学んでいく時間が必要になるため、今はまだ理解されにくいかもしれません。この社会で革新的な人々が成功していくにつれて、集団の考え方も変わっていくでしょう。私たちに必要なのは、ひとつひとつの事実とプロセスの積み重ねです。

いいなと思ったら応援しよう!