見出し画像

利益なんかよりも、AGIを実現したい

2024/6に、Deepseekの創業者が記者取材に応えた時の会話

価格戦の第一弾はどのようにして始まったのか?
記者: DeepSeek V2モデルが公開された後、すぐさまLLM(大言語モデル)の価格戦が勃発しました。業界の“鯰”のような存在だと言われていますが、いかがでしょうか?
梁文锋: 私たちは意図して「鯰」になろうとしたわけではなく、気づいたらそう見なされる立場になっていただけです。
記者: こうした結果は予想外でしたか?
梁文锋: とても意外でしたね。ここまで価格に敏感な反応があるとは思っていませんでした。ただ私たちは、あくまで自分たちのペースで進め、コストを算出したうえで価格を決めただけです。基本的には赤字で提供することも、暴利を得ることもしたくありません。今回設定した価格は、コストを少し上回るだけの利幅しかありません。
記者: 公開から5日後に智谱AIが追随し、その後バイトダンス(字節)やアリババ、バイドゥ、テンセントなど大手企業も次々に値下げを発表しました。
梁文锋: 智谱AIが下げたのはエントリークラスのモデル料金です。私たちと同等クラスのモデルはまだかなり高いままですね。厳密に言えば、最初に本格的に追随してきたのはバイトダンス(字節)でしょう。彼らがフラッグシップモデルを当社と同じ価格帯に下げ、それが他の大手にも波及して次々と値下げする事態になりました。大手は当社よりもモデルコストが格段に高いので、まさか赤字を覚悟でまでやるとは思わなかったんです。結果的に、インターネット時代にありがちな「大量の資金をつぎ込んで一時的に補助する」ような構図になりました。
記者: 外部からは、値下げはユーザー獲得競争の「価格戦」にしか見えないという声もあります。インターネット時代の価格戦は、まさにそんな形が多いですよね。
梁文锋: ただ、私たちが値下げした主目的はユーザーの取り合いではありません。一つは、次世代モデルのアーキテクチャを探求する中でコストが下がったこと。もう一つは、APIやAIは誰でも手軽に使えるものであるべきだという考えからです。
記者: 中国企業の多くは、今のLlama世代の構造をそのままコピーしてアプリ開発に使うのが普通のようです。なぜDeepSeekはまずモデル構造の研究から着手したのでしょう?
梁文锋: もし目的が単にアプリ開発であれば、Llamaの構造を採用して短期集中で製品化するのは理にかなっています。しかし私たちはAGI(汎用人工知能)を目指しており、新しいモデル構造を研究する必要があります。限られたリソースでより高い性能を引き出すためには、そうした基礎研究が欠かせませんし、モデルをさらに大規模化するときも同様です。
また、モデル構造だけでなく、データの構成方法や、モデルをいかに人間に近づけるかといった多面的な研究も行っています。こうした研究成果は今回リリースしたモデルにも反映しています。さらにLlamaの構造について言えば、トレーニング効率や推論のコスト面で海外最先端と比べると2世代ほど差があると推定しています。
記者: その2世代ほどの差というのは、どこに起因するとお考えですか?
梁文锋: まずトレーニング効率ですね。私たちの推定によると、中国国内トップレベルと海外トップレベルを比べた場合、モデル構造やトレーニングの力学的要素だけで2倍以上の差があり、同等の効果を得るには2倍の計算リソースが必要になると見ています。さらにデータ効率も2倍ほど遅れている可能性があり、同じ成果を得るためには2倍のデータ量と算力が必要になる。その「2倍×2倍」で4倍のリソースを要するわけです。私たちが取り組んでいるのは、この差を少しでも縮めることにほかなりません。
記者: 中国企業の多くは「モデルもアプリも両方やる」パターンですが、DeepSeekは研究・探索に特化しています。その理由は何でしょう?
梁文锋: 私たちは世界的なイノベーションの潮流に参加することを最優先に考えています。長年、中国企業は海外の技術を活用してビジネス化してきましたが、それを「当然」と見なすべきではないと思います。この新たな波において私たちは「便乗してひと稼ぎ」ではなく、「技術の最前線に立って、エコシステム全体を前進させたい」と考えています。
記者: インターネットやモバイルインターネットの時代から、「アメリカは技術革新が得意で、中国はアプリケーション実装が得意」という認識がありますね。
梁文锋: 中国の経済規模は拡大し続けており、いつまでも「ただ乗り」を続けるわけにはいきません。ここ30年のITブームで、中国は根本的な技術革新にはあまり関与してこなかった。まるで「モーアの法則」が天から降ってきて、18か月おきに座っているだけでより優れたハードやソフトが提供されるように感じてしまいがちです。スケーリング則(Scaling Law)も同じように捉えられています。
しかし実際は、それらの進歩は欧米が主導する技術コミュニティが何世代にもわたって努力し積み上げてきた成果であり、中国はその過程に参加してこなかったため、その存在を実感してこなかっただけなのです。


02 真の差は「オリジナル」と「模倣」の違いにある
記者: DeepSeek V2はシリコンバレーでも多くの人を驚かせました。その理由は何だと思いますか?
梁文锋: アメリカでは日々膨大なイノベーションが起きており、その1つとして見ればDeepSeek V2も特別な存在というわけではありません。ただ彼らにとって驚きだったのは「中国企業がイノベーションの提供者として、このゲームに参加してきた」点でしょう。大半の中国企業はフォロワーとして行動するイメージが強かったので。
記者: ただし、中国国内から見ると、LLM(大言語モデル)は巨額投資を要する分野で、すべての企業がイノベーションだけに集中して商業化を後回しにできるわけではありませんよね。
梁文锋: もちろんイノベーションには高コストがかかります。かつて「外部からもらった技術を利用する」傾向が強かったのも、当時の国情による部分があります。しかし現在、中国の経済規模やバイトダンス、テンセントなどの大手企業の利益水準は、世界規模で見ても遜色ありません。お金がないからイノベーションできないというよりは、「自信や、ハイレベル人材をどう集めて効率的に組織するかのノウハウ」が不足しているのだと思います。
記者: なぜ資金に余裕のある大企業までもが短期収益に走りがちなのでしょうか?
梁文锋: この30年、中国は「どう稼ぐか」に重点が置かれ、イノベーションが軽視されてきました。イノベーションには必ずしも直接の商業的動機だけではなく、好奇心や創造意欲が欠かせません。しかし、そうした要素は過去の慣性で抑えられてきた。でも中国が発展段階を進むなかで、いずれ変わっていくでしょう。
記者: 貴社は研究成果をオープンソースで共有しています。営利企業としての優位性はどう確保するのでしょうか。たとえば2024年5月に公開したMLAアーキテクチャの革新も、すぐに模倣されるのでは?
梁文锋: 破壊的技術の領域では、クローズドにして得られる優位は短期的なものにすぎません。OpenAIが非公開にしていても、他社の追随を防ぎきれたわけではないですよね。私たちの価値はチーム、そこに蓄積されたノウハウ、組織や文化が生む“イノベーションの力”です。オープンソースや論文発表で失うものはなく、エンジニアにとって自分の技術がフォローされることは大きな喜びでもあります。これは一種の文化的行為とも言えます。提供することそれ自体に名誉があり、企業としても文化的な魅力を高める効果があります。
記者: 朱啸虎のような「市場原理を重視する意見」についてはどう思われますか?
梁文锋: 彼の考えは一貫性があり、一定の理屈が通っています。ただ、それは「短期間で収益を上げたい企業」には合う手法です。アメリカの最も利益を出す企業群を見ればわかるように、ハイテク分野では長年の蓄積があってこそ急成長するケースが多い。
記者: LLM(大言語モデル)については、技術面で先行しても絶対的な優位になりにくいと指摘されています。貴社が狙う「さらに大きなもの」とは?
梁文锋: 中国のAIがいつまでも追随するだけとは思えません。「中国はアメリカに1~2年遅れている」とも言われますが、単なる時間差ではなく、オリジナルか模倣かという根本的な違いによる隔たりだと考えています。そこを変えないと永遠に後追いになる。だからこそ、私たちが行っているような探索は避けて通れません。
NVIDIAのリードも、一社だけの努力ではなく、西洋の技術コミュニティと産業界が長年連携してきた成果です。次世代技術の流れを把握し、ロードマップを備えています。中国がAIをさらに発展させるには、同様にエコシステムが必要です。多くの国産チップが大きな成果を出せないのも、関連する技術コミュニティが不足していたり、海外からの二次情報に頼るだけだったりするからです。中国にも世界最先端に立つ人材や組織が必要なのです。


03 幻方がLLM(大言語モデル)に参入したのは「研究・探索」が目的
記者: 幻方(HuanFang)がLLM(大言語モデル)の分野に乗り出すと決めたのはなぜでしょう。クオンツヘッジファンドの企業が、なぜそこまで踏み込んだのですか?
梁文锋: LLMプロジェクトそのものは金融やクオンツヘッジファンドとは直接関係ありません。私たちは新たに「深度求索(DeepSeek)」という会社を独立させて取り組んでいます。幻方の主要メンバーにはAI畑の人材が多く、さまざまな分野を試す中でまず複雑な金融へ踏み込んだ。そして次に挑むべき「最高に困難なテーマ」の一つとしてAGI(汎用人工知能)に行き着いたのです。私たちにとっては「やる・やらない」ではなく、「どうやるか」が焦点でした。
記者: LLMを自社でフルスクラッチで訓練するのですか。それとも金融のような特定業界に特化したモデルを目指すのですか?
梁文锋: 目指しているのはあくまでもAGIです。言語LLM(大言語モデル)はAGIへ至る必須プロセスであり、すでにAGI初期段階の特徴を備えています。そこからスタートし、将来的にはビジョン(視覚)なども含めて取り組む予定です。
記者: 大企業がすでに参入している中で、スタートアップが汎用型のLLMを目指すのは厳しいという声がありますが。
梁文锋: 私たちはモデルを活用したアプリ開発はせず、あくまでLLMに専念する方針です。
記者: 今から参入するのは時期的に遅いと言われることもあります。既に大手企業が動き始めていますが。
梁文锋: 目の前の状況からすると、大手もスタートアップも、短期で「圧倒的な技術優位」を築くのは難しいでしょう。OpenAIという先行事例があり、論文やコードも公開されているので、遅くとも来年には多くの企業が独自のLLMを完成させるはずです。大手は大手で優位があり、スタートアップにも別のチャンスがあります。業界特有のニーズを大手が押さえているように見えても、実は要求は細分化されていて対応すべき課題が分散しているので、柔軟なスタートアップにも機会は十分にあります。長期的には、LLM活用のハードルは下がり続けるので、この先20年いつ起業してもチャンスはあるでしょう。私たちは特定の領域やアプリケーションを急がず、研究と探索を重視する方針です。
記者: なぜそこまで「研究・探索」を重視するのでしょうか?
梁文锋: 根本には好奇心があります。長期的な視点で言えば、人間の知能の本質は「言語」にあるのではないかという仮説があります。人間の思考は脳内で言語を編み上げているプロセスかもしれない。つまり、言語LLMから人間並みのAI(AGI)が生まれる可能性がある。もっと近い視点では、GPT-4にはまだ不明な部分が多く、私たちはそれを再現しながら研究を進め、その謎を解明したいと考えています。
記者: 研究には膨大なコストがかかるのでは?
梁文锋: 確かに、公開されている論文やコードを参照して数回トレーニングすればよい、あるいはfinetune(微調整)だけで済ませるならコストは大きくありません。でも本格的に研究するには多くの実験や対照試験が必要で、それだけ計算リソースも人材も必要になる。結果として費用は大きく膨らみます。
記者: その研究資金はどう賄っているのですか?
梁文锋: 幻方自身が出資者の一つとして豊富な研究開発予算を持っていますし、さらに毎年数億元規模の寄付も行っています。これまでは公益団体への寄付に回していましたが、必要なら一部を研究開発へ回せる余地があります。
記者: LLMの基盤を作るだけでも2~3億ドルが必要とも言われます。その後の継続的な資金はどう確保するのでしょう。
梁文锋: いくつかの出資候補とも話していますが、ベンチャーキャピタル(VC)は研究志向に懐疑的な面があり、短期の製品化・収益化を求めます。私たちのような「研究優先」の姿勢とは相容れない部分があるでしょう。ただ当社は既に十分な計算リソースとエンジニアチームを備えており、これは必要な要素の大半を占めるといえます。
記者: ビジネスモデルの展望はどのようにお考えでしょう?
梁文锋: 将来的には、私たちが訓練した成果を大部分オープンにして、商業化に連携できるかもしれません。小規模のアプリでも低コストでLLMを利用できるようにし、一部企業だけに独占されないようにしたいのです。
記者: いずれ大手企業も同様のサービスを提供する可能性がありますが、どのように差別化を図りますか?
梁文锋: 大手企業のモデルは自社プラットフォームやエコシステムとの連携・囲い込みが進みやすいですが、私たちは完全に中立的な立場で提供可能です。
記者: しかし営利企業が、「青天井でコストがかかる研究探索」を続けるのは正気の沙汰ではないという見方もあります。
梁文锋: もしビジネス的な収支だけで考えれば、基礎研究は効率が悪いでしょう。OpenAI初期の投資家も、最初から明確なリターンを期待したわけではないはずです。「やりたいからやる」──私たちも同じで、やれる人材とリソースがある以上、今こそ最適なタイミングと考えています。


04 1万枚のGPUを備蓄したのも“好奇心”が原動力
記者: ChatGPTブームによるGPU不足が叫ばれていますが、御社は2021年の時点で1万枚もGPUを保有していたそうですね。先見の明があったからでしょうか?
梁文锋: 実は最初は1枚のGPUから始まり、2015年に100枚、2019年に1000枚、そして1万枚というふうに段階的に増やしていきました。はじめはIDC(データセンター)にホスティングしていましたが、ある規模を超えた時点で自社のマシンルームを建設する必要が出てきたんです。外からは「何か商売上の思惑があるのでは」と推測されがちですが、実際には好奇心が大きな動機でした。
記者: どのような好奇心ですか?
梁文锋: AIの能力の限界を見極めたいという好奇心です。一般の方にはChatGPTが突然出てきて大きな衝撃を与えたように見えますが、研究者視点では2012年のAlexNet登場から、すでに時代が大きく転換していました。AlexNetは他のモデルより突出した性能を示し、何十年も低迷していたニューラルネット研究を大きく復活させました。技術の詳細は常に変わり続けていますが、「モデル」「データ」「算力」の3要素が核心であることは変わりません。特に2020年、OpenAIがGPT-3を発表して以降、「大量の算力が必要だ」という方向性は明確でした。とはいえ2021年当時、私たちが「萤火二号」と呼ぶ自前のクラスターを建設していた頃、周囲の理解はまだ限られていました。
記者: 2012年の頃から、将来的に大規模な算力が不可欠だと考えていたわけですね。
梁文锋: 研究者にとって算力は常に不足気味です。小規模の実験をすると、次はより大きな規模の実験をやりたくなる。そこで「もっとGPUを増やしておこう」と考えたわけです。
記者: 一般にはクオンツヘッジファンドの業務で機械学習を用いるからGPUが必要なのだと言われていますが。
梁文锋: 純粋にクオンツヘッジファンドだけをやるなら、そんなに多くのGPUは要りません。私たちは投資業務のほかにも多くの研究を行っていて、「金融マーケット全体を包括的に表現できる手法はあるか」「それは他分野に適用可能か」など、さまざまな探求を続けてきました。
記者: しかし、大量にGPUを買うとなると費用もかかりますよね。
梁文锋: 何かに強くワクワクする気持ちは、お金だけで割り切れるものではないんです。ちょうど「家にピアノを買う」のと同じで、「買う余裕がある」「弾きたい人がいる」ならそれで十分という発想です。
記者: GPUは年に20%ほど価値が下がるとも言われます。
梁文锋: そこまで大きくはないでしょう。NVIDIAのGPUは「ハード通貨」に近く、古いGPUでもさまざまに使い道があります。退役GPUを中古で売却しても、そこそこ値がつきました。
記者: 大規模クラスターを維持するには、メンテナンスや人件費、電気代も相当かかるのでは?
梁文锋: 電気代や運営コストはハードウェアの価格の1%程度ですし、人件費は確かに高くなる場合もありますが、それは将来への投資であり、企業にとって最大の資産だと考えています。私たちは素朴で好奇心旺盛な人材を採用し、彼らに研究環境を提供することで惹きつける形ですね。
記者: 2021年にはアジア太平洋地域で初めてA100を手に入れた企業の一つだと聞きました。クラウド企業より早いのはなぜでしょう?
梁文锋: 新しいGPUの情報収集やテスト、導入計画を常に先行して行っていたからです。一方、大手クラウド企業は当時まだ需要が分散していて、本格的に整備を始めたのは2022年頃、自動運転などのトレーニング需要が増えてからでした。大手企業はビジネスニーズが明確になってから投入を増やす傾向があります。
記者: LLM(大言語モデル)の競争構図をどうご覧になりますか?
梁文锋: 大企業には大企業の強みがある一方、アプリケーションに結びつかないと投資を続けにくい面もあります。技術を堅実に積み上げているスタートアップも見られますが、彼らも大企業と同じく事業化の壁に直面するでしょう。
記者: クオンツヘッジファンドの企業がAIをやるのは「他事業の宣伝では」と見る人もいますが。
梁文锋: 当社のクオンツヘッジファンドは、実のところ外部資金をほとんど募集していません。
記者: AIに対して真剣に信念を持つ会社と、短期の投機目的で参入する会社を見分けるとしたら?
梁文锋: 本物の信念がある会社は、以前からGPUに大きく投資し、これからも継続していきます。数百・数千枚単位で長期契約を結び、クラウドとも長期レンタル契約をするなど、腰を据えて取り組む姿勢が見えます。一方、短期契約で済ませるようなところは、投機的な参入の可能性が高いでしょう。


05 V2モデルの研究開発はすべて国内人材で
記者: OpenAIの元ポリシー責任者でAnthropicの共同創業者でもあるJack Clark氏は、「DeepSeekには深遠な天才が雇われている」と話していました。実際、DeepSeek V2を作ったのはどのような人たちなのでしょう?
梁文锋: 「深遠な天才」というような特別な人たちばかりではありません。国内のトップ大学を卒業したばかりの新卒や、博士4~5年目のインターン、卒業数年の若手が中心です。
記者: 多くのLLM企業は海外から積極的にリクルートしています。業界トップ50の人材は中国企業にいないとも言われますが、DeepSeekのメンバーはどういう経歴ですか?
梁文锋: V2モデルの開発には海外から帰国した人はいません。確かに世界にはトップクラスの人材が欧米にいるかもしれませんが、私たちは自力でそういう人材を育てたいんです。
記者: MLAの革新はどのように生まれたのですか? 若手研究員の個人的な興味から始まったと聞きましたが。
※ 幻方では新しい「MLA(マルチヘッド潜在アテンション)」を提案し、従来のMHA構造に比べてGPUメモリ使用量を5~13%に抑える成果を上げた。
梁文锋: Attentionメカニズムの変遷を総括しているうちに、若手研究員が「代替策」をひらめいたのが出発点です。とはいえ、そこから実用化に至るまでには長い道のりがあり、専用チームを編成して数か月かけてようやく実装できました。
記者: こうした“発散的なアイデア”が生まれるのは、自由なイノベーションを尊重する組織風土があるからでは? AGIのように不確実性が高い最先端分野で、マネジメントはどのように機能しているのでしょう。
梁文锋: DeepSeekでも完全に「自発・自律」を基本としています。最初から「この課題を解決せよ」という指示は出さず、メンバーそれぞれが独自の経験とアイデアを持っていますから、何かアイデアが浮かんでうまくいきそうであればリソースを配分する。そんな流れです。
記者: DeepSeekではGPUや人材の使い方も自由度が高いと聞きます。
梁文锋: 社員それぞれに、GPUのトレーニングクラスターや人を呼び出す権限があります。面白そうなアイデアがあれば、いつでもリソースを使えますし、他のメンバーが興味を持てば一緒に参加してくれます。
記者: “ゆるやかなマネジメント”が成り立つのは、熱意のある人材を厳選しているからでしょうか。評価指標を固定しない採用スタイルだとも伺いました。
梁文锋: 私たちは「熱意」と「好奇心」を最重視します。そのため、一風変わった経歴の人も多く、とにかく研究欲が強い。お金を第一に考えない人たちが集まっています。
記者: TransformerはGoogle AI Lab発、ChatGPTはOpenAI発ですが、中国の大手AI Labとの違いは何でしょう?
梁文锋: GoogleでもOpenAIでも、中国の大企業のAI Labにもそれぞれ価値があります。OpenAIが最後にブレイクスルーを起こしたのは、ある意味、歴史的な偶然もあるでしょう。


06 かつての「常套手段」は前の時代の産物。今後も通用するとは限らない
記者: イノベーションには“偶然”も大きい要素なのでしょうか。御社のオフィス中央にある会議室の両脇には、いつでも開けられる扉があり「偶然の出会いのための仕掛け」と聞きました。Transformerも偶然近くを通りかかった人が参加して、汎用的フレームワークに仕上がったという話があります。
梁文锋: イノベーションにはまず「やってみる」という信念が必要です。シリコンバレーが革新にあふれるのは、そうした意欲を尊重する土壌があるから。ChatGPTが登場したとき、中国の投資家や大企業の多くは「アメリカとの差が大きすぎる」と自信喪失気味で、すぐに応用開発に走る傾向がありました。でもイノベーションには何より自信が要ります。特に若い人ほど強い自信を持っている場合が多いですね。
記者: DeepSeekはあまり外部にPRせず、資金調達もしないので知名度は高くない印象です。それでも優秀な人材が最初からDeepSeekを目指すのはなぜでしょう?
梁文锋: 私たちは「世界でいちばん難しいこと」に挑んでいるからです。トップクラスの人材にとって、最も魅力的なのは一番難しい課題を解決すること。実際、中国に優秀な人材は多いのですが、ハードコアなイノベーションが少なく、彼らが実力を発揮できる場が限られている。だからこそ私たちが「最高難度の課題」に取り組むこと自体がアピールになるわけです。
記者: OpenAIの最新発表ではGPT-5の情報がありませんでした。「技術の伸びが鈍化しており、Scaling Lawへの疑問が強まっている」と見る人もいますが、どうお考えですか?
梁文锋: 私たちは楽観的に捉えています。業界全体を見れば自然なペースでしょう。OpenAIだって神ではありませんから、いつまでもトップを走り続けられるわけではない。
記者: AGIが実現するのはいつ頃だと見ていますか? DeepSeekはV2公開前にコード生成や数学モデルも出し、DenseからMOE構造へ移行するなど積極的に進めていますが、どんなロードマップを描いているのでしょう。
梁文锋: 2年先か5年先か、はたまた10年先か、どのみち私たちが生きているうちにAGIは実現すると考えています。ただ、社内でも意見は一致していません。今注力しているのは大きく三つの方向です。(1)数学とコード、(2)マルチモーダル、(3)自然言語そのもの。数学とコードの領域は、囲碁のように閉じた検証可能なシステムなので、自己学習により高い知能が獲得しやすい可能性があります。一方、人間の実世界を直接扱うマルチモーダルもAGIには必要でしょう。私たちはあらゆる選択肢を模索しています。
記者: LLM(大言語モデル)の最終形態はどのようになると予測されますか?
梁文锋: 基盤モデルやサービスを専門に提供する会社があり、その上に個別の用途に特化した企業群が連携していく形になると思います。多様な社会ニーズを満たす長いバリューチェーンが形成されるイメージですね。
記者: この1年で、中国のLLM系スタートアップには多くの変化がありました。たとえば王慧文(元美団CEO)は途中で離脱し、新たに参入した企業も少しずつ差別化が進んでいます。
梁文锋: 王慧文氏は自ら損失を背負い、ほかの人には被害が及ばないようにしました。自分にいちばん不利になる決断をしてまで周囲に配慮したわけで、人間として器が大きい。私も尊敬しています。
記者: 個人的には今、どんなことに集中されていますか?
梁文锋: 次世代のLLM(大言語モデル)の研究が中心です。まだ未解決の課題が山積みです。
記者: 他社のLLM企業は「技術だけでは優位が長続きしない」として、製品化に力を入れています。DeepSeekがあくまで研究を重視するのは、まだモデル性能が不十分だからでしょうか?
梁文锋: 「常套手段」は前の時代の成功体験に基づいたもので、これから先に通用するかは分かりません。インターネットの商売モデルでAIの収益を考えるのは、テンセント創業当時に「GEやコカ・コーラのビジネスモデル」を持ち出すようなもので、必ずしも当てはまらないでしょう。
記者: 幻方の時代から技術を軸に成長してきて、比較的順調な印象もあります。その経験があるから楽観的なのでしょうか?
梁文锋: 幻方での成功体験が、技術主導のイノベーションに自信を持つきっかけになったのは事実ですが、決して順風満帆だったわけではありません。長い積み上げ期間があり、外からは2015年以降の幻方しか見えないかもしれませんが、実際には16年かけて今の地位に至っています。
記者: 中国経済が下降局面に入り、資本市場が冷え込む中で、オリジナルなイノベーションはむしろ抑制される可能性はありませんか?
梁文锋: 逆に産業構造が変化する局面では、ハードコアな技術革新がいっそう求められると思います。過去に手軽な方法で稼いだ人たちが「それは時代のおかげだった」と気づけば、地道なイノベーションに目を向けるはずです。
記者: では、この先の未来に対して楽観的ですか?
梁文锋: 私は1980年代に広東省の五線級都市(小さな街)で育ちました。父は小学校の教師でしたが、90年代の広東では「勉強なんて意味がない」と言われることも多かった。でも今、そのような声はほとんどありません。タクシー運転すら昔ほど簡単に稼げなくなりました。たった1世代で社会の価値観が変わったのです。
これからはハードコアなイノベーションがますます増えると思います。現時点で社会全体が追いついていないので理解を得にくい面はあるでしょうが、事例が積み重なれば世の中は変わります。そこには多くの時間とプロセスが必要ですが、必ず変わっていくはずです。


07 投資額を増やせばイノベーションも増えるとは限らない
記者: DeepSeekにはOpenAI初期のような理想主義的空気を感じます。今はオープンソースですが、この先クローズドに変わる可能性は? OpenAIやMistralのようにオープンからクローズドへ切り替えた事例もあります。
梁文锋: 私たちはクローズドにする考えはありません。まず強力な技術エコシステムを築くことが重要だと考えています。
記者: 資金調達についてはいかがでしょうか。メディアによれば、幻方がDeepSeekを独立上場させるプランがあるとか、シリコンバレーのAIスタートアップも最終的には大手企業との提携を迫られるとも言われています。
梁文锋: 現時点で調達の予定はありません。私たちが直面しているのは資金不足ではなく、ハイエンドチップの輸出規制のほうが大きな問題です。
記者: AGIとクオンツヘッジファンドでは性質がまるで違います。クオンツヘッジファンドなら黙々とやればいいですが、AGIには「大きなアピール」で仲間を増やし、大規模投資を呼び込む必要があるのでは?
梁文锋: 投入額が増えればイノベーションも増える、というものではありません。それならとっくに大手企業がすべてを独占しているはずです。
記者: 今アプリケーションに踏み込んでいないのは、運営やサービス面のノウハウが不足しているからでしょうか?
梁文锋: 私たちは現在、技術革新が爆発的に進んでいる時期であり、アプリケーションの爆発期はまだ来ていないと見ています。長期的には、私たちの技術成果を業界のさまざまな企業に使ってもらう「エコシステム」ができるのが理想です。ベースモデルや先端研究を私たちが担当し、その上で他社がto Bやto Cサービスを構築できるようになればいい。全体がそろえば、わざわざ自社でアプリをやる必要はありません。もちろん必要があればできなくはありませんが、研究とイノベーションが常に最優先です。
記者: APIを使うなら、DeepSeekではなく大手を選ぶ企業も多いのでは?
梁文锋: いずれの時代も専門的な分業は進んでいきます。基盤となるLLM(大言語モデル)の継続的な進化を担うには、大企業の体制だけでは限界があると思います。
記者: 技術で本当に差別化できるのでしょうか。「絶対的な技術の秘密などない」ともおっしゃっていました。
梁文锋: 技術に秘密はなくても、再現するには時間とコストがかかります。NVIDIAのGPUだって、理論的には誰にでも作れますが、追いつき、次世代も見据えるには膨大なリソースと年月が必要。そこに“堀”があるのです。
記者: 値下げ後、バイトダンスがすぐ追随したのは危機感の表れだとも言われています。これはスタートアップが大手と戦う新しいアプローチだと思いますか?
梁文锋: 私たちとしては大して気にしていません。「ついでに」やった程度で、そもそもクラウドサービスの提供自体が目的ではない。最終的な目標はAGIの実現です。
現状では「大手に対抗する画期的な方法」があるようには見えませんし、大手企業にも圧倒的な優位があるわけではありません。大手は既存ユーザーを抱えている分、それが足かせとなる場合もある。いつでも破壊的イノベーションに揺さぶられるリスクを抱えています。
記者: DeepSeek以外にも6社ほどLLMスタートアップがあると言われていますが、彼らの今後をどう見ますか?
梁文锋: おそらく2~3社は生き残るでしょう。まだどこも資金を大量に投じている段階なので、自分たちのポジションを明確にし、緻密に運営できる企業が残ると思います。ほかの企業は方向転換して新しい形になる可能性もあります。意味のある技術を持っていれば消滅はしないでしょうが、違う形で存続するかもしれません。
記者: 幻方時代から、御社は「競合」をあまり意識しないと言われています。どのようなお考えからでしょうか?
梁文锋: まず、社会の効率を高められるかどうか、そしてそのバリューチェーンの中で自分たちが得意とする位置を確保できるか。それがはっきりしていれば十分です。競争や事件はあくまで移行期のものであり、過度に振り回される必要はないと考えています。


08 イノベーションは自然に発生するもので、教えたり割り振ったりするものではない
記者: DeepSeekチームの採用状況はいかがですか?
梁文锋: 初期メンバーは既に固まっています。ただ、開発初期には人材が不足していたので、幻方から一部を手伝いで呼びました。ChatGPT 3.5が話題になった昨年末から本格的に採用を始めたので、今も継続しています。
記者: LLM(大言語モデル)のスタートアップでは人材争奪が激しいですよね。投資家の中には「この分野に適した人材はOpenAIやFacebook AI Researchなどに集中している」と言う人もいます。海外からのヘッドハンティングは考えていますか?
梁文锋: 短期的目標なら経験者が一番でしょうが、長期的展望を考えるなら必ずしも経験が全てではありません。基礎能力や創造性、熱意こそ重要です。そう捉えれば国内だけでも十分な候補者がいます。
記者: なぜ「経験」がそこまで重視されないのでしょう?
梁文锋: ある分野の経験者が必ずしも最適、というわけではないからです。私たちは能力を重視し、幻方でもコア技術者の多くは新卒や入社1~2年目の若手です。
記者: イノベーションの必要な仕事では、経験が邪魔になる場合もあるということでしょうか?
梁文锋: 経験が豊富すぎると、「こうするのが当たり前」という先入観が生まれがちです。一方で未経験者は最初から手探りで考え抜き、今の現実に合う新しい解法を発見することがある。
記者: 幻方がクオンツヘッジファンド業界で台頭した際、金融業出身者がほとんどいなかったのも同じ理由でしょうか。成功要因の一つですか?
梁文锋: コアメンバーには金融出身者がいませんでした。非常に珍しいと思います。これが成功の秘訣かは分かりませんが、企業文化の一部ではあります。経験者を排除しているわけではなく、あくまで能力重視なのです。
例えば営業(セールス)を例にとると、私たちのメイン営業は2人とも業界とは無縁でした。1人はドイツ製の機械製品を扱う貿易をしていた人、もう1人は証券会社のバックオフィスでプログラムを書いていた人。金融における営業経験や人脈はゼロでした。
しかし今、私たちは大手プライベートファンドとしては珍しく代理店に頼らず、直接投資家とやり取りしています。仲介手数料を払わなくて済むので、同じ規模とパフォーマンスでも利益率が高い。他社がまねしようとしても、うまくいかないようです。
記者: なぜ多くの企業が御社のやり方をまねても成功しないのですか?
梁文锋: 部分的に真似しただけではイノベーションは起きません。企業文化やマネジメントがそれに合わなければ、結局は形だけに終わります。実際、他社は最初の1年では何の成果も出せず、2年目になってようやく少し結果が出てくるくらいです。でも私たちの評価基準は一般的な企業と違います。KPIもありませんし、「これをやりなさい」というタスクもないんです。
記者: では、評価基準はどのように設定しているのでしょう?
梁文锋: 一般的な企業のように「顧客からいくら受注を獲得したか」で測りません。営業がどれだけ売り上げたか、そのインセンティブが事前にガチガチに決まっているわけでもない。むしろ営業自ら人脈を広げ、さまざまな人と接点をつくり、より大きな影響力を持つことを奨励しています。誠実な営業パーソンがいるとして、短期的には受注につながらなくても、「この人は信頼できる」と思ってもらうことが大切だと考えているのです。
記者: 適任者を採用したあと、どのようにスムーズに仕事へ移行させるのですか?
梁文锋: 重要な仕事を任せ、口出ししないことです。本人が自分のやり方を模索し、力を発揮できるようにする。結局、「企業の遺伝子」と呼べるような文化は、真似しようとして簡単にできるものではありません。例えば未経験者を採るにしても、その人のポテンシャルをどう見極めて、入社後どう育成するか。これらはすぐにコピーできるものではないのです。
記者: イノベーションを生み出す組織を作るには、何が必要だとお考えですか?
梁文锋: 私たちが出した結論は「できる限り干渉と管理を少なくする」ことです。一人ひとりに自由な裁量と試行錯誤の場を与える。イノベーションはほとんどが自発的に生まれるもので、意図的に割り当てたり、教え込んだりして起こるものではありません。
記者: かなり特殊なマネジメント手法だと思いますが、それでどうやって各人が効率よく動き、狙い通りの方向へ進んでいると確認するのでしょう?
梁文锋: 採用段階でまず価値観を共有し、あとは企業文化によって方向性をそろえます。もっとも、私たちは明文化された「企業文化」は持っていません。文章化してしまうと、それ自体がイノベーションを妨げる恐れがあるからです。多くの場合、経営陣の行動が一つの“基準”になります。何かを決めるとき、上層部がどのように判断するかが、一種の指針として皆に伝わるのです。
記者: 今回のLLM(大言語モデル)開発競争において、スタートアップの「イノベーションを生みやすい組織構造」が大手との戦いを打開する鍵になるのでしょうか?
梁文锋: 教科書的な理論で推し量ると、今のスタートアップがやっていることは「生き残れない」と結論づけられるかもしれません。しかし市場は刻々と変化します。最終的に勝負を決めるのは“既存のルール”ではなく、変化に対応して調整できる力です。多くの大企業は大規模な組織構造を抱え、迅速に動きづらい。さらにこれまでの成功体験や慣性が足かせになることも多い。だからこそ、AIの新たな波の中で、新興企業が一気に存在感を示す可能性があります。
記者: こういった活動をするうえで、いちばんワクワクする瞬間は?
梁文锋: 自分たちの仮説が正しいと確かめられたときでしょうね。もし正しければ、大きな興奮を感じます。
記者: 今回のLLM開発において、人材採用では何を重視していますか?
梁文锋: 「熱意」と「しっかりした基礎能力」。他の要素はあまり重視していません。
記者: そういった人材は簡単に見つかるものでしょうか?
梁文锋: 本人の熱意は自然と伝わってきます。なにしろ本気でやりたいことに出会えば、むしろ本人から私たちを探してアプローチしてくる場合が多いですね。
記者: LLM(大言語モデル)は終わりの見えない投資を必要とします。そのコストは気になりませんか?
梁文锋: イノベーションは往々にして高コストかつ非効率で、無駄も伴うものです。だからこそ経済がある程度成熟してはじめて生まれやすくなります。貧しい状況や、コスト効率ばかり追求する業界では、なかなかイノベーションは起きません。OpenAIも巨額の資金を投入してようやく成果を出しましたよね。
記者: 「自分たちは相当クレイジーなことをやっている」と思うことはありませんか?
梁文锋: クレイジーかどうかは分かりませんが、世の中、論理で説明がつかないことも多いです。プログラマーが疲れていてもオープンソースプロジェクトに貢献し続けるのも、その一例でしょう。
記者: そこには精神的な報酬があるのかもしれません。
梁文锋: たとえば50kmを歩き切ると、体はボロボロでも、心は満たされる感覚に近いですね。
記者: 好奇心に突き動かされる“熱中”はずっと続くと思いますか?
梁文锋: 誰もが一生続けられるわけではありません。しかし若い時期の数年間くらいなら、まったく打算なしで、ひたすら打ち込むことは可能だと思います。