1%の天才しか採用しない——シリコンバレーを脅かす中国企業
設立からわずか1年余りのあいだ世間にほとんど姿を見せなかったDeepSeek(深度求索)が、V2モデルの発表によって一気にブレイクを果たした。モデル構造の面で画期的なイノベーションを成し遂げ、大幅なコスト削減に成功したことで「AI界のピンドゥオドゥオ(価格破壊で有名な中国企業)」とも揶揄された。これをきっかけに、DeepSeekはシリコンバレーに本当の危機感を抱かせる存在となり、OpenAIにとって最強のライバルが現れたとも言われている。
「OpenAIの最強の対抗相手がついに出現した。その相手は中国から来た。」
2025年が始まったばかりの時期に世界的注目を集めたDeepSeekは、1月20日の夜に「真珠湾攻撃」に匹敵するサプライズともいえる動きを見せた。すなわち、推論モデルであるDeepSeek-R1正式版をリリースし、モデルの重みをオープンソース化。さらに、モデルの出力およびモデル蒸留によるトレーニング用データとしての利用も許可したのだ。このLLM(大規模言語モデル)は数学やコード生成、自然言語推論などにおいて、OpenAIの「o1正式版」に匹敵する性能を示すと言われている。
R1バージョンが発表されると、海外では「これこそが真のオープンAIだ」と大きな反響が起きた。NVIDIAのシニアリサーチサイエンティストであるジム・ファン(Jim Fan)はR1モデルについてこう評している。「我々は今、とある時代に生きている。アメリカ企業ではないAI企業が、OpenAI創立時に掲げていた使命を達成しようとしている。つまり、『すべての人に力を与えるような、真にオープンかつ最先端の研究』を実現する企業の登場だ。」
先日、鳳凰網科技(Phoenix Tech)は「英偉達(NVIDIA)の最大のショートセラー(空売り)出現か」と題した記事の中で、DeepSeek(深度求索)とその大モデル群の強みについて詳しく紹介した。実際に現在、DeepSeekが示すイノベーションの高さは、さらに評価が高まっている。
DeepSeekのイノベーションが世界中で注目されるにつれ、この中国のテック企業とその舵取り役は、一体どんな存在なのかとますます関心が集まっている。
五線都市出身の「浙大学霸(超エリート)」が“誰も行かない領域”へ挑む
1985年、梁文鋒(リャン・ウェンフォン)は広東省湛江という五線級都市で生まれた。幼少期の成長環境については詳細不明だが、インタビューの中で父親が小学校教師だったことを語っている程度の情報しかない。
2002年、17歳の梁文鋒は卓越した成績で浙江大学(電子情報工学専攻)に合格。2007年、22歳で再び浙江大学の情報・通信工学の修士課程に進学し、項志宇(シャン・ジーユー)教授のもと、主にマシンビジョン分野を研究した。
2008年、まだ浙江大学の修士課程在学中だった23歳の梁文鋒は、同級生を率いて市場動向や金融市場、マクロ経済に関するデータ収集を開始。当時は世界金融危機の真っただ中であり、彼らは機械学習技術を使った全自動のクオンツ取引に挑んでいた。
大疆(DJI)の創業者・汪滔(フランク・ワン)が梁文鋒に共同創業を打診したという話もある。当時のDJIはまさに創業期で、梁文鋒が加わっていれば早期に“財務的自由”を得られたかもしれないが、梁文鋒は「人工知能が世界を変える」と固く信じ、独自に起業する道を選んだという。
2010年6月、25歳の梁文鋒は浙江大学の情報・通信工学専攻修士課程を修了。修士論文のタイトルは「低コストPTZカメラを用いたターゲット追跡アルゴリズムに関する研究」だった。
修士修了から3年後の2013年、28歳になった梁文鋒は、AIとクオンツ取引を組み合わせ、浙江大学出身の徐進(シュー・ジン)らとともに「雅克比投資(杭州雅克比投資管理有限公司)」を設立。その後2015年には「杭州幻方科技有限公司」(現・浙江九章資産管理有限公司)を共同創立し、翌年には「寧波幻方量化投資管理合伙企業(有限合伙)」を立ち上げている。
量化投資(クオンツ投資)とは、簡単に言えばコンピュータによるモデル計算を使い、人間ではなくプログラムが売買指令を出す仕組みで、安定的な利益を得やすいとされる投資手法である。
数年の時間を経て幻方量化は国内で急成長。2016年10月、幻方量化は最初のAIモデルをリリースし、初めて深層学習によるトレーディングポジションを導入。2017年末には量化ストラテジーのほぼすべてがAIモデルを利用するようになり、2019年には幻方量化の運用規模は100億元を突破し、中国の量化私募ファンドの「四巨頭」の一角に数えられるまでになった。
その後、幻方量化は一時、中国で初めて運用規模が1000億元を超えた私募量化ファンドに成長し、実質的に業界唯一の「大台」を越えた存在となった。この期間に、梁文鋒は量化投資分野で強力な技術基盤と演算資源(算力)を蓄え、幻方量化は莫大な計算リソースを誇ることで名を馳せた。
そして2023年、世界でAIブームが勃興し、梁文鋒にとって起業10年目の節目を迎える。
通用AIに挑む——量化投資家がAI界へ“初参戦”
2023年5月、38歳の梁文鋒は汎用人工知能(AGI)をやると宣言。同年7月に杭州深度求索人工智能基礎技術研究有限公司(DeepSeek)を設立し、AI大モデルの研究開発に専念する。こうして、量化投資出身の起業家がAI分野に参入する「第一人」となったわけだ。
そこからは、まるで“爽文”(中国で言う“痛快ストーリー”)さながらの「AI界のピンドゥオドゥオ」的な急成長を遂げ、大手企業をも追従させるほどの存在になった。あるAIアルゴリズムエンジニアは鳳凰網科技の取材に対し、「豆包(字節跳動の大モデル)やアリババクラウドが価格を下げる以前に、DeepSeekがいち早くモデルコストを引き下げた。それはとても印象的だった」と語る。
2024年5月、DeepSeekは開源モデル「DeepSeek V2」をリリースし、これをきっかけに業界内で価格競争が勃発する。DeepSeek V2はそれまでにないコストパフォーマンスをもたらした。推論コストは100万トークンあたり1元(約20円)に抑えられ、Llama3 70Bと比べて7分の1、GPT-4 Turboの70分の1という水準だった。
同年12月26日、わずか7か月後にDeepSeekは「DeepSeek V3」をリリースし、再び価格に対する常識を覆した。DeepSeek V3のAPI料金は、入力100万トークンあたり0.5元(キャッシュヒット時)/2元(キャッシュミス時)、出力100万トークンあたり8元。これは字節跳動のDoubao-pro-256k(入力同5元、出力同9元)に匹敵し、依然として国産モデルの中では最高レベルのコスパを誇る。
そして業界がまだDeepSeek V3の衝撃から冷めやらぬうちに、今回DeepSeek-R1正式版が登場。DeepSeekはついにシリコンバレーに真の脅威をもたらす存在となった。
マイクロソフトのCEOサティア・ナデラは、スイス・ダボスの世界経済フォーラムで次のように述べている。「DeepSeekの新モデルを見て、本当に強く印象を受けた。彼らはオープンソースモデルを確かに開発していて、推論計算のパフォーマンスが優秀で、さらに超高効率のスーパーコンピューティングを実現している。」
「中国で起こっている進展を、我々は非常に非常に真摯に受けとめる必要がある。」とナデラは続けた。
DeepSeekの価値——やはりイノベーション
「DeepSeekには確かに際立った点がある。業界内では『彼らはOpenAIのo1モデルを蒸留で利用したのだろうけど、その上でより優れたアルゴリズム的イノベーションを実装した』と見ている人が多い。」こう話すのは、ある業界関係者だ。
設立から1年以上、DeepSeekは注目されるような声を上げず、鳳凰網科技の情報によると、広報部門さえ置いていないという。多くの大モデル企業が世間の注目や開発スピードを競う中、DeepSeekは“黙って”イノベーションを探究してきた形だ。
DeepSeekのイノベーションは自発・自下型で、会社全体に張り巡らされている。梁文鋒も普段は論文を読み、コードを書き、チームのディスカッションに参加しているという。一線級の研究者と同レベルで動く経営者は珍しい。
創業当初からAGIを目指していたため、DeepSeekは“既存の世界最先端モデルに乗っかってすぐアプリを形にする”という追随戦略をとらず、モデル構造の段階から0→1のイノベーションに取り組んでいる。
梁文鋒は《暗涌》というメディアのインタビューでこう語っている。「なぜなら今いちばん大切なのは、世界的なイノベーションの波に乗ることだと私たちは考えているからです。長年、中国企業は海外が生んだ技術革新を使ってアプリを作り、マネタイズしてきました。でもそれは当たり前のことではない。この新たな波で私たちが目指すのは『ここぞとばかりに一儲け』ではなく、最前線に立ってエコシステム全体を前に進めることなんです。」
これまで中国企業は人材の構成や資本力の制約もあり、“そこそこのイノベーション”にとどまる場合が多かった。ところが今や、バイトダンスのような企業は年間数百億ドルの利益を叩き出すまでになっている。鳳凰網科技の取材によれば、バイトダンスのDoubao大モデルチームも“Seed Edge”という名のAGI長期研究プロジェクトを始めている。
つまり、もはや中国企業がイノベーションを起こすうえで「資金不足」は問題ではなくなった。大切なのは「優れた人材密度をどう維持し、自信をどう持つか」という点だ。
DeepSeekに関わったことのある何人かによると、DeepSeekの強みは人材密度が非常に高いことで、しかも多くが中国国内出身者だという。
「DeepSeekのチームは初期の時点で100人ほどですが、一人ひとりが非常に優秀です」とあるAI業界のヘッドハンターは語る。「実はKimi(王慧文)が同じように人材を厳選するやり方を狙っていたけど、うまくいかなかったんです。」
別の業界関係者は「DeepSeekの提示する報酬水準はかなり高額なので、人材を強く惹きつけているのでは」と分析する。
これまで複数のメディアが報じているところによると、小米の雷軍が「DeepSeekの人材を引き抜こう」と動き、その際オファーした報酬は1000万元(約2億円)クラスだったという。その相手はDeepSeek-V2の開発に深く関わった95年生まれの羅福莉(ルオ・フーリー)だと言われる。
量子位(メディア)がまとめた情報を見る限り、DeepSeekチームの最大の特徴は“若さ”である。新卒や在学中の学生、とくに清華大学や北京大学出身の若者が多く活躍しているようだ。
「1%の天才しか採用せず、他の99%の中国企業にはできないことをやる。」DeepSeekの面接を受けた新卒者は、その採用方針をこう評する。
このため、DeepSeek全体として“極限のイノベーション・モチベーション”を保てている。
梁文鋒も《暗涌》のインタビューの中で、「DeepSeekは採用で経験より能力を見る。コア技術職の多くが新卒や卒業1~2年の若手だ。V2モデルは海外帰りの人材がいない純粋な国内メンバーで作り上げた。業界トップ50の人材が中国にいないとしても、自分たちでそういう人材を育てられるかもしれない」と述べている。
前の世代とは異なる成功ストーリーが、DeepSeekからは見えてくる。いわゆる「前の世代」はインターネットビジネスで功なり名を遂げた人々で、技術ブレイクスルーよりもスピード勝負、資本力、規模拡大で勝ってきた。
しかし現在は“ハードコアなイノベーション時代”に入っている。DeepSeekの例はその端的な表れで、同じ杭州に本拠を置くUnitree Robotics(宇樹科技)も新たな人型ロボット「B2-W」を発表して世界を驚かせた。同社の創業者兼CEO・王興興は浙江理工大学機械・自動制御学院で学部を修め、卒業後は上海大学大学院で機械工学を専攻したという経歴を持つ。