見出し画像

幻方時代のインタビューにみるクオンツトレーダーの下剋上

日経新聞にもDeepSeek創業者の去年のインタビューが掲載され、他の媒体でもかなり取り上げられています。

しかし、メディア嫌いとされるCEOがこれまでに受けた二度のインタビューのうち、最初のものはあまり紹介されていません。このインタビューこそ、梁文鋒のキャリアを理解するうえで重要なポイントが含まれています。

浙江大学から世界のAI戦争へ:DeepSeek創業者の異色キャリア

特に注目しているのは、梁文鋒の「クオンツヘッジファンド出身」という経歴です。クオンツの世界といえば、MIT(マサチューセッツ工科大学)、ハーバード、オックスフォード、ケンブリッジといった世界トップの数学の天才たちがひしめく世界です。

もちろん、梁文鋒の母校である浙江大学も中国国内では第一線の「985大学」ですが、2025年の世界大学ランキングではトップ50にすら入りません

中国の4つは清華大学12位、北京大学14位、上海交通大学43位、復旦大学44位

実際にクオンツヘッジファンドを見てみると、ルネサンス・テクノロジーズのジェームズ・シモンズはMIT出身の数学博士、シタデルのケン・グリフィンやブリッジウォーター・アソシエイツのレイ・ダリオはハーバード出身です。クオンツの採用条件でも世界トップの学歴を求めたりと、超学歴主義が支配するフィールドといえます。

去年亡くなったジム・シモンズ、「最も賢い億万長者」、「クオンツ王」と呼ばれた

しかし、梁文鋒のキャリアは単なるヘッジファンドの成功物語では終わりません。彼はクオンツファンドで稼いだ資金を元手に、投資家としてAI事業を立ち上げました。

収益に結び付かないから自分の資金でやりたいことをやるという点は、OpenAIを設立したときのイーロン・マスクとも通じるものがありますが、クオンツトレーダーとして築いた成功を新たな情熱へと再投資するスタイルはAI業界でも稀有なパターンです。

浙江大学出身からクオンツヘッジファンドで台頭し、さらに天才たちがひしめくAI界で話題をかっさらう姿は現代の下剋上ストーリーといえます。

今回紹介するインタビューは、まさにDeepSeekが設立された2023年5月、彼がクオンツファンドの幻方からAIへと軸を移し始めた時期のものです。クオンツからどのようにAI開発へとつながるのかが興味深いです。


1. 最も重要で最も難しいことをする

記者:幻方はLLM(大規模言語モデル)を構築することを決定しました。なぜクオンツファンドがそのようなことをするのでしょうか?

梁文鋒:私たちが作る大規模言語モデルは、実は定量分析や金融とは直接関係がありません。これを実現するために、私たちはDeep Quest(深度求索)という新しい会社を設立しました。幻方の主要チームメンバーの多くは人工知能分野で働いています。当時、私たちは多くのシナリオを試し、ようやく難関な金融の世界に切り込むことができました。そして汎用人工知能は次の最も難しいものの1つかもしれません。そのため、私たちにとっては、これはなぜやるかではなく、どうやってやるかの問題です。

記者:LLMを自分でトレーニングしたいですか、それとも金融に特化したモデルなど、いわゆる垂直産業向けのトレーニングしたいですか?

梁文鋒:私たちがやりたいのは、汎用人工知能、つまりAGIです。LLMはAGIに至るために必要な通り道かもしれませんし、AGIの初期の特徴を備えているので、まずはここから始めて、視覚やその他の機能は後から組み込むことになります。

記者:大手企業の参入により、多くのスタートアップ企業は、一般的なLLMを作るという方向性を放棄してしまいました。

梁文鋒:早い段階でLLMベースのアプリケーションを設計することはせず、LLM自体の開発に重点を置きます。

記者:他のスタートアップは大企業の台頭により撤退してしまい、もはや良いタイミングではないと多くの人が考えていますが。

梁文鋒:大企業にとってもスタートアップ企業にとっても、短期間で競合他社を圧倒する技術的優位性を確立するのは難しいようです。OpenAIの指導と公開論文やコードに基づき、大企業やスタートアップ企業は遅くとも来年(2024年)までに独自の大規模言語モデルを開発するでしょう。大企業にもスタートアップにもチャンスがあります。

既存の垂直シナリオはスタートアップの手に渡っていないため、この段階はスタートアップにとってあまり良いタイミングではありません。しかし、このシナリオは結局のところ、散在し断片化された小さなニーズに関するものであるため、柔軟な起業家組織に適しています。

長期的には、LLMを適用するためのハードルはどんどん低くなり、スタートアップ企業は今後20年間いつでもチャンスを得ることになるでしょう。私たちの目標も非常に明確で、垂直的なカテゴリやアプリケーションに焦点を当てるのではなく、研究と探求を行うことです。

記者:なぜ「研究と探求を行う」という定義なのですか?

梁文鋒:一種の好奇心が原動力だからです。一歩下がったところからいくつかの推測を検証したいと思います。たとえば、人間の知性の本質は言語であり、人間の思考は言語プロセスである可能性があると私たちは理解しています。あなたは自分が考えていると思っていますが、実際には心の中で言葉を紡いでいるのかもしれません。これは、言語モデルに基づいて人間のような汎用人工知能が誕生する可能性があることを意味します。短期的には、GPT4にはまだ解明すべき謎が数多く残っています。それを再現しながら、秘密を明らかにするための研究も行います。

記者:しかし、研究にはより大きなコストがかかります。

梁文鋒:複製だけであれば、公開されている論文やオープンソースコードに基づいて行うことができ、数回のトレーニング、あるいは微調整のみで済み、コストも非常に低くなります。研究ではさまざまな実験や比較が必要となり、より多くの計算能力と人員が必要になるため、コストが高くなります。

記者:研究資金はどこから来るのですか?

梁文鋒:投資家の1社として、幻方は十分な研究開発予算を持っています。さらに、毎年数億元の寄付予算があり、以前は慈善団体に寄付していました。必要に応じて調整することができます。

記者:しかし、ベースレイヤーで大規模なモデルを構築するために2〜3億ドルの資金がなければ、開発競争のテーブルに上がることすらできません。その継続的な投資をどのようにサポートできるのでしょうか?

梁文鋒:私たちはさまざまな投資家を探して話し合っています。彼らと交流した後、私は多くのベンチャーキャピタルが研究を行うことに懸念を抱いていると感じました。彼らは出口戦略を必要としており、できるだけ早く製品を商業化したいと考えています。しかし、私たちは研究を優先したいので、ベンチャーキャピタルから投資を受けるのは難しいです。しかし、私たちにはその投資の半分にも値するような計算能力とエンジニアのチームがいます。

記者:ビジネスモデルについてどのような推論や仮定を行ってきましたか?

梁文鋒:私たちが今考えているのは、将来的にはトレーニング結果のほとんどを公開し、それを商業化につなげていくことです。私たちは、技術が少数の人々や企業によって独占されるのではなく、小さなアプリであっても、より多くの人が低コストで大きなモデルを利用できることを願っています

記者:後期段階では大手企業もサービスを提供するでしょう。どこで差別化をするつもりですか?

梁文鋒:大企業のモデルは自社のプラットフォームやエコシステムにバンドルされているかもしれませんが、私たちは完全に自由です。

記者:いずれにしても、営利企業が際限なく研究調査を行うというのは少々無謀に思えます。

梁文鋒:ビジネス上の理由を見つけなければならない場合、コスト効率が悪いため不可能かもしれません。ビジネスの観点から見ると、基礎研究の投資収益率は非常に低くなります。

OpenAIの初期の投資家が資金を投資したとき、彼らはどれだけの利益が得られるかではなく、本当にこれをやりたいと考えていたのです。私たちが今確信しているのは、私たちがこれをやりたいと思っており、それを実行する能力もあるので、現時点で最も適した候補の1つであるということです。

2. 1万個のGPUを買い溜めできたのは好奇心によって突き動かされた結果

記者:このChatGPTの起業ブームではGPUは希少な商品です。2021年(アメリカの禁輸前)に10,000 個の GPU を予約しておくという先見の明を持てたのはなぜですか?

梁文鋒:実はこのプロセスは徐々に進みました。最初は1枚のGPUでしたが、2015年には100枚のGPU、2019年には1,000枚のGPU、そして10,000枚のGPUになりました。数百枚のGPUがリリースされる前は、IDCでホストしていました。しかし、規模が大きくなるにつれて、ホスティングでは要件を満たせなくなったため、独自のコンピュータルームを構築し始めました。多くの人は、この背後には未知のビジネスロジックがあったと考えるでしょうが、実際には、それは主に好奇心によって動かされた結果です。

記者:どんな好奇心ですか?

梁文鋒:AIの能力の限界に対する好奇心です。多くの部外者にとって、ChatGPTの波は特に大きな影響を与えました。しかし、AI研究者にとっては、2012年にAlexNet※がもたらした影響が新しい時代の到来を告げました

※「AlexNet」はアレックス・クリジェフスキー(Alex Krizhevsky)が イリヤ・サツケバー(Ilya Sutskever)および ジェフェリー・ヒントン (Geoffrey Hinton)と共同で設計した畳み込みニューラルネットワーク(CNN)の構造の名前。2012年にILSVRC(画像認識分野の世界的コンテスト)で、従来の技術を遥かに凌駕した精度で画像認識の記録を塗り替えた。ジェフリー・ヒントンは2024年にノーベル物理学賞受賞、イリヤ・サツケバーはOpenAIの共同設立者。

AlexNetのエラー率は当時の他のモデルよりもはるかに低く、何十年も休眠状態にあったニューラルネットワークの研究を復活させました。具体的な技術的方向性は変化しているものの、モデル、データ、計算能力の組み合わせは変わっていません。特にOpenAIが2020年にGPT3をリリースしたとき、多くの計算能力が必要になるという方向性が明確になりました。2021年に私たちはファイアフライ2(自前のスーパーコンピューター)を開発し始めましたが、ほとんどの人はまだそのことを理解できていませんでした。

記者:では、2012年から計算能力(GPUカード)の蓄積に注目し始めたのですか?

梁文峰:研究者にとって、計算能力への渇望は尽きることがありません。小規模な実験を行った後は、必ずもっと大規模な実験を行いたくなります。その後も、可能な限り多くのコンピューティングパワーを意識的に展開していきました。

記者:多くの人は、これらの計算能力インフラは、クオンツファンドのプライベートエクイティビジネスが機械学習を使用して価格予測を行うために構築されていると考えていたと思います。

梁文鋒:クオンツ投資だけであれば数枚のGPUで目標を達成できます。私たちは投資以外の分野でも、どのようなパラダイムが金融市場全体を完全に説明できるか、より簡潔な表現方法があるかどうか、さまざまなパラダイムの能力はどこにあるのか、これらのパラダイムはより広範囲に適用可能かなど、多くの調査を行っています。

記者:しかし、このプロセスはお金の無駄遣いでもあります。

梁文鋒:刺激的なことはお金だけでは測れないかもしれません。自宅にピアノを買う理由と同じで、購入資金があるかもそうですが、そのピアノを弾きたいと思う人々がいるからこそです。

記者:GPUは通常、20%の割合で消耗していくといわれますが。

梁文鋒:正確に計算したわけではないが、それほど多くはないはずです。Nvidiaのグラフィックカードは耐久性が高く、何年も前の古いカードでも今でも多くの人々に使用されています。廃棄した古いカードは中古で売ってもまだ価値があったので、それほど損失はありませんでした。

背景:コンピュータクラスターを構築するには、メンテナンス、人件費、さらには電気代など、かなりの費用がかかります。

梁文鋒:電気代やメンテナンス費用は実は非常に低く、これらの費用はハードウェア費用の年間約1%を占めるだけです。人件費は決して安くはありませんが、人件費は将来への投資であり、会社の最大の資産でもあります。私たちが選ぶのは、比較的素朴で好奇心旺盛な人、そしてここで研究を行うことができる人です。

記者:2021年、幻方はアジア太平洋地域で最初にA100のグラフィックカードを入手した企業の1つでした。なぜ一部のクラウドベンダーよりも早かったのでしょうか?

梁文鋒:私たちは新しいGPUの予備調査、テスト、計画をかなり早い段階で行いました。一部のクラウドベンダーに関しては、私が知る限りニーズがばらばらでした。2022年に自動運転が実現し、トレーニング用のマシンをレンタルする需要と資金的余裕が出てきたときに初めて、一部のクラウドベンダーはインフラを構築しました。大企業では、単に研究や研修を行うだけでは難しく、ビジネスニーズによって推進されるケースが多いです。

記者:大規模モデルの開発競争環境についてどのようにお考えですか?

梁文鋒:大企業には確かに利点がありますが、結果を求められるため、すぐに応用(収益化)できなければ継続できない可能性があります。大手スタートアップ企業の中には、確固たる技術力を持つ企業もありますが、古いAIスタートアップ企業と同様に、いずれも商業化の課題に直面しています。

記者:一部の人は、クオンツファンドが自社でAI事業やってますと強調するのは客寄せパンダ目的だと考えているかもしれません。

梁文鋒:しかし、実際に私たちのクオンツファンドは外部からの資金調達を基本的に停止しています。

記者:誰がAIに本気で、誰が金目当ての投機家なのかはどのように見分ければいいですか?

梁文鋒:信者はずっとAIに関わっています。GPUを短期間レンタルするのではなく、大量に購入したり、クラウドベンダーと長期契約を結んだりする可能性が高くなります。

3. イノベーションを起こす方法

記者: Deep Questチームの採用の進捗状況はどうですか?

梁文鋒:初期チームは編成済みです。初期段階では人手不足のため、一時的に幻方から出向する人もいます。昨年末にChatGPT3.5が人気になり、募集を開始しましたが、まだまだ参加人数が必要です。

記者:大型モデルのスタートアップ向けの人材も不足しています。一部の投資家は、多くの適切な人材はOpenAIやFacebook AI Researchなどの巨大企業のAIラボにしかいないかもしれないと述べています。そういった人材を採用するために海外に行くのでしょうか?

梁文鋒:短期的な目標を追求しているのであれば、すでに経験のある人を探すのが正解です。しかし、長期的に見れば、経験はそれほど重要ではありません。基礎能力、創造性、情熱などの方が重要です。この観点から見ると、国内には適任の候補者が多数存在します。

記者: なぜ経験はそれほど重要ではないのでしょうか?

梁文鋒:これをできるのは、以前にこれをやったことがある人だけではありません。幻方の採用原則の1つは、経験よりも能力を重視することです。当社の中核技術職は主に新卒者、または卒業して1~2年経った者で構成されています。

記者: 革新的なビジネスにおいては、経験が障害になると思いますか?

梁文鋒:何かをするとき、経験豊富な人はためらうことなく「こうするべきだ」と言いますが、経験の浅い人は何度も模索し、真剣にどうするかを考えた上で、現在の実際の状況に合った解決策を見つけます。

記者: 幻方は金融の遺伝子を持たない素人からこの業界に入り、数年でリーダーになりました。この採用ルールは秘密の1つですか?

梁文鋒:私を含め、私たちのコアチームは当初クオンツの経験が全くありませんでした。これは非常に特殊なことです。それは成功の秘訣とは言えませんが、幻方の文化の一部です。私たちは経験のある人を故意に避けるのではなく、むしろ能力を重視します。

営業職を例に挙げてみましょう。当社の主な営業担当者2人は、どちらもこの業界の新人です。1人はドイツ製機械の海外貿易に従事し、もう1人は証券会社のバックエンドでコードを書いていました。彼らがこの業界に参入した時、彼らには経験も、リソースも、蓄積もありませんでした。

そして今、私たちは直接販売に注力できる唯一の大手プライベートエクイティ会社かもしれません。直販は仲介業者に手数料を払う必要がないので、同じ規模とパフォーマンスで利益率が高くなります。多くの企業が私たちの真似をしようとしましたが、成功しませんでした。

記者: 多くの企業があなたの真似をしようとして失敗するのはなぜですか?

梁文鋒:これだけではイノベーションを起こすには不十分だからです。会社の文化や経営に合致する必要があります。

実際、彼らは最初の1年間は何も達成できず、2年目にようやく進歩し始めました。しかし、当社の評価基準は一般企業のそれとは若干異なります。 KPIやいわゆるタスクはありません。

記者: 評価基準は何ですか?

梁文鋒:当社は、顧客からの注文量に重点を置く他の企業とは異なります。営業マンの売上や手数料が最初から良くなるとは考えていません。その代わりに、営業マンが独自の輪を広げ、より多くの人と知り合い、そしてより大きな影響力を持つことを評価します。

なぜなら、お客様から信頼される誠実な営業マンは、短期間でお客様に注文をしてもらうことはできないかもしれませんが、信頼できる人だと感じてもらえると信じているからです。

記者: 適切な人材を選んだ後、どうやってその人を鍛えるのですか?

梁文鋒:重要な仕事を与えたあとは邪魔しません。彼に自分で解決させて、最善を尽くさせます。

実際、企業の遺伝子を模倣するのは難しいのです。例えば、未経験者を採用する際に、その人の潜在能力をどう判断するか、採用後にどう成長を促すか。これらはそのまま真似できるものではありません。

記者: 革新的な組織を構築するために必要な条件は何だとお考えですか?

梁文鋒:私たちの結論は、イノベーションには介入と管理をできるだけ少なくし、誰もが自由に活動できる余地と試行錯誤の機会を与えることです。イノベーションは、意図的に計画されたり教えられたりするのではなく、自然に起こることがよくあります。

記者: これは型破りな管理方法です。この場合、人が効率的に、そして望む方向に物事を進めていることをどのように確認するのでしょうか?

梁文鋒:人材を採用する際には、価値観が一貫していることを確認し、企業文化に沿っていることを確認します。もちろん、当社には文書化された企業文化はありません。文書化されたものはイノベーションの妨げになるからです。多くの場合、状況に遭遇したときにどのように決定を下すかを決定するのはマネージャーの個人的な例であり、それが基準になります。

記者: 大規模モデルの構築をめぐる競争の波の中で、イノベーションに適した組織構造が、スタートアップが大企業と競争するための突破口になると思いますか?

梁文鋒:教科書的な方法論に基づいてスタートアップを評価すると、現時点では、彼らが行うことは何も生き残れないでしょう。

しかし、市場は変化しています。本当の決定的な力は、多くの場合、既成のルールや条件ではなく、変化に適応し調整する能力です。

多くの大企業の組織構造は、もはや迅速に対応して物事を成し遂げることができず、過去の経験や慣性が制約になりやすい。このAIの新しい波の下で、新しい企業群が確実に誕生するでしょう。

4. 本当の狂気

記者:この取り組みをする中で、一番ワクワクするのは何ですか?

梁文鋒: 自分たちの仮説が事実かどうかを突き止めることです。それが正しければ、とても興奮しますね。

記者:今回の大規模言語モデル開発の採用で、絶対に外せない条件は?

梁文鋒:熱意としっかりした基礎力です。他のことはそれほど重要ではありません。

記者:そういう人は簡単に見つかりますか?

梁文鋒:彼らの熱意は自然と表れます。なぜなら、本気でこの仕事がしたいからです。だから、こういう人たちは往々にして私たちを探しているのと同時に、私たちも彼らを探しているんです。

記者:大規模モデルは終わりのない投資になるかもしれません。そのコストを考えると不安になりませんか?

梁文鋒:イノベーションとは、高価で非効率的であり、時には無駄を伴うものです。そのため、経済が一定のレベルに達して初めてイノベーションが生まれるのです。貧しい時代や、イノベーション主導ではない業界では、コストと効率が非常に重要になります。OpenAIも莫大な資金を投じてようやく今の形になっていますよね。

記者:自分たちがとてもクレイジーなことをしているとは思いませんか?

梁文鋒:クレイジーかどうかは分かりませんが、この世界には論理では説明できないことがたくさんあります。例えば、多くのエンジニアはオープンソースコミュニティに熱狂的に貢献しています。一日中仕事で疲れているのに、それでもコードを提供し続けるんです。

記者:そこには、ある種の精神的な報酬があるのでしょうか?

梁文鋒:そうですね。例えば50km歩き終えた後、体は完全に疲れ果てているけど、精神的には満たされている、そんな感覚に似ています。

記者:好奇心に突き動かされた「狂気」は、ずっと続くものだと思いますか?

梁文鋒: 一生狂い続けられる人は少ないでしょう。でも、多くの人は若い頃、利益を度外視して、ただ純粋に何かに没頭できる時期があるのではないでしょうか。

いいなと思ったら応援しよう!