見出し画像

中国のモノづくり思考が生んだDeepSeekによる価値剥奪(デモネタイゼーション)、そしてAGI/ASI[前半]

 ピーター・ディアマンディス(Peter H. Diamandis)氏のポッドキャスト番組から、DeepSeekを取っ掛かりとしたポストDeepSeek世界についてのディスカッションを、Stable Diffusionで著名な企業「Stability.AI」の創業者で元CEOであるエマド・モスタク(Emad Mostaque)氏を特別ゲストに迎え、シンギュラリティ大学でつながりのあるサリム・イスマイル(Salim Ismail)氏と共に行われた対談コンテンツを紹介します。
 エマド・モスタク氏は、Stable Diffusionで知られている通り、オープンソース界隈では、重要人物の一人であり、中国のDeepSeekには、2024年初頭には彼の注目企業として名前を挙げて、早いうちからDeepSeekを認知していた人物の一人です。
 今回の投稿は、1.5時間ほどの長尺の動画コンテンツから、前半54分あたりまでのテーマについて収録・参考訳しています。尚、オリジナル・コンテンツの収録日は、2024年1月29日(水)米国東海岸時間となっています。


[イントロ]

 さて、人間の脳が必要な電力は、20ワットと言われます。DeepSeekの登場によってAIモデル開発の省力化が急速に進んでいることが世間一般にも認知されました。2026年には、20ワット程度のパワーでOpenAI o1レベルのモデルが動作するであろうとの観測も存在しています。
 ゼロイチのイノベーションが得意な米国企業。一方、かつて日本が強みとしていたカイゼンのお株を取って世界の工場にまで上り詰めた中国が、最適化エンジニアリングで生み出したDeepSeekとその亜種は、一気に必要とするリソースの閾値を下げることに成功しています。そして、AIのユビキタス化(古い!)が徐々にでは近づいてきています。

 そしてDeepSeekが登場する前からAI開発で先行していた米国のその優位性は、スクリーンの中の世界ではしばらくは揺るがないと考えられますが、ハード+AIのイノベーション領域、特に多くの領域で中国に軍配の上がるハードウェアの生産にかかわるエコシステムについて米国がすぐに追いつくことは難しいと思われます。中国にしてみれば、自身の競争源泉である製造分野と省力化AIの掛け算によるモノづくりで非西側陣営のマーケットを攻めて行くというイメージは既にあるでしょう。白物家電に生成AIが搭載されて何が嬉しいのかは、すぐに良いアイデアはありませんが、極端には、そのようなAIを搭載した安価なハードウェア製品の世界を想像するのは容易です。そして人間はスクリーンの外の世界(物理世界)への依存度の方が高いのです。

 故に製造業の国内回帰を叫ぶトランプ政権の狙いは、国内の労働基盤の強化だけではなく、製造基盤を国内にリビルドして、長期的な経済安全保障に対して打ち手をうとうとしているのではないか、という気がしてなりません。つまり、DeepSeekが開いた箱の扉の先は、単なる企業間の競争にとどまらず、長い長い国家の覇権争いの道が横たわっているように思えてなりません。
 もちろんこのようなコモディティ化とは逆の方向に存在するAGI、ASIという「Winner-Take-All」的なゲームも並走している点も、各社・各国の競争は激しさを増しそうです。

 さた、以下掲載のコンテンツですが、そんな自身の知識の整理を促すためのアイデアを提供してくれる対談だと思います。ご興味あれば参照下さい。


※ 後半コンテンツは、以下より閲覧ください。







1. ポッドキャスト&ディスカッション(前半)


[出演者]
 ピーター・ディアマンディス(Peter H. Diamandis)
 シンギュラリティ大学の共同創設者兼会長、Xプライズ財団創設者兼会長

 エマド・モスタク(Emad Mostaque)
 Stability.AIの創業者、元CEO。Intelligent Internet創業者兼CEO

 サリム・イスマイル(Salim Ismail)
 シンギュラリティ大学の創設者兼エグゼクティブ・ディレクター、
 OpenExOの創業者兼会長


[ピーター・ディアマンディス](Peter H. Diamandis)
 ようこそ「Moonshots」へ。
 本日は、ホストのサリム・イスマイル氏と特別ゲストのエマド・モスタク氏を迎えています。

 ご存じのとおり、エマドはStability AIの創業者であり、音楽や画像生成の分野で先導的なオープンソース開発を行い、オープンソースのダウンロード数で3億件を達成しています。現在、彼はIntelligent Internetの創業者であり、今日はその話もしてもらう予定です。

 今回は、3つのテーマを深掘りします。まずはもちろんDeepSeekについて。そして、あらゆる市場で加速し続ける変革の波についてです。また、AIの安全性に関する話題や、OpenAIで進行中の出来事にも触れます。特に、AIアラインメントチームから人材が離れていく現象について議論します。最後に、エマドにIntelligent Internetのビジョンや今後の展望について話を聞きます。

 今週は私にとって、変化が急速に加速している特別な週です。この会話こそ、まさに今ここで語るべき最重要のテーマだと思います。それでは「Moonshots」を始めましょう。



(1)DeepSeekがもたらしたAI市場への衝撃


[ピーター・ディアマンディス]
 
今日は、Open EXOのCEOであるサリム・イスマイルと、Intelligent InternetのCEOであるエマド・モスタクという二人の親しい仲間と一緒です。

 このポッドキャストには何度も登場しているお二人ですが、今週は特に騒がしい一週間でした。DeepSeekに関するニュースで、インターネットとAI市場が一時的に混乱し、その衝撃波がまだ続いています。それが何を意味するのか、今日はその話をしていきます。


[ピーター・ディアマンディス]
 エマド、おはようございます、もしくはこんばんはでしょうか? 今はロンドンからですか?


[エマド・モスタク](Emad Mostaque)
 
ええ、ロンドンにいます。おはようございます。こちらこそよろしくお願いします。


[ピーター・ディアマンディス]
 
サリム、あなたはマイアミですか、それともニューヨーク?


[サリム・イスマイル](Salim Ismail)
 
ええ、ニューヨークです。


[ピーター・ディアマンディス]
 
世界中の3つの異なるタイムゾーンからお送りしていますね。あと香港に誰かいたら、バランスが完璧なんですが、いずれそうなるでしょう。


[ピーター・ディアマンディス]
 ではエマド、DeepSeekについてですが、驚きはありませんでしたか? これは予想通りの出来事でしたか、それとも、まさか!という感じでしたか?


[エマド・モスタク](Emad Mostaque)
 
ええ、実際に予想はしていました。昨年の2月にも話しましたが、DeepSeekは私が最も注目しているAI企業の一つです。彼らはStability.AIで私たちが掲げていたオープンな精神を受け継ぎ、もう一人の元ヘッジファンドマネージャーとともに素晴らしいモデルを公開しました。AIコミュニティがこれに気づき始めたのは、昨年の夏頃だったと思います。彼らが「DeepSeek Coda」をリリースし、コード・ランキングのトップに躍り出た時期ですね。最初はMetaのLLamaを再現するところからスタートし、その後大きく前進しました。そのとき使っていたアルゴリズムの一部は、現在も活用されています。そして12月、ちょうど1か月前ですが、「DeepSeek V3」をリリースしました。このモデルは600万ドルのトレーニング費用をかけたもので、GPT-4.0や他の主要なモデルに匹敵するものでした。その時点では「o1」には届きませんでしたが、私たちは彼らが突破口を見つけるだろうと思っていました。そして、実際にやり遂げ、その結果、このモデルはあらゆる場面に適応する力を持つようになりました。



(2)AI技術の進化:推論モデルの変革


[ピーター・ディアマンディス]
 週末に発表があって、インターネットが壊れたかのような騒ぎでしたが、みんながこんなに瞬時に熱狂したのはなぜでしょう? これまで存在していたものなのに、何がそこまで反響を呼んだのでしょうか?


[エマド・モスタク]
 
昨年12月に、ChatGPTに相当するベースモデルが出ています。それが、低コストでこうしたモデルを訓練できることを証明しました。次に登場したのが推論モデルのR1です。このモデルは、入力すると推論の過程を表示してくれます。少し時間はかかるものの、高品質な出力が得られます。このR1が実際に公開されたのは先週の月曜日(1月20日)で、週末になると一気に話題が広がりました。それで、あなたのお母さんやおばさんまで興味を持ち始めて、ニュースにも取り上げられ、株式市場でNVIDIAにも影響が出たわけです。
 この現象を振り返ると、ChatGPTの初期やStable Diffusionによる画像生成が出た頃と似た流れだと思います。即座に応答が得られる新しいパラダイムが、またここで生まれたのです。OpenAIが「o1」という思考モデルをリリースしたときもすごかったですが、そのときはまだ、何か入力すると「考えています」と表示され、結果が出る仕組みでした。その際、COT(思考の連鎖)の過程は非表示だったんです。
 でもR1は違います。どう考えているのか、どのように問題を分解しているのかを、画面上で見せてくれます。そのため、まるで対話相手がいるかのような感覚が得られました。多くの人が実際に使ってみて、そのパフォーマンスに気づき始めたんです。しかもオープンソースだと分かると、小型版をラップトップで動かし始めた人もいました。もしこれがクローズドなモデルで、COTが表示されず、ただ単に「o1」と同じ性能だったら、こんな反応はなかったでしょう。
 さらに、OpenAIが推論過程をリリースしたとしても、ここまでのインパクトにはならなかったと思います。この複数の要素が重なった結果、これまでの認識を覆され、これは一体何だ?どうやって実現したんだ?と人々が驚くことになったのです。



(3)AI市場の加速とデモネタイズの影響


[ピーター・ディアマンディス]
 すごいですよね、サリム。 週末に私たちが2人で電話で話していたときも、「これは本当に来てる」と感じましたよね。 そのとき、最初に何を思いましたか?


[サリム・イスマイル](Salim Ismail)
 
私が考えたのは2つのことです。1つ目はタイミングです。彼らは大統領就任式の日にリリースしましたね。これは、米国の新政権に対する一種の挑発で、「徹底的に制裁を加える」というメッセージが込められていたように感じました。そして2つ目として、ここ10日ほど考えているのが、デモネタイズ(価値の剥奪:Demonetization)がこれから進むだろうということです。これらのモデルの性能が加速度的に向上し、私たちを驚かせているように、デモネタイズのスピードも同じくらい私たちを驚かせるはずです。
 彼らがこれを10分の1や100分の1のコストで実現したという事実は、確かにすごいことですが、私たちが見てきた成長曲線を考えれば、驚くべきことではないとも言えます。どうやってそこに到達したかについてはまだ不明な点も多いですが、到達したという事実そのものは予想できたことです。もちろん、実際にそれを目の当たりにすると驚きますが、もし私たちがもっと現実的に見ていれば、こうした結果に驚くこともなかったかもしれません。


[エマド・モスタク]
 
誰かが言っていたのですが、実はこれ、武漢のラボリーク事件(COVID-19の起源として疑いがかかった件)からちょうど5年目のタイミングだそうです。でも、これ以上その話には触れません。


[ピーター・ディアマンディス]
 私がブログでDeepSeekの発表に関連して書いたことですが、これが新しい常識になっていくんだと思います。
 NetflixがBlockbusterを一気に飲み込んだときのように、これからも業界ごとに次々とこうした劇的な変化が起こるでしょう。特に興味深いのは、ChatGPTの時も、リリースから5日で100万人、2カ月で1億人のユーザーに到達したことで、皆が「こんなことがまた起こるのか?」と疑問に思ったのですが、でも答えは、「もっと速いペース起こる」でした。

 エマド、DeepSeekがGPT-4.0や「o1」、他のモデルと比べてどのような位置にいるのか、簡単に説明してもらえますか?
 GPUの使用台数やコスト、チームの規模についても多くの話題がありますが、それこそが今回のインパクトにつながっていますよね。もし単に同等の性能を持つだけで、短時間や低コストでの実現がなかったら、ここまでの反響はなかったと思います。


[エマド・モスタク]
 
そうですね、衝撃の大きさはその桁違いの規模感でしたね。少し分解して説明すると、まず「o1」はChatGPTの進化版として登場し、一気に国際数学オリンピック(IMO)のメダリストやトップコーダーレベル、つまりトップ1%のコーディング能力に到達しました。これは、より長く考える能力を持つようになったことが大きなブレークスルーにつながりました。
 OpenAIのマーク・チェン(Mark Chen:OpenAIのSenior Vice President of Research)によると、DeepSeekが実現した技術は、OpenAIでも行われていることとほぼ同じだそうです。昨年11月にはその話が出ていました。それからしばらく時間が経ちましたが、まずChatGPTと同等のモデルができ、その後、より深く考えられるように改良されました。しかし最も大きな衝撃は、96%もコストが安かったということでした。
 一般的にソフトウェアの利益率は80%程度とされています。OpenAIがどれだけのコストで運用しているかは正確には分かりませんが、彼らは大量のGPUを持っていて、コスト面での制約を受けることがなかったわけです。だからこそ、価格に対する感覚が鈍くなることもあります。特に、「o1」モデルが数学の論文や法律問題を解くとき、そのコストは弁護士や医者に支払う費用に比べれば圧倒的に安いわけです。しかし、今回の96%のコスト削減には誰もが驚きました。そして、次に衝撃だったのは、このモデルがほぼどこでも実装展開できるという点です。
 R1から進化したオリジナルのモデルをトレーニングするのにかかった費用は、おそらく20万ドル程度です。これもまた驚きです。昨年かその前の年、OpenAIはモデルのトレーニングに30億ドルを費やしたと言われています。この比較を考えると、DeepSeekのコストがいかに少ないかが分かります。

 一方で、DeepSeekは実際には5万台ものGPUを持っているのではないか?という憶測もありました。しかし、公式にはトレーニングに使ったのは2,000台だと発表しています。それを一定期間にわたって使用し、このモデルを構築したという話です。モデル構築の経験がある私たちから見ると、この数字は理にかなっています。それでも一部の人々は、「隠れたGPUがあるのではないか」とか「実際にはもっと多くのリソースがあるのでは」と疑ったのです。
 彼らが使用したGPUはH800というモデルで、これはNVIDIAの最上位チップではないものの、ほぼそれに近い性能ですが、チップ間の通信速度が若干抑えられています。この通信速度の問題は、私が以前在籍していたStability.AIでも直面しました。私たちは世界最大級のスーパーコンピューティングクラスターを構築していましたが、通信速度は他社の4分の1しかありませんでした。当時の予算で可能なレベルがその範囲だったのです。それでも私たちは、世界トップクラスのモデルを開発し、CUDAよりもさらに低レベルのPTXコードを使って限界を克服しました。



(4)AIのエンジニアリング革新と中国の存在感


[エマド・モスタク]
 DeepSeekも同じで、細かい部分まで徹底的にエンジニアリングを最適化しています。彼らには元クオンツのヘッジファンドマネージャーや細かい最適化技術に精通した人材が揃っています。そのため、今回の革新は主にエンジニアリング面での成果だと言えるでしょう。そしてこれが興味深いのは、中国がまさにこうしたエンジニアリングの革新に長けているということです。BYDやXiaomiを見れば分かりますよね。研究段階からエンジニアリング段階に進むときに、こうした飛躍が起こるのは当然なのかもしれません。
 結論として、今回示された数字はすべて合致していますし、コストが劇的に下がっていることも納得できます。おそらくDeepSeekが持っているGPUは1万台程度でしょうが、これは正直なところ、シリコンバレーの多くのスタートアップが持っている規模と大差はありません。


[ピーター・ディアマンディス]
 先日、ポッドキャストでカイフー・リーさんと話をしたのですが、その中で米国政府が中国企業に対してNVIDIAのチップの入手を制限している現状について議論しました。この制限が生んだのは、まさに「少ないリソースで多くを成し遂げる」という進化的プレッシャーです。これは、まるでダーウィンの進化論が技術開発にそのまま適用されているようなものだと感じます。


[エマド・モスタク]
 
そうですね。たとえば、ハンマーしか持っていないときは、それを使ってどうにかするしかないように、膨大なGPUがある環境では、GPUを活用して知識を圧縮する方法に頼りがちです。それはまるで、肉を圧力鍋で柔らかくするようなものです。でも中国企業は、データの質やアルゴリズム、効率的なプロセスに注力したのです。
 コンピュータの処理速度に頼れない状況、つまり高速なチップが不足しているときには、GPUを並列化してスピードを上げる方法がありますが、中国企業はメモリの活用をキーポイントにしました。たとえば、LLamaのような古典的なモデルは700億ものパラメータを持つ非常に密な構造です。しかし、彼らのモデルは640億から400億のパラメータの範囲に抑え、実際に動かしているのはそのうちの300億程度のパラメータです。これによって、メモリに依存したスケーリングを実現し、超高速なチップに頼らない形で効率化を実現しました。
 こうした制約こそが重要だと思います。制約がなければ、非効率なモデルを作りがちです。しかし、制約があるからこそ、効率的なアイデアが生まれます。「必要は発明の母」とはまさにこのことですね。


[サリム・イスマイル]
 
CEOが直接データのラベル付けや確認を行っていたのではないですか? それがモデルの性能を大きく引き上げるんですよね。


[エマド・モスタク]
 
モデルの本質はデータです。モデルはデータ間の相互関係を見つけ出すことが役割ですから、もしデータの質が悪ければ、モデルも良い結果は出せません。今の大規模モデル、たとえばDeepSeekやLLamaでは14兆語ものデータを使っていますが、実際に専門的なモデルを構築するには、そこまで膨大なデータは必要ありません。大量の計算資源があれば問題は軽減されますが、それでも2000基程度のGPUでも十分に対応できるのです。
 ここで重要なのは、データの質の改善です。今回、ベースモデルを思考型モデル(Thinking Model)に進化させる際には、合成データが使われました。つまり、どのデータが適切なのかが、ついに分かってきたということです。
 突破口を開く人たちは、ただ単にデータ処理を外部委託するのではなく、工程全体を細かく見直します。悪いデータを大量に投入して、規模の拡大で補おうとはしません。これは、エンジニアリングにおける成功事例にも共通しています。たとえば、テスラや中国の企業が技術的な驚異を実現したのも、すべてのプロセスを見直して無駄を省き、簡素化を徹底したからです。


[ピーター・ディアマンディス]
週末にデイヴィッド・サックス(David Sachs:著名なベンチャーキャピタリスト)さんが本件についてコメントしていました。そのビデオをちょっと再生するので、お二人のご意見を聞かせてください。


ええ、AIには「蒸留」(Distillation)という技術があります。これについて今後、よく耳にすることになるでしょう。蒸留とは、あるモデルが別のモデルから学ぶプロセスのことです。簡単に言うと、学生のモデルが親モデルに大量の質問を投げかけることで知識を吸収する仕組みです。人間が学ぶのと同じように、AIは数百万の質問を通じて親モデルの推論プロセスを模倣し、その知識を吸い取ります。DeepSeekがOpenAIのモデルから知識を蒸留したという証拠がいくつもあります。OpenAI側はこの件についてあまり快く思っていないでしょうね。

デイヴィッド・サックス


[ピーター・ディアマンディス]
 
これについて、エマドさんの意見はどうですか?


[エマド・モスタク]
 
これについては、「お前(= OpenAI)もやってるだろう」みたいな話ですね。「うちのデータで訓練するな!」と言いつつ、実際には業界全体でよくあることですから。蒸留自体は目新しいものではありませんし、モデル単位でこれを完全に止める方法は現実的にないんです。
 ただ、論文を見る限りでは、DeepSeekが使ったのはR10と呼ばれるバージョンで、独自にデータを生成していました。これは、AlphaGoやAlphaGo Zero、MuZeroなどの強化学習モデルの流れを知っている人には馴染みがあるでしょう。これらのモデルは囲碁で人間を超える性能を発揮しました。
 現在、私たちの専門知識がすべてAIに取って代わられつつあると言ってもいいかもしれません。でも、DeepSeekが意図的にOpenAIのモデルをそのままコピーしたわけではないと思います。OpenAIの最新モデルは、推論をするためのCOTが十分に組み込まれていなかったんです。それを補うために、R1のCOTプロセスや、Googleの新しいGeminiモデルのようなものが出てきて、今やリーダーボードのトップに立っています。このプロセスを最適化するために、彼らは実際に独自の合成データを生成したはずです。
 とはいえ、インターネット全体からデータをスクレイピングしている以上、その中にOpenAIのデータが含まれることは避けられません。実際、LLamaやGeminiでも同じことが起きています。ときどき、君は誰が作ったの?とモデルに聞くと、「OpenAIだ」と答えることもあるくらいです。それほどまでに、多くの断片的なデータが吸収されているのです。


[ピーター・ディアマンディス]
 1月27日の月曜の朝、ウォール街で興味深い影響が出ましたね。市場全体が真っ赤になり、NVIDIAの株価も大きく打撃を受けました。OpenAIも相当影響を受けたでしょう。サリムさん、これについてどうお考えですか? 市場の反応としては典型的なものに見えますが。


[サリム・イスマイル]
 
そうですね、市場は心理的な要素が大きいと思います。みんなが大変だ!となって、一気に株価が下がるんですね。NVIDIAのチップが過大評価されているのは間違いないですが、それでもAIの需要が急激に拡大しているので、長期的にはチップ需要に大きな影響は出ないと思います。エマドさんの見解もぜひ聞きたいですね。


[エマド・モスタク]
 
NVIDIAの株価はこの1年で100%も上がっていますから、また大きく下がったとは言えませんね。この先何が起こるかは分かりませんが、この市場の規模や変化はものすごく大きいと思います。知識労働の置き換えが起きているわけですから。産業革命が筋肉を機械に置き換えたように、今は脳の役割が置き換えられていく段階で、これは非常に巨大な市場といえます。


[ピーター・ディアマンディス]
 
世界のGDPは2025年には110兆ドルに達すると見込まれており、そのうち半分は肉体労働、もう半分は知的労働ですから、影響は計り知れませんね。


[エマド・モスタク]
 
これこそが生産性を定義するテクノロジー、「知的資本ストック」です。この技術がどのように展開していくのかを正確に予測するのは難しいです。たとえば、マイクロソフトのサティア・ナデラCEOが話していた「ジェヴォンズのパラドックス」(Jevons' paradox)のように、効率が上がれば上がるほど需要がさらに増えるという現象があります。アンドリーセン(ホロヴィッツ)氏もこの点について語っていますね。
 NVIDIAの戦略を見てみると、完全統合型のデータセンターボックスに移行しています。たとえば、GB300やNVL72、そして新しいプロジェクトDIGITSというものがあります。Mac Miniに似ていますが、デスクに置けるサイズで128GBのVRAMと1ペタフロップのAI演算能力を持っています。


[ピーター・ディアマンディス]
 3,000ドルですね。


[エマド・モスタク]
 
ええ、3,000ドルです。2台あればR1を動かせます。だから、それがあれば自宅でR1が使えることになります。これはNVIDIAが作った専用の基盤で、ファンもついていないし、消費電力も200ワット程度です。




(5)AI開発の効率化とコスト削減の戦略


[ピーター・ディアマンディス]
 
さっき、DeepSeekのモデルを構築するためのエネルギーやコストについてコメントしていましたが、それについてもう少し詳しく話していただけますか? すごい話でしたよね。


[エマド・モスタク]
 
最初に私たちがスーパーコンピュータを購入したときのことですが、2022年にStability.AIで使ったもので、その頃、世界で公表されている中で10番目に速いものでした。それにはトップクラスのNVIDIAのA100チップが4枚搭載されていました。インターネット接続は少し弱かったのですが、それでも大規模なシステムで、各チップの消費電力は400ワットにもなりました。それはまさに大きなシステムでした。
 最近のNVIDIAの発表を覚えていますか?ジェンスンが持っていたあの盾のような新しい統合ボックス、NVL72という72枚のチップが超高密度で接続されているものです。そのチップ間の接続速度は、なんとインターネット全体の帯域幅に匹敵します。それだけ進化しているのです。 

NVIDIA ジェンスン・ファンCEO (CES 2025)


[サリム・イスマイル]
 
ちょっと待ってください。今、チップ間の接続速度がどれくらいだと言いましたか?


[エマド・モスタク]
 
チップ同士の通信、つまり総帯域幅が6ペタビット/秒で、これはインターネット全体の帯域幅と同じくらいです。彼らはすべてを統合する方法を見つけたので、従来のようにチップ同士の接続が必要なくなりました。72枚のチップが1つの大きなウエハー上に配置されていて、消費電力は100キロワットです。
 計算してみましたが、中国が所有する性能的に制限された2,000個のH800ですが、Deep Seekが作ったモデルであれば、おそらく最大でも10個、おそらくそれ以下の数のボックスで作成できるでしょう。新しいデータセンターボックスは1個あたり300万ドルしますが、おそらく実際には、このボックスは4つしか必要ないでしょう。また、上限値だとしても、モデルのトレーニングに必要な総エネルギーは1,000メガワット/時です。そして、現在米国では1メガワット時あたり15ドルほどです。


[ピーター・ディアマンディス]
 
小さな太陽光発電所が自宅にあれば、それでトレーニングができてしまうということですか。


[エマド・モスタク]
 
大規模な太陽光発電所だと、10万キロワット時くらいの電力を確保できますが、あのボックスであれば、確実にDeepSeek R1をソーラーパネルで動かせますね。そして、まだ最適化されていないことを考えると、この流れでいけば来年には「o1」レベルのモデルがスマートフォンで動くようになります。消費電力はせいぜい20ワット程度です。そしてソーラー発電のコストは1ワットあたり1ドル未満なので、知的労働にかかるコストの考え方そのものが根本から変わっていきます。


[ピーター・ディアマンディス]
 
まあ、脳がどれくらいのエネルギーを使っているかを考えれば納得ですよね。


[エマド・モスタク]
 
わずか20ワットです。


[ピーター・ディアマンディス]
 
だから、ここから大きな効率化のカーブをたどっていくわけですね。


[エマド・モスタク]
 
来年には20ワットで「o1」レベルのモデルが実現すると思います。それはつまり人間の脳レベルで、しかも多くの分野で博士号レベルの知能を持つわけです。これがピンとこないのは、マイクロソフトがスリーマイル島の原子力発電所を再稼働させるとか、ダイソンのエネルギープロジェクトでアメリカのデータセンターに今後1年かそこらで60ギガワットの電力が供給される、みたいな話があるためです。しかし、実際の知能の単位の数値にまで落とし込んでみると、数ワット、数セントです。但し、それ以前に、チーム全体が脳やインフラで何ワットのエネルギーを使用しているのかを把握する必要があるのですが、我々はまだその準備ができていないのです。



(6)地政学的なリスクとデータの管理


[ピーター・ディアマンディス]
 
サリム、さっきDeepSeekがOpenAIやMeta、NVIDIAにとってどれほどの挑戦になるかという質問をしていましたよね。 何を考えているのですか?


[サリム・イスマイル]
 
2つ質問があります。1つ目は、これは中国の技術であるために、企業が自社のデータをそこに入れることをためらうかどうか、という点です。私の推測では、答えはノーです。なぜならオープンソースなのでローカルで実行できるからです。これで合っていますか?


[エマド・モスタク]
 
実行することは可能ですが、大半の人はそうしないでしょう。例えば、みんながTikTokに情報を気にせず渡しているのと同じです。誰もすべてのデータがどう扱われるかなんてわかっていませんからね。ローカルで実行できるのは、実際には本来のモデルを圧縮したバージョンであり、フルモデルをローカルで動かすのはかなり難しいです。


[サリム・イスマイル]
 
つまり、OpenAIやMetaといった既存のプレイヤーには、地政学的なアービトラージの優位性がまだあるということですね。それは強力ですね。


[ピーター・ディアマンディス]
 
さて、ここで重要な質問に戻りましょう。みなさんがX(旧Twitter)や友人からよく聞かれた質問は、「DeepSeekもTikTokのような道をたどるのか?」ということです。
 少し話を戻しますが、OpenAIがChatGPTを発表したとき、多くの企業、特に銀行が「オフィス内でChatGPTを使わないでほしい。OpenAIにデータを渡したくない」という反応を見せました。この即座のプライバシー保護の動きは、今でも有効な懸念です。では、DeepSeekも同じように「使うことはできない。データやデータの行先が不安だ」となるのでしょうか?


[エマド・モスタク]
 
いくつかの発表がありましたね。例えば、PerplexityはDeepSeekを米国内の施設で完全にローカル運用していると発表しています。このような形態は、規模が大きいものでも見られるでしょう。しかし、自社で全てを運用するのは難しいため、APIの利用が主流になるでしょう。次に、OpenAIが発表した「政府向けChatGPT」についてですが、すでに19万6000人の連邦職員が利用しています。この方向性が示すのは、今後AIが4つの異なるタイプに分かれるだろうということです。一つは、必要に応じて利用する超専門的なAGI。次に、個人用AIとしてのGoogleやAppleのAI。そして、DeepSeekやLLamaのようなオープンウェイトモデルで、これらは規制産業には向いていません。最後に、オープンソースやオープンデータを活用したAIで、意思決定支援システムにはその中身が透明であることが重要です。
 こうしたモデルは、バイアスによって容易に毒されるリスクがあります。以前、ピーターとも話したAnthropicの「スリーパーエージェント」に関する論文がその例です。10兆語の中でわずか数千語、あるいは1語だけで、モデルの性質を悪意あるものに変えたり、完全に別の動作をさせたりすることが可能なのです。驚くべきことです。
 また、面白いことに、米国内の多くのトランスフォーマーは中国企業が製造しており、その制御ソフトウェアの詳細は誰も把握していません。こうした潜在的な脅威を抱えた状態で、ビジネスを動かすトランスフォーマーに依存するリスクを許容できるでしょうか?今、私たちはこのようなリスクに対応するために、インターネット上でオープンソースのスタックを構築しています。

 

[ピーター・ディアマンディス]
 
では、あなたが新しく立ち上げた企業「Intelligent Internet」の構想について掘り下げていきましょう。この会社は、人類を支援するという点で、これまで見た中でも特に大胆なビジョンを掲げています。DeepSeekの影響がOpenAIやNVIDIA、Meta、Googleにまで及んでいるのは明らかです。
 実際、Redditでサム・アルトマン氏がコメントしていました。「DeepSeek R1モデルは価格に対して非常に優れた成果を出している。もちろん、私たちもさらに優れたモデルを開発しますが、新たな競争相手が出てきたことで本当に刺激を受けています」と。

 しかし、この「刺激を受けた」という状態が問題を引き起こすことがあります。なぜなら、こうした状況では、すべての手を打ち、規制も無視してでも競争に勝とうとする力が働きます。このようなリスクがAIの安全性に影響する可能性については後ほど話しますが、ここで重要なのは、DeepSeekが本当にこうした大企業の企業評価額を脅かす存在になるかどうかです。一時的に市場に影響を与えた場面もありましたが、それが継続する正当な理由があるかどうかは、まだ慎重に見極める必要があります。


[エマド・モスタク]
 
私の意見ですが、DeepSeekの存在は企業の評価額をむしろ引き上げると思います。というのも、膨大なインテリジェンスをほぼコストゼロで活用できる時代の到来を早めているからです。OpenAIを見てください。サム・アルトマンが見事に成し遂げたのは、3億~4億人ものユーザーを獲得したことです。多くの人にとってAIといえばChatGPTがその象徴ですよね。GeminiやClaudeはほとんど意識されていません。そして、コストが下がることはOpenAIにとってもプラスです。
 これはまさにザッカバーグの考え方と同じです。MetaがLLamaをオープンソース化したのは、全GPU使用量の10%で動作し、そこに10%のパフォーマンス向上があれば元が取れるからです。OpenAIも必要なものは何でも活用します。彼らの多くのモデルには最新の独自アルゴリズムが使われているわけではなく、Googleなど他社の技術を応用しています。この分野には今や隠された秘密はほとんどなく、カリフォルニアの競業避止条項(non-compete clauses)も廃止されたことで、さらにオープンな競争が進んでいます。
 OpenAIの現状を見れば、かつては大規模な計算リソースを使った事前学習が事業の中心でしたが、今やその領域はコモディティ化しています。OpenAIやxAIなど他の企業でも同じように事前学習ができるようになりましたが、今後はデータが質的に向上していくため、学習そのものに膨大なリソースを割く必要は減っていくでしょう。重要なのは、ユーザーがどのようにAIを使うかというフィードバックをもとにインテリジェンスを精緻化することです。
 そして、このオペレーターパラダイムが次の段階です。つまり、OpenAIがあなたのコンピュータやMacBookを管理し、旅行の予約なども自動で行えるようになる世界です。彼らはその次のステージに向けてすでに十分な準備が整えていますし、コストも下がるはずです。昨年、OpenAIは30億ドルの売上を上げましたが、50億ドルの赤字を出しており、そのうち30億ドルはモデルのトレーニング費用に充てられていました。このトレーニング費用が削減されれば、OpenAIにとっては大きなメリットになります。


[サリム・イスマイル]
 
膨大なユーザー数が生み出すフィードバックループがOpenAIに優位性をもたらしていますね。その意見には共感できます。


[エマド・モスタク]
 
そうですね、そして彼らは約50万台のGPUを新たに導入する予定で、それらを連続的に活用することで、より優れたデータの生成、マッピング、そしてそれをモデルにフィードバックして最適化・高度最適化が可能になります。従来のコンピューティングでは処理が並列化されておらず、逐次処理的に進められていましたが、現在は大規模なクラスターの時代を経て、タスクを解決するモデルやエージェントの群(Swarm)が主流となっています。これらはすでに十分に優れ、安価で、そして高速に動作するようになっています。
 実は、これがDeepSeekにおいても決定的な要素です。かつてのStable Diffusionが画像生成で示したのと同じように、十分に優れている、十分に速い、十分に安いという3つの条件が揃うと、一気に大規模な普及が起こります。このトライファクターが技術の急速な拡大を引き起こすのです。


[ピーター・ディアマンディス]
 
このDeepSeekの発表があった際、ザッカバーグはエンジニアによる4つの「ウォールーム」(戦略指令室)を設置して、状況を解析し、どう活用すべきかを検討したと言われています。このAI競争は、まさに各企業が互いの進展を参考にしながら加速しているAIの軍拡競争と言えるでしょう。そして、面白いのは、DeepSeekのチーム規模が比較的小さいことです。OpenAIも初期段階では200人ほどの小さなチームでスタートしましたよね。
 ここで重要なのは、チームの規模についてどう考えるかです。規模が大きすぎると冗長になり、逆に小さすぎると柔軟性が失われる可能性があります。理想は、小規模でありながら俊敏に動ける、バランスの取れたチームだと思います。あなたがどのようにチームの規模を決め、破壊的なイノベーションを生み出していくか、そのバランス感覚が成功の鍵になるでしょうね。


[エマド・モスタク]
 
コアなメンバーは研究者100人くらいが理想的だと思います。それ以上になると組織が肥大化してしまいます。私たちがStability.AIで取り組んでいたときは、研究者と開発者合わせて80人、さらに16人の博士号を持つメンバーがいて、画像、動画、さまざまなモダリティ、多言語において最先端の成果を達成しました。その結果、Hugging Faceで3億回ダウンロードされ、私たちは在籍中に最も多くダウンロードされた企業となり、オープンソースでも非常に人気がありました。
 しかし、150人規模に拡大したときに、いろいろと問題が生じ始めたのです。それは、スピーディなイテレーションや新しいことへの挑戦が研究開発のコアであって、それらについて単なるコストとして扱わないことが大切になるからです。規模が大きくなると計算資源の過剰利用なども課題になります。同様に、OpenAIも小規模だった頃に優れた成果を出していましたが、拡大しながらもまだ一定の成果を上げています。ただ、今は組織化が進み、どうしてもその規模を超えるとイノベーションを維持するのが難しいのは、サリムが専門家としてよく理解している通りです。


[ピーター・ディアマンディス]
 
サリム、どうですか?


[サリム・イスマイル]
 
トップダウンの管理構造を取るとイノベーションが遅くなりますし、逆に全員が自由に動くと重複が多発しますよね。そのため、そうしたバランスを取る必要から複雑さが増していきます。興味深いのは、150人というのがダンバー数として知られている点です。人類学的にもこれは信頼できる閾値とされています。エマドが話していたように、OpenAIには必要以上に多くの人がいますよね。資金が豊富だから、いろいろなことに人を割けるんです。ただ、これからは効率化を余儀なくされるでしょうし、これは市場全体にとっても良いことだと思います。「満ち潮はすべての船を浮かせる」という考え方ですね。とはいえ、結果的には分裂した状況になると感じています。例えば、西側の企業がDeepSeekのようなモデルを使いたがるとは思えませんし、インドの国営企業が安全保障上の理由でこうしたモデルを採用することも考えにくいですよね。その結果、各国で独自のモデルが開発され、最終的にさまざまなモデルが乱立することになると思います。


[ピーター・ディアマンディス]
 
エマドさんのインテリジェント・インターネットに関するビジョンやミッションについてお話しを伺う前に、中国についてもう少し掘り下げたいと思います。今回の発表で話題になったのは、単に安価なオープンソースモデルというだけではなく、中国から出てきた革新のレベルです。多くの人は中国をAIイノベーションの拠点と見ていないかもしれませんが、実際にはそうなのです。
 Business Insiderの記事に「台湾の半導体関税に関するトランプ氏の脅威は、DeepSeek後のNVIDIAに新たな頭痛の種をもたらす可能性がある」という内容があります。エマド、この状況をどのように見ていますか?


[エマド・モスタク]
 
そうですね、これが本当にNVIDIAの株価が下がる原因でしょうね。もしくは、ジム・クレイマーが先週「NVIDIAを買え」と言ったことが関係しているのかもしれませんが。どちらにせよ、彼らは国内でチップを作ろうとしていますし、インテルも買収対象として話題に上がっていますね。


[ピーター・ディアマンディス]
 
間違いなくその対象になっていますよね。まるで新鮮な肉がテーブルに出されているようで、みんなそれをどう切り分けるかを考えている状況です。


[エマド・モスタク]
 
実際、NVIDIAのチップは非常に速くて優秀です。AMDについて話す人もいますが、AMDのチップは使いづらいですよね。ソフトウェアの対応が追いつかず、バグも多いですし、安定するまでに数世代かかります。でも、NVIDIAのチップはすぐに動くんです。そして、中国のチップも動きますよ。例えば、DeepSeekモデルのAPIはHuaweiのAscend 910チップで動いています。効率性では数世代遅れているものの、十分に機能しています。さらに、中国には2つのエクサスケールコンピュータがあります。世界最速級のスーパーコンピュータであるOceanLightと天河3号(Tianhe-3)は、まったく異なるアプローチで大量生産されています。ここで注目すべきなのは、米国が国内生産を増やそうとしている点です。社会の生産手段と生産性の基盤は、これまでは資本や産業用設備、知的財産でしたが、今後はチップがその中心になります。世界でどれだけ競争力を持てるかは、どれだけ計算能力を確保できるかにかかっていると、米国も気付いたのだと思います。


[ピーター・ディアマンディス]
 
そして、どれだけのエネルギーをその計算能力に投じられるかですね。


[エマド・モスタク] 
 
ええ、それも要因の一つです。そのため、米国はこの重要性に気づき、「Drill, Baby, Drill」と言って、できる限り国内に生産基盤を戻すためのインセンティブを作っています。そして、その関税収入は、Stargateのようなイニシアチブに直接投じられると思います。


[ピーター・ディアマンディス]
 
Stargateについてですが、どう思いますか?


[エマド・モスタク]
 
総所有コストが5,000億ドルというのはよく知られた数字ですが、実際には、いろいろな要素を差し引くと1,000億ドル程度でしょうか。最近の感覚からすると小さく感じますが、実際には膨大な額です。ただ、5Gの導入にかかったコストと比べると少ないですよね。しかも、これは5Gより重要だと考えています。例えば、ロサンゼルスとサンフランシスコ間の鉄道建設にかかるコストと同じくらいの規模感です。


[ピーター・ディアマンディス]
 
あの伝説のロサンゼルス-サンフランシスコ鉄道ですか。


[エマド・モスタク]
 
すでに1キロほどはできているんですよね。


[ピーター・ディアマンディス]
 
サリム、今朝のロイターの記事をご覧になりましたか? アリババがAIモデルを公開し、DeepSeekを超えたと言っています。Qwen 2.5 Maxの異例のタイミングでのリリースは、ここ数週間で急成長した中国のAIスタートアップDeepSeekが、海外だけでなく国内の競争にも大きな圧力をかけていることを示していますね。


[サリム・イスマイル]
 
この件は、いわゆる「民主化」を象徴していると思いませんか?つまり、誰もがさまざまなモデルを作る時代になっていくということです。そして最終的には、非常に特化したモデルがたくさん生まれるのです。エリック・シュミット氏のコメントを思い出しますが、世界最高の物理学者であるAIや世界最高のバイオテクノロジー専門家であるAIが生まれ、それが無限に複製可能になるという話がありましたよね。そのような状況では、人間側の深い専門性というのはどう活かされるのでしょうか?
 ここが重要な問いになると思います。これまで見てきた通り、モデル自体はどんどん進化し続けふでしょう。エマドが言っていた「労働と資本の役割をどうするのか」という問いは、本当に深いテーマだと思います。これは構造的で、社会全体に関わる問題です。だからこそ、グローバルな知的フォーラムとして、今後これをどう乗り越えるかにもっと時間を割くべきだと思います。この変化は、あらゆるものに影響を与えるのですから。


[エマド・モスタク]
 
モデルの話ですが、結局、十分に良くて、十分に安くて、十分に速いということですよね。実際、もうひとつのQwen-VLモデルは、視覚理解においてAnthropicやGPT-4.0を上回りました。そして、次に出てくるモデルはコンピュータを直接操作できるものになります。今年中に、スクリーン越しにできることはすべて、AIの方が安価に、しかもより効率よくこなすようになるでしょう。



(7)AGIへの到達。知的資本と情報経済へのシフト


[ピーター・ディアマンディス]
 
シリコンバレーやホワイトハウスでも、米中AI戦争に関する議論が盛んです。実は来週、レイ・ダリオ氏ともこのテーマについて話す予定です。今、競争は2つのレベルで起きています。
 一つは企業間の競争で、現在、6社から8社ほどの主要なAI企業がトップを争っています。そしてもう一つは国家間の競争です。サウジアラビアが数千億ドル単位の巨額な投資を行い、続いてカタールやアラブ首長国連邦もトップを目指しています。そして、何といっても米中間の対立が中心です。
 この競争が「Winner-Take-All」のゲーム構造だとすれば、企業や国家の競争相手よりも少しでも先にデジタルなスーパーインテリジェンスを開発することができたら、その差が壊滅的な結果をもたらす可能性がありますよね。エマド、この米中の競争について、どう考えていますか?


[エマド・モスタク]
 
今の流れを見ると、私が知っている全てのAIリーダーが「AGI(汎用人工知能)は向こう3年から5年以内に到達する」と言っています。


[ピーター・ディアマンディス]
 
ただ、サム(アルトマン)は来年だと予測していましたよね。


[エマド・モスタク]
 
そうですね。ただし、3年から5年以内というのが、多くのリーダー間での共通認識です。ダリオ・アモデイ氏、デミス・ハサビス氏、私自身も含めて、みんなそう言っています。このコンセンサスがあるのはすごいことです。AGIやASIをめぐる議論の中で、もし一つの組織が先にAGIを開発すれば、その力で相手国をシャットダウンできる可能性があるという話が出ています。具体的には、相手のシステムを停止させてしまうこともできるわけです。そのために今から準備をしなければならないのです。Googleのスンダー・ピチャイ氏も言っていましたが、なぜ大量のGPUを用意しているのかというと、そうしないと競争に負けてしまうからです。これこそが、いわゆるゲーム理論ですよね。みんながAGIを開発しているなら、自分たちも開発しないわけにはいかないのです。
 AGIに到達する前段階として、いま考えられるのは、何でも創造できる「スーパーシェフ」のような存在です。今の時点でも、優れたデジタル料理人たちが既存のレシピに従って、人間よりも効率的に作業をこなせるレベルに達しています。例えば、Unitreeのロボットが披露していた扇子を使った中国舞踊を観ましたか? 家の建築さえも人間以上にできる時代に近づいています。


[ピーター・ディアマンディス]
 
Abundance Summit 2025にはUnitreeのロボットを登場させる予定です。本当に驚くべきもので、ミドル・クラスのモデルが1台たった6,000ドルです。


[エマド・モスタク]
 
減価償却やエネルギーコストなどを考慮しても、1時間あたり15ドル程度になりますよね。


[ピーター・ディアマンディス]
 
私の試算だと、1時間あたり40セントです。本当に信じられないくらいのコストパフォーマンスです。子どもたちも部屋を片付けさせるために1台買いたがるかもしれませんね。


[サリム・イスマイル]
 
そして、その金額は、最も高い今の時期での話ですよね。
 ところで、エマドが言っていた3年から5年で実現するAGIについてですが、いつも尋ねているのですが、AGIとは具体的に何を指すのでしょうか?
 私がこれまで見てきた中で一番分かりやすいのは、WNCテストやIKEAテスト(※双方ともにチューリングテストを補完するテスト)のように複数の評価基準を設ける方法です。エマドはどのようにAGIを定義していますか?


[エマド・モスタク]
 
私の考えでは、AGIとは複数の人間のチームを上回るパフォーマンスを発揮できる複雑なシステムだと思っています。それ以前の考え方としては、AIを人工的なリモート知能として捉えていました。つまり、相手が人間かコンピュータか分からない、リモートワーカーのような存在です。これが一番自然な形での始まりだと思います。例えば、企業に電話をすると、多くの人が対応しますが、その中に100%ロボットが混ざっていても不思議ではないという状況です。実際にその技術はすでに存在しています。


[ピーター・ディアマンディス]
 
リモートワーカーがSlackに接続し、Zoomに参加する時代です。今や分散型の労働環境が当たり前になっていますが、もしAGIが完全に役割を引き受け、すべてのメールやSlackの情報を瞬時に把握して即戦力となるとしたら、それはとても魅力的な未来です。本当にワクワクする世界ですね。


[エマド・モスタク]
 
しかし、これはあくまで初期レベルでの破壊的変化ですよね?もうBPO(ビジネス・プロセス・アウトソーシング)は必要なくなり、企業の在り方そのものが変わっていきます。なぜなら、これからはコックではなく、スーパーシェフが主役になるからです。ミスを犯さないか、たとえミスをしてもすぐに学ぶ存在です。コミュニケーションコストが低下すれば、次のステップは彼らがチームとして機能する段階です。それぞれが独立し、課題を与えられ、必要なリソースを自律的に集めることをします。だからこそ、ワイオミング州のDAO法(Decentralized Autonomous Organization Act)などがとても面白いのです。そのさらに先に待つのが、ASIの世界であり、ここはまだ完全に定義できません。ですが、人間を超えた組織能力を持ち、驚異的なスピードで発明を行えるフェーズがやってくるのです。


[ピーター・ディアマンディス]
 
私が注目しているのは、その影響が物理学や生物学、純粋科学にまで及ぶ点です。この変化が我々をとてつもなく先のステージへと導きます。ダリオ氏が動画で、確かダボスでの発言だったと思いますが、今後5年間で医学とバイオテクノロジー分野では100年分の進歩があるだろうと言っていました。そして人間の寿命が2倍になるとも。エマドさん、以前もこうした話をしていましたよね。このことが公に語られるには非常に驚くべき内容だと思います。


[エマド・モスタク]
 
そうですね。先週特に印象に残ったのは、「o1」(OpenAI)を使った時の話です。データをたくさん投入しても、ファイルのアップロードができなかったり、いろいろと制限があって少し不便ですが、非常に丁寧に処理します。しかし、R1(DeepSeek)はまだ調整されていないため安全性が低い一方で、非常に創造的です。実際、ある人がR1のコードベースを使ってパフォーマンスを2倍に向上させました。また、他の人たちは学術論文をまとめ、それを新しい強化学習アルゴリズムに統合しました。これは今後の兆しを示していると思います。安全性が低下するリスクもありますが、その代わりに創造性が高まる可能性もあります。そしてこれが、いわゆる段階的な変化です。素晴らしい料理人としてのAIは労働市場に破壊的な影響を与えますよね、特にスクリーン越しの仕事には。素晴らしいシェフのレベルになると、AGIのチーム化、さらにはASIへの道へとつながっていきます。私にはこの未来が3年から5年先の話とは思えません。この指数関数的な進化を考えると、もっと早く訪れるように感じます。但し、現状ではほとんどの人がその準備をしていませんね。


[ピーター・ディアマンディス]
 
そうですね。次々と破壊的な変化が訪れるでしょうが、金融市場はこの変化に対応できる準備が整っていないと思います。エネルギー市場もその一つです。AGIやASIの影響によって新たなエネルギー源が登場する可能性もあり、それによってドル体制が崩れ、政府の財政にも影響を及ぼすことになるかもしれません。本当に興味深く、かつ大規模な影響の可能性が予想されます。


[エマド・モスタク]
 
GDPと1人当たりのエネルギー消費量の相関を示すグラフを見たことはありますか?


[ピーター・ディアマンディス]
 
ええ。


[エマド・モスタク]
 
あれはほぼ一直線ですよね。


[ピーター・ディアマンディス]
 
その通りです。それに健康とも相関がありますし、ほかにもいろいろな要因と関係しています。


[エマド・モスタク]
 
しかし、その相関が完全に崩れる可能性があります。たとえば、数年後には世界最高の映画スタジオをどこにでも作れるようになるかもしれません。それも太陽光発電だけで、です。
 私が言いたいのはその点です。科学的な研究がグアテマラのような場所でも可能になるということです。この技術が普及すれば、これまで西側諸国に集中していた頭脳が流出して逆転し、世界全体の総合的な成長が見込めることになります。そして、知的資本や物的資本の分布が大きく変わるわけです。しかし、現状の経済構造はそれに対応できるようにはできていません。これまで生産性は労働力に依存し、労働力はエネルギーと密接に結びついていました。その長年の相関関係が、史上初めて崩れようとしています。


[サリム・イスマイル]
 
同感です。今、私たちはエネルギー経済から情報経済へと移行していて、今後はデータと情報が非常に重要になってくると思います。ここで、本当に大きな哲学的な問いを考え始める必要があります。つまり、この情報を使って何をしたいのか、人間としてどのようにありたいのか、労働市場がどんどん変わっていく中で、どんな活動や機能が必要になるのか、といったことです。
 私はまだヒューマノイド・ロボットには多少の不安を感じていますが、もしそういったロボットがフィードバック機能を持ち、大規模言語モデルが内蔵された状態で登場すれば、多くの多様な作業ができるロボットが完成することになると思います。
 そうなると、庭師や配管工などの仕事は必要なくなる可能性もあります。これは少し皮肉を交えた例ですが、実際にはこれらの仕事こそ重要かもしれません。それでも、例えば航空機のメンテナンスなど、多くの分野で情報へのアクセスによって、より精密かつ効率的に行われるようになるでしょう。
 数回前のエピソードでは、私たち自身のアバターは、私たちが覚えていること以上に、これまで話したすべての情報にアクセスできるため、より信頼性が高いという話をしました。


[ピーター・ディアマンディス]
 
そのほうが、より魅力的ですね。


[サリム・イスマイル]
 
そして見た目も、より良くなるでしょう。
 では、その状況をどうやって乗りこなすかが課題です。ここで、エマドさんの哲学的な視点が非常に重要になってくると思います。この先の展望について、ぜひお考えを聞かせてください。労働の置き換えというのは、あくまで始まりに過ぎませんよね。



(8)2025年の最良と最悪のシナリオ


[ピーター・ディアマンディス]
 
その話に入る前に、今日は後半でエマドの視点を深掘りする予定ですが、その前にいくつか質問したいと思います。
 エマド、今年、2025年におけるAIの最良のシナリオは何だと思いますか? 今年の年末に振り返って、これは素晴らしかった、とみんなが思えるようなことは何でしょうか?


[エマド・モスタク]
 
最良のシナリオですか?動画技術はさらに進化して、『ゲーム・オブ・スローンズ』のシーズン8を作り直せるレベルに達すると思いますが、それは結構良いことだと思いますね。


[ピーター・ディアマンディス]
 
その点からすると、ハリウッドはどれだけ厳しい状況になっているのでしょうか?


[エマド・モスタク]
 
映画制作のエネルギーは大幅に減っています。でも、その分クリエイティブなことができる可能性も高まっているんです。例えば、ビデオゲーム業界は、この10年で700億ドルから1,800億ドルに成長し、Metacriticの平均スコアも5%上がっています。IMDbの平均スコアも6.3です。
 一方、ハリウッドは400億ドルから500億ドルに増えた程度です。だから、何か新しいメディアの形に変わるのかもしれませんね。


[ピーター・ディアマンディス]
 
例えば、こういう会話がいつ現実になるかということです。「ジャービス、スタートレックのシーズン5の続編を作ってくれ。それから、僕をその中の俳優として登場させてくれ」という感じで。


[エマド・モスタク]
 
その技術はもうすでに揃っています。まだ完全に統合されてはいませんが、例えばKlingの特徴的なリファレンス機能を使えば、あるシーンから新しいシーンを生成することも可能です。物語の展開もできますし、平均的な映画のカットは2.5秒で、数十年前の10秒から大幅に短くなっています。この2.5秒間をほぼ完璧にコントロールできる技術もあるので、専念すれば1年以内に誰でもこれを実現できるでしょう。適切な体制のスタジオなら、年内に1話分のエピソードを作ることだって可能です。


[ピーター・ディアマンディス]
 
すごい話ですよね。では、2025年には他にどんな変化が見られるでしょうか。音楽や医療分野が注目です。


[エマド・モスタク]
 
音楽に関しては、メディア面ではほぼ解決したと言えるでしょう。次世代の技術がとんでもないレベルに達しています。医療に関しても、すでに人間を超えたレベルに到達しており、共感の面でも大きな差をつけています。医療用のチャットボットが誰にでも利用できるようになり、特にメンタルヘルス分野で大きな効果が期待されます。今のモデルは、不十分から十分なレベルへと進化し、メンタルヘルスの分野に革命を起こす可能性があります。科学の分野でも「o3」モデルの助けを借りて新しいブレイクスルーがいくつか見られるでしょう。テスト時推論、つまり、「シンクフェレンス」とでも呼びたいような、モデルがより長く考える能力がキーポイントになります。これが最大の影響を与えるでしょう。もしかしたら、Siriももう少しマシになるかもしれませんね。


[ピーター・ディアマンディス]
 
本当に、Siriがちゃんと機能してくれる日が待ち遠しいですし、Alexaももっと役に立つ存在になってほしいです。Amazonが当初はSiriやAlexaにAnthropicを導入して本格的に強化する予定だったのに、どうやらその計画は遅れているようです。


[エマド・モスタク]
 
現在、彼らは専用のチップを搭載した膨大な数のトレインを構築しているので、うまくいくか見ものです。


[ピーター・ディアマンディス]
 
さて、ここで視点を変えて、2025年における最悪のシナリオを考えてみましょう。


[エマド・モスタク]
 
BPO市場の完全な崩壊が考えられます。そして、その影響は大きく波及するでしょう。
 このBPOというのはビジネスプロセスアウトソーシングを指しますが、例えば、Operatorのようなテクノロジーを使ってコンピュータを操作することが想定されます。現時点ではまだ大したことはありませんが、今年、画面越しの業務に関わるものが置き換えられ、並列処理化されていくでしょう。この流れは、実際にはDOGE的な考えに似た動きで、労働者が実際の職場に戻る必要が出てくるかもしれません。直接対面で仕事をする方が良く、リモート勤務の人から先に解雇される可能性が高いです。


[ピーター・ディアマンディス]
 
非常に重要なポイントですね。それでは、BPOについて、知らない方のために少し説明しましょう。


[エマド・モスタク]
 
ビジネスプロセスのアウトソーシングについてです。インドへのアウトソーシング、例えばコールセンターのスタッフやプログラマーなどの話ですね。現時点で、AIはインドにアウトソースされているほとんどのプログラマーよりも優れていると言えます。そのため、こうした経済や米国内のリモートワーカーにも影響を与えることになるでしょう。


[ピーター・ディアマンディス]
 
今頃、インドのタイムズ紙にまた見出しが出ている光景が目に浮かびます。


[エマド・モスタク]
 
ええ、そうですね。


[サリム・イスマイル]
 
これは非常に現実的な話ですし、2段階に分かれて進むと考えています。第1段階では、大きなマイナスの影響が出ます。その後、第2段階では優秀な人たちが現れて、大量のコードを生み出すようになります。なぜなら、まだまだ膨大な量のコードが必要だからです。しかし、ソフトウェアのメンテナンスやサポートシステムのようなものは、すぐに不要になってしまうでしょう。


[ピーター・ディアマンディス]
 
数週間前にこのポッドキャストでマーク・ベニオフ氏と話しましたが、彼はAgentForceを活用し、新しいエンジニアを雇わずに既存のエンジニアを再配置していると言っていました。生産性が30%向上し、そこからさらに生産性は急上昇するであろうとも述べていました。


[エマド・モスタク]
 
例えば、LovableBoltCursorのようなツールを使えば、かなりのレベルまで引き上げられますし、アプリやスタック全体を構築できるようになります。ベースモデルが進化するにつれて、さらに良くなっていくでしょう。実際、私たちの会社ではエンジニアでない人が応募してきた際に、30分間のCursorのコースを受けてもらうようにしています。これはAIを活用したIDE(統合開発環境)です。人事部でも他の部署でも関係ありません。このコースを通じて、世界観がどう変わったかを報告してもらうのです。


[ピーター・ディアマンディス]
 
そのコースでは何を教えているのですか?


[エマド・モスタク]
 
人事向けのアプリをはじめ、何にでも応用できるアプリの作り方を教えています。話しかけるだけでアプリがほぼリアルタイムで構築されるんです。例えば、ChatGPTのCanvasを使えば、Reactアプリをその場で構築できます。Wiiの画面を完全に再現したり、人事アプリケーションを作ったりすることも可能です。やりとりをしながら生成していくのです。この基本的な能力の向上が、業界全体に再編をもたらすことになると思います。ただし、今話している課題は、実際に仕事をしている人々に影響があるという点です。彼らは次に何をするかを真剣に考える必要があります。AI支援のワークフローに精通しなければなりませんし、対面での対応も求められるでしょう。そうしないと、変革に置いていかれます。この点が大きな見出しになるべきだと思います。昨年の夏、インドのIIT(インド工科大学)の38%の就職先が決まらなかったと記憶しています。トップ大学でその状況は衝撃的ですし、さらに悪化していると聞いています。


[ピーター・ディアマンディス]
 
ええ、そして、インドの経済に大きな打撃を与えていることが確かであるということです。インドの皆さん、申し訳ありません。


[サリム・イスマイル]
 
希望があるのは、アメリカでトップクラスのMBAを雇用する数が大幅に減っていることです。


[ピーター・ディアマンディス]
 
弁護士もそうなるといいのですが。


[エマド・モスタク]
 
ハーバードも今年は就職率が大きく低下していますよね?


[ピーター・ディアマンディス]
 
ただ、これは始まりに過ぎません。これから訪れる社会の大きな変革に、まだ多くの人が備えることができてはいないと思います。


[サリム・イスマイル]
 
私たちは対応できますよね。

 

[ピーター・ディアマンディス]
 
そうですね、至るところで小さなL字カーブの変化が連続して起きている感じです。例えば、世界中の教師が「生徒にChatGPTを宿題で使わせてもいいのか?」と考え始めたように、人事部門やエンジニアリング部門も同じ疑問を抱いています。この変化はまだ主流にはなっていませんが、確実に話題にはなり続けています。COVIDのときも同じでした。
 私たちのように状況を先読みしていた人々は、これは大きな転換点だとわかっていましたが、一般の人々が気付いたのは、トム・ハンクスが感染したときでした。あの「トム・ハンクスの瞬間」が何になるのかを考えています。それはディープフェイクかもしれませんし、別の何かかもしれません。それが訪れれば、経済には良い影響が出る可能性がありますが、多くの人々にとっては非常にネガティブな結果になる可能性もあります。



(以下、後半コンテンツに続く)



2. オリジナル・コンテンツ

 オリジナル・コンテンツは、以下リンクからご覧になれます。
尚、本投稿の内容は、参考訳です。また、意訳や省略、情報を補足したコンテンツを含んでいます。

Peter H. Diamandis
(Original Published date : 2025/01/30 EST)



3. 参考コンテンツ



<御礼>

 最後までお読み頂きまして誠に有難うございます。
役に立ちましたら、スキ、フォロー頂けると大変喜び、モチベーションにもつながりますので、是非よろしくお願いいたします。 
だうじょん


<免責事項>

 本執筆内容は、執筆者個人の備忘録を情報提供のみを目的として公開するものであり、いかなる金融商品や個別株への投資勧誘や投資手法を推奨するものではありません。また、本執筆によって提供される情報は、個々の読者の方々にとって適切であるとは限らず、またその真実性、完全性、正確性、いかなる特定の目的への適時性について保証されるものではありません。 投資を行う際は、株式への投資は大きなリスクを伴うものであることをご認識の上、読者の皆様ご自身の判断と責任で投資なされるようお願い申し上げます。



いいなと思ったら応援しよう!

この記事が参加している募集