イーロン・マスクが超コンピューター「COLOSSUS」、1万ドルのオプティマス・ロボット、そして80/20のAIの未来を明かす

2024年9月12日 19:33

おおきに、イーロン・マスクがオール・インのポッドキャストに出演して、AIについてもいろいろ喋ってたんや。政治から言論の自由、サタデー・ナイト・ライブが本当にライブなんかどうかまで、幅広い話題を扱ってたんやけど、その中でも12、3分ほどAIと人類の未来、ロボット工学なんかについて語ってたんや。
まず最初に、AIの開発についてどう思うか聞かれとったんや。投資家はAIへの投資に見合うリターンを得られるんかとか、なんでNVIDIAだけがこのAIブームで儲かってるんかとか、そういう質問やったんやけど、イーロンはこう答えとったわ。
AIへの投資は今のところ収益を上回っとるんは間違いないんやけど、AIの進歩のスピードは今まで見たことないくらい速いんやで。例えば、チューリングテストなんてもう昔の話や。今じゃ、ラズベリーパイで動く基本的なオープンソースのLLMでもチューリングテストに合格できるやろ。
AIとロボット工学の発展で、モノやサービスの不足がなくなる時代が来るんちゃうかな。特別なアートワークみたいに人為的に希少性を作り出すもの以外は、みんな欲しいものが何でも手に入るようになるんやないかな。製造業やサービス業の商品やサービスのコストはほぼゼロに近づくやろ。実際にゼロにはならんけど、みんながほしいものを手に入れられるようになる、そういう良い未来が来る確率は80%くらいやと思うで。
残りの20%は人類滅亡の可能性やけど、まあ、ポジティブに考えよか。そんなもんやろ？人類滅亡って、どんな感じになるんやろな。
正直言うて、AIのことを考えすぎると寝られへんくなるんや。でも、一番の問題は、AIが人間よりも何でもうまくできるようになった時に、どうやって人生の意味を見出すかってことやと思うわ。それが一番の課題かもしれへん。
今はどんどん退職する人が増えてきてるけど、そういう生活を楽しんでる人も多いみたいやしな。でも、コンピューターが人間よりも何でもうまくできるようになったら、意味の危機みたいなもんが起こるかもしれへんな。
でも本当に必要なんは、自動運転車と人型ロボットや汎用FPUロボットやと思うわ。それさえあれば、何でも作れるようになるんや。経済の規模に実質的な限界はないと思うわ。地球の質量が一つの限界になるかもしれんけどな。
経済って結局のところ、一人当たりの平均生産性に人数をかけたものやからな。人型ロボットの数に制限がなくて、しかもそいつらが非常に賢く動けるようになったら、経済には実質的な限界がなくなるんや。
これはめっちゃ面白い指摘やな。イーロンは前にも似たようなこと言うてたけど、経済や繁栄、国の生産高なんかの定義の多くは、人間の労働力に結びついとるんや。働ける人の数とか、価値を生み出せる人の数とかな。
でも、AIやロボット工学が出てきたら、その方程式に全く新しい要素が加わるんや。コンピューターが人間よりちょっとだけ上手にあらゆることをこなせるようになって、ロボットが多くの肉体労働や生産を担うようになったら、特にロボットが他のロボットを製造するようになったら、もう未知の領域に突入するんやで。
イーロン・マスクとX AI（彼のAI企業）が最近立ち上げた「Colossus」について聞いたことあるか？「The Information」っていうメディアが「なぜマスクのAIライバルたちが彼の新しいGPUクラスターに警戒しているのか」って記事を書いてたんや。
イーロン・マスクは月曜日に、X AIの次世代モデル（GRとかそういうやつ）のトレーニング用に、10万個のNVIDIA H100チップを4ヶ月で完成させたって言うてるんや。これが本当なら、世界最強のGPU（グラフィック処理ユニット）クラスターってことになるんやけどな。
もちろん、疑う人もおるわな。他の企業はそんな多くのGPUを一箇所にまとめるのに成功してへんからな。一箇所にまとめたんか、それとも分散させたんかは分からんけど。うわさによると、マイクロソフトの人らが、そんなに大量の計算能力を一箇所に置いたら州の電力網がダウンしてまうって文句言うとったらしいわ。
他にも問題あるで。冷却の問題とかな。めっちゃ熱出すから、それを冷やして何も溶けへんようにせなあかんのや。一箇所にまとめるのはいろんな問題があるんや。
電力の問題もあるな。イーロンは6月下旬に10万チップのクラスターが稼働したって言うてたけど、その時点で地元の電力会社は、X AIが地元の電力網から数メガワットの電力しか使えへんって公表してたんや。これじゃ数千個のGPUしか動かせへんのや。
電力会社は、イーロン・マスクとX AIが使える電力量を徐々に増やしていくって言うとったな。去年の8月には半分のクラスターを動かせるくらいになって、2025年までには全部の10万チップを動かせるようになるらしいわ。
イーロンは短期的な解決策として、天然ガスで動くタービンを持ち込んだみたいやな。
次に、このGPUの超クラスターについて聞かれとったわ。どんな可能性があるか、どんな問題があるかってな。X AIだけやなくて、テスラもAIに取り組んどるからな。自動運転とかニューラルネットとか、オプティマスロボットもニューラルネットを使うとるし。大規模言語モデルとはちょっと違うけど、視覚や動きに基づいたものやな。でも、トレーニングや推論を実行するには同じようにNVIDIAのGPUが必要なんや。
ちなみに、このクラスターは「Colossus」って呼ばれとるんやで。
「COLOSSUSを稼働させたって聞いたんやけど、これって世界最大のプライベートGPUクラスターなんか？」
「そうや、どんな種類のスーパーコンピューターよりも強力なんや。これは、デイビッドとピーターが言うたように、AIの経済的価値のほとんどがNVIDIAに行ってるってことを示しとるな。でも、代替案を持ってる人もおるし、君もその一人やな。テスラの場合は特殊やけど、Dojoは画像や大規模な画像、巨大な動画を扱うためのものやからな。」
「そうやな、テスラの問題はLLMの問題とは違うんや。AIの性質も、重要な点も違うんや。テスラの場合、コンテキストがめっちゃ長いんや。ギガバイト単位のコンテキストウィンドウがあるんや。」
「そうや、数十億トークンのコンテキストがあるんや。7台のカメラがあって、1分間の高解像度の映像を撮ったら、それだけでギガバイトになるんや。だから圧縮せなあかんのや。」
「テスラの問題は、巨大なコンテキストを圧縮して、本当に重要なピクセルだけに絞り込まなあかんのや。時間と空間の両方の次元で、ピクセルを圧縮せなあかんのや。そして、それを比較的小さなコンピューター、数百ワットのテスラ設計のAIコンピューターで処理せなあかんのや。」
「ちなみに、テスラが設計したAIコンピューターは、他のサプライヤーから買えるどんなものよりも優れとるんや。テスラのチップ設計チームは本当にすごいで。」
「テスラのチーム誰かが技術論文とプレゼン資料を公開してて、それを見てびっくりしたわ。イーサネットの上に独自のトランスポート制御レイヤーを設計したんやろ？イーサネットじゃ不十分やって。PTCoとかいうのを作って、イーサネットを再発明したみたいやな。すごいことが起こってるな。」
「そうやな、テスラのチップ設計チームは本当にめっちゃすごいんや。」
「他の人たちも、例えば動画関連の用途とかで、将来的にNVIDIAの競合になる可能性はあるんかな？理論的には、余ったサイクルがあれば使えるって感じか。」
「意図的にそうしようとしてるわけやないけど、まあそうやな。トレーニングと推論があって、テスラには2つのプロジェクトがあるんや。Dojoってトレーニング用コンピューターと、全ての車に搭載されてる推論チップやな。」
「Dojoは今のところDojo1だけやけど、Dojo2は来年の終わりごろには量産できるはずや。Dojo2はB200みたいなシステム、トレーニングシステムに匹敵するものになると思うわ。」
AIチップの必要性について少し話してたけど、詳しいことはあんまり言うてへんかったな。でも、オプティマスプロジェクトとその価格については話してたで。これ、めっちゃ重要な要素やでな。
各ロボットがビジネスや工場、製造施設にもたらす価値によって、需要が大きく変わってくるからな。例えば、月1000ドルでリースして、2000ドルの利益を生み出すか、2000ドルのコスト削減ができるんやったら、その方程式が成り立つ限り、できるだけ多くのロボットを導入しようとするやろ。
テスラや他の企業が言うてる人型ロボットの価格、正直、みんなが予想してたよりもずっと安いんちゃうかな。聞いてみよか。
「オプティマスプロジェクトはどうなってる？前に話した時、工場内で軽いテストをしてるって聞いたけど、実際に役立ってるんか？量産するとしたら、モデル3みたいに年間100万台作るようになったら、1台あたりの製造原価はどれくらいになると思う？2万ドル、3万ドル、4万ドルくらい？」
「そうやな、十分な量を作れば、どんなものでも非漸近的に材料費に近づいていくもんやで。ただ、知的財産のコストとか特許の使用料とかで制約される部分もあるな。チップの中身の多くは、ロイヤリティの支払いやチップ製造設備の減価償却やからな。でも、チップそのものの材料費はめっちゃ安いんや。」
「オプティマスは車よりもずっと軽くて小さいからな。大量生産すれば、オプティマスの労働力と材料費は多分1万ドルくらいにはなるんちゃうかな。ただ、それには10年くらいかかるやろうな。オプティマスの設計を少なくとも3回は大幅に改良して、年間100万台以上の生産規模にせなあかんからな。」
「つまり、10年くらいかかるってことやな。2035年くらいに、第3世代か第5世代くらいの人型ロボットを作る時、1台追加で作るコストが1万ドルくらいになるってことやろ。技術開発や生産設備を作るのにかかったコストは別にして、追加で1台作るのに1万ドルってことやな。」
「これ、世界を変えるような出来事になるんちゃうか？十分な生産能力があれば、たくさんのロボットが安く作られて、あっちこっちにおるようになるってことやろ。そんな世界がどんなもんになるか、想像するのも難しいわ。」
「フィギュア・ワン・ロボットの創業者のブラッド・アドコックは、10億台以上のロボットがすぐに出現すると信じとるんや。1年で一気にってわけやないけど、毎年どんどん増えていくってな。車みたいに10年から20年くらいの寿命があるとしたら、10年以内に10億台のロボットに到達する可能性もあるわけや。」
「基本的に、オプティマスは小型車よりも安くなるって考えたらええんや。規模の経済が働いて、技術的にも3回ほど大きな進化を遂げたら、小型車が2万5000ドルくらいやとしたら、人型ロボットは2万ドルくらいになるんちゃうかな。R2-D2とC-3POを足して2で割ったようなもんやけど、もっと優れたやつやな。」
「正直、みんな自分の人型ロボットにめっちゃ愛着を持つようになると思うわ。スター・ウォーズのR2-D2とC3POみたいなもんや。あいつら、めっちゃ好きやったやろ？」
「そうやな、一方のほうがめっちゃ好きやったけどな。」
「ほんまにすごいやつらやで。あいつらの性格とかな。R2-D2はビープ音しか出せへんかったけど、C-3POは英語喋れたしな。ビープ音を翻訳せなあかんかったけど。」
「それで、2年目くらいやろ？1回の改良に2、3年かかるとしたら、10年くらいかかるんやな。」
「いや、大きな改良は2年以下やと思うわ。多分5年くらいで年間100万台の生産に到達できるんちゃうか。長くても6年くらいやな。」
「ワオ、その価格なら地球上の誰もが買えるようになるな。30年後には、ロボットの数と人間の数の比率はどうなると思う？1対1か2対1くらい？」
「ロボットの数は人間の数をはるかに超えると思うで。誰だってロボットの相棒が欲しくなるやろ。特に子供のおる家庭やったら、犬の散歩させたり、芝刈りしたり、子供の面倒見たり、勉強教えたりもできるしな。」
ワイ個人的には、家にロボットがおるのめっちゃ楽しみなんやけどな。ある女性の友達と話してて気づいたんやけど、彼女はあんまりロボットに興味なさそうやったんや。なんでかなって考えてたら、今から言うことが分かってきてな。
もし自分がロボットより背が高かったら、見下ろすような感じやから、別に怖くないんやけど、もしロボットのほうが頭ひとつくらい高かったら？全然違う印象になるやろ。頭の中でそんな状況想像したら、「あー、なるほどな」って思ったわ。もしロボットが自分より大きかったら、家に置きたくないって気持ちも分かるわ。全然違う雰囲気になるもんな。
「火星に送ることもできるで。」
「そうやな、火星を人類が住めるようにするために必要な仕事をさせるために、たくさんのロボットを送れるわ。」
「火星はもう既にロボットの惑星みたいなもんやな。探査機やヘリコプターとか、ロボットだらけやで。」
「そうやな、面白い考えやわ。実用的な人型ロボットは、今までで最大のチャンスやと思うわ。だって、人間とロボットの比率は少なくとも2対1、もしかしたら3対1くらいになると思うんや。みんながロボットを欲しがるやろうし、それに加えて、目に見えへんところでモノやサービスを作ってるロボットもたくさんおるやろうからな。」
「それって、いろんなタスクをこなせるように学習する汎用ロボットってことか？」
「そうやな、ワイらも汎用やで。肉でできとるだけやけどな。」
「そうか、肉の操り人形を動かしてるわけやな。」
「そうやな。オプティマスを設計してるうちに、人間がなんでこんな形をしてるんか、どんどん分かってきたんや。なんで指が5本あるんか、なんで小指が他の指より小さいんか、なんで親指が動くんか、とかな。」
「例えば、手を動かす主な筋肉が前腕にあるのはなんでなんやろ。指を動かす筋肉のほとんどが前腕にあって、指は主に腱、つまり小さな紐で動いてるんや。」
「今のオプティマスの手は、アクチュエーターが手の中にあって、11の自由度しかないんや。人間の手の自由度（25くらい）には及ばへんし、アクチュエーターが手の中に収まらなあかんから、力も足りんのや。」
「次世代のオプティマスの手は、人間と同じように、アクチュエーターを前腕に移動させて、ケーブルで指を動かすようにしたんや。そして、22の自由度を持つようになった。これで、人間ができることのほとんどができるようになると思うわ。」
「XとテスラがGRと協力してサービスを提供するかもしれへんって書かれとったけど、ワイがすぐに思ったんは、ロボットにGRみたいな対話AIを搭載したら、ロボットに個性が生まれて、音声や映像を処理できるようになるんちゃうかってことや。」
GRに自分をディスってもらったことあるか？TwitterかXのプロフィールがあったら、そこにある情報やツイート、フォローしてる人なんかを見て、それを元にディスってくれるんや。めっちゃ上手いで。
ワイらの未来は、7フィートの巨大ロボットがGRを搭載して、ずっとワイらをディスり続けるってことやな。
以上や。ワイはウェス・ロスや。見てくれてありがとう。

この記事が気に入ったらサポートをしてみませんか？