見出し画像

テスラ:なぜ複数のカスタムAIスーパーコンピューターを構築するのか


 現地 9/24にCNBCが配信したテスタのAIスーパーコンピュータの取組みをざっくりと紹介するコンテンツです。
 来る10月10日には、テスラのRoboタクシーに関するイベントが開催される予定ですが、どんな発表があるのか楽しみです。TeslaとxAIのインテリジェンスを支えるAIスーパーコンピューターがなぜ複数で、何故テスラが独自に設計されたカスタム環境なのか、おさらいできるコンテンツかと思います。ご興味次第でご参照ください。




(1)プロローグ

イーロン・マスクはなぜ複数のスーパーコンピューターを構築するのか

 イーロン・マスクといえば、車やロケット、ソーシャルメディアで有名ですが、今ではスーパーコンピューターにも力を入れています。


イーロン・マスクは、テスラが2024年末までに「プロジェクトDojo」と呼ばれる自社製スーパーコンピューターの構築に、10億ドル以上を投資する予定だと発表しています。

フランク・ホランド(CNBC)


スーパーコンピューターはデータセンターに似た外見ですが、極めて高速で計算やデータ処理を行うように設計されています。


どちらも大規模な計算能力の拡張を目的としていますが、データセンターでは多くの小さな並列タスクがあり、それらは必ずしも互いに関連していません。一方で、例えば大規模なAIモデルを訓練する場合、それらの計算は完全に独立しているわけではありません。そのため、計算同士の連携がより緊密である必要があり、データのやり取りもより高い帯域幅と低いレイテンシーが求められます。

アナンド・ラグナサン(パデュー大学教授)


マスクは、このスーパーコンピューターの力を使って、テスラの自動運転機能を向上させ、長年の約束であるロボタクシーの市場投入を実現しようとしています。また、テスラが来年から自社工場で使用を予定しているヒューマノイドロボット「オプティマス」の訓練にもスーパーコンピューターが必要です。マスクによると、テスラは今年AIに100億ドルを投資する予定です。

100億ドル : テスラが今年AIに費やす予定の金額


さらに、マスクの新しいAIベンチャー「xAI」も、チャットボット「Grok」の訓練に強力なスーパーコンピューターを必要としています。このGrokは、OpenAIのChatGPTやGoogleのGeminiチャットボットと直接競合しています。
いくつかのスーパーコンピュータープロジェクトはすでに開発中で、8月にはマスクがX(旧Twitter)で「Cortex」というテスラのAIスーパーコンピュータークラスタを紹介しました。このCortexは、テスラのテキサス州オースティンの本社で構築中です。


また、1月には、ニューヨーク州バッファローで「Dojo」スーパーコンピューターを建設するために5億ドルを投資すると発表しています。一方、マスクは最近、テネシー州メンフィスにあるxAIの「Colossus」スーパーコンピューターが稼働を開始したことも明らかにしました。CNBCは、マスクがスーパーコンピューターに賭けることが彼の企業の将来にどのような影響を与えるか、そして超競争的なAI開発の世界で彼が直面する課題について、さらに詳しく知ろうとしています。



(2)スーパーコンピューターとxAI


スーパーコンピューター自体は以前から存在しており、国立研究所などに行けば、マテリアルのシミュレーションやディスカバリ、気候モデル、核反応のモデル化など、さまざまな用途に使われています。しかし、AIスーパーコンピューターの特徴は、AIのために完全に最適化されている点にあります。

アナンド・ラグナサン(パデュー大学教授)


マスクは2023年にxAIを立ち上げ、チャットボット「Grok」のような大規模言語モデルやAI製品を開発し、OpenAIやMicrosoft、Googleが作るAIツールに対抗しようとしています。マスクはOpenAIの共同設立者の一人でしたが、2018年に同社を離れ、それ以来、最も厳しい批評家の一人となっています。6月には、xAIがテネシー州メンフィスにスーパーコンピューターを建設し、Grokの訓練を行うことが発表されました。

オープンAIの非営利の約束を破ったサム・アルトマンとの対立が再燃(2024年2月16日)


この投資は、メンフィス史上、新規参入企業による最大規模となる数十億ドルの資本投資となる見込みです。

テッド・タウンゼント(グレーター・メンフィス商工会議所、社長兼CEO)
xAI スーパーコンピュータサイト( テネシー州メンフィス)


この発表は、xAIがシリーズBで60億ドルの資金調達に成功した直後に行われました。この資金調達により、同社の評価額は80億ドルから240億ドルに上昇しました。
9月初めには、マスクがメンフィスにあるAIトレーニング用スーパーコンピューター「Colossus」が稼働を開始したと発表しました。このスーパークラスタは、100,000基のNVIDIA H100 GPUで動作しており、マスクによれば、世界で最も強力なAIトレーニングシステムです。さらに、このクラスタは数カ月以内に規模が倍増すると述べています。

マスクのAIスタートアップが60億ドルを調達(2024年5月28日)
xAI Colossusスーパーコンピュータが10万枚のH100 GPUで稼働開始 — マスクは50,000 H100と50,000 H200でGPUを20万に倍増する計画を発表(2024年9月4日 )
100,000個のNvidia H100 GPU


GPUはもともと、ノートパソコンやデスクトップでグラフィックス処理をメインのCPUから分担するために開発されました。いわばアクセラレーターの役割を果たしています。10年から15年前、オンラインゲームが急成長し、人々は高速なゲーム体験を求めていました。その際、グラフィックスとゲームの一般的な処理を同じプロセッサで行うと制約が生じることがわかりました。大規模言語モデルの訓練は非常に特化した作業で、これを従来のCPUで行うことも可能ですが、GPUの特定のアーキテクチャがこの種の作業には非常に適しています。

スティーブン・ディケンズ(ザ・フューチャラム・グループ)
Nvidiaのチップ不足でAIスタートアップはコンピュータパワーを求めて奔走(2023年8月24日)


実際、GPUは非常に人気となり、NVIDIAのようなチップメーカーは一時的に需要に追いつけないほどでした。GPUをめぐる争奪戦は、マスク自身の企業間でも競争を引き起こしています。マスクのソーシャルメディア企業「X」とxAIは密接に連携しており、XはxAIのチャットボット「Grok」を自社サイトでホスティングしています。また、xAIはXのデータセンターの一部を利用して、Grokを支える大規模言語モデルの訓練を行っています。


2023年12月、イーロン・マスクはNVIDIAに対し、テスラ向けに予約されていた12,000枚の非常に貴重なH100 GPUをテスラではなく、ソーシャルメディア企業「X」へ出荷するよう指示しました。この結果、テスラのデータセンターやAIインフラの拡充が5〜6カ月遅れることとなりました。

(CNBC)


この出来事は、受託者責任の違反として、株主がイーロン・マスクとテスラの取締役会を相手取って訴訟を起こしました。株主たちは、マスクがxAIを設立した後、テスラから貴重な人材や資源を新会社に流用し始めたと主張しました。マスクはX上で、テスラはその時点でチップを活用する準備が整っておらず、自分が転用しなければ倉庫に放置されていたはずだと説明しました。さらに、マスクはテスラがxAIに50億ドルを投資するべきだとまで提案しています。

イーロン・マスクは、最新のスタートアップであるxAIにテスラが50億ドルを投資することを望んでいる — 株主の承認が得られれば(2024年7月24日)



(3)スーパーコンピューターとテスラ



イーロン・マスクは、人工知能を活用してテスラを大きく変革するという大きな計画を持っています。
1月にイーロン・マスクはX(旧Twitter)で、テスラを自動車会社ではなく、AIロボティクス企業として捉えるべきだと述べています。この変革の鍵となるのが、テスラ独自のスーパーコンピューター「Dojo」です。Dojoについては、2021年のテスラのイベント「AI Day」で初めて公に発表しました。


ニューラルネットワークのトレーニングには、速度と処理能力に対する非常に高い要求性能があります。イーロン・マスクはこれを見越して、数年前に私たちに「超高速なトレーニング用コンピューターを設計してほしい」と依頼しました。こうして「Dojo」プロジェクトが始まったのです。

ガネッシュ・ヴェンカタラマナン(テスラ、シニアディレクター)
(クリックして拡大)


昨年の第2四半期の決算説明会で、イーロン・マスクは投資家に対し、2024年末までにテスラが「Dojo」に10億ドル以上を投資する予定だと語りました。その数カ月後、モルガン・スタンレーは「Dojo」がテスラの価値を5000億ドル引き上げる可能性があると予測しました。
「Dojo」の主な役割は、テスラ車両が収集する膨大な量の映像やデータを処理し、AIモデルをトレーニングすることです。この目的は、テスラの運転支援機能「オートパイロット」や、より高度な「完全自動運転(FSD)」システムを改善することにあります。

10億ドル以上:テスラが2024年末までにDojoに費やす予定の金額
モルガン・スタンレーはDojoがテスラの価値を5,000億ドル押し上げると予測(2023年9月10日)


テスラは500万台以上の車を販売しており、それぞれの車には通常8台のカメラが搭載されています。それらのカメラが撮影した映像はすべてテスラに送信されています。この膨大なデータを使って、テスラは完全自動運転の開発を進めています。現在、テスラはその実現にかなり近づいていると言われています。

スティーブン・ディケンズ(ザ・フューチャラム・グループ)


「オートパイロット」や「FSD(完全自動運転)」という名前にもかかわらず、これらのシステムはテスラ車を自律運転させるものではなく、ドライバーの積極的な監視が必要です。テスラも自社のウェブサイトでそのことを明示しています。しかし、テスラがオートパイロットやFSDの能力を誇張して宣伝しているとして、規制当局からの注目を集めています。2024年の国家道路交通安全局(NHTSA)の報告書では、956件のテスラ車の事故のうち、467件がオートパイロットと関連している可能性があるとされています。

カリフォルニア規制当局、テスラがオートパイロットとフルセルフドライビングを虚偽広告したと主張(2024年4月26日)
連邦規制当局、テスラのオートパイロットに「重大な安全ギャップ」があり、数百件の衝突に関連していると判明 連邦当局は、テスラのオートパイロットシステムに「重大な安全ギャップ」があり、少なくとも467件の衝突が発生し、そのうち13件は死亡事故につながったと述べている。(2024年4月26日)
ロボタクシーなしではテスラの評価額を正当化するのは難しいと、グッゲンハイムのロナルド・ジェウシコウが語る(2024年7月11日)


完全自動運転の実現はテスラにとって非常に重要であり、同社の高い企業価値は主にロボタクシー市場への参入にかかっていると分析されています。
しかし、テスラは最新の決算報告で冴えない結果を報告し、自動運転技術において他の自動車メーカーに遅れを取っていると言われています。
競合には、アルファベットが所有するウェイモ(Waymo)があり、すでにいくつかの米国都市で完全自律タクシーの商業運行を行っています。ほかにも、GMのクルーズ(Cruise)やアマゾン傘下のズークス(Zoox)、中国のDiDiやBaiduも競争相手です。


テスラは「Dojo」を通じてこの状況を変えることを目指しており、マスクによれば、Dojoは2023年からすでにテスラの業務に使用されています。Dojoはテスラの自動運転システムをトレーニングするという非常に特化したタスクを実行するため、自社専用のチップを設計することを決めました。


「D1」チップは、7ナノメートル技術で製造されており、わずか645平方ミリメートルの面積に500億個のトランジスタを搭載しています。特徴的なのは、このチップの100%のエリアが機械学習のトレーニングと帯域幅に使われている点です。まさに機械学習に特化した専用のチップです。

ガネッシュ・ヴェンカタラマナン(テスラ、シニアディレクター)
(クリックして拡大)


高性能コンピューティングでは、一般的にスーパーコンピューターにCPUやGPUが搭載されています。しかし、近年ではAIの作業負荷に特化した専用チップを搭載するAIスーパーコンピューターが増えています。「Dojo D1」チップはその代表例です。AIのワークロード向けに特別に設計されたチップで、高い性能を発揮します。

アナンド・ラグナサン(パデュー大学教授)


「D1チップ」を調べた際に特に印象的だったのは、レイテンシー(遅延)の問題です。D1は車両のカメラから送られてくるビデオフィードをトレーニングに使用しているため、大きなファイルをどう効率的に移動させるか、そして遅延をどのように処理するかが重要な課題となっています。これが、D1の設計において大きなポイントとなっています。

スティーブン・ディケンズ(ザ・フューチャラム・グループ)


「D1」チップは台湾の半導体メーカーTSMCによって製造されていますが、テスラはそれだけでなく、スーパーコンピューターの全体的なインフラも一から設計しています。これにより、テスラは自社のAIトレーニングに最適化されたシステム全体を構築しています。


カスタムAIスーパーコンピューターを設計することで、テスラはアルゴリズムからハードウェアまで、全ての要素を最適化し、それらが完全に連携して動作するようにすることができます。これはテスラに限ったことではなく、グーグル、メタ、マイクロソフト、アマゾンといった多くのハイパースケーラーも、AI向けに独自のカスタムチップやシステムを設計しています。これにより、それぞれのAIワークロードに最適化されたパフォーマンスを実現しています。

アナンド・ラグナサン(パデュー大学教授)


「Dojo」の設計は次のようになっています。25個の「D1」チップが「トレーニングタイル」と呼ばれるユニットを構成し、各タイルには冷却、データ転送、電力供給のためのハードウェアが内蔵されていて、それ自体が独立したコンピューターとして機能します。6つのタイルで「トレイ」を構成し、2つのトレイで「キャビネット」を作ります。最終的に、10個のキャビネットが「エクソポッド」を形成し、テスラによると、このエクソポッドは1.1エクサフロップスの計算能力を持ちます。

1.1エクサフロップスの計算能力


エクサフロップとは、1秒間に1兆回(クインティリオン、10の18乗)の計算を行う能力を意味します。わかりやすく言うと、地球上の全員が1秒間に1回計算しても、エクサスケールのコンピューターが1秒で処理する計算量に達するには4年以上かかる計算になります。

1京(けい)計算/秒


すごいですよね。ただ、同じような性能を持った他のスーパーコンピューターも確かに存在しています。

アナンド・ラグナサン(パデュー大学教授)


そのスーパーコンピューターの一つが、テネシー州にあるエネルギー省のオークリッジ国立研究所に設置されている「Frontier」というシステムです。Frontierは、1.2エクサフロップスの性能を持ち、理論上は2エクサフロップスに達する可能性があります。このスーパーコンピューターは、新薬開発のためのタンパク質シミュレーションや、飛行機のエンジン設計を改善するための乱気流のモデル化、大規模言語モデルの作成などに利用されています。また、次世代のZetaスケールスーパーコンピューターもすでに開発中で、Zetaフロップスのスーパーコンピューターは、1エクサフロップスの1,000倍の計算能力を持つとされています。Dojoに関しては、テスラ車を自動運転にするだけでなく、さらなる用途が見込まれているとディケンズ氏は述べています。

オラクルは、最大131,072枚のNvidia Blackwell GPUを使用した「ゼタスケール」のクラウドクラスターを構築していると発表(2024年9月11日)


もし、ロボットに穴を掘る方法を教えたいとしたら、これまでに何台のテスラ車が道端で穴を掘っている人を見てきたかを考えることができますよね。それを活用して、例えば「Optimus」に「何百時間も人が穴を掘る映像があるから、これを使って君を訓練したい」と言うことができるかもしれません。ですから、テスラを単なる自動車メーカーとして捉えるのではなく、もっと広い視点で考える必要があります。

スティーブン・ディケンズ(ザ・フューチャラム・グループ)


今年の夏の株主総会で、マスク氏はOptimusがテスラを25兆ドル規模の企業に成長させる可能性があると主張しましたが、全員がそれに納得しているわけではありません。

イーロン・マスクは、オプティマスロボットがテスラを25兆ドルの企業にする可能性があると主張 — 現在のS&P500の価値の半分以上(2024年6月13日)


ロボットが人間に取って代わるというのは夢物語のように感じますし、非常に高い目標ですよね。価格についても、正直現実的とは思えません。しかし、もし実現すれば、人類にとって大きな変革をもたらす可能性があります。EVは成功しましたが、このロボットに関しては非常に懐疑的だと言わざるを得ません。

クレイグ・アーウィン(ロス・キャピタル・パートナーズ)



(4)課題と今後の展望


これほどの潜在力があるにもかかわらず、マスク氏のスーパーコンピューター技術と彼の企業には、技術をスケールさせビジネスを強化するために多くの課題が残されています。その一つが、必要十分なハードウェアを確保することです。テスラは独自のチップを設計していますが、マスク氏は依然としてNVIDIAのGPUに大きく依存しています。例えば、6月にマスク氏は、テスラが今年NVIDIAのハードウェアに30億~40億ドルを投資すると発表しました。

イーロン・マスクの会社は、テスラがライバルスーパーコンピュータを構築しようとしている中でもNVIDIAのハードウェアを大量に購入している(2024年3月21日)


私たちが直面しているのは、需要が非常に高いためにNVIDIAのGPUを手に入れるのが困難であるという状況です。必要なときに最新のNVIDIA GPUを確実に入手できるかどうかは非常に懸念されるところです。だからこそ、私たちはDojoにもっと力を入れて、必要なトレーニング能力を確保する必要があると考えています。

イーロン・マスク(テスラ)


たとえマスク氏が望むすべてのチップを手に入れたとしても、テスラが完全自動運転に近づいていると考える人は少ないです。また、Dojoがその目標を達成するための解決策だと断言する人も限られています。
多くの他の自動車メーカーが自動運転技術のために高価なLiDARシステムを採用している一方で、テスラはカメラを使ったビジョンのみのシステムを選択しています。


FSD(完全自動運転)には、搭載されているセンサーに関連する問題があります。車を運転している人々からは、「ファントム障害物」と呼ばれる、実際には存在しないものに反応して車が突然ブレーキをかけたり、ステアリングが急に動いたりするという報告があがっています。例えば、白いトレーラートラックが倒れていて、曇りの日に白が重なったようなシナリオでは、コンピュータがそれを正確に認識するのは難しいのです。注意を払っている運転手なら、その状況を見てすぐにブレーキを強く踏むでしょうが、コンピュータはこうした状況に簡単に騙されてしまう可能性があります。こうした問題を解消するためには、テスラは他のセンサーを追加する必要がありますが、彼らは一貫してLiDARを採用しない姿勢を示しています。根本的なデザインを変えなければならないのに、DojoでこれらのFSDの核心的な問題は解決できません。

クレイグ・アーウィン(ロス・キャピタル・パートナーズ)
テスラの運転手が「ファントムブレーキ」の急増を報告(2022年2月2日)
オートパイロットがテスラの横転したトラックへの衝突の原因とされる(2020年6月16日)


時には、マスク氏自身もDojoの将来性について疑問を呈しています。


「私たちはAIとDojoの二つの道を追求しています。Dojoはあくまで長期的なチャレンジであり、リスクは高いですが、成功した場合のリターンも非常に大きいです。ただし、確実なものではなく、成功の確率が高いわけではありません。リスクは高いが、リターンも大きいプログラムです」とマスク氏は述べています。

イーロン・マスク(テスラ)


さらに、環境への影響も懸念されています。マスク氏や他の大手テック企業が構築しているスーパーコンピューターは、通常のコンピューティングよりもはるかに大量の電力を必要とし、冷却のために膨大な水を消費します。例えば、ある分析によると、2022年にデータセンターが世界的に約460テラワット時の電力を消費したと推定されており、その総電力消費は2026年には1,000テラワット時を超える可能性があります。この需要は日本全体の電力消費量に匹敵します。昨年発表された研究では、2027年までにAIによる水の需要が最大66億立方メートルに達する可能性があると予測されています。また、今夏、環境保護団体は、テネシー州メンフィスでxAIが適切な許可を得ずに天然ガスを燃料とするタービンを18基以上稼働させ、スーパーコンピューター施設の電力を供給したことで、スモッグ問題を悪化させていると指摘しました。xAIはこの件に関してCNBCのコメント要請に応じていません。供給チェーンの課題や環境問題以外にも、スーパーコンピューターやAIが本当にビジネスに適しているのか疑問視する声もあります。

データセンター、AI、暗号通貨の世界的な電力需要(クリックして拡大)
AIによる水不足:2027年までに66億立方メートル(クリックして拡大)
イーロン・マスクのxAIが、データセンターでの無許可のガスタービンによってメンフィスのスモッグを悪化させたと非難される(2024年8月28日)


テスラは、自動車メーカーとしての課題を抱えつつ、AIやロボティクスに大きな野望を持っている企業です。しかし、AIからすぐに収益を上げる状況にはありません。5年前に約束されたFSDも、現時点では実現の兆しが見えていません。Dojoは大規模で興味深く、彼らにとって大きな可能性を開くプロジェクトですが、慎重に見るべきだと思います。これでどうやって利益を出すのか、その見通しはまったく不明です。それは、暗闇に向かって矢を放つようなものに感じられます。

クレイグ・アーウィン(ロス・キャピタル・パートナーズ)


代わりに、アーウィン氏は、マスク氏が得意とするEV(電気自動車)製造に専念すべきだと提案しています。

私はテスラの株に対して非常に悲観的です。ただ、基本的な価値は理解しています。テスラがタイやインドに進出し、インドに数十億ドルの投資をすれば、供給チェーンも自然に構築されるでしょう。そうなれば、テスラは世界でコストリーダーになる可能性があります。ミニカーのような小型車を市場に投入する必要がありますが、もしそれが実現すれば、会社の展望は大きく変わるでしょう。

クレイグ・アーウィン(ロス・キャピタル・パートナーズ)


一方で、ディケンズ氏はより楽観的です。


私は、テスラがスーパーコンピューターのパラダイムを変えつつあると思います。彼らは、投資の規模、潤沢な資金、そしてそれを単一のユースケースに集中させる能力を持っています。確かに、FSDは長い間約束されてきましたし、イーロンに対しては各人各様の意見があるでしょう。それらもすべて正当な考え方です。しかし、テスラは先行しており、GMやステランティス、フォードなどが追いつくのは当分先のこと、あるいは永遠に実現しないかもしれません。

スティーブン・ディケンズ(ザ・フューチャラム・グループ)




(5)オリジナル・コンテンツ

 オリジナル・コンテンツは、以下リンクからご覧になれます。
尚、本投稿の内容は、参考訳です。また、意訳や省略、情報を補足したコンテンツを含んでいます。

CNBCより
(Original Published date : 2024/09/23 EST)




御礼

 最後までお読み頂きまして誠に有難うございます。
役に立ちましたら、スキ、フォロー頂けると大変喜び、モチベーションにもつながりますので、是非よろしくお願いいたします。 
だうじょん


免責事項


 本執筆内容は、執筆者個人の備忘録を情報提供のみを目的として公開するものであり、いかなる金融商品や個別株への投資勧誘や投資手法を推奨するものではありません。また、本執筆によって提供される情報は、個々の読者の方々にとって適切であるとは限らず、またその真実性、完全性、正確性、いかなる特定の目的への適時性について保証されるものではありません。 投資を行う際は、株式への投資は大きなリスクを伴うものであることをご認識の上、読者の皆様ご自身の判断と責任で投資なされるようお願い申し上げます。


いいなと思ったら応援しよう!