見出し画像

NVDAのBlackwell:AI革命を加速させる次世代プラットフォーム

私たちは今、人工知能(AI)が日常生活のあらゆる面に浸透し始める、エキサイティングな時代の入り口に立っています。その中心にいるのが、半導体大手NVIDIAです。彼らが最近発表した最新AIプラットフォーム「Blackwell」は、AIの可能性を大きく広げる画期的な技術として注目を集めています。

この記事では、Blackwellとは何か、どのようにして私たちの生活や社会を変革し、新たな可能性を切り開くのかを探っていきます。


Blackwellとは何か?

Blackwellは、NVIDIAが開発した最新のAI用プラットフォームです。従来のGPUアーキテクチャを大幅に改良し、AI処理能力を飛躍的に向上させました。具体的には、以下のような特徴を持っています

1. Blackwellの技術群

  • Blackwellプラットフォーム:単なるGPUではなく複数種のチップから構成されるAIクラスター向けの総合的なプラットフォーム
    ✔︎GPU(グラフィックス プロセッシング ユニット):Blackwell GPU
    ✔︎CPU(セントラル プロセッシング ユニット):Grace CPU ※Arm技術採用
    ✔︎DPU(データ プロセッシング ユニット):BlueField ※Arm技術採用
    ✔︎NIC(ネットワークインターフェースカード):ConnectX
    ✔︎NVLinkスイッチ
    ✔︎Spectrum Ethernetスイッチ
    ✔︎Quantum InfiniBandスイッチ

出典元:NVIDIA Blackwell Platform at Hot Chips 2024
https://www.servethehome.com/nvidia-blackwell-platform-at-hot-chips-2024/
  • チップ間の超高速接続技術
    ✔︎NV-HBI:複数のGPUダイを単一のチップ内で10TB/sの帯域で繋ぐ技術。2つのGPUが実質1つの巨大なGPUとして機能
    ✔︎NVLink-C2C:ヘテロジニアスコンピューティングを実現する超高速チップ間接続技術。GB200 Superchipは2つのGPUと1つのCPUを組合せている。
    ✔︎第5世代NVLink:1 基のBlackwell GPU で最大 18 本の NVLink 100 GB/s 接続(1.8TB/s)をサポート。前世代の帯域幅の2倍を実現。
    ✔︎NVLink Switch:複数の NVLink を接続し、単一ラック内やラック間の高速GPU通信を実現

  • 推論効率の向上:低精度フォーマットを高精度データに変換するQuasar量子化技術で推論効率が劇的に向上

  • ハイブリッド液冷ソリューション:冷却効率の大幅向上を実現

2. Blackwellの性能

上記の技術を組み合わせた水冷式ラックのGB200 NVL72の性能は以下の通りで、現行から劇的に性能が向上する予定です。

・LLM推論:30倍(vs. NVIDIA H100 Tensor コア GPU)
・LLMトレーニング:4倍(vs. H100)
・電力効率:25倍(vs. H100)
・データ処理:18倍(vs. CPU)

NVL72の性能(出典元:NVDIA https://www.nvidia.com/ja-jp/data-center/gb200-nvl72/)

これらの特徴により、Blackwellは様々な分野でAIの応用範囲を大きく広げることが期待されています。

3. 投資家を心配させるBlackwellの製造上の困難

Blackwellの製品群は非常に複雑な構造になっています。新たに採用される水冷技術は本格導入の歴史がなくサプライチェーンも脆弱なようです。また、巨大なチップサイズは歩留まりに不利に働きます。こういった様々な問題を解決して大量生産するのは簡単ではありません。実際何らかのトラブルがありBlackwellの市場展開が遅れるとの報道がありました。
実際にBlackwellが市場に展開されるのがいつなのか、予想されるNvidiaの収益は本当に実現できるのか、市場は心配しているようです。

Blackwellがビジネスにもたらすインパクト

シミュレーション分野での革新

Blackwellの高い処理能力は、シミュレーションの分野で革命をもたらす可能性があります。飛行機や電車から、橋、シリコン チップ、医薬品の分野のシミュレーションに活用されることで、劇的なコスト削減効果を期待されています。

  • ASICの設計時間の短縮:
    アナログ回路設計ソルバーの一つであるCadence社の回路シミュレーターでは、GB200 Blackwell Superchip では従来比13 倍速く実行されると予想

  • データセンターの仮想レプリカシミュレーションによる時間とコストの削減:
    Blackwell GPU を使用すると、従来比で最大 30 倍速く実行して、スケジュールを加速させ、エネルギー効率を向上できる見込みです。

Blackwellが切り開く新たな可能性

量子コンピューティングの進化の推進

量子コンピューティングは、核融合エネルギー、気象研究、創薬、その他多くの分野で期待されています。そのため、研究者は、NVIDIA GPU ベースのシステムやソフトウェアを使用して、量子アルゴリズムの開発とテストを加速させ、未来の量子コンピューターをシミュレートする作業に尽力しています。
NVIDIA Blackwell アーキテクチャは、量子シミュレーション分野での貢献が期待されます。

AI による天気予測

気候変動による異常気象災害は2050年までに年間100万人の命と1.7兆ドルの損失をもたらす見込みです。
従来の天気予報は、膨大な計算資源とエネルギーを消費してきました。
NVIDIA FourCastNetは生成AI技術を活用した新しい天気予報モデルです。
 ・従来モデルと同等の精度を維持しつつ、処理速度と省エネ性を大幅に向上
 ・1万回の予報アンサンブル生成により低確率高影響の極端気象の予測精度向上
天候・気候予測分野におけるAI革命の先駆けとして、期待されています。

出典元:Nvidia Extreme
weather simulation with FourCastNet. To learn more, visit: nvidia.com/sustainable-computing

高解像度な天気予報

Nvidiaによると、天気予報における高性能コンピューティング(HPC)の効率化が重要課題となっています。NVIDIAによるとNVIDIA GPUの採用により、
 ・計算速度が数倍向上
 ・エネルギー効率が大幅に改善
 ・導入コストを大幅に削減
他に、
 ・極端気象の予測精度向上に貢献
 ・安全な避難、輸送計画、エネルギー需給予測などに活用
 ・計算能力向上と同時に、天気予報のカーボンフットプリント削減に寄与
が可能になると主張されています。

追加記事('24.10.06) NVL36*2の開発がキャンセル(ミン・チー・クオ氏の記事より)

iPhoneを中心とした半導体関連の正確な情報発信で有名なミン・チー・クオ氏がBlackwellのラックサーバーの一部の開発のキャンセルについて記事を書いています。概要は以下の通り。

  • Nvidiaの頻繁な製品計画変更は、リソース、競争力、需要のバランスを取る試みを反映。これは現実的だが、一部の市場参加者を混乱させる可能性がある。

  • 2025年のBlackwellサーバーの製品ラインナップの不透明さにより、一部のサプライヤーの見通しに大きな影響を与える可能性がある。

Nvidiaの株価はしばらく停滞中ですが、複雑なラインナップに対する危惧がやはり一つの要因になっていそうです。ご興味がある方は覗いてみて下さい。

読者の皆様方へ

最後までお読みいただきありがとうございました。
AIの進化は私たちに無限の可能性をもたらします。その可能性を最大限に活かすためにも、ぜひ一緒にAIの未来を探っていきましょう。


この記事を読んでAI技術に興味を持たれた方、米国企業についてもっと詳しく知りたいと思った方は、ぜひnoteのフォローをお願いします!定期的に投稿していきます。

参考資料

NVIDIA BlueField ネットワーキング プラットフォーム(出典元:NVDA)
DPU とは?(出典元:NVDA)
NVIDIA Blackwell Platform at Hot Chips 2024(出典元:Hot Chips 2024)NVLink と NVSwitch(出典元:NVDA)
NVIDIA NVLink-C2C(出典元:NVDA)
NVIDIA GB200 NVL72(出典元:NVDA)
NVIDIA Blackwell プラットフォームが科学コンピューティングの領域を押し広げる(出典元:NVDA)
高解像度な天気予報(出典元:NVDA)
AI による天気予測(出典元:NVDA)

いいなと思ったら応援しよう!

PK
よろしければサポートお願いします!