
IBMが開発した光伝送技術で、大規模言語モデルの学習効率が飛躍的に向上しそう。
米IBMは、データセンターにおける生成AIモデルの学習・推論を劇的に改善する可能性のある光パッケージング技術を12月9日に発表しました。
研究者たちは、 次世代の光パッケージング技術であるCo-Packaged Optics(CPO)のための新しいプロセスを生み出し、データセンター内の既存の近距離電気配線を補完する光技術の導入を可能にしました。
ポリマー光導波路(PWG)の設計・組み立てを通じ、CPOがコンピューティング業界におけるチップ間、回路基板間、サーバー間での広帯域伝送を再定義し得ることを示しています。
この記事では、本技術について詳しく見ていきましょう💡

研究背景
現在、光ファイバー技術は長距離にわたってデータを高速で伝送し、電気の代わりに光で商業・通信等のトラフィックを支えています。
光ファイバーについてはこちらの記事で詳しく説明しているので、良ければ読んでみて下さい👇
データセンターは外部通信ネットワーク用に光ファイバー技術を使用していますが、データセンターのラック間の通信は依然としてほぼ銅の電気配線によって行われています。
電気配線は、GPUアクセラレーターに接続されるものの、GPUアクセラレーターは半分以上の時間はアイドル状態であり、大規模な分散学習プロセス時には他のデバイスからの信号を待つため、膨大な費用とエネルギーを消費します。
本技術の詳細
CPOテクノロジーは、チップメーカーがアクセラレーター間に電気配線の性能限界を超える光通信用配線を追加できるようにすることで、アクセラレーター間のインターコネクト密度の拡張を目指しています。
IBMは、これらの新しい高密度光通信構造に光波長多重通信技術を組み合わせることにより、電気配線と比較して、チップ間通信の帯域幅が最大80倍向上する可能性があることに言及しています。
IBMのイノベーションにより、現在の最先端のCPO技術と比較して、チップメーカーはシリコン・フォトニクス・チップの端面に6倍の光ファイバーを配線できるようになり、これは「beachfront density」と呼ばれています。
各光ファイバーは、人の髪の毛の約3倍ほどの幅であり、長さは数センチから数百メートルに及び、1秒間に数テラ・ビットのデータを通信します。I標準的なアセンブリー・パッケージング・プロセスを用いて、50マイクロメートル・ピッチの高密度のポリマー光導波路をシリコン・フォトニクス導波路にアディアバティック結合させました。
本論文ではさらに、50マイクロメートル・ピッチの高密度のポリマー光導波路が、量産時に必要なストレス・テストを初めて合格した点を記載しています。
さらに、研究者たちは18マイクロメートル・ピッチの高密度のポリマー光導波路も実証しました。4本のポリマー光導波路を積層することで、最大128チャンネルの接続も実現可能になります。

本技術の利点
この技術は、データセンター内の通信の帯域幅を大幅に拡大し、GPUのアイドリング・タイムを最小化しながら、AIの処理能力を大幅に向上させる可能性があります。
この研究革新により、以下が可能になります。
生成AIのスケーリングにおける低コスト化 : データセンター内のケーブルの長さは1 mから数百メートルに延伸する一方、ミッドレンジの電気配線と比較して消費電力は1/5以下になります。
AIモデルの学習が高速化: 開発者は、従来の電気配線と比較して最大5倍高速に大規模言語モデル(LLM)を学習できます。
データセンターの電力効率を劇的に向上: 1つのAIモデルの学習ごとに、米国の5,000世帯の年間消費電力に相当する電力を節電できます。
まとめ
IBMが革新的なCo-Packaged Optics(CPO)技術を発表
データセンター内の通信を大幅に改善し、AIモデルの学習を高速化
チップ間通信の帯域幅を最大80倍に向上させる可能性
消費電力の大幅な削減とAIモデル学習の効率化を実現
半導体技術の更なる発展に向けた重要な一歩
以上です。LLMの学習コストは増加し続けているので、このCPO技術がブレイクスルーになれば環境負荷も低減されますね。
今日も最後まで読んでいただき、ありがとうございました💡
参考文献
おすすめ記事
いいなと思ったら応援しよう!
