見出し画像

チップの寿命を延ばす安全な電圧スケーリング技術

インフラストラクチャーCAPEXの削減とシステムパフォーマンスの向上

もしチップが性能を犠牲にすることなく、また消費電力を削減しながら20%長く動作するとしたら、製品の信頼性やコストにどのような影響を与え、貴社の利益にどのような変化をもたらすでしょうか?

チップの寿命を延ばすことへの需要が業界全体で高まっている中、設計者や品質エンジニアは製品が期待される寿命を全うできるようにする必要性を強く感じています。アプリケーションによるストレスは、チップの劣化の主な要因の1つであり、必要とされるワークロード下でのパフォーマンスが電力消費の増加、温度の上昇、信頼性リスクの増大、そして最終的には製品寿命を短くしてしまいます。

この記事では、従来の方法よりも大幅に安全なワークロードと信頼性を考慮したAVS(adaptive voltage scaling)の革新的なアプローチについて説明します。この方法により、ガードバンド(不要に設定されたガードバンド)を少なくして、SoCの寿命を大幅に延ばすことが可能になります。

チップ寿命を延ばすことの重要性

データセンター、自動車システム、消費者向けデバイスは、長期間にわたって確実に機能するチップが必要です。例えば、ハイパースケールデータセンターは、サーバーの有効寿命を延ばすことでCAPEX(資本支出)を削減し、持続可能性を促進するという戦略的なビジネス目標を打ち出しています。以下の表によると、この寿命延長によりAmazonの四半期ごとの純利益は9億ドル増加し、AlphabetやMicrosoftの年次純利益も30億ドル増加しました。

この表からも、これらの企業が数年前にサーバーの寿命延長のための類似の取り組みを行ったことがわかり、明確なトレンドを示しています。さらに、純利益への影響は2021年の20億ドル〜27億ドルから、2023年には30億ドル〜37億ドルに増加しています。この急増は、生成的AIなど、より多くのコンピューティングリソースを必要とする高ストレスワークロードの導入によるものです。ハードウェア費用が上昇する中、ハイパースケーラーはこれまで以上にチップ寿命の最大化に取り組む必要に迫られています。


Alphabet、Amazon、Microsoftにおける減価償却スケジュールの変更

一方、自動車の電子機器は、高温や機械的なストレスに耐えながら、15年間の動作が求められ、さらに安全性要件を満たしている必要があります。この市場では、集中型ECUアーキテクチャの導入やADAS(先進運転支援システム)など高いユースケースが求められることにより、計算能力の要件が増加しています。これらの負荷がシリコンの劣化を加速させるため、十分な寿命を確保することはさらに困難になっています。

チップのライフが長くない理由

多くのチップメーカーは、信頼性を確保しながら動作をさせるためにVDDmin(最低動作電圧)を選定するという従来の方法に頼り、事前に定められたガードバンドを使用します。これらのガードバンドは、チップの使用寿命にわたって保持される必要があり、経年によるパフォーマンスの低下や、VDDminが設定される際のテスト時が不正確である可能性も考慮に入れる必要があります。

これらの方法はしばしば過度に保守的で、実際には必要以上に多くのガードバンドを設けることになります。この欠点は、チップが必要以上に幅広いガードバンドを利用することになり、結果的に消費電力削減の可能性が制限されるという問題を引き起こします。そのため、デバイスは不必要に高い電圧で設定され、早期に劣化することになります。

安全な電圧スケーリングが寿命を延ばす理由

その方程式はシンプルです。ワークロードと信頼性を考慮したリアルタイムソリューションがあれば、保守的なガードバンドを常に使用する必要はありません。適用可能な場合には低い電圧を安全に使用することが可能となり、これにより消費電力を大幅に削減し、寿命が短くなることを遅らせることができます。


安全な電圧スケーリングによって劣化が遅れる伝統的な半導体信頼性曲線

一般的な劣化モデル(例:負のバイアステンペラチャ不安定性、NBTI)は、電圧(V)と温度(T)に依存する物理現象である「べき乗則」に基づいています。


・劣化係数A0は主に電圧(V)と温度(T)に依存します。
・ΔS/S0は、特定のパラメータ(例:トランジスタVth)の変化をその初期値と比較したものです。
・mは劣化率係数(例:NBTIの場合、m ≈ 0.2)です。
・加速因子AF(V, T)を導入すると、効果的な劣化係数はAFm ∙ A0に変化し、効果的な劣化モデルが得られます。


低いVDDでの寿命延長を推定するには、f(t)とg(t)を特定の閾値で比較する必要があります。下に示すように、より安全な電圧と温度のスケーリングを持つg(t)は、劣化速度を遅くする加速係数を促進し、つまりf(t1) = g(t2)となります。

‍さらに分析を行うと以下の式が得られ、

これにより以下の式が導かれ、

加速係数が明らかになります。

g(t)は、より安全な電圧および温度スケーリングによって促進される分数加速係数のおかげで、f(t)より劣化が遅い

ここで示すように、劣化モデルは電圧と温度の影響を受け、加速係数(AF)が劣化速度を変更します。電圧が低いと温度も低くなり、劣化プロセスが遅くなります。その結果、加速係数の分数効果によってコンポーネントの寿命が延びます。

proteanTecs AVS Pro™による典型的な寿命延長シミュレーション結果

一般的なカナリア回路や固定電圧ガードバンドとは異なり、proteanTecs AVS Proは、チップ内でのタイミングマージンモニタリングを活用しています。このソリューションは、リアルタイムで何百万もの真のパスをモニタリングするマージンエージェントと、より情報に基づいた意思決定を行うための専用アルゴリズムを組み合わせています。AVS Proは、実際のワークロード、実際の劣化、および実際のIRドロップに基づいて、現実のシナリオでより多くの電力を削減しながら信頼性を確保するために、正確なガードバンドの設定を可能にします。

クリティカル・パスは、個々のデバイスのさまざまな劣化パターンによって時間とともに変化する可能性があるため、チップごとの真のパスをリアルタイムモニタリングすることが最も重要です。


AVS Proによって可能となる電力削減の割合に基づく典型的な寿命延長 (*)
(*) 寿命延長はVDDと温度に依存する。この場合、750mVのベースラインVDDレベルと85℃のベースラインに対して計算された。

チップの寿命を通じて公称電圧を下げることで、AVS Proは消費電力と温度を下げ、SoCへのストレスを減らして寿命を延ばします。チップが古くなるにつれて、ガードバンドの再設定はそれに応じて最適化され、効率を最大化しながら信頼性を確保します。
AVS Proにより、エンジニアは余分なガードバンドを安全に削減することができます。その結果、電圧が低下し、消費電力、温度、ストレスが低減され、劣化を遅らすことができます。


ノーマルコンディションでの5nm遅延劣化シミュレーション [%]:T接合 85℃、V=0.75V

上記のシミュレーションでは、AVS Proを使わない場合に発生するチップの最初の1年間での劣化が、AVS Pro(青い点線)を使用することで2年以上改善することができます。その結果、チップの総寿命も同様の割合で延長されます(青い点線)。

実データによる結果:システムの寿命を延ばす

proteanTecsのAVS Proは、チップの寿命を最大18%延長できる可能性を実証しました。これによりデータセンターは、早期の交換を減らすことで毎年数億ドルの節約が実現できます。自動車業界では、電子機器の15年の寿命目標を達成するのに役立ち、重要な安全機能が維持されることを保証します。


ここで視覚化されたAVS Proは、安全な電圧スケーリングを通じて大幅な電力削減を実現し、18%の寿命延長をもたらします。

上記の例は、5nmプロセスで量産されたコミュニケーションチップから取られたものです。AVS Proは12.5%の電力削減を実現し、その結果、予測される寿命が18%延長されました。AVS Proは不要な劣化を防ぎ、チップの寿命を通じて電圧を微調整することで劣化の進行や重大な故障の発生を遅延させるとともに、パフォーマンスに影響を与えることなく電力消費を削減します。

※この場合のノーマル電圧は0.65Vです。予測される寿命の延長は、0.75Vのノーマル電圧で動作するチップよりも小さくなります。

次世代への展望:より環境に優しく、信頼性の高い未来

チップの寿命延長への期待が高まる中、proteanTecs AVS Proは、長期間の信頼性を求める業界にとって必須のソリューションです。パフォーマンス、電力削減、寿命延長をバランスよく実現する能力により、チップメーカーは信頼性の高い製品を提供するだけでなく、CAPEXの削減と持続可能性の促進にも貢献できるようになりました。

AVS Proがどのようにチップの寿命を延ばすことができるかについて、さらに詳しく学ぶには、ホワイトペーパーをダウンロードするか、こちらからお問い合わせください。

1 S&P Global, “AWS, Azure and Google Cloud intensify capex to prevent customer churn”, Jean Atelsek, 2024年3月 
2 J.W. McPherson, Reliability Physics and Engineering, 第3版、Springer Publishing、2019年