SSD時代のRAID0の故障率について考える|西川善司
『backspace.fm』は1週間分のテック系ニュースをお届けするPodcastです。
すべてのエピソードは無料でWebサイトまたは各Podcastアプリから聴くことができます。
▷Twitter https://twitter.com/backspacefm
▷YouTube https://www.youtube.com/c/BackspaceFmHome
▷Spotify https://open.spotify.com/show/6STfl8XK3pk4hbaqTsi2sx?si=FUUUoHyCR76gHpZeh8newA
この記事は西川善司さんが瀬戸弘司さんにRAID0の故障率について説明されたチャットのログを転載しました。
この議論の発端となった対談はこちら
以下が、後日チャットで善司さんから瀬戸さんへ送られたフォローアップ解説のログです。
Backspace.fmマガジンに書き込むべきネタだったかなあ
ちょっと解説しますね。
さてさて、故障率についても考えてみましょう
SSDの故障は
(1)コントローラチップ(※)の故障
(2)記憶セルの故障
の2パターンが考えられます。
※コントローラチップとはCPU側とのやり取りや記憶セルにデータを書き込むための制御をおこなうチップです。
※実際のSSDを見ると偉そうな大き目なICがありますが、あれです。
(1)の確率が100分の1だとすると、たしかに同時に使うRAID0の故障確率は2倍。
100分の2になりますね。
(2)の場合ですが、SSDの寿命は書き込みで経年します。
「SSDの寿命は書き込み量とは無関係」という話もあるみたいですがこれは間違いです。
SSDの記憶セルのフラッシュメモリー(NAND記憶素子)は、高校の理科で習ったトランジスタにおけるソース/ドレイン/ゲートのうちゲートにある電荷量の大小によって制御されるソース/ドレイン間に流れる電流量でデータとなる0か1を判断します。
なので、ゲート側の電荷量は読み出し時には不変です。
しかし、書き込み時は、このゲートの電荷を一度、ソース/ドレイン側に飛び出させて(消去に相当)、書き込む0か1のデータに応じてゲートに電荷を飛び込ませます。
このゲートへの電荷の出し入れ時に、ゲートを包んでいる酸化膜(絶縁膜)を劣化させます。
ここが劣化すると、ゲートに電荷をため込んで保持できなくなり、記憶セルが役立たずとなります。
SSDの寿命を現したTBW値というのは、まさに「どのくらいのデータ量を書き込むとそろそろやばいか」を現した数値です。
ここまでで気が付いたかもしれませんが、
寿命が1TBW値(1TB書き込んだら死ぬ)の容量1TBのSSDがあったします。
こいつにいま1TBを書き込んでみましょう。
まず、1TB+1TBのRAID0構成だとどうでしょうか。
それぞれのSSDに0.5TB+0.5TBが書き込まれるので死にませんね
次の1TBの書き込みでは死にますけど。
1TB単発だとどうでしょうか。
1TB書き込んで即死ですね。
次回のチャンスはありません
つまり、RAID0だと、SSDの寿命が短い...というのは(2)の観点からすれば、正しくないということになります
では、(1)と(2)が両方起こりうるという視点で考えてみましょう。
(1)の視点でRAID0は故障率が二倍
(2)の視点でRAID0は故障率が2分の1
(1)×(2)を計算すると、故障率は単体SSDと変わらなくなりますよね。
基本的に、RAID0の問題は「純粋にデータが破損したときの復旧が難しい」というだけ...と僕は考えています。
(セットアップ面倒、というのはありますね)
その意味で、瀬戸さんが「RAID0はやめる」を選んだことは正しいです。
ただ、RAID0が故障しやすい...というのは、以上の理由からちょっと違うかも、と思うのです。
この記事はbackspace.fmが運営する月額有料サービス「BSM」の無料公開記事です。
BSMでは購読者限定コンテンツや、定例オフ会、YouTubeライブ特典などBackspaceをより楽しめるコンテンツをたくさん用意しています。
我々の活動の支援にもなりますので、まだ入会されてない方は、ぜひ一度、検討をお願いします!
ここから先は
BS Magazine
テクノロジー系ポッドキャスト番組として人気の「backspace.fm」主催者の2人(ドリキン、松尾)を中心にお届けする雑誌。 ポッドキ…
この記事が気に入ったらチップで応援してみませんか?