
ITシステムアラートメッセージの大切さ・・・(Raidが普及始めた時?)
一昔前、RAID構成のStorageが普及し始めた頃、間違った認識が広がって、RAID5にしたら「HDDの故障でData Lostは無い!」って...…「BackUpは必要無い!」って。
そのんなことは絶対にないですよ。大きな認識間違い・・・。Dataを読めなくなるのが、遅れるだけで、致命的な状態に陥ります。BackUpが無ければData Lostになります。
例えば、RAID5(最小構成:3台・・・容量は2台分)だと1個HDDが壊れても動作します。この状態で冗長化ではなくなりますので、あと1個壊れるとDataは読めなくなります。
ここで致命的になるか、復旧出来る可能性を残せるかは、オンサイトエンジニアの経験とSkillに依存するかもしれません。あくまでも可能性(小)ですが...…。
1個目が壊れてもDataは読めていますので、構成されているHDDはUpdateされています。当然、壊れたHDDと整合性はなくなります。このあと2個目が壊れるとRAID5構成でもで、壊れた瞬間に読めなくなりますので、Updateも行いません。(気づかれたかもしれませんが・・・)もし、2個目が復活できればRAID5が動作します(あくまでも可能性)。
・・・なので、2個故障した場合は、どちらが先に壊れたのかがPointです、知る方法はツールなり、アラート通知なりで知ることは可能でしょう。(1個目が壊れたときに)
Service Enjineerの時には、この情報で助かったことは多々あります。故障時は、アラートメッセージが重要です。
※どうしても必要なデータであれば、サルベージ専門業者に依頼することもありですが、非常に高価になります。
※寒くなると電源OFFするのが怖くて、正月明けに電源ONで正常に動作するのか不安でした。