基幹サーバのHDD交換作業をしました(リビルド)
アイニチ システム管理者です。
先日、管理しているサーバのHDDからエラーが出ていた為、交換作業を行いいました。
いわゆる、『RAIDのリビルド(再構築)』です。
サーバの構成は、RAID1のHDD2本構成。
OpenManage Server Administrator (OMSA)で年明けからエラーログが出ていました。
(エラー:Predictive Failure reported: Physical Disk 0:1:1 Controller 0, Connector 0)
故障ではなく予兆のエラーなので、急ぎではないですが、もう1本も同時期のHDDなので、エラーや故障が起きて壊れたら大変なので、HDDを手配しました。
約2週間程度でHDDが届きました。
下駄をはかせてサイズ調整、容量は同じHDDです。
オレンジのランプのHDDがエラーHDDなので交換します。
ホットスワップ対応のHDDの為、稼働しながら交換もできますが、今回は、より安全に行なうためにサーバの電源を落としてからHDDを交換しました。
(交換時、電源等ケーブルを一旦抜いて2分程度放置し、放電)
交換後、サーバを起動させます。
マニュアル通りなら自動的にリビルドが進行する想定ですが・・・・・。
・・・・・・進行しない、未対応のまま・・・・・。
仕方ないので、手動でリビルドを行います。
OpenManage Server Administrator (OMSA)を起動
Storage → 目的のコントローラー名 →[Connector 0]→[Enclosure]→[Physical Disk]
再構築する物理ディスクの[Tasks]のプルダウン メニューから[Rebuild]を選択し、[Execute]をクリックします。
OpenManage Server Administrator (OMSA)が日本語だったので、[Rebuild]=[グローバルホットスペアの割り当て]を選択して実行。
再構築開始、約600GBのHDDですが、約1時間弱掛かりましたが、無事完了。
点検は面倒ですが、その面倒を行っていたので、万が一の事故を防ぐ事が出来ました。
エレベーターや昇降機なども、万が一の事故を防ぐ為、日々の保守点検、メンテナスが大事です。
改めて、メンテナンスの重要性、必要性を考えて頂き、防げる事故を未然に防いで頂ければと思います。
この記事が気に入ったらサポートをしてみませんか?