
SSDが壊れた!👷smartctlで状態確認
SSDが壊れた?ですったもんだした顛末と、そんな時に役立つmacやwindowsでも使える状態確認方法のmoteですら
気絶した老ノートPC
Ubuntuで使っていたノートPCのアップデートをした直後、SSDの不調から再起動しなくなりました。 殆ど使わなくなり半年以上放置していたのでスネてしまったのでしょうか。。。初めてベトナムに来た時に持ってきた歴戦の勇士を捨てるのも可哀想な気もするので、SSD修復で遊んでみました。
症状は、アップデートから再起動で起動せず、initramfs という不吉なプロンプトモードになってしまいました⋯。ダメだこりゃ😩
そんな時には
① exit コマンド
② fsck コマンド
で、運が良ければエラー回復できるらしいのでやってみます。
・・・が、だめでした。😰

ちなみにコマンドの詳細は ①は
> exit
/dev/??? contains a file system with errors, check forced.
/dev/??? UNEXPECTED INCONSISTENCY; RUN fsck MANUALLY.
この???部分はマシン毎に異なります。
そして②のfsckを実行では
fsck -y /dev/nvme/???
コレで治って起動する、っていう話なんですが⋯5年以上前?に入れたSSDだし、しゃーないw
退役した実験用PCだから、正式退役かな。
(※この手順、いまいちわかってないので「正解」ご存じの方、是非教えてくださいmm)
念の為Ubuntu入れてみる
とはいえ30分前は普通に動いてたので納得がいきません。
実験用なのだから、終末期実験に使うのだぁ!ということでUbuntu24LTSを再インスコ。

無事にインストール終わりましたが、再起動の途中でまた死亡。シャットダウンできずエラーがでております。
「⋯ウム。」 5分待っても変わらないので、電源を強制的に落として再起動…したら、無事に起動しました。 君の名は今日からゾンビ号な。🧟
SSDの検証をしてみる
せっかくなので、新人ゾンビ君のSSDの状態を確認してみることに。
$ sudo apt install smartmontools
$ smartctl --scan
/dev/nvme0 -d nvme # /dev/nvme0, NVMe device
とデバイスが表示されるので
$ sudo smartctl /dev/nvme0 -A
smartctl 7.4 2023-08-01 r5530 [x86_64-linux-6.8.0-41-generic] (local build)
Copyright (C) 2002-23, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF SMART DATA SECTION ===
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 32 Celsius
Available Spare: 119%
Available Spare Threshold: 10%
Percentage Used: 0%
Data Units Read: 4,422,813 [2.26 TB]
Data Units Written: 6,675,735 [3.41 TB]
Host Read Commands: 57,690,608
Host Write Commands: 165,399,368
Controller Busy Time: 19,977,360
Power Cycles: 1,591
Power On Hours: 2,604
Unsafe Shutdowns: 97
Media and Data Integrity Errors: 123
Error Information Log Entries: 3,077
Warning Comp. Temperature Time: 29
Critical Comp. Temperature Time: 0
総書き込みは3.41TBです。同様の製品のTWB (Total Bytes Written,総書き込み容量)は100TBくらいなのでまだまだです。
しかき、気になるのは以下の2つ。Media and Data Integrity Errorsは 物理的ダメージやシステムエラーなど、データ整合性が取れなかった時にカウントアップされる「ストレージ デバイス自体の物理的な損傷」をあらわします。
Media and Data Integrity Errors: 123
Error Information Log Entries: 3,077
次のError Information Log Entriesは起動回数などでもカウントされるのでそれほど気にしなくて良い、という事ですが数が多いので気になります。
DISKツールで見るとSSDはAGI512G16AI198というモデルで,平均故障間隔160万時間と書かれてますが、よく考えたら仕事で使っていたわけでもないので1000時間も使っていないような気がします。

故障の前にファームウェアのアップデートがかかっていたので、なにかやらかされてしまったのかもしれません。トホホ
動くようになって一息ついたら、ちょうどタイムリーな記事が流れてきました。検索したからGoogleが見せただけのような気もしますが(怖
記事によるとSSDは1年くらい放置するとデータが消失するリスクが有るようで、定期的に使用する必要があるようです。
このノートはバッテリーがすでに弱く、半年くらい通電していませんでしたので調子が悪くなった疑いが出てきました。ゾンビなのか蘇生マンなのか、もうしばらく様子を見ることにします。
いずれにしても、数値で問題をある程度確認できたのは良かったです。
コンピュータでオカルトはよくありませんから。👻
付録:macの場合
ドライブ表示はdiskutil listを使います。
$ diskutil list
/dev/disk0 (internal, physical):
#: TYPE NAME SIZE IDENTIFIER
0: GUID_partition_scheme *500.3 GB disk0
1: Apple_APFS_ISC Container disk1 524.3 MB disk0s1
2: Apple_APFS Container disk3 494.4 GB disk0s2
3: Apple_APFS_Recovery Container disk2 5.4 GB disk0s3
/dev/disk3 (synthesized):
#: TYPE NAME SIZE IDENTIFIER
0: APFS Container Scheme - +494.4 GB disk3
Physical Store disk0s2
1: APFS Volume Macintosh HD 13.3 GB disk3s1
2: APFS Snapshot com.apple.os.update-... 13.3 GB disk3s1s1
3: APFS Volume Preboot 12.3 GB disk3s2
4: APFS Volume Recovery 1.9 GB disk3s3
5: APFS Volume Macintosh HD - Data 395.2 GB disk3s5
6: APFS Volume VM 20.5 KB disk3s6
/dev/disk6 (external, physical):
#: TYPE NAME SIZE IDENTIFIER
0: GUID_partition_scheme *2.0 TB disk6
1: EFI EFI 209.7 MB disk6s1
2: Apple_HFS ASMB-2TB 2.0 TB disk6s2
/dev/disk0 があるので、ここからは同じで
smartctl /dev/disk0 -A
とすれば情報が表示されます。
参考:
windowsの場合
いいなと思ったら応援しよう!
