Як інтерпретувати дані SMART для дисків SAS?

Я перебуваю в процесі заміни деяких несправних SATA-дисків на нові SAS-диски. Масив рейду, до складу якого входить один з несправних дисків, перебуває в процесі повторного прошивання. По мірі прогресування я можу помітити, що частота виправлення помилок при записі на новий диск повільно, але стабільно зростає. Це моє перше опромінення обладнання SAS, і я не знайомий з висновком smartctl, оскільки я звик до великої таблиці, яку виробляють диски SATA.

Диск являє собою HGST Ultrastar 2TB, прикріплений через IBM M1015 HBA, в режимі проходження.

Як саме слід інтерпретувати дані SMART нижче? Чи повинно мене хвилювати зростання виправленої помилки? А як щодо поля викликів алгоритму виправлення?

  Device: HITACHI  HUS723020ALS640  Version: A222
Serial number:         xxxxxxxx
Device type: disk
Transport protocol: SAS
Local Time is: Thu Jul 11 15:42:30 2013 MDT
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK

Current Drive Temperature:     44 C
Drive Trip Temperature:        85 C
Manufactured in week 29 of year 2012
Recommended maximum start stop count:  50000 times
Current start stop count:      2 times
Elements in grown defect list: 0
Vendor (Seagate) cache information
  Blocks sent to initiator = 149833037905920

Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:          0        0         0         0          6          0.565           0
write:         0      400         0       400         51       1034.246           0
verify:        0        0         0         0         37          0.000           0

Non-medium error count:        0

hard-drive smart sas

— Джефф Шатток
джерело

Я просто здогадуюсь тут, але оскільки це виправлення ECC, схоже, це все виправляється в кеші, а не актуальні проблеми з фізичними блюдами. . .

— ernie

Затримки помилок - це помилки, які сповільнюють інші запити. Виправлені помилки ECC не викликають особливих проблем на накопичувачах SCSI / SAS, у нас диски розгорнуті з сотнями мільйонів, і вони все ще працюють добре. Виклики алгоритму виправлення дещо серйозніші; вони можуть вимагати перечитування / перезапису диска та повторного повторного обчислення ECC.

Важко сказати, хвилює чи кількість помилок, які у вас є. Немає одного стандарту, у кожного виробника є свій власний, і вони зберігають його у власності. Зазвичай ви можете завантажити утиліту з веб-сайту виробників, щоб отримати додаткову інформацію.

Для Hitachi посилання: http://www.hgst.com/support/downloads#WINDFT

Детальніше про різні помилки ви можете прочитати тут: http://smartmontools.sourceforge.net/smartmontools_scsi.html

— Грегг А.
джерело