Скільки перерозподілів секторів SMART вказують на проблеми?


17

У мене є прилад NAS, якому трохи більше місяця. Він налаштований, щоб надсилати мені електронні сповіщення, отримані з даних SMART на жорстких дисках. Після одного дня один із жорстких дисків повідомив, що сектор погано поширився та перерозподілився. За перший тиждень ця кількість піднялася на шість загальних секторів для відповідного жорсткого диска. Через місяць кількість становила дев'ять перерозподілених секторів. Ставка, безумовно, здається уповільнює.

NAS налаштовано на шість накопичувачів 1,5 ТБ в конфігурації RAID-5. З такими накопичувачами з високою місткістю я б очікував, що час від часу відмовить сектора, тому мене не хвилює, коли перші кілька секторів будуть переселені. Мене це хвилює, хоча жоден з інших дисків не повідомляє про будь-які проблеми.

З якою швидкістю переїздів, або загальною кількістю переїздів, я повинен почати турбуватися про стан їзди? Чи може це змінюватися залежно від ємності накопичувача?


приємний, Джеремі. один з найкращих на сервері за замовчуванням, як і багато інших, тут буде корисним, і відповідь на це знайти непросто. однозначно заслуговує більше +2. ви можете перефразувати питання, щоб воно не було специфічним для NetGear, але загалом для зберігання
ім'я користувача

Дякую за відгук, я вніс запропоновані вами зміни та оновив ситуацію.
Джеремі

1
Я замінюю диски в одному перерозподіленому секторі. Слід очікувати нуля протягом гарантійного терміну дії накопичувача. Виробники завжди шанували гарантію на ці накопичувачі.
Майкл Хемптон

Відповіді:


13

Приводи, як і більшість компонентів, мають рівень відмови кривої ванни. Вони сильно зазнають невдач на початку, мають відносно низький рівень відмов у середині, а потім сильно зазнають невдач, коли досягають кінця свого життя.

Подібно до того, як цілий накопичувач слідує цій кривій, окремі ділянки диска також будуть слідувати цій кривій. Ви побачите багато перерозподілів секторів на початку використання диска, але це має скоротитися. Коли накопичувач починає виходити з ладу в кінці життя, він почне втрачати все більше секторів.

Вам не потрібно турбуватися про 6 (залежно від накопичувача - проконсультуйтеся з виробником), але потрібно спостерігати і бачити частоту кожного нового перерозподілу. Якщо погіршення прискорюється або залишається таким же, хвилюйтеся. В іншому випадку це повинно бути добре після початкового періоду прориву.

-Адам


Невеликий момент: Диски будуть виходити з ладу ДОВГО перед MTBF. Я думаю, ти маєш на увазі, що вони сильно зазнають невдач, коли наближаються до очікуваного життя.
Едді

5
Хіба Google досить докладно не розкрив теорію "кривої ванни"?
Insyte

20

Перечитавши статтю Google на тему " Тенденції невдач у великій кількості населення на дисковому диску ", я думаю, що можу сміливо сказати, що відповідь Адама невірна. Під час їх аналізу надзвичайно масивної сукупності приводів приблизно 9% мали ненульовий підрахунок перерозподілу. Оповідаюча цитата така:

Після першого перерозподілу диски накопичуються в 14 разів більше, ніж протягом 60 днів, ніж диски без підрахунку перерозподілу, що робить критичний поріг для цього параметра також одним.

Це ще цікавіше, коли ми маємо справу з "офлайн перерозподілами", які є перерозподілами, виявленими під час вискоблювання фонів накопичувача, а не під час фактичного запиту операторів IO. Їх висновок:

Після першого перерозподілу в режимі офлайн, диски мають понад 21 раз більше шансів виходу з ладу протягом 60 днів, ніж диски без перерозподілу в режимі офлайн; ефект, який знову більш драматичний, ніж загальні перерозподіли.

Моя політика відтепер полягає в тому, що диски з ненульовим підрахунком перерозподілу мають бути заплановані на заміну.


Це цікаво, що я чув про цей документ, але мені може знадобитися його перечитати. FWIW, 4 з 6 дисків у моїй NAS мають перерозподілені сектори. Дякую за відповідь.
Джеремі

3

Напевно різні диски мають різні параметри. На накопичувачі, який я востаннє перевіряв, що це диск серії 1 ТБ від одного постачальника, було 2048 зарезервованих секторів для перерозподілу.

Ви можете оцінити кількість зарезервованих секторів, які шукають у звіті SMART на диску, що має ненульове число перерозподілених секторів. Розгляньте звіт про несправний диск нижче.

...
ID# ATTRIBUTE_NAME          VALUE WORST THRESH TYPE      WHEN_FAILED  RAW
...          
  5 Reallocated_Sector_Ct   005   005   036    Pre-fail  FAILING_NOW  1955

Тут було використано 95% його резервованої потужності, що становить 1955 секторів. Тому початкова ємність становила близько 2057 р. Насправді це 2048 р., Різниця зумовлена ​​помилкою округлення.

SMART перетворює привід у збій, коли кількість перерозподілених секторів досягає певного порогу. Для диску, про який йдеться, цей поріг встановлюється на рівні 64% від зарезервованої ємності. Це приблизно 1310 перероблених секторів.

Однак зарезервовані сектори не лежать у безперервному періоді. Натомість вони розділені на кілька груп, кожна група використовується для перестановки секторів з певної частини диска. Це робиться для збереження локальних даних у зоні на диску.

Мінусом локальності є те, що на диску може бути багато зарезервованих секторів. Але в одній зоні може вже не вистачати зарезервовану потужність. У цьому випадку поведінка залежить від прошивки. На одному диску ми спостерігали, що він переходить у стан FAILED та блокується, коли виникає помилка в частині, яка більше не захищена.


Як Ви визначили, що "було 2048 зарезервованих секторів для перерозподілу"?
AJ.

Можливо, 2047 рік - це максимальна кількість секторів, що надаються повторно. Один з моїх накопичувачів мав рівно 2047, коли викупили eBay для "нового", який становить 0x7FF, також b11,111,111,111. До 2048 року буде витрачено зайвий шматочок.
подарунок

2

Ви можете запустити тривалий самотест SMART, якщо він підтримує його. Це може дати вам більше інформації про стан накопичувача. Якщо ваш NAS не може цього зробити, і якщо ви можете витягнути накопичувач або вимкнути NAS протягом декількох годин, тоді ви можете зробити довгий самотест з жорстким диском, підключеним до іншої машини.



1

Різні виробники мають різні "прийнятні збитки" номери (така ж ідея, як і для моніторів і поганих пікселів). Зверніться до виробника приводів, щоб дізнатися, що таке їх стандарт.

Це виглядає як погана тенденція, хоча ...


-1

Western Digital особливо пишається технологією, яка відновлює поганий сектор у прийнятний час замість замороженого диска, розміщеного в RAID, його назвою TLER ( http://en.wikipedia.org/wiki/Time-Limited_Error_Recovery ). Час, як правило, 5..7 секунд.

Як я виявив, в Інтернеті є дисководи WD з вимкненою опцією, але деякі народи ввімкнули цю функцію на дешевих накопичувачах Green WD, а потім помістити їх у RAID.

Утиліта WDTLER видалена з сайту підтримки WD, але її можна легко виявити через Google.

PS Я використовую цю утиліту лише для читання статусу, і до цього часу я не використовую RAID :)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.