Високий показник відмов великих приводів?


24

Нещодавно я розгорнув сервер з 5-кратними 1 ТБ накопичувачами (про їхню марку я не згадую, але це був один із великих двох). Мене спочатку застерігали від отримання накопичувачів великої ємності, тому що друг порадив мені, що у них дуже низький MTBF, і мені було б краще отримати більше, приводи меншої ємності, оскільки вони не "підштовхуються до межі" з точки зору того, що технологія може впоратися.

Відтоді три з п’яти дисків вийшли з ладу. На щастя, мені вдалося замінити і відновити масив до того, як наступний диск не вдався, але це мене дуже переживає.

Які ваші думки? Я щойно отримав їх у поганій партії? Або нові диски з більшою ємністю мають більше шансів вийти з ладу, ніж випробувані диски?


2
Чому б не згадати про бренд? Я думаю, ваша партія склала 7200,11 куд, які, як відомо, мають тенденцію до ранньої смерті.
Дані

Насправді, це були західні дигіталі ...
Марк Хендерсон

Тільки для запису, я забрав їх усіх назад і отримав усі нові, і вони вже два місяці працюють без проблем.
Марк Хендерсон

У мене був подібний досвід. 16 накопичувачів 1,5 ТБ. У перші 4 місяці 4 важких не вдалося. У наступні три роки одне програмне забезпечення вийшло з ладу.
Девід Шварц

Відповіді:


19

Ви, мабуть, отримали погану партію. Мені нервує розгортання масивів, побудованих з дисків з тієї ж партії з цієї причини - вони, ймовірно, мають схожий термін служби, що робить заміну потенційно дуже захоплюючою, коли не вдасться.

Не виключено, що з накопичувачами є якісь дефекти дизайну, це безумовно було раніше; однак, як правило, в Інтернеті багато скарг на накопичувач, якщо з ним дійсно щось не так, на відміну від звичайного фонового шуму, який ви знайдете про що завгодно.


6
+1 Спробуйте або зменшити покупки, отримати джерела від різних торговців або змішати торгові марки, щоб полегшити це.
Роб Аллен

Або ви можете пом'якшити це, спалюючи накопичувачі, які виводяться з того самого місця одночасно. Запускайте проти них інтенсивну програму протягом декількох годин / днів; великі тривалості для імітації різного старіння. Я створив просту програму під назвою DriveTest, яка записує дані psuedo-випадкових даних, а потім зчитує їх і перевіряє, щоб "записати" і зробити простий тестовий стіл одночасно. Ця порада не рекомендується використовувати для SSD-дисків.
rkagerer

13

На це складний питання відповісти, якщо у вас немає ресурсів великої організації. Перегляньте дослідження Google щодо несправності на жорсткому диску .

Роблячи значну покупку дисків, я визначу розмір грубого диска з найнижчою вартістю за байт, який, як правило, на покоління старше останнього. Це має сенс, що вони покращать надійність цього покоління.


1
1,5 до 2 ТБ - це кров'яна кров прямо зараз, тож чи не відповідає 1 ТБ вашим критеріям? Вони досить дешеві.
Марк Рансом

Дуже хороший момент.
Нокс

10

Більше блюд + більше головок дорівнює більшому шансу невдачі.

Візьміть два поширених жорстких диска WD

640 ГБ = два тарілки
1 ТБ = три тарілки

    WD Black 640GB vs 1TB comparison

Drive Ready Time 11 sec  13
R/W Power watts  8.3     8.4
Idle Power watts 7.7     7.8
Standby watts    1       1
Max shock        300g    250g
Performance seek 29      33
Quiet seek       26      29

Цей додатковий блюд = більше шуму, більше споживання електроенергії, більше тепла, більш повільний час готовності приводу, більш чутливі до пошкоджень та більше вібрацій.

Якби вони зробили однакову конструкцію приводу лише на одній тарілці, вони мали б ще кращі характеристики. У цьому випадку це накопичувачі споживчих класів, але вони є накопичувачами високого класу з подвійним кешем та 5-річною гарантією. Ви побачите подібну математику, якщо уважно ознайомтеся з документацією на будь-яку марку чи стиль традиційного жорсткого диска (прядильні блюда). Це суто питання фізики, що більше блюд робить привід менш надійним.

Джефф Хенгесбах теж мав рацію, коли сказав

Основна проблема, що стосується "великих" дисків, - це час відновлення, коли виникає збій. Чим більший накопичувач, тим довше відбудова, тим більше вікно для додаткової несправності накопичувача та можливої ​​втрати масиву. З "великими" накопичувачами ділова цінність наявності повинна визначати рівень прийнятного ризику (втрата масиву), який сприятиме вашому вибору рівня RAID та кількості приводів (більше приводів = більше шансів виходу з ладу).

додати в невелику дозу Graeme Perrow

Привід з п'ятдесят мільйонів секторів має в десять разів більше шансів мати поганий сектор, ніж привід з п'ятьма мільйонами секторів. Я припускаю, що рівень відмов серед великих і малих приводів тут однаковий, що, мабуть, не є хорошим припущенням

Більше блюдців = погано
Більше місця для зберігання - мішана сумка. Плюсів і мінусів у цьому багато.
Більше секторів справді більше шансів на помилки. Не обов'язково лінійний за масштабом, але, безумовно, фактор.

Якщо вам не потрібен простір більше, ніж надійність, я б запропонував дотримуватися приводів на одних плат чи подвійних плат. Потрібні дослідження, а в деяких випадках і удача дізнатися, що ви отримаєте при замовленні накопичувачів, оскільки деякі виробники не тільки уникають публікації кількості тарілок, вони можуть продати більше одного диска під тим же номером деталі.

Візьмемо для прикладу WD3200AAKS, є версія 320GB на одній тарілці та версія 320GB з подвійною пластиною (160GB x 2). На додаток до цього використовується декілька етикеток та кожухів накопичувачів, тому ви не можете легко подивитися на привід і знати, яка тарілка знаходиться всередині. Єдиний спосіб дізнатися - це пошук в Інтернеті, щоб дізнатися, що WD3200AAKS-00B3A0 та WD3200AAKS-75VYA0 розповідають, що таке блюдо, але жоден роздрібний продавець не скаже, що ви отримаєте.


1
Ого. Це якісь глибокі речі! Спасибі! Я раніше навіть не розглядав кількість рухомих деталей (тарілок).
Марк Хендерсон

3

Я вважаю, що вищий за показник рівень відмов свідчить про будь-яку нову технологію. Мені завжди говорили ніколи не купувати автомобіль першого модельного року, чекати, поки вони не виправлять помилок. Я б сказав, що те ж саме, мабуть, справедливо і для багатьох інших речей, включаючи жорсткі диски.


1
Я можу засвідчити всю аналогію автомобіля (аналогії автомобілів ніколи не збиваються, чи не так?). Я визнаю, що я поспішав і зовсім не дослідив це належним чином, і я плачу ціну зараз!
Марк Хендерсон

3

Я не впевнений, що справедливо сказати, що "великі" диски мають вищу MTBF чи ні. У мене є велика система імен з кількома накопичувачами 750 Гб, і за останні 2+ роки жоден не вийшов з ладу (750 років було "великим" 2 роки тому). Але я також знаю велику систему імен, яка була побудована тоді, коли 250 ГБ було великим, і цей масив зменшився в кілька разів. Дебати на MTBF - це щось святе.

Основна проблема, що стосується "великих" дисків, - це час відновлення, коли виникає збій. Чим більший накопичувач, тим довше відбудова, тим більше вікно для додаткової несправності накопичувача та можливої ​​втрати масиву. З "великими" накопичувачами ділова цінність наявності повинна визначати рівень прийнятного ризику (втрата масиву), який сприятиме вашому вибору рівня RAID та кількості приводів (більше приводів = більше шансів виходу з ладу).

За останні кілька років бізнес SATA / RAID розвивався. Я не думаю, що великі імена пропонують це, якби вони знали, що це буде головним питанням підтримки чи відстороненням клієнта. Мені буде цікаво дізнатись про вашу надійність, коли ви замінили частину оригінальної партії.


1

Вони всі на одному комп'ютері чи дисковому контролері? Ви сказали, що вам доведеться відновити масив. Якщо це так, то, можливо, щось не вдається з контролером, джерелом живлення або пам'яттю . Якщо ні, то я б також здогадався про несправну партію накопичувачів. Також може виникнути проблема сумісності з будь-якими конкретними накопичувачами, які ви використовуєте з цим конкретним контролером.

Крім того, мені цікаво, коли люди кажуть, що на великих дисках вищий MTBF, як це обчислюється. Скажімо, у вас є диски 2x250 GB та 1x500 GB. Можливо, це наївно, але хіба привід, який має два рази більше, не мав би більше даних, з якими він може вийти з ладу? Я думаю, я не знаю, чи включає MTBF будь-який непрочитаний чи неправильний текст, або якщо це означає, що диск стає механічно зламаним. Хтось знає, чи існує жорсткий галузевий стандарт та визначення MTBF для жорстких дисків?


1

Ось декілька речей, які я хотів би перевірити: 1) Чи є порядкові номери на накопичувачах досить близькими? Якщо так, у вас може виникнути несправна партія. 2) Яке середовище живе у вашому сервері? Чи були у вас проблеми з іншим обладнанням, що вийшли з ладу останнім часом? 3) Чи буває накопичувачами це диски Seagate Barracuda? З цими накопичувачами є проблеми. Дивіться цю статтю про комп'ютерний світ у . 4) Чи були ці накопичувачі частиною системи? чи ти їх купував сам? Якщо ви купили накопичувачі OEM, немає жодного способу забезпечити обережність з дисками, перш ніж придбати їх.

Я особисто мав неймовірну удачу з жорсткими дисками. У мене тільки два диски вийшли з ладу. Тільки одна з цих відмов була на диску, якою я фактично користувався. Однак я навколо бачив, як багато людей втрачають дані на жорстких дисках.


Хм, так, вони всі дуже близькі, але вони були WD, а не Seagates, і так, вони були приводами ОЕМ ... кілька речей, які я там не розглядав ...
Марк Хендерсон

1

Більш високий показник відмов великих приводів може бути просто функцією від розміру накопичувачів. Привід з п'ятдесят мільйонів секторів має в десять разів більше шансів мати поганий сектор, ніж привід з п'ятьма мільйонами секторів. Я припускаю, що показник відмов серед великих та малих дисків тут однаковий, що, мабуть, не є хорошим припущенням - як хтось ще сказав, факт, що терабайтні накопичувачі все ще відносно нові, вони, ймовірно, мають більш високий показник відмов почати з.

У вашому випадку це просто звучить як погана партія накопичувачів.


1

Якщо ви придбали всі диски одночасно з того самого місця, цілком можливо, що всі вони надходять із однієї партії iffy.

При збиранні масиву RAID я зазвичай рекомендую трохи змішати накопичувачі, тобто суміш виробників або принаймні диски різних постачальників (щоб зменшити ризик того, що всі накопичувачі будуть з однієї поганої партії).

Ще одна рекомендація, яку я хотів би зробити, це використовувати по можливості менші накопичувачі (тобто у вас є фізичний простір для портів накопичувачів і контролерів, щоб їх вивісити), тому замість RAID 1 обсягу або двох 1Tb накопичувачів є RAID 10 з чотирьох одиниць 500Gb. Таким чином, коли накопичувач поганий, ви лише відновлюєте менший масив, який є частиною більшого масиву, замість того, щоб перебудувати весь масив (скорочуючи тривалість часу, протягом якого масив не є повним), а також він пропонує трохи більше надмірності (у чотирьох з шести сценаріїв "два диски виходять з ладу" відразу 4-накопичувальний масив RAID10 буде жити). Ви можете зробити те ж саме, комбінуючи менші масиви R5 в масив R50, якщо це підтримується вашим RAID-контролером / програмним забезпеченням.

Можливо, я занадто параноїдальний, але я б насторожено довіряв 1 Тб даних на одному диску, навіть якщо цей диск є частиною зайвого масиву.

Очевидно, що у грі є фізичні обмеження, які можуть зробити цю техніку недоцільною для вас, обмеження живлення теж обмежує, так що YMMV. Як "наприклад", коли масив чи масиви не є практичними: я б швидше мав чотири диски як R10 на одному з наших серверів замість великих дисків в масиві R1, але фізично він не має місця , купівля / складання зовнішнього масиву виходило з бюджету, і ми не могли використовувати простір на існуючому масиві, оскільки дані повинні були зберігатися фізично окремо від усіх інших даних через вимоги захисту даних.


1

Хтось дуже детально вивчив цю проблему великих приводів. Це пов'язано з тим, що частота помилок бітів залишається постійною, навіть незважаючи на те, що розмір накопичувача збільшився, а також більше часу, необхідного для відновлення великих дисків. Вони поєднуються, щоб перетворити другий збій під час перебудови дуже в області реальності. Я б хотів отримати 500 Гбіт або менші диски на RAID-масивах.


1

Завжди використовуйте жорсткі диски меншої ємності для виробничого використання. Ніколи не перевіряли фізику за нею, але менші диски, як правило, ламаються рідше. Ось що мені завжди говорили.


0

Чи створили ви масив з дисками з тієї ж партії та всіх, що постачалися від одного постачальника? Мені сказали, що це погано робити ...


0

Розглянемо RAID-6. Шанс сильної помилки читання під час реконструкції RAID-5 дуже реальний. Або RAID-Z із ZFS.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.