Середній час між відмовами - SSD


32

Середній час напрацювання на відмову , або MTBF, для цього SSD перераховано як 1,500,000годинник.

Це багато годин.1,500,000годин приблизно170 років. Оскільки винахід цього конкретного SSD є післягромадянською війною, то як вони знають, що таке MTBF?

Пара варіантів, які мають для мене сенс:

  • У Newegg просто друкується помилка
  • Визначення середнього часу між відмовами - це не те, що я думаю, що це таке
  • Вони використовують певний тип статистичної екстраполяції, щоб оцінити, якою буде MTBF

Питання:

Як отримується середній час між відмовами (MTFB) для SSD / HDD?


Відповіді:


34

Виробники накопичувачів визначають надійність своєї продукції з точки зору двох пов’язаних показників: річного коефіцієнта відмов (AFR), який становить відсоток дискових накопичувачів у сукупності, яка не виходить з тесту, що оцінюється до оцінки за рік; і середній час до відмови (MTTF).

АФР нового продукту, як правило, оцінюється на основі прискореного терміну експлуатації та стресових тестів або на основі польових даних попередніх продуктів. MTTF оцінюється як кількість потужності в годинах на рік, поділене на AFR. Поширене припущення для накопичувачів на серверах полягає в тому, що вони працюють на 100% часу.

http://www.cs.cmu.edu/~bianca/fast/

MTTF за 1,5 мільйона годин звучить дещо правдоподібно.

Це приблизно тест з 1000 дисками, які працюють протягом 6 місяців, і 3 диски виходять з ладу.
AFR буде (2 * 6 місяців * 3) / (1000 приводів) = 0,6% щорічно, а MTTF = 1 рік / 0,6% = 1460,967 годин або 167 років.

Інший спосіб поглянути на це число - це коли у вас є 167 накопичувачів і залишаєте їх працювати протягом року, виробник стверджує, що в середньому ви побачите один збій диска.

Але я очікую, що це просто постійний "випадковий" коефіцієнт механічних / електронних відмов.

Якщо припустити, що показники відмов відповідають кривій ванни , як згадується в коментарях, маркетингова група виробника може трохи помасажувати показники надійності, наприклад, не включаючи DOA'S (мертві по прибуттю, одиниці, які пройшли контроль якості, але не вдається, коли кінцевий користувач встановлює їх) та розтягує визначення DOA, щоб також виключити ті, що перебувають у ранньому сплеску відмови. А оскільки тестування не проводиться досить довго, ви також не побачите вікових ефектів.

Я думаю, що гарантійний термін є кращим показником того, як довго виробник очікує, що SSD прослужить!
Це точно не вимірюватиметься десятиліттями чи століттями ...


Пов’язана з MTBF - це надійність, пов'язана з кінцевою кількістю циклів запису, яку можуть підтримувати клітини NAND. Загальною метрикою є загальна ємність запису, як правило, в ТБ. Крім інших вимог до продуктивності, це один великий обмежувач.

Щоб дозволити більш зручне порівняння між різними виробниками та різними розмірами накопичувачів, витривалість запису часто перетворюється на щоденну ємність запису у вигляді частки ємності диска.

Якщо припустити, що накопичувач може жити до тих пір, поки він знаходиться під гарантією:
SSD об'ємом 100 ГБ може мати 3-річну гарантію та ємність запису 50 ТБ:

        50 TB
---------------------  = 0.46 drive per day write capacity.
3 * 365 days * 100 GB

Чим вище це число, тим більше підходить диск для інтенсивного запису вводу-виводу.
На даний момент (кінець 2014 р.) Серверні диски SSD мають значення 0,3-0,8 приводу на добу, середній діапазон стабільно зростає від 1-5, а високий клас, здається, має ракету з рівнем витривалості до запису до 25 * потужність приводу на день протягом 3-5 років.

Деякі тести в реальному світі показують, що іноді претензії постачальників можуть бути значно перевищені, але рух автомобілів, що перевищують ліміти постачальника, не завжди має на увазі підприємство ... Натомість купуйте правильно спеціальні диски для ваших цілей.


1
Зауважте, що перетворення з AFR в MTTF передбачає постійний AFR. Це явно не вірно для речей з рухомими частинами (наприклад, жорсткі диски), а може бути істинним для SSD.
Марк

Однозначно правда. У IIRC спостерігається ранній стрибок відмов, потім період низької недостатності, а потім стійке збільшення AFR зі збільшенням віку. Додайте мінливі фактори навколишнього середовища, і число реального світу стає значно більшим. Як згадував @Chris S, гарантійний термін може бути кращим показником з корисним впливом на реальний світ.
HBruijn

Хороший тверезий погляд на те, що 1'500'000 годин MTBF означає справді "Якщо у мене 1000 ssd, як у цього, 3, ймовірно, вийдуть з ладу протягом 6 місяців (деякі навіть раніше, ніж це) ...". +1 (і оскільки випробування закінчуються протягом короткого періоду, очікуйте, що термін їх служби не перевищить занадто велику гарантію ... "MTBF", ймовірно, сильно падає, коли ваш привід досягне років N)
Олів'є Дулак

1
@HBruijn Дякую за інформативну відповідь. Явище, про яке ви посилаєтесь (ранній стрибок відмови, період низьких відмов, а потім постійне збільшення відмов), описується кривою ванни .
OSE

19

На жаль, MTBF - це не те, про що думають більшість людей ...

  • Це не так як довго триватиме окремий привід.

    Виробники очікують, що їх накопичувачі прослужать до тих пір, як гарантія, після цього це справді не їхня проблема. Старі жорсткі диски з електромагнітними пластинами захоплюватимуться через 10 років. Інтегральні схеми тривають надзвичайно довго, але інші компоненти (зокрема конденсатори) зношуються після дещо передбачуваної кількості циклів.

  • це є , як багато хто з цих дисків ви повинні очікувати , 1 диск потерпіти невдачу щогодини.

    Як зазначають інші, виробники роблять різні випробування протягом розумного періоду часу та визначають рівень відмов. У таких видах тестів є досить велика дисперсія, і маркетинг часто має "внесок" щодо того, яким повинен бути кінцевий номер. Незалежно від того, що вони доклали найкращих зусиль, скільки дисків знадобиться для середнього провалу на годину.

    У ситуаціях із меншими накопичувачами можна зробити статистичну ймовірність виходу з ладу на основі MTBF, але майте на увазі, що відмови у добре розроблених продуктах повинні слідувати кривій "ванни" - тобто більш високі показники відмов, коли пристрої спочатку вводяться в експлуатацію та після їх гарантійний строк закінчився, з нижчими показниками відмов між ними.


2

Вони виходять із статистичної оцінки, заснованої на невеликому розмірі вибірки та короткому проміжку часу. Загальноприйнятого методу чи процесу насправді немає, тому це справді просто дурний "маркетинг".

Ця стаття може пояснити це трохи більше. І Вікіпедія є деякі формули, які можуть бути те, що ви шукаєте?

По суті, майже для всього (включаючи загальні побутові машини, такі як посудомийна машина) декілька виробів запускаються протягом X часу. Скільки відмов трапляється за цей період, використовується для обчислення MTFB.

Звичайно, неможливо запускати продукти протягом усього життєвого циклу, тобто SSD, який триватиме довго. Вони здебільшого обмежені кількістю записів, а не механічними пошкодженнями (для чого призначений MTFB)


2

Погана новина про MTBF полягає в тому, що загальна методика оцінки передбачає рівномірно розподілене навантаження запису серед усіх комірок NAND. Але комірки згруповані в кластери, і коли одна одна комірка виходить з ладу - цілий кластер позначається як мертвий і замінюється новим із резерву. Зазвичай резерв становить близько 20% від обсягу SSD. Коли запас буде вичерпаний, весь SSD буде позначений як мертвий.

IRL SSD містить стійкі дані, а також нестабільні. Уявіть, що у вас 90% SSD заповнені статичними даними, а 10% відпочинок знаходиться під великим навантаженням на запис. Контролер SSD розподіляє навантаження серед доступних вільних кластерів. Ці 10% вичерпують їх термін експлуатації в 10 разів швидше, ніж ви оцінили. Вони будуть замінюватися з резерву знову і знову до кінця.

У справді поганому випадку, коли стійкий / мінливий обсяг даних становить 30: 1 або більше, наприклад - купа фотографій та відносно невелика база даних для популярного веб-сайту, ваш SSD загине через рік.

Один з моїх клієнтів був дуже вражений характеристиками SSD і наполягав на обладнанні його СУБД-сервера парою. У наступні 12 місяців ми двічі замінили їх обох.

Але відповідно до маркетингових матеріалів тривалість життя SSD становить 170 років. Звичайно.


1

MTBF не має значення для вимірювання стійкості накопичувача SSD, оскільки SSD не чутливий сам час, як звичайний обертовий жорсткий диск, а кількість повторних записів для комірок SSD. Більш релевантним заходом для SSD є запис на диску в день (DWPD) . Наприклад, деякі корпоративні SSD-диски класу 3,2 ТБ витримали б 3 DWPD протягом 5 років.

Деякі рази постачальник SSD забезпечує витривалість у перерахунку на (Total) Terabytes Written (TBW) або "Цикли запису", які можна легко перевести на DWPD і навпаки, знаючи час та максимальну пропускну здатність для даного SSD-накопичувача.

Для наведеного прикладу з 3,2 Тб SSD накопичувачем:
TBW = DriveSize * Роки * DWPD;
TBW = 3,2 ТБ * 5 * 365 * 3d = 17520 ТБ протягом 5 років

Якщо накопичувач забезпечує 80 Мбіт в секунду стійкої пропускної здатності запису, тоді
WriteCycles = DWPD * Роки;
WriteCycles = 3 * 365 * 5 = 5475 загальних циклів запису для даного диска

Що важливо помітити, ми обчислюємо найгірший випадок, якщо ви забезпечите 100% пропускну спроможність для накопичувача (що, швидше за все, неможливо).

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.