що саме є URE?


14

Останнім часом я розглядаю RAID5 VS RAID6 і постійно бачу, що RAID5 вже недостатньо захищений через рейтинги URE та збільшення розміру накопичувачів. В основному, більшість знайденого мною вмісту говорить про те, що в RAID5, якщо у вас є збій диска, якщо решта вашого масиву становить 12 ТБ, ви маєте майже 100% шанс зустріти URE і втратити свої дані.

Цифра 12 ТБ походить від того, що диски оцінюються в 10 ^ 14 біт, прочитаних, щоб досягти одного URE.

Що ж, є щось таке, чого я тут не отримую. Зчитування робиться головою, що переходить на сектор, а читання може призвести до невдачі - або голова вмирає, або сектор гине. також може бути так, що читання не працює з якихось інших причин (я не знаю, як вібрація зробила стрибки голови ...). тож, дозвольте мені вирішити всі 3 ситуації:

  • читання не працює: це не піддається відновленню, правда? це можна спробувати ще раз.
  • голова помирає: це, безумовно, було б не підлягає відновленню, але це також означає, що повна блюдо (або принаймні сторона) було б нечитабельним, це було б тривожніше, ні?
  • сектор гине: так само повністю не піддається відновленню, але тут я не розумію, чому диск 4 ТБ оцінюється на 10 ^ 14 для URE, а 8 ТБ так само оцінюється в 10 ^ 14 для URE, це означатиме сектори на 8 ТБ (швидше за все, новіші технології) наполовину надійніші, ніж у 4 ТБ, що не має сенсу.

Як бачите, із 3-х точок відмови, які я визначаю, жодна не має сенсу. Отже, що конкретно є URE, я маю на увазі конкретно?

Хтось може мені це пояснити?

Редагуйте 1

Після першої хвилі відповідей, мабуть, причина - невдача сектору. Добре те, що вбудована програма, контролер RAID та файлова система OS + мають створені процедури для раннього виявлення цього та перерозподілу секторів.

Ну, я тепер знаю, що таке URE (насправді, назва цілком зрозуміла :)).

Мене все ще спантеличують основні причини та переважно стабільна оцінка, яку вони дають.

Деякі віднесли невдалий сектор до зовнішніх джерел (космічних хвиль), я тоді здивований, що коефіцієнт URE тоді заснований на рахунку читання, а не на віці; космічні хвилі дійсно повинні впливати на більш старий диск просто тому, що він був підданий більше, я думаю, що це більше фантазія, хоча я можу помилятися.

Тепер з’являється інша причина, що стосується зносу диска, і деякі вказували на те, що більша щільність дає слабкіші магнітні домени, що абсолютно має сенс, і я б дотримувався пояснення. Але, як це добре пояснено тут , нові диски різного розміру отримують здебільшого, поміщаючи в шасі жорсткого диска більше або менше тієї ж пластини (а потім такої ж щільності). Сектори однакові і всі повинні мати однакову надійність, тому більші диски повинні мати вищу оцінку, ніж менші диски, сектори читаються менше, це не так, чому? Це хоч би пояснило, чому нові диски з новішими технологіями отримують не кращий рейтинг, ніж старі, просто тому, що кращий приріст техніки компенсується втратами через більшу щільність.


"URE і втратити ваші дані" afaik (і я можу помилитися), URE означає лише те, що деякі дані втрачені, а не всі - і ви можете спробувати відновити знову після натискання на URE. Тим не менш, рейд 10 або zfs є свого роду там, де це в наші дні.
Sirex

1
" сектори [на нових дисках] наполовину надійніші, ніж [на старих], що не має сенсу " Я не впевнений, що згоден. У міру того, як магнітні зони стають все меншими (що передбачає більш високу щільність даних у пакеті одного розміру), це дуже розумно, що вони стають все більш чутливими до випадкового стирання (локальні випромінювання гамма-випромінювань, події космічних променів тощо). Ця зростаюча сприйнятливість сучасних накопичувачів - це те, чому ніхто з нас не розгортає диски без RAID в чомусь важливому, і одна з причин, чому більшість з нас відмовилися від RAID-5.
MadHatter


Справжня проблема тут полягає в тому, що занадто багато масивів RAID перетворюють один URE в помилку цілого масиву. Один URE повинен спричинити втрату одного блоку RAID. Нехай файлова система з'ясує, якщо цей блок навіть використовувався, швидше за все, це не має значення.
MSalters

1
@Мес ні, номери скасовуються. Удвічі більше секторів також вдвічі більше можливостей для відмов, тому однаковий показник помилок читання дорівнює одній і тій же надійності на байті. Ось чому він використовується в першу чергу.
варення

Відповіді:


13

URE - це непоправна помилка читання. Сталося щось, що спричинило збій читання сектора, що привід не може виправити. Електроніка накопичувача є складною, вони передаватимуть дані лише в тому випадку, якщо вони змогли їх правильно прочитати з диска. Електроніка приводу намагатиметься кілька разів прочитати поганий сектор, перш ніж оголосити його пошкодженим.

Що спричиняє помилку читання - я тут не фахівець (махає рукою), але старість приводу може спричинити допущення до виробництва. Магнітні домени можуть ослабнути. Космічні промені можуть завдати шкоди тощо. По суті це випадковий збій.

Як це впливає на RAID 5?

RAID 5 складається з блочного рівня чергування з розподіленою парністю. Блоки парності обчислюються шляхом збиття бітів з блоків даних разом. Функція XOR в основному говорить, якщо всі біти однакові, результат дорівнює 0, інакше це 1. При обчисленні паритету ви берете перші 2 біти і XOR їх, то XOR результат з наступним бітом і так далі, наприклад

1010   data      or    1010 data
1100   data            1100 data
0110   parity          0011 data
                       0101 parity

Характер функції XOR такий, що якщо будь-який диск вмирає і замінюється, дані, які повинні бути на ньому, можна реконструювати з решти дисків.

1010  data       or    1010 data
      damaged               damaged
0101  parity           0011 data
                       0101 parity

Як ви бачите, пошкоджені дані можна реконструювати за допомогою XORing решти даних і паритету.

Як URE впливає на це?

URE є важливим лише під час відновлення RAID 5.

Коли ви реконструюєте RAID 5, слід прочитати велику кількість читання. Кожен блок даних повинен бути прочитаний, щоб відновити дані на новому диску. Якщо виникає URE, то дані відповідного блоку неможливо відновити, тому ваші дані несумісні. Для досить великих дисків з досить великим R5 кількість бітів, прочитаних для реконструкції заміненого диска, перевищує значення URE, наприклад, 1 біт на 10 ^ 14 зчитування.


2
Одиночний 8 Тб диск має більш ніж 6 * 10 ^ 13 біт на, так і з просто три таких дисків в RAID-5, А URE є більш ймовірним , що не під час реконструювати. О, і +1 від мене.
MadHatter

3
Твердження (написане у запитанні, в деяких відповідях та коментарях, а також в інших запитаннях, фактично по всьому Інтернету), що після читання 12 ТБ помилка читання майже впевнена, є помилковою. Не вірите? Не варто. Знай це. Прочитавши 12 (або більше) туберкульозу з будь-якого з ваших дисків і помітивши, що жодної помилки не сталося. Будь ласка, зробіть це і припиніть цей міф. Дякую.
Давид Балажич

1
@IanKemp Ні, це не так. Я спробував це. Ви, очевидно, цього не зробили. (також, кращий рейтинг просто трохи
Девід

1
@ DavidBalažic Очевидно, що ваш вибірковий розмір одного збиває з себе всю сутність теорії ймовірностей! Я пропоную вам подати документ до Нобелівського комітету.
Ян Кемп

1
@IanKemp Якщо хтось стверджує, що всі числа діляться на 7, і я знаходжу ОДНЕ, що це не так, то так, одна знахідка може визнати недійсною всю теорію. До речі, ще жодна людина не підтвердила міфу на практиці (експериментом), чи не так? Навіщо їм, коли віра - це більше, ніж знання ...
Девід

9

Отже, що конкретно є URE, я маю на увазі конкретно?

Жорсткі диски не просто зберігають дані, про які ви їх запитуєте. Через постійно зменшуються розміри магнітних доменів і той факт, що жорсткі диски зберігають дані аналоговим, а не двійковим способом (вбудована програма жорсткого диска отримує аналоговий сигнал із тарілки, який переводиться на двійковий сигнал, і цей переклад є частина секретного соусу виробника) практично завжди є деяка ступінь помилки в прочитанні, яку необхідно компенсувати.

Щоб переконатися, що дані можуть бути прочитані назад, на жорсткому диску також зберігаються дані про виправлення помилок разом із тими, про які ви попросили їх зберігати.

При звичайних операціях даних FEC достатньо для виправлення помилок у сигналі, який зчитується з тарілки. Потім прошивка може реконструювати вихідні дані, і все добре. Це відновлена ​​помилка читання, яка виявляється в SMART як атрибут швидкості читання (атрибут SMART 0x01) та / або відновлено апаратне ECC (атрибут SMART 0xc3).

Якщо з якоїсь причини сигнал деградує нижче певної точки, даних FEC більше не вистачає для реконструкції вихідних даних. Після цього, теорія іде, прошивка все ще зможе виявити, що дані не можна надійно прочитати, але вона нічого не може з цим зробити. Якщо кілька таких зчитувань не вдається, диск повинен якось інформувати решту комп'ютера про те, що зчитування не вдалося виконати успішно. Це робиться шляхом подання сигналу про непоправну помилку читання . Це також збільшує лічильник повідомлених нерегульованих помилок (атрибут SMART 0xbb).

Невиправна помилка читання або URE - це просто звіт про те, що з будь-якої причини дані корисного навантаження плюс дані FEC були недостатніми для відновлення спочатку збережених даних.

Майте на увазі, що коефіцієнти URE є статистичними . Ви не зіткнетеся з жодним жорстким диском, де ви зможете прочитати рівно 10 ^ 14 (або 10 ^ 15) - 1 біт успішно, а потім наступний біт вийде з ладу. Скоріше, це заява виробника, що в середньому , якщо ви прочитаєте (скажімо) 10 ^ 14 біт, то в якийсь момент під час цього процесу ви зіткнетесь з одним нечитабельним сектором.

Крім того, дотримуючись останніх кількох слів вище, пам’ятайте, що ставки URE наведені у вигляді секторів за прочитаними бітами . Через те, як дані зберігаються на тарілках, диск не може визначити, яка частина сектора є поганою, тому якщо сектор не виконає перевірку FEC, то весь сектор вважається поганим.


Гаразд, тому, схоже, це вказує на провал сектору. Я повністю отримую статистичні речі, не хвилюйтесь. Я також бачу тут, що надійність сектора зменшується в міру збільшення щільності, але це все ще не має сенсу. Нові диски зазвичай мають однакову щільність блюд незалежно від фізичного розміру, у 4 ТБ буде менше планок, ніж у 6 ТБ. В основному сектори однакові, тому чому 8TB не в змозі досягти статистично вищого значення, їх секторів удвічі більше, тому кожен читається вдвічі менше (статистично). вони повинні тоді менше вийти з ладу, ні?
Меми

3

сектор гине: так само повністю не піддається відновленню, але тут я не розумію, чому диск 4 ТБ оцінюється на 10 ^ 14 для URE, а 8 ТБ так само оцінюється в 10 ^ 14 для URE, це означатиме сектори на 8 ТБ (швидше за все, новіші технології) наполовину надійніші, ніж у 4 ТБ, що не має сенсу.

Специфікація зазвичай "в середньому виявляється 1 помилка під час зчитування n біт", тому розмір диска не має значення. Має значення, якщо ви обчислюєте свій ризик того, що на вашому приводі та навантаженні буде помилка, але виробник заявляє лише, що для виявлення помилки (в середньому, не гарантовано) потрібно n біт, прочитаних.

Приклад: Якщо ви купуєте накопичувач 1 ТБ, вам доведеться прочитати його приблизно 12 разів, щоб знайти помилку, тоді як накопичувач 8 ТБ може відчути його при другому читанні - але кількість прочитаних бітів однаково обидва рази, тому якість магнітних шпинделів приблизно однакові.

За що ви платите за підвищення ціни - це інші фактори, здатність набитися на 8 ТБ у фізичному просторі на 1 ТБ, значно знизити споживання енергії, менше втрат на голові під час переміщення приводу тощо.


0

Я думаю, що @Michael Kjörling чітко відповів.

Коли диск зчитується, голова виявляє напрямок магнітної області, потім висилає якийсь електронний сигнал, який є аналогом. Ми припускаємо, що вбудована програма повинна дати 1, коли вона отримує напругу вище 0,5 В, але магнітне поле занадто слабке, тому голова надсилає сигнал лише з 0,499 В, зіткнулася помилка. Нам потрібен FEC, щоб виправити цю помилку.

Ось приклад: дані сектора повинні бути 0x0F23, ми кодуємо їх 0 * 1 + F * 2 + 2 * 3 + 3 * 4 = 0x30. тепер ми отримуємо FEC і пишемо його після сектору. Коли ми читаємо, ми читаємо 0x0E23 і FEC 0x30, це не відповідає. Після деяких підрахунків ми виявили, що це має бути 0x0F23. Але якщо ми отримали 0x0E13 і 0x30, АБО ми отримали 0x0E23 і 0x32, ми не можемо обчислити правильний.

Цей рейтинг настільки низький, можливо, якщо виробник HDD не зчитував PB, коли-небудь дані EBs могли отримати стабільне значення. Тому вони видають значення ймовірності: коли ви читаєте 10 ^ 14 бітові дані, ви можете стикатися одного разу. Оскільки це значення ймовірності, можливо, ви сприяли після того, як прочитали лише 1 сектор даних, можливо, ви стикалися, поки не прочитали дані 50TB. І це значення не мало нічого з ємності диска, воно лише стосується випадкових розмірів даних, які ви читаєте. Якщо ви прочитаєте 4TB диск, повний даних 6 разів, цей шанс буде дорівнює читання 6TB диска 4 рази або 8TB диска 3 рази.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.