Шукаєте фактичний досвід виходу з ладу приводу RAID 5 2? [зачинено]


15

Мені цікаво, чи є у когось особистий досвід виходу з ладу RAID 5 2 з великими накопичувачами?

Наскільки я розумію, теорія полягає в тому, що при великих накопичувачах 1-2 ТБ, якщо один накопичувач виходить з ладу в наборі рейдів, він повинен відновити все, тому, таким чином, ударить по всіх інших дисках дуже важко, і шанс на інший збій зростає, особливо, якщо приводи були з тієї ж партії виготовлення. І якщо ви втратите інший диск, ви втрачаєте всі дані.

Зазвичай це пояснюється після твердження "RAID не створює резервну копію", з яким я згоден.

Теорія цього має сенс, і я це розумію, але чи справді це відбувається?


На жаль, ми щойно отримали нове запитання із досвідом цього життя. :( superuser.com/questions/516844/…
Геннес

Відповіді:


15

Так, у мене це сталося зі мною. Набір з 4-х дискових приводів WD 500 вийшов погано протягом тижня. Я повільно замінив перший, і не взяв масив в автономному режимі, і втратив усі свої дані, коли другий не вдався. Я повторно використав решту двох хороших, і одне з них вийшло з ладу протягом наступного місяця. Всі вони були належним чином охолоджені та доглядали. Я можу лише сказати, що зараз я вважаю риторику «поганої партії».

В окремому випадку у мене було 3 окремі приводи різних моделей, і моделі виходили з ладу протягом місяця один від одного, хоча я впевнений, що причина їх виходу була з-за неправильної вентиляції. Не готуйте свої диски!


3
Як наслідок, майте запасне сидіння навколо, коли привід погано працює. Крім того, остерігайтеся мовчазної корупції ... втратити дані на диску, який лише прикидається, працює легко.
Пол Макміллан

Це ще одна причина, що не слід встановлювати накопичувачі, які є з однієї партії в масиві RAID - вони співвідносили часи відмов (знаєте, як ставки за замовчуванням траншованих заставних цінних цінних паперів на субпріймах).
Ендрю Мао

4

Це насправді трапилося зі мною, хоча це був насправді не найпоширеніший спосіб, коли диск не зможе. У мене було 4 500gb зовнішніх накопичувачів sata в рейді 5. Вони були прикріплені до дешевого старого сервера, встановленого на стійці IBM. Вся установка була запряжена під сходами, і одного дня, або щур, або зайчик, але щось пережовувало через якісь силові кабелі та 2 приводи були затримані. Всі диски були у дешевих зовнішніх кожухах, тому я здогадуюсь, я не повинен був так дивуватися.


3

Ви питаєте, чи можете ви втратити 2 диски назад до спини? Звичайно, все може статися. Raid 5 дозволяє підвищити доступність та ефективність доступу до даних, але рейд 5 нічого не створює. Це просто допомагає запобігти використанню ваших даних через втрату апаратного забезпечення одного накопичувача. Це не копія ваших даних. Ви не можете відновити стару копію, стару версію або просто копію вашої поточної роботи. Також не захищає від корупції даних. Є більше речей, які можуть піти не так, ніж просто втратити драйв. Вірус може зіпсувати всі ваші дані, маленька сестра любить дивитися, щоб смітник на вашому робочому столі стає повноцінним і порожнім, коли вона кидає в нього файли, дурний друг кидає соду на вашу машину тощо.

Також пам’ятайте, що ви можете втратити рейдер на жорсткому диску. І ви не можете просто перемістити масив до іншого випадкового контролера. Ви нормально повинні використовувати саме таку саму, і все-таки щось може піти не так. Деякі контролери рейду зберігають інформацію на борту, а інші надсилають інформацію про конфігурацію до доданого масиву. Це азарт, коли виникає така ситуація.

Те саме питання в SF: /server/2888/why-is-raid-not-a-backup

Вам потрібно більше причин?

EDIT: Ваша ідея правильна і може трапитися з будь-ким. Я особисто не бачив більше, ніж один привід вийшов з ладу, але я бачив, як деякі гинуть насправді близько. Жоден з них не був у тому вікні перебудови, але це технічно ризик. Але у вас є резервна копія, якщо щось трапиться правильно? ха-ха. Деякі люди іноді навчаються на цьому важкому шляху. Raid 6 піднімає його на наступний рівень з подвійним паритетом і може втратити до 2 приводів. При будь-яких налаштуваннях рейду поширеність відмови збільшується з розміром (# дисків) та складністю масиву. Більше приводів = більше точок можливого виходу з ладу


вибачте, я все це розумію, просто запитую, чи трапилося це з кимсь і яким був сценарій?
Брайан

3

Ви маєте рацію, в сценарії RAID-5, якщо ви втратите один диск і потім відновите його, система повинна успішно прочитати кожен сектор усіх збережених накопичувачів у наборі RAID. NetApp стверджує, що в деяких ситуаціях (вони можуть робити набори RAID до 28 дисків деяких видів) шанси потрапити на другий збій можуть становити до одного десятого. Таким чином, вони роблять "подвійний паритет", який, на мою думку, пов'язаний з RAID-6.

Очевидно, що чим більше дисків у наборі RAID, і чим вони більше, тим більше шансів на те, що виникне проблема. Для невеликого набору RAID (3-5 дисків) шанси, ймовірно, не надто зрушили проти використання RAID-5.

Але я завжди роблю Raid-DP на NetApps, де можу.


+1 Я ніколи не замислювався над фактом "повинен успішно прочитати кожен сектор усіх збережених приводів".
AaronLS

2

Ніякого особистого досвіду, але я слухав крики тих, хто це стався з ними. Будь-яка система зберігання даних - будь то один накопичувач, USB-ключ, касета, величезна установка RAID або Amazon S3 - врешті-решт не вдасться будь-яким чином незручним для вас. Другий збій під час відновлення набору RAID 5 - це лише один із способів цього статися.

На додаток, підтримка RAID з трьома парностями була інтегрована в OpenSolaris пару днів тому - тому принаймні один постачальник вважає, що допускати два додаткових збої під час відновлення паритету RAID варто інженерних зусиль.


1

Це насправді відбувається насправді. Ось чому рішення для зберігання NetApp мають реалізацію RAID 6. Це на випадок, якщо ви втратите другий привід під час відновлення.

Ви можете обчислити ймовірність збою за допомогою стандартних формул, наведених на тексті посилання на наступній сторінці. Коли ви збільшуєте масштаб до більшої та більшої кількості накопичувачів даних, то ймовірність виникнення такого збою зростає. Якщо у вас достатньо дисків, ви можете ввести це число в зону турботи, якщо ви використовуєте RAID 5 з величезною кількістю об'ємів даних.

Я можу вам сказати з особистого досвіду, що у вас, безумовно, можуть бути дві несправності приводу в одному масиві за один і той же критичний проміжок часу. Raid 6 врятував мене від необхідності відновлення після резервного копіювання.

Сподіваюсь, це допомагає


1

Ось такий сценарій: на вашому масиві RAID5 накопичувач не вдається, але ваш запас уже сидів, або замовлення на новий жорсткий диск нарешті надійшло. Ви (чи, можливо, віддалений міньйон) їдете зі свіжим приводом у руці, щоб замінити несправний. Через погану маркування, втому або просто нерозумність один із решти хороших приводів викидається замість несправного… і ось ваша друга невдача.


1

Я бачив це вже кілька разів, коли я перебуваю в бізнесі з відновлення даних. І так, вони часто виходять з ладу одночасно, проте я не вірю, що це має щось спільне, коли вони були побудовані обов'язково, як я також бачив, що це відбувається з невідповідними накопичувачами. Найчастіше цей тип збоїв виникає незабаром після грози, сплеску електроенергії або відключення електроенергії.

Зазвичай перенапруження пошкоджує накопичувачі або RAID-контролер, і протягом декількох днів вони починають виходити з ладу. Я фактично зараз працюю над відновленням масиву, у якого два диски вийшли з ладу одночасно після відключення електроенергії. (зараз виглядає безнадійно)

Маленька порада: захисні пристрої від перенапруг не захищають ваше обладнання. Завжди підключайте свій рейд 5 до хорошого ДБЖ. Я ніколи не бачив, щоб це сталося, коли масив був на АБЖ.


1

Випадкове витягнення другого хорошого накопичувача з однопаритетного набору не повинно знищувати масив з хорошою реалізацією RAID. Я знаю, що ZFS RAID-Z просто заморозить будь-який I / O на масиві, поки ви знову його не ввімкнете в Інтернет.


0

Інший сценарій: Віддаленому міньйону наказано витягти резервну стрічку з стрічки. Вона підходить до стійки і не витягує стрічку з стрічки приводу ... але 2 (два) жорстких диска одночасно виходять з проміжних доріжок і вуаля: 2 вихід з ладу.

Ви думаєте, що це далеко надумано? Я зараз у замовника, який зробив саме це і зараз дивиться на перебудову сервера.

Добре, що вона не спалила стрічку, яка насправді знаходилась у стрічці, чи ні ;-)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.