Помилка набору обсягу 1280 мл RAID6 в Areca


10

Сьогодні ми потрапили в найгірший сценарій і відкриті для будь-яких добрих ідей.

Ось наша проблема:

Ми використовуємо декілька виділених серверів зберігання для розміщення наших віртуальних машин. Перш ніж продовжувати, ось специфікації:

  • Виділений серверний автомат
  • Areca 1280ml RAID контролер, прошивка 1,49
  • 12x жорсткі диски Samsung 1 ТБ

Ми налаштували один набір RAID6 з 10 дисками, що містить один логічний том. У нас є два гарячих запасні частини в системі.

Сьогодні один HDD не вдався. Час від часу це відбувається, тому ми його замінили. Після відновлення другого диска не вдалося. Зазвичай це не весело. Ми припинили важкі операції вводу-виводу, щоб забезпечити стабільне відновлення RAID.

На жаль, гарячий запасний диск вийшов з ладу під час відновлення, і вся справа припинилася.

Зараз у нас є така ситуація:

  • Контролер каже, що рейдовий набір відновлюється
  • Контролер каже, що гучність не вдалася

Це система RAID 6, і два диски вийшли з ладу, тому дані повинні бути недоторканими, але ми не можемо знову донести обсяг в Інтернеті, щоб отримати доступ до даних.

Під час пошуку ми знайшли наступні результати. Я не знаю, хороші вони чи погані:

  1. Дзеркальне відображення всіх дисків до другого набору накопичувачів. Таким чином, ми мали б можливість спробувати різні речі, не втрачаючи більше, ніж ми вже маємо.

  2. Спроба відновити масив у R-Studio. Але у нас немає реального досвіду роботи з програмним забезпеченням.

  3. Витягнувши всі диски, перезавантаживши систему, перейшовши в біос контролера areca, повторно встановивши жорсткі диски один за одним. Деякі люди говорять про те, що система принесла це в Інтернеті цим. Деякі кажуть, що ефект дорівнює нулю. Деякі кажуть, що вони підірвали всю справу.

  4. Використання незадокументованих команд areca типу "рятувальний" або "LeVel2ReScUe".

  5. Зверніться до служби комп’ютерної криміналістики. Але ось… первинні оцінки по телефону перевищили 20 000 євро. Ось чому ми ласкаво просимо про допомогу. Може, ми пропускаємо очевидне?

І так, звичайно, у нас є резервні копії. Але деякі системи втратили дані за тиждень, тому ми хотіли б знову запустити та запустити систему.

Будь-яка допомога, пропозиції та питання більш ніж вітаються.


3
Я б заперечував, що що б ви не робили, ваш перший крок повинен бути ddдзеркалом усіх дисків, лише щоб запобігти більше шкоди та створити резервний план при роботі над реальним рішенням.
Свен

Ми зробимо це ...
Річард

1
А як щодо гарячих просторів?
Cawflands

1
Чи можете ви зв’язатися з продавцем для підтримки? Якщо припустити, що ви не можете (і ви використовували dd для дзеркального відображення всього, за чудовою пропозицією @ @ SvenW), чому б не замінити несправні диски, перезавантажити та подивитися, що відбувається? Мені б не обов'язково тягнути всі диски, тільки несправні. Але дійсно, ваша перша ставка - це постачальник, вони розуміють своє програмне забезпечення.
Джеремі

Ви знайшли рішення? Якщо так, дайте нам знати, що це було для подальшого ознайомлення, будь ласка!
Грант

Відповіді:


2

Я думаю, що варіант 1. найкраще.

Візьміть 12x нових жорстких дисків, 1x новий RAID-контролер. Спробуйте віддзеркалити (dd, якщо = of =) старі диски на нові 1: 1, використовуючи будь-яке поле Linux. Створіть новий сервер, використовуючи 1x новий контролер RAID плюс 12x нові жорсткі диски

Спробуйте відновити масив на новому сервері. Успіх? Чудово. Стій.
Не вдалося відновити? Зеркаліть старі диски на нові, спробуйте Опція i + 1


0

На жаль, це дуже поширений сценарій. У цьому році було проведено гарне дослідження Google, і виявляється, що втрата даних за допомогою RAID може статися під час відновлення масиву. Це може вплинути на різні системи RAID з різною серйозністю. Ось сценарій RAID6:

  • у вашому масиві є 3 дані та 2 паритетних диска.
  • якщо ви втратите один диск, ви впевнені, що всі дані підлягають відновленню.
  • якщо ви втратите 2 диски, ви втратили дані

Чому так?

Подумайте про наступне: дозвольте мати деякі дані, припустимо, що для першого блоку файлу у вас є такі блоки даних: A1 + A2 + A3 та наступний паритет: Ap + Ap, що сидить на hdd1 ... hdd5

Якщо ви втратили будь-який два диска між 1 і 3, ви втратили дані, оскільки дані не підлягають відновленню, у вас є 2 парності та 1 блок даних.

Тепер той самий сценарій з 10 дисками може бути різним, але я думаю, що він обробляв так само, як ви розділяли дані на 8 блоків і зберігали паритет на 2 інших дисках і мали 2 гарячих запасних частини. Чи знаєте ви деталі конфігурації вашого RAID-контролера?

Я б почав відновлюватись із резервного резервного копіювання (мабуть, у вас є), і служба повертається, спробуйте відновити якомога більше даних, використовуючи Unix та dd диски для зображень та використовуючи їх, наприклад, як петлевий пристрій.

http://wiki.edseek.com/guide:mount_loopback

Вам потрібно знати, які метадані використовує контролер RAID, і якщо вам пощастить, він підтримується в такому інструменті, як dmraid.

Але це не означає, що ви можете відновити дані взагалі, оскільки файли зазвичай розподіляються між багатьма блоками, відновлення, ймовірно, не зможе повернути будь-які ваші дані.

Більше про RAID:

https://raid.wiki.kernel.org/index.php/RAID_setup

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.