ZFS - Чи RAIDZ-1 насправді такий поганий?


18

У мене є сервер NAS з 4-дюймовими накопичувачами WD RE4-GP в форматі RAID10 (можливий 4 ТБ). Мені не вистачає місця (<1 ТБ залишилось корисного місця). У мене є 0 доларів, які потрібно витратити на більші / більше накопичувачів / корпусів.

Мені подобається те, що я читав про особливості цілісності даних ZFS, яких - самостійно - мені достатньо, щоб перейти з існуючого RAF10 (програмного забезпечення) XFS. Тоді я прочитав про чудову реалізацію RAID5 від ZFS, тому подумав, що навіть за допомогою RAIDZ-1 я можу отримати на 2 ТБ більше корисного простору в угоді.

Тим НЕ менше, я продовжую читати більше , і більше повідомлень говорять досить багато , щоб просто не використовувати RAIDZ-1. Тільки RAIDZ-2 + є достатньо надійним для усунення несправностей накопичувачів у реальному світі. Звичайно, в моєму випадку RAIDZ-2 не має сенсу. Було б набагато краще використовувати два дзеркальних vdevs в одному пулі (RAID10).

Чи я божевільний, що хочу використовувати RAIDZ-1 для 4x 2TB накопичувачів?

Чи варто просто використовувати пул із двох дзеркальних vdevs (по суті RAID10) і сподіваюся, що стиснення дає мені достатньо додаткового місця?

У будь-якому випадку я планую використовувати стиснення. У мене є лише 8 Гб оперативної пам’яті (в maxed), тому дедупція не є варіантом.

Це буде на сервері FreeNAS (збирається замінити поточну ОС Ubuntu), щоб уникнути проблем зі стабільністю ZFS-на-Linux.


Не впевнений, як це поза темою. Я прошу поради щодо правильної конфігурації файлової системи для сервера.
Ендрю Енслі

Також RAIDZ1or2 записує швидкість запису порівняно з RAID10
JamesRyan

2
Якщо у вас достатньо процесора для обчислення парності без уповільнення, для більшості записів RAIDZ повинен бути таким же швидким або швидшим, ніж RAID10. RAIDZ пише все в повній смузі RAID, немає циклу читання-зміни-запису, як у RAID5. Таким чином, ви отримаєте більше пропускної здатності диска (більше даних, менше накладних витрат), а запис повинен бути швидшим, ніж RAID10. Однак у цього є той недолік, що читання часто закінчується повільніше. "Пишіть повну смужку кожного разу" призводить до фрагментації, і не дає вам користі читати лише підмножину дисків для багатьох невеликих читань. Це було свідоме дизайнерське рішення.
Dan Pritts

Те, що я сказав вище, лише частково правдиве. RAID10 буде набагато швидшим, якщо у вас є одночасно невеликі записи, наприклад, сервер бази даних. У RAIDZ всі диски активні для всіх записів; RAID10 розбиває їх. Я намагався зіткнутися з тим, що RAIDZ позбавляється від продуктивності та потенційно небезпечного циклу читання-модифікації-запису RAID5.
Dan Pritts

RAIDZ2 надійніше, ніж RAID10. З RAIDZ2 будь-які два диски можуть вийти з ладу, і ви все одно матимете свої дані. У RAID10 два невдалі диски (у чотирьох дискових масивах) можуть спричинити втрату даних.
Клави

Відповіді:


21

Перш ніж ми розберемося з деталями, розглянемо ваш випадок використання. Чи зберігаєте ви фотографії, MP3 та DVD-диски? Якщо це так, вам може бути все одно, чи назавжди ви втратите один блок з масиву. З іншого боку, якщо це важливі дані, це може бути катастрофою.

Заява про те, що RAIDZ-1 "недостатньо хороший для несправностей у реальному світі", пояснюється тим, що ви, швидше за все, матимете приховану помилку медіа на одному з збережених дисків, коли настане час відновлення. Ця ж логіка стосується і RAID5.

ZFS певною мірою пом'якшує цю невдачу. Якщо пристрій RAID5 неможливо відновити, вам майже не пощастило; скопіюйте свої (залишилися) дані та відновіть з нуля. З іншого боку, ZFS реконструює всі, крім поганого фрагменту, і дозволить адміністратору "очистити" помилки. Ви втратите файл / частину файлу, але не втратите весь масив. І, звичайно, перевірка паритетності ZFS означає, що ви будете надійно проінформовані про помилку. В іншому випадку я вважаю, що можливо (хоча й малоймовірно), що багато помилок призведе до того, що відновлення, очевидно, буде успішним, але поверне вам погані дані.

Оскільки ZFS є " шаленим порушенням рівня ", він також знає, у яких областях немає даних про них, і може пропустити їх під час відновлення. Отже, якщо ваш масив наполовину порожній, ви наполовину менші за ймовірність помилки відновлення.

Ви можете зменшити ймовірність подібних помилок відновлення на будь-якому рівні RAID, роблячи регулярні "zpool scrubs" або "mdadm перевірки" свого масиву. Існують подібні команди / процеси для інших RAID; наприклад, рейд-картки LSI / dell PERC називають це "читанням патруля". Вони читають все, що може допомогти дисковим накопичувачам знайти несправні сектори та присвоїти їх до того, як вони стануть постійними. Якщо вони постійні, система RAID (ZFS / md / raid-карта / що завгодно) може відновити дані з паритету.

Навіть якщо ви використовуєте RAIDZ2 або RAID6, важливі регулярні скраби.

Останнє зауваження - будь-який тип RAID не є заміною резервного копіювання - він не захистить вас від випадкового видалення, викупу програм тощо. Хоча звичайні знімки ZFS можуть бути частиною стратегії резервного копіювання.


Дякую за пояснення. Це має багато сенсу і відповідає тому, що я дізнався про ZFS до цього часу. Я вже перезавантажив свій сервер FreeNAS і пішов з конфігурацією RAIDZ-1. У мене це налаштовано вичісувати раз на місяць. Як ви вважаєте, це досить часто, або ви б рекомендували частіші скраби? Похмуре порушення шарування - моя улюблена особливість ZFS :-)
Ендрю Енслі

1
У мене raidz1 працює на 7 споживчих накопичувачах різного віку. У мене це скраб кожні 2 тижні. Він часто знаходить помилку і виправляє її. Нещодавно я втратив диск і втратив файл, який мав приховану помилку. На щастя, це був медіа-файл, який я міг легко замінити. Що стосується моїх важливих даних, я, звичайно, маю резервні копії.
Дан Прітц

Я зазначу, що "домашні" накопичувачі мають на 2 порядки гірший показник помилок бітів, який не піддається ремонту, коли їх відсікають від "підприємства". Я все ще задоволений тим, що коефіцієнт відмов у RAID-5 є прийнятним на пристойних накопичувачах FC / SAS. Не вдалося б це зробити на SATA.
Sobrique

1
Лише один порядок порівняння двох приводів Seagate: Seagate ST2000DM001: 1 в 10E14. ST2000NM0033: 1 в 10E15. Дійсно, однак, важко сказати точно, чи різняться приводні механізми. Я чув, як надійні джерела дають протилежні відповіді.
Dan Pritts

2
Я виявив поганий кабель SATA у своїй системі - оскільки його замінили, мої скраби виявили нульові помилки.
Dan Pritts

4

Тут є трохи помилки на роботі. Багато порад, які ви бачите, засновані на припущенні, яке може бути неправдивим. Зокрема, коефіцієнт помилок біт, який не можна отримати, на диску.

Дешевий диск "домашнього користувача" має 1 на 10 ^ 14 коефіцієнтів помилок.

http://www.seagate.com/gb/en/internal-hard-drives/desktop-hard-drives/desktop-hdd/#specs

Це на рівні, коли ви говорите про велику ймовірність непоправної помилки під час відновлення RAID, і тому ви не повинні цього робити. (Швидкий і брудний розрахунок говорить про те, що 5x 2TB диски набору RAID-5 насправді мають приблизно 60% шансу на це)

Однак це не стосується більш дорогих накопичувачів: http://www.seagate.com/gb/en/internal-hard-drives/enterprise-hard-drives/hdd/enterprise-performance-15k-hdd/#specs

1 на 10 ^ 16 в 100 разів краще - значить, 5x 2 ТБ - <1% шанс невдалого відновлення. (Можливо, менше, оскільки для використання підприємством шпинделі на 600 Гб, як правило, корисніші).

Так що особисто - я думаю, що і RAID-5, і RAID-4 все ще користуються великою популярністю, з усіх причин RAID-0 все ще досить поширений. Не забувайте - проблема з RAID-6 полягає в тому, що це здоровенний штраф. Ви можете частково пом'якшити це за допомогою великої кількості кешування, але у вас все ще виникає біль, особливо коли ви працюєте з повільними дисками в першу чергу.

І ще важливіше - НІКОЛИ не довіряйте своєму RAID, щоб надати вам повну стійкість. Ви втрачаєте дані частіше "ой", ніж помилки накопичувача, тому вам потрібна гідна стратегія резервного копіювання, якщо ви все одно дбаєте про свої дані.


Я використовую 4 диски WD RE4-GP, які мають <1 на 10 ^ 15 помилок читання, які не підлягають відшкодуванню.
Ендрю Енслі

Штраф за запис RAID6 дуже реальний. Однак RAID-Z2 від цього не страждає; zfs змушує все писати повну смужку. Однак це має й інші негативні наслідки - воно, як правило, знижує продуктивність читання з кількох причин.
Dan Pritts

3

Гммм, тут погана інформація. Для 4 дисків насправді немає нічого поганого з XFS. Я схильний уникати ZFS RAIDZ з причин продуктивності та розширення (низький показник читання / запису, неможливо розширити). Використовуйте дзеркала ZFS, якщо можете. Однак, маючи 4 диски та ніде не розміщуючи ОС, ви втратите чималу ємність або доведеться пройти через дивні ігри з розділеннями, щоб підходити до вашої ОС та даних на ті самі чотири диски.

Я, мабуть, не рекомендую ZFS для вашого випадку використання. З XFS тут нічого поганого.


2
Забув згадати, що ОС живе на окремому диску. Вибачте. Чого я хочу від ZFS, що XFS RAID10 не має, це перевірка даних контрольної суми, яка може виявити (і прозоро виправити) мовчазні помилки даних (трохи перевернуті на диску, а про жорсткий диск немає поняття). Я не вірю, що XFS здатний це зробити.
Ендрю Енслі

Для чотирьох дисків використовуйте дзеркала ZFS, якщо є якийсь шанс, що вам потрібно розгорнути або якщо продуктивність має значення. Я б також уникав FreeNAS і просто використовував прямий ZFS в Linux.
ewwhite

1
Я сам термінальний хлопець, тому я точно не переходжу на GUI. Здебільшого мені просто потрібна стабільна файлова система, яка (наскільки це можливо) гарантує цілісність збережених на ній файлів. І я сподівався отримати деякий простір у процесі. Я бачив багато проблем, повідомлених про ZoL, багато з них стосуються оновлення Ubuntu OS. groups.google.com/a/zfsonlinux.org/forum/#!searchin/zfs-discuss/… Не намагаючись завдати болю. Просто пояснюючи, чому я думаю, що я думаю. Я, безумовно, відкритий до виправлення.
Ендрю Енслі

1
Це чудово. Я бачив набагато більше проблем із FreeNAS (не FreeBSD), тому це йде обома способами. Там є інформація. Я не використовую Ubuntu, але я дійсно знаю ZFS . Мій ZFS в Linux зазвичай є RHEL або CentOS. Ось зразок робочого процесу .
ewwhite

1
Я використовую ZFS на Linux і Centos 6. Я не дозволяю автоматичне оновлення ядра або ZFS. У мене виникли проблеми із ZFS / SCL, але я ніколи не мав втрати даних. Для запису, btw, FreeBSD має подібний набір процедур сумісності solaris, але вони та ZFS повністю інтегровані в дистрибутив, що робить його набагато простішим, щоб все працювало разом. Якби я хотів лише ZFS та файлового сервісу, я, мабуть, запустив FreeBSD. Насправді саме це я і робив, але я використовую поле для інших випадкових речей, що зробило ZoL привабливішим.
Дан Прітц
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.