Як зробити резервну копію сервера зберігання даних?


14

Я дивлюся на реалізацію дуже великого сервера зберігання даних, який буде використовуватися як жива NAS для декількох інших серверів (усіх Linux).

Я дуже маю на увазі між корисним простором між 4 ТБ та 20 ТБ (хоча навряд чи ми дійсно зробимо це 20 ТБ).

Сервер пам’яті буде RAID 10 для захисту даних та продуктивності, але нам все одно потрібне рішення для резервного копіювання, включаючи резервне копіювання за межами сайту.

Моє запитання: як створити резервну копію стільки даних !?

Це не так, як я можу просто підключити портативний жорсткий диск і перенести файли. Наразі у нас немає інших пристроїв, у яких є стільки місця для зберігання.

Мені потрібно складати бюджет на другий сервер зберігання за межами сайту чи є краще рішення?


5
Я залишу свій звичайний коментар, що стосується того, що підтримка не перебуває в режимі офлайн. Мені дуже хочеться нервувати, коли система резервного копіювання постійно "живе і в Інтернеті". Якщо зловмисник може потрапити до вашої виробничої системи та ваших резервних копій, вони можуть скинути ваші резервні копії відразу після того, як вони закінчать виводити вашу виробничу систему.
Еван Андерсон

@Evan Я вважаю за краще обидва, відновлення з стрічки може зайняти багато годин, але відновлення з локального або безпосередньо прикріпленого диска може бути зроблено за лічені хвилини.
Том О'Коннор

@Tim O'Connor: D2D2T - це чудово, коли ти можеш його отримати. Майте на увазі, що відновлення окремих елементів з диска чи стрічки може бути дуже швидким. Резервне копіювання на основі диска має репутацію швидко відновлення з, але більшість людей думають "отримати доступ до даних безпосередньо з медіа-даних B2D", а не "відновити", коли вони це говорять. Якщо вам доведеться відновити пару ТБ даних з дискової системи резервного копіювання, скажімо, заміни SAN після того, як ваш згорів у пожежі, це не буде "хвилин", щоб скопіювати ці дані. Диск та стрічка високого класу за швидкістю передачі даних дуже схожі.
Еван Андерсон

Відповіді:


13

Існує багато способів обробки даних такого розміру. Багато чого залежить від вашого оточення та того, скільки грошей ви готові витратити. Загалом, існує декілька загальних стратегій "вилучення даних із сервера":

  • Через мережу Ethernet Як це сказано в коробці, дані передаються в Some Where Else для обробки. Копіювання 1GbE триватиме 20 ТБ, але це можна зробити. Апаратне забезпечення може допомогти (наприклад, посилання 10GbE або в деяких випадках NIC-зв'язок).
  • Через підсистему зберігання Якщо ви перебуваєте на Fiber Channel, надішліть її на інший пристрій у мережі FC. Якщо у вас є SAS, надішліть його на пристрій, підключений до SAS. Взагалі швидше, ніж Ethernet.
  • Надіслати його на інший дисковий масив Надіслати його на інший пакет пам’яті, приєднаний до того ж сервера.

Ось 100 км перегляду. Як тільки ви почнете збільшувати масштаби, речі стають набагато більш фрагментарними. Як вже було сказано, LTO5 - це специфічна стрічкова технологія, розроблена для таких видів навантажень високої щільності. Інший ідентичний масив пам’яті є хорошою ціллю, особливо якщо ви можете використовувати щось на зразок GlusterFS або DRBD, щоб отримати там дані. Крім того, якщо вам потрібна резервна ротація або просто можливість продовжувати працювати, якщо масив не вдасться вплинути на те, що ви поставите на місце.

Після того, як ви зупинитесь на 100-кілометровому способі перегляду, наступне велике завдання - потрапити в програмне забезпечення. Фактори, що впливають на це, - це те, що ви можете встановити на своєму сервері зберігання даних (в першу чергу, якщо це NetApp, це одне, сервер Linux з купою пам’яті - цілком інша справа, як і сервер Windows з купою пам’яті) , яке обладнання ви вибираєте (наприклад, не всі пакети резервного копіювання FOSS добре обробляють стрічкові бібліотеки), і який тип збереження резервного копіювання потрібно.

Вам дійсно потрібно розібратися, якого типу відновлення після катастроф ви хочете. Проста реплікація в реальному часі простіша, але не дозволяє відновити її лише з минулого тижня. Якщо здатність до відновлення з минулого тижня для вас важлива, тоді вам потрібно розробити такі речі. За законом (у США та інших місцях) деякі дані потрібно зберігати протягом 7+ років.

Проста реплікація - це найпростіше зробити. Це те, що призначено для роботи з DRBD. Як тільки початкова копія виконана, вона просто надсилає зміни. Тут ускладнюють фактори локальність мережі, якщо ваш 2-й масив не поруч з первинним DRBD, можливо, не представляється можливим. Вам знадобиться 2-й сервер зберігання, принаймні стільки місця для зберігання, як і перший.


Про резервне копіювання стрічки ...

LTO5 може утримувати 1,5 Тб стиснення даних без огляду. Годування цих монстрів вимагає дуже швидкої роботи в мережі, яка є або Fiber Channel, або 6Gb SAS. Оскільки в резервному режимі потрібно створити резервну копію більше 1,5 ТБ, вам потрібно розібратися в автонавантажувачі (ось приклад: посилання , автозавантажувач на 1 гніздо на 24 слота від HP). За допомогою програмного забезпечення, яке їх підтримує, вони оброблятимуть зміну стрічок середньої резервної копії для вас. Вони чудові. Вам все одно доведеться витягувати стрічки, щоб надсилати їх за межі сайту, але це чортове видовище краще, ніж навішувати всю ніч, щоб завантажувати стрічки самостійно, коли резервна копія вимагає їх.

Якщо стрічка надає вам " legacy, ew " heebiegeeebies, віртуальна бібліотека стрічок може бути більшою вашою швидкістю (наприклад, ця з посилання Quantum:) . Вони претендують на бібліотеки стрічок для резервного копіювання програмного забезпечення, фактично зберігаючи речі на диску з надійними (сподіваєтесь) методами дедуплікації. Фанатніші навіть копіюють віртуальні стрічки на реальні стрічки для вас, якщо вам подобається така річ, яка може бути дуже зручною для обертання поза межами сайту.


Якщо ви не хочете спілкуватися з рівномірними віртуальними стрічками, але все ще хочете робити резервні копії прямого диска, вам знадобиться масив пам’яті, достатньо великий, щоб обробляти ці 20 ТБ, а також скільки потрібних даних про зміну мережі. триматися. Різні резервні пакети вирішують це по-різному. Деякі технології дедуплікації справді приємні, інші - хакіти. Я особисто не знаю стан програмних пакетів резервного копіювання FOSS в цій області (я чув про Bacula), але їх може бути достатньо. У багатьох комерційних пакетах резервного копіювання є місцеві агенти, які ви встановлюєте на сервери для резервного копіювання, щоб збільшити пропускну здатність, що має багато достоїнств.


Дякую за довгу і продуману відповідь. Ви багато мені
задумалися

9

Автоматичний автомат LTO-5? вам знадобиться десь від трьох до 15 стрічок для резервного копіювання цього масиву, що не є надзвичайно великим числом. Jukebox подбає про зміну стрічок для вас, а гарне програмне забезпечення для резервного копіювання (наприклад, бакула) буде відслідковувати, які файли (файли) є на якій стрічці.

Ви також хочете розглянути час, необхідний для створення резервної копії файлової системи настільки великої, наскільки це дуже ймовірно, що FS зміниться за цей період. Для найкращих результатів файлова система, яка підтримує знімки, була б дуже корисною, тому ви можете зробити миттєвий знімок і виконати повне або покрокове резервне копіювання проти цього, а не проти живої файлової системи.


1
Я не знайомий зі стрічковими системами. Я здогадуюсь, що немає способу робити додаткові резервні копії. Крім того, чи не пройде декілька годин і вручну змінювати стрічкові приводи один за одним? Це не було б ідеально, тому що я б проводив такий час лише раз на місяць, і ми дійсно не хочемо, щоб місячні мали цінні дані. Я щось пропускаю, чи це просто прийняті незручності / ризики / обмеження систем резервного копіювання стрічки?
Ендрю Енслі

4
Сучасні системи резервного копіювання стрічок високо автоматизовані та робототехнічні :)
phoebus

3
Так, резервні копії стрічок зазвичай дозволяють робити додаткові резервні копії. Хороша стратегія резервного копіювання - робити повні резервні копії (довгі, повільні, багато стрічок) щомісяця або раз на рік, а також робити щоденні додаткові чи диференційні резервні копії між ними.
Brent

Стрічкові роботи доступні за ціною і містять багато стрічок. Що стосується створення резервних копій, чому б не було способу робити додаткові прибутки? Нарешті, більшість людей запускають роботу резервного копіювання у неробочий час. Якщо у вас їх немає, це важлива частина специфікації.
Slartibartfast

Так, у нас дійсно немає годин. У нас є години, коли було б прийнятніше, щоб система була недоступною (як-от 4 ранку в суботу вранці), але ці системи будуть цілодобово використати потенційно сотні користувачів.
Ендрю Енслі

5

Напевно, ви повинні дивитись на створення резервної копії на диску , оскільки стрічка займе тривалий час, а відновлення послідовного доступу триватиме назавжди.

Однозначно скористайтеся диференційованими або покроковими резервними копіями - лише резервне копіювання змін на будь-якій частоті, яка має сенс для вас.

Ймовірно, ідеальним рішенням був би другий сервер аналогічного розміру в іншому місці , де регулярно надсилаються додаткові резервні копії, і це можна було б швидко замінити, якщо головний сервер коли-небудь загине. Однак іншим варіантом буде використання знімних накопичувачів на місці, які потім вивозяться за межі зберігання.

Якщо ви маєте справу з такою кількістю даних, також має сенс розділити свої резервні копії на менші завдання резервного копіювання, і якщо їх не вдається створити всі резервні копії щодня, розмістіть свої резервні копії, щоб встановити, що A створюється резервна копія одного дня, і встановити B наступним.

Завжди думайте про процедуру відновлення . Ми один раз заїхали, коли нам довелося відновити файл із декількох сотень гіга завдань для резервного копіювання, що вимагало багато пам’яті та багато часу, щоб відновити індекс резервного копіювання та відновити. Врешті-решт ми не змогли виконати це за день, і довелося побудувати виділений сервер відновлення, щоб наш основний сервер резервного копіювання продовжував працювати за ніч!

- додано--

Ви також хочете подумати про технології дедупликації , які можуть заощадити величезний простір, не створюючи резервну копію однієї і тієї ж інформації кілька разів для декількох користувачів. Багато резервних рішень або файлових систем пропонують дедуплікацію як частину їх функціональності.


+1 для thinking about the restore procedure. Амінь!
Стівен у понеділок,

Багато чудових порад. Спасибі. Я маю багато думати.
Ендрю Енслі

2
Мені хотілося б подати заяву, але я не бачу стрічки. Стрічка, ймовірно, стане важливою частиною режиму резервного копіювання для такої кількості даних, якщо потрібне якесь значне вікно збереження в поєднанні із зберіганням за межами сайту. Вартість картриджів LTO-5 для довготривалого зберігання за межами сайту, порівняно зі знімними накопичувачами жорсткого диска, робить їх дуже привабливими. Стрічкові картриджі також розроблені для архівного зберігання, тоді як знімних накопичувачів жорсткого диска зазвичай немає.
Еван Андерсон

@Evan: Якщо чесно, він уже в першому реченні згадував стрічки.
Ендрю Енслі

2

Спочатку перерахуйте ризики, від яких ви захищаєтесь. Деякі поширені ризики:

  • Катастрофа: Щось дуже прикро трапляється з усім вашим сайтом.
  • Людські помилки (це те, що відбувається _all_the_time_):
    • Хтось вирішує реалізувати можливість «гарячої заміни» вашого сервера зберігання способом, який не призначений виробником.
    • Хтось запускає процес, який мовчки пошкоджує дані, які надійно створюються резервними копіями за пару місяців до того, як проблема буде помічена.
    • Хтось видаляє важливий звіт, який повинен вийти за годину і коштує тисячі доларів.

Потім оцініть вартість різних рішень щодо запобігання ризику, наприклад:

  • Позамінне резервне резервне копіювання (віддалене дзеркало): захищено від катастроф, деякі (але не всі) людські помилки (це все ще є в режимі он-лайн).
  • Позашляхове зберігання (стрічки): захищено від катастроф, важко швидко відновити дані.
  • Он-лайн резервне резервне копіювання (дзеркало): захищено від людських помилок, деяких несправностей обладнання, вразливих до катастроф.
  • Позашляхове резервне резервне копіювання (стрічки в змінній стрічки): захищено від більшості помилок людини, більшості апаратних збоїв.

Потім оцініть стратегії обертання (наскільки далеко ви хочете відновитись, скільки даних ви можете дозволити собі втратити).

Потім виберіть те, що ваші дані варті.


Приємно ламатися. Я вже оцінив це здебільшого і приземлився на оф-сайті, в режимі онлайн резервного копіювання. Мета резервного копіювання в основному - захист від катастроф, крім очевидних людських помилок. Стійка знаходиться в межах 2 миль від узбережжя затоки, тому урагани викликають занепокоєння. Нам просто доведеться зробити все можливе, щоб захистити від людських помилок за допомогою частої перевірки цілісності. Ваша відповідь допомогла мені почуватися краще щодо цього висновку. Спасибі.
Ендрю Енслі

Я радий, що можу допомогти. Деякі зауваження щодо обраного рішення: Це, безумовно, може бути, але сайт резервного копіювання, ймовірно, повинен знаходитися в іншому штаті або в місці, добре захищеному від ураганів ТБ, яким ви піддаєтесь. Ви можете пом'якшити корупційну проблему, маючи довгий "хвіст" (резервні копії з широкого діапазону дат у минулому). За допомогою резервної копії в Інтернеті ви також хочете врахувати небезпеку випадкового видалення даних, а не відновити їх. Нарешті, завжди перевіряйте процес відновлення.
Slartibartfast

2

У мене є замовник з двома подібними системами на 12 ТБ у двох різних будинках, підключених на 1 Гб. Один - виробнича система; це резервне копіювання поступово (із щоденними знімками) до іншого за допомогою великої утиліти rdiff-backup . rdiff-резервне копіювання повинно бути доступним у вашому стандартному сховищі дистрибутива.


1

Позамінне резервне резервне копіювання (віддалене дзеркало)

використовувати rsync, хоча ssh (лише зміни) - спочатку резервне копіювання має бути зроблено локально, але після цього резервне копіювання буде вітерцем залежно від змін

якщо вам потрібно зберегти версії із зміною rdiff-backup

http://www.nongnu.org/rdiff-backup/

Файлова система btrfs в Linux звучить багатообіцяюче, але все ще на важкому розвитку


Дякую, що вказали мені на rdiff. Я вже використовую rsync, і це виглядає як ідеальний крок від цього.
Ендрю Енслі

1

Погляньте на власний "вміст" та на те, як часто він змінюється, перш ніж планувати свою стратегію. Багато разів люди просто збирають одні й ті самі дані на стрічки щотижня без перешкод без поважних причин.

Технології дедуплікації від деяких постачальників дозволяють знімати знімки, щоб врятувати вас від відновлення окремих файлів, але для захисту вам завжди знадобиться виїзд.


Систему використовуватимуть тисячі, можливо, десятки тисяч щоденних користувачів, які вводять форми та оновлюють інформацію. Це дуже динамічні дані. Я повинен був це згадати у питанні.
Ендрю Енслі

Якби це я, я створив би систему з достатньою можливістю накладних витрат або знімків, щоб мені не довелося переходити до реальних резервних копій, якщо це не катастрофа.
SpacemanSpiff

Я згоден. Як я вже говорив раніше, накопичувачі будуть в RAID 10, тому ми будемо охоплені у разі відмови жорсткого диска, і у мене будуть також місцеві резервні копії / знімки. Резервне копіювання за межами сайту - це за найгіршого сценарію, як метеор, який потрапляє у спільний пошук або хтось випадково запускає rm -rf / * на сервері зберігання даних.
Ендрю Енслі

Ну, я мав на увазі накладні витрати щодо потужності. RAID10 розумний для найкращого звільнення, звичайно, але я б взяв RAID6, якщо продуктивність не настільки велика потреба, і якщо я міг би використовувати додатковий простір для більшої області знімків. Чим більше знімків ви можете собі дозволити, тим менше вам знадобиться "резервного копіювання" для відновлення файлів.
SpacemanSpiff
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.