Існує багато способів обробки даних такого розміру. Багато чого залежить від вашого оточення та того, скільки грошей ви готові витратити. Загалом, існує декілька загальних стратегій "вилучення даних із сервера":
- Через мережу Ethernet Як це сказано в коробці, дані передаються в Some Where Else для обробки. Копіювання 1GbE триватиме 20 ТБ, але це можна зробити. Апаратне забезпечення може допомогти (наприклад, посилання 10GbE або в деяких випадках NIC-зв'язок).
- Через підсистему зберігання Якщо ви перебуваєте на Fiber Channel, надішліть її на інший пристрій у мережі FC. Якщо у вас є SAS, надішліть його на пристрій, підключений до SAS. Взагалі швидше, ніж Ethernet.
- Надіслати його на інший дисковий масив Надіслати його на інший пакет пам’яті, приєднаний до того ж сервера.
Ось 100 км перегляду. Як тільки ви почнете збільшувати масштаби, речі стають набагато більш фрагментарними. Як вже було сказано, LTO5 - це специфічна стрічкова технологія, розроблена для таких видів навантажень високої щільності. Інший ідентичний масив пам’яті є хорошою ціллю, особливо якщо ви можете використовувати щось на зразок GlusterFS або DRBD, щоб отримати там дані. Крім того, якщо вам потрібна резервна ротація або просто можливість продовжувати працювати, якщо масив не вдасться вплинути на те, що ви поставите на місце.
Після того, як ви зупинитесь на 100-кілометровому способі перегляду, наступне велике завдання - потрапити в програмне забезпечення. Фактори, що впливають на це, - це те, що ви можете встановити на своєму сервері зберігання даних (в першу чергу, якщо це NetApp, це одне, сервер Linux з купою пам’яті - цілком інша справа, як і сервер Windows з купою пам’яті) , яке обладнання ви вибираєте (наприклад, не всі пакети резервного копіювання FOSS добре обробляють стрічкові бібліотеки), і який тип збереження резервного копіювання потрібно.
Вам дійсно потрібно розібратися, якого типу відновлення після катастроф ви хочете. Проста реплікація в реальному часі простіша, але не дозволяє відновити її лише з минулого тижня. Якщо здатність до відновлення з минулого тижня для вас важлива, тоді вам потрібно розробити такі речі. За законом (у США та інших місцях) деякі дані потрібно зберігати протягом 7+ років.
Проста реплікація - це найпростіше зробити. Це те, що призначено для роботи з DRBD. Як тільки початкова копія виконана, вона просто надсилає зміни. Тут ускладнюють фактори локальність мережі, якщо ваш 2-й масив не поруч з первинним DRBD, можливо, не представляється можливим. Вам знадобиться 2-й сервер зберігання, принаймні стільки місця для зберігання, як і перший.
Про резервне копіювання стрічки ...
LTO5 може утримувати 1,5 Тб стиснення даних без огляду. Годування цих монстрів вимагає дуже швидкої роботи в мережі, яка є або Fiber Channel, або 6Gb SAS. Оскільки в резервному режимі потрібно створити резервну копію більше 1,5 ТБ, вам потрібно розібратися в автонавантажувачі (ось приклад: посилання , автозавантажувач на 1 гніздо на 24 слота від HP). За допомогою програмного забезпечення, яке їх підтримує, вони оброблятимуть зміну стрічок середньої резервної копії для вас. Вони чудові. Вам все одно доведеться витягувати стрічки, щоб надсилати їх за межі сайту, але це чортове видовище краще, ніж навішувати всю ніч, щоб завантажувати стрічки самостійно, коли резервна копія вимагає їх.
Якщо стрічка надає вам " legacy, ew " heebiegeeebies, віртуальна бібліотека стрічок може бути більшою вашою швидкістю (наприклад, ця з посилання Quantum:) . Вони претендують на бібліотеки стрічок для резервного копіювання програмного забезпечення, фактично зберігаючи речі на диску з надійними (сподіваєтесь) методами дедуплікації. Фанатніші навіть копіюють віртуальні стрічки на реальні стрічки для вас, якщо вам подобається така річ, яка може бути дуже зручною для обертання поза межами сайту.
Якщо ви не хочете спілкуватися з рівномірними віртуальними стрічками, але все ще хочете робити резервні копії прямого диска, вам знадобиться масив пам’яті, достатньо великий, щоб обробляти ці 20 ТБ, а також скільки потрібних даних про зміну мережі. триматися. Різні резервні пакети вирішують це по-різному. Деякі технології дедуплікації справді приємні, інші - хакіти. Я особисто не знаю стан програмних пакетів резервного копіювання FOSS в цій області (я чув про Bacula), але їх може бути достатньо. У багатьох комерційних пакетах резервного копіювання є місцеві агенти, які ви встановлюєте на сервери для резервного копіювання, щоб збільшити пропускну здатність, що має багато достоїнств.