Перенесіть 10 ТБ файлів із США до Великобританії в центр обробки даних


96

Я переміщую свій сервер із США до Великобританії з одного центру даних в інший. Мій хост сказав, що я повинен мати можливість досягти 11 мегабайт в секунду.

Операційна система - це Windows Server 2008 з обох кінців.

Мій середній розмір файлу становить близько 100 МБ, а дані розділені на п'ять накопичувачів 2 ТБ.

Який би був рекомендований спосіб передачі цих файлів?

  • FTP
  • SMB
  • Rsync / Робокопія
  • Інший?

Мене не надто турбує безпека, оскільки це все-таки загальнодоступні файли, але я просто хочу рішення, яке може підштовхнути повну швидкість передачі 11 Мб / с, щоб мінімізувати загальний час передачі.


19
11 Мб / с або 11 Мб / с?
wim

14
перенесіть дані на бінарну перфокартку та скористайтеся голубом-носієм :)
enterzero

9
Ви повинні надати детальну інформацію. Скільки голубів-носіїв, на вашу думку, знадобиться? Покажіть свою роботу.
Евік Джеймс

18
@Евік європейський чи африканський?
Вім

8
В сторону Вольфрам Альфа - це найзручніший спосіб зробити розрахунок, "10 ТБ при 11 МБ / с". wolframalpha.com/input/?i=10+TB+at+11MB%2Fs
рибу фугу

Відповіді:


173

Натомість надсилайте жорсткі диски через океан.

При 11 Мбіт / с при повному використанні ви дивитесь лише на 90 днів, щоб переказати 10 ТБ.


11 Мбіт / с = 1,375 Мбіт = 116,015 ГБ / день .

10240 ГБ / 116.015 ГБ / день = ~ 88,3 дня .


42
+1 для Sneakernet . Крім того, ви забули накладні витрати TCP / IP. Це більше схоже на ~ 100 днів за ідеальних обставин.
Кріс С

43
Мудрець одного разу сказав: "Ніколи не варто недооцінювати пропускну здатність фур, наповнених стрічками, що хитаються вниз по шосе". Це рівняння дуже вірно і істотно не змінюється зміною вагона станції для човна. ( bpfh.net/sysadmin/never-underestimate-bandwidth.html )
Роб

5
Краще відправляти стрічки або диски blueray, а не диски. Якщо ви їдете з накопичувачами, переконайтеся, що оригінали зберігаються в безпеці та доступні на всякий випадок. Я б пішов на накопичувачі сам (якщо б у мене не було Ultrium 4 накопичувачів), оскільки 10 ТБ = 410 одношарових блакитних дисків!
Аллен

9
Щойно зрозумів, що я набрав 11 Мбіт / с, однак це те, що я насправді мав на увазі, було 11 Мб / с. Я вважаю, що це має велике значення, мої розрахунки мають приблизно 11-14 днів приблизно ... це правильно?
Пол Хінетт

18
як і раніше вважають, що надсилаючи людину за допомогою резервного копіювання 10TB, поки офіційний диск все ще працює, після того, як налаштування завершено, ви можете пообідати rsync, щоб оновити новий сервер для будь-яких змін. У вас машина буде працювати і працювати приблизно за день.
Loïc Faure-Lacroix

26

Я б сказав, rsync, при 11 Мб / с ви подивитесь на 10-14 днів, і навіть якщо вас перерве, rsync легко запуститься там, де він зупинився минулого разу.

На швидкості 11 Мбіт / с я поставляю жорсткі диски, як було запропоновано вище :)


1
Ваша оцінка сильно відрізняється від того, що розмістили інші (і я не знаю, хто є правильним). Чи можете ви надати свою методологію досягнення цих показників?
Джон Гарденєр

9
Різниця виникає в тому, що OP помиляється на 11 Мбіт / с, коли насправді він мав на увазі 11 Мбіт / с - що в 8 разів швидше. BTW, перезапуск 10-ти TB rsync у випадку перерви, ймовірно, займе певний час, чи не так? Години, чи довше?
Френк Фермер

@FrankFarmer: я б не турбувався про перезапуск rsync; Я зберігаю виїзну копію ~ 20 ТБ по бездротовій лінії 30 Мбіт / с, а перезапуск - в секундах. початкова копія займала пару тижнів, але нічне оновлення зазвичай - це дві години.
Хав'єр

@FrankFarmer - rsync, здається, масштабує дуже добре. У мене є ~ 2 ТБ над сільською лінією ADSL1, яка була підписана за допомогою кросівок, але потрібно rsync щоночі ~ 5 хв, якщо нічого не змінилося.
Flexo

6
Шкала часу перезавантаження rsync з кількістю файлів (головним чином stat, з мого досвіду), а не із загальними даними. Я очікував би не значного очікування (максимум кілька хвилин). Хоча мій досвід роботи з rsync на вершині трохи менше 5 ТБ.
derobert

15

Rsync звичайно.

Принаймні, ви можете продовжити в будь-який час після перерви, і це без жодного болю.


7
3+ місяці для копіювання зі 100% використанням. Вибачте, але це жахливий спосіб передати стільки даних.
Chris S

Я маю згоду з @ChrisS, використання rsyncпросто для копіювання великих файлів не є ефективним. Для моїх речей я закінчила використання tarнад netcatабо sshдля початкової передачі. Це набагато швидше і починає передаватись негайно, в той час як rsyncспочатку сканувати всі файли, що вимагає часу. Якщо це перерветься, ви все одно можете скористатися rsyncзгодом. Насправді я це роблю іноді після того, як tarбудь-коли переконайтесь, що всі дозволи, файли сокетів і т.д.
Мартін Шаррер

1
Після виправлення ОП, що він має ~ 100 Мб підключення, а не 11 Мб, rsync має набагато більше сенсу. +1 для першого, хто це згадав.
Кріс S

12

Ніколи не недооцінюйте пропускну здатність вагона станції, повного стрічок

- Трад.

У вашому випадку диски або стрічки, надіслані кур’єром, але принцип все-таки діє. Якщо вас не турбує затримка, це буде значно дешевше, ніж пропускна здатність мережі для передачі даних 10 ТБ за будь-який розумний проміжок часу.


Джефф Етвуд керував номерами в одній зі своїх старих публікацій Coding Horror .. codinghorror.com/blog/2007/02/the-economics-of-bandwidth.html
tardate

10

Ви повинні використовувати rsync. Він буде стискати дані та дедублювати їх перед надсиланням. Він також може відновити часткові трансфери, що дуже важливо для будь-яких великих переказів.

Ймовірно, він не передає 10 ТБ; якщо це журнали та текст, і він може бути менше 1 ТБ; можливо, нижче 1 ТБ.

Є інструменти, які краще справляються зі стисненням, ніж rsync і, ймовірно, знаходять більше збігів. Ви можете використовувати lrzipі т.д.

Існують конкретні типи даних, які не стискаються та не містять буквальних даних - наприклад, відео та інші носії інформації. У таких випадках FTP і rsync докладають майже однакових зусиль.


3
RSync видаляє дані? Я думаю, що це робиться лише на рівні файлів, тобто дедупликація в цьому випадку є марною.
devicenull

6

Я знаю, що це вже прийнято, але ви розглядали можливість перевезти свої диски в центр обробки даних / провайдера / хоста, де ви можете отримати більшу пропускну здатність? Це, ймовірно, обійдеться вам трохи грошей, але копіювання 10240Gb на резервні диски та надсилання також коштуватимуть і часу, і грошей (2 х гроші).

Також ви будете впевнені, що ваші диски не зламаються в транспорті.


Чим ця відповідь відрізняється від прийнятої відповіді?
Кріс S

2
@Chris Ця відповідь пропонує транспортувати диски до більшої труби на одному континенті.
Алекс Жасмін

5

11 Мбіт / с? Це досить обмеження, яке ви маєте тут. У вашій ситуації я просто:

  • Клоніруйте дані
  • Стисніть його
  • Оренда серверів на обох кінцях принаймні в 10 разів більша пропускна здатність (в тих самих центрах обробки даних або на вашому кінці в центрі обробки даних поблизу вас).
  • Перенесіть файли
  • Застосувати дані до нового сервера.

Якщо у вас дійсно немає рішення збільшити пропускну здатність ... Тоді доставка фізичного диска буде набагато швидшою.

З мого болісного досвіду жорсткі диски, як правило, зламаються в пошті ... USB-флешки - це краще рішення для частої передачі даних. У вашому випадку знадобиться декілька з них :) Тому надсилайте 2 копії своїх даних на декілька жорстких дисків.

Враховуючи кількість наявних даних, ви також можете надсилати диски з масиву RAID 5 або RAID 6, якщо у вас є те саме апаратне / програмне забезпечення з іншого боку, щоб підключити ваші диски. Але в цьому випадку не забудьте позначити порядок своїх дисків. і їх серійні номери, тому при перенастроюванні вони не змішуються.


1
вибачте, 11 Мбіт / с була помилковою, це 11 Мб / с ... я згадував в одному з вищезазначених коментарів.
Пол Хінетт

4

Хоча в цьому випадку я маю згоду на відповідь "переслати це за допомогою жорстких дисків", ось рішення для копіювання, яке я використовую, коли мені вперше потрібно копіювати велику кількість файлів:

Хоча rsyncдобре зберігати два сховища даних синхронізовано, воно вводить зовсім небагато зайвих витрат для початкової передачі. Я зрозумів , що найшвидший шлях до tarякої отримує по трубопроводу через netcat. На сайті приймача ви також можете використовувати netcatв режимі прослуховування, який передає вхідні дані на витяг tar. Перевага полягає в тому, що він tarпочинає надсилати негайно і netcatнадсилає його як звичайний потік TCP без додаткових накладних протоколів вищого рівня. Це має бути якнайшвидшим, як це стає. Однак перезавантажити перервану передачу на останній позиції непросто.

Також легко можна стиснути дані для передачі, використовуючи правильні tarваріанти або додати інструмент стиснення в трубах. Зауважте, що netcatдату надсилається незашифрованою. У випадках, коли це не варіант, sshзамість цього можна використовувати зашифроване з'єднання ( tar <options> | ssh <target> -c 'tar -x <options>').

Якщо всі дані передаються, rsyncможна використовувати для забезпечення синхронізації всіх оновлених файлів тим часом. Також IIRC tarне створює сокети, які втрачаються в іншому випадку, але вони все одно не використовуються для даних центру даних.


Мінус у тому, що він не терпимий до втручань
Джоель Коел

3

Чи розглядали ви IPoAC ?

Один голуб може мати можливість переносити десятки гігабайт даних приблизно за годину, що на основі середньої пропускної здатності дуже сприятливо порівнюється з діючими стандартами ADSL навіть при обліку втрачених накопичувачів.


21
Голуби зазнали б втрати сигналу на відстані, описаній ОП.
Рой Тінкер

Очищений IPoAC @RoyTinker потрібно реалізувати за допомогою віконного процесу.
JamesBarnett

3

Знову ж таки, перша пропозиція - поставити накопичувачі.

Друга пропозиція - використовувати rsync для rsyncd, а не через SSH. Я спробував багато речей, і це, як правило, найшвидше. Не забудьте включити стиснення. Крім того, подивіться на збільшення або зменшення розміру буфера rsync, щоб отримати оптимальну швидкість передачі. Це також може допомогти збільшити розмір MTU . Це допомагає лише, якщо маршрутизатори на маршруті не фрагментують ваші пакети. Є способи визначити, чи є вони.

На жаль, немає налаштувань, які завжди найкращі. Вам доведеться експериментувати, щоб з’ясувати, що найкраще працює у вашій ситуації.


2

Ви згадали, що на серверах працює Windows 2008. Чи підходить Microsoft DFS ? У нижньому кінці є деяка магія, яка намагається вивести якомога більше пропускної здатності з з'єднання, наскільки це можливо, а також має стиснення та дедуплікацію (IIRC).

Зауважте, жорсткі диски, DVD-диски або BluRays були б швидшими ... Мій розрахунок становить 11 днів при повних 11 Мб / с ...


1

Для цього можна використовувати торрент.

Створіть приватний торрент на одному кінці та використовуйте клієнта з іншого.

Хоча на місці є шифрування, ви повинні перевірити свої вимоги.


1
Відносини від 1 до 1 торрента не краще, ніж передача файлів 1 на 1. Якщо між двома ділянками є труба обмежена, вам потрібно кілька сівалок на різних трубах, в ідеалі географічно розподілених.
Джеремі

@Jeremy - це ні краще, ні гірше в плані пропускної здатності. Це може бути кращим з точки зору надійності (легка пауза / резюме), що для цього розміру xfer може бути важливим
Joel Coel
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.