Кращий підхід до періодичного архівування веб-сайту


0

Я працюю над підходом до того, щоб періодично архівувати наш веб-сайт (динамічно генерується) (скажімо, щомісяця) і тримати його в оновленні, щоб я міг повернутися назад і перетягнути сторінку на певний період.

Мій початковий підхід полягає в тому, щоб сканувати сайт рекурсивно і зафіксувати його у сховищі субверсії, щоб я міг використовувати історію підривів та функцію експорту.

Чи є якесь інше оптимальне рішення, яке використовує менше місця? Крім того, я не впевнений, скільки часу займе підривна робота цілого сайту, щоб також було бажано швидше рішення.


1
Чи є щось погано в тому, щоб просто створити gzipped tarball сайту через регулярні проміжки часу? Простір не повинен бути головною проблемою під час створення резервних копій.
slhck

2
Чому ви просто не помістіть сам сайт у систему контролю версій, а коли внесете зміни, оновіть розгорнутий сайт зі свого сховища?
Der Hochstapler

@OliverSalzburg Я повинен був згадати у запитанні. Сайт динамічно генерується.
Баладжі Натараджан

Якщо у вас є готовий для прогляду архів, я б запропонував wget та пропозицію tarballing виводу.
Doktoro Reichard

2
Динамічно генеровані статичні сторінки? Якщо так, то динамічно генерований насправді не має значення. Gzipped tarball per slhck та робота з кроном. Якщо динамічно під час виконання, то знімок бази даних та стандартне керування джерелом
ToddB

Відповіді:


1

Використовуйте 7zip на роботі cron, щоб періодично виконувати поштові копії з рекурсивними та датами часу - потім тестуйте і mv на кластер, який не працює - завжди перевіряйте резервну копію періодично, інакше у вас з’являться пошкоджені дані і не з’ясуєте, поки не стане критичним. Я вважаю, що ви можете також використовувати тест-перемикач 7zip. Ми використовуємо цей підхід протягом 7 років з критичними даними місії та поштою 16 разів на день без жодних збоїв.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.