Коротка відповідь
Неможливо гарантувати тривалий термін через ентропію (її також називають смертю!). Цифрові дані розпадаються і гинуть, як і будь-яка інша річ у Всесвіті. Але це можна сповільнити.
Наразі не існує надійного і науково перевіреного способу гарантувати 30+ років архіву холодних даних. Деякі проекти мають на меті це зробити, як проект Rosetta Disks з музею Long Now , хоча вони все ще дуже затратні та мають низьку щільність даних (близько 50 Мб).
Тим часом ви можете використовувати науково перевірені стійкі оптичні носії для зберігання в холоді, як Blu-ray диски типу HTL типу Panasonic, або архіви DVD + R, як Verbatim Gold Archival, і зберігати їх у герметичних коробках у м'якому місці (уникайте висока температура) і поза світлом.
Також будуть зайвими : Зробіть кілька копій ваших даних (по крайней мере , 4), і обчислити хеші регулярно перевіряти , що все в порядку, і кожні кілька років , ви повинні переписати дані на нових дисках. Також використовуйте безліч кодів для виправлення помилок , вони дозволять відремонтувати ваші пошкоджені дані!
Довга відповідь
Чому дані пошкоджуються з часом? Відповідь полягає в одному слові: ентропія . Це одна з первинних і неминучих сил Всесвіту, завдяки чому системи стають все менше впорядкованими в часі. Корупція даних саме така: розлад у порядку біт. Іншими словами, Всесвіт ненавидить ваші дані .
Боротьба з ентропією точно схожа на боротьбу зі смертю: ви, швидше за все, не досягнете успіху. Але, ви можете знайти способи уповільнити смерть так само, як і ви можете повільно ентропії. Ви також можете виправдати ентропію, відремонтувавши пошкодження (іншими словами: ви не можете зупинити корупцію, але ви можете відновити їх після того, як вони відбудуться, якщо вжити заходів заздалегідь!). Як і все, що стосується життя та смерті, тут немає жодної магічної кулі, ані одного рішення для всіх, а найкращі рішення вимагають від вас безпосередньо брати участь у цифровій курації ваших даних. І навіть якщо ви все зробите правильно, ви не гарантуєте збереження своїх даних, ви лише максимізуєте свої шанси.
Тепер про добру новину: зараз є досить ефективні способи збереження ваших даних, якщо ви поєднуєте носії хорошої якості зберігання та хороші стратегії архівації / зберігання : вам слід розробити на помилку .
Які хороші стратегії курації? Давайте розберемося одне: більша частина інформації, яку ви знайдете, стосуватиметься резервного копіювання, а не архівної. Проблема полягає в тому, що більшість людей передадуть свої знання про стратегії резервного копіювання в архівні архіви, і, таким чином, зараз багато чують міфи. Дійсно, зберігання даних протягом декількох років (резервне копіювання) та зберігання даних протягом найменшого можливого періоду, що охоплює принаймні десятиліття (архівні), є абсолютно різними цілями, і тому потрібні різні інструменти та стратегії.
На щастя, існує досить багато досліджень та наукових результатів, тому я раджу звертатися до тих наукових праць, а не на форумах чи журналах. Тут я підсумую деякі свої читання.
Крім того, будьте обережні до претензій і незалежних наукових досліджень, стверджуючи, що таке чи таке носій інформації є ідеальним. Згадайте відомий проект BBC Dom Tuesday: «Книга цифрового вівторка триває 15 років, а не 1000» . Завжди двічі перевіряйте дослідження справді незалежними документами, а якщо таких немає, завжди припускайте, що носій зберігання даних не є корисним для архіву.
Давайте уточнимо, що ви шукаєте (з вашого питання):
Довгостроковий архів : ви хочете зберігати копії ваших чутливих, невідтворюваних "особистих" даних. Архівництво принципово відрізняється від резервного копіювання , як це добре пояснено тут : резервні копії - це динамічні технічні дані, які регулярно оновлюються і тому потребують оновлення в резервні копії (тобто ОС, макет робочих папок тощо), тоді як архіви - це статичні дані, які ви, ймовірно, пишете лише один раз і час від часу читаєте просто . Архів - це тимчасові дані , як правило, особисті.
Холодне зберігання : ви хочете максимально уникнути збереження заархівованих даних. Це є великим обмеженням, оскільки це означає, що носій повинен використовувати компоненти та методологію написання, які залишаються стабільними протягом тривалого часу, без будь-яких маніпуляцій з вашого боку та без необхідності підключення до комп'ютера чи електропостачання.
Щоб полегшити наш аналіз, давайте спочатку вивчимо рішення для зберігання холоду, а потім довгострокові архівні стратегії.
Середовища для зберігання холоду
Вище ми визначили, яким повинен бути хороший холодильний носій: він повинен зберігати дані протягом тривалого часу без будь-яких маніпуляцій, необхідних (тому його називають "холодним": ви можете просто зберігати його в шафі, і вам не потрібно підключати його до комп’ютер для підтримки даних).
Папір може здатися найбільш стійким середовищем зберігання на землі, тому що ми часто знаходимо дуже старий рукопис з давніх часів. Однак папір страждає від основних недоліків: по-перше, щільність даних дуже низька (не можна зберігати більше ніж 100 КБ на папері, навіть із крихітними символами та комп’ютерними інструментами), і вона з часом деградує, не маючи змоги контролювати це: папір , як і жорсткі диски, страждають від мовчазної корупції. Але тоді як ви можете контролювати беззвучні пошкодження цифрових даних, ви не можете на папері. Наприклад, ви не можете гарантувати, що малюнок збереже ті самі кольори протягом лише десятиліття: кольори погіршаться, і у вас немає ніякого способу знайти, які були оригінальні кольори. Звичайно, можна вилікувати ваші фотографії, якщо ви професіонал відновлення зображень, але це вимагає великих витрат часу, тоді як за допомогою цифрових даних ви можете автоматизувати процес курірування та відновлення.
Жорсткі диски (HDD) будуть відомі до мають середню тривалість життя від 3 до 8 років: вони не просто деградують з часом, вони гарантовано в кінці кінців вмирають (тобто недоступні). Наступні криві показують цю тенденцію до вмирання всіх жорстких дисків з приголомшливою швидкістю:
Крива ванни, що показує еволюцію рівня відмов жорсткого диска, враховуючи тип помилки (також застосовно до будь-якого інженерного пристрою):
Крива, що показує рівень відмов жорсткого диска, всі типи помилок об'єднані:
Джерело: Backblaze
Ви можете бачити, що існують 3 типи жорстких дисків відносно їх відмови: швидко вимираючі (наприклад: помилки виробництва, жорсткі жорсткі диски поганої якості, відмова голови тощо), постійні показники вмирання (гарне виробництво, вони вмирають за різні " нормальні "причини". Це стосується більшості жорстких дисків), і нарешті, надійні, які живуть трохи довше, ніж більшість жорстких дисків, і в кінцевому підсумку гинуть незабаром після "нормальних" (наприклад, щасливі жорсткі диски, не надто використовувані, ідеальні умови навколишнього середовища тощо.). Таким чином, вам гарантується, що ваш жорсткий диск помре.
Чому жорсткі диски гинуть так часто? Я маю на увазі, дані записуються на магнітний диск, і магнітне поле може тривати десятиліттями, перш ніж згасати. Причина їх вмирання полягає в тому, що накопичувач (магнітний диск) та обладнання для читання (електронна дошка + прядильна головка) з'єднані між собою : їх неможливо відмежувати, ви не можете просто витягнути магнітний диск і прочитати його іншою головою, тому що спочатку електронна плата (яка перетворює фізичні дані в цифрову) відрізняється майже для кожного жорсткого диска (навіть тієї ж марки та посилання, це залежить від виробника, що виробляє), а внутрішній механізм із прядильною головкою настільки складний, що сьогодні неможливо для людини ідеально розмістити прядильну головку на магнітних дисках, не вбиваючи їх.
Крім того, відомо, що жорсткі диски демагнітизуються з часом, якщо не використовуються (включаючи SSD). Таким чином, ви не можете просто зберігати дані на жорсткому диску, зберігати їх у шафі і вважати, що вони зберігатимуть дані без будь-якого електричного з'єднання: вам потрібно підключати ваш HDD до електричного джерела хоча б раз на рік або за пару років . Таким чином, жорсткі диски явно не підходять для зберігання в холоді.
Магнітні стрічки : їх часто описують як доповнення для резервного копіювання, а розширення - для архівних. Проблема з магнітними стрічками полягає в тому, що вони ДУЖЕ чутливі: магнітні оксидні частинки можуть легко руйнуватися сонцем, водою, повітрям, подряпинами, розмагнічуватися часом або будь-яким електромагнітним пристроєм або просто випадати з часом, або друкуватись . Ось чому їх зазвичай використовують лише у центрах обробки даних професіонали. Також ніколи не було доведено, що вони можуть зберігати дані більше десятиліття. Отже, чому їх часто радять робити резервні копії? Оскільки вони раніше були дешевими: у минулі часи це коштувало від 10 до 100 разів дешевше використовувати магнітні стрічки, ніж жорсткі диски, а жорсткі диски, як правило, були набагато менш стабільними, ніж зараз. Тож магнітні стрічки в першу чергу радять для резервного копіювання через економічну ефективність, а не через стійкість, яка саме нас найбільше цікавить, коли йдеться про архівування даних.
Карти CompactFlash та Secure Digital (SD), як відомо, досить міцні та надійні, здатні пережити катастрофічні умови .
Карти пам'яті у більшості камер практично незнищенні, виявив журнал Digital Camera Shopper. П’ять форматів карт пам'яті вижили, коли варили, топтали, мили та пили у каві чи кола.
Однак, як і будь-який інший магнітний носій, він покладається на електричне поле для збереження даних, і, таким чином, якщо на картці закінчиться сік, дані можуть повністю втратитись. Таким чином, не ідеально підходить для зберігання в холоді (як потрібно періодично переписувати цілі дані на карту для оновлення електричного поля), але це може бути хорошим середовищем для резервного копіювання та коротко- чи середньострокового архіву.
Оптичні носії: Оптичні носії - це клас середовищ зберігання даних, що покладаються на лазерне зчитування даних, наприклад CD, DVD або Blu-ray (BD). Це можна розглядати як еволюцію паперу, але ми записуємо дані настільки крихітними розмірами, що нам потрібен був більш точний і пружний матеріал, ніж папір, а оптичні диски - це саме це. Дві найбільші переваги оптичних носіїв полягають у тому, що носій інформації відокремлюється від обладнання для читання (тобто, якщо ваш зчитувач DVD виходить з ладу, ви завжди можете придбати інший для читання вашого диска) і що він базується на лазері, що робить його універсальним і майбутнє підтвердження (тобто, доки ви знаєте, як зробити лазер, ви завжди можете налаштувати його, щоб прочитати біти оптичного диска шляхом емуляції, як це робив CAMILEON для проекту BBC BBC у вівторок ).
Як і будь-яка технологія, нові ітерації пропонують не тільки більшу щільність (сховище), але й кращу корекцію помилок та кращу стійкість до занепаду навколишнього середовища (не завжди, але загалом вірно). Перші суперечки щодо надійності DVD були між DVD-R та DVD + R, і навіть якщо DVD-R все ще поширені в наші дні, DVD + R визнані більш надійними та точними . Зараз існують архівні DVD-диски, спеціально зроблені для зберігання в холоді, які стверджують, що вони можуть витримати мінімум ~ 20 років без будь-якого технічного обслуговування:
Verbatim Gold Archival DVD-R [...] був оцінений як найнадійніший DVD-R в ретельному довготерміновому стрес-тесті добре розглянутим німецьким журналом c't (c't 16/2008, стор. 116-123 ) [...] досягнення мінімальної міцності 18 років і середньої довговічності від 32 до 127 років (при 25 ° С, 50% вологості). Жоден інший диск не наблизився до цих значень, другий найкращий DVD-R мав мінімальну довговічність лише 5 років.
З LinuxTech.net .
Крім того, деякі компанії, що спеціалізуються на дуже довгострокових архівах DVD і широко продають їх на ринок, як-от M-Disc від Millenniata або DataTresorDisc, стверджуючи, що вони можуть зберігати дані протягом більше 1000 років і перевірені деякими (незалежними) дослідженнями (з 2009) серед менш наукових інших .
Це все здається дуже перспективним! На жаль, не вистачає незалежних наукових досліджень, щоб підтвердити ці твердження, і кілька доступних не є настільки захопленими:
Вологість (80% RH) та температура (80 ° C) прискорили старіння на декількох DVD-дисках протягом 2000 годин (приблизно 83 дні) тесту, регулярно перевіряючи читабельність даних:
Перекладено з французької установи архіву цифрових даних (Archives de France), дослідження з 2012 року.
Перший графік показує DVD з повільною еволюцією деградації. Другий DVD із кривими швидкої деградації. І третій - для спеціальних DVD-дисків, "дуже довгострокових", таких як M-Disc та DataTresorDisc. Як ми бачимо, їх продуктивність не зовсім відповідає претензій, будучи нижчими або нарівні зі стандартними, неархівними DVD-дисками!
Однак неорганічні оптичні диски, такі як M-Disc і DataTresorDisc, отримують одну перевагу: вони досить нечутливі до деградації світла:
Прискорене старіння за допомогою світла (750 Вт / м²) протягом 240 годин:
Це чудові результати, але DVD із архівним рівнем, наприклад, «Вербатим Золотой архів» також досягає такої ж продуктивності, і, крім того, світло є найбільш керованим параметром для об’єкта: досить просто помістити DVD у закриту коробку чи шафу, і таким чином усуваючи будь-який можливий вплив світла. Було б набагато корисніше придбати DVD, який дуже стійкий до температури та вологості, ніж світло.
Ця ж дослідницька група також вивчила ринок Blu-ray, щоб перевірити, чи не знайдеться якийсь бренд з хорошим середовищем для тривалого зберігання в холоді. Ось їх висновок:
Вологість і температура прискорили старіння на декількох брендах Blu-ray за тими ж параметрами, що і для DVD-дисків:
Легке прискорене старіння на кількох брендах BluRays, однакові параметри:
Перекладено з цього дослідження Archives de France, 2012.
Два зведення всіх висновків (французькою мовою) тут і тут .
Насправді, найкращий диск Blu-ray (від Panasonic) виконаний аналогічно найкращому DVD з архівним класом у тесті на вологість + температуру, хоча він практично не чутливий до світла! І цей диск Blu-ray не має навіть архівної оцінки. Крім того, диски Blu-ray використовують розширений код для виправлення помилок, ніж DVD-диски (самі використовують розширену версію відносно компакт-дисків), що додатково мінімізує ризики втрати даних. Таким чином, здається, що деякі диски BluRay можуть бути дуже хорошим вибором для зберігання в холоді.
Дійсно, деякі компанії починають працювати над архівними дисками Blu-ray з високою щільністю, наприклад, Panasonic та Sony, оголошуючи, що вони зможуть запропонувати 300 ГБ до 1 ТБ пам’яті із середньою тривалістю життя 50 років. Також великі компанії звертаються до оптичних носіїв для зберігання в холоді (адже це забирає набагато менше ресурсів, оскільки ви можете холодильно зберігати їх без будь-якого електропостачання), наприклад, Facebook, який розробив робототехнічну систему для використання Blu-ray дисків як "холодних" зберігання " для даних, до яких їх система рідко отримує доступ.
Архівна ініціатива Long Now: Є й інші цікаві ведучі, такі як проект Rosetta Disc від музею Long Now , який є проектом написання мікроскопічно розроблених сторінок "Буття" на всіх мовах на землі, на які була переведена Генеза. Це чудовий проект, який першим запропонував носій, який дозволяє зберігати 50 Мб для дійсно дуже тривалого зберігання в холоді (оскільки це записано у вуглеці) та з надійним доступом, оскільки вам потрібна лише лупа для доступу до дані (жодних дивних специфікацій формату, ні технологічних клопотів для обробки таких, як фіолетовий промінь Blu-ray, просто потрібна лупа!). Однак вони все ще виготовляються вручну і, таким чином, оцінюються в 20 доларів, що, мабуть, занадто багато для особистої архівної схеми.
Інтернет-рішення: Ще одна мережа для зберігання ваших даних у мережі. Однак рішення хмарного резервного копіювання не дуже підходять, оскільки головна проблема, ніж хмарні хостингові компанії, можуть не жити до тих пір, поки ви хочете зберегти свої дані. До інших причин можна віднести той факт, що резервне копіювання страшенно повільно (оскільки воно передається через Інтернет), і більшість постачальників вимагають, щоб файли також існували у вашій системі, щоб підтримувати їх в Інтернеті. Наприклад, і CrashPlan, і Backblaze назавжди видалять файли, які хоча б не бачилися один раз на вашому комп’ютері протягом останніх 30 днів, тому якщо ви хочете завантажити дані резервного копіювання, які ви зберігаєте лише на зовнішніх жорстких дисках, вам доведеться підключити свій USB HDD принаймні раз на місяць та синхронізуйте із хмарою, щоб скинути відлік часу. Однак, деякі хмарні сервіси пропонують зберігати ваші файли нескінченно (поки ви заплатите звичайно) без зворотного відліку, наприклад, SpiderOak. Тому будьте дуже уважні до умов та використання хмарного резервного рішення, яке ви обрали.
Альтернативою постачальникам резервних копій у хмарі є оренда власного приватного сервера в Інтернеті, і, якщо можливо, виберіть його з автоматичним дзеркальним відображенням / резервним копією ваших даних у разі відмови обладнання на їх стороні (декілька з них навіть гарантують вам дані, втрачені в їхніх контрактах , але звичайно це дорожче). Це чудове рішення, по-перше, тому що ви все ще володієте своїми даними, а по-друге, тому що вам не доведеться керувати відмовами обладнання, це відповідальність вашого хоста. І якщо одного дня ваш хост припинить роботу, ви все одно можете отримати свої дані (виберіть серйозного хоста, щоб вони не вимикалися протягом ночі, але повідомили вас заздалегідь, можливо, ви можете попросити поставити це на договір), і реконструювати в інших місцях.
Якщо ви не хочете турбуватися про налаштування власного приватного інтернет-сервера, і якщо ви можете собі це дозволити, Amazon пропонує нову послугу архівації даних під назвою Glacier . Мета полягає саме в тому, щоб довго зберігати ваші дані: таким чином, зберігання даних на льодовику коштує багато, але повернення цих даних коштує ще більше, оскільки ця послуга створена для зберігання даних поза досяжністю , не зберігати дані, до яких ви хочете часто отримувати доступ. Це означає, що ця послуга котирує ціни на запис даних, а також на їх читання. Ця послуга має величезну вартість, але це може бути хорошою пропозицією для найбільш вагомих даних (тобто: якщо у вас є кілька текстових файлів або зображень, ДУЖЕ чутливих, оскільки такі дані зазвичай мають невеликий розмір, це не обійдеться вам дуже дорого для зберігання в льодовику).
Недоліки холодного зберігання : Однак у будь-якому середовищі зберігання холодів є великий недолік: немає перевірки цілісності, оскільки холодні носії зберігання не можуть автоматично перевіряти цілісність даних (вони можуть просто реалізувати схеми виправлення помилок, щоб "залікувати" трохи збиток після пошкодження стався, але його не можна запобігти чи автоматично керувати!), оскільки, навпаки, на комп’ютері, немає жодного процесорного пристрою для обчислення / журналізації / перевірки та виправлення файлової системи. Тоді як за допомогою комп'ютера та декількох одиниць зберігання даних, ви можете автоматично перевірити цілісність своїх архівів і автоматично відобразити дзеркало на інший при необхідності, якщо в архіві даних сталася якась пошкодження (якщо у вас є кілька копій одного архіву).
Довгостроковий архів
Навіть з найкращими доступними в даний час технологіями, цифрові дані можуть зберігатися в холоді протягом декількох десятиліть (приблизно 20 років). Таким чином, у перспективі ви не можете розраховувати лише на зберігання в холодному режимі: вам потрібно встановити методологію процесу архівування даних, щоб забезпечити можливість відновлення даних у майбутньому (навіть із технологічними змінами) та мінімізувати ризики. втрати ваших даних. Іншими словами, вам потрібно стати цифровим куратором ваших даних, виправляючи пошкодження, коли вони трапляються, і відтворювати нові копії, коли це потрібно.
Немає дурних правил, але ось кілька сформованих стратегій курінгу , зокрема магічний інструмент, який полегшить вашу роботу:
- Принцип надмірності / реплікації : надлишок - єдиний інструмент, який може повернути наслідки ентропії , що є принципом, заснованим на теорії інформації. Щоб зберегти дані, потрібно дублювати ці дані. Коди помилок - це саме автоматичне застосування принципу надмірності. Однак вам також потрібно забезпечити надмірність ваших даних: декілька копій одних і тих же даних на різних дисках, кілька копій на різних носіях (так що, якщо один носій вийшов з ладу через внутрішні проблеми, мало шансів, що інші на різних носіях також вийдуть з ладу одночасно) тощо. Зокрема Ви завжди повинні мати принаймні 3 копії своїх даних, які також називаються 3-модульною надмірністю в техніці, так що якщо Ваші копії пошкоджуються, Ви можете подати голос простою більшістю голосів, щоб відновити Ваші файли з Ваших 3-х примірників. Завжди пам’ятайте поради щодо моряка щодо компаса:
Немає сенсу брати два циркуль, тому що якщо один піде не так, ви ніколи не можете знати, який з них правильний, або якщо обидва помиляються. Завжди візьміть один компас або більше трьох.
Помилка виправлення кодів : це магічний інструмент, який полегшить ваше життя та безпечніші дані. Корекція помилок (ECC) - це математична конструкція, яка генерує дані, які можна використовувати для відновлення ваших даних. Це більш ефективно, тому що ECC можуть відремонтувати набагато більше ваших даних, використовуючи набагато менше місця для зберігання, ніж проста реплікація (тобто, зробити кілька копій ваших файлів), і вони навіть можуть бути використані для перевірки наявності у вашому файлі будь-якого корупція та навіть знайти місце, де ці корупції. Насправді це саме застосування принципу надмірності, але розумнішим способом, ніж реплікація. Ця методика широко застосовується в будь-якій комунікації далекого діапазону в наші дні, наприклад, 4G, WiMax і навіть космічні комунікації NASA. На жаль, незважаючи на те, що ECC всюди є в телекомунікаціях, вони не в ремонті файлів, можливо, тому, що це трохи складно. Однак доступні деякі програми, наприклад, добре відомі (але вже старі) PAR2, DVD Disaster (які пропонують додати коди виправлення помилок на оптичних дисках) та pyFileFixity (які я частково розробляю для подолання обмежень та проблем PAR2). Існують також файлові системи, які необов'язково реалізують Reed-Solomon, такі як ZFS для Linux або ReFS для Windows, які технічно є узагальненням RAID5.
Регулярно перевіряйте цілісність своїх файлів: Зберігайте файли та періодично перевіряйте їх (тобто раз на рік, але це залежить від середовища зберігання та умов навколишнього середовища). Коли ви побачите, що ваші файли постраждали від пошкодження, настав час відновити за допомогою створених ECC, якщо ви це зробили, та / або зробити нову свіжу копію своїх даних на новому носії інформації. Перевірка даних, усунення корупції та створення нових свіжих копій - це дуже хороший цикл курації, який забезпечить безпеку ваших даних. Зокрема, перевірка дуже важлива, оскільки копії ваших файлів можуть бути тихо пошкоджені, і якщо ви потім скопіюєте підроблені копії, ви отримаєте повністю пошкоджені файли. Це ще важливіше для холодних середовищ зберігання даних, таких як оптичні диски, які CANNOT автоматично перевіряють цілісність даних (вони вже впроваджують ECC, щоб трохи зажити, але вони не можуть перевірити або створити нові свіжі копії автоматично, це ваша робота!). Для контролю за змінами файлів ви можете використовувати сценарій rfigc.pypyFileFixity або інші інструменти UNIX, такі як md5deep . Ви також можете перевірити стан здоров'я деяких середовищ зберігання даних, як-от жорсткі диски, використовуючи такі інструменти, як Sentinel на жорсткому диску або smartmontools з відкритим кодом .
Зберігайте свої архіви в різних місцях (принаймні одна копія поза вашим будинком!), Щоб уникнути катастрофічних подій у реальному житті, таких як повені чи пожежі. Наприклад, один оптичний диск у вашій роботі або хмарне резервне копіювання можуть бути хорошою ідеєю для усунення цієї вимоги (навіть якщо хмарні провайдери можуть бути вимкнені в будь-який момент, якщо у вас є інші копії, ви будете в безпеці , провайдери хмарних ситуацій будуть виконувати функції архіву за межами сайтів лише у випадку надзвичайних ситуацій).
Зберігати в конкретних контейнерах з контрольованими параметрами навколишнього середовища : для оптичних середовищ зберігати подалі від світла та у водонепроникній коробці, щоб уникнути вологи. Для жорстких дисків та sd-карт зберігайте в антимагнітних втулках, щоб уникнути залишків електроенергії, щоб підробити накопичувач. Ви також можете зберігати в герметичній та непромокальній воді сумці / коробці та зберігати в морозилці: повільні температури повільно сприймуть ентропію, і ви можете досить довго продовжити термін служби будь-якого подібного носія (просто переконайтеся, що вода перемогла не заходьте всередину, інакше ваш засіб швидко помре).
Використовуйте апаратуру хорошої якості та заздалегідь перевірте їх (наприклад: коли ви купуєте SD-карту, протестуйте всю карту за допомогою програмного забезпечення, такого як HDD Scan, щоб перевірити, чи все в порядку, перш ніж писати ваші дані). Це особливо важливо для оптичних накопичувачів, оскільки їх якість може кардинально змінити якість ваших згорілих дисків, як показало дослідження Archives de France (поганий записуючий пристрій DVD дасть DVD, які триватимуть набагато менше).
Вибирайте ретельно свої формати файлів: не всі формати файлів стійкі до корупції, деякі навіть явно слабкі. Наприклад, зображення у форматі .jpg можуть бути повністю порушені та нечитабельні, підробляючи лише один чи два байти. Те саме для архівів 7zip. Це смішно, тому будьте уважні щодо формату файлів, які ви архівуєте. Як правило, простий чіткий текст найкращий, але якщо вам потрібно стиснути, використовуйте непомітний zip та для зображень, використовуйте JPEG2 (ще не з відкритим кодом ...). Більше інформації та відгуки про цифрові куратори тут , тут і тут .
Зберігайте поряд зі своїми архівами даних все програмне забезпечення та технічні характеристики, необхідні для читання даних. Пам’ятайте, що технічні характеристики швидко змінюються, і, таким чином, надалі ваші дані вже не будуть читатими, навіть якщо ви можете отримати доступ до файлу. Таким чином, вам слід віддавати перевагу форматам та програмному забезпеченню з відкритим кодом та зберігати вихідний код програми вздовж своїх даних, щоб ви завжди могли адаптувати програму від вихідного коду до запуску з нової ОС або комп’ютера.
Безліч інших методів та підходів доступні тут , тут і в різних частинах Інтернету.
Висновок
Я раджу використовувати те, що ви можете мати, але завжди дотримуйтесь принципу надмірності (зробіть 4 копії!), І завжди регулярно перевіряйте цілісність (тому потрібно заздалегідь генерувати базу даних хешів MD5 / SHA1) та створити нові копії у випадку корупції. Якщо ви це зробите, ви можете технічно зберігати свої дані довгий час, наскільки ви хочете, яким би не був ваш носій інформації. Час між кожною перевіркою залежить від надійності ваших носіїв пам’яті: якщо це дискета, перевіряйте кожні 2 місяці, чи це HTL Blu-ray, перевіряйте кожні 2/3 роки.
Зараз в оптимальному випадку я раджу для зберігання в холодному режимі використовувати диски Blu-ray HTL або DVD- диски з архівним класом, які зберігаються у непромокальних водонепроникних коробках та зберігаються у свіжому місці. Крім того, ви можете використовувати SD-карти та постачальників хмарних технологій, таких як SpiderOak, щоб зберігати зайві копії даних або навіть жорсткі диски, якщо вони доступні вам.
Використовуйте багато кодів для виправлення помилок , вони врятують ваш день. Також ви можете зробити декілька копій цих файлів ECC (але кілька копій ваших даних важливіше, ніж декілька копій ECC, тому що файли ECC можуть самостійно відремонтувати!).
Усі ці стратегії можна реалізувати за допомогою набору інструментів, які я розробляю (відкритий код): pyFileFixity . Цей інструмент насправді був запущений цією дискусією, виявивши, що не існує вільного інструменту для повного керування коректністю файлів. Також, будь ласка, зверніться до проекту та вікі проекту, щоб отримати докладнішу інформацію про виправлення файлів та цифрову курацію.
Нарешті, я дуже сподіваюсь, що на цю проблему буде поставлено більше науково-дослідних робіт. Це головне питання для нашого нинішнього суспільства, де все більше даних оцифровується, але без жодної гарантії, що ця маса інформації збережеться більше кількох років. Це дуже гнітюче, і я дійсно думаю, що це питання слід поставити набагато більше на передній план, щоб це стало маркетинговою точкою для будівельників і компаній, щоб зробити пристрої зберігання даних, які можуть тривати для наступних поколінь.
/ EDIT: читайте нижче для практичного кураційного розпорядку .