Довготривале зберігання бізнес-критичних даних


16

Це справді хитро, і певною мірою це не технічна проблема, і тут може не належати, але

Помилка сервера - це системні адміністратори ..., які керують комп'ютером або підтримують його професійно

І я роблю .. і це одне з моїх завдань .. У всякому разі.

Уявіть, у вас було 5000 + двосторонніх сторінок формату А4. Дані компанії, усі важливі для бізнесу.
Вам потрібно якось підкріпити це. Наразі пропоновані рішення:

  1. PDF -> Інтернет-сховище
  2. PDF -> DVD / BluRay / стрічка
  3. PDF -> Портативний жорсткий диск / SSD / флешка.
  4. Купуйте / орендуйте / наймайте / 'Викрадайте' великий фотокопіювальний апарат і робіть копії.
  5. ???

Негайні проблеми з вищезазначеним:

  1. Що робити, якщо партнер сховища розбився?
  2. DVD з часом гниють. Стрічки аналогічно.
  3. Вони теж з часом ламаються.
  4. Дорогий. Повільно. Важка. Не дерево.

Питання:

Що є золотим стандартом для збереження та архівації даних на довгостроко та середньострокового періоду? Ви вирішили подібну проблему на робочому місці?

Після початкового завантаження є певна вимога додавати до колекції приблизно 100 сторінок на місяць. Пошук повинен бути можливим, легким, але, ймовірно, нечасто.
В ідеалі я хотів би гарантувати, що рішення буде корисним протягом довгого часу після того, як я покину компанію, і що йому не знадобиться величезна кількість, щоб зберегти його доступним, тому зберігання багатьох багатьох DVD-дисків не тільки не ідеально, але й не хороше довгострокове рішення.

Хоча просто робити паперові копії, звичайно, найпростіше, але це не є екологічно чистим, не дуже довгим. Це також не дуже керований, важкий для пошуку, індексування тощо. У поєднанні з важкими і важко зберігати фізично.

Мені в принципі дуже подобається ідея мати все, що зберігається в електронному вигляді, але власне механізм цього повинен бути прозорим і легким. Я дійсно не хочу відповідати за це вічно і цілий день, підтримуючи користувачів офісів, коли вони піднімають це, і втрачають документи. Я також не хочу покладатися на одного постачальника пам’яті, що робити, якщо Dropbox (у нас є онлайн-резервне рішення для банкоматів, але це не Dropbox.) Повинен розрушитися або іншим чином зазнати катастрофічної події, скільки підприємств хто користується їхніми послугами, був би вгору за течією, не вести весло?

Тут є деяка гнучкість бюджету, але я підозрюю, що все, що коштує більше, ніж наші поточні резервні копії в Інтернеті (як, наприклад, 2500USD / рік), було б розглянуто менш вигідно, порівняно з тим, що просто помістити його в коробку для взуття під ліжком. Що без сумніву, що буде, якщо я нічого не зробив, а завтра пішов у відставку.

Будь-які ідеї?

-Edit-

Причина для цього двояка.

1) забезпечити розумне безпечне резервне копіювання ділової критичної документації у випадку, якщо офіс згоряє.

2) задоволення законів про архівування даних WRT uk податкового законодавства для підприємств тощо.

Редагувати 2:

Маючи якийсь механізм індексації документів, теж було б корисно.


Я збив швидкий сценарій для виконання PDF-> Txt з ghostscript і gocr. Однозначно розглядаю, як вивести все в db SQLlite, щоб зробити якийсь цікавий індекс для даних.
Том О'Коннор

Надлишок (цифрових носіїв) та збереження надмірності протягом багатьох років можуть стати вашим найкращим другом.
Vortico

Відповіді:


5

Зберігання даних у такому форматі, як PDF, ймовірно, безпечне, оскільки для їх читання існують безкоштовні інструменти. Обсяг даних, про який ви говорите, досить невеликий (1200 сторінок на рік), тому навіть при роздільній здатності сканування 300 dpi ви говорите лише про десятки гігабайт на рік.

Однак проблема фізичного накопичувача ніколи не згасне. Які б носії ви не використовували для зберігання електронних даних (стрічкових, оптичних тощо), з часом потрібно буде оновити на новіші носії. План і бюджет для "перенесення даних по дорозі" до нових форматів, оскільки нові формати замінюють старі формати.

Я б, напевно, дивився на оптичні носії як на перший вибір просто тому, що у вас так мало даних. Я б також планував спалювати 3-кратні дублікати всього і освіжати засоби масової інформації кожні 2 - 3 роки.

Якщо оптичних носіїв занадто мало, я б переходив на LTO-стрічку і оновлював носії кожні 4 - 5 років. Однак це буде досить дорого для такої невеликої кількості даних.


DVD? Або Blu-ray? Чи є BR ще розважливим форматом для даних?
Том О'Коннор

1
@Tom O'Connor: Вони мені здаються однаковими. Я б розглядав вартість, щоб прийняти це рішення. Зараз там є пробіли Blu-Ray "архівного класу", тому з технічної точки зору це здається життєздатним форматом. (Виробники кажуть, що носій Blu-Ray має "рейтинговий" термін життя 200 років не дає мені більше впевненості, ніж ті, хто сказав, що архівні DVD-носії мали 100-річний "рейтинг" життя ...)
Еван Андерсон

У мене є кілька CD-дисків Kodak GOLD приблизно з 1998 року, або близько того, і вони все ще читаються. У мене також є кілька вільних, де шар фарби відокремився, і вони накручені.
Том О'Коннор

Я не припускаю, що в архіві немає різниці між неархівними носіями інформації. Я просто кажу, що носії архівів Blu-Ray порівняно із засобами архіву DVD з архівами не здаються мені дуже різними. Якщо порівнювати архівну оцінку з носієм "шпинделя 100 за $ 20,00" - це зовсім інша історія.
Еван Андерсон

Один із предметів, що не згадувався, - це твердотільне зберігання (USB-накопичувачі): більший за оптичний, менший за LTO. USB, ймовірно, буде щонайменше ще десятиліття-два, а 16-дюймовий або 32 Гб-палець (або два, або три) є досить дешевим з точки зору вартості архівації. Оскільки мова йде про «Написати-раз-читайте-багатьом», вам не доведеться турбуватися про зношеність клітин SSD, тому теоретично ви могли б зберігати палички протягом 5 і більше років у вогнестійкому сховищі.
voretaq7

6

Існують спеціальні системи, які внутрішньо використовують DVD-диски та переносять дані на нові носії так часто. Знайдіть цифрове збереження.

Оскільки вимоги до пам’яті зростають досить швидко, то в будь-якому випадку бажано переходити на новіші, більші типи носіїв інформації кожні кілька років.

Якщо ви отримаєте дані в паперовій формі, вам потрібно:

  1. Перерахуйте дані при введенні пошти. Це може означати надання кожному аркуша унікального штрих-коду.
  2. Скануйте його. Використовуйте ідентифікатор штрих-коду як ім'я файлу. Заархівуйте папір.
  3. Заархівуйте дані. Помістіть дані у захищену систему архівації. Сервер файлів буде недостатньо хорошим, тому що з файлами може статися щось, якщо вони доступні для запису.
  4. Зробити доступним для читання для інших систем.

У випадку із замовниками, всі рахунки-фактури для великих організацій мають бути переведені в онлайн-систему (SAP). На сьогодні архів зберігав кілька ітерацій. В даний час вони переходять на блакитний промінь.

З іншого боку, сьогодні все виходить на диски, тому, можливо, щось у цьому напрямку стане вашим шляхом: http://www.eurostor.com/german/iTernity.D.php


Майте на увазі, що більшість DVD-R (та інших) триває лише кілька років до погіршення. Дорогі "архівні" речі тривають довше, якщо зберігати згідно з інструкціями.
Chris S

Так само і у більшості дисків, серверів, файлових систем або форматів документів. Архівування означає переміщення даних. Спробуйте прочитати PDF через 20 років. Ви пам’ятаєте, яким був стандарт 10 років тому? У нас насправді немає нічого, що наближається до паперу. За винятком копіювання та вставки ...
Posipiet

Чисті текстові документи все ще досить легко читаються.
Барт Сільверстрім

Існують безкоштовні інструменти для читання PDF-файлів. Поки вони "звичайні ванілі", я б не надто хвилювався. TIFF теж хороший варіант.
Еван Андерсон

3

Наше рішення: Сканувати в PDF -> Резервне копіювання на стрічку

У нас є сканер документів, складає ~ 30 сторінок / хв і виробляє OCRed PDF-файли. Ми повертаємо їх до Tape (зокрема LTO4), який має термін зберігання від 50 до 100 років (знайти стрічковий накопичувач може бути складним у часові рамки, але є місця для відновлення даних, які все одно відновлять 8-дюймові дискети навколо).


2
Мені довелося google 8 "floppy ....
Holocryptic

Я зберігаю резервні стрічки з Mac OS 7.5. Але диск зламався, носії програм резервного копіювання втрачаються. Мені вдалося перевстановити Mac, але я не можу прочитати стрічку, оскільки у мене немає програми резервного копіювання. І, чесно кажучи, я навіть не пам’ятаю його назви. Так, стрічка може тривати 100 років. Але читач не хоче.
Posipiet

@Holocryptic: Лише кілька місяців тому я викинув незакриту коробку дисперсних жорстких 8-
дюймових

1
@Holocryptic: NSFW! NSFW !!
Барт Сільверстрім

@Posipiet, я думаю, я висвітлював той факт, що накопичувачі не працюють вічно, але є компанії, які спеціалізуються на відновленні даних практично з будь-яких часто використовуваних носіїв.
Chris S

3

Я думаю , що нова послуга «Льодовик Amazon» - це цікава пропозиція в цьому просторі.

Амазонський льодовик оптимізований для даних, до яких нечасто звертаються, і для яких час пошуку становить кілька годин. Завдяки Amazon Glacier, клієнти можуть надійно зберігати великі або малі обсяги даних за ціною лише $ 0,01 за гігабайт на місяць, що значно заощаджує порівняно з локальними рішеннями.


2
Витрати на пошуки шалено величезні.
Том О'Коннор

2

Перший крок, резервне копіювання: перезаписуйте документи, а потім упорядковуйте всі слова у серії романів про католицьку церкву, Opus Dei та тамплієрів. У вас повинно бути достатньо вхідних даних для приблизно 10 романів і ще близько одного щороку або близько того назавжди. Підтримуйте таблицю пошуку, яка містить оригінальне розташування слів у вихідних документах (у порядку джерела), і остаточне розташування у романах; зберігати повторювані слова в одному записі таблиці. Забезпечте видавничу угоду і опублікуйте мільйони романів. Використовуйте дохід від продажу книг для фінансування операцій з перестановки OCR і перестановки слів. Подрібніть оригінали документів і продайте їх як постільну білизну хом'яків. Іноді може знадобитися розміщувати замовлення на розп’яття, антиматеріали або квитки на літак до екзотичних місць, якщо у вхідних документах вам не вистачає словникового запасу.

Крок другий, відновлення / доступ: немає необхідності зберігати копії даних - все, що вам потрібно, - це ваша таблиця пошуку та книгозбірня у секонд-хенді.

Оскільки таблиця пошуку є вашою єдиною точкою відмови, вам все одно потрібно буде створити резервну копію. Завдяки застосованій схемі кодування Хаффмана це буде досить мало, порівняно з вашими вхідними документами, тому, ймовірно, можна скопіювати на DVD. Для резервного резервного копіювання сідайте перед каміном та читайте таблицю пошуку, роблячи відео. Розмістіть свій відеоролик про злиття мистецтва та технологій у сучасній галереї Tate, на постійному дисплеї.


1

Трохи рано купувати, але здається, що HDS придумав постійний механізм зберігання даних, заснований на кварці, - читайте .


1
Я чув багато разів про це твердження про постійність, що я ніколи не вірю в це, і ніхто з нас не проживе досить довго, щоб коли-небудь побачити це доведеним. Прогнози постійності абсолютно нікчемні і незмінно виявляються неправильними.
Джон Гарденєр

-2

Мені потрібно висунути Humyo.com (куплений Trend Micro - середнє ім'я - безпека)

Вони шифрують усі дані користувачів, а їхні сервери розміщені в сховищі Bank Of England.

Досить безпечно :)


1
Б'юсь об заклад, що насправді вони не є в Банку Англії. Там немає місця, там багато банкірів.
Том О'Коннор

5
Trend Micro, чиє прізвище - безшовна ...
Том О'Коннор,

Я погоджуюсь з вами щодо Trend Micro, але вони володіють лише ним, ви працюєте з програмним забезпеченням Humyo
benhowdle89,
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.