Деякі домашні істини щодо сховища, чи чому корпоративне зберігання настільки дороге?
Споживчі жорсткі диски пропонують великі обсяги місця, щоб навіть найвибагливіший користувач * кашлю * потокового носія * кашлю * міг придбати достатньо для зберігання колекції з кількох терабайт. Насправді ємність диска зростає швидше, ніж транзистор розраховує на кремній вже пару десятків років.
Зберігання "Enterprise" - дещо складніша проблема, оскільки дані мають вимоги до продуктивності та цілісності, що диктують дещо складніший підхід. Дані повинні мати певну гарантію доступності у випадку збоїв апаратних засобів, і їх, можливо, доведеться ділити з великою кількістю користувачів, що генерує набагато більше запитів на читання / запис, ніж один користувач.
Технічні рішення цієї проблеми можуть бути в багато, у багато разів дорожчі за гігабайт, ніж рішення для зберігання споживачів. Вони також потребують фізичного обслуговування; необхідно робити резервні копії та часто зберігати їх поза межами сайту, щоб пожежа не знищила дані. Цей процес додає поточні витрати.
Продуктивність
На вашому споживачі або навіть прикордонному приводі 1 ТБ у вас є лише одна голова. Диск обертається зі швидкістю 7200 об / хв, або 120 обертів в секунду. Це означає, що ви можете отримати максимум 120 операцій вводу / виводу з випадковим доступом в секунду теоретично * і дещо менше на практиці. Таким чином, копіювання великого файлу на один обсяг 1 ТБ відбувається досить повільно.
На дисковому масиві з 14x дисками 72 Гб у вас є 14 голов над дисками (скажімо) 15000 об / хв або приблизно 250 оборотів в секунду. Це дає вам теоретичний максимум 3500 випадкових операцій вводу / виводу в секунду * (знову ж таки, дещо менше на практиці). За інших рівних копій файлів буде багато, у багато разів швидше.
*
Ви можете отримати більше одного випадкового доступу за обертання диска, якби геометрія показань дозволяла приводу рухати головами та читати сектор, який, можливо, був доступний за один оборот диска. Якщо доступ до дисків був широко розсіяний, ви, мабуть, в середньому менше одного. Якщо дисковий масив відформатований у смугастий (див. Нижче) макет, ви отримаєте максимум одну зчитувану смугу за обертання диска в більшості обставин і (залежно від контролера RAID) в середньому, можливо, менше одного в середньому.
Привід 7200 об / хв 1 Тб, ймовірно, буде досить швидким при послідовному вході / виводі. Дискові масиви, відформатовані за смугастою схемою (RAID-0, RAID-5, RAID-10 тощо), як правило, можуть читати не більше однієї смуги за обертання диска. За допомогою смужки 64К ми можемо читати 64Kx250 = 16 Мб або близько того даних за секунду, виключаючи диск з 15000 об / хв. Це дає послідовну пропускну здатність близько 220 Мб в секунду на масиві 14 дисків, що не набагато швидше на папері, ніж 150 МБ / с або приблизно так, що цитується на сучасному 1 ТБ SATA диску.
Для потокової передачі відео (наприклад), масив із 4 SATA-дисків в RAID-0 з великим розміром смуги (деякі RAID-контролери підтримуватимуть розміри смуг до 1 МБ) мають досить багато послідовних пропускних можливостей. Цей приклад теоретично може передавати близько 480 Мб / сек, що є достатньо зручним для редагування відео в режимі реального часу, нестисненого HD. Таким чином, власники Mac Pros та подібного обладнання можуть виконувати завдання з компонування відео у форматі HD, які потребували б машини з волоконним масивом прямого приєднання лише кілька років тому.
Справжня перевага дискового масиву полягає в роботі бази даних, яка характеризується великою кількістю малих, розсіяних запитів вводу / виводу. На цьому типі продуктивність роботи обмежується фізичною затримкою шматочків металу в диску, що йде навколо і назад. Цей показник відомий як IOPS (операції вводу / виводу за секунду). Чим більше у вас фізичних дисків - незалежно від ємності - тим більше IOPS ви можете теоретично зробити. Більше IOPS означає більше транзакцій в секунду.
Цілісність даних
Крім того, більшість конфігурацій RAID надають певну надмірність даних - для визначення яких потрібен більше одного фізичного диска. Поєднання схеми зберігання даних з такою надмірністю та більшою кількістю приводів дає системі можливість надійно обслуговувати велику транзакційну навантаження.
Інфраструктура для дискових масивів (і SAN в більш крайньому випадку) не є саме предметом масового ринку. Крім того, це один з бітів, який насправді, справді, не може вийти з ладу. Таке поєднання стандарту складання та менших обсягів ринку не є дешевим.
Загальна вартість зберігання, включаючи резервне копіювання
На практиці найбільші витрати на підтримку 1 ТБ даних, ймовірно, становлять резервне копіювання та відновлення. Стрічковий накопичувач та 34 набори стрічок SDLT або ultrium для повноцінного циклу резервного копіювання та відновлення, ймовірно, обійдуться дорожче, ніж це зробив дисковий масив на 1 ТБ. Додайте витрати на зберігання за межами сайту та зарплату навіть однієї стрічки-мавпи, і раптом ваші 1 ТБ даних не такі вже й дешеві.
Вартість дисків часто є справедливим способом зниження ієрархії домінуючих витрат на зберігання. В одному банку я мав нагоду працювати для зберігання даних в SAN за ціною 900 фунтів / Гб для системи розвитку та 5000 фунтів / ГБ для диска на виробничому сервері. Навіть за цінами постачальників підприємств фізична вартість дисків становила лише незначну частку. Інший приклад, який мені відомо, має (відносно) скромно налаштований IBM Shark SAN, який коштував їм десь понад 1 мільйон фунтів. Тільки фізична пам’ять на цьому тарифікується близько 9 фунтів / гігабайт, або приблизно 9000 фунтів стерлінгів за місце, еквівалентне вашому жорсткому диску 1 TB.