Чому Enterprise Storage так дорого?


107

Це канонічне запитання щодо вартості зберігання підприємств.
Дивіться також таке питання:

Щодо загальних питань, таких як:

  • Чому я повинен платити 50 баксів на місяць за додатковий гігабайт пам’яті?
  • Нашому файловому сервері завжди не вистачає місця, чому наш sysadmin просто не кидає туди додатковий накопичувач на 1 ТБ?
  • Чому обладнання SAN таке дороге?

Відповіді тут спробують краще зрозуміти, як працює сховище на рівні підприємства та що впливає на ціну. Якщо ви можете розширити питання або надати зрозумілу відповідь, будь ласка, опублікуйте.


17
Будь ласка, закрийте будь-які питання "Чому таке зберігання так дорого" та вкажіть їх тут.
Марк Хендерсон

17
Це не призначений для того, щоб бути рекламним форумом для всіх, хто знайшов дешевих постачальників, це стосується окреслення "прихованих" витрат у сховищах на рівні підприємства.
Марк Хендерсон

2
Обов’язкове посилання BOFH ("мені потрібно більше місця!"): Bofh.ntk.net/BOFH/0000/bastard01.php
Массімо

Джим Салтер опублікував розрив цього питання, запропонувавши повідомлення в блозі Depressing Storage Calculator . Підсумок тут: вам потрібно забезпечити десь від 10 до 25 разів більше бажаного місця для видимого кінцевого користувача , залежно від припущень та вимог.
CVn

Відповіді:


116
  1. Ємності жорсткого диска сервера є мізерними порівняно з настільними жорсткими дисками. 450 і 600 Гб - не рідкість розмірів, які можна побачити на абсолютно нових серверах, і ви можете придбати багато настільних накопичувачів 4 TB SATA за ціною одного жорсткого диска SAS (сервер) 600 Гб.

  2. Ваш жорсткий диск SATA в настільному ПК вдома - це як м'язова машина від Ford, GM або Mercedes або будь-якого іншого виробника автомобілів для людей щоденного дня (велика ємність V8 або V12, 5 або 6 літрів). Оскільки їм потрібно керувати людьми, які не мають гоночної ліцензії, або розуміють, як працює двигун внутрішнього згоряння, вони мають дуже великі допуски. Вони мають обмежувачі оборотів, вони призначені для роботи на будь-якій олії певного рейтингу, вони мають інтервали обслуговування, наприклад, 10 000 км один від одного, але якщо ви пропустите сервісний інтервал на кілька тижнів, він не вибухне перед вами. Вони не загоряються, коли ви їдете на великі відстані.

    Привід SAS на сервері більше схожий на двигун Формули-1. Вони дійсно невеликі (2,4 літра), але мають величезні потужності через свої крихітні допуски. Вони обертаються вище і часто не мають обмежувача оборотів (це означає, що вони зазнають серйозних ушкоджень при неправильному керуванні), і якщо ви пропустите сервісний інтервал (який кожні кілька годин ), вони вибухають.

    Ви в основному порівнюєте крейду та сир. Числа та повна розбивка обговорюються в класі Intel Whitepaper Enterprise порівняно з жорсткими дисками настільного класу

  3. Поговоримо тут кілька важких цифр. Скажімо, ви вимагаєте 1 Мб додаткових даних (хороший круглий номер). Скільки це насправді даних ? Ну, ваші 1 МБ даних перейдуть в масив RAID. Скажімо, вони в безпеці і перетворюють це на RAID1. Ваш 1 Мб даних є дзеркальним, тому це фактично 2 Мб даних.

    Скажімо, ваші дані знаходяться всередині SAN. У разі відмови вузла SAN ваші дані синхронізуються на байтовому рівні з другим вузлом SAN. Таким чином, він дублюється, і ваші 2 МБ даних тепер 4 Мб.

    Ви очікуєте, що ваш провайдер зберігатиме резервні копії на місці, щоб ваші дані могли бути відновлені у разі надзвичайних ситуацій, що не відбулися після катастрофи? Будь-який гідний постачальник надасть вам принаймні 1 резервну копію на місці, можливо, більше. Скажімо, вони роблять знімки раз на тиждень протягом трьох тижнів на місці. Це зайві 3 Мб даних, тому ви тепер до 7 МБ.

    Якщо трапляється критична катастрофа, краще, щоб ваш постачальник десь зберігав його поза межами сайту. Навіть якщо це місяць, він повинен існувати. Тож тепер ви до 8 МБ.

    Якщо це дійсно високий рівень послуг, у них може бути навіть сайт відновлення після аварій, синхронізований наживо. Ці диски також будуть RAIDed, так що це додаткові 2 Мб, і, таким чином, ви до 10 МБ даних.

    Ці дані вам доведеться з часом перенести. Що? Передати? Так, передача даних коштує грошей. Це коштує грошей, коли ви завантажуєте їх, отримуєте доступ до них через Інтернет, це навіть коштує грошей, щоб створити резервну копію (хтось повинен забрати ці стрічки з офісу, і може бути, що ваші 1 МБ даних означають, що вони повинні придбати додатковий набір стрічок і перенести їх кудись).

  4. Коли ваш домашній привід SATA виходить з ладу, ви можете зателефонувати в технічну підтримку та переконати їх, що ваш привід мертвий. Потім направляйте свій диск у виробника (на свій власний грошовий залік більшість разів). Зачекайте тиждень. Знову поверніть привід для заміни і доведеться його перевстановити (він майже напевно не доступний для заміни або у санках диска).

    Якщо цей диск SAS не працює, ви викликаєте службу технічної підтримки. Вони майже ніколи не сумніваються у вашій думці, що накопичувач потребує негайної заміни та випускає новий привід; Зазвичай новий привід постачається пізніше того ж дня, інакше на наступний день теж дуже часто. Зазвичай виробник відправить свого представника, щоб він фактично встановив накопичувач, якщо ви не знаєте як (дуже зручно, якщо ви плануєте коли-небудь взяти відпустку і потрібно, щоб речі продовжували працювати, поки ви не вдома).

  5. Корпоративні накопичувачі мають жорсткі допуски (див. №2 вище) і, як правило, тривають приблизно в 10 разів довше, ніж накопичувачі споживчих класів (MTBF). Корпоративні накопичувачі майже завжди підтримують розширене виявлення помилок та збоїв, які, як виявлено у звіті Google, працюють приблизно 40% часу, але це те, що хтось вважає за краще, щоб комп'ютер раптово помер.

    Якщо у вас на домашньому комп’ютері є один накопичувач, його статистичні шанси вийти з ладу - це лише той диск. Раніше диски оцінювались у MTBF (де диски SAS все ще користуються ~ 50% вищими показниками або більше), тепер частіше спостерігати показники помилок. Типовий накопичувач SAS в 10-1000 разів рідше матиме непоправну помилку (зі 100 разів найпоширенішою, яку я знайшов останнім часом). (коефіцієнти помилок відповідно до документації виробника, наданої Seagate, Western Digital та Hitachi; жодних упереджень не передбачається; прямо відмовляються від відшкодування збитків).

    Коефіцієнти помилок особливо важливі не тоді, коли ви натрапили на невідправлену помилку на диску, але коли інший диск у тому ж масиві вийшов з ладу, і ви не покладаєтесь на те, що всі диски в масиві будуть читабельні для відновлення невдалого диска.

  6. SAS - похідна SCSI, яка є протоколом зберігання даних. SATA базується на ATA, яка сама базується на шині ISA (що 8/16-бітна шина в комп'ютерах епохи динозавра). Протокол зберігання даних SCSI має більш обширні команди для оптимізації способу передачі даних з накопичувачів на контролери та назад. Це покращення ефективності зробило б інакше рівний привід SAS по суті швидше, особливо при екстремальних робочих навантаженнях, ніж привід SATA; це також збільшує вартість.

  7. Випускається менше приводів SAS, економність масштабу диктує, що вони будуть дорожчими за інших рівних.

  8. Приводи SAS, як правило, мають швидкість обертання 10k або 15k; тоді як SATA зазвичай надходить у 5,4 к або 7,2 к. Диски SAS, особливо розміром 2,5 ", які стають все більш популярними, мають швидший час пошуку. Два комбіновані різко збільшують IOps, який може виконувати диск, як правило, привід SAS швидше ~ 3 рази. Коли багато користувачів вимагають неоднорідних даних, IOps ємність накопичувача / масиву стає критичним показником продуктивності.

  9. Зазвичай диски в центрі обробки даних постійно працюють. Дослідженнями встановлено, що на збій приводу впливає кількість циклів нагрівання / охолодження, які він проходить (від запуску проти вимкнення). Підтримка їх роботи весь час, як правило, збільшує термін служби диска. Наслідком цього є те, що накопичувачі споживають електроенергію. Ця електроенергія повинна бути поставлена ​​чимось (у випадку великого постійного струму, тільки приводи можуть зайняти більше енергії, ніж невеликий мікрорайон будинків). Їм також потрібно десь розсіювати тепло, вимагаючи систем охолодження (які самі потребують більше енергії для роботи).

  10. Витрати на інфраструктуру та персонал. Ці накопичувачі знаходяться у високоякісних блоках NAS або SAN. Ці агрегати дорогі навіть без дорогих накопичувачів. Вони потребують дорогого персоналу для їх розміщення та обслуговування. Будівлі, в яких розташовані ці підрозділи NAS та SAN, є дорогими для експлуатації (див. Пункт про охолодження вище, але там відбувається набагато більше.) Програмне забезпечення для резервного копіювання, як правило, не є безкоштовним (як і ліцензії на такі речі, як дзеркальне відображення) , і персонал для розгортання та підтримки резервного копіювання зазвичай теж дорогий. Вартість оренди позашляхової стрічки та її зберігання - це ще одна з багатьох речей, які починають накопичуватися, коли потрібно більше місця.

Маючи на увазі, що ємність їх накопичувачів цілком може бути на 10-ту частину розміру настільного накопичувача і в п'ять разів перевищує ціну, ваш 1 Мб даних насправді становить 10, а всі інші відмінності, немає ніякого способу витягнути будь-яке змістовне висновки між ціною зберігання на робочому столі та ціною зберігання на рівні підприємства.


3
У наші дні накопичувачі 2-4 ТБ SAS / SATA 7.2K використовуються для масового зберігання, тому частина цього більше не застосовується універсально.
Mircea Chirea

1
@MirceaChirea 2-4TB накопичувачі, що використовуються у корпоративній пам’яті, є NL або ML SAS і відрізняються від SATA дисків 2-4 ТБ. Ціна за ГБ все ще сильно відрізняється між двома платформами.
MDMarra

@MDMarra, більшість не набагато відрізняються від їхніх настільних варіантів: крім SAS вони мають кращу гарантію і надійні для надійності.
Mircea Chirea

1
Вони призначені для використання в режимі 24x7 там, де більшість SATA-дисків немає. Вони також виграшно виходять з ладу і не повісять весь RAID-масив . Тільки диски SATA, які підтримують TLER, виходять з ладу і уникають цього. Також немає SATA-дисків з двома портами, тоді як двопортовий SAS є загальним і дозволить отримати прозорий відмову контролерів. Знову ж таки, якщо ви маєте невеликий бюджет, то SATA може бути вашим єдиним вибором, але існують значні відмінності, які турбуються підприємств між NL-SAS та SATA.
MDMarra

3
Backblaze повідомив у своєму блозі, що корпоративні накопичувачі мають не меншу ймовірність виходу з ладу, ніж споживчі диски
Берт

31

Я не додаю цього до верхньої відповіді CW насамперед тому, що це різниця в думках. Ви можете злити / відредагувати це, якщо бажаєте.

Часто причина "зберігання на рівні підприємства" настільки дорога, що може статися в тому, що запитувач не розуміє вимоги, але іноді також і sysadmin не розуміє вимоги, не може повідомити про вимогу комусь із органом купівлі, або просто отримує зазначена влада ігнорується.

Високопродуктивні, високодоступні масиви зберігання, що не мають постійного зберігання, є дорогими . Частина роботи системного дизайнера полягає в тому, щоб знати, де вони підходять, а де інша конструкція підходить.

Я не думаю, що відносні витрати різних типів дисководів насправді стосуються жодного з прикладних питань.

Чому я повинен платити 50 баксів на місяць за додатковий гігабайт пам’яті?

Це чітко адресовано якомусь постачальнику послуг. Мої два варіанти відповіді:

  1. У вас є дев'ять дев'яти разів, 24 години підтримки, у Манхеттені / Лондоні / Гонконзі. Обертові тарілки - це лише невелика частина стека, за який ви платите.

  2. Ви платите занадто багато. Домовляйтеся, перемикайте постачальника або приносьте його додому.

Нашому файловому сервері завжди не вистачає місця, чому наш sysadmin просто не кидає туди додатковий накопичувач на 1 ТБ?

Це майже напевно погана конструкція (можливо, з політичних причин). Дані про цей файловий сервер потрапляють десь із цього спектру:

  • Дані варто зберігати на високоефективних, високодоступних та високих витратах. Час простою, спричинений нестачею місця, впливає на вашу високу доступність і є помилкою в дизайні чи плануванні.

  • Дані є неважливими, або низька продуктивність або триваліший час простою є прийнятними. Прийнятні дешеві диски та дешеві резервні рішення. Регулярний час простою через брак дискового простору все ще здається дивним компромісом, оскільки більша частина ваших витрат у цьому випадку, ймовірно, буде вашим систематичним часом, і в кінцевому рахунку вони витратять більше часу на усунення проблем з низьким диском простір.

Зауважте, що я сказав, що це спектр, і більшість вимог виникає десь між двома.


5
Варто зазначити, що те, що з точки зору користувача "не вистачає місця", цілком може бути "заповненням вашої квоти" з точки зору системи.
Річард Ґадсден

6

Вартість виготовлення будь-якого товару безпосередньо пов'язана з обсягом одиниці, яку вона продаватиме в циклі зворотного зв'язку.

Що стосується звичайного жорсткого диска, що обертається іржавим склом та електронікою, можливо, величезна різниця у вартості механічних та електронних компонентів - проте з'явилися 2 чіткі смуги ціна / якість - Enterprise and Commodity.

Однак зменшений обсяг продажів на корпоративному приводі суттєво впливає на те, що ви отримуєте за свої гроші - те, що коштує в сім разів більше, не буде в сім разів кращим.

Підрозділи підприємства (для заданої потужності) трохи швидші, ніж товарні одиниці, наприклад, порівнюючи приводи Seagate Barracuda SATA (товар) та накопичувачі Cheetah SAS (підприємство):

model            Barracuda            Cheetah
capacity(Gb)     500                  450
sustained data   125                  168
   rate (Mb/s)
cache(Mb)        16                   64
annual failure   <1%                  0.44%
   rate
Price GBP        42                   275
Price USD        67                   440

Але в корпоративному контексті жоден здоровий системний адміністратор ніколи не зберігатиме важливі дані на одному диску - використання декількох приводів забезпечує більшу надійність та пропускну здатність, а також ефективно зменшує затримку; чотири з накопичувачів Barracuda, сконфігуровані як RAID10, будуть набагато швидшими, ніж одинарний диск «Гепард», з набагато меншим ризиком втрати даних приблизно на 60% від ціни.

Звичайно, ви отримаєте кращу гарантію за допомогою накопичувача Enterprise, і постачальник, як правило, зможе отримати його вам в той же день - але, ймовірно, ви зможете отримати джерело руху товару від місцевого постачальника швидше, ніж може ваш постачальник. кур'єр вийміть замінний диск. З іншого боку, корпоративний диск, швидше за все, буде точною заміною несправного накопичувача.

То, можливо, ви отримуєте набагато більше надійності від приводів підприємств? Хоча люди, що виготовляють та продають накопичувачі, часто кажуть, що це так (Seagate доволі домовляються про це на своєму веб-сайті - але навіть заплутані цифри, які вони публікують, показують, що це менше, ніж коефіцієнт 2). Незалежні дослідження показують, що суттєвої різниці немає .

Командний набір SCSI має деякі технічні переваги перед набором команд ATA - особливо з точки зору того, що ОС може точно знати, що зроблено на диску - однак знову ж таки, це лише робить ефективну різницю з точки зору продуктивності та надійності файлової системи реалізовані на одному диску.

Якщо ваш постачальник послуг керує мережевим каналом SAN, то вартість за гігабайт пам’яті буде щонайменше у 8 разів вища, ніж придбання диска з полиці у найближчому магазині обладнання. Але є й інші підходи, які можуть значно знизити вартість.

Зауважте, що це все одно ніколи не буде дешевшим, ніж придбання нестандартного диска, оскільки ви також платите за надмірність, потужність, кондиціонування повітря та підтримку, але ці витрати повинні бути невеликими щодо витрат на забезпечення зберігання.


5

Я погоджуюся з іншими повідомленнями про якість того, що пропонує хостинг-компанія. Але ми нещодавно переробили наш хостинговий контракт і покуповували, і ніхто не був конкурентоспроможним щодо місця зберігання, а також ціни не були нижчими від попереднього 3-річного контракту. Приводи SAS падають у ціні, дискові полиці / масиви / SAN / FC / вимикачі падають, все знижується в ціні. Але не дискове зберігання?

Колега з набагато більшим досвідом вказав на тактику. Цінові процесори, пам'ять, пропускна здатність були сліпучими! Зареєструйтесь тут! Зареєструйтесь зараз і ігноруйте проблему з місцем на диску! Вам не знадобиться стільки місця на диску. Подивіться на процесор і пам’ять!

Після того, як ви покладете на їх договір, вони справді отримали вас, і вони складають свій дохід на дисковому просторі. Так, це RAID-5 і висока продуктивність і т. Д., Але резервне копіювання коштує додатково, зовнішня реплікація коштує більше.

Для хостинг-компаній це бізнес-модель. Більшість підприємств роблять щось подібне зі своїми цінами - знижують цю ціну тут, але збільшують цю, щоб отримати свій прибуток десь в іншому місці. Вони також повинні сплачувати ренту і зарплату.

Для внутрішніх серверів у вас різні проблеми. Ви не можете просто зайти в серверну кімнату з полем FedEx, на якому є ваш новий 3Tb жорсткий диск. Якщо ви планували розширення, це простіше, але сервери / стійки / масиви вже можуть бути на їх потужності з точки зору слотів, вводу / виводу, карт контролера, потужності.

Це як заглянути під скелю, ви здивуєтесь тому, що можете знайти.


Вартість дисків може знижуватися, але праця збільшується. CapEx не є найбільшою частиною TCO.
Кріс S

5

Також важливо зауважити, що місцеве зберігання може коштувати дорожче, ніж ви думаєте в будь-якому випадку.

У рамках вправи з метою переміщення деяких наших "заархівованих" даних у хмару я нещодавно завершив практику ціноутворення, порівнюючи вартість наявного (наприклад, відформатованого, а не необробленого) дискового простору, доступного в останньому нашому SAN, за рахунок вартості зберігання. в хмарній службі даних Amazon.

Якщо врахувати ціну, заплачену за сам SAN, включаючи диски, якщо припустити 5-річний термін служби апаратури SAN, а не «накладні» витрати на роботу нашого серверного приміщення, наша ціна на 150Gb локального сховища становить $ 31,88 на місяць проти Amazon $ 28,41 ( припускаючи швидкість руху в місяць на 20% вгору і вниз).

Зараз я не збираюся поспішати та переміщувати все наше сховище до хмари, оскільки є інші переваги у наявності локального сховища, але я вважаю, що такий спосіб ціноутворення корисний: якщо ви вважаєте, що хмарне зберігання дорого, то скільки Ви справді платите за місцеве зберігання?


4

На мій погляд це простий IO ... файл, який сидить на одному жорсткому диску товару без нальоту та, ймовірно, не здійснює гарячу заміну, і до нього, як правило, звертається одна людина і, ймовірно, ніколи не створюється резервна копія. Це дешевий і простий метод введення ...

У нашому бізнесі я використовував один з найдорожчих методів нальоту (рейд 10), який вимагає мінімум 4 приводів; ми використовуємо 6 ... це дає нам високі показники вводу-виводу та відмовостійкість.

Ця конфігурація значно врятувала мій $$, і цей результат означав підвищення продуктивності та менший час простою для кінцевих користувачів. Для простого IO розчарування може лише одна людина, і, ймовірно, невелика фінансова цінність пов'язана з простоєм.

У нас також є виділений сервер iSCSI, який використовується для віртуалізації Xen і який також налаштований для рейду 10 ...

Чим більше IO, який потрібно використати та створити резервну копію, тим дорожче його впроваджувати ... якщо ваша вимога підприємства сприйме втрату даних, дуже низькі швидкості та відсутність надмірності - тоді зберігання бізнес-класу можна зробити на дешево !!! Просто будьте готові до звільнення ...

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.