Що таке мережа зберігання даних та які переваги вона має над різними рішеннями для зберігання?


35

Я пропоную це стати канонічним питанням щодо мереж сховищ даних на рівні підприємства.

Що таке мережа зберігання даних (SAN) і як вона працює?
Чим він відрізняється від мережевого приєднаного сховища (NAS)?
Які є випадки використання порівняно з безпосередньо приєднаним сховищем даних (DAS)?
У який спосіб це краще чи гірше?
Чому це так дорого?
Чи повинен я (або моя компанія) використовувати його?


@Basil: ти вважаєш, питання має стосуватися і NASE? Вони принципово відрізняються від SAN (і вже є питання про їх порівняння: serverfault.com/questions/81723/… ). Я мав намір це конкретно щодо SAN. Я не видаляю ваші зміни, але я вдячний відгукам спільноти про це.
Массімо

Обслуговування файлів у мене зазвичай є функцією більшості пристроїв зберігання даних на ринку зараз, коли більшість людей називають "SAN".
Василь

Я думаю, що питання, з яким я пов’язаний, охоплює це досить добре, а також NASes концептуально набагато простіше (це в основному файлові сервери). SAN виходить більш складним, модульним і дорогим. Розширення сфери застосування цього питання на всі форми зберігання зробило б його занадто широким. Це, звичайно, моя думка.
Массімо

Моя думка, що кожне рішення для зберігання даних, яке ви можете отримати зараз, має інтегроване обслуговування файлів. EMC, HDS, IBM, HP, Netapp (очевидно), Dell. Ви не можете говорити про "SAN" (знову ж таки, неправильне слово, оскільки це насправді те, що ви описуєте як шар підключення), не говорячи про обслуговування файлів. Не могли б ви заскочити в кімнату для прийомів?
Василь

1
Мені подобається, як це вийшло. Я думаю, що краще зупинитися на цьому питанні на тому, що таке SAN, і лише згадати NAS попутно. Це старе питання про те, "в чому різниця між SAN, NAS, DAS?" може бути трохи оновлений і самостійно перетворений у канонічні запитання.
Уорд - Відновіть Моніку

Відповіді:


45

Перш за все, для (широкого) порівняння пам’яті DAS, NAS та SAN див. Тут .


Існують деякі поширені помилки щодо терміна " SAN ", що означає " мережа Storage Area ", і як таке, строго кажучи , відноситься лише до комунікаційної інфраструктури, що з'єднує пристрої зберігання даних (масиви дисків, бібліотеки стрічок тощо) та користувачів сховища (сервери) ). Однак у загальній практиці термін "SAN" використовується для позначення двох речей:

  1. Повна інфраструктура зберігання, включаючи все обладнання та програмне забезпечення, що беруть участь у наданні спільного доступу до центральних пристроїв зберігання даних з декількох серверів. Таке використання, хоча і не є строго правильним, є загальноприйнятим, на що більшість людей посилається, коли говорять про "SAN". Решта цієї відповіді буде зосереджена на ньому, описуючи таким чином кожен компонент інфраструктури зберігання на рівні підприємства.
  2. Один масив пам’яті (див. Далі); як у "У нас є бренд X SAN з 20 ТБ сховища". Це використання є принципово неправильним, оскільки воно навіть не враховує справжнє значення "SAN" і просто припускає, що це певна форма пристрою зберігання даних.

SAN може складатися з дуже різного обладнання, але зазвичай його можна розділити на різні компоненти:

  • Масиви зберігання : саме тут фактично зберігаються дані (і те, що помилково часто називають "SAN"). Вони складаються з:
    • Фізичні диски: вони, звичайно, архівують дані. Використовуються диски на рівні підприємства, а це означає, що вони, як правило, мають меншу ємність на один диск, але значно вищу продуктивність та надійність; Крім того, вони набагато дорожчі, ніж диски споживчого класу. Диски можуть використовувати широкий спектр з'єднань і протоколів ( SATA , SAS , FC тощо) та різні носії інформації ( твердотілі диски стають все більш поширеними), залежно від конкретної реалізації SAN.
    • Корпуси дисків: саме тут розміщуються диски. Вони забезпечують електроенергію та з'єднання для передачі даних.
    • Контролери / процесори зберігання: вони керують дисковим входом / виводом, RAID та кешування (термін "контролер" або "процесор" змінюється між постачальниками SAN). Знову ж використовуються контролери на рівні підприємства, тому вони мають набагато кращі показники та надійність, ніж апаратні засоби споживчого класу. Вони можуть і, як правило, налаштовуються в парі для надмірності.
    • Басейни зберігання: пул пам’яті - це купа простору, що містить декілька (часто багато) дисків у конфігурації RAID. Його називають "пулом", оскільки його частини можуть бути розподілені, змінені та розміщені на вимогу, створюючи LUN.
    • Логічних пристроїв (LUN): ЛУН є шматок простору , що відбирається від пулу пристроїв зберігання даних, який стає доступним ( «представленої») на одному або декількох серверах. Сервери розглядаються як об'єм зберігання, і їх можна відформатувати за допомогою будь-якої файлової системи, яку вони віддають перевагу.
  • Бібліотеки стрічок: вони можуть бути підключені до SAN та використовувати однакові технології зв'язку як для підключення до серверів, так і для прямого резервного копіювання на стрічку.
  • Мережа зв’язку ( власне "SAN" ): саме це дозволяє користувачам (серверам) зберігання доступу до пристроїв зберігання (масивів (-ів) зберігання, бібліотек стрічок тощо); це, власне кажучи, справжнє значення терміна "Мережа сховища" та єдина частина інфраструктури зберігання, яку слід визначити як таку. Насправді існує безліч рішень для підключення серверів до спільних пристроїв зберігання даних, але найпоширенішими з них є:
    • Fiber Channel : технологія, яка використовує оптоволоконну оптику для високошвидкісних з'єднань із спільним сховищем. Вона включає в себе адаптери хост-шини , волоконно-оптичні кабелі та FC-комутатори, і вони можуть досягти швидкості передачі в межах від 1 Гбіт до 20 Гбіт. Крім того, багатосторонній введення / вивід можна використовувати для групування кількох фізичних зв'язків разом, що дозволяє підвищити пропускну здатність і відмовостійкість.
    • iSCSI : реалізаціяпротоколу SCSI над транспортом IP. Він працює над стандартнимобладнанням Ethernet , а це означає, що він може досягти швидкості передачі від 100 Мбіт (як правило, не використовується для SAN) до 100 Гбіт. Також можна використовувати багатосторонній введення / вивід (хоча базовий мережевий шар вводить деякі додаткові складності).
    • Fiber Channel over Ethernet (FCoE) : технологія, що знаходиться між повним FC та iSCSI, яка використовує Ethernet як фізичний рівень, а FC як транспортний протокол, таким чином уникаючи потреби в IP-шарі посередині.
    • InfiniBand : дуже високопродуктивна технологія підключення, менш використана і досить дорога, але завдяки якій можна досягти вражаючої пропускної здатності.
  • Адаптери хост-шини (HBA): адаптерні картки, які використовуються серверами для доступу до рівня з'єднання; це можуть бути виділені адаптери (як у FC SAN) або стандартні Ethernet-карти. Є також HBA iSCSI, які мають стандартне підключення до Ethernet, але можуть обробляти протокол iSCSI апаратно, тим самим позбавляючи сервер від додаткового навантаження.

SAN забезпечує безліч додаткових можливостей для прямого (або фізично спільного) зберігання:

  • Толерантність до відмов: висока доступність вбудована в будь-який SAN на рівні підприємства та обробляється на всіх рівнях, від джерел живлення в масивах зберігання даних до підключень до сервера. Диски надійніші, RAID використовується для протистояння відмов одних дисків (або декількох дисків), використовуються надлишкові контролери, а багатоповерховий введення / вивід дозволяє безперебійно отримати доступ до пам’яті навіть у разі відмови зв’язку.
  • Більша ємність зберігання: SAN можуть містити багато великих пристроїв зберігання даних, що забезпечує набагато більше місця для зберігання, ніж те, що може досягти один сервер.
  • Динамічне управління зберіганням: обсяги зберігання (LUN) можуть бути створені, змінені та знищені на вимогу; їх можна переміщувати з одного сервера на інший; виділення додаткового сховища на сервері вимагає лише деяких конфігурацій, на відміну від придбання дисків та їх встановлення.
  • Продуктивність: правильно налаштований SAN, використовуючи останні (хоча і дорогі) технології, може досягти справді вражаючої продуктивності, і він розроблений з нуля для обробки великого одночасного навантаження з декількох серверів.
  • Реплікація рівня сховища: два (або більше) масиви зберігання даних можуть бути налаштовані для синхронної реплікації, що дозволяє повне перенаправлення вводу-виводу сервера з одного на інший в сценаріях помилок або аварій.
  • Знімки на рівні сховища : більшість масивів пам’яті дозволяють робити знімки з одного обсягу та / або цілих пулів пам’яті. Ці знімки можна буде відновити за потреби.
  • Резервні копії на рівні зберігання: більшість SAN також дозволяють виконувати резервні копії безпосередньо з масивів зберігання даних у підключені до SAN бібліотеки стрічок, повністю обходячи сервери, які фактично використовують дані; Для забезпечення цілісності та послідовності даних застосовуються різні методи.

Виходячи з усього вище, переваги використання SAN є очевидними; а як щодо витрат на придбання одного та складності управління ним?

SAN - це апаратне забезпечення для корпоративного класу (хоча для невеликих SAN можуть бути ділові справи навіть у малих / середніх компаніях); вони, звичайно, дуже настроюються, тому можуть варіюватися від "декількох ТБ з 1 Гбіт iSCSI та дещо високою надійністю" до "декількох сотень ТБ з дивовижною швидкістю, продуктивністю та надійністю та повною синхронною реплікацією до центру обробки даних DR"; витрати залежать відповідно, але, як правило, вищі (як у «загальній вартості», а також у «витраті на гігабайт місця»), ніж інші рішення. Не існує стандартів ціноутворення, але навіть рідкісні SAN не мають рідкісних цінників у діапазоні десятків тисяч (і навіть сотень тисяч) доларів.

Розробка та реалізація SAN (тим більше для вищого класу) вимагає конкретних навичок, і подібну роботу зазвичай виконують вузькоспеціалізовані люди. Повсякденні операції, такі як управління LUN, значно простіші, але у багатьох компаніях управлінням сховищами так чи інакше займається спеціальна особа або команда.

Незалежно від вищезазначених міркувань, SAN - це рішення для зберігання даних, де потрібні висока потужність, надійність та продуктивність.


3
Проголосуйте ++ за таку глибоку відповідь.
Саймон Кетлін

3

Вам потрібна? Залежить. £ або $ за ТБ значно вище, ніж DAS. Плюс, виконання DAS робить, я боюсь, випереджає FC / AL та iSCSI SAN (ну, принаймні, в моєму тестуванні з Oracle та SQL Server DB). Але, з DAS, ви не отримуєте переваг від можливості спільного використання сховища (добре для кластеризації та VMWare).

Кілька постачальників сховищ переміщуються від волоконного каналу для підключення контролера "хост-сховище" на користь iSCSI, який працює на вершині Ethernet. Це стара сага «Token-Ring» проти Ethernet; маючи стільки галузевих досліджень та інвестицій в Ethernet, ФК просто не може йти в ногу. 10Gbps Ethernet комутатор набагато дешевший, ніж 8Gbps FC, плюс він може бути vLANd або іншим чином сегментований для забезпечення даних про зберігання та не зберігання.

Однак є кілька великих переваг SAN:

  • Знімки SAN (момент часу відновлення для сервера або колекції серверів)
  • Реплікація на рівні блоку на місці та поза ним (без участі хост-сервера, тому немає потреби в реплікації на основі програмного забезпечення)
  • Прямі резервні копії SAN - якщо ваша система резервного копіювання може підключитися до вашої SAN

Якщо ви думаєте занурити носок у воду загального сховища, подивіться на такі продукти, як набір HP P4000.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.