Як вимірюється швидкість диска і що швидко? Скільки часу має зайняти копія 1500 Гб?


11

Як вимірюється швидкість диска? Це прочитаний Мбіт або Мбайт в секунду? Що в середньому сьогодні, а що швидко і що дуже швидко в галузі?

Скажімо, хтось каже, що потрібно зробити багато часу, щоб зробити копію файлу в 1500 ГБ (скажімо, файл бази даних), скільки часу це займе у професійній системі і як це можна обчислити, враховуючи швидкість жорсткого диска ?

Відповіді:


19

Швидкість диска зазвичай вимірюється в;

  • Швидкість обертання в оборотах в хвилину (найнижча при 4200 об / хв, потім 5400, 7200, 10 к і 15 к - це не стосується SSD або флеш-пам'яті).
  • Швидкість інтерфейсу - це найшвидша дискова електроніка, яка може спробувати надсилати дані на дисковий контролер (це діапазон від 100 Мбіт / с ATA через 150/300/600 Мбіт / с SATA, 2/4/8/16 Гбіт / с Fiber-Channel і навіть до швидкості PCIe для накопичувач на основі флеш-пам’яті, такий як FusionIO).
  • Шукати час - це просто час, який потрібен для початку читання або запису певного сектору диска - вони можуть становити від 3-15 мс для дисків до невеликої частки цього для SSD / флеш-дисків.
  • Тоді ми доходимо до фактичної швидкості, яку ви можете очікувати, є чотири швидкості, про які вам слід піклуватися; послідовне читання (читання дуже великого блоку даних), послідовне записування (те саме, але запис), випадкове читання (отримання даних з усього диска) та випадкове записування. Вони дуже варіюються, але для спінінг-дисків ви можете розраховувати що завгодно, від 25 Мбіт до 150 Мбіт / с для послідовного читання і запису, і все, що завгодно, від 3 Мбіт до 50 Мбіт для випадкового читання і запису. SSD, як правило, в діапазоні 200 Мбіт / с для послідовних і, як правило, трохи менше для випадкових операцій. FusionIO може легко досягти 1 Гбіт / с для всіх, але зазвичай невеликий і дорогий.

Як бачите, немає реальної середньої величини, якщо ви хочете отримати рекомендації щодо того, що купувати, не соромтесь повертатися до нас з якомога більше інформації - це має включати бюджет, тип програми, розмір набору даних, базу користувача , апаратне забезпечення / ОС плюс усе інше, що, на вашу думку, було б корисним.

Що стосується вашої копії 1,5 Тб, добре, якщо ви робили це на USB-диску SATA, що підтримує 2-х 7200 об / хв, ви повинні отримати принаймні 30 Мбіт-40-Мбіт / с, або повний 1,5 ТБ може зайняти більше 10 годин. Якби це була типова професійна система DAS / SAN, я б очікував, що в районі 100 Мбіт / с означає, що це зайняло б близько 3 годин.

Сподіваюся, це допомагає, о, і просто уточнити, МБ = мегабайт, Мб - мегабіт.


8

Існує багато, багато змінних, що беруть участь у подібних обчисленнях. Дискові системи реального світу мають багато взаємозалежностей. Просто в одному комп’ютері:

  • Фактична номінальна швидкість самого приводу (як правило, обороти в хвилину, 5200, 7200, 10 К, 15 К)
  • Файлова система, що використовується
  • Незалежно від того, використовується система RAID чи ні
    • Якщо це так, продуктивність карти RAID
    • Тип RAID
  • Операційна система, що використовується
  • Операції читання та запису мають абсолютно різні характеристики продуктивності
  • Коефіцієнт читання / запису для операцій
  • Для послідовних операцій коефіцієнт фрагментації зберігання

Як бачите, швидкість самого диска є лише одним із багатьох факторів. Це чималий фактор, але все ж один із багатьох. Якщо ця копія 1,5 ТБ знаходиться на одному диску, то диск (95% ймовірно) буде виконувати 100% швидкі випадкові характеристики читання / запису, що, як правило, перетворюється на найгірші показники продуктивності. Якщо копія з одного диска на інший, а дані на 100% послідовні, а цільовий диск повністю порожній, це має забезпечити максимально швидку продуктивність з цією підсистемою диска. Реальні результати роботи будуть десь між цими двома крайнощами.

Якщо ви копіюєте між двома окремими серверами, є ще більше факторів.

У мене є масив пам’яті на роботі, який може насичувати 3Gb (gigaBIT) канали SAS, коли в основному виконуються послідовні операції. Якби у мене був 6Gb SAS, він, ймовірно, може бути дуже близьким до насичення їх теж. Для випадкових вводу / виводу ця конкретна система працює дуже по-різному, залежно від того, яка ОС (OpenSolaris, наприклад, мав найгірший випадковий ввід / вивід, а Linux XFS - кращий з коефіцієнтом 3).

Існує занадто багато змінних, щоб остаточно відповісти на це питання.


3

Скільки часу для копіювання потрібно 1,5 ТБ, дуже залежить від типу даних. Якщо у вас є кілька 1500 файлів 1 Гб, це, ймовірно, займе лише кілька годин, але якщо у вас є мільярд з половиною файлів 1 КБ, це, ймовірно, займе кілька днів.

Це відбувається через дві суперечливі характеристики на дисках: пропускну здатність та середній час доступу. Традиційний диск з пропускною здатністю 100 Мб / сек та час доступу 10 мс є досить поширеним явищем. Якщо ви можете послідовно передавати дані, ви можете отримати 100 МБ / сек. Однак якщо вам потрібно перестрибнути в інше місце, це займе 10 мс. Якби ви транслювались, ви могли б записати 1 МБ даних за час, який потрібно для переходу до іншого місця.

Створення файлу може зайняти кілька пошуків, тому створення файлу в 1 КБ може «коштувати» стільки, скільки потокової передачі декількох МБ даних.

Так, у деяких випадках краще робити необроблену копію дискового блоку, ніж копіювати у файловій системі через щось на зразок rsync. Якщо у вас багато файлів, у файловій системі, яка, скажімо, наповнена 50% або більше, вам часто краще просто скопіювати повний блок пристрою через "dd", скільки часу це потрібно. Звичайно, ви не можете цього зробити під час монтажу файлової системи, тому в цьому є і недоліки.

SSD можуть допомогти пом’якшити це, оскільки час їх доступу приблизно в 100 разів швидше, але MLC SSD-накопичувачі мають складні проблеми доступу в залежності від наявності пулу попередньо стертих блоків. SLC SSD можуть допомогти в цьому.

RAID-контролери із вбудованим кешем можуть допомогти в пошуку, як і щось на зразок модуля ядра flashcache, який дозволяє кешувати блоковий пристрій через SSD.

Системи RAID можуть передбачати кілька паралельних пошуків, ефективно скорочуючи середній час доступу, а також паралелізацію для збільшення пропускної здатності. Але загальна продуктивність часто залежатиме від кількості файлів.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.