Скільки часу для копіювання потрібно 1,5 ТБ, дуже залежить від типу даних. Якщо у вас є кілька 1500 файлів 1 Гб, це, ймовірно, займе лише кілька годин, але якщо у вас є мільярд з половиною файлів 1 КБ, це, ймовірно, займе кілька днів.
Це відбувається через дві суперечливі характеристики на дисках: пропускну здатність та середній час доступу. Традиційний диск з пропускною здатністю 100 Мб / сек та час доступу 10 мс є досить поширеним явищем. Якщо ви можете послідовно передавати дані, ви можете отримати 100 МБ / сек. Однак якщо вам потрібно перестрибнути в інше місце, це займе 10 мс. Якби ви транслювались, ви могли б записати 1 МБ даних за час, який потрібно для переходу до іншого місця.
Створення файлу може зайняти кілька пошуків, тому створення файлу в 1 КБ може «коштувати» стільки, скільки потокової передачі декількох МБ даних.
Так, у деяких випадках краще робити необроблену копію дискового блоку, ніж копіювати у файловій системі через щось на зразок rsync. Якщо у вас багато файлів, у файловій системі, яка, скажімо, наповнена 50% або більше, вам часто краще просто скопіювати повний блок пристрою через "dd", скільки часу це потрібно. Звичайно, ви не можете цього зробити під час монтажу файлової системи, тому в цьому є і недоліки.
SSD можуть допомогти пом’якшити це, оскільки час їх доступу приблизно в 100 разів швидше, але MLC SSD-накопичувачі мають складні проблеми доступу в залежності від наявності пулу попередньо стертих блоків. SLC SSD можуть допомогти в цьому.
RAID-контролери із вбудованим кешем можуть допомогти в пошуку, як і щось на зразок модуля ядра flashcache, який дозволяє кешувати блоковий пристрій через SSD.
Системи RAID можуть передбачати кілька паралельних пошуків, ефективно скорочуючи середній час доступу, а також паралелізацію для збільшення пропускної здатності. Але загальна продуктивність часто залежатиме від кількості файлів.