Як довго fsck може зайняти об'єм 30 ТБ?


17

У середині листопада VPS, який я орендую у приймаючої компанії, перестав реагувати. Коли я зв’язався із службою підтримки, вони пояснили, що відключення електроенергії в центрі обробки даних викликало вимушене перезавантаження та fsck. Врешті-решт я запитав, чому це займає так довго, і мені відповіли, що розмір гучності становить 30 ТБ. Востаннє я отримував оновлення в лютому, і вони не відповіли на мій останній запит.

Я розумію, що fsck може бути дуже повільним для деяких файлових систем, але чи можливо, щоб fsck зайняв 6 місяців на об'ємі 30 ТБ, чи слід вважати, що ця хостингова компанія бреше мене, щоб я продовжував сплачувати свій рахунок кожен місяць?


39
Вони, напевно, брехали вам із самого початку. Я б очікував, що це займе години . Ви повинні були перестати платити у грудні.
Майкл Хемптон

15
Навіть якщо вони не брешуть, вибираючи налаштування програмного забезпечення HW +, яке може зажадати FSCK, який довго показує, що вони некомпетентні. І незалежно від причини, вони не надають послуги, за яку ви платите.
Пітер Кордес

34
Звучить як справжній кластерний fsck!
JMK

2
@JMK Я хотів би, щоб був спосіб відзначити коментарі для додаткових заслуг, можливо, доповнити зал слави.
труба

2
Те, що говорить @PeterCordes, є ключовим моментом. Ви платите за послугу. Вам дуже шкода, чуючи, що у них проблеми, але ви телефонуєте про ту послугу, яку ви платите і не отримуєте.
Роб

Відповіді:


31

fsckшвидкість головним чином залежить від кількості файлів та способу їх поширення у відповідній директорії. Однак, 6 місяців для A fsckабсолютно абсурдно: він повинен був завершитись за декілька годин, особливо якщо використання xfsцього має швидку xfs_repairкорисність. Тут ви можете знайти деякий fsckпробіг у масштабі - все завершено за одну годину (3600). Отже, не можливо, що ваш fsckвсе ще працює.

У будь-якому випадку, несподівана втрата електроенергії не спричинить повний удар fsck, а лише дуже швидке (кілька секунд) перезапис журналу . Однак якщо деякі ключові файли були пошкоджені, ОС може бути незавантаженою.

Але вони, напевно, просто збрехали вам. Слід негайно припинити платити, попросити пояснення та подати заявку на повне повернення коштів.


8
Якщо вони використовуються ext2, то для відключення електроенергії потрібен повний fsck, і я не здивуюся, якщо на потужно використаний обсяг 30 ТБ потрібні дні. З іншого боку, якщо вони використовуються ext2в обсязі 30 ТБ, саме по собі це є підставою шукати в іншому місці хостинг-сервіси.
Марк

14
ext2 використовує 32-розрядний лічильник блоків, максимальний розмір блоку - 4096 байт (тобто: сторінка) на x86 та x86_64. Це означає, що ext2 (і ext3) обмежені об'ємами 8 ТБ, тому ні, ОП не може використовувати ext2 / 3. У будь-якому випадку, використання будь-якої файлової системи, яка не зазначається на об'ємі об'ємом 30 ТБ, було б абсолютно безумним .
shodanshok

Я думаю, що ext4 fsck може бути трохи кращим, якщо є 30Tb FS, що містить величезну кількість крихітних файлів. Обурення створити це, тому все-таки причина шукати в іншому місці.
nigel222

7

Концепція: їх система використовує RAID (без програмного забезпечення RAW / FBWC) (або навіть програмний RAID) з усіма можливими кешами запису (включаючи такі на самих жорстких дисках), встановлених у найагресивніших налаштуваннях, щоб отримати максимальну продуктивність за мінімальні витрати. Постійне відключення електроенергії при такій установці може залишити файлову систему журналу в стані, коли журналу не можна довіряти і не можна використовувати для відновлення. Проблема полягає в тому, що така система агресивно впорядковує і відкладає записування, а це означає, що запис у журналі можна писати з ефектом втраченої дії даних ... або втрачається запис журналу під час дії даних, яка була наслідком.

Відновлення такої системи з найгіршого випадку відключення може означати, що вам потрібно зробити "повільний" fsck / ремонт, який фактично вивчає всі структури файлової системи такими, якими вони є, що дійсно може зайняти день-два за 30 Тб .... і це малоймовірно, що вам доведеться запустити кілька циклів ремонту. Додайте до цього, що персонал може бути не завжди доступний для моніторингу цього, ви можете легко перейти на один fsck, що робиться на тиждень. Вони, напевно, здалися і забули.


1

Для більшості файлових систем це буде набагато швидше, навіть коли є помилки, оскільки зазвичай перевіряються лише метадані.

У гіршому випадку він може прочитати весь диск ( наприклад, щось подібне fsck.ext4 -cc /dev/sda, яке робить неруйнівний тест запису на кожен блок), що може зайняти кілька днів за 30 ТБ. Якщо ви знаєте швидкість приводів, ви можете розрахувати розмір / швидкість . Для жорсткого диска споживача, який копіює кілька ТБ, близько 100 Мб / с може зайняти більше годин, ніж очікували більшість людей.

Якби це ваш сервер, у вас може виникнути проблема, що він завантажується, тоді він зависає, коли fsckзапитує, чи хочете виправити помилку. Але адміністратор Центру обробки даних не залишить fsckвисіти протягом 6 місяців, поки всі VPS в режимі офлайн.

Тож вони вам або брешуть, або виникає величезне непорозуміння. Або вони працювали fsck деякий час тому і не повідомляли вас про нову проблему після її закінчення.


4
fsckобходить всі структури файлової системи, що в основному означає виконання випадкових вводу-виводу. Отже, наведений вище розрахунок, заснований на послідовній швидкості передачі, не дуже корисний.
shodanshok

@shodanshok дійсно структура файлів не має значення в загальній перевінці диска, як я щойно пояснив у своїй відповіді.
Сверхразум

@shodanshok моє найгірше припущення базувалося на дуже великому fsck. Наприклад, типовий xfs fsck робить мало. ext2 має тривалий обширний контроль, і старий скандал MS-DOS провів тест читання на кожному блоці жорсткого диска, коли він запускався в повному режимі. Отже, у вас є верхня межа розміру диска.
Алло

1
@Overmind І ви не відповідаєте на питання, яке стосується fsck, а не загальної перевірки накопичувача.
BlackJack

Будь ласка, майте на увазі, що прийняття типової пропускної здатності диска як індикатора може ввести в оману. Я зробив математику, коли одного разу повторно синхронізував масив, який повинен був (на мою думку) зайняти менше ніж день, і це зайняло більше двох тижнів! Домінанти є одним з домінуючих факторів за загальний час, і навіть якщо ви думаєте, що робите суворо послідовну операцію, іноді це не один. Тепер fsck суворо не послідовний, тому ... ніяк не можна судити про звичайну пропускну здатність диска до тривалості операції (все-таки місяці смішні ... це очевидна брехня).
Деймон
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.