Я перебуваю в середовищі, яке містить багато серверів Supermicro, оснащених апаратними RAID-контролерами Adaptec та LSI MegaRAID . Ці контролери містять кешовані модулі, керовані акумулятором, щоб підвищити продуктивність запису та захистити дані під час передачі.
Часті проблеми з підтримкою - вихід з ладу батареї RAID-контролера. Це зрушує масив від зворотного запису для запису через режим. Очевидно негативний вплив на продуктивність, оскільки система працює із зниженою швидкістю запису. Це зберігається, поки не буде встановлено вікно простою для вимкнення системи та заміни акумулятора.
Це дуже рутинна операція для нас; майже щотижня на декількох тисячах фізичних серверів ... У нас навіть є зарядні станції для підготовки замінних батарей, щоб їх можна було замінити без циклу зарядки.
Можливо, мене зіпсувала довга історія із серверами HP ProLiant та контролерами RAID Smart Array , але системи HP зазвичай мали батарею 4-6 років. Вони врешті-решт виключили використання батарейок RAID близько 2009 року. Їх замінили модулі пам'яті, що підтримуються суперконденсатором (кеш-пам'ять запису, що підтримується спалахом, або FBWC) і не потребують заміни, утилізації або тривалого початкового циклу зарядки.
Оскільки я бачу збої акумулятора в контролері Adaptec та LSI, які іноді трапляються в системах, які працюють менше 12 місяців, мені цікаво, чи це часто зустрічається в інших середовищах.
Якщо це звичайне явище, як інші великі серверні середовища обробляють це?
- Які-небудь поради чи підказки щодо роботи із заміною батареї RAID?
- Чи є якісь параметри конфігурації, які можуть допомогти?
- Наскільки руйнівним це є для операцій у вашому оточенні?
- Чи можуть поганий охолодження шасі і температура бути фактором?
- Ми щось робимо не так?
- Контролери Dell PERC виробляються LSI. Чи мають середовищі Dell такі ж короткі терміни експлуатації акумулятора?
Література про товари LSI, в якій викладено акумулятор нового покоління, який може працювати довше, ніж 1 рік.
Сервер HP ProLiant DL585 G2 з режимом 1000+ днів роботи та радісним батареєю RAID ...
# uptime
05:38:08 up 1031 days, 44 min, 31 users, load average: 0.49, 0.64, 0.99
# hpacucli
Cache Board Present: True
Cache Status: OK
Accelerator Ratio: 50% Read / 50% Write
Total Cache Size: 512 MB
Battery Pack Count: 1
Battery Status: OK