Підсумок
Я отримую ці загадкові повідомлення в syslog з моменту встановлення нового обладнання, і я не можу зрозуміти, в чому проблема, якщо вона серйозна, або що з цим робити.
Вони з нового SATA HBA, і вони слідують схемі. Я отримаю кілька перших повідомлень, а через 5 - 30 секунд кілька інших. Вони надходять у краплі, які реєструються в одну і ту ж секунду, і точна кількість кожного варіюється приблизно від 2 до 35. Між появами записів може пройти хвилин чи години.
Приклад двох повідомлень:
Jul 13 06:06:23 durandal kernel: [366918.435596] mpt2sas0: log_info(0x31120303): originator(PL), code(0x12), sub_code(0x0303)
Jul 13 06:06:28 durandal kernel: [366923.145524] mpt2sas0: log_info(0x31110d01): originator(PL), code(0x11), sub_code(0x0d01)
Це завжди 0x31120303, а потім 0x31110d01.
mpt2sas є драйвером для адаптера шини хоста SATA, який я використовую, але вміст помилки є надто виразним. Це не говорить мені, в чому проблема, з яким диском чи портом це чи наскільки це серйозно.
Обладнання
Supermicro X9SCL з Xeon E3-1220 та 8 ГБ оперативної пам’яті.
Супермікро AOC-USAS2-L8I SAS / SATA HBA на базі LSI SAS2008 підключений до набору лотків для дисків Supermicro CSE-M35T-1B . У нього три Western Digital WD30EZRX і два Segate ST3000DM001, підключені до нього. Всі накопичувачі 3 ТБ (фактично однакова кількість секторів). Не використовуються розширювачі портів.
HBA, лотки для дисків та 4 диски є новими. Один із WD30EZRX був місяцями, з ним не було проблем. Якщо раніше він був підключений до інтегрованого контролера Intel SATA, перемістив його у відсіки накопичувача за допомогою цієї нової установки.
Проблеми з HBA мали потребу в частому перезавантаженні та отримання дійсно жахливих показників. Оновлено мікропрограмне забезпечення / біографію до "Phase 12", останнього випуску, доступного від Supermicro, і змінив тип на ІТ (тобто перехід, з IR для інтегрованого рейду, оскільки я збирався використовувати весь програмний рейд): 2008IT12.FW. Це оновлення очистило всі ранні випуски, і я не почав отримувати вищезгадані повідомлення пізніше (див. Нижче).
Перші чотири диски, які я додав, знаходяться на першому порту SFF-8087 (розділений на 4 кабелі SATA). Останній доданий мені диск знаходиться на іншому порті, якщо це має значення.
Єдиний інший диск в системі містить ОС, і це старіший накопичувач Intel 80GB SSD, підключений до вбудованого контролера SATA.
Програмне забезпечення
Ubuntu 11.10 (онерік). Linux 3.0.0-14-сервер x86_64. Використання драйвера mpt2sas, який постачається з ОС.
Спроба створити масив RAID6 за допомогою Linux md з цими п'ятьма дисками. Почав із виродженого масиву з 3-х дисків, двох Segates та одного з нових накопичувачів WD. Це було швидко і пройшло дуже добре, після журналу оновлення прошивки не було повідомлень у журналах. Тим часом я все ще використовую старий диск WD на порту 0 того ж контролера.
До масиву додали інший новий диск WD. Початок відновлення, і я періодично отримую ці повідомлення в syslog. Я не впевнений, скільки часу знадобиться додати диск до масиву, але орієнтовний час (cat / proc / mdstat) коливається від тисяч до десятків тисяч хвилин, набагато довше, ніж на перші 3 диски. Я розумію, що диски WD набагато повільніше; У мене з'явилися різні моделі, щоб зменшити шанси на збій декількох дисків, і це були дві найдешевші 3TB моделі.
Примітки
SMART не повідомляє про проблеми на жодних дисках. На будь-яких дисках не зафіксовано помилок, і жодна зі статистичних даних про відмову не знаходиться десь біля порогу.
Повідомлення, що ввійшли в систему, почали з'являтися лише після того, як я додав останній диск, що говорить про те, що у когось може виникнути проблеми, але я нічого іншого не вказую на це.
Я знайшов файл заголовка, який, здається, відповідає повідомленням журналу цього драйвера. Перше повідомлення, схоже, є перервою (код 12) для "підкоду" 0303, який не вказаний. Друге повідомлення - це скидання (код 11) з тієї причини, яка також не зрозуміла. Якби я міг визначити, що означають 0303 та 0d01, це було б дуже корисно.
Я знаю, що 4 диски в 5-дисковому RAID6 - це неповний масив. Я планую скопіювати вміст старого диска в масив, як тільки він закінчить інтегрувати 4-й диск, а потім додати старий диск до масиву.