За останній тиждень машина mini-ITX, яку я створив для обслуговування пошти, а також акції Samba, ядро двічі панікувало файли, пов'язані з файловою системою. Минулої ночі я помітив помилки в цілісності під час передавання фільму на мій топ-клієнт (відео артефакти), тому я почав ковтати.
І внутрішній жорсткий диск, і зовнішній жорсткий диск використовують програмне забезпечення RAID Linux і на будь-якому дзеркалі, якщо я роблю md5sum на досить великому файлі, як у відео, і роблю це повторно, я отримую різні контрольні суми щоразу (я повинен зазначити, що один - ext4, інший - JFS). Я завантажив USB-накопичувач у режим відновлення, відбувається те саме. Я не намагався прочитати зовнішнє дзеркало на іншому комп’ютері, але я встановив один із складових дисків, і це здавалося прекрасним, принаймні, він давав там постійні md5sums.
Отже, файлова система виключається (це відбувається як на ext4, так і на JFS), напевно, жорсткі диски (це було б неймовірно збіг обставин), контролери SATA, ймовірно, бачать, як це відбувається на двох абсолютно незалежних контролерах, пошкодженому модулі ядра або щось не бачить, як це робиться, навіть під час завантаження рятувального диска.
Той факт, що це відбувається з двома окремими наборами накопичувачів, керованими двома окремими контролерами SATA, запускаючи дві різні файлові системи, і поведінка зберігається при завантаженні двох різних ядер, змушує мене думати, що єдиний правдоподібний варіант полягає в тому, що щось жахливо не так материнська плата. Ця материнська плата вже була заміною RMA від компанії, якій я не особливо довіряю (Zotac), тому це було б менш дивно, ніж зазвичай.
Це Ubuntu Server 10.04, до речі, 64-розрядний на материнській платі Zotac IONITX-C (я думаю) з Atom N230.
У когось є якісь інші ідеї, діагностика, яку я повинен виконувати і т.д.?
EDIT: Дві речі, які я забув згадати: коли я завантажувався з USB-клавіші, я дуже мало запускав fsck на обох md-пристроях.
Ось як виглядають паніки:
Я намагався шукати в Google декілька з них без особливого успіху, але думаю, що швидше за все винне обладнання; Я просто не знаю , який конкретний шматок апаратних засобів.
EDIT 2: Щойно пройшов memtest86, і жодного тесту не проходить. Найменш значущі 2 байти тестового шаблону, здається, завжди читаються неправильно. Все ще не впевнений, чи це оперативна пам’ять чи чіпсет, і я не маю зайвої палиці оперативної пам’яті для тестування.