Linux media box / поштовий сервер, що страждає файловою системою / помилками RAID, панікою ядра


3

За останній тиждень машина mini-ITX, яку я створив для обслуговування пошти, а також акції Samba, ядро ​​двічі панікувало файли, пов'язані з файловою системою. Минулої ночі я помітив помилки в цілісності під час передавання фільму на мій топ-клієнт (відео артефакти), тому я почав ковтати.

І внутрішній жорсткий диск, і зовнішній жорсткий диск використовують програмне забезпечення RAID Linux і на будь-якому дзеркалі, якщо я роблю md5sum на досить великому файлі, як у відео, і роблю це повторно, я отримую різні контрольні суми щоразу (я повинен зазначити, що один - ext4, інший - JFS). Я завантажив USB-накопичувач у режим відновлення, відбувається те саме. Я не намагався прочитати зовнішнє дзеркало на іншому комп’ютері, але я встановив один із складових дисків, і це здавалося прекрасним, принаймні, він давав там постійні md5sums.

Отже, файлова система виключається (це відбувається як на ext4, так і на JFS), напевно, жорсткі диски (це було б неймовірно збіг обставин), контролери SATA, ймовірно, бачать, як це відбувається на двох абсолютно незалежних контролерах, пошкодженому модулі ядра або щось не бачить, як це робиться, навіть під час завантаження рятувального диска.

Той факт, що це відбувається з двома окремими наборами накопичувачів, керованими двома окремими контролерами SATA, запускаючи дві різні файлові системи, і поведінка зберігається при завантаженні двох різних ядер, змушує мене думати, що єдиний правдоподібний варіант полягає в тому, що щось жахливо не так материнська плата. Ця материнська плата вже була заміною RMA від компанії, якій я не особливо довіряю (Zotac), тому це було б менш дивно, ніж зазвичай.

Це Ubuntu Server 10.04, до речі, 64-розрядний на материнській платі Zotac IONITX-C (я думаю) з Atom N230.

У когось є якісь інші ідеї, діагностика, яку я повинен виконувати і т.д.?

EDIT: Дві речі, які я забув згадати: коли я завантажувався з USB-клавіші, я дуже мало запускав fsck на обох md-пристроях.

Ось як виглядають паніки:

введіть тут опис зображення

Я намагався шукати в Google декілька з них без особливого успіху, але думаю, що швидше за все винне обладнання; Я просто не знаю , який конкретний шматок апаратних засобів.

EDIT 2: Щойно пройшов memtest86, і жодного тесту не проходить. Найменш значущі 2 байти тестового шаблону, здається, завжди читаються неправильно. Все ще не впевнений, чи це оперативна пам’ять чи чіпсет, і я не маю зайвої палиці оперативної пам’яті для тестування.


Ви скасовували розділи під час завантаження USB-пристрою?
matthias krull

Так, кілька разів. Вони були добре.
dwf

Відповіді:


1

Моє голосування - це оперативна пам'ять, яка погана, або, можливо, щось на чіпсеті. Чи можете ви поміняти оперативну пам'ять на відому хорошу оперативну пам’ять і подивитися, як вона йде? - (Більшість сучасних Linux мають також "memtest" варіант встановлення диска, що ви можете спробувати, якщо ви не знаєте хорошого оперативної пам’яті, хоча я б запропонував зробити гарну оперативну пам'ять як кращий тест.


Дякую, що нагадали, що я обов’язково запускаю memtest86, коли повернусь додому.
dwf

Виявляється, одна з палиць оперативної пам’яті була несправною, інша - нормальною. Я подав запит RMA. Дякую!
dwf
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.