Виняток машинної перевірки, повідомлений ядром


3

Я створив новий комп’ютер:

  • Intel Core i7 4770K
  • Гігабайт Z87N-WIFI
  • Samsung 840 Evo S x2 (в RAID 0)
  • 450w Corsair RM 80Plus
  • Темний рок Pro 3 охолодження
  • Kingston 1600 DDR3
  • НЕ ВІДДАЛЕНОГО GPU

Операційна система:

  • Linux Mint 16 Петра

Налаштування BIOS повністю за замовчуванням, за винятком конфігурації RAID. Процесор НЕ розігнаний, і ніколи не був з моменту його придбання.

Приблизно 3 рази на день, коли я побудував систему, вона несподівано вийде з ладу і перейде на чорний екран із написом "Машинна перевірка винятку ...", зображення нижче:

введіть тут опис зображення

Температура виглядає добре:

➜  ~  sensors
acpitz-virtual-0
Adapter: Virtual device
temp1:        +27.8°C  (crit = +105.0°C)
temp2:        +29.8°C  (crit = +105.0°C)

coretemp-isa-0000
Adapter: ISA adapter
Physical id 0:  +42.0°C  (high = +80.0°C, crit = +100.0°C)
Core 0:         +40.0°C  (high = +80.0°C, crit = +100.0°C)
Core 1:         +41.0°C  (high = +80.0°C, crit = +100.0°C)
Core 2:         +41.0°C  (high = +80.0°C, crit = +100.0°C)
Core 3:         +40.0°C  (high = +80.0°C, crit = +100.0°C)

pkg-temp-0-virtual-0
Adapter: Virtual device
temp1:        +42.0°C 

Оновлений BIOS до останнього.

Хтось може сказати мені, яка проблема може бути?


2
Звучить як апаратна проблема. Чи працював ЦП раніше? Ви перевірили, чи немає зігнутих шпильок на материнській платі? Ви пробували інші дистрибутиви, крім монетного двору 16?
DanteTheEgregore

Спробували з кількома дистрибутивами Linux: Fedora, Ubuntu та Linux Mint з PCRE. Усі вони руйнуються однаково. Можливо, це несправна материнська плата або несправний процесор викликають цю помилку?
Світ

Це може бути збій процесора. Спробуйте завантажити Prime95 (не турбуйте реєстрацію) і запустіть тест Blend ( mprime -mдля запуску утиліти config) протягом 6-8 годин (3 мінімум). Він буде тривати до тих пір, поки ви не зупините його або не виникне помилка.
DanteTheEgregore

Температури ACPI - це не дуже добре. Мій сервер також повідомляє про ці точні температури - у будь-який момент часу. Спробуйте використовувати lm_sensors.
Даніель Б

Відповіді:


2

Це, безумовно, апаратна проблема. mcelog --asciiповідомляє про таке:

Hardware event. This is not a software error.
CPU 0 BANK 4 TSC 2d95278285f8
RIP !INEXACT! 10:ffffffff816f6570
MISC 0
TIME 1398091195 Mon Apr 21 16:39:55 2014
MCG status:RIPV MCIP
MCi status:
Uncorrected error
Error enabled
MCi_MISC register valid
Processor context corrupt
MCA: Internal unclassified error: 402
STATUS ba00000052000402 MCGSTATUS 5
CPUID Vendor Intel Family 6 Model 60
SOCKET 0 APIC 0 microcode 9

... що, на жаль, не дуже допомагає. Ймовірно, якась недокументована внутрішня помилка процесора. Вашою найкращою ставкою буде, якщо це можливо, піти на обмін гарантією (вашого процесора).


Ви мали рацію, це був несправний процесор.
СТУР
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.