"Mce: [Помилка апаратури]: події перевірки машини зареєстровані" з'являється в syslog. Що я повинен зробити?


19

Я встановив останню версію OSSEC (2.8.1), а також увімкнув сповіщення електронною поштою. І я отримую багато таких сповіщень про те, що є помилка обладнання та щось про mce:

OSSEC HIDS Notification.
2015 Apr 04 20:09:22

Received From: Bath-Towel->/var/log/syslog
Rule: 1002 fired (level 2) -> "Unknown problem somewhere in the system."
Portion of the log(s):

Apr  4 20:09:21 Bath-Towel kernel: [ 1873.680872] mce: [Hardware Error]: Machine check events logged



 --END OF NOTIFICATION

То що саме це означає? Що означає mce? І чи є ця очевидна помилка апаратури, що я повинен турбуватися?


Інформація про ОС:

Description:    Ubuntu 14.10
Release:    14.10

Вам потрібно буде трохи прочитати на ossec, подивитися правила - ossec-docs.readthedocs.org/en/latest/manual/rules-decoders . Веб-інтерфейс допомагає, оскільки має низку пояснень - ossec.net/wiki/index.php/OSSECWUI:Install
Panther


ossec, мабуть, погано підтримується або не працює в темі, оскільки його немає у сховищах ubuntu
Panther

1
Це зовсім не про OSSEC. Ви отримали це повідомлення, оскільки OSSEC знайшов слово "помилка" в syslog. Хоча я не думаю, що це поза темою, ви, мабуть, отримаєте додаткову допомогу у формі Unix & Linux або Server Fault .
Ерік Карвальо

4
@ bodhi.zazen Все, що потрібно зробити, щоб бути на тему, працює на Ubuntu. Тепер це не означає, що ви отримаєте відповідь, звичайно.
Сет

Відповіді:


23

Виняток з машинної перевірки :

Machine Check Exception (MCE) являє собою тип апаратної помилки комп'ютера , що відбувається , коли центральний блок обробки комп'ютера виявляє проблему апаратних засобів.

На вашому комп'ютері сталася помилка в апаратному забезпеченні, і ядро ​​записало подію в буфер. Ви можете використовувати mcelogдля реєстрації та перегляду подій перевірки машини. З mcelogmanpage :

Процесори X86 повідомляють про помилки, виявлені процесором як події машинної перевірки (MCE). Це можуть бути пошкодження даних, виявлені в кешах процесора, в основній пам'яті за допомогою інтегрованого контролера пам'яті, помилки передачі даних на передній бічній шині або взаємозв'язку процесора або інші внутрішні помилки. Можливими причинами можуть бути космічне випромінювання, нестабільні джерела живлення, проблеми з охолодженням, зламане обладнання, запуск систем, що не відповідають технічним умовам, або невдача.

Більшість помилок може бути виправлена ​​ЦП за допомогою внутрішніх механізмів виправлення помилок. Невиправлені помилки викликають винятки перевірки машини, які можуть призвести до руйнування процесів або паніки машини. Невелика кількість виправлених помилок зазвичай не викликає занепокоєння, але велика кількість може вказувати на майбутній збій.

Коли виправлена ​​або відновлена ​​помилка, ядро ​​x86 записує запис, що описує MCE, у внутрішній кільцевий буфер, доступний через пристрій / dev / mcelog. mcelog вилучає помилки з / dev / mcelog, розшифровує їх у читаному для людини форматі та друкує їх на стандартному виході або необов'язково в системний журнал.

Якщо ви не помітили жодної аварії, ймовірно, помилка була успішно виправлена. Все-таки раджу встановити, mcelogщоб слідкувати за такими подіями:

sudo apt-get install mcelog

Події будуть зареєстровані /var/log/mcelog. Ви також можете запустити:

sudo mcelog --client

запитувати mcelogдемона на помилки.


2
Цікаво, чому помилки MCE не просто записуються безпосередньо в системний журнал ... можливо, якась вагома причина, можливо
Xen2050

2
@ Xen2050 Оскільки декодування повідомлення залежить від архітектури, воно не завжди документально підтверджується виробниками обладнання. Помилка може бути згенерована навіть шиною PCIe.
Мірча Вутковичі

4
@ Xen2050: На моїй машині Fedora 25 повідомлення MCE записуються до журналу, я можу їх бачити journalctl -b.
Мартін Удінг
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.