Помилки апаратних процесорів в Ubuntu 17.04


12

Хтось може мені пояснити, які ці повідомлення про помилки я отримав, коли переглянув dmesg? Я новачок у Ubuntu та Linux World.

[ 7.802351] CPU4: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802352] CPU0: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802353] CPU5: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU0: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU4: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] CPU1: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] mce: [Hardware Error]: Machine check events logged
[ 7.802362] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802363] mce: [Hardware Error]: TSC 99561677c
[ 7.802385] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.802387] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802387] mce: [Hardware Error]: TSC 995616be4
[ 7.802388] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.802389] CPU2: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802390] CPU6: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802391] CPU3: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802392] CPU7: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.826359] CPU4: Core temperature/speed normal
[ 7.826359] CPU0: Core temperature/speed normal
[ 7.826360] CPU2: Package temperature/speed normal
[ 7.826361] CPU6: Package temperature/speed normal
[ 7.826361] CPU0: Package temperature/speed normal
[ 7.826362] CPU4: Package temperature/speed normal
[ 7.826363] mce: [Hardware Error]: Machine check events logged
[ 7.826367] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826368] mce: [Hardware Error]: TSC 99916f004
[ 7.826369] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.826369] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826370] mce: [Hardware Error]: TSC 99916f2ca
[ 7.826370] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.826400] CPU1: Package temperature/speed normal
[ 7.826401] CPU5: Package temperature/speed normal
[ 7.826402] CPU3: Package temperature/speed normal
[ 7.826402] CPU7: Package temperature/speed normal
[ 467.922330] CPU4: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922331] CPU0: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922332] CPU7: Package temperature above threshold, cpu clock throttled (total events = 86)
[ 467.922333] CPU3: Package temperature above threshold, cpu clock throttled 

Я запускаю Ubuntu 17.04 з загальним ядром 4.10.0-29


або це помилка в програмному забезпеченні, я маю те саме у своєму журналі нового Lenovo T480S, див. bugs.launchpad.net/ubuntu/+source/linux/+bug/1781924
Rolf Schumacher

Відповіді:


8

Процесор перегрівається і переходить в MCE (події перевірки машини) ... тобто: він виходить з ладу. Якщо у системі ви не бачите інших подій, пов'язаних з температурою, це, мабуть, тому, що ваш процесорний кулер / вентилятор / теплова труба / термопаста не справляється з цим.

  • Перевірте syslog за допомогою цієї terminalкоманди ...

    grep -i -e temp -e therm /var/log/syslog*
    
  • Якщо машина дуже брудна / запилена, це може зіграти головну роль у перегріві машини. Почистіть його.

  • Якщо на вашій машині є процесори Intel, переконайтеся, що intel-microcodeвони встановлені.

    sudo apt-get update
    sudo apt-get install intel-microcode
    reboot
    
  • Встановіть, thermaldщоб спробувати контролювати температуру.

    sudo apt-get update
    sudo apt-get install thermald
    reboot
    
  • Перевірте свою версію BIOS. Введіть свій BIOS під час живлення та зверніть увагу на версію №. Перейдіть на веб-сайт виробника з маркою / моделлю вашого комп’ютера. Перейдіть до розділу підтримки та завантаження та подивіться, чи є новіший BIOS.

  • Нарешті, і дуже ймовірно, що якщо це старіша машина, теплову суміш, що сидить між процесорами та його охолоджувачем теплової труби / вентилятора, потрібно повторно застосувати. Для цього потрібен певний технічний досвід.


1
Який вплив intel-micorocodeмає температура?
gene_wood

@gene_wood, як я вже згадую, це, мабуть, проблема з пилом, вентилятором чи термічними сполуками, і перевірка мікрокоду - лише черговий крок, який допомагає дистанційно діагностувати проблему. Старий мікрокод центрального процесора може спричинити різні проблеми. Секунди, щоб перевірити це.
гейннема
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.