На подвійному сервері процесора, чи нормально один процесор працювати більш гарячим, ніж інший?


51

У мене є подвійний сервер Opteron під управлінням Linux з libvirt для розміщення декількох віртуальних машин. Відеомагнітофони працюють нормально, і сервер обробляє все в порядку, але я помічаю, що один процесор завжди працює близько 69 ° C (дросель при 70 ° C), а інший працює близько 15 ° C.

Це не здається мені нормальним? Чи не повинні вони обоє трохи ближче до температури?

Я не впевнений, як далі діанозувати. Можливо, на одному з процесорів недостатньо термічної пасти?

Редагувати: материнська плата ASUS KGPE-D16 і охолоджується подвійними вентиляторами Noctua NH-U9DO .

Зауважте, що я думаю, що температури можуть бути більше за навколишні, а не від абсолютних? Коли сервер працює на холостому ходу, температура процесора падає до 2С і 13С. Я використовую конфігурацію LMSensors з тут


1
Що таке марка / модель сервера?
ewwhite

2
Як розподіляється завантаження процесора? mpstat -P ALL 1на Linux допоможе
Крістофер Перрін

3
звучить як зламаний датчик температури
матчек

14
15С, швидше за все, зламаний цензор ....
Здійснюється

Здається, що вийшов з ладу або погано відкалібрований датчик, якщо ви можете перезавантажити сервер, подивіться на BIOS, який повинен відображати правильні значення.

Відповіді:


106

Проблема виявилася погано підігнаним радіатором. Можливо, погано підходить - не правильний опис. Виявляється, вам потрібно нанести теплову пасту на радіатор, а не на пластикову кришку, яка йде над радіатором.

введіть тут опис зображення

Після зняття пластикової кришки процесор приємний і крутий, дякую всім!


51
+1 просто тому, що це смішно
HBruijn

9
Ви маєте на увазі, що хтось залишив пластикову кришку на місці, а потім поклав на неї пасту, а потім надів радіатор? Епос.
TomTom

4
Бааааааааааахахахааа !!
Крейг

8
Мені подобається, як ви можете бачити положення та умови, обмежену гарантію та політику повернення у фоновому режимі. :)
Гонки легкості з Монікою

6
Якщо ти змушуєш себе почувати себе менш дурним, (і не буде), я зробив подібну річ зі своєю новою офісною кавоваркою. Кава була занадто холодною для пиття, і я упаковував її назад для повернення в магазин, перш ніж диск захисного картону скинув нагрівальний елемент :)
Мартін Джеймс

25

На мій досвід, для парних компонентів нормально працювати в різних випадках, тому що повітряний потік не скрізь однаковий. Ось графік температури жорсткого диска з моєї коробки кольорів. Приводи дзеркальні, тому навантаження на них майже однакові.

munin графік темпів HDD за минулий рік

Як бачите, вони відслідковують один одного, але вони не однакові; вони також, в середньому, лише 6С один від одного. Незалежно від того, чи дають датчики абсолютну температуру або температуру, різниця 55С під навантаженням здається дуже неправильною. Якщо у вас є впевненість, що дані вірні, то, враховуючи, що спокій різниці падає до 10С, що є різницею, яку я бачу через повітряний потік, я б підозрював погано встановлений радіатор.


1
Використовуючи mpstat (від Крістофера Перріна, спасибі!), Я підтвердив, що навантаження розподіляється досить рівномірно. Зараз речі простоюють при + 3 ° C та + 20 ° C. Я спробую повозитися з радіатором, щоб побачити, чи він вільний. Як ви думаєте, це може бути питання термічної пасти?
самоз

Це дуже можливо (і тим більше після того, як ви почнете його махати).
MadHatter

8

Це не так. Якщо у вас немає серйозних проблем із потоком повітря. Або один із кулерів поганий. Температура буде різнитися - але не настільки сильно (70 проти 15 градусів Цельсія).

Враховуючи, наскільки низький 15 градус, я б припустив (а) ваш датчик вимкнено (ви дійсно зберігаєте сервер у цій прохолодній кімнаті?)

Я б також припустив, що один із процесорів взагалі просто не працює, з будь-якої причини.

Невеликі відмінності є нормальними. Можливо, деякі трохи більші (повітряний потік приходить мені в голову). але тут ми говоримо про те, що один є холодним.


2

Це може бути або охолодження, або нерівномірне завантаження (враховуючи тимчасову різницю, ваше становище, ймовірно, нерівномірне завантаження). Вам слід використовувати щось на кшталт prime95, щоб рівномірно завантажувати всі ядра та бачити, чи змінюються темпи. Якщо їх немає, то вам потрібно збалансувати віртуальний комп'ютер, перевірте, чи ваші програми багатопотокові та зайняті. Як це зробити, залежить від вашого програмного забезпечення та індивідуального навантаження, тому це дійсно виходить за рамки питання. Майте на увазі, що немає реальної переваги робити це, якщо у вас недостатньо навантаження для поповнення одного процесора / ядра, адже ваш VM може навмисно уникати використання другого процесора, щоб він міг переходити в режими енергозбереження на мульти -cpu системи.

Якщо ви звузили його до охолодження. Невелика різниця до 10С може бути занадто мало (або занадто багато!) Термопасти. Більша різниця вказує на значну проблему чи різницю між процесорами-кулерами. Можливо, хтось заблокував повітряний потік, радіатор збитий і т.д.


0

Мені доведеться погодитись, несправна температура. датчик, як 15С всього 59F !!! Якщо б комп’ютер не знаходився в надзвичайно холодному центрі обробки даних, я б міг уявити, що температура повітря навколишнього повітря буде вище 59F! Ви намагаєтеся призначити ВМ для низькотемпературного ядра і побачити, чи є якісь зміни; якщо ні, то я б дуже підозрював, що датчик несправний.

Ви також можете подивитися на висновок dmesg(повідомлення про завантаження) і побачити, чи є там щось незвичне.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.