По-перше, я повинен запитати: "відключення"? Ви маєте на увазі, що машина перезавантажується чи вона насправді зупиняється? Якщо він зупиняється, він або неправильно налаштований (можливо, в BIOS), або щось активно вимикає машину (тобто init 0).
Якщо ні, то вашим основним кандидатом буде / var / log / syslog та /var/log/kern.log, оскільки ваша проблема звучить як паніка ядра або помилка апаратного забезпечення, що викликається програмним забезпеченням. Звичайно, якщо сервер запускає якусь послугу (наприклад, apache), це може дати вам і підказку.
Часто в таких ситуаціях генеруються записи журналу, але оскільки у машини виникають труднощі, він не зможе записати записи на диск. Якщо вікно є кольоровим, велика ймовірність, що він підключений до послідовної консолі партнером по колорі. Саме тут я б заглянув, якби не знайшов нічого підозрілого у вищезгаданих журналах.
Якщо машина не підключена до послідовної консолі і в журналі немає нічого, ви можете розглянути можливість надсилання syslog до іншого вікна через мережу. Можливо, мережевий інтерфейс зберігається трохи довше, і повідомлення журналу можна прочитати на сервері syslog. Погляньте на rsyslog або syslog-ng.
ОНОВЛЕННЯ:
Я згоден з @Johann нижче. Найімовірнішою причиною зупинки є сторожова температура температури процесора. Спробуйте перевірити / побудувати графік температури в коробці через lmsensors або smartctl (як правило, найпростіший). Я вважаю, що colled є безпрецедентним при відстеженні великої кількості змінних у часі. Він може робити як IPMI, так і lm-датчики та hddtemp. Також деякі зупинки температури журналу BIOS: es журналу.