У мене 15 однакових 64-розрядних серверів Linux RH 4.7. Вони запускають базу даних кластерів (кластер - це рівень програми). При нагоді (щомісяця або близько того) випадкова скринька (ніколи не однакова) замерзає.
Я можу пінг коробку і пінг працює. Якщо я спробую ввести скриньку в поле, я отримаю:
ssh_exchange_identification: Connection closed by remote host
SSH налаштований належним чином.
Коли я заходжу в серверну кімнату і намагаюся увійти безпосередньо до консолі, я можу перемикати консолі на Alt+ Fn, можу ввести ім’я користувача, і символи показують, але після натискання Enterнічого не відбувається. Я чекав 8 годин одного разу, і це не змінилося.
Я налаштував syslog для того, щоб реєструвати все на віддалений хост, і в цих журналах немає нічого. Коли я перезавантажую машину, вона працює без проблем. Я запустив тести на HW - все нормально, і нічого немає в журналах. Машини також контролюються за допомогою NAGIOS, і перед заморожуванням не спостерігається незвичного навантаження чи активності.
У мене закінчилося ідей; що ще я можу зробити або перевірити?