Сервер Ubuntu перезапустився самостійно


1

Я використовую коробку Ubuntu 16.04.3 LTS від Linode, яка дуже недостатньо використовується, але монітор тривалості роботи сказав мені, що мої сайти були знищені майже годину, перш ніж вони повернулися. Я перевірив і виявив, що сервер перезавантажений, і тоді сайт відновився. Був електронний лист від Linode, що Host initiated restart. Попередження про налаштування всередині Linode із високим пороговим рівнем використання також не спрацювало.

Я намагаюся з’ясувати, що сталося. Я бачив проблему в іншій бічній коробці Ubuntu з Linode, і підтримка Linode розповіла мені, що щось спричинило аварію Linode, і Лассі (їх сторожовий собака) перезавантажив її, саме це, здається, сталося тут.

Я перевірив , як /var/log/auth.logі , /var/log/syslogале вони просто , здається, НЕ вистачає записів журналу між 18:03до 18:57якої є вікно простою. Жодне повідомлення не виділяється як таке. На /var/log/messagesмоєму сервері немає журналу.

Зміст /var/log/syslog:

Feb 23 18:03:04 localhost alertyo-engine[6279]: Un-Setting flag
Feb 23 18:03:04 localhost alertyo-engine[6279]: Alloc = 1 MiB#011TotalAlloc = 2470 MiB#011HeapAlloc = 1 MiB#011Sys = 10 MiB#011NumGC = 10856
Feb 23 18:57:14 localhost rsyslogd: [origin software="rsyslogd" swVersion="8.16.0" x-pid="3304" x-info="http://www.rsyslog.com"] start
Feb 23 18:57:14 localhost rsyslogd-2222: command 'KLogPermitNonKernelFacility' is currently not permitted - did you already set it via a RainerScript command (v6+ config)? [v8.16.0 try http://www.rsyslog.com/e/2222 ]
Feb 23 18:57:14 localhost rsyslogd: rsyslogd's groupid changed to 108
Feb 23 18:57:14 localhost rsyslogd: rsyslogd's userid changed to 104
Feb 23 18:57:14 localhost systemd[1]: Mounted FUSE Control File System.

Зміст /var/log/auth.log:

Feb 23 18:03:01 localhost CRON[29814]: pam_unix(cron:session): session closed for user root
Feb 23 18:03:01 localhost CRON[29813]: pam_unix(cron:session): session closed for user ashfame
Feb 23 18:57:14 localhost CRON[3301]: pam_unix(cron:session): session opened for user ashfame by (uid=0)
Feb 23 18:57:15 localhost systemd-logind[3312]: Watching system buttons on /dev/input/event0 (Power Button)
Feb 23 18:57:15 localhost systemd-logind[3312]: New seat seat0.
Feb 23 18:57:15 localhost sshd[3449]: Server listening on 0.0.0.0 port 22.
Feb 23 18:57:15 localhost sshd[3449]: Server listening on :: port 22.
Feb 23 18:57:16 localhost CRON[3301]: pam_unix(cron:session): session closed for user ashfame
Feb 23 18:58:01 localhost CRON[3681]: pam_unix(cron:session): session opened for user root by (uid=0)
Feb 23 18:58:01 localhost CRON[3680]: pam_unix(cron:session): session opened for user ashfame by (uid=0)
Feb 23 18:58:01 localhost CRON[3681]: pam_unix(cron:session): session closed for user root
Feb 23 18:59:01 localhost CRON[3787]: pam_unix(cron:session): session opened for user root by (uid=0)
Feb 23 18:59:01 localhost CRON[3786]: pam_unix(cron:session): session opened for user ashfame by (uid=0)
Feb 23 18:59:01 localhost CRON[3787]: pam_unix(cron:session): session closed for user root
Feb 23 18:59:01 localhost CRON[3786]: pam_unix(cron:session): session closed for user ashfame

Що ще я можу перевірити? Якщо це повторювалося, я, мабуть, міг би налаштувати більше матеріалів для ведення журналу, щоб зрозуміти, що йде не так, але, як і минулого разу (що було в іншому полі), я боюся, що це відбувається раз на кілька місяців. Як я можу з’ясувати, що сталося, а не готуватися до того, коли це повториться?


ви не знайдете корисних журналів, якщо ваш хостинг-провайдер перезавантажить ваш екземпляр сервера, ви не можете контролювати це зсередини
Fabian

@Fabian Що ти пропонуєш зробити? Я також створив службу підтримки з Linode, але боюся, що вони просто заявлять, що це проблема програмного забезпечення, для якої вони не надають підтримку.
Ashfame

Одним недоліком цих віртуальних серверів є те, що ви не знаєте, що хост-система робить з вашим екземпляром. Ви можете відстежувати це за допомогою Munin guide.munin-monitoring.org/en/latest, щоб проаналізувати тенденції до ресурсів та отримати добре поінформовану основу для аргументації з вашим постачальником.
Фабіан

Відповіді:


0

Тільки що дізналися, що це було викликано відключенням електроенергії у центрі обробки даних Linode у Fermont

Отже, якщо ви не бачите нічого в своїх журналах сервера для такої проблеми, однією з причин може бути те, що сервер просто вимкнено, і, отже, нічого не з’явилося в журналах (я пам'ятаю, читав щось, що деякі системи можуть хоч).

Завжди хороша ідея, щоб перевірити сторінку статусу вашого провайдера та пошук у Twitter)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.