Яка стратегія виявлення дрейфу часу в центрі обробки даних на базі Linux?


14

Яка стратегія виявлення затримки часу у всіх системах обробки даних на базі Linux? Це складніша проблема, ніж здається спочатку.

Збіг часу може спричинити серйозні проблеми для певних додатків, і часто, навіть якщо встановлений NTP, можливі збої з наступних (та багатьох інших) причин:

  • NTP неправильно налаштований для автоматичного перезавантаження при перезавантаженні.
  • Налаштування на сервері невірні, тому сервер часу, на який він вказує, недоступний або неточний.
  • Сервер основного часу недоступний, і всі сервери синхронізуються з ним тепер синхронізуються з ненадійним джерелом.

Я хотів би спосіб визначити, чи всі окремі сервери вірні. Майте на увазі, що сервер із тестовим сценарієм / програмою може бути неправильним.


6
Я думаю, що ваші причини нечіткі, оперативний НТП є критичним для ферми. Переконайтесь, що NTP працює належним чином. Також розгорніть місцевий головний годинник.
user539484

NTP працює з коробки на багатьох дистрибутивах Linux зараз із розумними типовими настройками. Зараз це майже не проблема.
Метт

Відповіді:


20

Це легко контролювати. Управління конфігурацією є ключовим ...

Переконайтеся, що служба ntp працює та налаштована ...

Наприклад, використовувати Monit для того, щоб переконатися, що ntpdвін працює, і перезапустити його, якщо він не вдався, - це простий підхід ... Можливо, має сенс додати крон та інші необхідні демони до такої перевірки.

Іншим варіантом є використання інструменту управління конфігурацією , наприклад Puppet, щоб примусити той же ntpd.conf до ваших серверів і забезпечити встановлення, налаштування та запуск ntpd.

У протоколі NTP достатньо надмірностей для вирішення випадків, коли сервер часу є недоступним. Вкажіть кілька джерел.


3
Я повинен перегукуватися з цим настроєм. Управління конфігурацією та декілька серверів NTP є досить базовою частиною інфраструктури у будь-якому, що наближається до "центру даних". Середній або більший центр обробки даних повинен мати апаратний годинник. Джерела часу GPS можна придбати за кілька сотень, а якщо у вас паяльник <100 доларів.
Кріс С

це рішення + нагіо
той хлопець звідти

4
Зауважте, що те , як ви перевіряєте ntpdстатус, є досить важливим. Ви не хочете просто говорити "ntpd працює. Все чудово!". Потрібно фактично переконатися, що ваша система синхронізується та має функціональний аналог, або що зсув часу мінімальний між хостом та вікном моніторингу . Nagios має check_ntp_peerі check_ntp_timeякі впораються з цим, якщо ви хочете використовувати Nagios.
voretaq7

ntpq для перевірки стану
kubanczyk

10

Існують різні плагіни check_ntp для нагіосів .

Ось один:

http://nagiosplugins.org/man/check_ntp

Додайте цей чек своєму хосту nagios і отримайте сповіщення, якщо щось піде не так.


Так, просто встановіть систему моніторингу, щоб перевірити, чи час дійсний, або принаймні зсув щодо системи моніторингу мінімальний.
Зоредаче
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.