Сервер Zabbix надсилає занадто багато сповіщень


9

Нещодавно я встановив сервер Zabbix на VPS і дуже задоволений цим. Я встановив клієнта на appr. 6-7 інших VPS і все працює добре. Інтерфейс гладкий, і він дає дуже гарні графіки.
Моя єдина проблема з програмним забезпеченням полягає в тому, що я налаштував його надсилати сповіщення про проблеми, але щодня отримую від 30 до 60 електронних листів. Завжди щось поряд із "Сервер XXX недоступний: ПРОБЛЕМА", а через хвилину: "Сервер XXX недоступний: ОК". Звичайно, Zabbix також визнає, коли є реальні проблеми, наприклад, коли перезапуск сервера. Мені просто здається, ніби Zabbix дуже швидко "здається", або, можливо, йде швидше, ніж те, що відповідає моїм потребам. Я кілька разів намагався google цю проблему, але відмовився, тому зараз я намагаюся такий підхід.

Хтось знає, як відрегулювати вірність цих повідомлень / тригерів?


ви використовуєте шаблони прикладів за замовчуванням? якщо так, то, швидше за все, це пункт "статус", який насправді не пропонується :) - замість нього слід змінити на agent.ping, щоб перевірити наявність хоста
Richlv

Відповіді:


9

https://www.zabbix.com/documentation/1.8/manual/escalations_and_repeated_notifications/delayed_notifications Я використовую функцію ескалації Zabbix для придушення частих повідомлень On / Off. В загальному:

  • перші повідомлення запускають ланцюг ескалації, без електронної пошти вам
  • тоді Zabbix чекає 5 хвилин (або все, що ви налаштували), перш ніж надсилати повідомлення.
  • якщо протягом цих 5 хвилин тривожна зміна стану, ви отримуєте повідомлення НІ, і все повернеться до норми.
  • Приємна частина цього, що дешборд все ще показує

Олег


Дякую! Це схоже на те, що я шукав. Я відкоригував налаштування, і тепер даю системі деякий час, щоб побачити, як впливає на надсилання повідомлень.
anselmdk

Після терплячого очікування (та розслаблення деяких тригерів), електронна пошта Zabbix нарешті працює належним чином. Дякую за пораду!
anselmdk

5

Ви також можете налаштувати тригери. Я знайшов метод count () зручним.
Замість того, щоб активувати останній (0), спробуйте підрахувати (300,0, "eq")}> 5. Це викликає виняток, якщо останні 5 перевірок (припускаючи 60 секунд між чеками) не вдалося.

http://www.zabbix.com/documentation/1.8/manual/config/triggers

Ви також можете відключити повідомлення ОК, додавши умову "Тригерне ​​значення =" ПРОБЛЕМА "'. Цю зміну слід внести в конфігурацію дій.

http://www.zabbix.com/documentation/1.8/manual/config/action


2
Насправді ваш приклад підрахунку поверне кількість значень за останні 300 секунд, що дорівнює 0. Потім ви порівнюєте його з 5. Загальний ефект полягає в запуску події, якщо за останні 300 секунд відбулося 5 або більше значень "0".
G-Wiz
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.