Високе навантаження на сервер nagios - Скільки перевірок обслуговування сервера nagios занадто багато?


9

У мене є сервер nagios, на якому працює Ubuntu з процесором Intel 2,0 ГГц, масивом RAID10 і 400 Мб оперативної пам’яті. Він контролює загальну кількість 42 сервісів на 8 хостах, більшість з яких перевіряється за допомогою плагіна check_http навіть 5 хвилин, деякі щохвилини. Останнім часом навантаження на сервер nagios було вище 4, часто досягає 6. Сервер також працює кактуси, щохвилини збираючи статистику для 6 хостів.

Цікаво, скільки служб, як це обладнання, має вміти обробляти? Чи навантаження настільки велика, тому що я розсуваю межі апаратного забезпечення, чи це обладнання може мати 42 перевірки обслуговування плюс кактуси? Якщо апаратне забезпечення недостатнє, чи варто додати більше оперативної пам’яті, більше ядер чи швидших ядер? Які апаратні / сервісні перевірки виконують інші?


Як виглядає використання оперативної пам’яті зараз на сервері? Також як виглядає використання процесора? Якщо це високо, які процеси прив'язують його?
3вплив

Ви вирішили проблему? Ми відчуваємо те саме питання. Сер. Навантаження - 12 ..
Іван

Відповіді:


7

Вам потрібно розібратися, де ваше вузьке місце ...

Я запускаю монітор nagios, який перевіряє 400+ хостів за допомогою http, ping та ssh. (разом з безліччю інших пасивних перевірок і nscd)

Це на сервері 2xQuadCore з 4 дисками SAS в RAID10.

Я підозрюю, що у вас є суперечки щодо IO, оскільки писати на багато rrds дуже неефективно.

Вам потрібно розібратися, який процес займає ваші ресурси. (кактуси, нагіо чи щось інше)

Для перевірки IO мені подобається iotop. Встановити iotop (пакет 9.04 працює з 8.04)

Але в іншому випадку верх також повинен допомогти вам знайти вантажну свиню.

Кактуси раз на хвилину досить агресивні. (Я запускаю свою з інтервалом 5 м)

Один із підходів, який я чув для суперечки щодо запису rrd, - це поставити свої магазини rrd на ramdisk / tmpfs. (не забудьте rsync що час від часу для постійного зберігання)

Удачі.


Дякую. Я розберуся в це. Ймовірно, кактуси генерують навантаження, і я побачу, чи є спосіб перемістити rrds на tmpfs. Або просто додайте більше оперативної пам’яті, щоб сервер міг захистити rrds. Я боюся, якщо кожні 5 хвилин я запускаю кактуси, там можуть бути шпилі навантаження, які триватимуть лише 1 або 2 хвилини, які я б зовсім пропустив ...
Джош

6

Якщо кактуси не створюють більшу частину навантаження, тоді ви повинні мати можливість виконувати набагато більше перевірок, ніж це на вашому обладнанні.

Я запускаю nagios на віртуальній машині FreeBSD, що працює на віртуальному сервері Microsoft на старому ПК (Pentium 3 1 ГГц з повільним диском PATA). Віртуальна машина має лише 128 Мб оперативної пам’яті, а продуктивність жахлива.

Однак середня завантаженість становить приблизно 0,2, виконавши 158 перевірок у 42 хостів.


Дякую. Я б хотів, щоб я міг прийняти обидві відповіді! Вам було дуже корисно, це вказує на мене, що кактуси, мабуть, є винуватцем.
Джош

2

На старому PIII з 256 Мб оперативної пам’яті я активно відстежую приблизно 230 різних сервісів. Ця ж машина також працює MRTG та HylaFAX для всіх наших вхідних факсів і робить це досить комфортно.


Дуже корисна інформація. Це вказує на мене, що кактуси, мабуть, є винуватцем, а не нагіоси. Дякую!
Джош

1

Ви повинні мати змогу запустити навантаження на перевірку нагіосів із цим обладнанням. Ми запускаємо аналогічну установку з приблизно 70 чеками і Nagiosgraph - основна різниця додається оперативної пам'яті (це дешево, тому я б накинув коробку на 2 Гб).

Спробуйте запустити top або ps -aux, щоб побачити, чи перевантажений процесор, але я сумніваюся. Ви також можете перевірити документи паралелізації nagios, щоб побачити, чи ваша установка намагається запустити занадто багато перевірок одночасно, а не їх серіалізувати.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.