Який інструмент ви використовуєте для моніторингу своїх серверів?


187

Щоб отримати більш повний перелік інструментів моніторингу та їх особливості, перегляньте цю сторінку Вікіпедії .

Як зазначено в питанні, які найчастіше використовуються інструменти для цього завдання та які їх сильні та слабкі сторони?


На якій платформі працює ваш сервер?
Гленн Славен

1
На моїх серверах працює Debian Lenny, але питання в першу чергу не зосереджене лише на моніторингу UNIX, оскільки багато інструментів, ймовірно, матимуть певну форму міжплатформної підтримки.
Арон Ротвевель

Можливо, вони використовують різні інструменти, але із загальної системної точки зору, ви в кінцевому підсумку робите одне і те саме в різних системах. Це просто трохи сценаріїв, щоб видавити останній шматочок даних, який ви хочете. Я б вважав "інструментами" в цьому контексті екземпляр запису (моніторинговий сервер) не власне плагін / скрипт, який виплює дані
serverhorror

Мені подобається також контролювати програми (продуктивність, доступність тощо). Інструменти моніторингу, схоже, мають спектр з їх можливістю контролювати апаратне забезпечення з одного кінця та здатністю контролювати програми з іншого. Обладнання <----- + -----> Додаток
Nathan Hartley

Відповіді:


136

Я раніше використовував Nagios з успіхом. Це дуже розширюваний (понад 200 доповнень), відносно простий у використанні та безліч звітів. Негативним буде початкове налаштування.


10
Nagios чудово працює для контролю всіх типів хостів (Windows, Linux, маршрутизаторів, комутаторів тощо). Я рекомендую використовувати інструмент налаштування, наприклад, фруктовий або Lilacto, щоб полегшити біль у конфігурації. NSClient ++ на вікнах Windows та nagios-statd на linux-матеріалах для моніторингу запущених процесів, використання диска тощо
TonyB

На жаль, Nagios вимагає агента у вікнах Windows - раніше я виявив, що агент готується до випадкового вмирання.
PowerApp101

Для моніторингу ми подивилися і Nagios, і Zabbix. Zabbix виграв після короткої оцінки, головним чином завдяки простоті розгортання та функціональності (наприклад, Zabbix включає графік як основну функцію, тоді як Nagios потребує плагіна). Я виявив, що налаштування Nagios є болем.

GroundWork OpenSource має мережевий моніторинговий пристрій, який використовує Nagios в основі, і спрощує налаштування / управління
Rog

12
Існує нова вилка нагіоса під назвою icinga. Поки ніде, але їх цілі виглядають багатообіцяючими. icinga.org
cstamas

70

Кактуси - це дуже хороший веб-інтерфейс до RRDTool , що забезпечує дуже зручні графіки та статистику. RRDTool - це частина, яка збирає дані з різних систем і відстежує широкий спектр технічних даних.

Ми використовуємо це рішення кактусів / RRDTool для моніторингу систем Unix та Windows. Ми отримуємо багато корисних показників, включаючи завантаження, використання процесора / оперативної пам’яті, простору HD, користувачів, які ввійшли, мережевий трафік, запущені процеси тощо.

Ви знайдете більше інформації про кактуси на те, що таке кактуси ? сторінки.


Кактуси - це цікаве рішення, яке чудово виглядає та виходить за велику ціну (безкоштовно). Однак налаштування мережевих пристроїв є ПДФА і мало документально підтверджено. Зараз може бути краще, але я б не взяв на себе зобов’язання, поки ви не зробите своє дослідження.
Кріс Портер

57

Особисто я люблю Муніна, який дуже просто встановлювати та писати плагіни, оскільки він має дуже просту архітектуру. Існує досить багато плагінів для всіх цілей, які ви могли собі уявити, тому вам, мабуть, навіть не доведеться писати плагіни.

Він також пропонує прекрасні графіки та можливість налаштування (дуже основних) сповіщень.


2
Я теж великий фанат Муніна. Він має підтримку інтеграції з Nagios (так що ви можете запустити і те й інше), і підтримку всіх загальних ароматів unix. Я не думаю, що існує підтримка моніторингу вузла Windows - однак він написаний на Perl, тому, хоча це може бути нетривіально, це, безумовно, має бути можливим .
Джон Далтон

2
@John. Вузол Windows підтримується через munin-node-win32, який є нативним вузлом munin, або через SNMP, як і будь-який хост.
Стів Шнепп

34

Заббікс . Це відкритий код і досить простий у налаштуванні та налаштуваннях. У нас є безліч користувацьких скриптів моніторингу, які надходять на сервер zabbix, але він піклується про централізацію цих даних, їх належне відображення, повідомлення (електронна пошта, чат, SMS, щебетання тощо) тощо.


2
Ми також використовуємо Zabbix і вважаємо, що він досить потужний і настроюється. Ми протестували і Zabbix, і Nagios, і врешті вибрали Zabbix, оскільки, мабуть, Nagios має гарну репутацію, встановити це трохи болю, а багато функціоналів виходить із плагінів, а не з використанням основних програм (графік - це хороший приклад цього, ви отримуєте це безкоштовно із Zabbix).

3
Я віддаю перевагу Zabbix, оскільки це гнучкість з точки зору графіку та карти вашої інфраструктури (з точки зору доступності), а також гнучкий спосіб моніторингу.
Андріоїд

29

Я робив розкрутки Spiceworks в нашій компанії, і ми вважаємо, що це чудовий інструмент не тільки для моніторингу серверів, але і для всього іншого в мережі.

Це таке, як автоматична інвентаризація та спеціальний моніторинг, щоб надсилати вам електронні листи, коли виникає проблема (EG: Принтер втрачає до 10% чорнила або жорсткий диск цього сервера має 20%).

Його недоліком, мабуть, буде густота інформації на комп'ютер, не помиляйтесь, вона має багато даних на машині, але для таких речей, як сервери, де вам може знадобитися багато статистики, можливо, вам потрібно буде використовувати інший інструмент.

EDIT: О, я згадав, що його бізнес-модель базується на тому, щоб вона була вільною назавжди.


Spiceworks робить багато дивовижних речей - і БЕЗКОШТОВНО.

3
У SpiceWorks є дійсно велике співтовариство, яке також непогано перегукується з ServerFault. Буде цікаво побачити взаємодію між громадами. Я також використовую SpiceWorks. Дивовижний інструмент.
Скотт Алан Міллер

Зараз я використовую це на основі вашої рекомендації. Відмінний інструмент.
Марко Картер

Ми використовуємо це у своїй роботі. Це досить вражаюче. Сам інвентар обладнання, не кажучи вже про програмне забезпечення, варто переглянути самостійно.
Террі

Минулого разу я використовував Spiceworks (версія 3 щось), у нього не було можливості додавати або змінювати апаратні компоненти, такі як монітори, відеокарти тощо. Це виявило б їх, але часто неправильно. Тому я все ще використовую GLPI + OCSNG, який ненавиджу .
Боден

18

Куріння не тільки перевіряє наявність різних серверів та сервісів, але й відстежує їх затримку, забезпечуючи простий у користуванні, приємний вигляд та швидке відображення графіків.

Широкий вибір плагінів для вимірювання затримки доступний поза коробкою. Якщо ви знаєте деякі Perl, легко створити свої власні для будь-яких екзотичних потреб.

Великі установки отримають користь від системи Master / Slave для розподілених вимірювань.

Висококонфігурована система оповіщення допоможе вам помітити проблеми, перш ніж вони почнуть зачіпати користувачів або перетворяться на значну несправність.

Куріння - безкоштовне програмне забезпечення OpenSource, написане в Perl Тобі Оетікер, творцем MRTG та RRDtool


Палити добре, щоб побачити, як виглядає ваша мережа
Rory,

Куріння дивовижно для візуалізації затримки.
Джеймс

15

OpenNMS використовується там, де я працюю для моніторингу понад тисячі машин Linux. Ми стежимо за обладнанням кожної машини та програмами, що працюють на них.


+1 для OpenNMS, ми також використовуємо це на роботі для моніторингу тисяч машин та інтерфейсів. У нас багато різних операційних систем, і ми можемо відстежувати їх за допомогою OpenNMS.
Стів К

не мій перший вибір, але дуже корисний

як з додаванням MIB для нового обладнання?
slovon

OpenNMS має багато статистики snmp, яка вже є у конфігурації за замовчуванням, тому вона може автоматично відкривати та починати графікувати з поля. Нові статистичні дані SNMP досить легко додати, просто введіть назву RRD, OID та тип даних та покладіть їх у групу за типом пристроїв, до яких застосовується статистика.
mtinberg

15

Zenoss Core приносить користь, ми використовуємо його (близько року) для легкого моніторингу серверів, мережевих комутаторів та ДБЖ.

Zenoss Core - це нагорода з моніторингом ІТ-технологій з відкритим кодом, яка ефективно управляє конфігурацією, здоров’ям та роботою мереж, серверів та додатків за допомогою єдиного інтегрованого програмного пакету.


Якщо ви користуєтеся безкоштовною версією Zenoss Core, будьте готові зробити багато налаштувань SNMP MIB. Я також виявив, що він рішуче відмовлявся збирати дані операційної системи на деяких моїх серверах, і напрочуд важко налаштуватись на прості завдання, такі як перевірка вмісту веб-сторінки.
gareth_bowles

Може співчувати проблемам MIB, але перевірку веб-сторінок можна здійснити за допомогою плагінів Nagios на Zenoss.
gimel

12

Nagios - це чудово, оскільки він безкоштовний і для цього є багато плагінів. Однак користувальницький інтерфейс та конфігурація дуже важкі.

Зовсім навпаки, що стосується професіоналів / контенів, що також чудово - це менеджер операційних систем Microsoft Center Center (SCOM), який не є безкоштовним, має менше плагінів, але налаштування та конфігурація є блискучими та простими.

Я повинен визнати, якби я був в основному в компанії Microsoft, мав дуже високі вимоги щодо надійності (тобто не можу дозволити собі моніторинг, щоб зламатись) або мені довелося думати про те, щоб розробники могли працювати з ним, тоді SCOM був би моєю рекомендацією щодо Nagios.


12

Я використовував:

  • Nagios - вимагає деякої старої настройки командного рядка, не дуже, але міцної та функціональної. Його замінили:
  • Zenoss - вимагає набагато меншої стопи для встановлення, має комерційний варіант. Після запуску решта контролюється через браузер. Дуже потужна, але вимагає певної роботи MIB, якщо ви користуєтеся безкоштовною версією.
  • Intermapper - комерційна програма, затратна, якщо у вас є багато вузлів для моніторингу. Здається, що вони написані на Java (для кращого чи гіршого).
  • Spiceworks - не пробували останню версію. Старіші версії потребували трохи більше umph під капотом, щоб змусити його реагувати, але в іншому випадку це працює чудово. Безкоштовна версія поставляється з нагною рекламою.

Ми широко використовуємо Intermapper.
sysadmin1138

Я також використовую InterMapper. Клієнт консолі написаний на Java. Сервер написаний на Python. Postgres використовується як резервна база даних для агрегації даних та звітності.
lsiu

11

Ми використовуємо AlertFox з декількох тижнів і дуже раді. Він не тільки перевіряє час роботи та ефективність роботи, але також відстежує кошик для покупок, вхід користувачів та інші важливі частини веб-сайту за допомогою скриптів транзакцій (на основі iMacros).

Для внутрішнього моніторингу (дискового простору тощо) ми використовуємо Nagios .


10

PRTG Network Monitor - не можу сказати про це достатньо чудових речей. Дивовижний передній веб-сайт і особливо чудовий для моніторингу маршрутизаторів (пропускної здатності тощо) та інших пристроїв за допомогою SNMP та вимірювання тривалості роботи для угод про обслуговування та обслуговування тощо.

www.paessler.com


9

Як особа Windows, MOM. Ми хочемо оновити до System Center Operations Manager (SCOM), але це не потрібно, поки ми не почнемо розгортати Windows 2008.


Я також використовую MOM. Я люблю це і водночас ненавиджу.
Spoulson

SCOM є чудовою платформою моніторингу для корпоративних середовищ на базі Windows. Справжнім генієм тут є пакети управління, випущені самими групами продуктів Microsoft (це частина загальних інженерних критеріїв MS, згідно з якими кожен продукт має SCOM MP протягом 90 днів після RTM). Отримання консультацій та знань від самих команд продуктів може значно покращити здатність оперативного відділу підтримувати роботу та здоровий стан, не турбуючи старших адміністраторів за кожну дрібницю.
Кевін Колбі

8

Я є частиною проекту з модернізації оперативного моніторингу. У нас були різні постачальники, які приїжджали на місце, щоб представити кілька великих доларових систем і змішали деякі дешевші альтернативи для порівняння.

Один з яких - це Hyperic , який також доступний у вигляді безкоштовного рішення з відкритим кодом. Мене вразили його надані можливості та розширюваність для спеціальних агентів.


Хоча це непросто з ресурсами, але, безумовно, це чудовий інструмент моніторингу!
Вінсент Де Баре

8

Для моніторингу статистики (використання пам’яті, навантаження, активність mysql, активність апаш тощо) я використовую Munin . З вікна він вже відстежує багато речей та графіків графіків за різні проміжки часу (останні 24 години, останні 7 днів, останній місяць, минулий рік). За допомогою плагінів можна контролювати ще більше речей. Його вихід - це HTML-сторінки з гарними графіками.

Munin має архітектуру master / node: вузли збирають статистику на сервері, а master зберігає дані та виробляє HTML та графіки.

Я використовую Monit для відстеження запущених процесів і для перезапуску або попередження мене, коли виникають певні умови, що настроюються (велика завантаженість процесора, велике використання пам'яті, відсутність відповіді HTTP тощо). Monit також може відслідковувати більш загальні речі щодо сервера, наприклад, процесор завантаження, використання пам'яті, стан жорсткого диска або використання диска.

Monit потрібно налаштувати для кожної служби або обладнання, яке ви хочете контролювати, і як реагувати, коли щось піде не так. Найбільш використовувані варіанти - нічого не робити, надсилати сповіщення електронною поштою або перезапускати послугу.

Monit - це чудово, коли він працює, але іноді не вдається запустити, зупинити або перезапустити послугу, і не існує великої кількості діагностичної інформації, яка дозволяє вам сказати, що пішло не так. Це означає, що ви не знаєте, чи проблема була у вашій службі або з конфігурацією Monit, яка працює з мінімальним середовищем, схожим на крони.

Обидва інструменти доступні за замовчуванням у більшості дистрибутивів Linux.


8

Я здивований, що ніхто не згадав логвард або логчек для серверів Linux - економить тонну часу на читанні журналів !!


Ці інструменти звичайно не дають вам показників та довгострокової читабельності ваших тенденцій інфраструктури. Вони є приємним доповненням, але я б не покладався тільки на них. Afaik "logwatch" є дещо злим, оскільки він повідомлятиме лише про помилки, про які ви їм повідомляєте, на відміну від "logcheck", де ви повідомляєте інструменту відомі добрі речі, і він повідомляє про все інше.
serverhorror


7

Наш проект використовує Ganglia для наших кластерів із 100 вузлів. Одна з причин, яку ми використовуємо, це тому, що це інструмент моніторингу, який постачається із Rocks .

Нам важливо мати дуже низькі накладні витрати на кожному вузлі, щоб якомога більше ресурсів було доступно для обчислень. Ganglia надає нам хороший огляд кластеру і дозволяє нам при необхідності переглядати окремі вузли. Окрім того, що знаємо, що відбувається зараз, ми можемо досить добре подивитися на те, що сталося за останню годину, день, тиждень, місяць та рік. Графіки різних статистичних даних є основними та функціональними.


6

Все залежить від того, що ви маєте на увазі під "монітором"!

  • Чи доступна вона (система чи послуга)? Ми використовуємо нагіоси .
  • Що це робить? Ми використовуємо munin для Linux-серверів, а кактуси - майже все інше, хоча інколи налаштовувати болі ...
  • Що це зробило? Ми використовуємо syslog-ng, щоб сконцентрувати syslogs в одному місці, а потім щодня запускаємо індивідуальний сценарій реєстрації для надсилання звітів по електронній пошті. Ми шукаємо щось подібне для серверів Windows.

5

Новим учасником на сцені, щоб перевірити, чи змагаються з кактусами та рішеннями на основі RRDTool, є Graphite ( http://graphite.wikidot.com/ )

RRDTool замінюється магазином підкладки під назвою Whisper. Документи дають досить хороший огляд того, чому він відрізняється, і мені дуже подобається CLI за спеціальні графіки, коли щось досліджують.


4

Ми використовуємо (і подобається) WhatsUp від Ipswitch для нашої відносно невеликої мережі Windows. Це легко в налаштуванні та порівняно простий в управлінні, а також вміє поводитися з серверами Windows, а також зі стандартними речами.

Для великих мереж, не орієнтованих на Windows мереж або мереж з великою кількістю різноманітних матеріалів, я щиро рекомендую OpenNMS . Програмне забезпечення OpenNMS, якщо воно безкоштовне, і компанія з радістю продає служби підтримки та впровадження. Також буває, що керує дуже гострим моїм другом з коледжу!


4

Для тих, хто не любить веб-інтерфейс Nagios, є NPC , плагін для кактусів, який робить Nagios UI доступним зсередини кактусів, але з кращим виглядом (аякс тощо).

Він читається з бази даних, наданої NDO2DB , що є прекрасним способом забезпечити доступність вашої інфраструктури всередині бази даних для використання в сценаріях та інших інструментах.


4

В даний час ми використовуємо PRTG від Paessler . Це чудово. Ніякі агенти не потрібні, чудовий веб-інтерфейс Ajax, історичний журнал, графіки, WMI тощо тощо. Безкоштовно доступна версія 10 сенсорів, але ми пропонували кілька грошей для корпоративної версії. Гроші добре витрачені.


4

Хоббіт - це більш швидка краща версія Big Brother (яка, здається, тривожно комерційна в ці дні).

http://hobbitmon.sourceforge.net/


Ми також використовуємо Hobbit, це приголомшливо, він обробляє 600+ серверів з 10+ моніторами кожен, багато з них оновлюються щохвилини
MarkR

1
Зараз хобіта називають Ксимон. hswn.dk/hobbiton/2008/11/msg00123.html
Клінтон Блекмор

4

Якщо ви поспішаєте та хочете, щоб швидкий інструмент контролював ваш MS-сервер, тоді використовуйте монітор продуктивності для Windows, налаштуйте лічильник журналів із спеціальним шаблоном моніторингу та графіком зберігання (наприклад: збирайте дані протягом 5 хв щогодини). Потім завантажте Microsoft LogParser та Codeplex аналіз ефективності журналів (PAL) Інструмент ( http://pal.codeplex.com/ ), щоб розчавити ваш лічильник журналів. PAL створить чудовий задокументований звіт із посиланнями на можливі документи / засоби вирішення проблеми.


3

Я використовую комбінацію Solarwinds, вкладки продуктивності сервера VMware та власні сценарії.

Монітор ефективності мережі Solarwinds Orion - це те, що я використовую з нашими системами Windows. адміністратори на моїх веб-серверах. На ньому все ще працює кілька корисних показників додатків, але він має хорошу інформацію про базові матеріали на рівні вікна (диск, мережа, процесор).

Для своїх гостей VMware я люблю вкладки продуктивності.

Для моїх серверів Sun, коли мені потрібно щось, що недоступне в Solarwinds (оскільки наш адміністратор цього не додав чи що), я пишу власні сценарії (як правило, в Perl) для моніторингу таких речей, як здоров'я дзеркал, використання своп і т.д.

Мені б хотілося більше звертатися до Solarwinds, але в день є лише як 26 годин (або так вважає мій бос), тому я вважаю, що це може бути обмежувальним ...


3

Ми використовуємо OpsView , який працює на вершині Nagios. WebUI допомагає нам розгорнути нові визначення монітора хоста без необхідності доступу до SSH, надає загальнодоступні перегляди та записує історичні значення. Це зручно для забезпечення та визначення відповідних базових ліній.



2

Вибачте, але я вже використовував безліч користувацьких сценаріїв. Хоча далеко не ідеал, я сумніваюся, що є більш поширене рішення.


Завжди буде потреба у користувацьких сценаріях!
Techboy

2

Ми написали власне програмне забезпечення для моніторингу. Наш код не настільки складний, як комерційний пакет, але нам не потрібна велика функціональність. Простіше було написати власне, ніж дослідити інші пакунки та навчитися ними користуватися. Код робить саме те, що ми хочемо, і його легко розширити.


2
Я думаю, що важливо продумати наслідки такого рішення. Написати щось з нуля може бути не так багато зусиль - але технічне обслуговування в дорозі - це ведмедя.
Адам

Я міг би уявити, що обслуговування є проблемою, але це не було для нас, хоча ми працювали цією системою протягом багатьох років. Оскільки база коду невелика і знайома, нам було легко додати нову функціональність за потреби. Підтримка комерційного рішення також може бути проблемою з часом, прищеплення на шматки від нових постачальників, коли оригінальний продукт не виконує все необхідне тощо.
Джон Д. Кук
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.