Щоб отримати більш повний перелік інструментів моніторингу та їх особливості, перегляньте цю сторінку Вікіпедії .
Як зазначено в питанні, які найчастіше використовуються інструменти для цього завдання та які їх сильні та слабкі сторони?
Щоб отримати більш повний перелік інструментів моніторингу та їх особливості, перегляньте цю сторінку Вікіпедії .
Як зазначено в питанні, які найчастіше використовуються інструменти для цього завдання та які їх сильні та слабкі сторони?
Відповіді:
Я раніше використовував Nagios з успіхом. Це дуже розширюваний (понад 200 доповнень), відносно простий у використанні та безліч звітів. Негативним буде початкове налаштування.
Кактуси - це дуже хороший веб-інтерфейс до RRDTool , що забезпечує дуже зручні графіки та статистику. RRDTool - це частина, яка збирає дані з різних систем і відстежує широкий спектр технічних даних.
Ми використовуємо це рішення кактусів / RRDTool для моніторингу систем Unix та Windows. Ми отримуємо багато корисних показників, включаючи завантаження, використання процесора / оперативної пам’яті, простору HD, користувачів, які ввійшли, мережевий трафік, запущені процеси тощо.
Ви знайдете більше інформації про кактуси на те, що таке кактуси ? сторінки.
Особисто я люблю Муніна, який дуже просто встановлювати та писати плагіни, оскільки він має дуже просту архітектуру. Існує досить багато плагінів для всіх цілей, які ви могли собі уявити, тому вам, мабуть, навіть не доведеться писати плагіни.
Він також пропонує прекрасні графіки та можливість налаштування (дуже основних) сповіщень.
Заббікс . Це відкритий код і досить простий у налаштуванні та налаштуваннях. У нас є безліч користувацьких скриптів моніторингу, які надходять на сервер zabbix, але він піклується про централізацію цих даних, їх належне відображення, повідомлення (електронна пошта, чат, SMS, щебетання тощо) тощо.
Я робив розкрутки Spiceworks в нашій компанії, і ми вважаємо, що це чудовий інструмент не тільки для моніторингу серверів, але і для всього іншого в мережі.
Це таке, як автоматична інвентаризація та спеціальний моніторинг, щоб надсилати вам електронні листи, коли виникає проблема (EG: Принтер втрачає до 10% чорнила або жорсткий диск цього сервера має 20%).
Його недоліком, мабуть, буде густота інформації на комп'ютер, не помиляйтесь, вона має багато даних на машині, але для таких речей, як сервери, де вам може знадобитися багато статистики, можливо, вам потрібно буде використовувати інший інструмент.
EDIT: О, я згадав, що його бізнес-модель базується на тому, щоб вона була вільною назавжди.
Куріння не тільки перевіряє наявність різних серверів та сервісів, але й відстежує їх затримку, забезпечуючи простий у користуванні, приємний вигляд та швидке відображення графіків.
Широкий вибір плагінів для вимірювання затримки доступний поза коробкою. Якщо ви знаєте деякі Perl, легко створити свої власні для будь-яких екзотичних потреб.
Великі установки отримають користь від системи Master / Slave для розподілених вимірювань.
Висококонфігурована система оповіщення допоможе вам помітити проблеми, перш ніж вони почнуть зачіпати користувачів або перетворяться на значну несправність.
Куріння - безкоштовне програмне забезпечення OpenSource, написане в Perl Тобі Оетікер, творцем MRTG та RRDtool
OpenNMS використовується там, де я працюю для моніторингу понад тисячі машин Linux. Ми стежимо за обладнанням кожної машини та програмами, що працюють на них.
Zenoss Core приносить користь, ми використовуємо його (близько року) для легкого моніторингу серверів, мережевих комутаторів та ДБЖ.
Zenoss Core - це нагорода з моніторингом ІТ-технологій з відкритим кодом, яка ефективно управляє конфігурацією, здоров’ям та роботою мереж, серверів та додатків за допомогою єдиного інтегрованого програмного пакету.
Nagios - це чудово, оскільки він безкоштовний і для цього є багато плагінів. Однак користувальницький інтерфейс та конфігурація дуже важкі.
Зовсім навпаки, що стосується професіоналів / контенів, що також чудово - це менеджер операційних систем Microsoft Center Center (SCOM), який не є безкоштовним, має менше плагінів, але налаштування та конфігурація є блискучими та простими.
Я повинен визнати, якби я був в основному в компанії Microsoft, мав дуже високі вимоги щодо надійності (тобто не можу дозволити собі моніторинг, щоб зламатись) або мені довелося думати про те, щоб розробники могли працювати з ним, тоді SCOM був би моєю рекомендацією щодо Nagios.
Я використовував:
Ми використовуємо AlertFox з декількох тижнів і дуже раді. Він не тільки перевіряє час роботи та ефективність роботи, але також відстежує кошик для покупок, вхід користувачів та інші важливі частини веб-сайту за допомогою скриптів транзакцій (на основі iMacros).
Для внутрішнього моніторингу (дискового простору тощо) ми використовуємо Nagios .
PRTG Network Monitor - не можу сказати про це достатньо чудових речей. Дивовижний передній веб-сайт і особливо чудовий для моніторингу маршрутизаторів (пропускної здатності тощо) та інших пристроїв за допомогою SNMP та вимірювання тривалості роботи для угод про обслуговування та обслуговування тощо.
www.paessler.com
Як особа Windows, MOM. Ми хочемо оновити до System Center Operations Manager (SCOM), але це не потрібно, поки ми не почнемо розгортати Windows 2008.
Я є частиною проекту з модернізації оперативного моніторингу. У нас були різні постачальники, які приїжджали на місце, щоб представити кілька великих доларових систем і змішали деякі дешевші альтернативи для порівняння.
Один з яких - це Hyperic , який також доступний у вигляді безкоштовного рішення з відкритим кодом. Мене вразили його надані можливості та розширюваність для спеціальних агентів.
Для моніторингу статистики (використання пам’яті, навантаження, активність mysql, активність апаш тощо) я використовую Munin . З вікна він вже відстежує багато речей та графіків графіків за різні проміжки часу (останні 24 години, останні 7 днів, останній місяць, минулий рік). За допомогою плагінів можна контролювати ще більше речей. Його вихід - це HTML-сторінки з гарними графіками.
Munin має архітектуру master / node: вузли збирають статистику на сервері, а master зберігає дані та виробляє HTML та графіки.
Я використовую Monit для відстеження запущених процесів і для перезапуску або попередження мене, коли виникають певні умови, що настроюються (велика завантаженість процесора, велике використання пам'яті, відсутність відповіді HTTP тощо). Monit також може відслідковувати більш загальні речі щодо сервера, наприклад, процесор завантаження, використання пам'яті, стан жорсткого диска або використання диска.
Monit потрібно налаштувати для кожної служби або обладнання, яке ви хочете контролювати, і як реагувати, коли щось піде не так. Найбільш використовувані варіанти - нічого не робити, надсилати сповіщення електронною поштою або перезапускати послугу.
Monit - це чудово, коли він працює, але іноді не вдається запустити, зупинити або перезапустити послугу, і не існує великої кількості діагностичної інформації, яка дозволяє вам сказати, що пішло не так. Це означає, що ви не знаєте, чи проблема була у вашій службі або з конфігурацією Monit, яка працює з мінімальним середовищем, схожим на крони.
Обидва інструменти доступні за замовчуванням у більшості дистрибутивів Linux.
Я здивований, що ніхто не згадав логвард або логчек для серверів Linux - економить тонну часу на читанні журналів !!
Я використовую Pingdom для моніторингу свого сервера. Він надсилає мені SMS-повідомлення, коли сервер недоступний.
Наш проект використовує Ganglia для наших кластерів із 100 вузлів. Одна з причин, яку ми використовуємо, це тому, що це інструмент моніторингу, який постачається із Rocks .
Нам важливо мати дуже низькі накладні витрати на кожному вузлі, щоб якомога більше ресурсів було доступно для обчислень. Ganglia надає нам хороший огляд кластеру і дозволяє нам при необхідності переглядати окремі вузли. Окрім того, що знаємо, що відбувається зараз, ми можемо досить добре подивитися на те, що сталося за останню годину, день, тиждень, місяць та рік. Графіки різних статистичних даних є основними та функціональними.
Все залежить від того, що ви маєте на увазі під "монітором"!
Новим учасником на сцені, щоб перевірити, чи змагаються з кактусами та рішеннями на основі RRDTool, є Graphite ( http://graphite.wikidot.com/ )
RRDTool замінюється магазином підкладки під назвою Whisper. Документи дають досить хороший огляд того, чому він відрізняється, і мені дуже подобається CLI за спеціальні графіки, коли щось досліджують.
Ми використовуємо (і подобається) WhatsUp від Ipswitch для нашої відносно невеликої мережі Windows. Це легко в налаштуванні та порівняно простий в управлінні, а також вміє поводитися з серверами Windows, а також зі стандартними речами.
Для великих мереж, не орієнтованих на Windows мереж або мереж з великою кількістю різноманітних матеріалів, я щиро рекомендую OpenNMS . Програмне забезпечення OpenNMS, якщо воно безкоштовне, і компанія з радістю продає служби підтримки та впровадження. Також буває, що керує дуже гострим моїм другом з коледжу!
Для тих, хто не любить веб-інтерфейс Nagios, є NPC , плагін для кактусів, який робить Nagios UI доступним зсередини кактусів, але з кращим виглядом (аякс тощо).
Він читається з бази даних, наданої NDO2DB , що є прекрасним способом забезпечити доступність вашої інфраструктури всередині бази даних для використання в сценаріях та інших інструментах.
В даний час ми використовуємо PRTG від Paessler . Це чудово. Ніякі агенти не потрібні, чудовий веб-інтерфейс Ajax, історичний журнал, графіки, WMI тощо тощо. Безкоштовно доступна версія 10 сенсорів, але ми пропонували кілька грошей для корпоративної версії. Гроші добре витрачені.
Хоббіт - це більш швидка краща версія Big Brother (яка, здається, тривожно комерційна в ці дні).
Якщо ви поспішаєте та хочете, щоб швидкий інструмент контролював ваш MS-сервер, тоді використовуйте монітор продуктивності для Windows, налаштуйте лічильник журналів із спеціальним шаблоном моніторингу та графіком зберігання (наприклад: збирайте дані протягом 5 хв щогодини). Потім завантажте Microsoft LogParser та Codeplex аналіз ефективності журналів (PAL) Інструмент ( http://pal.codeplex.com/ ), щоб розчавити ваш лічильник журналів. PAL створить чудовий задокументований звіт із посиланнями на можливі документи / засоби вирішення проблеми.
Я використовую комбінацію Solarwinds, вкладки продуктивності сервера VMware та власні сценарії.
Монітор ефективності мережі Solarwinds Orion - це те, що я використовую з нашими системами Windows. адміністратори на моїх веб-серверах. На ньому все ще працює кілька корисних показників додатків, але він має хорошу інформацію про базові матеріали на рівні вікна (диск, мережа, процесор).
Для своїх гостей VMware я люблю вкладки продуктивності.
Для моїх серверів Sun, коли мені потрібно щось, що недоступне в Solarwinds (оскільки наш адміністратор цього не додав чи що), я пишу власні сценарії (як правило, в Perl) для моніторингу таких речей, як здоров'я дзеркал, використання своп і т.д.
Мені б хотілося більше звертатися до Solarwinds, але в день є лише як 26 годин (або так вважає мій бос), тому я вважаю, що це може бути обмежувальним ...
Ми використовуємо OpsView , який працює на вершині Nagios. WebUI допомагає нам розгорнути нові визначення монітора хоста без необхідності доступу до SSH, надає загальнодоступні перегляди та записує історичні значення. Це зручно для забезпечення та визначення відповідних базових ліній.
Zabbix ( http://www.zabbix.com ) також хороший і простіший у налаштуванні, ніж Nagios.
Вибачте, але я вже використовував безліч користувацьких сценаріїв. Хоча далеко не ідеал, я сумніваюся, що є більш поширене рішення.
Ми написали власне програмне забезпечення для моніторингу. Наш код не настільки складний, як комерційний пакет, але нам не потрібна велика функціональність. Простіше було написати власне, ніж дослідити інші пакунки та навчитися ними користуватися. Код робить саме те, що ми хочемо, і його легко розширити.