Хтось знає про інструмент для виявлення та звітування про повторювані шаблони у файлі журналу? [зачинено]


12

Мені потрібно відслідковувати кілька великих шумних файлів журналів (500м / день) із програми Java (log4j). Зараз я вручну дивлюся на файли, grep для "ПОМИЛКА" тощо. Однак інструмент повинен мати можливість помітити повторювані шаблони у файлі, порахувати їх та надати детальну інформацію про окремі записи. Хтось знає про такий інструмент? Текстовий або веб-інтерфейс буде добре.


1
Для мене це питання абсолютно кричить perl.
Джон Гарденєр

Хм, його початок виглядає так, що мені доведеться писати баш сценарій з великою кількістю грепсів. Я сподівався, що я зможу щось зрозуміти схеми автоматично.
Девід Тінкер

серйозно, саме для цього створено Perl. Ви можете написати сценарій самонавчання для цих шаблонів, хоча це, очевидно, поза сферою.
Джон Гарденє

stackoverflow.com/questions/2590251/… має рішення під назвою Бензопила.
Джон ака hot2use

datadoghq.com/blog/log-patterns <- настійно рекомендую, але хоч і не шалено дорогий, це теж не дуже дешево.
neokyle

Відповіді:


3

Я чув, як люди застосовують баєсівську фільтрацію у файлах журналів, щоб помітити цікаві речі та звичайні записи журналу. Вони використовували фільтри спаму, де звичайні нецікаві записи вважалися "хорошими", тоді як незвичайні вважалися "спамом", і за допомогою цього забарвлення вони змогли зміститись.

Мені це дуже схоже на матеріали машинного навчання, але потім я знову не бачив його в дії, лише чув про це над пивом.


Це здається мені цілком розумним, і ви навіть можете мати дуже сильні попередні припущення (в байєсівському розумінні) щодо певних слів, які завжди відображаються в журналах сервера.
DrewConway

Так, це зробить роботу. Хтось знає реалізацію, яку я міг би навчити?
Девід Тінкер

Можна було б почати з CRM114, мабуть. Або зачекайте, поки Дрю Конвей опублікує своє машинне навчання для хакерів . Я досі працюю над тим, щоб знайти оригінальну посилання на те, що я запропонував.
адамо

Так! Я читав це ще в 2005 році в цій нитці членів мудреця . Автор електронної пошти згадує спампроб .
адамо

6

Splunk творить чудеса для подібних матеріалів. Я використовую її внутрішньо для збору всіх журналів і швидкого пошуку через його відмінний інтерфейс на основі браузера.


На жаль, нам, швидше за все, потрібна невільна версія та її трохи дорога
Девід Тінкер

3

syslog-ng має функцію patterndb з назвою. Ви можете робити шаблони та записувати журнали відповідності до них у режимі реального часу, а потім надсилати їх до окремих журналів.


2

Переглядаючи syslog-ng та patterndb (+1 до цієї відповіді вище), я зіткнувся з веб-інструментом під назвою ELSA: http://code.google.com/p/enterprise-log-search-and-archive/ . Це F / OSS в perl, з веб-інтерфейсом, і він повинен бути дуже швидким.

Я ще не пробував цього, але як тільки я закінчив фільтрувати за допомогою patterndb, я спробую ELSA.


1

Спробуйте пети .
Я не впевнений, чи буде він працювати у форматі log4j, але ви, можливо, зможете написати для цього спеціальний фільтр.
У Petit немає веб-інтерфейсу, він відображає графіки у вашій оболонці (ASCII art ftw!).
Дуже корисно швидко бачити повторювані повідомлення та з’ясовувати, коли вони траплялися чи почали траплятися частіше.



0

Glogg - це дуже хороший дослідник журналів, оскільки у вас є можливість створити основу фільтру на рядку та кольоровій лінії або відновити всі випадки до рядка.

http://glogg.bonnefon.org/



-1

Ви можете спробувати LogTtender SEQREL, який автоматично визначає шаблони та агрегує подібні журнали. Так робиться, створюючи регулярні вирази під час руху та використовуючи кешований регулярний вираз, щоб відповідати іншим журналам. За допомогою додаткового виявлення таксономії можна додати ще більш деталізацію. Безкоштовну версію можна завантажити за посиланням https://try.logxtender.net .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.