Як я можу знайти кореляції між збоями та системними середовищами?


10

У вільний час я працюю над невеликою веб-системою, яка збирає звіти про збої (але не інші звіти про помилки, що не збиваються), що надсилаються з програм Delphi Windows.

Для усунення несправностей користувачі хочуть мати функцію обміну даними для пошуку зв’язків між апаратними версіями або версіями операційної системи та конкретною помилкою та / або збоєм.

Як приклад, як це має працювати:

  • для кожного збою в базі даних є звіт, який має відбиток пальця / хеш-код сліду стека (стек виклику) на момент збою для ідентифікації дублікатів
  • алгоритм перевіряє, чи всі дублікати звіту про помилки також мають деякі інші загальні атрибути, наприклад, відсутній пакет оновлень операційної системи
  • в результаті аналізу перераховані всі властивості, які мають спільні звіти про помилки

Припустимо, ці автоматичні звіти про помилки містять всю ключову інформацію, як-от імена всіх поточних процесів, назви файлів, відомості про версії завантажених DLL тощо.

Як я можу знайти кореляцію між повторними збоями та навколишнім середовищем? Чи є конкретні алгоритми чи статистичні методи, які допомогли б?


2
Пошук кореляції - важке завдання. Ви бачили цей інструмент на роботі? Це може допомогти вам знайти належний спосіб організації своїх даних.

Отже, ви хочете зробити також кореляційні обчислення в Delphi? Потім подивіться на цей список функцій математики Delphi : він охоплює багато, а також дає пояснення та посилання на бібліотеки.

@DaveBall Дякую за цікаве посилання, однак, хоча звіти про помилки надходять із Delphi, веб-служба насправді реалізована на Java - можливо, я можу використовувати алгоритми як вихідну точку, або як інструмент "офлайн" статистики.

1
Ви можете розглянути "дискретні моделі небезпеки". Це здається випадком, коли потрібно регресувати події відмови (збої) за фіксованими характеристиками (змінні середовища) та час з часу останньої аварії. Якщо у вас достатньо спостережень (звітів про збої), ви зможете додати взаємодію між змінними навколишнього середовища до моделі. Потім вони направлять вас у бік системних конфліктів. На жаль, я не знаю, наскільки легко реалізувати таку модель на Java.
jmtroos

1
Види аналізів, які ви могли б використати, залежать від розміру проблеми, тобто скільки існує різних видів збоїв? Скільки можливих атрибутів існує?
Самєр

Відповіді:


1

Не могли б ви взяти вибірку [без збоїв] машин вашого користувача на ту саму інформацію, що й у звіті про збій? Тому що тоді ви могли використовувати логістичну регресію для моделювання цих атрибутів (та взаємодій) з можливістю отримати збій.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.