Ми маємо випадковий процес , який може або може-ні-відбуватися кілька разів в протягом заданого періоду часу . У нас є канал даних із попередньо існуючої моделі цього процесу, що забезпечує ймовірність виникнення ряду подій у періоді 0 \ leq t <T . Ця існуюча модель є старою, і нам потрібно запускати перевірки в реальному часі на дані каналу для помилок оцінки. Стара модель, що виробляє подачу даних (яка забезпечує ймовірність n подій, що відбудуться в t, що залишився в часі ), приблизно розподілена Пуассоном.
Таким чином , щоб перевірити наявність аномалій / помилок, ми дозволяємо бути час , що залишився і бути загальна кількість подій відбувається в час, що залишився . Стара модель передбачає оцінки . Отже, за нашим припущенням маємо:
Такий підхід спрацьовує фантастично при зборі помилок у розрахунковій кількості подій протягом повного періоду часу , але не так добре, якщо ми хочемо зробити те ж саме для іншого періоду де . Щоб обійти це, ми вирішили, що тепер хочемо перейти на використання негативного біноміального розподілу, щоб припустити, що тепер і маємо:
1. Чи можемо ми просто встановити в негативному біноміальному розподілі? Якщо ні, то чому б і ні?
2. Припустимо, що ми можемо встановити де - деяка функція, як ми можемо правильно встановити (чи потрібно нам підходити використовуючи минулі набори даних)?
3. Чи залежить від кількості подій, які ми очікуємо відбутися протягом певного процесу?
Додаток до вилучення кошторисів для (і ):
Я усвідомлюю, що якби насправді була усунена ця проблема, і ми мали кількість подій для кожного процесу, ми могли б прийняти максимальну оцінку ймовірності для та . Звичайно, максимальний показник ймовірності існує лише для зразків, для яких дисперсія вибірки більша за середню вибірку, але якби це було так, ми могли б встановити функцію ймовірності для незалежних однаково розподілених спостережень як: з якого ми можемо записати функцію вірогідності журналу як: