Перейти від моделювання процесу за допомогою розподілу Пуассона, щоб використовувати негативний біноміальний розподіл?


24

Ми маємо випадковий процес , який може або може-ні-відбуватися кілька разів в протягом заданого періоду часу . У нас є канал даних із попередньо існуючої моделі цього процесу, що забезпечує ймовірність виникнення ряду подій у періоді 0 \ leq t <T . Ця існуюча модель є старою, і нам потрібно запускати перевірки в реальному часі на дані каналу для помилок оцінки. Стара модель, що виробляє подачу даних (яка забезпечує ймовірність n подій, що відбудуться в t, що залишився в часі ), приблизно розподілена Пуассоном.T0t<Tnt

Таким чином , щоб перевірити наявність аномалій / помилок, ми дозволяємо t бути час , що залишився і Xt бути загальна кількість подій відбувається в час, що залишився t . Стара модель передбачає оцінки P(Xtc) . Отже, за нашим припущенням XtPoisson(λt) маємо:

P(Xtc)=eλk=0cλtkk!.
Щоб отримати наш показник подій λt з виводу старої моделі (спостереження yt ), ми використовуємо підхід до простору стану і моделюємо співвідношення стану як:
yt=λt+εt(εtN(0,Ht)).
Ми фільтруємо спостереження зі старої моделі, використовуючи модель простору стану [зменшення постійної швидкості] для еволюції λt щоб отримати відфільтрований стан E(λt|Yt) і позначити аномалію / помилку в оціночній частоті події від дані каналу, якщо E(λt|Yt)<yt .

Такий підхід спрацьовує фантастично при зборі помилок у розрахунковій кількості подій протягом повного періоду часу T , але не так добре, якщо ми хочемо зробити те ж саме для іншого періоду 0t<σ де σ<23T . Щоб обійти це, ми вирішили, що тепер хочемо перейти на використання негативного біноміального розподілу, щоб припустити, що тепер XtNB(r,p) і маємо:

P(Xtc)=prk=0c(1p)k(k+r1r1),
де параметр λ тепер замінено на r і p. Це потрібно зробити просто, але я маю певні труднощі з тлумаченням, і тому у мене є деякі питання, з якими я хотів би допомогти вам:

1. Чи можемо ми просто встановити p=λ в негативному біноміальному розподілі? Якщо ні, то чому б і ні?

2. Припустимо, що ми можемо встановити p=f(λ) де f - деяка функція, як ми можемо правильно встановити r (чи потрібно нам підходити r використовуючи минулі набори даних)?

3. Чи залежить r від кількості подій, які ми очікуємо відбутися протягом певного процесу?


Додаток до вилучення кошторисів для rp ):

Я усвідомлюю, що якби насправді була усунена ця проблема, і ми мали кількість подій для кожного процесу, ми могли б прийняти максимальну оцінку ймовірності для та . Звичайно, максимальний показник ймовірності існує лише для зразків, для яких дисперсія вибірки більша за середню вибірку, але якби це було так, ми могли б встановити функцію ймовірності для незалежних однаково розподілених спостережень як: з якого ми можемо записати функцію вірогідності журналу як: rpNk1,k2,,kN

L(r,p)=i=1NP(ki;r,p),
l(r,p)=i=1Nln(Γ(ki+r))i=1Nln(ki!)Nln(Γ(r))+i=1Nkiln(p)+Nrln(1p).
Щоб знайти максимум, беремо часткові похідні відносно і і встановлюємо їх рівним нулю: Налаштування та встановлення знаходимо: rp
rl(r,p)=i=1Nψ(ki+r)Nψ(r)+Nln(1p),pl(r,p)=i=1Nki1pNr11p.
rl(r,p)=pl(r,p)=0p=i=1Nki(Nr+i=1Nki),
rl(r,p)=i=1Nψ(ki+r)Nψ(r)+Nln(rr+i=1NkiN)=0.
Це рівняння не можна вирішити для r у закритому вигляді, використовуючи Ньютон або навіть ЕМ. Однак у цій ситуації це не так. Хоча ми могли використати минулі дані, щоб отримати статичний і це насправді не є корисним для нашого процесу, нам потрібно вчасно адаптувати ці параметри, як це робилося з Пуассоном. rp

1
Чому б просто не підключити свої дані до моделі регресії Пуассона або Негативної Біномії?
СтатистикаСтудент

1
Я не відчуваю , що це повинно мати , щоб використовувати. Маючи на увазі, що Пуассон є обмежувальним випадком негативного бінома, я повинен мати певний спосіб параметризувати цю проблему аналогічно тому, що я зробив для Пуассона. Крім того, цей процес відбувається одночасно для тисяч різницьких процесів, і жоден не має однакової "швидкості подій", тобто регресійний аналіз цих параметрів повинен проводитися при кожному новому спостереженні за всіма живими процесами. Це неможливо. Дуже
дякую, що знайшли

1
З точки зору посилання пуассона на NB, якщо у вас є із прихованою над дисперсійною змінною так що і . Це дасть граничний розподіл NB при інтеграції . Ви можете використовувати це, щоб допомогти. (Xt|λt,rt,gt)Pois(λtgt)(gt|rt)Gamma(rt,rt)E(gt)=1var(gt)=rt1gt
ймовірністьлогічний

Це чудова допомога, але чи можете ви це детальніше розібратися та надати чіткі деталі? Дякую за ваш час ...
MoonKnight

1
Що з використанням двочленного, а не від'ємного двочленного? Це може бути простіше зробити. Anscombe FJ. Перетворення даних Пуассона, біноміальних та негативно-біноміальних даних. Біометрика. 1948; 35: 246-54.
Карл

Відповіді:


1

Негативний біноміальний розподіл дуже схожий на біноміальну модель ймовірності. він застосовується, коли наступні припущення (умови) справні 1) Будь-який експеримент проводиться за тих же умов, поки не буде досягнуто фіксованого числа успіхів, скажімо, C 2) Результат кожного експерименту можна класифікувати на одну з двох категорій , успіх чи невдача 3) Ймовірність P успіху однакова для кожного експерименту. Кожен експеримент не залежить від усіх інших. Перша умова - єдиний ключовий диференціюючий фактор між біноміальним та негативним двочленним


0

Розподіл пуассона може бути розумним наближенням двочлена за певних умов, таких як 1) Ймовірність успіху для кожного випробування дуже мала. P -> 0 2) np = m (скажімо) є тонким Правилом, яке найчастіше використовують статистики, є те, що пуассон є хорошим наближенням двочлена, коли n дорівнює або більше 20, а p дорівнює або менше 5 %

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.