Перевірка наявності двох зразків Пуассона однаковою середньою


30

Це елементарне запитання, але я не змогла знайти відповідь. У мене є два вимірювання: n1 події в часі t1 і n2 події в часі t2, обидва вироблені (скажімо) процесами Пуассона з можливо різними значеннями лямбда.

Це насправді з новинної статті, яка по суті стверджує, що оскільки що вони різні, але я не впевнений, що ця заява є дійсною. Припустимо, що періоди часу не були обрані зловмисно (щоб максимально збільшити події в тих чи інших).n1/t1n2/t2

Чи можу я просто зробити t- тест, чи це не підходить? Кількість подій для мене занадто мала, щоб зручно називати розподіли приблизно нормальними.



1
Чудовий зразок наукової журналістики, там ...
Метт Паркер

1
Так ... ви можете зрозуміти, чому я хотів перевірити використану статистику.
Чарльз

Відповіді:


25

Для перевірки середнього значення Пуассона умовний метод був запропонований Пшиборовським та Віленським (1940). Умовний розподіл X1, заданий X1 + X2, слідує за біноміальним розподілом, імовірність успіху якого є функцією відношення двох лямбда. Тому процедури тестування гіпотез та оцінки інтервалу можна легко розробити з точних методів для отримання висновків про ймовірність успіху бінома. Зазвичай для цього розглядаються два методи,

  1. C-тест
  2. Е-тест

Подробиці цих двох тестів ви можете знайти в цій роботі. Більш потужний тест для порівняння двох засобів Пуассона


4
+1 Хороша довідка, дякую. C-тест - це більш сувора версія тієї, яку я замальовував, тому варто задуматися. E-тест стосується t-статистики до відповідного розподілу. Розрахунок, що розподіл передбачає подвійну нескінченну суму, яка потребуватиме : досить легко кодувати, ймовірно, надмірність для перевірки газети! О(н1н2)
whuber

1
Автор статті E-test написав просту реалізацію fortran, щоб обчислити значення p для двох пуассонових засобів тут: ucs.louisiana.edu/~kxk4695 Я переніс їх фортран MATLAB тут git.io/vNP86
AndyL

11

Як щодо:

poisson.test(c(n1, n2), c(t1, t2), alternative = c("two.sided"))

Це тест, який порівнює показники Пуассона 1 і 2 один з одним і дає як значення ap, так і 95% довірчий інтервал.


Слід зазначити, що для проблеми з двома вибірками для порівняння показників використовується біноміальний тест
Jon

10

Ви шукаєте швидку та просту перевірку.

Під нульовою гіпотезою, що показники (значення лямбда) рівні, скажімо, , ви могли розглядати два вимірювання як спостереження за одним процесом за час та підрахунок подій протягом інтервалу ( в кількості) та події протягом інтервалу ( в кількості). Ви б оцінили ставку якλт=т1+т2[0,т1]н1[т1,т1+т2]н2

λ^=н1+н2т1+т2

і з цього ви можете оцінити розподіл : вони - Пуассон інтенсивності поблизу . Якщо один або обидва розташовані на хвостах цього розподілу, швидше за все, претензія є дійсною; якщо ні, претензія може покладатися на випадкові зміни.нiтiλ^нi


1
Дякую (+1), це лише правильна перевірка на цю річ, що не йде в манжету. Це було дуже важливим (p = 0,005), тому стаття чудова. Я сподіваюся, що ви не заперечуєте, що я прийняв іншу відповідь - добре знати «справжній» спосіб зробити це, коли це має значення.
Чарльз

5

Мене б більше зацікавив довірчий інтервал, ніж значення ap, ось наближення завантажувальної програми.

Спочатку обчислення довжин інтервалів і перевірка:

Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)

[1] 2.000276

Ця перевірка дає дещо інший результат (збільшення на 100,03%), ніж результат публікації (збільшення на 101%). Продовжуйте завантажувальний інструмент (зробіть це двічі):

N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660 

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706 

95% довірчий інтервал збільшення становить від 31% до 202%.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.