Тестування гіпотези Пуассона за двома параметрами


9

Тож для задоволення я беру деякі дані дзвінків з кол-центру, в якому я працюю, і намагаюся зробити тестування гіпотез щодо них, зокрема кількість отриманих дзвінків за тиждень, і використовую розподіл Пуассона, щоб підходити до нього. Зважаючи на тему моєї роботи, є два типи тижнів, давайте назвемо один з них на тижні, де я припускаю, що більше дзвінків, а поза тижнів, коли я гіпотезую, є менше.

У мене є теорія, згідно з якою з тижнів (назвемо це ) більша, ніж у тижня з поза тижнів (назвемо це )λλ1λ2

Отже, я хочу перевірити гіпотезуН0:λ1>λ2,Н1:λ1λ2

Я знаю, як перевірити один параметр (скажімо Н0:λ1>1,Н1:λ11), але не настільки впевнений, як рухатись за допомогою 2 даних. Скажімо, я беру дані на два тижні з кожногоХ1=2 і Х2=3 за недільний і Y1=2 і Y2=6на тиждень. Хтось може допомогти мені ходити через цю більш просту версію, щоб я міг застосувати її до більшого набору даних? Будь-яка допомога вдячна, дякую.


3
Чи розподілені дзвінки насправді пуассоном? Якщо дзвінків багато, їх найкраще моделювати як приблизно. Але це може вбити забаву.
Регрес вперед

1
Ну, що визначає це те, як ви це правильно встановите? Я отримую x кількість дискретних дзвінків у будь-який часовий проміжок одиниці. Я міг би це зробити як звичайний розподіл впевнений, але в усьому суть, я хотів би спробувати це з Пуассоном, оскільки він підходить.
Джеймс Снайдер

Якщо ви вважаєте, що рахунки є Пуассоном, то ви можете просто додати підрахунки (виправте мене, якщо я помиляюся). Тобто ви отримаєте X = 2 + 3 і Y = 2 + 6. Потім ви можете перевірити на різницю, використовуючи, наприклад, "Poisson.test" в Р. Якщо ви хочете пройти байєсівський аналіз, у мене також є повідомлення в блозі тут: sumsar.net/blog/2014/ 09 /
байезіанський

Відповіді:


4

Зауважимо, що рівність зазвичай є нульовою (з поважною причиною).

Що стосується цього питання, я згадаю кілька підходів до тестування подібної гіпотези

  1. Дуже простий тест: умова на загальну кількість спостережуваних н, що перетворює його на біноміальну пробу пропорцій. Уявіть, що єшна на-тижні і швимкнено поза тижнів і ш тижні разом.

Тоді під нулем очікувані пропорції шнаш і швимкненошвідповідно. Ви можете зробити односхилий тест на пропорцію протягом тижнів досить легко.

  1. Ви можете побудувати односхилий тест, адаптувавши статистику, пов’язану з тестом коефіцієнта ймовірності; z-форму Wald-тесту або тестування балів можна зробити, наприклад, хвостиком, і він повинен добре працювати з мовоюλ.

Є й інші заходи.


1

Що про щойно використаний GLM зі структурою помилок Пуассона та log-link ??? Але думка про двочлен може бути більш потужною.


Наразі це скоріше коментар, ніж відповідь. Ви задумали це як коментар, запитання для уточнення чи відповіді? Якщо останнє, чи можете ви розширити його на більшу відповідь? Ми також можемо перетворити це в коментар для вас.
gung - Відновіть Моніку

1

Я б вирішив це за допомогою пуассона або квазі-пуассона GLM з перевагою квазі-пуассона або негативного двочлена.

Проблема використання традиційного Пуассона полягає в тому, що він вимагає відхилення і середнього значення бути рівним, що, швидше за все, не так. Квазі-Пуассон або NB оцінює дисперсію, необмежену середнім значенням.

Ви можете зробити що-небудь з цього в R дуже легко.

# week on = 1, week off = 0
week.status <- c(1, 1, 0, 0)
calls <- c(2, 6, 2, 3)
model <- glm(calls ~ week.status, family = poisson())
# or change the poisson() after family to quasipoisson() 
# or use the neg binomial glm from the MASS package

Підхід GLM є вигідним, оскільки ви можете розширити, включаючи додаткові змінні (наприклад, місяць року), які можуть вплинути на обсяг виклику.

Щоб зробити це вручну, я, мабуть, скористався нормальним наближенням і двома зразками t тесту.


1

Ми починаємо з максимальної оцінки ймовірності для параметра Пуассона, що є середнім.

Тому, λ^1=Y¯  анг  λ^2=Х¯

Тепер ви можете просто протестувати Y¯-Х¯N(λ1-λ2,λ1н1+λ2н2)

а потім порівняйте, отримавши Z-значення =(Y¯-Х¯)-λ1-λ2λ1н1+λ2н2

Примітка: -Критерії відхилення є Z<Сriтicал Vалуе


0

Починаючи зі сторінки 125 Тестичної статистичної гіпотези Казелли, викладено відповідь на тип запитання, який ви сформулювали. Я додав посилання на pdf, я знайшов його в Інтернеті для ознайомлення. Тестова статистична гіпотеза Казелли, Третє видання .


Хороший вказівник, однак відповіді, що мають лише посилання, не дозволяють перехресно перевірити. Не могли б ви намалювати резолюцію у своїй відповіді? Дякую.
Сіань

Вибачте, що я не знав цього правила. Дякую, що повідомили мені. :) Спробую якнайшвидше дати вичерпну відповідь.
Nuzhi Meyen
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.