Чи вбудовані нуль-усічений Пуассон і базовий Пуассон, чи вкладені чи не вкладені?


9

Я бачив багато, що обговорює, чи є базовою пуассоновою регресією вкладена версія нульової завищеної пуассонової регресії. Наприклад, цей сайт стверджує, що він є, оскільки останній включає додаткові параметри для моделювання додаткових нулів, але в іншому випадку включає ті самі параметри регресії Пуассона, що і перший, хоча на цю сторінку входить посилання, яка не погоджується.

Те, про що я не можу знайти інформацію, - це вбудований нульовий Пойсон та основний Пуассон. Якщо нульовий усілений Пуассон - це лише Пуассон із додатковою умовою, що ймовірність нульового підрахунку дорівнює нулю, то, мабуть, це звучить так, як вони могли бути, але я сподівався на більш остаточну відповідь.

Мені цікаво, що це вплине на те, чи слід використовувати тест Вуонга (для моделей, що не вкладаються), або більш базовий тест чі-квадрат, заснований на різниці в логічності (для вкладених моделей).

Вілсон (2015) розповідає про те, чи підходить тест Вуонга для порівняння нульової завищеної регресії з базовою, але я не можу знайти джерело, яке обговорює нульові усічені дані.

Відповіді:


4

Просто натрапи на це зараз. Щоб уникнути плутанини, я - Вільсон Вілсон (2015), на який посилається в початковому запитанні, яке запитує, чи є вкладені, не вкладені моделі Пуассона та усічені Пуассона тощо. Трохи спрощуючи, менша модель вкладається у більшу модель, якщо більша модель зменшується до меншої, якщо підмножина її параметрів фіксується за вказаними значеннями; дві моделі перекриваються, якщо вони обидві зменшуються до однієї і тієї ж моделі, коли підмножини відповідних параметрів фіксуються до певних значень, вони є вкладеними, якщо незалежно від того, як встановлені параметри, одна не може зменшитись до іншої. Згідно з цим визначенням усічений Пуассон і стандартний Пуассон не вкладені. ЯКЩО, і це точка, яку, здається, багато хто не помічає, теорія розподілу Вуонга посилається на СТРАТИВНО вкладені, Строго не вкладені, і СТРАТИВНО перекриваються. "Строго", що посилається на додавання шести обмежень до основного визначення вкладених тощо. Ці обмеження не зовсім прості, але вони, серед іншого, означають, що результати Вуонга щодо розподілу коефіцієнтів вірогідності журналу не застосовуються у випадках, коли моделі / розподіли вкладені на межі простору параметрів (як це відбувається у Пуассона / нуль, завищений Пуассоном з ідентифікаційним зв’язком для параметра нульової інфляції) або коли одна модель прагне до іншої, коли параметр прагне до нескінченності, як - це випадок з Пуассоном / нульовим рівнем Пуассона, коли для моделювання параметра нульової інфляції використовується посилання logit. Вуонг не висуває жодної теорії щодо розподілу коефіцієнтів вірогідності колоди в цих умовах. На жаль, тут,

Наступний код R буде імітувати розподіл коефіцієнтів логотипності Пуассона та усіченого Поассона. Для цього потрібен VGAMпакет.

n<-30   
lambda1<-1
H<-rep(999,10000)
for(i in 1:10000){
  print(i)
  y<-rpospois(n, lambda1)
  fit1 <- vglm(y ~ 1, pospoisson)
  fit2<-glm(y~1, family=poisson(link="log"))
  H[i]<-logLik(fit1)-logLik(fit2)
}

hist(H,col="lemonchiffon")

4

Основний Пуассон можна вважати вкладеним всередині більш загальної форми:

p(х)=(1-p)е-λλхх!+p1(х=0)

Коли p=0, у нас є основний Пуассон. Колиp=-досвід{-λ}/(1-досвід{-λ}), у нас є нульовий усілений Пуассон. Коли-досвід{-λ}/(1-досвід{-λ})<p<0, ми маємо нульово зменшений Пуассон. Коли0<p<1, у нас Пуассон з нульовим рівнем, і ми маємо вироджене розподіл при p=1.

Тож мені здається, що вкладена версія тесту Вуонга, або чі-квадрат, як ви пропонуєте, була б доречною у вашому випадку. Однак зауважте, що квадрат квадратних чі може мати проблеми через малі ймовірності "великого" (відносноλ) спостереження. Ви, мабуть, хочете скористатися завантажувальним інструментом, щоб отримати значення р для статистики хі-квадрата замість того, щоб покладатися на асимптотику, якщо у вас є досить багато даних.


Спасибі @jbowman - ось така більш сувора відповідь, на яку я сподівався. Мені незрозуміло: я вважав, що вся суть тесту Вуонга стосується невкладених моделей, тому, хоч це і виходить за рамки мого початкового повідомлення, ви могли б надати трохи більше інформації про "вкладену версію тесту Вуонга". Щоб було зрозуміло про джерело моєї плутанини: до цього моменту я знав лише про vuongфункцію в пакеті psclна R, яка говорить, що це стосується не вкладених моделей. Я просто гугл і знайшов функцію vuongtestв пакеті, nonnest2який включає аргумент "вкладений". Це все?
Джастін

Так, це так. Власне, сторінка Wikipedia en.wikipedia.org/wiki/Vuong%27s_closeness_test на тесті Вуонґа легка користь (часто це не так багато) для опису різниці.
jbowman

1
NB І Пуассон, і Пуліссон з нульовим уселенням - це особливі випадки визначеного вами розподілу. Одне не вкладено в інше. Таким чином, ви не можете використовувати теорему Уілкса для отримання асимптотичного розподілу в квадратику для подвійного коефіцієнта ймовірності журналу, який би ви вважали нульовою гіпотезою. (Я думаю, що для тесту
Вуонг

3
@Scortchi Мені цікаво визначення "вкладеного", яке ви застосовуєте. Хоча я не погоджуюся з вашим висновком, я приходжу до нього з дещо іншої точки зору: так, Пуассон вкладений у цю сім'ю (адже він виникає обмеженням наp=0), але різні висновки щодо асимптотичних розподілів оцінок параметрів MLE для p не застосовуватись, оскільки це значення p лежить на кордоні сім'ї. Чи пропускаю я якусь важливу відмінність?
whuber

2
@whuber, я збирався прокоментувати / надати відповідь приблизно з тієї ж точки. Посилання посилання робить примітку: «... хоча розподілу хі-квадрат може знадобитися певне коригування , оскільки обмеження на кордоні простору параметрів»
Бен Bolker
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.