Припущення узагальнених лінійних моделей


9

На сторінці 232 статті "Супутник R застосованій регресії" відзначають Фокс та Вайсберг

Тільки сім'я Гаусса має постійну дисперсію, а у всіх інших GLM умовна дисперсія y at x залежить від μ(x)

Раніше вони зазначали, що умовна дисперсія Пуассона є μ а двочлен є μ(1μ)N.

Для гауссів це звичне і часто перевірене припущення (гомоскедастичність). Так само я часто бачу умовну дисперсію Пуассона, яку обговорюють як припущення про пуассонову регресію разом із засобами правового захисту для випадків, коли вона порушена (наприклад, негативна двочлен, нуль завищена тощо). І все ж я ніколи не бачу, щоб умовна дисперсія для біноміалу обговорювалася як припущення логістичної регресії. Трохи Гуглінг не знайшов про це жодної згадки.

Що я тут пропускаю?

EDIT після коментаря @whuber:

Як було запропоновано, я переглядаю Hosmer & Lemeshow. Це цікаво, і я думаю, що це показує, чому я (і, можливо, інші) розгублені. Наприклад, слово "припущення" відсутнє в покажчику до книги. Крім того, ми маємо це (стор. 175)

При логістичній регресії ми маємо покладатися насамперед на візуальну оцінку, оскільки розподіл діагностики під гіпотезою про те, що модель відповідає, відомий лише у певних обмежених налаштуваннях

Вони показують досить багато сюжетів, але концентруються на розкидах різних залишків проти розрахункової ймовірності. Ці сюжети (навіть для хорошої моделі не мають "крихітного" малюнка, характерного для подібних сюжетів в регресії OLS, і тому важче судити. Крім того, вони не виявляють нічого подібного до кількісних сюжетів.

У R, plot.lm пропонує гарний набір ділянок за замовчуванням для оцінки моделей; Я не знаю еквівалента для логістичної регресії, хоча це може бути в якомусь пакеті. Це може бути тому, що для кожного типу моделі потрібні різні схеми. SAS пропонує деякі сюжети в PROC LOGISTIC.

Це, звичайно, є зоною потенційної плутанини!


3
Якщо у вас є копія Hosmer & Lemeshow, Applied Logistic Regression, тоді перегляньте розділ «Оцінка придатності моделі»: умовна дисперсія двочлена з’являється скрізь і явно враховується майже у всіх тестах GoF.
whuber

1
Я думаю, що біноміальне припущення нав'язується реальним експериментом: відповіді незалежні 0/1, тому біноміальний розподіл є єдиним, який моделює реальний експеримент. Навпаки, припущення розподілу Пуассона для підрахунків не є реалістичним.
Стефан Лоран

1
Дякую @whuber. У мене є ця книга, і я перевірю її
Пітер Флом

... але функція зв'язку не є природною, і вона визначає умовну дисперсію ... тому мій вище коментар був не дуже розумним
Stéphane Laurent

Відповіді:


3

Ці сюжети (навіть для хорошої моделі не мають "крихітного" малюнка, характерного для подібних сюжетів в регресії OLS, і тому важче судити. Крім того, вони не показують нічого подібного до квантильних сюжетів.

Пакет DHARMa R вирішує цю проблему, моделюючи з вбудованої моделі, щоб перетворити залишки будь-якого GL (M) M в стандартизований простір. Після цього можна застосовувати всі регулярні методи візуального та формального оцінювання залишкових проблем (наприклад, qq-графіки, наддисперсія, гетерокедастичність, автокореляція). Дивіться віньєтку на упаковці для ознайомлюваних прикладів.

Щодо коментаря @Otto_K: якщо гомогенна передисперсія є єдиною проблемою, можливо, простіше використовувати випадковий ефект спостережувального рівня, який можна реалізувати за допомогою стандартного двочленного GLMM. Однак я думаю, що @PeterFlom хвилювався також щодо гетерокедастичності, тобто зміни параметра дисперсії з деякими прогнозами чи прогнозами моделі. Це не буде зібрано / виправлено за допомогою стандартних перевірок / виправлень передисперсії, але ви можете побачити це на залишкових ділянках DHARMa. Для її виправлення моделювання дисперсії як функції чогось іншого в JAGS або STAN - це, мабуть, єдиний на даний момент спосіб.


1

Тему, яку ви пояснюєте, часто називають наддисперсією . У своїй роботі я побачив можливе рішення такої теми:

Використання байєсівського підходу та оцінка бета-біноміального розподілу. Це має велику перевагу перед іншими розподілами (індукованими іншими пріорами), щоб мати рішення закритої форми.

Список літератури:

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.