Параметричне моделювання дисперсії даних лічильників


12

Я шукаю, щоб моделювати деякі дані, але я не впевнений, який тип моделі я можу використовувати. У мене є дані про підрахунок, і я хочу, щоб модель дала параметричні оцінки як середнього, так і дисперсійного даних. Тобто, у мене є різні прогнозні чинники, і я хочу визначити, чи впливає який-небудь з них на дисперсію (не лише середнє значення групи).

Я знаю, що регресія Пуассона не спрацює, оскільки дисперсія дорівнює середній; це припущення не вірно в моєму випадку, тому я знаю, що є наддисперсія. Однак негативна біноміальна модель генерує лише один параметр передисперсії, а не той, який є функцією предикторів у моделі. Яка модель може це зробити?

Крім того, було б вдячне посилання на книгу або папір, де обговорюється модель та / або пакет R, який реалізує модель.


1
Звідки ви знаєте, що має місце наддисперсія, не попередньо зробивши пуассонову регресію? Зрештою, порівняння дисперсії сирих значень (відповіді) з їх середнім значенням не є актуальним: важливим є корисність придатності моделі Пуассона (це аналог оцінки розподілу залишків у лінійній моделі порівняно з оцінкою розподіл змінної відповіді). Інший спосіб зробити це, що зв'язок між незалежними змінними та реакцією може створити появу наддисперсії навіть у чудово точній моделі Пуассона.
whuber

2
@whuber Це справедливо. Для одного категоричного прогноктора, що дивиться на дисперсію та середнє значення підгруп, було б достатньо для виявлення наддисперсії, але для багатовимірної пуассонової регресії це не так. На думку аргументів, припустимо, що було зроблено і пуассонова, і негативна біномальна регресія, і негативна біноміал показує кращу відповідність за допомогою порівняння моделі anova. Це повинно свідчити про перевищення рівня. Враховуючи це, як міняти дисперсію / наддисперсію можна параметрично, а не як константу?
Брайан Діггс

1
Я думаю, є розділ про McCullagh та Nelder, Узагальнені лінійні моделі, 2-е видання , що висвітлює це (але моя копія працює) ... реальної вірогідності не буде, але ви можете використовувати квазі-ймовірність, і так може бути назвою глави. Ви застосовуєте ітераційно переосмислені найменші квадрати, хоча немає ймовірності, яка відповідає.
Карл

У главі 10 МакКлала і Нелдера обговорюється спільне моделювання середнього та дисперсійного характеру, тобто параметризація як середнього, так і відхилення. Розширена квазіімовірність є головним інструментом, але в деяких ситуаціях можуть виникнути занепокоєння щодо цього методу
гість

Відповіді:


9

Можна моделювати сам параметр негативної біноміальної дисперсії як функцію змінних та параметрів, використовуючи пакет gamlss в Р. Я надаю витяг із вступу до нього:

Чому я повинен використовувати GAMLSS

Якщо ваша змінна відповідь - це кількість (дискретні) дані, велика ймовірність, що розподіл Пуассона не підійде добре. GAMLSS забезпечує різноманітні дискретні розподіли (включаючи негативний біном), який ви можете спробувати. Параметр дисперсії можна також моделювати як функцію пояснювальних змінних.

На веб-сайті www.gamlss.org є документація та посилання на кілька робіт про підходи, що використовуються в пакеті.


Обидві відповіді корисні та надають хороші довідки. Я присуджую цю нагороду тому, що (а) вона передувала іншій протягом чотирьох хвилин і (б) рішення gamlss для мене нове (я знайомий з nbreg). Але капелюхи до @timbp за хорошу відповідь; Сподіваюсь, ви продовжите надавати свій внесок у наш сайт.
whuber

2
@whuber, мене також роздирає питання про те, щоб прийняти відповідь як "", тому що обидва були дуже корисними. Я пішов з цим, тому що він містив посилання на пакет R, який я можу використовувати; Посилання на книгу в іншій відповіді було добре прочитано, і її не слід скидати з рахунків. Дякуємо, що запропонували щедроту, яка підказала ці дві хороші відповіді.
Брайан Діггс

9

Stata надає команду -gnbreg-, яка дозволяє моделювати параметр дисперсії. Довідку Stata для команди можна переглянути на веб- сайті http://www.stata.com/help.cgi?nbreg

Стати називає це узагальненою негативною біноміальною моделлю. Джозеф Хільбе розглядає це у своїй книзі "Негативна біноміальна регресія", розділ 10.4, як "NB-H: Гетерогенна негативна біноміальна регресія".

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.