Яка підходяща модель для низькодисперсних даних підрахунку?


24

Я намагаюся моделювати дані підрахунку в R, які, мабуть, нерозподілені (параметр дисперсії ~ .40). Це, мабуть, причина glmз family = poissonабо негативною біноміальною ( glm.nb) моделлю не є істотною. Коли я дивлюсь на описи моїх даних, у мене немає типового перекосу даних підрахунку, і залишки в двох моїх експериментальних умовах теж є однорідними.

Тому мої запитання:

  1. Чи потрібно мені навіть використовувати спеціальні регресійні аналізи для моїх даних підрахунку, якщо дані моєї підрахунку насправді не ведуть себе як дані підрахунку? Іноді я стикаюся з ненормальністю (як правило, через куртоз), але для порівняння обрізаних засобів я використовував метод процентильного завантаження (Wilcox, 2012) для нестандартності. Чи можуть методи підрахунку даних замінити будь-який надійний метод, запропонований Wilcox і реалізований у пакеті WRS?

  2. Якщо мені доведеться використовувати регресійні аналізи для даних підрахунку, як я можу враховувати недолік дисперсії? Пуассон і негативний біноміальний розподіл передбачають більшу дисперсію, так що це не повинно бути правильно, правда? Я думав про те, щоб застосувати розподіл квазі-Пуассона , але це зазвичай рекомендується для надмірної дисперсії. Я читав про бета-біноміальні моделі, які, здається, здатні враховувати як надмірне, так і недоліпшення, є в VGAMпакеті R. Однак однак автори рекомендують рекомендувати розподілений пуассоновий розподіл , але я не можу знайти його в пакеті .

Чи може хтось порекомендувати процедуру недорозвинених даних і, можливо, надати для неї якийсь приклад R-код?


1
Як ви знаєте, що ваші дані недооцінені? Як ви обчислюєте параметр дисперсії?
Hong Ooi

1
Це також допоможе нам розповісти більше про те, що вас цікавить. Для лінійних оцінок точок прогнозу та прогнозування значень недостатність рідко є проблемою, але тести та інтервали можуть бути надмірно консервативними (квазі-сім'ї допоможуть у цьому). Однак, для "нормального" підходу до вірогідності ознайомтеся з COM-Пуассоном та іншими узагальненими моделями Пуассона.
Момо

@ Hung Ooi: Я протестував дисперсію з дисперсійним тестом (Poissonmodel, alternative = c ("менше")), і тест виявився значним.
Сіль

1
@ Momo: Я хочу перевірити, чи переговорні діади в двох експериментальних умовах відрізняються від правильних пропозицій, які вони роблять. Правильні пропозиції означають, що діади заявляють більше питань, що відповідають відповідним інтересам їхніх команд, а не вимагати питань, які є більш цінними для іншої сторони. По-перше, я навіть не знав, що це підрахунок даних. Ви маєте на увазі розподіл Конвей-Максвелл-Пуассона від COM Poisson? Дякую вже багато!
Сіль

3
Дякуємо за додаткову інформацію. Так, я мав на увазі пуансон Conway-Maxwell. Компанія Shmueli & co розробила для неї узагальнену лінійну модель kindbof, також є пакет R, якщо ви хочете спробувати.
Момо

Відповіді:


9

Найкращий --- і стандартний спосіб поводження з нерозбірливими даними Пуассона - це використання узагальненої моделі Пуассона або, можливо, перешкоди. Три моделі підрахунку параметрів можуть також використовуватися для недорозвинених даних; наприклад, Faddy-Smith, Waring, Famoye, Conway-Maxwell та інші узагальнені моделі підрахунку. Єдиний недолік у них - інтерпретація. Але для загальних недорозвинених даних слід використовувати узагальнені Пуассона. Це як негативний двочлен для наддисперсних даних. Я детально обговорюю це в двох моїх книгах «Моделювання даних про підрахунок (2014) та негативна біноміальна регресія», 2-е видання, (2011) обох Cambridge University Press. У пакеті VGAM передбачена генералізована регресія Пуассона (GP). Негативні значення параметра дисперсії вказують на коригування для низької дисперсії. Модель GP можна використовувати і для наддисперсних даних, але загалом модель NB є кращою. Коли справа доходить до неї, найкраще визначити причину недооцінки, а потім вибрати найбільш підходящу модель для її вирішення.


З поверненням! Зареєструйте та / або з’єднайте свої акаунти (інформацію про те, як це зробити, ви можете знайти в розділі " Мій обліковий запис " нашого довідкового центру ), тоді ви зможете редагувати та коментувати власне запитання. (Ваш початковий рахунок тут .)
gung - Відновіть Моніку

Чи можете ви виконати узагальнений аналіз Пуассона на SPSS?
Грейс Керролл

3

Одного разу я зіткнувся з розсіяним Пуассоном, що було пов'язано з частотою, з якою люди будуть грати в соціальну гру. Виявилося, це було через надзвичайну регулярність, з якою люди гратимуть по п’ятницях. Видалення даних у п'ятницю дало мені очікуваний перерозподіл Пуассона. Можливо, у вас є можливість аналогічно редагувати свої дані.


1

Бувають ситуації, коли недостатня дисперсія поєднується з нульовою інфляцією, що характерно для бажаних дітей, що підлічуються людьми обох статей. Я не знайшов способу зафіксувати це на сьогоднішній день

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.