Я намагаюся моделювати дані підрахунку в R, які, мабуть, нерозподілені (параметр дисперсії ~ .40). Це, мабуть, причина glm
з family = poisson
або негативною біноміальною ( glm.nb
) моделлю не є істотною. Коли я дивлюсь на описи моїх даних, у мене немає типового перекосу даних підрахунку, і залишки в двох моїх експериментальних умовах теж є однорідними.
Тому мої запитання:
Чи потрібно мені навіть використовувати спеціальні регресійні аналізи для моїх даних підрахунку, якщо дані моєї підрахунку насправді не ведуть себе як дані підрахунку? Іноді я стикаюся з ненормальністю (як правило, через куртоз), але для порівняння обрізаних засобів я використовував метод процентильного завантаження (Wilcox, 2012) для нестандартності. Чи можуть методи підрахунку даних замінити будь-який надійний метод, запропонований Wilcox і реалізований у пакеті WRS?
Якщо мені доведеться використовувати регресійні аналізи для даних підрахунку, як я можу враховувати недолік дисперсії? Пуассон і негативний біноміальний розподіл передбачають більшу дисперсію, так що це не повинно бути правильно, правда? Я думав про те, щоб застосувати розподіл квазі-Пуассона , але це зазвичай рекомендується для надмірної дисперсії. Я читав про бета-біноміальні моделі, які, здається, здатні враховувати як надмірне, так і недоліпшення, є в
VGAM
пакеті R. Однак однак автори рекомендують рекомендувати розподілений пуассоновий розподіл , але я не можу знайти його в пакеті .
Чи може хтось порекомендувати процедуру недорозвинених даних і, можливо, надати для неї якийсь приклад R-код?