Я намагаюся розмістити для себе, коли доречно використовувати тип регресії (геометричний, пуассонський, негативний двочлен) з даними підрахунку, в рамках GLM (лише 3 з 8 розподілів GLM використовуються для підрахунку даних, хоча більшість з них Я читав центри навколо негативних біноміальних та пуассонових розподілів).
Коли використовувати дані Пуассона проти геометричних та негативних біноміальних GLM для даних підрахунку?
Поки я маю таку логіку: чи вважаються дані? Якщо так, то чи середня величина та відхилення неоднакові? Якщо так, негативна біноміальна регресія. Якщо ні, регресія Пуассона. Чи є нульова інфляція? Якщо так, нульовий завищений Пуассон або нульовий завищений від'ємний двочлен.
Запитання 1 Здається, не існує чіткої вказівки, що слід використовувати, коли. Чи є щось, щоб повідомити про це рішення? З того, що я розумію, щойно ви переходите на ZIP, середня дисперсія, рівна припущенню, стає розслабленою, тому вона знову схожа на NB.
Запитання 2 Де геометрична сім'я вписується в це чи які питання мені слід задавати дані, вирішуючи, чи використовувати геометричну сім'ю в моїй регресії?
Питання 3 Я бачу, що люди постійно змінюють негативні біноміальні та пуассонові розподіли, але не геометричні, тому я здогадуюсь, що є щось чітко інакше, коли його використовувати. Якщо так, то що це?
PS Я склав (напевне, спрощений, з коментарів) діаграму ( редаговану ) свого сучасного розуміння, якщо люди хотіли прокоментувати / налаштувати її для обговорення.