Яка відповідна стратегія для вирішення, яку модель використовувати для даних лічильників? У мене є кількість даних, які мені потрібні для моделювання як багаторівневої моделі, і мені було рекомендовано (на цьому веб-сайті), що найкращий спосіб зробити це через помилки або MCMCglmm. Однак я все ще намагаюся дізнатися про байєсівську статистику, і я подумав, що спершу слід спробувати вписати свої дані як узагальнені лінійні моделі та проігнорувати вкладені структури даних (просто так я можу отримати розпливчасте уявлення про те, чого очікувати).
Близько 70% даних дорівнюють 0, а співвідношення дисперсії до середнього - 33. Отже, дані досить розсіяні.
Спробувавши декілька різних варіантів (включаючи пуассону, негативну біноміальну, квазі та нульову завищену модель), я бачу дуже незначну послідовність у результатах (відмінність від усього суттєва до нічого не має значного значення).
Як я можу прийняти обгрунтоване рішення про те, який тип моделі вибрати на основі інфляції та надмірної дисперсії? Наприклад, як я можу зробити висновок про те, що квазі-пуассон є більш підходящим, ніж негативний двочлен (або навпаки), і як я можу знати, що використовуючи або справились адекватно (чи ні) із зайвими нулями? Аналогічно, як я оцінюю, що більше не буде надмірної дисперсії, якщо використовується модель із заниженою нулем? або як я повинен вирішити між нульовим завищеним пуассоном і нульовим завищеним негативним двочленним?