Я зіткнувся з низкою практичних питань, коли моделював підрахунок даних експериментальних досліджень за допомогою експерименту в рамках предмета. Я коротко описую експеримент, дані та те, що я зробив до цього часу, після чого мої питання
Чотири різних фільми були показані на вибірці респондентів послідовно. Після кожного фільму було проведено інтерв'ю, в якому ми підраховували кількість випадків тих чи інших тверджень, які представляли інтерес для RQ (прогнозована змінна кількість). Ми також зафіксували максимальну кількість можливих подій (одиниці кодування; змінна зміна). Крім того, кілька характеристик фільмів вимірювались у безперервній шкалі, з яких для однієї ми маємо причинну гіпотезу про вплив кінофільму на кількість висловлювань, а інші - контрольні (прогноктори).
Стратегія моделювання, прийнята поки що, така:
Оцініть випадкову модель Пуассона, де причинну змінну використовують як коваріат, а інші змінні як контрольні коваріати. Ця модель має зміщення, рівне 'log (одиниці)' (одиниці кодування). Випадкові ефекти знімаються в різних предметах (конкретні підрахунки фільму вкладені в сюжети). Ми знаходимо підтверджену причинно-наслідкову гіпотезу (сиг. Коефіцієнт причинної змінної). Для оцінки ми використовували пакет lme4 в R, зокрема функцію glmer.
Тепер у мене є такі питання. Поширена проблема регресії Пуассона - це наддисперсія. Я знаю, що це можна перевірити, використовуючи негативну біноміальну регресію і оцінюючи, чи покращує її дисперсійний параметр модель пристосування простої моделі Пуассона. Однак я не знаю, як це зробити в контексті випадкових ефектів.
- Як слід перевірити на наявність надмірної дисперсії в своїй ситуації? Я випробував наддисперсію в простій пуассонової / негативної біноміальної регресії (без випадкових ефектів), яку я вмію вмістити. Тест передбачає наявність наддисперсії. Однак, оскільки ці моделі не враховують кластеризацію, я вважаю, що цей тест є неправильним. Також я не впевнений у ролі компенсації для тестів на наддисперсію.
- Чи є щось на зразок негативної біноміальної моделі регресії випадкових ефектів, і як я повинен вмістити її в R?
- Чи є у вас пропозиції щодо альтернативних моделей, які я повинен спробувати на даних, тобто з урахуванням структури повторних заходів, підрахунку змінних та експозиції (одиниць кодування)?