Альтернативи надмірної дисперсії та моделювання в моделях випадкових ефектів Пуассона із зрушеннями


12

Я зіткнувся з низкою практичних питань, коли моделював підрахунок даних експериментальних досліджень за допомогою експерименту в рамках предмета. Я коротко описую експеримент, дані та те, що я зробив до цього часу, після чого мої питання

Чотири різних фільми були показані на вибірці респондентів послідовно. Після кожного фільму було проведено інтерв'ю, в якому ми підраховували кількість випадків тих чи інших тверджень, які представляли інтерес для RQ (прогнозована змінна кількість). Ми також зафіксували максимальну кількість можливих подій (одиниці кодування; змінна зміна). Крім того, кілька характеристик фільмів вимірювались у безперервній шкалі, з яких для однієї ми маємо причинну гіпотезу про вплив кінофільму на кількість висловлювань, а інші - контрольні (прогноктори).

Стратегія моделювання, прийнята поки що, така:

Оцініть випадкову модель Пуассона, де причинну змінну використовують як коваріат, а інші змінні як контрольні коваріати. Ця модель має зміщення, рівне 'log (одиниці)' (одиниці кодування). Випадкові ефекти знімаються в різних предметах (конкретні підрахунки фільму вкладені в сюжети). Ми знаходимо підтверджену причинно-наслідкову гіпотезу (сиг. Коефіцієнт причинної змінної). Для оцінки ми використовували пакет lme4 в R, зокрема функцію glmer.

Тепер у мене є такі питання. Поширена проблема регресії Пуассона - це наддисперсія. Я знаю, що це можна перевірити, використовуючи негативну біноміальну регресію і оцінюючи, чи покращує її дисперсійний параметр модель пристосування простої моделі Пуассона. Однак я не знаю, як це зробити в контексті випадкових ефектів.

  • Як слід перевірити на наявність надмірної дисперсії в своїй ситуації? Я випробував наддисперсію в простій пуассонової / негативної біноміальної регресії (без випадкових ефектів), яку я вмію вмістити. Тест передбачає наявність наддисперсії. Однак, оскільки ці моделі не враховують кластеризацію, я вважаю, що цей тест є неправильним. Також я не впевнений у ролі компенсації для тестів на наддисперсію.
  • Чи є щось на зразок негативної біноміальної моделі регресії випадкових ефектів, і як я повинен вмістити її в R?
  • Чи є у вас пропозиції щодо альтернативних моделей, які я повинен спробувати на даних, тобто з урахуванням структури повторних заходів, підрахунку змінних та експозиції (одиниць кодування)?

1
для початку перегляньте розділ "перенапруження" в glmm.wikidot.com/faq
Бен Болкер

1
Дякую, дуже корисно! Можливо, хтось хоче скласти відповідь з цієї та іншої інформації.
tomka

Відповіді:


1

[0,)

Замість того, щоб перевірити наявність наддисперсії , яка не має гарантії привести до корисної відповіді, і, хоча можна вивчити показники дисперсії для кількісної оцінки дисперсії, я б більш корисно запропонувати шукати найкращу дистрибуцію за допомогою дискретного варіанту розподілу потрібного якісного пошуку. програма, наприклад, підручник FindDistribution Mathematica . Цей тип пошуку виконує досить вичерпну роботу - здогадуватися, які відомі роботи (-и) розповсюдження (-ів) найкраще не тільки зменшити надмірність, але й більш корисно моделювати багато інших характеристик даних, наприклад, корисність розміру в розмірі десятка. різні шляхи.

Для подальшого вивчення мого розподілу кандидатів, я б постфактум досліджувати залишки для перевірки гомоскедастичність, і / або типу розподілу, а також розглянути питання про доцільність розподіл кандидатів може бути погоджено як відповідна фізичним поясненням даних. Небезпека цієї процедури полягає у визначенні розподілу, що не відповідає найкращому моделюванню розширеного набору даних. Небезпека не виконувати пост-спеціальну процедуру полягає в тому, щоб апріорі призначити довільно обраний розподіл без належного тестування (сміття всередині сміття). Перевага посадиПідхід полягає в тому, що він обмежує помилки пристосування, і це також є його слабкістю, тобто він може занижувати помилки моделювання за допомогою чистого шансу, оскільки намагається здійснити чимало приладів розподілу. Це тоді є причиною для вивчення залишків та врахування фізичності. Підхід зверху вниз або апріорі не пропонує такої спеціальної перевірки на розумність. Тобто єдиний метод порівняння фізичності моделювання з різними розподілами - це поступове їх порівняння. Таким чином виникає природа фізичної теорії, ми перевіряємо гіпотетичне пояснення даних за допомогою багатьох експериментів, перш ніж приймати їх як виснажливі альтернативні пояснення.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.