Розглянемо експеримент із кількома учасниками людини, кожен вимірював кілька разів у двох умовах. Модель змішаних ефектів може бути сформульована (використовуючи синтаксис lme4 ) як:
fit = lmer(
formula = measure ~ (1|participant) + condition
)
Тепер, скажіть, я хочу генерувати завантажені інтервали довіри для прогнозів цієї моделі. Я думаю, що я придумав простий і обчислювально ефективний метод, і я впевнений, що я не вперше задумався про це, але у мене виникають проблеми з пошуку будь-яких попередніх публікацій, що описують цей підхід. Ось:
- Підходимо до моделі (як вище), називаємо це "оригінальною моделлю"
- Отримайте прогнози з оригінальної моделі, назвіть їх "оригінальними прогнозами"
- Отримати залишки з оригінальної моделі, пов'язані з кожною відповіддю від кожного учасника
- Перекомпонуйте залишки, відібравши вибірки учасників із заміною
- Встановіть лінійну модель змішаних ефектів з гауссовою помилкою до залишків , назвіть це "проміжною моделлю"
- Обчисліть прогнози з проміжної моделі для кожної умови (ці прогнози будуть дуже близькі до нуля), назвіть їх "проміжними прогнозами"
- Додайте проміжні передбачення до початкових прогнозів, назвіть результат "повторними спробами передбачень"
- Повторіть кроки від 4 до 7 багато разів, генеруючи розподіл передбачень повторних зразків для кожної умови, з якої один раз можна обчислити CI.
Я бачив процедури «залишкового завантаження» в контексті простої регресії (тобто не змішаної моделі), де залишки відбираються як одиниця переустановки, а потім додаються до прогнозів вихідної моделі перед тим, як встановлювати нову модель для кожної ітерації завантажувальна програма, але це здається досить відмінним від підходу, в якому я описую, де залишки ніколи не повторюються, люди є, і лише післяотримується тимчасова модель, чи вступають у дію оригінальні прогнози моделі. Ця остання особливість має дуже гарну перевагу в тому, що незалежно від складності оригінальної моделі, тимчасова модель завжди може бути придатною як гауссова лінійна змішана модель, яка в деяких випадках може бути значно швидшою. Наприклад, нещодавно у мене були біноміальні дані та 3 змінних предиктора, одна з яких, як я підозрював, спричинить сильно нелінійні ефекти, тому мені довелося використовувати узагальнене аддитивне змішане моделювання за допомогою функції біноміального зв’язку. Встановлення оригінальної моделі в цьому випадку зайняло більше години, тоді як пристосування гауссової ЛММ на кожну ітерацію займало лише кілька секунд.
Я дійсно не хочу претендувати на пріоритет щодо цього, якщо це вже відома процедура, тому я буду дуже вдячний, якщо хтось може надати інформацію про те, де це, можливо, було описано раніше. (Крім того, якщо з цим підходом є якісь явні проблеми, повідомте мене!)