Чи існує назва цього типу завантажувальної програми?


9

Розглянемо експеримент із кількома учасниками людини, кожен вимірював кілька разів у двох умовах. Модель змішаних ефектів може бути сформульована (використовуючи синтаксис lme4 ) як:

fit = lmer(
    formula = measure ~ (1|participant) + condition
)

Тепер, скажіть, я хочу генерувати завантажені інтервали довіри для прогнозів цієї моделі. Я думаю, що я придумав простий і обчислювально ефективний метод, і я впевнений, що я не вперше задумався про це, але у мене виникають проблеми з пошуку будь-яких попередніх публікацій, що описують цей підхід. Ось:

  1. Підходимо до моделі (як вище), називаємо це "оригінальною моделлю"
  2. Отримайте прогнози з оригінальної моделі, назвіть їх "оригінальними прогнозами"
  3. Отримати залишки з оригінальної моделі, пов'язані з кожною відповіддю від кожного учасника
  4. Перекомпонуйте залишки, відібравши вибірки учасників із заміною
  5. Встановіть лінійну модель змішаних ефектів з гауссовою помилкою до залишків , назвіть це "проміжною моделлю"
  6. Обчисліть прогнози з проміжної моделі для кожної умови (ці прогнози будуть дуже близькі до нуля), назвіть їх "проміжними прогнозами"
  7. Додайте проміжні передбачення до початкових прогнозів, назвіть результат "повторними спробами передбачень"
  8. Повторіть кроки від 4 до 7 багато разів, генеруючи розподіл передбачень повторних зразків для кожної умови, з якої один раз можна обчислити CI.

Я бачив процедури «залишкового завантаження» в контексті простої регресії (тобто не змішаної моделі), де залишки відбираються як одиниця переустановки, а потім додаються до прогнозів вихідної моделі перед тим, як встановлювати нову модель для кожної ітерації завантажувальна програма, але це здається досить відмінним від підходу, в якому я описую, де залишки ніколи не повторюються, люди є, і лише післяотримується тимчасова модель, чи вступають у дію оригінальні прогнози моделі. Ця остання особливість має дуже гарну перевагу в тому, що незалежно від складності оригінальної моделі, тимчасова модель завжди може бути придатною як гауссова лінійна змішана модель, яка в деяких випадках може бути значно швидшою. Наприклад, нещодавно у мене були біноміальні дані та 3 змінних предиктора, одна з яких, як я підозрював, спричинить сильно нелінійні ефекти, тому мені довелося використовувати узагальнене аддитивне змішане моделювання за допомогою функції біноміального зв’язку. Встановлення оригінальної моделі в цьому випадку зайняло більше години, тоді як пристосування гауссової ЛММ на кожну ітерацію займало лише кілька секунд.

Я дійсно не хочу претендувати на пріоритет щодо цього, якщо це вже відома процедура, тому я буду дуже вдячний, якщо хтось може надати інформацію про те, де це, можливо, було описано раніше. (Крім того, якщо з цим підходом є якісь явні проблеми, повідомте мене!)


1
Просто побічний коментар, але він може бути доречним. Пітер Мак-Каллаг має доповідь у Бернуллі, де він показує, що жодна завантажувальна програма не правильно оцінює дисперсію в моделі випадкових ефектів.
кардинал

@Mike (+1) Це одне дуже добре написане запитання!
chl

1
Чому б вам не переупорядкувати учасників із заміною, а потім не перепропонувати їх дані? Це, здається, більше відповідає духу багаторівневої моделі з одним розподілом, закладеним всередині іншого. Інший момент полягає в тому, що можлива проблема з біноміальними даними, оскільки крайні кінці зразків будуть менш схильні.
Джон

@John: Я віддаю перевагу перестановці залишків, оскільки (1) це швидше, коли оригінальна модель є трудомісткою для оцінки, і (2) вона дає ІС, які видалили мінливість, пов’язану з мінливістю між учасниками. # 2 означає, що вам не потрібно створювати кілька сюжетів, коли ви хочете показати необроблені дані та ефект повторних заходів; ви можете просто побудувати ці інтерфейси, видалені між варіантами, на вихідних даних, і вони будуть доречні для порівняння умов, повторених у особи. За умови, що може виникнути плутанина в значенні таких інтерфейсів, але саме для цього використовуються підписи.
Майк Лоуренс

@John: Не могли б ви детальніше розглянути свої побоювання щодо застосованості такого підходу до біноміальних даних?
Майк Лоуренс

Відповіді:


-1

Моя книга Bootstrap Methods 2nd Edition має велику бібліографію до 2007 року. Тож навіть якщо я не висвітлюю тему книги, посилання може бути в бібліографії. Звичайно, пошук Google з правильними ключовими словами може бути кращим. Фрідман, Пітерс і Навіді зробили завантаження для прогнозування лінійної регресії та економетричної моделі, але я не впевнений, що було зроблено у випадку змішаної моделі. Stine's 1985 JASA paper Paint Bootstrap передбачення регресії - це те, що вам буде дуже цікавим, якщо ви ще цього не бачили.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.