Чому завантажувальне використання залишків із моделі змішаних ефектів дає антиконсервативні довірчі інтервали?


11

Зазвичай я маю справу з даними, де кілька осіб вимірюються кілька разів у кожному з двох або більше умов. Я нещодавно грав із моделюванням змішаних ефектів, щоб оцінити докази відмінностей між умовами, моделюючи individualяк випадковий ефект. Для візуалізації невизначеності щодо прогнозів такого моделювання я використовував завантажувальний запуск, де на кожній ітерації завантажувального пристрою обидва особи та спостереження в межах умов відбираються з заміною, і нова модель змішаного ефекту обчислюється, з якої прогнози отримуються. Це чудово працює для даних, які передбачають гауссова помилка, але коли дані є біноміальними, завантажувальна завантаження може зайняти дуже багато часу, оскільки кожна ітерація повинна обчислити порівняно інтенсивно обчислювану біноміальну модель змішаних ефектів.

Я вважав, що я міг би використовувати залишки з оригінальної моделі, а потім використовувати ці залишки замість необроблених даних під час завантаження, що дозволило б мені обчислити гауссову модель змішаного ефекту для кожної ітерації завантажувальної програми. Додавання оригінальних прогнозів із біноміальної моделі необроблених даних до завантажених прогнозів із залишків дає 95% ДІ для вихідних прогнозів.

Однак я нещодавно зашифрував просту оцінку цього підходу, моделюючи різницю між двома умовами та обчислюючи частку разів 95-відсоткового довірчого інтервалу не вдалося включити нуль, і я виявив, що вищезазначена процедура завантаження на основі залишків дає досить сильну анти- консервативні інтервали (вони виключають нуль більше 5% часу). Крім того, я кодував (за тим самим посиланням, що і попередній) аналогічну оцінку цього підходу, що застосовувався до даних, які спочатку були гауссовими, і він отримав аналогічно (хоча і не настільки крайні) антиконсервативні КІ. Будь-яка ідея, чому це може бути?


Хм, я щойно помітив, що в коді, що генерує дані для обох випадків, я фактично не додав будь-якої мінливості між окремими людьми, яку, як правило, цікавить усунення шляхом моделювання людей як випадкових ефектів. Я побачу, чи додавання цієї змінності змінить результат; назад через кілька годин ...
Майк Лоуренс

Якщо я правильно пам'ятаю, bootstrap робить оцінку ближчою до справжньої оцінки населення. Про інтервал довіри нічого не сказано. (пор. Кесар Сінгх, Про асимптотичну точність завантажувального апарату Ефрона. Ann. Statist., 1981, 9, 1187-1195)
suncoolsu

@me: Я можу підтвердити, що додавання змінності між індивідами у функції генерування даних не покращує продуктивність завантажувальної програми. Я завантажив код, який використовував для підтвердження цього, до суті, пов’язаної в оригінальній публікації.
Майк Лоуренс

@suncoolsu: Я майже впевнений, що інтервали довіри, що завантажуються, є стандартними протягом досить тривалого часу. Ефрон згадує їх у своїй статті 1978 р., Яка описує процедуру завантаження, як правило, тоді він мав купу паперів у 80-х та 90-х роках, коли були налаштовані процедури завантаження для більш точних інтервалів довіри (корекція зміщення, акселерація, студентизування тощо).
Майк Лоуренс

1
Чи читали ви наступний документ Морріса: "BLUPs не найкращі, коли справа стосується завантаження". Це може стосуватися вашої роботи. посилання
липень

Відповіді:


7

Пам’ятайте, що всі довірчі інтервали завантажувальної програми є лише асимптотично на зазначеному рівні довіри. Існує також низка можливих методів вибору довірчих інтервалів завантажувальної стрічки Метод перцентиля Ефрона, метод перцентиля Холла, подвійний завантажувальний запуск, завантажувальний t, нахилений завантажувальний пристрій, BC, BCa і, можливо, ще кілька. Ви не сказали нам, який метод ви використовуєте. Доповідь Шенкера в JASA 1985 показала, що для певних розподілів квадратних чі, інтервал довіри завантажувальної стрічки BC не охоплював рекламований відсоток. При невеликих розмірах вибірки ця проблема може бути серйозною. У мене з Лабудд є два документи, які показують, як у невеликих зразках навіть BCa може мати дуже слабке покриття при оцінці відхилення від лонормального розподілу, і існує аналогічна проблема для тестування рівності двох дисперсій. Це просто для простої проблеми. Я очікую, що те ж саме може трапитися і із залишками змішаних моделей. У нашій новій книзі «Вступ до методів завантаження з додатками до R», опублікованій Wiley в 2011 році, ми висвітлюємо цю тему в Розділі 3.7 та надаємо посилання. Несподіванкою є те, що метод процентилів іноді справляється краще, ніж точний метод BCa вищого порядку, коли розмір вибірки невеликий.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.