Для обчислення модельованих усереднених прогнозів за шкалою відгуку в GLM, що є "правильним" і чому?
- Обчислюють модельне усереднене прогнозування за шкалою зв’язку, а потім зворотним перетворенням на шкалу відповідей, або
- Назад перетворіть прогнози на шкалу відгуку, а потім обчисліть середню модель
Прогнози близькі, але не рівні, якщо модель є GLM. Різні пакети R дають варіанти для обох (з різними значеннями за замовчуванням). Кілька колег голосно стверджували, що №1 - це неправильно, оскільки "всі роблять №2". Моя інтуїція говорить про те, що №1 є "правильним", оскільки він тримає всю лінійну математику лінійною (№2 - це середнє, що не є лінійним масштабом). Просте моделювання виявляє, що №2 має дуже (дуже!) Трохи менший MSE, ніж №1. Якщо №2 правильний, в чому причина? І, якщо №2 є правильним, чому моя причина (тримати лінійну математичну лінійну) погана аргументація?
Редагувати 1: Обчислення граничних значень для рівнів іншого фактора в GLM є подібною проблемою до питання, яке я задаю вище. Рассел Лент обчислює граничні засоби моделей GLM, використовуючи "таймінги" (його слова) №1 (у пакеті emmeans), і його аргумент схожий на мою інтуїцію.
Редагувати 2: Я використовую усереднення моделей для позначення альтернативи вибору моделі, де прогнозування (або коефіцієнт) оцінюється як середньозважене серед усіх або підмножина "найкращих" вкладених моделей (див. Посилання та пакети R нижче) .
З огляду на вкладені моделі, де є лінійним прогнозуванням (у просторі посилань) для індивідуального для моделі , а - вага для моделі , середньостатистичне прогнозування з використанням №1 вище (середнє значення за посиланням масштаб, а потім зворотне перетворення шкали відповідей):
а середньостатистичне прогнозування з використанням №2 вище (зворотне перетворення всіх прогнозів та середнє значення за шкалою відповідей):
Деякі методи баєсіанських та частотологічних моделей усереднення моделей:
Hoeting, JA, Madigan, D., Raftery, AE and Volinsky, CT, 1999. Байєсівська модель усереднення: навчальний посібник. Статистична наука, с.382-401.
Burnham, KP та Anderson, DR, 2003. Вибір моделі та мультимодельний висновок: практичний інформаційно-теоретичний підхід. Springer Science & Business Media.
Hansen, BE, 2007. Середнє моделювання середніх квадратів. Економетрика, 75 (4), стор.1175-1189.
Claeskens, G. and Hjort, NL, 2008. Вибір моделі та усереднення моделі. Кембриджські книги.
Пакети R включають BMA , MuMIn , BAS та AICcmodavg . (Примітка. Це не питання про розумність усереднення моделей загалом.)