Для середнього моделювання GLM ми оцінюємо прогнози за шкалою зв'язку або відповідей?


12

Для обчислення модельованих усереднених прогнозів за шкалою відгуку в GLM, що є "правильним" і чому?

  1. Обчислюють модельне усереднене прогнозування за шкалою зв’язку, а потім зворотним перетворенням на шкалу відповідей, або
  2. Назад перетворіть прогнози на шкалу відгуку, а потім обчисліть середню модель

Прогнози близькі, але не рівні, якщо модель є GLM. Різні пакети R дають варіанти для обох (з різними значеннями за замовчуванням). Кілька колег голосно стверджували, що №1 - це неправильно, оскільки "всі роблять №2". Моя інтуїція говорить про те, що №1 є "правильним", оскільки він тримає всю лінійну математику лінійною (№2 - це середнє, що не є лінійним масштабом). Просте моделювання виявляє, що №2 має дуже (дуже!) Трохи менший MSE, ніж №1. Якщо №2 правильний, в чому причина? І, якщо №2 є правильним, чому моя причина (тримати лінійну математичну лінійну) погана аргументація?

Редагувати 1: Обчислення граничних значень для рівнів іншого фактора в GLM є подібною проблемою до питання, яке я задаю вище. Рассел Лент обчислює граничні засоби моделей GLM, використовуючи "таймінги" (його слова) №1 (у пакеті emmeans), і його аргумент схожий на мою інтуїцію.

Редагувати 2: Я використовую усереднення моделей для позначення альтернативи вибору моделі, де прогнозування (або коефіцієнт) оцінюється як середньозважене серед усіх або підмножина "найкращих" вкладених моделей (див. Посилання та пакети R нижче) .

З огляду на вкладені моделі, де є лінійним прогнозуванням (у просторі посилань) для індивідуального для моделі , а - вага для моделі , середньостатистичне прогнозування з використанням №1 вище (середнє значення за посиланням масштаб, а потім зворотне перетворення шкали відповідей):Mηimimwmm

Y^i=г-1(м=1Мшмηiм)

а середньостатистичне прогнозування з використанням №2 вище (зворотне перетворення всіх прогнозів та середнє значення за шкалою відповідей):М

Y^i=м=1Мшмг-1(ηiм)

Деякі методи баєсіанських та частотологічних моделей усереднення моделей:

  • Hoeting, JA, Madigan, D., Raftery, AE and Volinsky, CT, 1999. Байєсівська модель усереднення: навчальний посібник. Статистична наука, с.382-401.

  • Burnham, KP та Anderson, DR, 2003. Вибір моделі та мультимодельний висновок: практичний інформаційно-теоретичний підхід. Springer Science & Business Media.

  • Hansen, BE, 2007. Середнє моделювання середніх квадратів. Економетрика, 75 (4), стор.1175-1189.

  • Claeskens, G. and Hjort, NL, 2008. Вибір моделі та усереднення моделі. Кембриджські книги.

Пакети R включають BMA , MuMIn , BAS та AICcmodavg . (Примітка. Це не питання про розумність усереднення моделей загалом.)


1
Я підозрюю, що причина, коли ваше запитання не отримує відповідей, полягає в тому, що інші читачі, як я, не розуміють вашого питання. Що ви маєте на увазі саме під "моделюванням усереднення"? Опишіть детально контекст, щоб ми зрозуміли, яку проблему ви намагаєтеся вирішити. Наскільки я бачу, пакет emmeans не дає середніх прогнозів для різних моделей.
Гордон Сміт

1
Дякую за запитання, і я можу помітити, що додавання ноти Рассела Лента бентежить моє запитання. Я намагався уточнити це вище. Пакет emmeans обчислює граничні засоби та SE над рівнями іншого чинника, і ця статистика обчислюється за шкалою зв'язку і потім перетворюється назад. Дивіться розділ «Модель - наш найкращий посібник» .
JWalker

Мені б дуже цікаві відповіді на це питання. Тим часом, коментар. Цей результат MSE обчислюється за зворотно-трансформованою шкалою. Я б погодився, що при тих же результатах моделювання, MSE, обчислюючись за шкалою посилань, буде меншою за №1, ніж для №2. Причина полягає в тому, що середня вибірка - це оцінка найменших квадратів середньої сукупності, навіть у неправильній шкалі.
Russ Lenth

Відповіді:


6

Оптимальний спосіб поєднання оцінок чи прогнокторів залежить від функції втрат, яку ви намагаєтеся мінімізувати (або корисної функції, яку ви намагаєтеся максимально використовувати).

Взагалі кажучи, якщо функція втрат вимірює помилки прогнозування за шкалою відгуку, то середнє прогнозування за шкалою відповідей виправляє. Якщо, наприклад, ви прагнете мінімізувати очікувану помилку прогнозу в квадраті за шкалою відповідей, тоді передній середній прогноз буде оптимальним і, залежно від ваших припущень моделі, може бути еквівалентним усередненню прогнозів за шкалою відгуку.

Зауважимо, що усереднення за лінійною шкалою предиктора може бути дуже поганим для дискретних моделей. Припустимо, що ви використовуєте логістичну регресію для прогнозування ймовірності бінарної змінної відповіді. Якщо будь-яка з моделей дає оцінну ймовірність нуля, то лінійний предиктор для цієї моделі буде мінус нескінченність. Прийняття середнього значення нескінченності з будь-якою кількістю кінцевих значень все одно буде нескінченним.

Чи консультувались ви зі списками, які ви перераховуєте? Я впевнений, що, наприклад, Hoeting et al (1999) обговорюють функції втрат, хоча, можливо, не дуже детально.


1
Відмінно. Дякую за цю відповідь (вітаю інших!). Я припускаю, що "тоді усереднення прогнозів, ймовірно, буде оптимальним або близьким до нього" - це усереднення прогнозів за шкалою відповідей. Особливо корисна логістична записка.
JWalker

1
@rvl Щодо лінійності функції втрат, я думав з точки зору функції впливу втрат. Я погоджуюся, що це трохи виразно, тому я відредагував свої коментарі. Я повинен не погодитися з вашими іншими зауваженнями. ГЛМ оцінюються за МЛ, а не по квадратичних втратах. Незважаючи на назву, популярний для GLM алгоритм IRLS не зводить до мінімуму суму квадратів, а робоча змінна IRLS включає стандартизовані залишки за шкалою відповіді, а не шкалою зв'язку. У будь-якому випадку, оцінка і прогнозування не є однаковими і не потрібно мати однакові функції втрат.
Гордон Сміт

@rvl Точні нульові значення часто зустрічаються в рамках логістичної регресії і обговорювалися на цьому форумі кілька разів.
Гордон Сміт

@rvl Втрати не оцінюються за шкалою посилань. Ця дискусія не є правильним місцем для того, щоб запропонувати вам підручник з GLM - я натомість посилаюсь на мою книгу про GLM, яку Springer опублікує приблизно за місяць. Також ця дискусія не є правильним місцем для того, щоб запропонувати альтернативну відповідь на початкове запитання. Напишіть належну відповідь, якщо ви хочете це зробити.
Гордон Сміт

Ось посилання на нашу книгу про GLM: doi.org/10.1007/978-1-4419-0118-7
Gordon Smyth
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.