Як порівняти моделі на основі AIC?


15

У нас є дві моделі, які використовують один і той же метод для обчислення ймовірності журналу, і AIC для однієї нижче, ніж для іншої. Однак той із нижчим АПК інтерпретувати набагато складніше.

У нас виникають проблеми вирішити, чи варто ввести труднощі, і ми оцінили це, використовуючи відсоткову різницю в АПК. Ми виявили, що різниця між цими двома АПК становила лише 0,7%, при цьому більш складна модель має на 0,7% нижчу АПК.

  1. Чи є низька відсоткова різниця між цими двома вагомими причинами уникати використання моделі з нижчим AIC?

  2. Чи пояснює відсоток різниці, що в менш складній моделі втрачається 0,7% більше інформації?

  3. Чи можуть дві моделі мати дуже різні результати?



2
@ArunJose, здається, це не дублікат. Питання тут зовсім інші.
Річард Харді

1
Ні. Це питання не стосується порівнянності моделей. Ми вже знаємо, що моделі порівнянні. Це питання стосується того, що вважається суттєвою різницею в АПК та компромісі між складністю та моделлю.
Алі Тураб Лотія

Відповіді:


27

Не можна порівнювати абсолютні значення двох АПК (які можуть бути як але також ), але розглядає їх різницю : де - AIC з -та модель, а - найнижча AIC, отримана серед набору досліджуваних моделей (тобто, краща модель). Основне правило, окреслене, наприклад, у Burnham & Anderson 2004 , таке:1000000 Δ i = A I C i - A I C m i n , A I C i i A I C m i n1001000000

Δi=AICiAICmin,
AICiiAICmin
  1. якщо , то існує істотна підтримка ї моделі (або докази проти неї варто лише згадати), і твердження про те, що це правильний опис, дуже вірогідне;iΔi<2i
  2. якщо , то є сильна підтримка ї моделі;i2<Δi<4i
  3. якщо , тоді значно менша підтримка ї моделі;i4<Δi<7i
  4. моделі з по суті не мають підтримки.Δi>10

Тепер щодо 0,7%, зазначених у питанні, розглянемо дві ситуації:

  1. AIC1=AICmin=100 а більший на 0,7%: . Тоді тому істотної різниці між моделями немає.AIC2AIC2=100.7Δ2=0.7<2
  2. AIC1=AICmin=100000 а більший на 0,7%: . Тоді тому немає підтримки для другої моделі.AIC2AIC2=100700Δ2=70010

Отже, мовляв, що різниця між АПК становить 0,7%, не дає жодної інформації.

Значення AIC містить константи масштабування, що надходять від вірогідності журналу , і тому не містять таких констант. Можна вважати перетворення масштабу, що змушує найкращу модель мати .LΔiΔi=AICiAICminAICmin:=0

Рецептура AIC карає використання надмірної кількості параметрів, отже, перешкоджає надмірному застосуванню. Він віддає перевагу моделям із меншою кількістю параметрів до тих пір, поки інші не забезпечують значно кращого пристосування. АПК намагається вибрати модель (серед обстежених), яка найбільш адекватно описує реальність (у формі даних, що перевіряються). Це означає, що насправді модель, яка є реальним описом даних, ніколи не розглядається. Зауважте, що AIC дає вам інформацію, яка модель краще описує дані, вона не дає тлумачення .

Особисто я хотів би сказати, що якщо у вас є проста модель і складна, яка має набагато менший AIC, то проста модель недостатньо хороша. Якщо більш складна модель дійсно набагато складніша, але не величезна (можливо, , можливо - залежить від конкретної ситуації), я б дотримувався більш простої моделі, якщо з нею дійсно простіше працювати .ΔiΔi<2Δi<5

Далі ви можете віднести ймовірність до ї моделі черезi

pi=exp(Δi2),

що забезпечує відносну (порівняно з ) ймовірність того, що -та модель мінімізує AIC. Наприклад, відповідає (досить високий), а відповідає (досить низький). Перший випадок означає, що існує 47% ймовірність того, що -та модель насправді може бути кращим описом, ніж модель, яка дала , а у другому випадку ця ймовірність становить лише 0,05%. i Δ i = 1,5 p i = 0,47 Δ i = 15 p i = 0,0005 i A I C m i nAICminiΔi=1.5pi=0.47Δi=15pi=0.0005iAICmin

Нарешті, стосовно формули для AIC:

AIC=2k2L,

важливо зазначити, що при розгляді двох моделей з подібними залежить виключно від кількості параметрів через термін . Отже, коли , відносне поліпшення зумовлене фактичним поліпшенням пристосування, а не збільшенням кількості лише параметрів.Δ i 2 k Δ iLΔi2kΔi2Δk<1

TL; DR

  1. Це погана причина; використовувати різницю між абсолютними значеннями АПК.
  2. Процент не каже нічого.
  3. Неможливо відповісти на це питання через відсутність інформації про моделі, дані та те, що означають різні результати .

2
Це найяскравіше пояснення, яке я коли-небудь бачив у цій загадковій справі. Я переглянув статтю, на яку ви згадували (с. 270-272), і ваше пояснення тут - це просте і чітке, але дуже точне представлення того, що пояснюється у статті.
Tripartio

Чи можете ви допомогти у цьому подальшому питанні? stats.stackexchange.com/questions/349883 / ...
Tripartio
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.