Не можна порівнювати абсолютні значення двох АПК (які можуть бути як але також ), але розглядає їх різницю :
де - AIC з -та модель, а - найнижча AIC, отримана серед набору досліджуваних моделей (тобто, краща модель). Основне правило, окреслене, наприклад, у Burnham & Anderson 2004 , таке:∼ 1000000 Δ i = A I C i - A I C m i n , A I C i i A I C m i n∼ 100∼ 1000000
Δi= А яСi- А яСм я н,
А яСiiА яСм я н
- якщо , то існує істотна підтримка ї моделі (або докази проти неї варто лише згадати), і твердження про те, що це правильний опис, дуже вірогідне;iΔi< 2i
- якщо , то є сильна підтримка ї моделі;i2 < Δi< 4i
- якщо , тоді значно менша підтримка ї моделі;i4 < Δi< 7i
- моделі з по суті не мають підтримки.Δi> 10
Тепер щодо 0,7%, зазначених у питанні, розглянемо дві ситуації:
- А яС1= А яСм я н= 100 а більший на 0,7%: . Тоді тому істотної різниці між моделями немає.А яС2А яС2= 100,7Δ2= 0,7 < 2
- А яС1= А яСм я н= 100000 а більший на 0,7%: . Тоді тому немає підтримки для другої моделі.А яС2А яС2= 100700Δ2= 700 ≫ 10
Отже, мовляв, що різниця між АПК становить 0,7%, не дає жодної інформації.
Значення AIC містить константи масштабування, що надходять від вірогідності журналу
, і тому не містять таких констант. Можна вважати перетворення масштабу, що змушує найкращу модель мати .LΔiΔi=AICi−AICminAICmin:=0
Рецептура AIC карає використання надмірної кількості параметрів, отже, перешкоджає надмірному застосуванню. Він віддає перевагу моделям із меншою кількістю параметрів до тих пір, поки інші не забезпечують значно кращого пристосування. АПК намагається вибрати модель (серед обстежених), яка найбільш адекватно описує реальність (у формі даних, що перевіряються). Це означає, що насправді модель, яка є реальним описом даних, ніколи не розглядається. Зауважте, що AIC дає вам інформацію, яка модель краще описує дані, вона не дає тлумачення .
Особисто я хотів би сказати, що якщо у вас є проста модель і складна, яка має набагато менший AIC, то проста модель недостатньо хороша. Якщо більш складна модель дійсно набагато складніша, але не величезна (можливо, , можливо - залежить від конкретної ситуації), я б дотримувався більш простої моделі, якщо з нею дійсно простіше працювати .ΔiΔi<2Δi<5
Далі ви можете віднести ймовірність до ї моделі черезi
pi=exp(−Δi2),
що забезпечує відносну (порівняно з ) ймовірність того, що -та модель мінімізує AIC. Наприклад, відповідає (досить високий), а відповідає (досить низький). Перший випадок означає, що існує 47% ймовірність того, що -та модель насправді може бути кращим описом, ніж модель, яка дала , а у другому випадку ця ймовірність становить лише 0,05%. i Δ i = 1,5 p i = 0,47 Δ i = 15 p i = 0,0005 i A I C m i nAICminiΔi=1.5pi=0.47Δi=15pi=0.0005iAICmin
Нарешті, стосовно формули для AIC:
AIC=2k−2L,
важливо зазначити, що при розгляді двох моделей з подібними залежить виключно від кількості параметрів через термін . Отже, коли , відносне поліпшення зумовлене фактичним поліпшенням пристосування, а не збільшенням кількості лише параметрів.Δ i 2 k Δ iLΔi2kΔi2Δk<1
TL; DR
- Це погана причина; використовувати різницю між абсолютними значеннями АПК.
- Процент не каже нічого.
- Неможливо відповісти на це питання через відсутність інформації про моделі, дані та те, що означають різні результати .