Я б стверджував, що принаймні при обговоренні лінійних моделей (на зразок моделей AR), скориговані та AIC не так вже й відрізняються.R2
Розглянемо питання, чи слід включати у
Це еквівалентно порівнянню моделі
де . Ми говоримо, що - справжня модель, якщо . Зауважте, що . Таким чином, моделі вкладені в гніздо . Процедура вибору моделі - це залежне від даних правило, яке вибирає найбільш правдоподібну з декількох моделей.X2
y=X1(n×K1)β1+X2(n×K2)β2+ϵ
M1M2::y=X1β1+uy=X1β1+X2β2+u,
E(u|X1,X2)=0M2β2≠0M1⊂M2Mˆ
Ми говоримо
є послідовним , якщо
Mˆ
limn→∞P(Mˆ=M1|M1)limn→∞P(Mˆ=M2|M2)==11
Розглянемо скоригований . Тобто виберіть якщо . Оскільки монотонно зменшується в , ця процедура еквівалентна мінімізації . У свою чергу це еквівалентно мінімізації . Для досить великих останній може бути записаний як
деR2M1R¯21>R¯22R¯2s2s2log(s2)n
log(s2)==≈≈log(σˆ2nn−K)log(σˆ2)+log(1+Kn−K)log(σˆ2)+Kn−Klog(σˆ2)+Kn,
σˆ2є оцінкою ML дисперсії помилок. Отже, вибір моделі на основі асимптотично еквівалентний вибору моделі з найменшим
. Ця процедура непослідовна.
R¯2log(σˆ2)+K/n
Пропозиція :
limn→∞P(R¯21>R¯22|M1)<1
Доказ :
де випливає другий рядок, оскільки статистика є статистикою LR у випадку лінійної регресії, що слідує за асимптотикою нульовий розподіл. QED
P(R¯21>R¯22|M1)≈=≈=→<P(log(s21)<log(s22)|M1)P(nlog(s21)<nlog(s22)|M1)P(nlog(σˆ21)+K1<nlog(σˆ22)+K1+K2|M1)P(n[log(σˆ21)−log(σˆ22)]<K2|M1)P(χ2K2<K2)1,
χ2K2
Тепер розглянемо критерій Akaike,
Таким чином, АПК також торгує зменшенням SSR, що має на увазі додаткові регресори, проти "штрафного строку , "який вказує у зворотному напрямку. Таким чином, виберіть якщо
, інше виберіть .
AIC=log(σˆ2)+2Kn
M1AIC1<AIC2M2
Видно, що також суперечить продовженню вищезазначеного доказу в третьому рядку з . Відрегульований та таким чином вибирають "велику" модель з позитивною ймовірністю, навіть якщо є справжньою моделлю.AICP(nlog(σˆ21)+2K1<nlog(σˆ22)+2(K1+K2)|M1)R2AICM2M1
Оскільки штраф за складність в AIC трохи більший, ніж для скоригованого , він може бути менш схильним до перевибору. І він має інші приємні властивості (мінімізуючи розбіжність KL до справжньої моделі, якщо цього немає в наборі розглянутих моделей), які не розглядаються в моєму дописі.R2