Інтерпретація номерів AIC та BIC


23

Я шукаю приклади, як інтерпретувати оцінки AIC (інформаційний критерій Akaike) та BIC (байєсівський інформаційний критерій).

Чи можна негативну різницю між BIC інтерпретувати як задні шанси однієї моделі над іншою? Як я можу це поставити словами? Наприклад, BIC = -2 може означати, що шанси на кращу модель порівняно з іншою моделлю приблизно ?е2=7.4

Будь-яка основна порада оцінена цим неофітом.


Погляньте на розділ 2. Розділ 2.6 - який частково доступний для книг Google - може, зокрема, допомогти вам. books.google.se/… (Посилання: Вибір моделі та багатомодельний висновок Кеннета П. Бернхема та Девіда Р. Андерсона. Спрингер Верлаг)
boscovich

Відповіді:


6

для моделі я запріорноїмоделі безлічі може бути recaled до А я = A I C я - м я п я З , де краща модель безлічі моделі матиме Д = 0 . Ми можемо використовувати значення Δ i для оцінки сили доказів ( w i ) для всіх моделей набору моделей, де: w i = e ( - 0,5 Δ i )AICiΔi=АЯСi-мiнАЯСΔ=0Δiшi Це часто називають "вагою доказів" для моделіi зурахуваннямнаборуапріорнихмоделей. ІззбільшеннямΔi,wiзменшується, припускаючи, що модельiє менш правдоподібною. Цізначенняwiможна інтерпретувати як ймовірність того, що модельiє найкращою моделлю з урахуваннямнаборуапріорнихмоделей. Можна також розрахувати відносну ймовірність моделіiпорівняно з моделлюjяк

шi=е(-0,5Δi)r=1Rе(-0,5Δi).
iΔiшiiшiiij . Наприклад, якщо w i = 0,8 і w j = 0,1, то можна сказати, що модель i в 8 разів частіше, ніж модель j .шi/шjшi=0,8шj=0,1ij

Зауважимо, коли модель 1 - найкраща модель (найменша A I C ). Бернхем і Андерсон (2002) називають це співвідношенням доказів. Ця таблиця показує, як змінюється коефіцієнт доказів щодо найкращої моделі.ш1/ш2=е0,5Δ2АЯС

Information Loss (Delta)    Evidence Ratio
0                           1.0
2                           2.7
4                           7.4
8                           54.6
10                          148.4
12                          403.4
15                          1808.0

Довідково

Бернхем, КП та Андерсон. 2002. Вибір моделі та мультимодельний висновок: практичний інформаційно-теоретичний підхід. Друге видання. Спрингер, Нью-Йорк, США.

Anderson, DR 2008. Модель, заснована на висновках з наук про життя: буквар на докази. Спрингер, Нью-Йорк, США.


rR

У наборі моделей є моделі R.
RioRaider

3

Я не думаю, що існує така проста інтерпретація AIC або BIC. Вони обидві величини, які приймають вірогідність журналу і застосовують до нього штраф за кількість оцінюваних параметрів. Конкретні покарання для AIC пояснюються Akaike у своїх роботах, починаючи з 1974 року. BIC був обраний Гедеоном Шварцом у своїй роботі 1978 року і мотивований байесівським аргументом.


2
Однак покарання може трактуватися як попереднє перевагу моделей певного розміру. Якщо вам трапиться прийняти це попереднє (яке має деякі теоретико-теоретичні обгрунтування), то ви можете обчислити коефіцієнт заднього шансу безпосередньо із значень ІС. Також @RioRaider згадує ваги Akaike, які дають вам ймовірність того, що дана модель є найкращою моделлю з набору з точки зору розбіжності KL. ( див. - див. стор. 800).
Девід Дж. Харріс

1

Ви, ймовірно, використовуєте BIC в результаті наближення до коефіцієнта Байєса. Тому ви не вважаєте (більш-менш) попередній розподіл. BIC на етапі вибору моделі корисний при порівнянні моделей. Щоб повністю зрозуміти BIC, фактор Байєса я настійно рекомендую прочитати статтю (розд. 4): http://www.stat.washington.edu/raftery/Research/PDF/socmeth1995.pdf, щоб доповнити знання за допомогою: http: // www .stat.washington.edu / raftery / Дослідження / PDF / kass1995.pdf

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.