Чи можливо, що AIC та BIC дають абсолютно різні вибірки?


12

Я виконую модель регресії Пуассона з 1 змінною відгуку та 6 коваріатами. Вибір моделі з використанням AIC призводить до моделі з усіма коваріатами, а також 6 термінами взаємодії. Однак BIC приводить до моделі, що має лише 2 коваріати та відсутні умови взаємодії. Чи можливо, що два критерії, які дуже схожі, дають абсолютно різні вибірки?


6
Якби не вдалося отримати різні рекомендації щодо моделей з двох показників, то не було б двох показників, ми б просто завжди використовували одну.
Грегор Томас

Слово "абсолютно інше" важко інтерпретувати, коли моделі є результатом вибору з набору дискретних параметрів.
BallpointBen

Відповіді:


21

Це справді можливо. Як пояснено на https://methodology.psu.edu/AIC-vs-BIC , "BIC більш серйозно карає складність моделі. Єдиний спосіб, з яким вони не повинні погодитися, це коли AIC обирає більшу модель, ніж BIC".

Якщо ваша мета - визначити хорошу модель прогнозування, вам слід використовувати АПК. Якщо ваша мета - визначити хорошу пояснювальну модель, вам слід скористатися BIC. Роб Хайндман чудово узагальнив цю рекомендацію на
https://robjhyndman.com/hyndsight/to-explain-or-predict/ :

"AIC краще підходить для вибору моделі для прогнозування, оскільки він асимптотично еквівалентний перехресній валідації" один-один "в регресії або одношаговій перехресній валідації у часових рядах. З іншого боку, можна стверджувати, що BIC краще підходить для вибору моделі для пояснення, оскільки це послідовно ".

Рекомендація виходить із статті Галіта Шмулі «Пояснити чи передбачити?», Статистична наука, 25 (3), 289-310 ( https://projecteuclid.org/euclid.ss/1294167961 ).

Додаток:

Існує третій тип моделювання - описове моделювання, але я не знаю жодних посилань на те, який з AIC або BIC найкраще підходить для визначення оптимальної описової моделі. Я сподіваюся, що інші тут можуть зазивати зі своїми ідеями.


6
" Єдиний спосіб, з яким вони не погоджуються, - це коли AIC обирає більшу модель, ніж BIC. "Технічно BIC може вибрати більшу модель, якщо , тобто . Сподіваємось, зразки розміру 7 не є надто великою проблемою. : pn 7lnn<2n7
Дугал

Гарна думка! З розміром вибірки 7 або менше, я думаю, що вибір моделі не входить у таблицю. 😀
Ізабелла Ґхемент

Існує третій тип моделювання - описове моделювання, але я не знаю жодних посилань на те, який з AIC або BIC найкраще підходить для визначення оптимальної описової моделі. Я сподіваюся, що інші тут можуть зазивати зі своїми ідеями. Це відповідь чи питання?
Subhash C. Davar

@ subhashc.davar: Ще немає відповіді - я спокусився надіслати електронною поштою Галіт Шмулі та попросити її думати з цього приводу.
Ізабелла Гемен

1
Якщо ми розуміємо значення «описового» та сприймаємо це серйозно, я не впевнений, що має сенс говорити про визначення оптимальної описової моделі.
gung - Відновіть Моніку

11

Коротка відповідь: так, це дуже можливо. Два застосовують різні штрафи, виходячи з кількості оцінених параметрів (2k для AIC проти ln (n) xk для BIC, де k - кількість оцінюваних параметрів, а n - розмір вибірки). Таким чином, якщо коефіцієнт приросту ймовірності від додавання параметра невеликий, BIC може вибирати різні моделі до AIC. Однак цей ефект залежить від розміру вибірки.


2
Непогано було б чітко сказати, що n - розмір вибірки у наведеному вище рівнянні
fabiob
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.