Тож я розумію, що вибір змінних є частиною вибору моделі. Але з чого саме складається вибір моделі? Це більше ніж наступне:
1) виберіть дистрибутив для вашої моделі
2) вибрати пояснювальні змінні,?
Я запитую це, тому що я читаю статтю Burnham & Anderson: AIC vs BIC, де вони говорять про AIC та BIC при виборі моделі. Читаючи цю статтю, я розумію, що я вважаю "вибір моделі" як "змінний вибір" (посилання на коментарі Чи BIC намагається знайти справжню модель? )
Уривок із статті, де вони розповідають про 12 моделей із зростаючим ступенем «загальності», і ці моделі показують «звужуючі ефекти» (рис. 1), коли KL-Information будується проти 12 моделей:
РІЗНІ ФІЛОСОФІЇ ТА ЦІЛЬНІ МОДЕЛИ ... Незважаючи на те, що ціль BIC є більш загальною моделлю, ніж цільова модель для AIC, модель, яку найчастіше вибрали BIC, буде менш загальною, ніж модель 7, якщо n не дуже велика. Це може бути Модель 5 або 6. Відомо (з численних статей та моделювання в літературі), що в контексті зменшення ефектів (мал. 1) AIC працює краще, ніж BIC. Якщо це контекст реального аналізу даних, тоді слід використовувати AIC.
Як BIC може колись вибрати модель, більш складну, ніж AIC у виборі моделі, я не розумію! Що конкретно означає "вибір моделі" і коли конкретно BIC обирає більш "загальну" модель, ніж AIC?
Якщо ми говоримо про вибір змінних, то BIC, безумовно, повинен завжди вибирати модель з найменшою кількістю змінних, правильно? Термін в BIC завжди буде штрафувати додані змінні більше, ніж член в AIC. Але чи це нерозумно, коли « ціль BIC є більш загальною моделлю, ніж цільова модель для AIC »?
Редагувати :
З обговорення в коментарях у " Чи є якась причина віддавати перевагу AIC або BIC перед іншими? ми бачимо невелику дискусію між @Michael Chernick та @ user13273 в коментарях, що спонукає мене повірити, що це щось, що не настільки тривіально:
Я вважаю, що доцільніше назвати це обговорення як "функціональний" вибір або "коваріаційний" вибір. Для мене вибір моделей набагато ширший, включаючи конкретизацію розподілу помилок, форму функції зв’язку та форму коваріатів. Коли ми говоримо про AIC / BIC, ми зазвичай опиняємося в ситуації, коли всі аспекти побудови моделі є фіксованими, крім вибору коваріатів. - user13273 13 серпня '12 о 21:17
Вирішення конкретних коваріатів для включення в модель звичайно відбувається шляхом вибору моделі терміна, і існує ряд книг з вибором моделі в заголовку, які в першу чергу визначають, яку модель коваріатів / параметрів включати в модель. - Майкл Черник 24 серпня 1212 о 14:44