Варіабельний вибір та вибір моделі


12

Тож я розумію, що вибір змінних є частиною вибору моделі. Але з чого саме складається вибір моделі? Це більше ніж наступне:

1) виберіть дистрибутив для вашої моделі

2) вибрати пояснювальні змінні,?

Я запитую це, тому що я читаю статтю Burnham & Anderson: AIC vs BIC, де вони говорять про AIC та BIC при виборі моделі. Читаючи цю статтю, я розумію, що я вважаю "вибір моделі" як "змінний вибір" (посилання на коментарі Чи BIC намагається знайти справжню модель? )

Уривок із статті, де вони розповідають про 12 моделей із зростаючим ступенем «загальності», і ці моделі показують «звужуючі ефекти» (рис. 1), коли KL-Information будується проти 12 моделей:

РІЗНІ ФІЛОСОФІЇ ТА ЦІЛЬНІ МОДЕЛИ ... Незважаючи на те, що ціль BIC є більш загальною моделлю, ніж цільова модель для AIC, модель, яку найчастіше вибрали BIC, буде менш загальною, ніж модель 7, якщо n не дуже велика. Це може бути Модель 5 або 6. Відомо (з численних статей та моделювання в літературі), що в контексті зменшення ефектів (мал. 1) AIC працює краще, ніж BIC. Якщо це контекст реального аналізу даних, тоді слід використовувати AIC.

Як BIC може колись вибрати модель, більш складну, ніж AIC у виборі моделі, я не розумію! Що конкретно означає "вибір моделі" і коли конкретно BIC обирає більш "загальну" модель, ніж AIC?

Якщо ми говоримо про вибір змінних, то BIC, безумовно, повинен завжди вибирати модель з найменшою кількістю змінних, правильно? Термін в BIC завжди буде штрафувати додані змінні більше, ніж член в AIC. Але чи це нерозумно, коли « ціль BIC є більш загальною моделлю, ніж цільова модель для AIC »?2ln(N)k2k

Редагувати :

З обговорення в коментарях у " Чи є якась причина віддавати перевагу AIC або BIC перед іншими? ми бачимо невелику дискусію між @Michael Chernick та @ user13273 в коментарях, що спонукає мене повірити, що це щось, що не настільки тривіально:

Я вважаю, що доцільніше назвати це обговорення як "функціональний" вибір або "коваріаційний" вибір. Для мене вибір моделей набагато ширший, включаючи конкретизацію розподілу помилок, форму функції зв’язку та форму коваріатів. Коли ми говоримо про AIC / BIC, ми зазвичай опиняємося в ситуації, коли всі аспекти побудови моделі є фіксованими, крім вибору коваріатів. - user13273 13 серпня '12 о 21:17

Вирішення конкретних коваріатів для включення в модель звичайно відбувається шляхом вибору моделі терміна, і існує ряд книг з вибором моделі в заголовку, які в першу чергу визначають, яку модель коваріатів / параметрів включати в модель. - Майкл Черник 24 серпня 1212 о 14:44


3
Хороше питання! Принаймні частина резолюції полягає в тому, щоб розрізнити "ціль" BIC в термінології цього документу - справжню модель, яку вона вибере з дуже великим розміром вибірки - & модель, яку трапляється вибрати з певним зразком розмір. Тоді немає суперечностей, коли розглядається вкладена послідовність моделей зі збільшенням відсутності. Параметри, кажучи, що ціль BIC - це модель з 9 параметрами, хоча при помірному розмірі вибірки BIC вибирає модель із 4 параметрами, а AIC - із 6.
Scortchi - Відновити Моніку

1
@Scortchi: Хороший приклад, але хіба концепція цільової моделі не є абсолютно зайвою, коли ми говоримо про вкладені моделі? Якщо контекст - це набір вкладених моделей (тоді ми говоримо про вибір змінних): BIC може мати більш складну цільову модель , але ніколи не вибере більш складну модель, ніж AIC. У будь-якому іншому контексті (ми говоримо про вибір моделі) (з великим розміром вибірки) у статті стверджується, що BIC вибере більш складну ("загальну") цільову модель, ніж AIC. Як це відбувається конкретно, досі мені незрозуміло.
Еросеннін

@Erosennin вам коли-небудь вдалося знайти відповідь на це загальне ваше запитання?
zipzapboing

Відповіді:


3

Іноді моделери розділяють вибір змінних на чіткий крок у розробці моделі. Наприклад, вони спершу провели дослідницький аналіз, дослідили академічну літературу та галузеві практики, а потім склали список змінних кандидатів. Вони б назвали вибір цього крокової змінної .

Далі вони запускають купу різних специфікацій із безліччю різних змінних комбінацій, таких як модель OLS: де позначає змінну в моделі . Вони обирають найкращу модель з усіх моделей вручну або в автоматизованих процедурах. Отже, ці люди називали б вибір останнього етапу .j m j m m

yi=jmXijmβjm+εi,
jmjmm

Це схоже на те, як у машинному навчанні люди розмовляють про функціональну інженерію , коли знаходять змінні. Ви підключаєте функції до LASSO або подібних рамок, де будуєте модель за допомогою цих функцій (змінних). У цьому контексті має сенс відокремити вибір змінної на окремий крок, тому що ви дозволяєте алгоритму вибирати правильні коефіцієнти для змінних, а не усувають жодні змінні. Ваше судження (щодо того, яка змінна переходить у модель) виділяється на етапі вибору змінної, тоді решта залежить від відповідного алгоритму.

У контексті статті, яку ви цитували, це все не має значення. У статті використовується BIC або AIC для вибору між різними специфікаціями моделі. Не має значення, чи був у вас вибір змінної окремим кроком у цьому випадку. Важливо лише те, які змінні є у будь-якій конкретній специфікації моделі , тоді ви дивитесь на їх BIC / AIC, щоб вибрати найкраще. Вони враховують розміри вибірки та кількість змінних.m

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.