Еквівалентність значень AIC та p у виборі моделі


9

У коментарі до відповіді на це питання було зазначено, що використання AIC у виборі моделі еквівалентно використанню р-значення 0,154.

Я спробував це в R, де я використав "зворотний" алгоритм вибору підмножини, щоб викинути змінні з повної специфікації. По-перше, послідовно викидаючи змінну з найвищим р-значенням і зупиняючи, коли всі p-значення нижче 0,154, і, по-друге, скидаючи змінну, яка призводить до найнижчого AIC при видаленні, поки не буде досягнуто поліпшення.

Виявилося, що вони дають приблизно однакові результати, коли я використовую р-значення 0,154 як порогове значення.

Це насправді правда? Якщо так, чи хтось знає, чому може звернутися до джерела, яке пояснює це?

PS Я не міг попросити людину, яка коментує або написати коментар, тому що щойно зареєструвалася. Я знаю, що це не найбільш підходящий підхід до вибору моделі та висновку тощо.


(1) Прогностичне моделювання з логістичним регресійним аналізом: порівняння методів відбору та оцінки в малих наборах даних. Статистика в медицині, 19, 1059-1079 (2) вірно для змінних з df1, засновані на aic визначенні. Але вона може бути нижчою, якщо ваші ступені свободи змінних вищі
Чарльз

Відповіді:


13

Варіабельний вибір, здійснений за допомогою статистичного тестування або AIC, є дуже проблематичним. Якщо використовуєтьсяχ2 тестів, AIC використовує обріз χ2= 2,0, що відповідає α=0,157. AIC при використанні на окремих змінних не робить нічого нового; він просто використовує більш розумнийαніж 0,05 Більш розумний (менше заважає виводу)α становить 0,5.


+1 Я витратив стільки часу на створення своєї (тепер видаленої) відповіді, що я навіть не бачив, як ця публікація була тим часом. Я б просто проголосував за це.
Glen_b -Встановити Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.