Поетапна регресія в R - критичне р-значення


12

Яке критичне значення р використовується step()функцією в R для поступової регресії? Я припускаю, що це 0,15, але чи моє припущення правильне? Як я можу змінити критичне p-значення?


7
Функція "крок" R заснована на AIC.
Майкл М

7
Найкраще взагалі не використовувати поетапні процедури вибору моделі. Щоб зрозуміти чому, може допомогти вам прочитати мою відповідь тут: Алгоритми автоматичного вибору моделі .
gung - Відновіть Моніку

3
Далі до коментаря @ MichaelMayer: Descriptionчастина довідкової сторінки, якою ?stepйдеться, у повному обсязі: Виберіть модель AIC на основі формули.
Стефан Коласа

Відповіді:


27

Як я пояснив у своєму коментарі до вашого іншого запитання, stepвикористовує AIC, а не p-значення.

Тим НЕ менше, для однієї змінної в той час, АІК робить , відповідають з використанням р-значення 0,15 (або , щоб бути більш точним, 0,1573):

Розглянемо порівняння двох моделей, які відрізняються однією змінною. Зателефонуйте моделям (менша модель) та M 1 (більша модель), і нехай їх AIC будуть AIC 0 та AIC 1 відповідно.M0M1AIC0AIC1

AIC1<AIC02logL0(2logL1)>2

αχ122logL0(2logL1)>Cα

2χ1210.843=0.15715.7%


То як ви модифікуєте це?

Легко. Змініть kпараметр stepз 2 на щось інше. Ви хочете 10% замість цього? Зробіть 2,7:

qchisq(0.10,1,lower.tail=FALSE)
[1] 2.705543

Ви хочете 2,5%? Набір k=5:

qchisq(0.025,1,lower.tail=FALSE)
[1] 5.023886

і так далі.


Однак, незважаючи на те, що це вирішує ваше запитання, я раджу уважно звернути увагу на відповідь Френка Гаррелла на ваше інше питання, а також шукати відповіді великої кількості статистиків на інші запитання, що стосуються ступінчастої регресії тут, і поради, як правило, дуже послідовно уникати поступових процедур взагалі.


Приємне пояснення. Чи знаєте ви, чи буде це справедливо для р-значень звичайних регресійних t-тестів?
Бен Огорек

α=0.05

(ctd) ... цілий ряд серйозних проблем із ступінчастими. До інших відносяться необ’єктивні оцінки та стандартні помилки, які занадто малі.
Glen_b -Встановити Моніку

1
Миттєво відкладаючи проблеми з поетапним вибором моделі, мені цікаво узагальнити менше AIC => .1573 правило p-значення. Значення р-значення ймовірності, яке ви описуєте, добре, але в таких процедурах, як R's lm, оцінка / std.err порівнюється з t-розподілом. Це інший тест, і мені було цікаво, чи може ваш результат .1573 приблизно тримати.
Бен Огорек

2
tk

4

Як було сказано вище, stepфункція в R заснована на критеріях AIC. Але я здогадуюсь, що під р-значенням ви маєте на увазі альфа для входу, а альфа для виходу. Що ви можете зробити, це використовувати функцію, stepwiseнаписану Полом Рубіном та доступну тут . Як ви бачите, у вас є аргументи alpha.to.enter та alpha.to.leave, які ви можете змінити. Зауважте, що ця функція використовує F-тест або еквівалентно t-тест для вибору моделей. Більше того, він може обробляти не тільки ступінчату регресію, але і вибір вперед та усунення назад, якщо ви правильно визначите аргументи.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.