Можливо, було б простіше зрозуміти, як здійснюється покрокова регресія, переглянувши всі 15 можливих lm-моделей.
Ось швидке повідомлення для створення формули для всіх 15 комбінацій.
library(leaps)
tmp<-regsubsets(mpg ~ wt + drat + disp + qsec, data=mtcars, nbest=1000, really.big=T, intercept=F)
all.mods <- summary(tmp)[[1]]
all.mods <- lapply(1:nrow(all.mods, function(x)as.formula(paste("mpg~", paste(names(which(all.mods[x,])), collapse="+"))))
head(all.mods)
[[1]]
mpg ~ drat
<environment: 0x0000000013a678d8>
[[2]]
mpg ~ qsec
<environment: 0x0000000013a6b3b0>
[[3]]
mpg ~ wt
<environment: 0x0000000013a6df28>
[[4]]
mpg ~ disp
<environment: 0x0000000013a70aa0>
[[5]]
mpg ~ wt + qsec
<environment: 0x0000000013a74540>
[[6]]
mpg ~ drat + disp
<environment: 0x0000000013a76f68>
Значення AIC для кожної моделі витягуються за допомогою:
all.lm<-lapply(all.mods, lm, mtcars)
sapply(all.lm, extractAIC)[2,]
[1] 97.98786 111.77605 73.21736 77.39732 63.90843 77.92493 74.15591 79.02978 91.24052 71.35572
[11] 63.89108 65.90826 78.68074 72.97352 65.62733
Повернемося до вашої крокової регресії. Значення extraAIC для lm (mpg ~ wt + drat + disp + qsec) становить 65,63 (еквівалентно моделі 15 у списку вище).
Якщо модель видалити disp (-disp), то lm (mpg ~ wt + drat + qsec) становить 63.891 (або модель 11 у списку).
Якщо модель нічого не видаляє (жодного), то AIC все ще 65,63
Якщо модель видалити qsec (-qsec), то lm (mpg ~ wt + drat + disp) дорівнює 65.908 (модель 12).
тощо.
В основному, підсумки розкривають все можливе поетапне вилучення однозначного терміну з вашої повної моделі та порівняють значення ExtraAIC, перераховуючи їх у порядку зростання. Оскільки менше значення AIC швидше нагадує модель ІСТИНА, крок збереже (-disp) модель на першому кроці.
Процес повторюється знову, але із збереженою (-дисп) моделлю як вихідною точкою. Умови або віднімаються ("назад"), або віднімаються / додаються ("обидва"), щоб дозволити порівняння моделей. Оскільки найнижчим значенням AIC у порівнянні все ще є (-disp) модель, зупинка процесу та наведені результати моделей.
Що стосується вашого запиту: "Якої функції намагаються досягти, додавши + disp знову при поетапному виборі?", В цьому випадку це насправді нічого не робить, тому що найкраща модель з усіх 15 моделей - модель 11 , тобто lm (mpg ~ wt + drat + qsec).
Однак у складних моделях з великою кількістю предикторів, які потребують численних кроків, щоб вирішити, додавання терміна, який було видалено спочатку, є критичним для забезпечення найбільш вичерпного способу порівняння термінів.
Сподіваюся, що ця допомога в чомусь допоможе.