Порівняння двох моделей за допомогою функції anova () в R


32

З документації для anova():

Коли дається послідовність об'єктів, 'anova' перевіряє моделі один проти одного у визначеному порядку ...

Що означає тестування моделей одна проти одної? І чому порядок має значення?

Ось приклад з підручника GenABEL :

    >  modelAdd = lm(qt~as.numeric(snp1))
    >  modelDom = lm(qt~I(as.numeric(snp1)>=2))
    >  modelRec = lm(qt~I(as.numeric(snp1)>=3))
     anova(modelAdd, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ as.numeric(snp1)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2320                      
    2   2371 2320  1    0.0489     0.82
     anova(modelDom, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 2)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2322                      
    2   2371 2320  1      1.77     0.18
     anova(modelRec, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 3)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)  
    1   2372 2324                        
    2   2371 2320  1      3.53    0.057 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Як я інтерпретую цей вихід?

Відповіді:


31

При використанні anova(lm.1,lm.2,test="Chisq")він виконує тест Chi-квадрата для порівняння lm.1та lm.2(тобто перевіряє, чи є зменшення залишкової суми квадратів статистично значущим чи ні). Зауважте, що це має сенс лише за наявності lm.1та lm.2вкладених моделей.

α=0,05α=0,1

Ознайомтеся і з ANOVA для лінійної моделі .


1
Але чи означає це щось із того, чи краще одна з двох? Спасибі!
qed

5
Це залежить від того, як ви визначаєте термін "краще". Якщо ви визначите її як модель, яка забезпечує менше залишкової суми квадратів, то відповідь - так. Це тому, що в цьому тесті порівнюється зменшення залишкової суми квадратів.
Стати

3
З іншого боку, якщо дві моделі не відрізняються суттєво, чи можна стверджувати, що простіша модель "краща"? Я тут думаю про парцимент.
Синіньо

1
що робити, якщо anova (mod1, mod2, test = "LRT") в чому полягає різниця?
ElleryL
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.