Якщо ви робите однобічну ANOVA для перевірки, чи є значна різниця між групами, то неявно ви порівнюєте дві вкладені моделі (тож існує лише один рівень вкладеності, але він все ще гніздовий).
Ці дві моделі:
Приклад порівняння засобів та еквівалентності вкладених моделей: візьмемо довжину сепалу (см) з набору даних про райдужну оболонку (якщо ми використовуємо всі чотири змінні, ми насправді могли б робити LDA чи MANOVA, як це робив Фішер у 1936 р.)
Загальні спостережувані та групові засоби:
мкt o t a lмкs e t o s aмкv e r s i c o l o rмкv i r gi n i c a= 5,83= 5,01= 5,94= 6,59
Який у формі моделі:
модель 1: модель 2: уi j= 5,83 + ϵiуi j= 5,01 + ⎡⎣⎢00,931.58⎤⎦⎥j+ ϵi
∑ ϵ2i= 102,1683
∑ ϵ2i= 38,9562
Таблиця ANOVA буде подібною (і неявно обчислити різницю між груповою сумою квадратів, яка становить 63,212 в таблиці з двома ступенями свободи):
> model1 <- lm(Sepal.Length ~ 1 + Species, data=iris)
> model0 <- lm(Sepal.Length ~ 1, data=iris)
> anova(model0, model1)
Analysis of Variance Table
Model 1: Sepal.Length ~ 1
Model 2: Sepal.Length ~ 1 + Species
Res.Df RSS Df Sum of Sq F Pr(>F)
1 149 102.168
2 147 38.956 2 63.212 119.26 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Ж= R SSгi ffe r e n c eД Жгi ffе р еn c eR SSн е шД Жн е ш= 63,212238.956147= 119,26
набір даних, використаний у прикладі:
довжина пелюстки (см) для трьох різних видів квітів ірису
Iris setosa Iris versicolor Iris virginica
5.1 7.0 6.3
4.9 6.4 5.8
4.7 6.9 7.1
4.6 5.5 6.3
5.0 6.5 6.5
5.4 5.7 7.6
4.6 6.3 4.9
5.0 4.9 7.3
4.4 6.6 6.7
4.9 5.2 7.2
5.4 5.0 6.5
4.8 5.9 6.4
4.8 6.0 6.8
4.3 6.1 5.7
5.8 5.6 5.8
5.7 6.7 6.4
5.4 5.6 6.5
5.1 5.8 7.7
5.7 6.2 7.7
5.1 5.6 6.0
5.4 5.9 6.9
5.1 6.1 5.6
4.6 6.3 7.7
5.1 6.1 6.3
4.8 6.4 6.7
5.0 6.6 7.2
5.0 6.8 6.2
5.2 6.7 6.1
5.2 6.0 6.4
4.7 5.7 7.2
4.8 5.5 7.4
5.4 5.5 7.9
5.2 5.8 6.4
5.5 6.0 6.3
4.9 5.4 6.1
5.0 6.0 7.7
5.5 6.7 6.3
4.9 6.3 6.4
4.4 5.6 6.0
5.1 5.5 6.9
5.0 5.5 6.7
4.5 6.1 6.9
4.4 5.8 5.8
5.0 5.0 6.8
5.1 5.6 6.7
4.8 5.7 6.7
5.1 5.7 6.3
4.6 6.2 6.5
5.3 5.1 6.2
5.0 5.7 5.9
anova()функція, тому що перший, справжній, ANOVA також використовує F-тест. Це призводить до плутанини термінології.