Моє первинне питання - як інтерпретувати вихід (коефіцієнти, F, P) при проведенні типу I (послідовного) ANOVA?
Моя конкретна дослідницька проблема трохи складніша, тому я розбию свій приклад на частини. По-перше, якщо мене цікавить вплив густоти павуків (X1) на ріст рослини (Y1) і я висаджував розсаду у вольєри та маніпулював щільністю павуків, то я можу проаналізувати дані за допомогою простої ANOVA або лінійної регресії. Тоді було б неважливо, чи використовував я тип I, II або III суму квадратів (СС) для своєї ANOVA. У моєму випадку у мене є 4 повтори 5 рівнів щільності, тому я можу використовувати щільність як фактор або як безперервну змінну. У цьому випадку я вважаю за краще інтерпретувати це як суцільну незалежну (предикторну) змінну. У RI може працювати наступне:
lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)
Запуск функції anova матиме сенс для порівняння пізніше, сподіваємось, тому, будь ласка, ігноруйте тут дивацтва. Вихід:
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4279 0.08058 .
Residuals 18 2.53920 0.14107
Скажімо, я підозрюю, що початковий рівень неорганічного азоту в ґрунті, який я не міг контролювати, також може суттєво вплинути на ріст рослин. Я не особливо зацікавлений у цьому ефекті, але хотів би потенційно пояснити різні зміни, які він викликає. Дійсно, мій основний інтерес викликає вплив павутинної щільності (гіпотеза: збільшення густоти павуків викликає збільшення росту рослин - імовірно, через зменшення травоїдних комах, але я лише тестую дію, а не механізм). Я міг би додати ефект неорганічного N до свого аналізу.
Для мого запитання зробимо вигляд, що я перевіряю щільність взаємодії * неорганічнийN, і це несуттєво, тому я видаляю її з аналізу та запускаю такі основні ефекти:
> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4113 0.08223 .
inorganicN 1 0.12936 0.12936 0.9126 0.35282
Residuals 17 2.40983 0.14175
Тепер це має різницю, використовую я тип I або тип II SS (я знаю, що деякі люди заперечують проти термінів типу I і II тощо), але, зважаючи на популярність SAS, це дуже просто. R anova {stats} використовує тип I за замовчуванням. Я можу обчислити тип II SS, F і P для щільності, змінивши порядок моїх основних ефектів, або можу використовувати пакет "автомобіль" доктора Джона Фокса (супутник застосованій регресії). Я віддаю перевагу останньому методу, оскільки він легший для складніших проблем.
library(car)
Anova(lm2)
Sum Sq Df F value Pr(>F)
density 0.58425 1 4.1216 0.05829 .
inorganicN 0.12936 1 0.9126 0.35282
Residuals 2.40983 17
Я розумію, що гіпотезами типу II було б: "Немає лінійного ефекту x1 на y1, враховуючи ефект (утримуючи постійну?) X2", і те саме для x2, заданого x1. Я думаю, що тут я плутаюсь. Яка гіпотеза тестується ANOVA за допомогою методу типу I (послідовний) вище порівняно з гіпотезою, що використовує метод II типу?
Насправді мої дані трохи складніші, оскільки я вимірював численні показники росту рослин, а також динаміку поживних речовин та розкладання посліду. Мій фактичний аналіз приблизно такий:
Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)
Type II MANOVA Tests: Pillai test statistic
Df test stat approx F num Df den Df Pr(>F)
density 1 0.34397 1 5 12 0.34269
nitrate 1 0.99994 40337 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)
Df Pillai approx F num Df den Df Pr(>F)
density 1 0.99950 4762 5 12 < 2e-16 ***
nitrate 1 0.99995 46248 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
Residuals 16