Це питання, очевидно, випливало з дослідження з неврівноваженою двосторонньою конструкцією, проаналізованого в R з aov()
функцією; на цій сторінці подано більш пізній та детальний приклад цього питання.
Загальна відповідь на це питання, як і для багатьох, така: "Це залежить". Тут залежить від того, чи буде дизайн збалансованим і якщо ні, то який аромат ANOVA обраний.
По-перше, це залежить від того, чи збалансований дизайн. У кращому з усіх можливих світів при однаковій кількості випадків у всіх осередках факторної конструкції не було б різниці через порядок введення факторів у модель, незалежно від того, як виконується ANOVA. * Наведені випадки , очевидно, з ретроспективної клінічної когорти, схоже, з реального світу, де такого балансу не було знайдено. Тож порядок може мати значення.
По-друге, це залежить від того, як виконується ANOVA, що є дещо спірним питанням. Типи ANOVA для незбалансованих конструкцій відрізняються за порядком оцінки основних ефектів та взаємодій. Оцінка взаємодій є основою для двостороннього та вищого порядку ANOVA, тому існують суперечки щодо найкращого способу. Дивіться цю перехресну перевірену сторінку для одного пояснення та обговорення. Дивіться подробиці та попередження про функцію Anova()
(з великою літери "А") в посібнику для car
пакета для іншого перегляду.
Порядок факторів має значення в незбалансованих конструкціях за замовчуванням aov()
у R, які використовують те, що називається тестами типу I. Це послідовне віднесення відхилень від факторів у порядку вступу до моделі, як передбачалося в цьому питанні. Порядок не має значення для тестів типу II або III типу, передбачених Anova()
функцією в car
пакеті в Р. Ці альтернативи, однак, мають свої потенційні недоліки, зазначені у вищезазначених посиланнях.
Нарешті, розглянемо відношення до множинної лінійної регресії, як lm()
у R, що є, по суті, тим же типом моделі, якщо включити умови взаємодії. Порядок введення змінних у lm()
значення не має значення з точки зору коефіцієнтів регресії та p- значень, про які повідомляється summary(lm())
, в яких категоричний коефіцієнт рівня k кодується як (k-1) бінарних манекенних змінних і коефіцієнт регресії повідомляється для кожної манекена .
Однак, можливо, обернути lm()
висновок anova()
(з нижнього регістру "a" з stats
пакету R ) або Anova()
підсумувати вплив кожного фактора на всі його рівні, як це очікує в класичній ANOVA. Тоді впорядкування факторів буде мати значення anova()
як для aov()
, так і не матиме значення Anova()
. Аналогічно, повертаються суперечки щодо того, який тип ANOVA використовувати. Тому не можна вважати незалежність замовлення від введення факторів у всіх lm()
моделях, що використовуються нижче .
* Достатня кількість рівних спостережень у всіх клітинах, але, наскільки я розумію, це не є необхідним для того, щоб порядок факторів був несуттєвим. Менш вимогливі типи балансу можуть забезпечити незалежність замовлення.