Сподіваюсь, це питання, на який хтось тут може відповісти за мене про характер розкладання сум квадратів у моделі змішаних ефектів, що відповідає lmer
(з пакету lme4 R).
По-перше, я повинен сказати, що мені відомо про суперечки з використанням цього підходу, і на практиці я з більшою ймовірністю використовую завантажений LRT для порівняння моделей (як це запропонував Faraway, 2006). Однак я здивований, як повторити результати, і тому для власної розумності я думав, що запитаю тут.
В основному, я переживаю використання моделей зі змішаними ефектами, що підходять до lme4
пакету. Я знаю, що ви можете використовувати anova()
команду, щоб дати короткий підсумок послідовного тестування фіксованих ефектів у моделі. Наскільки мені відомо, саме так називається Faraway (2006) як підхід «Очікувані середні квадрати». Що я хочу знати, як обчислюються суми квадратів?
Я знаю, що я міг взяти оцінені значення з певної моделі (використовуючи coef()
), припустити, що вони фіксовані, а потім зробити тести, використовуючи суми квадратів залишків моделі з факторами, що цікавлять, і без них. Це добре для моделі, що містить єдиний коефіцієнт, що входить до теми. Однак, реалізуючи проект розбиття на графік, отримане значення значень квадратів дорівнює значенню, отриманому R, використовуючи aov()
відповідне Error()
позначення. Однак це не те саме, що суми квадратів, отримані anova()
командою на об'єкті моделі, незважаючи на те, що коефіцієнти F є однаковими.
Звичайно, це має повний сенс, оскільки Error()
в змішаній моделі немає потреби в шарах. Однак це повинно означати, що суми квадратів певною мірою штрафуються в змішаній моделі, щоб забезпечити відповідні F-співвідношення. Як це досягається? І як модель якось виправляє між квадратом суму квадратів, але не виправляє внутрішньодіапазонну суму квадратів. Очевидно, що це є необхідним для класичного ANOVA-розділеного сюжету, що було досягнуто шляхом позначення різних значень помилок для різних ефектів, то як модель змішаного ефекту дозволяє це зробити?
В основному, я хочу вміти повторювати результати anova()
команди, застосованої до об'єкта lmer моделі, щоб перевірити результати та своє розуміння, однак, на даний момент я можу досягти цього для нормальної внутрішньої теми, але не для розділення- Сюжетний дизайн, і я, здається, не можу з’ясувати, чому це так.
Як приклад:
library(faraway)
library(lme4)
data(irrigation)
anova(lmer(yield ~ irrigation + variety + (1|field), data = irrigation))
Analysis of Variance Table
Df Sum Sq Mean Sq F value
irrigation 3 1.6605 0.5535 0.3882
variety 1 2.2500 2.2500 1.5782
summary(aov(yield ~ irrigation + variety + Error(field/irrigation), data = irrigation))
Error: field
Df Sum Sq Mean Sq F value Pr(>F)
irrigation 3 40.19 13.40 0.388 0.769
Residuals 4 138.03 34.51
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
variety 1 2.25 2.250 1.578 0.249
Residuals 7 9.98 1.426
Як видно, всі F-коефіцієнти згодні. Суми квадратів для різноманітності також погоджуються. Однак суми квадратів для поливу не узгоджуються, однак, схоже, випуск лімерів масштабується. Отже, що насправді робить команда anova ()?
mixed()
зafex
якої пропонує те , що ви хочете ( з допомогоюmethod = "PB"
). І оскільки ви, очевидно, зробили тестування з даними іграшок, це, безумовно, буде корисно, якщо ви зможете показати ці еквіваленти з даними та кодом (отже, не +1).