Ми знаємо, що парний t- test - це лише особливий випадок односторонньої (або всередині суб'єкта) ANOVA, а також лінійної моделі зі змішаним ефектом, яку можна продемонструвати за допомогою lme () функції пакету nlme в R як показано нижче.
#response data from 10 subjects under two conditions
x1<-rnorm(10)
x2<-1+rnorm(10)
# Now create a dataframe for lme
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")
Коли я запускаю такий парний t-тест:
t.test(x1, x2, paired = TRUE)
Я отримав цей результат (ви отримаєте інший результат через випадковий генератор):
t = -2.3056, df = 9, p-value = 0.04657
З підходом ANOVA ми можемо отримати той же результат:
summary(aov(y ~ x + Error(subj/x), myDat))
# the F-value below is just the square of the t-value from paired t-test:
Df F value Pr(>F)
x 1 5.3158 0.04657
Тепер я можу отримати такий самий результат у lme із наступною моделлю, припускаючи позитивно-певну симетричну матрицю кореляції для двох умов:
summary(fm1 <- lme(y ~ x, random=list(subj=pdSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.3142115 9 -0.7918878 0.4488
# xx2 1.3325786 0.5779727 9 2.3056084 0.0466
Або інша модель, якщо припустити складну симетрію для кореляційної матриці двох умов:
summary(fm2 <- lme(y ~ x, random=list(subj=pdCompSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.4023431 9 -0.618428 0.5516
# xx2 1.3325786 0.5779727 9 2.305608 0.0466
За допомогою парного t-тесту та одностороннього повторного вимірювання ANOVA я можу записати традиційну модель середньої комірки як
Yij = μ + αi + βj + εij, i = 1, 2; j = 1, ..., 10
де i індексується умова, j індекс суб'єкта, Y ij - змінна відповіді, μ є постійним для фіксованого ефекту для загального середнього значення, α i - фіксований ефект для умови, β j - випадковий ефект для суб'єкта, що слідує за N (0, σ p 2 ) (σ p 2 - дисперсія популяції), а ε ij є залишковим після N (0, σ 2 ) (σ 2 - в межах предметної дисперсії).
Я вважав, що модель середньої комірки вище не підходить для lme-моделей, але проблема полягає в тому, що я не можу придумати розумну модель для двох підходів lme () з припущенням кореляційної структури. Причина полягає в тому, що модель lme, здається, має більше параметрів для випадкових компонентів, ніж запропонована вище модель середньої комірки. Принаймні, lme-модель забезпечує точно таку саму F-величину, ступінь свободи та p-значення, що і gls не може. Більш конкретно, gls дає некоректні DF через те, що він не враховує того, що кожен суб'єкт має два спостереження, що призводить до сильно завищених DF. Модель lme, швидше за все, завищена параметризовано у визначенні випадкових ефектів, але я не знаю, що це за модель та які параметри. Тож питання для мене ще залишається невирішеним.