Витяг укосів для випадків із моделі змішаних ефектів (lme4)


13

Я хотів би витягнути нахили для кожної людини в моделі змішаного ефекту, як це викладено в наступному параграфі

Моделі змішаних ефектів використовувались для характеристики окремих шляхів зміни когнітивних підсумкових заходів, включаючи терміни віку, статі та років навчання як фіксованих ефектів (Laird and Ware, 1982; Wilson et al., 2000, 2002c) ... Залишкові, індивідуальні умови когнітивного зниження нахилу були вилучені із змішаних моделей після коригування наслідків віку, статі та освіти. Потім коригували залишкові схили, орієнтовані на людину, як фенотип кількісного результату для аналізу генетичної асоціації. Ці оцінки прирівнюються до різниці між нахилом особи та передбачуваним схилом особи того ж віку, статі та рівня освіти.

De Jager, PL, Shulman, JM, Chibnik, LB, Keenan, BT, Raj, T., Wilson, RS, та ін. (2012 р.). Геномне сканування для поширених варіантів, що впливають на швидкість вікового когнітивного зниження . Нейробіологія старіння, 33 (5), 1017.e1–1017.e15.

Я розглядав використання coefфункції для отримання коефіцієнтів для кожної людини, але я не впевнений, чи правильно це використовувати.

Хто-небудь може дати поради, як це зробити?

#example R code 
library(lme4)
attach(sleepstudy)  
fml <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy)
beta <- coef(fml)$Subject
colnames(beta) <- c("Intercept", "Slope")
beta

summary(beta)
summary(fm1)

Відповіді:


29

Модель:

library(lme4)
data(sleepstudy)
fm1 <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy)

Функція coef- це правильний підхід для вилучення індивідуальних відмінностей.

> coef(fm1)$Subject
    (Intercept)       Days
308    253.6637 19.6662581
309    211.0065  1.8475834
310    212.4449  5.0184067
330    275.0956  5.6529540
331    273.6653  7.3973908
332    260.4446 10.1951151
333    268.2455 10.2436611
334    244.1725 11.5418622
335    251.0714 -0.2848735
337    286.2955 19.0955694
349    226.1950 11.6407008
350    238.3351 17.0814915
351    255.9829  7.4520286
352    272.2687 14.0032989
369    254.6806 11.3395025
370    225.7922 15.2897513
371    252.2121  9.4791308
372    263.7196 11.7513155

Ці значення є комбінацією фіксованих ефектів та компонентів дисперсії (випадкових ефектів). Можна використовувати summaryі coefдля отримання коефіцієнтів фіксованих ефектів.

> coef(summary(fm1))[ , "Estimate"]
(Intercept)        Days 
  251.40510    10.46729 

Перехват - 251,4, а нахил (пов'язаний з Days) - 10,4. Ці коефіцієнти є середніми для всіх предметів. Для отримання випадкових ефектів можна використовувати ranef.

> ranef(fm1)$Subject
    (Intercept)        Days
308   2.2585637   9.1989722
309 -40.3985802  -8.6197026
310 -38.9602496  -5.4488792
330  23.6905025  -4.8143320
331  22.2602062  -3.0698952
332   9.0395271  -0.2721709
333  16.8404333  -0.2236248
334  -7.2325803   1.0745763
335  -0.3336936 -10.7521594
337  34.8903534   8.6282835
349 -25.2101138   1.1734148
350 -13.0699598   6.6142055
351   4.5778364  -3.0152574
352  20.8635944   3.5360130
369   3.2754532   0.8722166
370 -25.6128737   4.8224653
371   0.8070401  -0.9881551
372  12.3145406   1.2840295

Ці значення є дисперсійними компонентами предметів. Кожен рядок відповідає одному предмету. По суті середнє значення кожного стовпця дорівнює нулю, оскільки значення відповідають різниці щодо фіксованих ефектів.

> colMeans(ranef(fm1)$Subject)
  (Intercept)          Days 
 4.092529e-13 -2.000283e-13 

Зауважте, що ці значення дорівнюють нулю, відхилення зумовлені неточністю подання числа з плаваючою комою.

Результат coef(fm1)$Subjectоб'єднує фіксовані ефекти у випадкові ефекти, тобто до випадкових ефектів додаються коефіцієнти фіксованого ефекту. Результати - індивідуальні перехоплення та нахили.


Дякуємо за відповідь, що з’ясувало, як розраховуються окремі коефіцієнти. Ще одне додаткове запитання, коли вищевказаний параграф зазначав, що вони скориговані на залишки, це те саме, що включати випадкові ефекти в коефіцієнти чи це окрема проблема?
Ендрюс

Ви заявляєте, що кофе (резюме (fm1)) [, "Оцінка"] дає середнє значення для всіх предметів. Я вважаю, що для перехоплення є середнє значення "Реакція", але "середнє (снудстуд $ Реакція) = 298.5079". Це інтерпретація перехоплення в лінійній регресії, і я намагаюся зрозуміти коефіцієнти в моделях зі змішаними ефектами, і я намагаюся отримати речі (на кшталт цього, щоб скласти). Чому не перехоплення 298.5?
svannoy

@svannoy Зауважимо, що перехоплення - це розрахункове значення залежної змінної, коли всі коваріати дорівнюють нулю. Тут Daysне зосереджено на середньому, і тому перехоплення моделі нижче середнього значення Reaction. Крім того, лінія регресії є найкращим лінійним приляганням. Отже, спостереження не обов'язково в цій лінії.
Свен Гогенштейн

@SvenHohenstein дякую, що пояснив це. Чи точно тоді сказати, що в регресії OLS, що має лише одну категоричну змінну предиктора та кодування відхилень (contr.sum ()), перехоплення - це саме велике значення; тоді як у регресії RC з випадковою моделлю перехоплення перехоплення є оцінним великим значенням?
svannoy

@svannoy Так, кодування відхилення перехоплення відображає велике значення в регресії OLS. У лінійній змішаній моделі перехоплення - це дійсно оціночне велике значення.
Свен Гогенштайн
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.