Лінійне моделювання змішаних ефектів із даними дослідження побратимів


14

Припустимо, у мене є деяка змінна відповіді яка вимірювалася від ї побратимів у й сім'ї. Крім того, деякі дані поведінки були зібрані одночасно від кожного суб'єкта. Я намагаюся проаналізувати ситуацію за допомогою наступної лінійної моделі змішаних ефектів:yijjixij

yij=α0+α1xij+δ1ixij+εij

де і є фіксованим перехопленням і нахилом відповідно, - випадковий нахил, а - залишковий.α0α1δ1iεij

Припущення про випадкові ефекти та залишковий є (якщо припустимо, що в кожній родині є лише два брати і сестри)δ1iεij

δ1idN(0,τ2)(εi1,εi2)TdN((0,0)T,R)

де - невідомий параметр дисперсії, а структура дисперсії-коваріації - симетрична матриця форми 2 x 2 Rτ2R

(r12r122r122r22)

що моделює співвідношення двох братів і сестер.

  1. Чи є це підходящою моделлю для такого дослідження брати і сестер?

  2. Дані трохи складніші. Серед 50 сімей близько 90% з них є двояйцевими (ДЗ) близнюками. Для решти сімей,

    1. двоє мають лише одного брата;
    2. у двох є одна пара DZ плюс один брат; і
    3. у двох є одна пара DZ плюс два додаткові брати.


    Я вірю, lmeщо пакет R nlmeможе легко впоратися (1) з відсутнім або незбалансованим становищем. Моя біда в тому, як боротися з (2) і (3)? Я можу подумати про те, щоб розбити кожну з цих чотирьох сімей на (2) та (3) на дві, щоб кожна підсемейство мала одного чи двох братів і сестер, щоб вищезгадана модель могла бути застосована до цього часу. Це добре? Іншим варіантом було б просто викинути дані із зайвих одного чи двох братів і сестер у (2) та (3), що, здається, марно. Будь-які кращі підходи?

  3. Здається, що lmeможна зафіксувати значення у залишкової матриці дисперсії-коваріації , наприклад = 0,5. Чи має сенс нав'язувати кореляційну структуру, або я повинен просто оцінити її на основі даних?R r 2 12rRr122


1
Що позначає ? xj
Макро

@Macro: Дякую, що помітили це. Щойно змінив ОП, щоб вказати, що є пояснювальною змінною, поведінковою мірою від кожного брата. xij
bluepole

1
Дуже цікаве питання та застосування. Я міг би чогось бракувати, але мені здається, що ця модель завелика. помилки можна ефективно перетворити на "нерозподілений" компонент і "спільний" компонент, останній з яких має ту ж функцію, що і . Вам доведеться або видалити , зробити помилки iid , або накласти такі обмеження, як для ідентифікації - чи це ви робите за призначенням для деакуляції екологічних / генетичних компонентів до співвідношення побратимів? ϵi1,ϵi2δ0iδ0ir 2 12 = .5ϵr122=.5
Макрос

@Macro: Ти маєш рацію: не потрібен у моделі. Дякуємо, що вказали на це! Дивно не скаржиться на таку надмірність. δ0ilme
блакитна полю

Ви все ще працюєте з цією завищеною моделлю (ця частина вашого питання не була відредагована)?
Макрос

Відповіді:


10

Ви можете включити близнюків і не-близнюків в єдину модель, використовуючи фіктивну змінну і включивши випадкові нахили в цю манекенну змінну. Оскільки у всіх сімей є максимум один набір близнюків, це буде відносно просто:

Нехай якщо рідний брат у сім'ї є близнюком, а 0 в іншому випадку. Я припускаю, що ви також хочете, щоб випадковий нахил відрізнявся для близнюків проти звичайних братів і сестер - якщо ні, не включайте термін у наведену нижче модель.j i η i 3Aij=1jiηi3

Потім підходимо до моделі:

yij=α0+α1xij+ηi0+ηi1Aij+ηi2xij+ηi3xijAij+εij
  • α0,α1 є фіксованим ефектом, як у вашій специфікації

  • η i 1 A i j = 1ηi0 - це "базовий" випадковий ефект побратимів, а - додатковий випадковий ефект, що дозволяє близнюкам бути більш схожими, ніж звичайні брати та сестри. Розміри відповідних дисперсій випадкових ефектів кількісно визначають, наскільки схожими є брати і сестри і на скільки більше подібних близнюків, ніж звичайні брати і сестри. Зауважимо, що і для близнюкових, і для не близнячих співвідношень ця модель характеризується цією кореляцією - близнюкові кореляції обчислюються відповідним чином підсумовуючи випадкові ефекти (підключіть ).ηi1Aij=1

  • η i 3 x i jηi2 і мають аналогічні ролі, лише вони виконують роль випадкових схилівηi3xij

  • εij це терміни помилки в iid - зауважте, що я написав вашу модель дещо інакше з точки зору випадкових перехоплення, а не корельованих залишкових помилок.

Ви можете підігнати модель, використовуючи Rпакет lme4. У коді нижче залежної змінної є y, фіктивна змінна є A, предиктор є x, добуток манекенної змінної, а предиктор є Axі famIDє ідентифікаційним номером для сімейства. Передбачається, що ваші дані зберігаються у кадрі даних Dіз цими змінними як стовпці.

library(lme4) 
g <- lmer(y ~ x + (1+A+x+Ax|famID), data=D) 

Змінні випадкових ефектів та оцінки фіксованих ефектів можна переглянути, ввівши summary(g). Зауважимо, що ця модель дозволяє вільно співвідносити один з одним випадкові ефекти.

У багатьох випадках може бути більше сенсу (або простіше інтерпретувати) вважати незалежність між випадковими ефектами (наприклад, це припущення часто робиться для розкладання генетичної та екологічної сімейної кореляції), і в цьому випадку ви замість цього введете

g <- lmer(y ~ x + (1|famID) + (A-1|famID) + (x-1|famID) +(Ax-1|famID), data=D) 

Це дійсно приємне рішення, і мені це подобається! Спробую це незабаром, і подивіться, що це піде ... Дякую велике!
bluepole

Ласкаво просимо. Якщо ви вважаєте це рішення корисним, будь ласка, прийміть відповідь :)
Макрос

Два питання: 1) Оскільки більшість суб'єктів - це дизиготичні близнюки, ваш підхід, здається, не моделює співвідношення між парою близнюків ДЗ. 2) Лише 4 родини мають додаткових братів і сестер. Я хвилююся, що важко буде оцінити випадкові наслідки для братів і сестер на основі лише цих 4 родин. Оскільки різниця між парою близнюків ДЗ та іншим братом і сестрами порівняно невелика (переважно екологічна, а не генетична), можливо, я можу просто ігнорувати тонку різницю близнюків по відношенню до рідних братів і брати побратимів із близнюками з випадковими ефектами, як у вашій моделі або з корельованими залишками, як у моїй ОП.
блакитна полю

Цей підхід моделює співвідношення між близнюками. Наприклад, якщо їх значення передбачувача дорівнюють 0, то кореляція між близнюками дорівнює де - це варіації відповідно і - дисперсія терміна помилки. Якщо значення предиктора не дорівнюють 0, це вираження також буде включати в себе відхилення двох інших випадкових ефектів. σ 2 0 ,σ 2 1 ηi0,ηi1σ 2 ε
σ02+σ12σ02+σ12+σε2
σ02,σ12ηi0,ηi1σε2
Макро

Ви маєте рацію, що, оскільки мало не близнюків, варіації та складно оцінити. Ви можете їх залишити, але нічого не втратите, скориставшись запропонованою нами моделлю, але, можливо, обчислювальною стислістю. Якщо ви це робите, ви фактично припускаєте, що брати та сестри, які не є близнюками, є незалежними. Але ви все ще можете використовувати ці спостереження для оцінки середніх параметрів (тобто не залишайте їх поза примірною моделлю). Або, як ви сказали, ви можете просто діяти так, ніби звичайні брати і сестри такі ж, як і близнюки, і вам взагалі не потрібно буде робити фіктивне кодування. η i 2ηi0ηi2
Макро
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.