Модель змішаних ефектів із вкладкою


34

У мене є дані, зібрані з експерименту, організованого таким чином:

Два майданчики, на кожному з 30 дерев. 15 обробляються, 15 - контролюються на кожній ділянці. З кожного дерева ми відбираємо три шматки стебла і три шматки коренів, так що 6 зразків рівня 1 на дерево, що представлено одним із двох рівнів фактора (корінь, стебло). Потім з цих стовбурових / кореневих зразків беремо два зразки шляхом розсічення різних тканин всередині зразка, що представлено одним з двох рівнів фактора для типу тканини (тип тканини А, тканина типу В). Ці зразки вимірюються як суцільна змінна. Загальна кількість спостережень - 720; 2 ділянки * 30 дерев * (три проби стебла + три зразки кореня) * (одна тканина Проба + одна проба тканини B). Дані виглядають приблизно так ...

        ï..Site Tree Treatment Organ Sample Tissue Total_Length
    1        L  LT1         T     R      1 Phloem           30
    2        L  LT1         T     R      1  Xylem           28
    3        L  LT1         T     R      2 Phloem           46
    4        L  LT1         T     R      2  Xylem           38
    5        L  LT1         T     R      3 Phloem          103
    6        L  LT1         T     R      3  Xylem           53
    7        L  LT1         T     S      1 Phloem           29
    8        L  LT1         T     S      1  Xylem           21
    9        L  LT1         T     S      2 Phloem           56
    10       L  LT1         T     S      2  Xylem           49
    11       L  LT1         T     S      3 Phloem           41
    12       L  LT1         T     S      3  Xylem           30

Я намагаюся встановити модель змішаних ефектів за допомогою R та lme4, але я новачок у змішаних моделях. Я хотів би продемонструвати відповідь як фактор лікування + рівень 1 (стебло, корінь) + фактор 2 рівня (тканина А, тканина В) із випадковими ефектами для конкретних зразків, вкладених у два рівні.

У R я роблю це, використовуючи lmer, наступним чином

fit <- lmer(Response ~ Treatment + Organ + Tissue + (1|Tree/Organ/Sample)) 

З мого розуміння (... що не точно, і чому я публікую!) Термін:

(1|Tree/Organ/Sample)

Вказує, що "Зразок" вкладений у зразки органів, які вкладені в дерево. Чи є цей вид гніздування відповідним / дійсним? Вибачте, якщо це питання не зрозуміло, якщо так, то, будь ласка, вкажіть, де я можу розробити.

Відповіді:


33

Я думаю, що це правильно.

  • (1|Tree/Organ/Sample)розширюється до / еквівалентно (1|Tree)+(1|Tree:Organ)+(1|Tree:Organ:Sample)(де :позначається взаємодія).
  • Фіксовані чинники Treatment, Organі Tissueавтоматично отримати обробляються на правильному рівні.
  • Ви, ймовірно, повинні включати Siteяк фіксований ефект (концептуально це випадковий ефект, але це не практично, щоб спробувати оцінити дисперсію між сайтами лише двома сайтами); це трохи зменшить дисперсію серед дерев.
  • Вам, мабуть, слід включити всі дані в рамки даних і передати це явно lmerчерез data=my.data.frameаргумент.

Можливо, ви знайдете корисними питання про glmm (він орієнтований на GLMM, але також є речі, що стосуються лінійних змішаних моделей).


Що робити, якщо Ерік захотів вказати структуру коваріації для цих перехоплювачів? Тобто можна очікувати, що зразок із позитивним перехопленням дерева також матиме позитивний перехоплення органу. Чи гніздо вирішує цю проблему автоматично? Якщо ні, то як можна вказати таку структуру?
Шерідан Грант

Я думаю, що якщо ви спробуєте виписати рівняння для цього випадку, ви виявите, що це вирішено.
Бен Болкер

13

Я прочитав це запитання та відповідь доктора Болкера та спробував повторити дані (не піклуючись багато, відверто кажучи, про те, що "довжина" представляє в біологічному плані чи одиницях, а потім підходити до моделі, як описано вище. Опублікую результати тут ділитися та шукати відгуки щодо ймовірності наявності непорозумінь.

Код, який я використовував для створення цих вигаданих даних, можна знайти тут , а набір даних має внутрішню структуру ОП:

     site     tree treatment organ sample tissue    length
1    L       LT01         T  root      1  phloem  108.21230
2    L       LT01         T  root      1  xylem   138.54267
3    L       LT01         T  root      2  phloem   68.88804
4    L       LT01         T  root      2  xylem   107.91239
5    L       LT01         T  root      3  phloem   96.78523
6    L       LT01         T  root      3  xylem    88.93194
7    L       LT01         T  stem      1  phloem  101.84103
8    L       LT01         T  stem      1  xylem   118.30319

Структура така:

 'data.frame':  360 obs. of  7 variables:
     $ site     : Factor w/ 2 levels "L","R": 1 1 1 1 1 1 1 1 1 1 ...
 $ tree     : Factor w/ 30 levels "LT01","LT02",..: 1 1 1 1 1 1 1 1 1 1 ...
     $ treatment: Factor w/ 2 levels "C","T": 2 2 2 2 2 2 2 2 2 2 ...
 $ organ    : Factor w/ 2 levels "root","stem": 1 1 1 1 1 1 2 2 2 2 ...
     $ sample   : num  1 1 2 2 3 3 1 1 2 2 ...
 $ tissue   : Factor w/ 2 levels "phloem","xylem": 1 2 1 2 1 2 1 2 1 2 ...
     $ length   : num  108.2 138.5 68.9 107.9 96.8 ...

Набір даних був "сфальсифікований" (відгуки тут вітаються) наступним чином:

  1. Бо treatmentіснує фіксований ефект з двома різними перехопленнями для лікування проти контролю ( 100проти 70), і відсутні випадкові ефекти.
  2. Я встановлюю значення для tissueчітко виражених фіксованих ефектів із дуже різними перехопленнями для phloemпорівняння xylem( 3проти 6), а випадкові ефекти з а sd = 3.
  3. organN(0,3)sd = 36rootstem
  4. Бо у treeнас просто випадкові ефекти з a sd = 7.
  5. Бо sampleя намагався налаштувати лише випадкові ефекти за допомогою sd = 5.
  6. Бо для siteтакож просто випадкових eff з sd = 3.

Не було встановлено нахилів, що обумовлено категоричністю змінних.

Результати моделі змішаних ефектів:

fit <- lmer(length ~ treatment + organ + tissue + (1|tree/organ/sample), data = trees) 

були:

 Random effects:
 Groups              Name        Variance  Std.Dev. 
 sample:(organ:tree) (Intercept) 9.534e-14 3.088e-07
 organ:tree          (Intercept) 0.000e+00 0.000e+00
 tree                (Intercept) 4.939e+01 7.027e+00
 Residual                        3.603e+02 1.898e+01
Number of obs: 360, groups:  sample:(organ:tree), 180; organ:tree, 60; tree, 30

Fixed effects:
            Estimate Std. Error       df t value Pr(>|t|)    
(Intercept)  79.8623     2.7011  52.5000  29.567  < 2e-16 ***
treatmentT   21.4368     3.2539  28.0000   6.588 3.82e-07 ***
organstem     0.1856     2.0008 328.0000   0.093    0.926    
tissuexylem   3.1820     2.0008 328.0000   1.590    0.113    
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Як це вийшло:

  1. Бо treatmentперехоплення без лікування було 79.8623(я встановив середнє значення 70), а з лікуванням це було 79.8623 + 21.4368 = 101.2991(ми встановили середнє значення 100.
  2. Для tissueбув 3.1820внесок в перехоплюють люб'язно xylem, і я налаштував різницю між phloemі xylemз 3. Випадкові ефекти не були частиною моделі.
  3. Оскільки organзразки stemзбільшили перехоплення на 0.1856- я не встановив різниці у фіксованих ефектах між stemта root. Стандартне відхилення того, що я хотів діяти як випадкові ефекти, не відображалось.
  4. У treeвипадкові ефекти з сд від 7спливли красиво , як 7.027.
  5. Що стосується sample, початковий sdпоказник 5був недостатньо підкреслений як 3.088.
  6. site не входила до моделі.

Таким чином, загалом здається, що модель відповідає структурі даних.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.