Чому введення випадкового ефекту нахилу збільшило SE схилу?


9

Я намагаюся проаналізувати вплив року на змінний logInd для певної групи осіб (у мене є 3 групи). Найпростіша модель:

> fix1 = lm(logInd ~ 0 + Group + Year:Group, data = mydata)
> summary(fix1)

Call:
lm(formula = logInd ~ 0 + Group + Year:Group, data = mydata)

Residuals:
    Min      1Q  Median      3Q     Max 
-5.5835 -0.3543 -0.0024  0.3944  4.7294 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
Group1       4.6395740  0.0466217  99.515  < 2e-16 ***
Group2       4.8094268  0.0534118  90.044  < 2e-16 ***
Group3       4.5607287  0.0561066  81.287  < 2e-16 ***
Group1:Year -0.0084165  0.0027144  -3.101  0.00195 ** 
Group2:Year  0.0032369  0.0031098   1.041  0.29802    
Group3:Year  0.0006081  0.0032666   0.186  0.85235    
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 0.7926 on 2981 degrees of freedom
Multiple R-squared: 0.9717,     Adjusted R-squared: 0.9716 
F-statistic: 1.705e+04 on 6 and 2981 DF,  p-value: < 2.2e-16 

Ми можемо бачити, що Group1 значно скорочується, Групи2 та 3 зростають, але не значно.

Очевидно, що індивід повинен бути випадковим ефектом, тому я впроваджую ефект випадкового перехоплення для кожної людини:

> mix1a = lmer(logInd ~ 0 + Group + Year:Group + (1|Individual), data = mydata)
> summary(mix1a)
Linear mixed model fit by REML 
Formula: logInd ~ 0 + Group + Year:Group + (1 | Individual) 
   Data: mydata 
  AIC  BIC logLik deviance REMLdev
 4727 4775  -2356     4671    4711
Random effects:
 Groups     Name        Variance Std.Dev.
 Individual (Intercept) 0.39357  0.62735 
 Residual               0.24532  0.49530 
Number of obs: 2987, groups: Individual, 103

Fixed effects:
              Estimate Std. Error t value
Group1       4.6395740  0.1010868   45.90
Group2       4.8094268  0.1158095   41.53
Group3       4.5607287  0.1216522   37.49
Group1:Year -0.0084165  0.0016963   -4.96
Group2:Year  0.0032369  0.0019433    1.67
Group3:Year  0.0006081  0.0020414    0.30

Correlation of Fixed Effects:
            Group1 Group2 Group3 Grp1:Y Grp2:Y
Group2       0.000                            
Group3       0.000  0.000                     
Group1:Year -0.252  0.000  0.000              
Group2:Year  0.000 -0.252  0.000  0.000       
Group3:Year  0.000  0.000 -0.252  0.000  0.000

Це мало очікуваний ефект - ПС схилів (коефіцієнти Групи 1-3: Рік) тепер нижчі, а залишкові СЕ також нижчі.

Особи також відрізняються за схилом, тому я також ввів ефект випадкового нахилу:

> mix1c = lmer(logInd ~ 0 + Group + Year:Group + (1 + Year|Individual), data = mydata)
> summary(mix1c)
Linear mixed model fit by REML 
Formula: logInd ~ 0 + Group + Year:Group + (1 + Year | Individual) 
   Data: mydata 
  AIC  BIC logLik deviance REMLdev
 2941 3001  -1461     2885    2921
Random effects:
 Groups     Name        Variance  Std.Dev. Corr   
 Individual (Intercept) 0.1054790 0.324775        
            Year        0.0017447 0.041769 -0.246 
 Residual               0.1223920 0.349846        
Number of obs: 2987, groups: Individual, 103

Fixed effects:
              Estimate Std. Error t value
Group1       4.6395740  0.0541746   85.64
Group2       4.8094268  0.0620648   77.49
Group3       4.5607287  0.0651960   69.95
Group1:Year -0.0084165  0.0065557   -1.28
Group2:Year  0.0032369  0.0075105    0.43
Group3:Year  0.0006081  0.0078894    0.08

Correlation of Fixed Effects:
            Group1 Group2 Group3 Grp1:Y Grp2:Y
Group2       0.000                            
Group3       0.000  0.000                     
Group1:Year -0.285  0.000  0.000              
Group2:Year  0.000 -0.285  0.000  0.000       
Group3:Year  0.000  0.000 -0.285  0.000  0.000

Але зараз, всупереч очікуванню, ПП схилів (коефіцієнти Групи 1-3: Рік) зараз значно вищі, навіть вищі, ніж взагалі без випадкового ефекту!

Як це можливо? Я б очікував, що випадковий ефект "з'їсть" нез'ясовану мінливість і підвищить "впевненість" оцінки!

Однак залишкова SE поводиться як очікувалося - вона нижча, ніж у моделі випадкового перехоплення.

Ось дані, якщо потрібно.

Редагувати

Тепер я зрозумів дивовижний факт. Якщо я роблю лінійну регресію для кожної окремо і потім запускаю ANOVA на результуючому схилі, я отримую точно такий же результат, як і випадкова модель нахилу! Ви б знали, чому?

indivSlope = c()
for (indiv in 1:103) {
    mod1 = lm(logInd ~ Year, data = mydata[mydata$Individual == indiv,])
    indivSlope[indiv] = coef(mod1)['Year']
}

indivGroup = unique(mydata[,c("Individual", "Group")])[,"Group"]


anova1 = lm(indivSlope ~ 0 + indivGroup)
summary(anova1)

Call:
lm(formula = indivSlope ~ 0 + indivGroup)

Residuals:
      Min        1Q    Median        3Q       Max 
-0.176288 -0.016502  0.004692  0.020316  0.153086 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)
indivGroup1 -0.0084165  0.0065555  -1.284    0.202
indivGroup2  0.0032369  0.0075103   0.431    0.667
indivGroup3  0.0006081  0.0078892   0.077    0.939

Residual standard error: 0.04248 on 100 degrees of freedom
Multiple R-squared: 0.01807,    Adjusted R-squared: -0.01139 
F-statistic: 0.6133 on 3 and 100 DF,  p-value: 0.6079 

Ось дані, якщо потрібно.


Вам потрібен фіксований ефект на рік, якщо ви будете мати рік: фіксований ефект групової взаємодії. Загалом, ви не можете включати термін взаємодії, не включаючи основні ефекти. Ви справді думаєте, що немає фіксованого компонента до ефекту року? І якщо так, то як може бути фіксований рік: групова взаємодія?
Джон

І, чому немає фіксованого перехоплення? Ви можете мати як фіксований, так і випадковий характер.
Джон

@John, ця модель повністю діє. Це лише питання бажаного кодування категоріальної змінної. СюдиGroupi є перехопленням групи i, і Groupi:Year - це нахил всередині групи i. Якщо включати головний ефект року та перехоплення, то оцінками будуть різниці перехоплення Групиiі група 1 і аналогічно зі схилами.
Аніко

@ Джон, це все одно в моєму питанні поза темою: повірте, це нормально, я багато експериментував з цим. Моя перша lm модель повністю еквівалентна logInd ~ Year*Group, тільки коефіцієнти мають різну форму, не більше того. Залежить від вашого смаку і того, яка форма коефіцієнтів вам подобається, більше нічого. У моїй 1-й моделі, коли ви пишете, немає виключення "Основний ефект року" ... logInd ~ Year*Groupробить точно так само, Yearкоефіцієнт тоді не головний ефект, а група 1: рік.
Цікаво

Гаразд, акуратний, не вважав і перехоплення 0, і групу категоричними.
Джон

Відповіді:


11

Я думаю, що проблема полягає у ваших очікуваннях :) Зауважте, що коли ви додавали випадковий перехоплення для кожної людини, стандартна помилка перехоплення зросла. Оскільки кожна людина може мати власний перехоплення, середня оцінка групи є менш певною. Те ж саме сталося і з випадковим схилом: ви вже не оцінюєте один загальний (всередині групи) нахил, а середнє значення для різних схилів.

EDIT: Чому краща модель не дає більш точної оцінки?

Давайте подумаємо про це навпаки: чому початкова модель недооцінює стандартну помилку? Він передбачає незалежність спостережень, які не є незалежними. Друга модель послаблює це припущення (таким чином, що впливає на перехоплення), а третя розслабляє його далі.

EDIT 2: взаємозв'язок з багатьма моделями, характерними для пацієнта

Ваше спостереження є відомою властивістю (і якщо у вас було лише два роки, то модель випадкових ефектів була б еквівалентна парному t-тесту). Я не думаю, що я встигаю реально довести, але, можливо, виписання двох моделей зробить стосунки яснішими. Давайте ігноруємо змінну групування, оскільки це просто ускладнить позначення. Я буду використовувати грецькі букви для випадкових ефектів, а латинські літери для фіксованих ефектів.

Модель випадкових ефектів (i - предмет, j - копія в темі):

Yij=а+αi+(б+βi)хij+ϵij,
де (αi,βi)'N(0,Σ) і ϵijN(0,σ2).

Коли ви підходите окремі моделі для кожного предмета, то

Yij=аi+бiхij+ϵij,
де ϵijN(0,σi2).

[Примітка: наступне дійсно просто рукоділля:]

Ви можете побачити багато подібностей між цими двома моделями аi відповідна а+αi і бi до б+βi. Середній показникбiвідповідає б, оскільки випадкові ефекти в середньому до 0. Нестримне співвідношення випадкового перехоплення та нахилу призводить до того, що моделі просто можна встановити окремо. Я не впевнений, як синглσ припущення пов'язані з предметом σi, але я б припустив це αi набуває різниці.


Дякую Аніко Ви маєте рацію, мої розрахунки це підтверджують, але я хотів би зрозуміти, чому ... Це здається протиінтуїтивним. Я вдосконалив моделі - вводячи випадкові ефекти, я краще описав структуру помилок. Залишкова помилка це підтверджує - все нижча і нижча. Тож із цими кращими, точнішими моделями я б очікував більш точного нахилу ... Я знаю, що десь помиляюся, будь ласка, допоможіть мені це побачити.
Цікаво

Дякую Аніко, це цікава точка зору! Мене цікавлять лише схили (Група *: Рік), не перехоплюючи тут .. тому мій перший крок введення випадкового ефекту іцепту послабив це припущення про незалежність і призвело до нижнього СЕ (схилу ..), а потім наступного кроку було, мабуть, занадто багато (??) і зробив навпаки (ще гірше SE ..) .. можливо, мені потрібно подумати про це, дякую.
Цікаво

Зараз мене також дивує дуже цікавий факт - будь ласка, дивіться мою редакцію. Чи знаєте ви, чому це?
Цікаво

Я не думаю, що припущення про незалежність було занадто послабленим! Почати було неправильно.
Аніко

3
Томаш, "точна" модель не означає, що оцінки будуть більш точними. В якості крайнього прикладу візьміть будь-яку модель, яка вам не подобається, наприклад таку, яка передбачає, що всі відповіді дорівнюють нулю. Ця модель абсолютно впевнена у своїй оцінці нуля. Тому він настільки точний, наскільки це можливо, але це, мабуть, і неправильно, наскільки це можливо. Надання моделі більшої області застосування для встановлення параметрів, тому зазвичай означає, що ці параметри підходять з меншою точністю, не більше. Краща модель, оскільки вона може кількісно оцінити невизначеність, не захоплена гіршою моделлю, часто має більші стандартні помилки.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.