Як я інтерпретую "кореляції фіксованих ефектів" у своєму виведенні з блиску?


26

У мене є такий результат:

Generalized linear mixed model fit by the Laplace approximation 
Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape) 

 AIC   BIC    logLik deviance
 4062  4093  -2022   4044

Random effects:
Groups    Name        Variance Std.Dev.
landscape (Intercept) 0.82453  0.90804 
Number of obs: 239, groups: landscape, 45

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  2.65120    0.14051  18.868   <2e-16     
sMFS2        0.26922    0.17594   1.530   0.1260    
sAG2         0.09268    0.14529   0.638   0.5235    
sSHDI2       0.28345    0.17177   1.650   0.0989  
sbare        0.41388    0.02976  13.907   <2e-16 
seasonlate  -0.50165    0.02729 -18.384   <2e-16 
cropforage   0.79000    0.06724  11.748   <2e-16 
cropsoy      0.76507    0.04920  15.551   <2e-16 

Correlation of Fixed Effects:
           (Intr) sMFS2  sAG2   sSHDI2 sbare  sesnlt crpfrg
sMFS2      -0.016                                          
sAG2        0.006 -0.342                                   
sSHDI2     -0.025  0.588 -0.169                            
sbare      -0.113 -0.002  0.010  0.004                     
seasonlate -0.034  0.005 -0.004  0.001 -0.283              
cropforage -0.161 -0.005  0.012 -0.004  0.791 -0.231       
cropsoy    -0.175 -0.022  0.013  0.013  0.404 -0.164  0.557

Всі мої безперервні змінні (позначаються малим sперед назвою змінної) стандартизовані (z-бали). season- категоріальна змінна з 2 рівнями (ранній і пізній) і cropє категоріальною змінною з 3 рівнями (кукурудза, корм та соя).

Це співвідношення матриці фіксованих ефектів мене дійсно бентежить, оскільки всі кореляції мають протилежний знак, який вони роблять, коли я дивлюся на прості регресії пар змінних. тобто кореляція матриці фіксованих ефектів говорить про сильну позитивну кореляцію між, cropforageа sbareнасправді існує дуже сильна НЕГАТИВНА кореляція між цими змінними - кормові культури, як правило, мають набагато менше оголеного ґрунту порівняно з посівами кукурудзи та сої. Пари безперервних змінних мають однакове питання, кореляція матриці фіксованих ефектів говорить про те, що все протилежне тому, що має бути ... Чи може це бути лише через складність моделі (не простої регресії)? Чи може це мати щось спільне з тим, що змінні стандартизовані?

Спасибі.

Відповіді:


27

Вихід "кореляції фіксованих ефектів" не має інтуїтивного значення, яке б йому приписали більшість. Зокрема, мова не йде про співвідношення змінних (як зазначає ОП). Мова йде насправді про очікуване співвідношення коефіцієнтів регресії. Хоча це може говорити про мультиколінеарність, це не обов'язково. У цьому випадку це говорить вам про те, що якщо ви зробили експеримент ще раз, і так сталося, що коефіцієнт для cropforageзменшився, швидше за все, це також буде коефіцієнтом sbare.

Частково його книга "Аналіз лінгвістичних даних: практичне вступ до статистики за допомогою R", що стосується lme4, Бааєн пригнічує цю частину результату і оголошує її корисною лише в особливих випадках. Ось список listserv, де сам Бейтс описує, як інтерпретувати цю частину виводу:

Це приблизне співвідношення оцінювача фіксованих ефектів. (Я включаю слово "приблизний", тому що я повинен, але в цьому випадку наближення дуже добре.) Я не знаю, як це краще пояснити. Припустимо, що ви взяли зразок MCMC з параметрів моделі, тоді ви очікуєте, що вибірка параметрів фіксованих ефектів відображатиме структуру кореляції, як ця матриця.


3
Вибачте, це, мабуть, буде дурним питанням, але тоді чому важливо враховувати цю кореляцію? Я маю на увазі, в яких ситуаціях слід розглядати цей результат?
mtao

1
@Teresa Це залежить від того, для чого ти його використовуєш. Якщо ви дбаєте про інтерпретацію, то це говорить вам про те, наскільки конфузні два джерела ефекту. Якщо ви дбаєте про передбачення, це трохи розповість про те, як можуть виглядати інші моделі прогнозування, і дає вам деякий підказку щодо того, як може змінитися модель, якщо ви скинете прогнози.
russellpierce

1
Отже, уявіть, що у мене є дві змінні у цьому виході з співвідношенням 0,90, наприклад. З точки зору тлумачення, я припускаю, що я мушу відмовитись одній із них, оскільки вони "заплутані" і, здається, розповідають ту ж інформацію. Що стосується прогнозування, якщо я скину одну з них, інші моделі не повинні так сильно змінюватись, оскільки вони співвідносяться, я прав? Або я неправильно трактую це?
mtao

3
Знаєте, я думаю, ви повторюєте те, що я сказав правильно; але, поміркувавши, я не впевнений, що я стовідсотковий. Вам, можливо, найкраще послужить, відкривши нове запитання - це приверне більше уваги до вашого питання і збільшить ймовірність отримання правильної відповіді.
russellpierce

1
@russellpierce, дякую за цю відповідь. Хоча з одного питання я дізнався, що мультиколінеарність виникає тоді, коли предиктори співвідносяться між собою. Але у своїй відповіді ви говорите, що кореляція коефіцієнтів регресії (а не прогнозів) може говорити про мультиколінеарність. Чому б не просто співвіднести самі прогнози замість розрахункових коефіцієнтів?
локус

0

Якщо ваші негативні та позитивні кореляції однакові за значенням і відрізняються лише їх ознакою, ви вводите змінну помилково. Але я не думаю, що це стосується вас, оскільки ви вже здаєтеся досить просунутими в статистиці.

Невідповідність, яку ви відчуваєте, може бути і, ймовірно, викликана мультиколінеарністю. Це означає, коли деякі незалежні змінні діляться деякими перекритими ефектами або іншими словами співвідносяться між собою. наприклад, моделювання змінних "швидкість росту" та "розмір пухлини" може спричинити мультиколінеарність, оскільки це можливо та ймовірно, що більші пухлини мають більш високі темпи росту (до їх виявлення) як такі. Це може заплутати модель. І якщо у вашій моделі є кілька незалежних змінних, які співвідносяться між собою, інтерпретувати результати іноді може стати досить складно. Іноді це призводить до абсолютно дивних коефіцієнтів, навіть до таких розширень, що ознака деяких кореляцій повертається назад.

Спершу слід виявити джерела мультиколінеарності та розібратися з ними, а потім повторити аналіз.


1
-1; введення в оману. ОП не ввів свої змінні неправильно, і мультиколінеарність може не бути проблемою. Кореляція між необмеженими фіксованими ефектами може говорити про це, але парадокс Сімпсона може дозволити такому підходу вести вас у неправильному напрямку.
russellpierce

1
Чому "вводити в оману"? Яка частина була оманливою? Я говорив дуже чітко і уникав чітких висновків. Те, що я сказав, справді є одним із знаків мультиколінеарності і говорить нам, що ми також повинні перевірити ВІФ. Але я не розумію, як ви знаєте чи впевнені, що "ОП не ввів свої змінні неправильно, і мультиколінеарність може не бути проблемою".
Вік

1
Окрім того, ви навіть не прочитали повністю мою публікацію (і оскаржили її і називали її оманливою). Якби у вас було, ви бачили, що я запропонував ОП перевірити ВІФ (як офіційні показники для мультиК), щоб переконатися, чи справді ці високі кореляції вказують на МС чи ні? але в будь-якому випадку я відкритий для навчання, доки він не має зарозумілості та особистих нападів.
Вік

1
@Vic: Не бачив ваших коментарів лише зараз. Я не мав на увазі, щоб ви розглядали мою реакцію як особисту атаку. Я вважав, що це вводить в оману, і я надав те, що, на мою думку, є правильною відповіддю вище. Я прочитав ваш пост у повному обсязі на той час. Я не знаю, заглиблювався я в коментарі чи ні. Я стою поруч із своєю головою.
russellpierce

1
... але я допускаю, що я можу помилитися в цьому суді. Однак, здавалося, краще пояснити, чому я виступав проти, а не просто виступав проти.
russellpierce

0

Це може бути корисно показати, що ці кореляції між фіксованими ефектами отримуються шляхом перетворення "vcov" моделі в матрицю кореляції. Якщо fitваша відповідна модель lme4, значить

vc <- vcov(fit)

# diagonal matrix of standard deviations associated with vcov
S <- sqrt(diag(diag(vc), nrow(vc), nrow(vc)))

# convert vc to a correlation matrix
solve(S) %*% vc %*% solve(S)

і кореляції між фіксованими ефектами є позадіагональними записами.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.