Інтерпретація трьох форм "змішаної моделі"


19

Існує відмінність, яка мене спонукає до змішаних моделей, і мені цікаво, чи зможу я отримати трохи ясності. Припустимо, у вас є змішана модель підрахунку даних. Є змінна, яку ви знаєте, що ви хочете як фіксований ефект (A), і інша змінна для часу (T), згрупована за словами змінної "Site".

Як я це розумію:

glmer(counts ~ A + T, data=data, family="Poisson") - це модель з фіксованими ефектами.

glmer(counts ~ (A + T | Site), data=data, family="Poisson") є випадковою моделлю ефектів.

Моє запитання, коли у вас є щось на кшталт:

glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")що таке Т? Це випадковий ефект? Фіксований ефект? Що насправді досягається, поставивши T в обидва місця?

Коли щось повинно з’являтися лише в розділі випадкових ефектів формули моделі?

Відповіді:


22

Це може стати зрозумілішим, виписавши формулу моделі для кожної з цих трьох моделей. Нехай Yij є спостереженням для людини i на сайті j у кожній моделі та визначимо Аij,Тij аналогічно для позначення змінних у вашій моделі.

glmer(counts ~ A + T, data=data, family="Poisson") є модель

log(E(Yij))=β0+β1Aij+β2Tij

що є лише звичайною пуассоновою регресійною моделлю.

glmer(counts ~ (A + T|Site), data=data, family="Poisson") є модель

log(E(Yij))=α0+ηj0+ηj1Aij+ηj2Tij

де - випадкові ефекти, які поділяються кожним спостереженням, зробленими людьми з сайту j . Ці випадкові ефекти дозволяють вільно співвідносити (тобто обмеження щодо Σ не робляться) у вказаній вами моделі. Щоб нав'язати незалежність, ви повинні розмістити їх у різних дужках, наприклад,це зробить. Ця модель передбачає цей журнал ( E ( Y i jηj=(ηj0,ηj1,ηj2)N(0,Σ)jΣ(A-1|Site) + (T-1|Site) + (1|Site) є α 0 для всіх сайтів, але кожен сайт має випадкове зміщення ( η j 0 ) і має випадковий лінійний зв’язок з обома A i j , T i j .журнал(Е(Yij))α0ηj0Аij,Тij

glmer(counts ~ A + T + (T|Site), data=data, family="Poisson") є модель

журнал(Е(Yij))=(θ0+γj0)+θ1Аij+(θ2+γj1)Тij

Тож тепер має деяку "середню" залежність з A i j , T i j , задану фіксованими ефектами θ 0 , θ 1 , θжурнал(Е(Yij))Аij,Тij але це відношення є різним для кожного сайту та тими відмінностями вловлюються випадковими ефектами, γ j 0 , γ j 1 , γ j 2θ0,θ1,θ2γj0,γj1,γj2. Тобто, основна лінія зміщена випадковим чином, і нахили двох змінних випадковим чином зміщуються, і всі з одного сайту ділять однаковий випадковий зсув.

що таке Т? Це випадковий ефект? Фіксований ефект? Що насправді досягається, поставивши T в обидва місця?

- один із ваших коваріатів. Це не випадковий ефект -це випадковий ефект. Існує фіксований ефект T, який відрізняється залежно від випадкового ефекту, наданого- γ j 1 у наведеній вище моделі. Що досягається включенням цього випадкового ефекту, це дозволити гетерогенність між ділянками у співвідношенні між T і log ( E ( Y i j ) ) .ТSiteТSiteγj1Тжурнал(Е(Yij))

Коли щось повинно з'являтися лише у розділі випадкових ефектів формули моделі?

Це питання про те, що має сенс у контексті програми.

Щодо перехоплення - вам слід тримати фіксований перехоплення там з багатьох причин (див., Наприклад, тут ); re: випадковий перехоплення , це в першу чергу діє, щоб викликати кореляцію між спостереженнями, зробленими на одному і тому ж місці. Якщо такої кореляції немає сенсу існувати, випадковий ефект слід виключити.γj0

Що стосується випадкових нахилів, модель лише з випадковими нахилами та без фіксованих нахилів відображає думку про те, що для кожного сайту існує деяка залежність між та вашими коваріатами для кожного сайту, але якщо ви середньостатистично оцінюєте ці ефекти над усіма сайтами, тоді жодних стосунків немає. Наприклад, якщо у вас був T випадковий нахил у T, але немає фіксованого нахилу, це було б так, якбисказати, що час у середньому не має ефекту (наприклад, немає світських тенденцій у даних), але коженрухається у випадковому напрямку в часі, що могло б мати сенс. Знову ж таки, це залежить від програми.журнал(Е(Yij))ТSite

Зауважте, що ви можете підходити до моделі і без випадкових ефектів, щоб побачити, чи відбувається це - у фіксованій моделі ви не повинні бачити жодного ефекту, але значущих випадкових ефектів у наступній моделі. Маю застерегти, що подібні рішення часто краще приймати на основі розуміння програми, а не через вибір моделі.


2
(+1): складання формули моделі для кожної моделі - це справді найкращий спосіб зробити R-позначення більш прозорими; хороша робота!
ocram

@Macro Одне запитання щодо рівнянь вище (спасибі їм btw) - чи в них також є звичайний термін помилки? Якщо так, то який підпис цього терміна?
Фоміт

2
Е(Yij|Х)Yij|Х
Макро

11

Слід зазначити, що Tжодна з вашої моделі не є випадковими ефектами, а фіксованим ефектом. Випадкові ефекти є лише ті ефекти , які з'являються після того , як |в lmerформулі!

Більш ретельне обговорення того, що ця специфікація, ви можете знайти у цьому питанні lmer faq .

З цих питань ваша модель повинна дати наступне (для вашого фіксованого ефекту T):

  • Глобальний схил
  • Довільний нахил, який визначає відхилення від загального нахилу для кожного рівня Site
  • Кореляція між випадковими нахилами.

І як зазначає @ mark999, це дійсно є загальною специфікацією. У повторних проектах заходів, як правило, ви хочете мати випадкові нахили та кореляції для всіх повторних заходів (у межах суб'єктів) факторів.

Дивіться наступний документ для деяких прикладів (які я, як правило, завжди цитую тут):

Judd, CM, Westfall, J., & Kenny, DA (2012). Трактування подразників як випадковий фактор соціальної психології: нове і всебічне рішення поширеної, але значною мірою ігнорованої проблеми. Журнал особистості та соціальної психології , 103 (1), 54–69. doi: 10.1037 / a0028347


2
Аналогічна довідка з екології: Schielzeth, Holger та Wolfgang Forstmeier. 2009. «Висновки поза підтримкою: оцінки самовпевненості в змішаних моделях». Екологія поведінки 20 (2) (1 березня): 416–420. doi: 10.1093 / beheco / arn145. beheco.oxfordjournals.org/content/20/2/416 .
Бен Болкер

1

Щось повинно з’являтися лише у випадковій частині, коли вас особливо не цікавить його параметр, але потрібно включити його, щоб уникнути залежних даних. Наприклад, якщо діти вкладені на заняттях, ви зазвичай хочете дітей лише як випадковий ефект.


1
Можливо, я вас нерозумію, але я б подумав, що встановлення фіксованих та випадкових ефектів для однієї змінної є більш поширеним, ніж змінна, яка має лише випадковий ефект. Закріплені та випадкові ефекти для однієї змінної не є рідкістю у книзі Пінхеро та Бейтса.
mark999

2
@MichaelChernick, як я розумію, якщо у вас є фіксований ефект і випадковий ефект для однієї змінної, то фіксований ефект є загальним ефектом у сукупності, тоді як випадковий ефект дозволяє різний ефект змінної для кожного суб'єкта. Є кілька прикладів у Pinheiro & Bates.
mark999

2
@PeterFlom, re: "якщо діти вкладені на заняттях, ви зазвичай хочете дітей лише як випадковий ефект". Я думаю, ти маєш на увазі, що клас - це випадковий ефект. Якщо додаткові дані не вводяться (наприклад, повторні вимірювання дітей), випадкові наслідки на рівні дітей не визначаються.
Макрос

1
@macro Так, це я мав на увазі, вибачте. Термінологія стає дуже заплутаною! Ось чому Гельман уникає термінів "фіксований" та "випадковий"
Пітер Флом - Відновлення Моніки

2
@Michael, я згоден з тобою. У таких видах ієрархічних моделей випадкові ефекти визначаються змінною групування (на відміну від інших багатоваріантних моделей, таких як просторово індексовані набори даних, де змінна група "постійно" змінюється). На питання , що ОП, в Siteзгадуватиметься як випадковий ефект, а НЕ Tабо Aабо що - небудь ще. Думаючи про це таким чином, Siteефект явно не міг бути як фіксованим, так і випадковим, оскільки вони не будуть ідентифіковані один від одного. Ви можете мати як фіксовані, так і випадкові коефіцієнти для змінної, але це інше питання.
Макрос
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.