Р-ль шпаргалка


160

На цьому форумі триває багато дискусій щодо правильного способу визначення різних ієрархічних моделей за допомогою lmer .

Я думав, що було б чудово мати всю інформацію в одному місці. Кілька питань для початку:

  1. Як вказати кілька рівнів, де одна група вкладена в межах іншої: це (1|group1:group2)чи(1+group1|group2) ?
  2. Яка різниця між (~1 + ....)і (1 | ...)та(0 | ...) ін?
  3. Як вказати взаємодії на рівні групи?

11
В ручної і три віньєтки для lme4пакета можна знайти на CRAN
Генрі

4
На додаток до матеріалів CRAN, слайди лекцій та чернетки розділів книги, яку Дуг пише на (G) LMMs та R з lme4, доступні в r-forge
Гевін Сімпсон,

Пряме посилання на версію arXiv статті JSS від Bates et al .: Встановлення лінійних моделей змішаних ефектів за допомогою lme4 (зокрема, Розділ 2.2 «Розуміння формул змішаної моделі»). Дивіться також відповідний розділ FAQ Бен Болкер.
амеба

5
Можливо, мова, яка використовується, lmerстановить загальний статистичний інтерес, і тому не є лише питанням програмування. Тому я голосую за те, щоб ця тема була відкритою.
whuber

2
@whuber +1 Повністю згоден.
амеба

Відповіді:


180

Яка різниця між (~ 1 + ....) та (1 | ...) та (0 | ...) тощо?

Скажімо, у вас є змінна V1, передбачена категоричною змінною V2, яка трактується як випадковий ефект, і безперервною змінною V3, яка трактується як лінійний фіксований ефект. За допомогою синтаксису lmer найпростіша модель (M1):

V1 ~ (1|V2) + V3

Ця модель оцінить:

P1: глобальний перехоплення

P2: Перехоплення випадкових ефектів для V2 (тобто для кожного рівня V2, відхилення перехоплення цього рівня від глобального перехоплення)

P3: Єдина глобальна оцінка ефекту (нахилу) V3

Наступна найскладніша модель (M2):

V1 ~ (1|V2) + V3 + (0+V3|V2)

Ця модель оцінює всі параметри з M1, але додатково оцінить:

P4: Ефект V3 в межах кожного рівня V2 (точніше, ступінь, в якому ефект V3 в межах заданого рівня відхиляється від глобального ефекту V3), одночасно забезпечуючи нульову кореляцію між відхиленнями перехоплення та відхиленнями ефекту V3 по всіх рівнях V2 .

Останнє обмеження знімається в остаточній найскладнішій моделі (M3):

V1 ~ (1+V3|V2) + V3

У якому всі параметри від М2 оцінюються, забезпечуючи кореляцію між відхиленнями перехоплення та відхиленнями ефекту V3 в межах рівнів V2. Таким чином, у M3 оцінюється додатковий параметр:

P5: Кореляція між відхиленнями перехоплення та відхиленнями V3 по рівнях V2

Зазвичай пари моделей, такі як M2 і M3, обчислюються, а потім порівнюються для оцінки доказів кореляції між фіксованими ефектами (включаючи глобальний перехоплення).

Тепер розглянемо додавання іншого прогноктора фіксованого впливу, V4 Модель:

V1 ~ (1+V3*V4|V2) + V3*V4

оцінив би:

P1: глобальний перехоплення

P2: Єдина глобальна оцінка ефекту V3

P3: Єдина глобальна оцінка ефекту V4

P4: Єдина глобальна оцінка взаємодії між V3 та V4

P5: Відхилення перехоплення від P1 на кожному рівні V2

P6: Відхилення ефекту V3 від P2 на кожному рівні V2

P7: Відхилення ефекту V4 від P3 на кожному рівні V2

P8: Відхилення взаємодії V3-на-V4 від P4 на кожному рівні V2

P9 Кореляція між P5 і P6 в рівнях V2

P10 Кореляція між P5 і P7 за рівнями V2

P11 Кореляція між P5 та P8 у рівнях V2

P12 Кореляція між P6 та P7 в рівнях V2

P13 Кореляція між P6 та P8 в рівнях V2

P14 Кореляція між P7 та P8 за рівнями V2

Фу , це багато параметрів! І я навіть не намагався перераховувати параметри дисперсії, оцінені моделлю. Більше того, якщо у вас є категоріальна змінна з більш ніж двома рівнями, які ви хочете моделювати як фіксований ефект, замість одного ефекту для цієї змінної ви завжди будете оцінювати k-1 ефекти (де k - кількість рівнів) , тим самим ще більше вибухнувши кількість параметрів, що оцінюються моделлю.


1
@Mike Lawrence Дякую за відповідь! як оцінюється модель 3 рівня тоді? де один фактор групування вкладений в інший?

DBR, я не думаю, що ви знаєте, що таке рівні. Ви про це просили назавжди. Створіть питання, яке фактично деталізує ваш дизайн експерименту та демонструє вашу інтерпретацію рівня.
Джон

3
Я думаю, що DBR має на увазі рівні в ієрархії. Те, що я описав, є ієрархічною моделлю на 2 рівні, із спостереженнями, закладеними в предметах, і DBR запитує про 3-рівневі ієрархії, прикладом яких можуть бути тестові завдання в межах учнів у школах, де ви хочете моделювати як учнів, так і школи як випадкові Ефекти, коли учні вкладаються в школи. У таких випадках я припускаю, що відхилення на рівні школи спочатку обчислюються, а потім відхиляються від школяра.
Майк Лоуренс

2
Найкраща відповідь, яку я бачив за налаштування моделей. Допоміг мені забезпечити просту основу для свого боса, щоб зрозуміти, що я роблю в R з lmer.
bfoste01

Yij=γ00+γ10Хij+γ01Zj+γ11ХijZj+у1jХij+у0j+еij
iijjlmerY~X+Z+(1|group)+(0+X|Z)group

50

Загальна хитрість, як згадується в іншій відповіді , полягає в тому, що формула йде за формою dependent ~ independent | grouping. Як groupingправило, випадковий коефіцієнт, ви можете включати фіксовані фактори без будь-якої групування, і ви можете мати додаткові випадкові коефіцієнти без будь-якого фіксованого фактора (модель, що перехоплює лише). А +між факторами вказує на відсутність взаємодії, а *на взаємодію.

Для випадкових факторів у вас є три основні варіанти:

  1. Перехоплення лише випадковим фактором: (1 | random.factor)
  2. Нахили лише випадковим фактором: (0 + fixed.factor | random.factor)
  3. Перехоплення та нахили випадковим фактором: (1 + fixed.factor | random.factor)

Зауважимо, що варіант 3 має нахил і перехоплення, обчислені в одній групі, тобто одночасно. Якщо ми хочемо, щоб нахил і перехоплення розраховувались незалежно, тобто без будь-якої припущеної кореляції між ними, нам потрібен четвертий варіант:

  • Intercept і нахил, окремо від випадкового фактора: (1 | random.factor) + (0 + fixed.factor | random.factor). Альтернативним способом написання цього є використання двозначної позначення fixed.factor + (fixed.factor || random.factor).

Також є приємне резюме в іншій відповіді на це питання, яку ви повинні подивитися.

Якщо ви хочете трохи зануритися в математику, Барр та ін. (2013) lmerдосить добре узагальнити синтаксис у таблиці 1, адаптованій тут, щоб відповідати обмеженням безмітного розмітки. У цьому документі розглядалися психолінгвістичні дані, тому два випадкові ефекти є SubjectіItem .

Моделі та еквівалентний lme4синтаксис формули:

    • Yсi=β0+β1Хi+есi
    • Не застосовується (не модель змішаних ефектів)
    • Yсi=β0+S0с+β1Хi+есi
    • Y ∼ X+(1∣Subject)
    • Yсi=β0+S0с+(β1+S1с)Хi+есi
    • Y ∼ X+(1 + X∣Subject)
    • Yсi=β0+S0с+Я0i+(β1+S1с)Хi+есi
    • Y ∼ X+(1 + X∣Subject)+(1∣Item)
    • Yсi=β0+S0с+Я0i+β1Хi+есi
    • Y ∼ X+(1∣Subject)+(1∣Item)
    • S0сS1с
    • Y ∼ X+(1∣Subject)+(0 + X∣ Subject)+(1∣Item)
    • Yсi=β0+Я0i+(β1+S1с)Хi+есi
    • Y ∼ X+(0 + X∣Subject)+(1∣Item)

Список літератури:

Barr, Dale J, R. Levy, C. Scheepers und HJ Tily (2013). Структура випадкових ефектів для перевірки підтверджувальної гіпотези: Тримайте її максимально . Журнал пам’яті та мови, 68: 255–278.


4
Приємно. Це може бути краще з інформацією про вкладені '/' фактори та подвійні позначення '||'
скан

1
Що з символом:
eastafri

1
@eastafri Це означає, що те саме, що робиться скрізь у R (формулах) - взаємодія між двома змінними.
Лівій

S0сS1с0S0сS1с

4

The |Символ вказує на угруповання фактора в змішаних методів.

Відповідно до Pinheiro & Bates:

... Формула також позначає відповідь і, коли є така можливість, первинний коваріат . Дано як

response ~ primary | grouping

де responseє вираз для відповіді, primaryце вираз для первинного коваріату і groupingє виразом для групуючого фактора.

Залежно від того, який метод ви використовуєте для аналізу змішаних методів R, можливо, вам знадобиться створити groupedDataоб'єкт, щоб мати можливість використовувати групування в аналізі ( nlmeдеталі див. У пакеті, lme4схоже , це не потрібно). Я не можу говорити з тим, як ви вказали свої lmerзаяви про модель, тому що я не знаю ваших даних. Однак мати декілька (1|foo)в модельній лінійці незвично від того, що я бачив. Що ви намагаєтеся моделювати?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.