Чи правильно я вказав свою модель в лмері?


26

Я переглянув безліч довідкових сайтів і все ще плутаю, як вказати складніші вкладені терміни і в змішаній моделі. Я також плутати , як використання :і /та |у визначенні взаємодій і вкладеності з випадковими чинниками , використовуючи lmer()в lme4пакеті в R.

Для цього питання припустимо, що я точно зобразив свої дані за допомогою цієї стандартної статистичної моделі: є фіксованим і є випадковим. (імпліцитно) вкладено всередині .

Yijк=у+станціяi+буксируванняj(i)+деньк+(станція×день)iк+(буксирування×день)j(i)к
stationtowdayTowstation

Іншими словами, я сподіваюся, що моя модель включає станцію (i, фіксовану), буксир (j, випадкова, неявно вкладена в межах станції), день (k, випадковий) та взаємодію між буксиром і днем, а також взаємодію між днем та Вокзал. Я порадився зі статистиком, щоб створити свою модель, і в цей час я вважаю, що вона є репрезентативною для моїх даних, але також додасть опис моїх даних для тих, хто зацікавлений внизу моєї посади, щоб не захаращувати.

Поки що мені вдалося зібрати разом, це наступне lmer:

lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day), 
     data=my.data)

Чи точно це зображує мою статистичну модель? Будь-які пропозиції щодо покращення коду, якщо він не читається правильно?

Я виділив жирним шрифтом конкретні терміни, які мені важко вказати у своїй формулі lmer

№1. буксирування, вкладене в межах станції, коли буксирування випадкове, а станція встановлена,
я збентежений, однак щодо розмежування вкладених термінів та термінів взаємодії, які використовуються випадковим чином :і /. У своєму вищенаведеному прикладі я маю (1|station:tow)на увазі, що я сподіваюся, що читає буксир, вкладений в межах станції. Я читав суперечливі коментарі на різних сайтах, чи слід використовувати я тут :чи не /у випадковому (1|...)форматі lmer.

№2. Тоді
я маю взаємодію між станцією та днем, коли станція є фіксованою, і день є випадковим , (1|station:day)але цього разу я сподіваюся, що вона читає взаємодію між станцією та днем. Здається, я міг би використовувати станцію * day для обліку індивідуальних ефектів станції та дня, а також їх взаємодії (а не включати кожен із трьох термінів окремо, як я це робив вище), але я не розумію, як це вказати коли одна фіксована, а інша - випадкова. Зробив station*(1|day)би це?

№3. Взаємодія між буксиром та днем ​​(обома випадковими), коли буксирування вкладено у станцію (фіксовано) Тоді, нарешті, у мене є те, про (1|tow:day)що я сподіваюсь, читає взаємодію towта day, але мені цікаво, чи потрібно мені ще раз вказати, що буксир вкладений (неявно) на станції?

Я новачок , як Rі lmerі статистичного моделювання і високо оцінюють тривогу ретельних пояснень в яких - або відповідей на мої питання , якщо це можливо.

Більш детально про мої дані: Я запитую, чи змінюються концентрації планктону в залежності від фізичного фронту в приморському океані. У мене є три станції, прибережні, в межах і на березі цього фронту. Станція таким чином закріплена. На кожній станції я беру по три копії планктонових буксирів (з яких сортую, рахую та отримую концентрацію у перерахунку на кількість помилок на метр кубічної води). Буксирування є випадковим: я сподіваюсь, що в три букси будувати загальну мінливість планктону на цій конкретній станції. Буксир суттєво вкладений у станцію, оскільки кожен буксир не має унікального ідентифікатора (123,123,123 - ідентифікатор для буксирів на кожній станції). Потім я робив це кілька разів, незалежними днями, з новим фронтом, який сформувався. Я думаю, що я можу вважати "День" блокуючим фактором? День є випадковим, оскільки повторення цього на декількох незалежних фронтових днях намагається захопити мінливість з дня на день і бути репрезентативним для всіх днів, де цей фронт присутній. Я хочу знати про умови взаємодії, щоб побачити, чи змінюються зміни Tows з дня на день і чи завжди станції надають подібні дані чи це залежить від дня?

Ще раз дякую за ваш час та допомогу, я ціную це!


Я вважаю, що вам не вистачає деяких підписок (я не хотів їх додавати, якщо помилявся) у вашій стандартній статистичній моделі.

1
FWIW, для кожного, хто стикається з цією темою і цікавиться, чи це на тему, враховуючи, що вона зосереджена на Rсинтаксисі, IMO, вона є достатньо статистичною (wrt розуміючи, як вказана модель стосується вкладення та взаємодії тощо), щоб бути темою. для резюме.
gung - Відновіть Моніку

1
На мою думку, це 100% на тему.


2
У відповідності з вашим lmer()синтаксисом, ви вказали модель , в якій існує фіксований ефект stationі чотири випадкових перехоплень, розділяється люди з однієї і тими ж (1) поєднаннями stationі tow, (2) значенням Day, (3) поєднанням stationі dayі ( 4) поєднання towі day, відповідно. Це те, що ви задумали? Я не впевнений, тому що, як вказує @BabekP, як ви написали формулювання своєї моделі, не ясно. Ви написали імена змінних, а не параметри. Зазвичай у подібній моделі змінні комбінації фіксуються підписниками.
Макрос

Відповіді:


23

Буксир вкладений у станцію, коли буксирування є випадковим і станція закріплена

station+(1|station:tow)правильно. Як сказав @John у своїй відповіді, (1|station/tow)він розшириться до (1|station)+(1|station:tow)(головний ефект станції плюс взаємодія між буксиром та станцією), чого ви не хочете, оскільки ви вже вказали станцію як фіксований ефект.

Взаємодія між станцією та днем, коли станція закріплена, і день є випадковим.

Взаємодія між фіксованим та випадковим ефектом завжди випадкова. Знову, як сказав @John, station*dayрозширюється до того station+day+station:day, чого ви (знову ж) не хочете, оскільки ви вже вказали dayу своїй моделі. Я не думаю, що існує спосіб зробити те, що ви хочете, і згорнути перехрещені ефекти day(випадковий) і station(фіксований), але ви можете, якщо хочете написати station+(1|day/station), на що, як зазначено в попередній відповіді, буде розширено station + (1|day) + (1|day:station).

взаємодія між буксиром та днем, коли буксирування вкладено у станцію

Тому що ви не мають унікальні значення towзмінної (тобто , тому що , як ви говорите нижче джгути визначаються як 1, 2, 3на кожній станції, ви робите , необхідно вказати вкладеності, так як (1|station:tow:day). Якщо ви дійсно були джгути визначені однозначно, ви можете використовувати або (1|tow:day)або (1|station:tow:day)(вони повинні дати еквівалентні відповіді). Якщо ви не вказуєте вкладення в цьому випадку, lme4спробуйте оцінити випадковий ефект, який ділиться буксиром №1 на всіх станціях ...

station:tow:day××

Чи корисні для Вас http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#model-specification та http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#nested-or-crossed ?


дуже дякую за корисну відповідь та посилання, вони дуже вдячні. Мене плутає позначення (1 | a: b), як ви описуєте вище, де видно, що ":" може означати "вкладене в", а також взаємодія. Як він може вказати обидва? Іншими словами, як lmer знає, на які стосунки ви вказуєте? Я, мабуть, пропускаю щось базове, вибачаюся
wtree

4
У цьому контексті немає великої різниці між взаємодією та вкладенням. Незалежно від того B, вкладений в Aабо просто взаємодіє з ним , залежить від того , основний ефект Aвключається в модель чи ні. Якщо основний ефект Bє також в моделі тоді він перетнув ...
Бен Bolker

Привіт усім, я задав відповідне запитання тут: stats.stackexchange.com/questions/272377/… якщо хтось (особливо @BenBolker) має шанс подивитися і надати відповідь.
Джошуа Розенберг

11

Деякі речі формули трохи заплутані. Це :для взаємодії між двома термінами, тоді *як для основних ефектів та взаємодій. Це /ще один для взаємодій, але те, що він робить, це генерувати взаємодію між чисельником і всіма термінами в знаменнику (наприклад A/(B+C) = A:B + A:C). Це |щось на зразок "згруповано за". Отже, 1|stationперехоплення буде згруповано по станції, а в дужках - випадково (1|station). Ось як би ви робили гніздування.

Сподіваємось, що це допомога. Це трохи дивно, щоб випадковий ефект вклався у фіксований ефект, і я не впевнений, як би ви це представляли. Я навіть не можу уявити ситуацію. Ви можете отримати кращу відповідь, якщо поясните, що саме є вашими змінними та що ви хочете виконати. Багато разів люди задають питання і неправильно використовують термінологію, і це важко спілкуватися. Поясніть, що представляють змінні та що ви хочете знати про них.

Якщо зосередитись на своєму описі в останньому абзаці, це здається, що ваш буксир - це просто показник зібраних зразків, а не те, що вам потрібно оцінювати в тому сенсі, що ви очікуєте, що буксир 1 певним чином відрізнятиметься від буксирування 2. Буксир просто вказує на зразок. Якщо ви дійсно не вірите, що порядок буксирування має значення, ви навіть не турбуєтесь про цю змінну. І якщо вони мали значення, то це фіксований ефект (і може бути випадковим, але не виключно випадковим ефектом). Ви кажете, що хочете знати, чи буксири змінюються мінливістю з дня на день. Як щодо відповіді - так? Це не в царині реальної ймовірності, що вони не змінюються з дня на день. Це просто дисперсія ваших заходів. Ти' Вам заборонено намагатися враховувати кожну специфікацію дисперсії, оскільки тоді ви не виявите жодної дисперсії для помилки. У вас буде завищена модель. Ви б опинилися в пункті просто повідомити про кожен захід.

Ви робите подібну заяву про цікавлення, чи змінюється станція в день; звичайно, так і є. Але, можливо, ви маєте на увазі конкретні дні? Чи були дні групували якимось чином за сезоном, місячним циклом тощо? Якщо у вас є щось інше, ніж тільки це день 1, це день 2 і т. Д., Як знання того, що станції змінюються день у день, говорить вам, що не відрізняється від станцій? Тож відповідь на це питання, звичайно, станції змінюються день у день. І звичайно, буксирування змінюються день у день і станція до станції. Ви залишаєте просту модель:

aov(y ~ station, data = dat)

Один фіксований ефект, який ви маєте тут, вокзал, просто відбирається на кілька буксирів і кілька днів. Я не впевнений, що вам взагалі потрібне багаторівневе моделювання. Це здається, що ви переоцінюєте свою модель.

Якщо ви дійсно хочете випадкових ефектів дня та буксирування, а тут є інформація, яку ви тут не вказали, ви можете розширити її на багаторівневу модель. Це було б:

lmer(y ~ station + (two*day|station), data = dat)

Для використання цієї моделі вам потрібно кілька буксирів на кожній станції та в день.


Я погоджуюся з усім, що ви сказали, але думаю, це, мабуть, скоріше коментар, ніж відповідь.
Макрос

@John Я був з тобою до тих пір, поки "саме так ти б робив гніздування". Я думаю, що я пропустив фактичну точку, як ви робите вкладення. Чи готові ви пояснити більш детально? Я думаю, що мене все ще бентежить | і детальніше розберемося. Але з вашої відповіді я все ще не впевнений, як, наприклад, вказати, що буксир (випадковий) вкладений в межах станції (фіксований)?
wtree

@John Oh та станція закріплена як сайти / місця, що цікавлять океан, і буксирування є випадковим, тому що я приймаю планктонні буксири на цих ділянках, які є випадковими тим, що вони намагаються врахувати мінливість планктону на кожному майданчику, а потім бути екстрапольованою. щоб представити планктонну популяцію на станції.
wtree

1
Не кожна мітка зразка є випадковою змінною, див. Правки.
Джон

1
Я все ще думаю, що тягач взагалі не повинен бути в моделі з огляду на це опис. Хоча день звучить чудово.
Джон
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.