Запитання щодо визначення лінійних змішаних моделей у R для даних повторних вимірювань з додатковою структурою вкладення


10

Структура даних

> str(data)
 'data.frame':   6138 obs. of  10 variables:
 $ RT     : int  484 391 422 516 563 531 406 500 516 578 ...
 $ ASCORE : num  5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ...
 $ HSCORE : num  6 2.1 7.9 1 6.9 8.9 8.2 3.6 1.7 8.6 ...
 $ MVMNT  : Factor w/ 2 levels "_Withd","Appr": 2 2 1 1 2 1 2 1 1 2 ...
 $ STIM   : Factor w/ 123 levels " arti"," cele",..: 16 23 82 42 105 4 93 9 34 25 ...
 $ DRUG   : Factor w/ 2 levels "Inactive","Pharm": 1 1 1 1 1 1 1 1 1 1 ...
 $ FULLNSS: Factor w/ 2 levels "Fasted","Fed": 2 2 2 2 2 2 2 2 2 2 ...
 $ PATIENT: Factor w/ 25 levels "Subj01","Subj02",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ SESSION: Factor w/ 4 levels "Sess1","Sess2",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ TRIAL  : Factor w/ 6138 levels "T0001","T0002",..: 1 2 3 4 5 6 7 8 9 10 ...

Повна модель кандидата

model.loaded.fit <- lmer(RT ~ ASCORE*HSCORE*MVMNT*DRUG*FULLNSS
                              + (1|PATIENT) + (1|SESSION), data, REML = TRUE)
  • Часи реакцій в ході випробувань кластеризуються в межах сеансів, які, в свою чергу, кластеризуються у пацієнтів
  • Кожне випробування можна охарактеризувати двома безперервними коваріатами ASCORE та HSCORE (в межах від 1 до 9) та реакцією на рух (відкликання або наближення)
  • Сеанси характеризуються прийомом наркотиків (плацебо або активних фармаконів) та повнотою (голодною або перед годуванням)

Моделювання та синтаксис R?

Я намагаюся вказати відповідну повну модель із завантаженою середньою структурою, яку можна використовувати як вихідну точку в стратегії вибору моделі зверху вниз.

Конкретні проблеми:

  • Чи правильно вказаний синтаксис кластеризації та випадкових ефектів?
  • Окрім синтаксису, чи підходить ця модель для вищевказаного внутрішнього предмета?
  • Чи повинна повна модель визначати всі взаємодії фіксованих ефектів або лише ті, які мене справді цікавлять?
  • Я не включив коефіцієнт STIM в модель, яка характеризує тип певного стимулу, який використовується в дослідженні, але який я не зацікавлений ні в якому разі оцінювати - чи слід зазначити, що як випадковий коефіцієнт, що враховує його, має 123 рівня і дуже мало бали даних за типом стимулу?

якщо я не можу знайти тут поради, я дійсно не знаю, кого я можу запитати? можливо ви знаєте про будь-які виділені форуми для змішаних моделей або навіть експерта, готового порадитися за невеликі гроші?
Сел

3
Привіт @Cel, схоже, у вас є ВСІ взаємодії в моделі, включаючи 5-ти, 4-х та 3-х напрямків. Я не впевнений у цьому випадку, але це, як правило, дико перевищує дані, що зробить ваші результати менш узагальненими. Зворотний вибір (якщо його потрібно використовувати) не потрібно починати з повністю насиченої моделі - він повинен починатися з найбільшої моделі, яку ви вважаєте правдоподібною. Чи можете ви взагалі зменшити це?
Макрос

@Macro Чудово знати, я включатиму лише ті взаємодії, які здаються правдоподібними. Чи є у вас пропозиції щодо інших питань? якщо ви це зробите, можливо, поставте це як відповідь, щоб я міг прийняти це.
Сел

Відповіді:


16

Я відповім на кожен ваш запит по черзі.

Чи правильно вказаний синтаксис кластеризації та випадкових ефектів?

Модель, яку ви тут вписуєте, - математично, модель

Yijk=Xijkβ+ηi+θij+εijk

де

  • k j iYijk - час реакції на спостереження під час сеансу на окремих .kji

  • kjiXijk - вектор предиктора для спостереження під час сеансу на окремих (у написаній вами моделі це складається з усіх основних ефектів та всіх взаємодій).kji

  • i θ i jηi є людина випадковий ефект , який індукує кореляції між спостереженнями , зробленими на одну людину. є випадковим ефектом для індивідуального «и сесії і є терміном помилки пережитку.iθijj ε i j kijεijk

  • β - вектор коефіцієнта регресії.

Як зазначається на сторінці 14-15, ця модель є правильною для того, щоб вказати, що сеанси вкладені в осіб, що стосується вашого опису.

Окрім синтаксису, чи підходить ця модель для вищевказаного внутрішнього предмета?

Я думаю, що ця модель є розумною, оскільки вона поважає структуру вкладених даних, і я думаю, що індивідуальність та сеанс розумно розглядаються як випадкові ефекти, як стверджує ця модель. Ви повинні подивитися на зв’язки між предикторами та відповіддю з розсіювачами тощо, щоб переконатися, що лінійний предиктор ( ) правильно вказаний. Можливо, також слід вивчити іншу стандартну регресійну діагностику.Xijkβ

Чи повинна повна модель визначати всі взаємодії фіксованих ефектів або лише ті, які мене справді цікавлять?

Я думаю, що починати з такої сильно насиченої моделі може не чудова ідея, якщо це не має сенсу змістовно. Як я вже говорив у коментарі, це, як правило, перевищує ваш набір даних і може зробити ваші результати менш узагальненими. Що стосується вибору моделі, якщо ви починаєте з повністю насиченої моделі і здійснюєте вибір назад ( що деякі люди на цьому веб-сайті з поважною причиною заперечують ), то вам доведеться дотримуватися ієрархію моделі. Тобто, якщо ви виключите взаємодію нижчого рівня з моделі, ви також повинні видалити всі взаємодії вищого рівня, що включають цю змінну. Для більш детальної дискусії з цього питання дивіться зв'язану нитку.

Я не включив коефіцієнт STIM в модель, яка характеризує тип певного стимулу, який використовується в дослідженні, але який я не зацікавлений ні в якому разі оцінювати - чи слід зазначити, що як випадковий коефіцієнт, що враховує його, має 123 рівня і дуже мало бали даних за типом стимулу?

Справді, нічого не знаючи про додаток (тому прийміть це із зерном солі), це звучить як фіксований ефект, а не випадковий ефект. Тобто тип лікування звучить як змінна, яка відповідала б фіксованому зрушенню середньої відповіді, а не те, що могло б викликати кореляцію між суб'єктами, які мали однаковий тип стимулу. Але той факт, що це фактор 123 рівня, робить його громіздким увійти в модель. Я думаю, я хотів би знати, наскільки великий ефект ви б очікували від цього. Незалежно від розміру ефекту, це не спричинить упередженості у ваших оцінках нахилу, оскільки це лінійна модель, але, якщо вийти з нього, можливо, ваші стандартні помилки будуть більшими, ніж вони були б інакше.


2
Ого. дякую макро, я хотів би, щоб я міг дати більше очок.
Сел

Оскільки випадкові ефекти перехрещені, а не випадкові, чи повинні позначення бути та (а не ), оскільки оскільки він схрещений (а не вкладений) з пацієнтом? θ j θ jηiθjθj
Джошуа Розенберг
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.