Чи слід моделювати різницю між контролем та лікуванням явно або неявно?


9

З огляду на наступні експериментальні установки:

Кілька зразків відбирають у суб'єкта, і кожен зразок обробляється декількома способами (включаючи контрольну обробку). Що в основному цікаво, це різниця між контролем та кожним лікуванням.

Я можу придумати дві прості моделі для цих даних. Зразкомi, лікування j, лікування 0 як контроль, нехай Yij бути даними, γi бути базовою лінією для вибірки i, δj бути різницею для лікування j. Перша модель розглядає як управління, так і різницю:

Yij=γi+δj+ϵij
δ0=0

У той час як друга модель дивиться лише на різницю. Якщо ми проводимо попередній розрахунокdij заздалегідь

dij=YijYi0
тоді
dij=δj+εij

Моє запитання - які принципові відмінності між цими двома установками? Зокрема, якщо рівні самі по собі безглузді і має значення лише різниця, чи перша модель робить занадто багато і, можливо, недооцінена?


2
Я можу дати більш ґрунтовну відповідь пізніше, але я б припустив, що цей документ Пол Еллісон буде цікавим ( Allison, 1990 ).
Andy W

1
Відредаговано так, щоб відображати той факт, що помилки в різних моделях насправді не однакові, а отже, не слід використовувати однакові символи.
Ронан Далі

Відповіді:


6

The ϵij ймовірно, вони будуть корельованими у другій моделі, але не в першій.

По-перше, ці терміни представляють похибку вимірювання та відхилення від адитивної моделі. При розумній обережності - наприклад, шляхом рандомізації послідовності вимірювань - ці помилки можна зробити незалежними, коли модель точна. Звідси

dij=YijYi0=γi+δj+ϵij(γi+δ0+ϵi0)=δj+(ϵijϵi0).

(Зауважте, що це суперечить останньому рівнянню у питанні, оскільки це неправильно вважати ϵi0=0. Це може змусити нас визнати цеγiє випадковими змінними, а не параметрами, принаймні один раз ми визнаємо можливість помилки вимірювання для управління. Це призведе до тих же висновків нижче.)

Для j,k0, jk це означає

Cov(dij,dik)=Cov(ϵijϵi0,ϵikϵi0)=Var(ϵi0)0.

Кореляція може бути істотною. Для помилок iid аналогічний розрахунок показує, що він дорівнює 0,5. Якщо ви не використовуєте процедур, які явно і правильно обробляють цю кореляцію, надайте перевагу першій моделі над другою.


Отже, ви припустили, що перша модель є справжньою моделлю і отримала небажану властивість другої моделі. Ми знаємо, що всі моделі помиляються, чи справді цей результат має значення?
Макрос

1
@Macro Прочитайте більш уважно мою відповідь: вона створена, щоб показати, які припущення потрібні для обґрунтування першої моделі та відмежування її від другої, але не містить припущень про те, що будь-яка модель є "правдою". Наприклад, зверніть увагу на застереження "коли модель є точною". Навіть слово "точне" було обрано з певною думкою, щоб уникнути помилкового враження, що існує "справжня" чи "правильна" модель.
whuber

1
Я трохи розгублений, що таке dik?
Енді Ш

1
@Andy j і kіндексувати два різних способи лікування. Я мав би написати «Заj,k0... "; я
виправлю

@whuber Чи є посилання, які підтримують вашу заяву, наприклад, щоб переконати рецензентів?
Даніель
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.