Щоб відповісти на ваше буквальне запитання: "Чи справедливо включати базовий показник як контрольну змінну при тестуванні впливу незалежної змінної на бали змін?", Відповідь - ні . Відповідь "ні", оскільки, будуючи базовий бал, співвідноситься з терміном помилки, коли оцінка зміни використовується як залежна змінна величина, отже, оцінений вплив базової лінії на бал змін не може бути зрозумілим.
Використання
- як початкова вагаY1
- як кінцева вагаY2
- як зміна ваги (тобто Δ Y = Y 2 - Y 1 )ΔYΔY=Y2−Y1
- яквипадково призначенелікування, іT
- як інші екзогенні фактори, що впливають на вагу (наприклад, інші контрольні змінні, які пов'язані з результатом, але повинні бути неспорідненими з лікуванням через випадкове призначення)X
Тоді є модель регресування на T і X ;ΔYTX
ΔY=β1T+β2X+e
Який за визначенням рівнозначний;
Y2−Y1=β1T+β2X+ е
Тепер, якщо ви включаєте базову лінію як коваріат, слід побачити проблему в тому, що у вас є термін по обидва боки рівняння. Це показує, що β 3 Y 1 не інтерпретоване, оскільки він по своїй суті корелює з терміном помилки.Y1β3Y1
Y2- Y1Y2= β1Т+ β2Х+ β3Y1+ е= β1Т+ β2Х+ β3Y1+(e+Y1)
Тепер частина плутанини в різних відповідях, мабуть, випливає з того, що різні моделі дадуть однакові результати для ефекту лікування , у моїй вище рецепті. Отже, якби порівняти ефект лікування для моделі з використанням балів змін як залежної змінної до моделі за допомогою "рівнів" (при цьому кожна модель, включаючи базову лінію Y 1 як коваріат), інтерпретація ефекту лікування була б так само. У двох моделях, що слідують за β 1 T, будуть однаковими, а також висновки, засновані на них (Брюс Вівер має розміщений код SPSS, що також демонструє еквівалентність).β1TY1β1T
Сhange Score ModelLevels Model:Y2−Y1=β1T+β2X+β3Y1+e:Y2=β1T+β2X+β3Y1+ е
Так дехто буде сперечатися (як це має Фелікс у цій темі, і як Брюс Вівер у деяких дискусіях щодо google групи SPSS) що оскільки моделі призводять до однакового оціночного ефекту від лікування, не має значення, яку саме вибрати. Я не погоджуюся, оскільки коваріат базової лінії у моделі оцінки змін не може бути інтерпретований, ви ніколи не повинні включати базову лінію як коваріату (незалежно від того, оцінений ефект лікування однаковий чи ні). Отже, це викликає ще одне питання, який сенс у використанні балів змін як залежних змінних? Як уже зазначав Фелікс, модель, що використовує бал зміни як залежної змінної, виключаючи базову лінію як коваріату, відрізняється від моделі, що використовує рівні. Для уточнення наступні моделі даватимуть різні ефекти лікування (особливо у випадку, якщо лікування співвідноситься з базовим рівнем);
Сhange Score Model Without BaselineLevels Model:Y2−Y1=β1T+β2X+e:Y2=β1T+β2X+β3Y1+e
Це було відзначено в попередній літературі як "Парадокс Господа". То яка модель є правильною? Що ж, у випадку рандомізованих експериментів, я б сказав, що модель рівнів є кращою (хоча, якщо ви зробили гарну роботу, рандомізуючи, середній ефект лікування повинен бути дуже близьким між моделями). Інші відзначили причини, чому модель рівнів є кращою, відповідь Чарлі дає хороший момент у тому, що ви можете оцінити ефекти взаємодії з базовою лінією в моделі рівнів (але ви не можете в моделі зміни балів). У відповіді Вюбер на дуже подібне питання демонструє, як результати змін викликають кореляцію між різними методами лікування.
У ситуаціях, коли лікування не призначається випадковим чином, модель, яка використовує бали змін як залежної змінної, слід більше уваги розглянути. Основна перевага моделі оцінки змін полягає в тому, що будь-які інваріантні прогнози результатів контролюються. Так, у вищенаведеному формулюванні, скажімо, є постійним протягом усього часу (наприклад, скажімо, генетична схильність бути певною вагою), і що X співвідноситься з тим, чи вирішила людина фізичні вправи (а X - це не помічено). У цьому випадку краща модель зміни є кращою. Також у випадках, коли відбір для лікування корелює з базовим значенням, модель оцінки змін може бути кращою. Пол Еллісон у своїй роботі,XXXЗміна балів як залежних змінних в регресійному аналізі дає такі самі приклади (і значною мірою вплинула на мою точку зору на тему, тому я настійно пропоную прочитати її).
Це не означає, що бали змін завжди бажані в не рандомізованих налаштуваннях. У випадку, якщо ви очікуєте, що базовий рівень матиме фактичний причинний вплив на вагу після посту, слід використовувати модель рівнів. У випадку, якщо ви очікуєте, що базовий рівень матиме причинний ефект, а вибір на лікування корелює з вихідним рівнем, ефект лікування плутається з базовим ефектом.
Я проігнорував замітку Чарлі про те, що логарифм ваги може використовуватися як залежна змінна. Хоча я не сумніваюся, що це може бути можливим, це початкове питання дещо не є послідовним . Ще одне питання обговорювало, коли доцільно використовувати логарифми змінної (а ті, що все ще застосовуються в цьому випадку). Напевно, є попередня література з цього приводу, яка допоможе вам орієнтуватись на те, чи правильне використання зареєстрованої ваги також.
Цитування
Аллісон, Пол Д. 1990. Змінення балів як залежних змінних в регресійному аналізі . Соціологічна методологія 20: 93-114. Загальнодоступна версія PDF .