Наскільки проблематичним є контроль за незалежними коваріатами в спостережному (тобто не рандомізованому) дослідженні?


11

Міллер і Чапман (2001) стверджують, що абсолютно не доцільно контролювати незалежні коваріати, які пов'язані як із незалежними, так і залежними змінними в спостережному (не рандомізованому) дослідженні, - хоча це звичайно робиться в соціальних науках. Наскільки проблематично це зробити? Як найкраще вирішити цю проблему? Якщо ви регулярно контролюєте незалежність коваріатів у спостережному дослідженні у своєму власному дослідженні, як це виправдаєте? Нарешті, чи варто це боротися, коли сперечатися з методологією з колегами (тобто, чи це насправді важливо)?

Дякую

Міллер, Джорджія та Чапман, JP (2001). Аналіз нерозуміння коваріації. Журнал ненормальної психології, 110, 40-48. - http://mres.gmu.edu/pmwiki/uploads/Main/ancova.pdf


Наступне питання про "інтуїтивне пояснення мультиколінеарності" може бути корисним у наведеному вище контексті.

Відповіді:


4

Це так само проблематично, як і ступінь кореляції.

Іронія полягає в тому, що ви б не переймалися контролем, якби не було очікуваної кореляції з однією із змінних. І якщо ви очікуєте, що ваша незалежна змінна вплине на залежних, це обов'язково дещо співвідноситься з обома. Однак, якщо вони сильно корелюють їх, можливо, ви не повинні контролювати це, оскільки це рівнозначно контролювати фактичну незалежну чи залежну змінну.


Я знаю, що це стара відповідь, але чи є у вас деякі посилання, що детальніше розглядають wrt. ваш перший рядок, особливо ті, що обговорюють це з чітким посиланням на Miller & Chapman?
jona

4

У соціальних науках ми часто називаємо це питання "зміщенням після лікування". Якщо ви розглядаєте ефект деякого лікування (вашої незалежної змінної), включаючи змінні, що виникають після лікування (у причинному розумінні), то ваша оцінка ефекту від лікування може бути упередженою. Якщо ви включите ці змінні, то ви в деякому сенсі контролюєте вплив лікування. Якщо лікування T викликає результат Y, а інша змінна A і A викликає Y, то контроль за A ігнорує вплив, який T має на Y через A. Це зміщення може бути позитивним або негативним.

У соціальних науках це може бути особливо важким, оскільки А може спричинити T, який повертається на A, а A і T викликають Y. Наприклад, високий ВВП може призвести до високого рівня демократизації (наше лікування), що призводить до скажімо, що більш високий ВВП та більший ВВП та демократизація призводять до меншої корупції уряду. Оскільки ВВП спричиняє демократизацію, якщо ми не контролюємо це, то у нас виникає проблема ендогенності або "ухилення змінних змінних". Але якщо ми контролюємо ВВП, ми маємо упередження після лікування. За винятком випадків, коли ми можемо використовувати рандомізовані випробування, є ще мало, що ми можемо зробити, щоб керувати нашим судном між Сциллою та Харибдісом. Гері Кінг каже про ці питання , як його висунення на «Hardest Невирішені проблеми в області соціальних наук» гарвардського ініціативи тут .


3

Як я бачу, існують дві основні проблеми спостережливих досліджень, які "контролюють" ряд незалежних змінних. 1) У вас є проблема відсутності пояснювальних змінних і, таким чином, модель неправильної специфікації. 2) У вас є проблема декількох корельованих незалежних змінних - проблема, яка не існує в (добре) розроблених експериментах, - і той факт, що коефіцієнти регресії та тести коваріатів ANCOVA засновані на частках, що ускладнює їх інтерпретацію. Перший є властивим природі спостережливих досліджень і розглядається в науковому контексті та процесі конкурентної розробки. Останнє є проблемою освіти і спирається на чітке розуміння регресії та моделей ANCOVA та саме того, що представляють ці коефіцієнти.

Щодо першого питання, досить легко продемонструвати, що якщо всі впливи на якусь залежну змінну відомі та включені в модель, статистичні методи контролю є ефективними та дають хороші прогнози та оцінки ефектів для окремих змінних. Проблема в "м'яких науках" полягає в тому, що всі відповідні впливи рідко включаються або навіть відомі, і тому моделі є недостатньо конкретизованими і важко інтерпретовані. Однак у цих областях існує багато вартісних проблем. Відповіді просто не мають певності. Краса наукового процесу полягає в тому, що він самокорегується, а моделі ставлять під сумнів, розробляються та вдосконалюються. Альтернативою є припущення, що ми не можемо дослідити ці проблеми науково, коли не можемо розробити експерименти.

Другий випуск - це технічне питання щодо характеру ANCOVA та регресійних моделей. Аналітикам потрібно зрозуміти, що представляють ці коефіцієнти та тести. Кореляції між незалежними змінними впливають на коефіцієнти регресії та тести ANCOVA. Вони - випробування партизанів. Ці моделі виймають дисперсію в заданій незалежній змінній та залежній змінній, які асоціюються з усіма іншими змінними в моделі, а потім вивчають співвідношення в цих залишках. Як результат, окремі коефіцієнти та тести дуже важко інтерпретувати поза контекстом чіткого концептуального розуміння всієї сукупності змінних та їх взаємозв'язків. Однак це не створює проблем для прогнозування - будьте обережні щодо тлумачення конкретних тестів та коефіцієнтів.

Побічна примітка: Останнє питання пов'язане з проблемою, обговореною раніше на цьому форумі, щодо реверсування знаків регресії - наприклад, від негативного до позитивного - коли інші прогнози вводяться в модель. За наявності корельованих предикторів та без чіткого розуміння множинних та складних взаємозв'язків у всій сукупності предикторів, немає підстав очікувати (за природою частковий) коефіцієнт регресії, щоб мати певну ознаку. Коли існує сильна теорія і чітке розуміння цих взаємозв'язків, такі знакові "перевороти" можуть бути освічуючими і теоретично корисними. Хоча, враховуючи складність багатьох проблем суспільствознавства, достатнє розуміння не було б загальним, я би сподівався.

Відмова: Я - соціолог та аналітик публічної політики, навчаючись.


2

Я прочитав першу сторінку їх статті, і тому, можливо, неправильно зрозумів їхню думку, але мені здається, що вони в основному обговорюють проблему включення до аналізу багатоколінеарних незалежних змінних. Приклад, який вони беруть за віком і рівнем, ілюструє цю ідею, оскільки вони заявляють, що:

Вік настільки тісно пов'язаний з класом у школі, що усунення дисперсії в баскетбольній здатності, пов’язаної з віком, усуне значну (можливо, майже всю) дисперсію в баскетбольній здатності, пов'язаній з оцінкою

ANCOVA - це лінійна регресія з рівнями, представленими як манекенні змінні, і коваріати, що також виступають як незалежні змінні в рівнянні регресії. Таким чином, якщо я не зрозумів їхню думку (що цілком можливо, оскільки я не прочитав повністю їхню статтю), схоже, вони говорять «не включати залежних коваріатів», що еквівалентно твердженню уникнення мультиколінеарних змінних.


Їх аргумент стосується не співвідносних змінних самих по собі, а змінних, які практично невіддільні одна від одної. Змінні, про які можна сказати майже "без цього безглуздо". Замість ступеня кореляції, яку можна оцінити статистично, питання має бути розроблено концептуально. Чи можна підвищувати ступінь без збільшення віку? Навряд чи. Чи може депресія посилюватися без збільшення тривоги? Це важче.
rolando2

1

(Найбільша) проблема полягає в тому, що через те, що групова змінна (и) та коваріат (и) знаходяться разом на прогнозованій стороні рівняння, змінна (и) групи більше (і) не є змінною (іми) групи, вони чи є ті змінні з коваріатом ущільненими, тому їх більше не впізнають чи інтерпретують як групові змінні, які ви думали, що вивчаєте. Величезна проблема.

Ключовий рядок на сторінці 45 "ANCOVA видаляє значущу відмінність від" Group ", залишаючи нехарактерну змінну залишкової змінної групи з невизначеним відношенням до конструкції, яку представляла Група".

Моє теперішнє рішення - часткове використання коваріату від DV, а потім подання залишків DV у звичайну ANOVA, як альтернативу використанню ANCOVA.


2
Але це те саме, що анкова ?!

0

Деякі інструменти відповідності, розроблені Гері Кінгом та його колегами, виглядають перспективно:


2-е посилання вже не існує.
rolando2

Який із багатьох перерахованих там програмних засобів ви рекомендуєте?
rolando2
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.