Наскільки добре може багатократна регресія справді «контролювати» коваріати?


45

Всі ми знайомі із спостережними дослідженнями, які намагаються встановити причинно-наслідковий зв’язок між нерандомізованим передбачувачем X та результатом, включивши кожного можливого потенційного учасника в модель множинної регресії. Таким чином, «контролюючи» всіх плутанин, аргумент іде, ми виокремлюємо дію інтелектуального прогноза.

У мене виникає все більший дискомфорт від цієї ідеї, що ґрунтується, головним чином, на зауваженнях, які висловлювали різні професори моїх статистичних занять. Вони поділяються на кілька основних категорій:

1. Ви можете контролювати лише коваріати, які ви думаєте, і вимірювати.
Це очевидно, але мені цікаво, чи це насправді найбільш згубно і непереборне з усіх.

2. Підхід призвів до некрасивих помилок у минулому.

Наприклад, Petitti & Freedman (2005) обговорюють, наскільки десятиліттями статистично скориговані спостережні спостереження дійшли катастрофічно неправильних висновків щодо впливу гормональної замісної терапії на ризик серцевих захворювань. Пізніше RCT виявили майже протилежні ефекти.

3. Взаємовідношення прогноз-результат може поводитися дивно, коли ви контролюєте коваріати.

Ю-Кан Ту, Гуннелл і Гілторп (2008) обговорюють деякі різні прояви, включаючи парадокс Лорда, парадокс Сімпсона та супресорні змінні.

4. Важко для однієї моделі (множинна регресія) адекватно налаштувати коваріати і одночасно моделювати співвідношення прогноз-результат.

Я почув це як причину переваги таких методів, як показники схильності та розшарування на плутанину, але я не впевнений, що насправді це розумію.

5. Модель ANCOVA вимагає, щоб коваріат та предиктор інтересів були незалежними.

Звичайно, ми налаштовуємо для плутаниць саме тому, що вони співвідносяться з прогнозкою інтересу, тому, здається, модель виявиться невдалою в тих випадках, коли ми цього хочемо найбільше. Аргумент іде, що коригування підходить лише для зменшення шуму в рандомізованих випробуваннях. Miller & Chapman, 2001 дають чудовий відгук.

Тому мої запитання:

  1. Наскільки серйозні ці проблеми та інші, про які я, можливо, не знаю?
  2. Як боятися я, коли бачу дослідження, яке "контролює все"?

(Я сподіваюся, що це питання не надто заглиблюється на дискусійну територію і із задоволенням запрошу будь-які пропозиції щодо його вдосконалення.)

EDIT : Я додав пункт 5 після пошуку нового посилання.


1
Для питання 2 я вважаю, що "контроль за всім" є більш загальним питанням специфікації. У мене виникають проблеми з роздумом ситуації, коли параметрична модель правильно вказана. Як сказано, модель спрощує реальність, і саме тут лежить мистецтво такого типу дослідження. Дослідник повинен вирішити, що є, а що не важливо в моделі.
кірк

4
За допомогою цього питання ви зробили мене фанатом.
rolando2

1
Я думаю, що це викликає дуже хороші моменти; але я думаю, що відповіді знаходяться за межами суворо статистичного поля. Таким чином, будь-який статистичний результат є більш цінним , якщо воно 1) реплицируется 2) Є чи по суті життєздатним і т.д. Також дивіться критерії MAGIC і загальний аргумент Абельсон робить.
Пітер Флом - Відновіть Моніку

1
Пункт №5 абсолютно помилковий. Папір Miller & Chapman абсолютно неправильна, повна зупинка.
Джейк Вестфалл

1
@ напівпропуск Не впевнений, що ще про нього сказати, окрім центрального твердження статті - тобто про те, що фокусний предиктор X та коваріат C мають бути некорельованими - просто не відповідає дійсності. Зауважте, що ANCOVA - це лише модель регресії, тож ця сама лінія міркувань, очевидно, також призведе до недійсності майже всіх реальних застосувань множинної регресії! У мене в Twitter було кілька дискусій про цю жахливу роботу кілька місяців тому: twitter.com/CookieSci/status/902298218494644228
Джейк Уестпад

Відповіді:


4

Можливо, стає загальноприйнятою, нестатистичною, відповідь на те, які припущення потрібно зробити, щоб стверджувати, що дійсно контролюється коваріати.

Це можна зробити за допомогою причинних графіків Джудеї Перл і зробити обчислення .

Дивіться http://ftp.cs.ucla.edu/pub/stat_ser/r402.pdf , а також інші матеріали на його веб-сайті.

Тепер, як статистики, ми знаємо, що всі моделі помилкові, і справжнє статистичне питання - це ті ідентифіковані припущення, які, ймовірно, не надто помилкові, так що наша відповідь приблизно в порядку. Перл знає про це і обговорює це у своїй роботі, але, мабуть, не явно і досить часто, щоб уникнути роздуття багатьох статистиків своїм твердженням про відповідь (що я вважаю, що він робить для тих припущень, які потрібно зробити? ).

(В даний час АСК пропонує премію за навчальний матеріал для включення цих методів у статистичні курси дивіться тут )


Чудова посилання на елегантне графічне зображення, дякую.
половина проходу

0

Відповідь на питання 1:

  • Величину серйозності найкраще оцінювати контекстуально (тобто слід враховувати всі чинники, що сприяють обгрунтованості).
  • Величину серйозності не слід оцінювати категорично. Прикладом може слугувати поняття про ієрархію умовиводів для дослідних конструкцій (наприклад, звіти про випадки найнижчі, а RCT - категорично найвищі). Цей тип схеми часто викладають у медичних школах як просту евристику для швидкого виявлення доказів високої якості. Проблема такого типу мислення полягає в тому, що воно є алгоритмічним і надмірно детермінованим, насправді відповідь сама завищена. Коли це станеться, ви можете пропустити способи, коли погано розроблені РХТ можуть дати гірші результати, ніж добре розроблене спостережне дослідження.
  • Дивіться цей легкий для читання огляд для повного обговорення вищезазначених моментів з погляду епідеміолога (Rothman, 2014) .

Відповідь на питання 2:

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.