Всі ми знайомі із спостережними дослідженнями, які намагаються встановити причинно-наслідковий зв’язок між нерандомізованим передбачувачем X та результатом, включивши кожного можливого потенційного учасника в модель множинної регресії. Таким чином, «контролюючи» всіх плутанин, аргумент іде, ми виокремлюємо дію інтелектуального прогноза.
У мене виникає все більший дискомфорт від цієї ідеї, що ґрунтується, головним чином, на зауваженнях, які висловлювали різні професори моїх статистичних занять. Вони поділяються на кілька основних категорій:
1. Ви можете контролювати лише коваріати, які ви думаєте, і вимірювати.
Це очевидно, але мені цікаво, чи це насправді найбільш згубно і непереборне з усіх.
2. Підхід призвів до некрасивих помилок у минулому.
Наприклад, Petitti & Freedman (2005) обговорюють, наскільки десятиліттями статистично скориговані спостережні спостереження дійшли катастрофічно неправильних висновків щодо впливу гормональної замісної терапії на ризик серцевих захворювань. Пізніше RCT виявили майже протилежні ефекти.
3. Взаємовідношення прогноз-результат може поводитися дивно, коли ви контролюєте коваріати.
Ю-Кан Ту, Гуннелл і Гілторп (2008) обговорюють деякі різні прояви, включаючи парадокс Лорда, парадокс Сімпсона та супресорні змінні.
4. Важко для однієї моделі (множинна регресія) адекватно налаштувати коваріати і одночасно моделювати співвідношення прогноз-результат.
Я почув це як причину переваги таких методів, як показники схильності та розшарування на плутанину, але я не впевнений, що насправді це розумію.
5. Модель ANCOVA вимагає, щоб коваріат та предиктор інтересів були незалежними.
Звичайно, ми налаштовуємо для плутаниць саме тому, що вони співвідносяться з прогнозкою інтересу, тому, здається, модель виявиться невдалою в тих випадках, коли ми цього хочемо найбільше. Аргумент іде, що коригування підходить лише для зменшення шуму в рандомізованих випробуваннях. Miller & Chapman, 2001 дають чудовий відгук.
Тому мої запитання:
- Наскільки серйозні ці проблеми та інші, про які я, можливо, не знаю?
- Як боятися я, коли бачу дослідження, яке "контролює все"?
(Я сподіваюся, що це питання не надто заглиблюється на дискусійну територію і із задоволенням запрошу будь-які пропозиції щодо його вдосконалення.)
EDIT : Я додав пункт 5 після пошуку нового посилання.