Що може сказати статистична модель про причинно-наслідкові зв’язки? Які міркування слід враховувати, роблячи причинний висновок із статистичної моделі?
Перше, що слід зрозуміти, це те, що не можна робити причинно-наслідкові умови з чисто статистичної моделі. Жодна статистична модель не може сказати нічого про причинно-наслідкові зв’язки без причинних припущень. Тобто для здійснення причинного висновку потрібна причинно-наслідкова модель .
ZХY
П( Y| гo ( X) ) = Р( Y| Х)ХY
Х
Це може стати ще складнішим. У вас можуть виникнути проблеми з помилками вимірювання, суб'єкти можуть відмовитися від дослідження або не дотримуватися інструкцій, серед інших питань. Вам потрібно буде зробити припущення про те, як ці речі пов'язані з тим, щоб виходити з висновком. З "чисто" даними спостереження це може бути більш проблематичним, оскільки зазвичай дослідники не матимуть гарного уявлення про процес формування даних.
Отже, щоб робити причинно-наслідкові умовиводи з моделей, потрібно судити не лише про його статистичні припущення, а головне про його причинно-наслідкові припущення. Ось деякі поширені загрози для причинного аналізу:
- Неповні / неточні дані
- Цільова причинно-наслідкова кількість, яка не визначена (Який причинний ефект, який ви хочете визначити? Яка цільова сукупність?)
- Блудність (непомічені плутанини)
- Відхилення відбору (самовідбір, усічені зразки)
- Помилка вимірювання (що може спричинити заплутаність, а не лише шум)
- Неправильне визначення (наприклад, неправильна функціональна форма)
- Проблеми із зовнішньою дійсністю (неправильний висновок до цільової сукупності)
Іноді претензія про відсутність цих проблем (або претензія на вирішення цих проблем) може бути підкріплена самою розробкою дослідження. Ось чому експериментальні дані зазвичай є більш достовірними. Однак іноді люди припускатимуть ці проблеми або теоретично, або для зручності. Якщо теорія буде м'якою (як у соціальних науках), важче буде зробити висновки за номіналом.
Щоразу, коли ви думаєте, що існує припущення, яке неможливо зробити резервним, слід оцінити, наскільки чутливі висновки щодо правдоподібних порушень цих припущень - це зазвичай називають аналізом чутливості.