[Наступне, можливо, здається трохи технічним через використання рівнянь, але він будується головним чином на стрілових діаграмах, щоб забезпечити інтуїцію, яка вимагає лише дуже базового розуміння OLS - тому не варто відбиватися.]
Припустимо , ви хочете , щоб оцінити причинний ефект на у я задається оціненого коефіцієнта для р , але з якоїсь - то причини , існує кореляція між пояснює змінної , а термін помилки:xiyiβ
yi=α+βxi+↖corrϵi↗
Це могло статися, тому що ми забули включити важливу змінну, яка також корелює з . Ця проблема відома як опущеною змінної упередженості , а потім ваш β не дасть вам причинно - наслідковий зв'язок (див тут для подробиць). Це той випадок, коли ви хочете використовувати інструмент, оскільки тільки тоді ви зможете знайти справжній причинний ефект.xiβˆ
Інструмент - це нова змінна яка не пов'язана з ϵ i , але вона добре співвідноситься з x i і впливає лише на y i через x i - тому наш інструмент називається "екзогенним". Це як у цій графіці тут:ziϵixiyixi
zi→xi↑ϵi→↗yi
Тож як ми використовуємо цю нову змінну?
Можливо, ви пам’ятаєте ідею типу ANOVA за регресією, де ви розділили загальну варіацію залежної змінної на пояснену та незрозумілу складову. Наприклад, якщо ви регресуєте ваш на інструменті,xi
xitotal variation=a+πziexplained variation+ηiunexplained variation
то ви знаєте, що пояснена тут варіація екзогенна для нашого початкового рівняння, оскільки вона залежить тільки від екзогенної змінної . Отже, в цьому сенсі ми розділимо x i на частину, на яку ми можемо стверджувати, що це, безумовно, екзогенна (це та частина, яка залежить від z i ), і якась незрозуміла частина η i, яка зберігає всі погані зміни, що корелює з ϵ i . Тепер ми беремо екзогенну частину цієї регресії, називаємо її ^ x i ,zixiziηiϵixiˆ
xi=a+πzigood variation=xˆi+ηibad variation
і поставити це в нашій вихідної регресії:
yi=α+βxˆi+ϵi
Тепер , так як х я не корелює більше з ε я (пам'ятаєте, що ми «відфільтровані» ця частина від ї я і залишив його в η яxˆiϵixiηi ), ми можемо послідовно оцінити нашу ; бо інструмент допоміг нам розірвати зв'язок між пояснювальна змінна та помилка. Це був один із способів застосування інструментальних змінних. Цей метод насправді називають двоступеневими найменшими квадратами, де наша регресія x i на z i називається "першою стадією", а останнє рівняння тут називається "другою стадією".βxizi
З точкою зору нашої оригінальної картини (я залишаю поза не наплутав , але пам'ятайте , що вона є!), Замість того , щоб взяти прямий маршрут , але недоліки між й я до у я ми взяли проміжний крок по й яϵixiyixˆi
zi→xi↗→xˆi↓yi
Завдяки цьому незначному відхиленню нашої дороги до причинного ефекту ми змогли послідовно оцінити за допомогою інструменту. Вартість цього відхилення полягає в тому, що моделі інструментальних змінних, як правило, менш точні, це означає, що вони, як правило, мають більші стандартні помилки.β
Як ми знаходимо інструменти?
Це непросте запитання, оскільки вам потрібно зробити хороший випадок, чому ваш не був би співвіднесений з ϵ i - це формально не може бути перевірено, оскільки справжня помилка не помічена. Таким чином, головне завдання полягає в тому, щоб придумати щось екзогенне, таке як природні катастрофи, зміни у політиці, а іноді навіть можна проводити рандомізований експеримент. Інші відповіді мали для цього дуже хороші приклади, тому я не повторюю цю частину.ziϵi