Що таке інструментальна змінна?


36

Інструментальні змінні стають все більш поширеними у прикладній економіці та статистиці. Для непосвячених, чи можемо ми отримати кілька нетехнічних відповідей на наступні питання:

  1. Що таке інструментальна змінна?
  2. Коли хочеться використовувати інструментальну змінну?
  3. Як можна знайти або вибрати інструментальну змінну?

4
Ви не вважаєте, що статті Вікіпедії про це достатньо?

1
Такі питання вимагають відповіді на тип вікі / публікації в блозі. Я думаю, що питання не повинні вимагати таких довгих відповідей.

Я не впевнений, що правильно робити це - просто ігнорувати це питання та направляти запитувача до вікі - особливо під час бета-версії, де ми намагаємося створити вміст сайту. Можливо, запитуючий питання повинен подати кожне з цих питань окремо, щоб їх можна було краще вирішити.
russellpierce

3
@mbq - приклад wikipedia навряд чи кваліфікується як нетехнічний. Це дуже залежить від жаргону та рівнянь.
rolando2

1
Це стало поширеним в економіці деякий час у 1980-х. Деякі біостатики також чули про це і застосовують його в контексті моделей помилок вимірювань, де інструменти вузько розглядаються як додаткові доступні вимірювання. Вони кваліфікуються як інструменти в більш широкому економетричному контексті: вони співвідносяться зі змінною, що цікавить, і некорельовані з її похибкою вимірювання.
Стаск

Відповіді:


41

[Наступне, можливо, здається трохи технічним через використання рівнянь, але він будується головним чином на стрілових діаграмах, щоб забезпечити інтуїцію, яка вимагає лише дуже базового розуміння OLS - тому не варто відбиватися.]

Припустимо , ви хочете , щоб оцінити причинний ефект на у я задається оціненого коефіцієнта для р , але з якоїсь - то причини , існує кореляція між пояснює змінної , а термін помилки:xiyiβ

yi=α+βxi+ϵicorr

Це могло статися, тому що ми забули включити важливу змінну, яка також корелює з . Ця проблема відома як опущеною змінної упередженості , а потім ваш β не дасть вам причинно - наслідковий зв'язок (див тут для подробиць). Це той випадок, коли ви хочете використовувати інструмент, оскільки тільки тоді ви зможете знайти справжній причинний ефект.xiβ^

Інструмент - це нова змінна яка не пов'язана з ϵ i , але вона добре співвідноситься з x i і впливає лише на y i через x i - тому наш інструмент називається "екзогенним". Це як у цій графіці тут:ziϵixiyixi

zixiyiϵi

Тож як ми використовуємо цю нову змінну?
Можливо, ви пам’ятаєте ідею типу ANOVA за регресією, де ви розділили загальну варіацію залежної змінної на пояснену та незрозумілу складову. Наприклад, якщо ви регресуєте ваш на інструменті,xi

xitotal variation=a+πziexplained variation+ηiunexplained variation

то ви знаєте, що пояснена тут варіація екзогенна для нашого початкового рівняння, оскільки вона залежить тільки від екзогенної змінної . Отже, в цьому сенсі ми розділимо x i на частину, на яку ми можемо стверджувати, що це, безумовно, екзогенна (це та частина, яка залежить від z i ), і якась незрозуміла частина η i, яка зберігає всі погані зміни, що корелює з ϵ i . Тепер ми беремо екзогенну частину цієї регресії, називаємо її ^ x i ,zixiziηiϵixi^

xi=a+πzigood variation=x^i+ηibad variation

і поставити це в нашій вихідної регресії:

yi=α+βx^i+ϵi

Тепер , так як х я не корелює більше з ε я (пам'ятаєте, що ми «відфільтровані» ця частина від ї я і залишив його в η яx^iϵixiηi ), ми можемо послідовно оцінити нашу ; бо інструмент допоміг нам розірвати зв'язок між пояснювальна змінна та помилка. Це був один із способів застосування інструментальних змінних. Цей метод насправді називають двоступеневими найменшими квадратами, де наша регресія x i на z i називається "першою стадією", а останнє рівняння тут називається "другою стадією".βxizi

З точкою зору нашої оригінальної картини (я залишаю поза не наплутав , але пам'ятайте , що вона є!), Замість того , щоб взяти прямий маршрут , але недоліки між й я до у я ми взяли проміжний крок по й яϵixiyix^i

x^izixiyi

Завдяки цьому незначному відхиленню нашої дороги до причинного ефекту ми змогли послідовно оцінити за допомогою інструменту. Вартість цього відхилення полягає в тому, що моделі інструментальних змінних, як правило, менш точні, це означає, що вони, як правило, мають більші стандартні помилки.β

Як ми знаходимо інструменти?
Це непросте запитання, оскільки вам потрібно зробити хороший випадок, чому ваш не був би співвіднесений з ϵ i - це формально не може бути перевірено, оскільки справжня помилка не помічена. Таким чином, головне завдання полягає в тому, щоб придумати щось екзогенне, таке як природні катастрофи, зміни у політиці, а іноді навіть можна проводити рандомізований експеримент. Інші відповіді мали для цього дуже хороші приклади, тому я не повторюю цю частину.ziϵi


10
+1 Я вдячний, нарешті, прочитав детальну відповідь замість списку посилань чи посилань.
качан

1
xϵxxβ

βx^ixixiβ

Дивіться тут: stats.stackexchange.com/questions/64279/… або ви можете поставити нове запитання. Сподіваюся, це допомагає.
Енді

@ user35734 це не послідовно, але асимптотично .
Vim

17

Як медичний статистик, який не мав попередніх знань про економіку (etr) ics, я намагався впоратися з інструментальними змінними, оскільки часто намагався наслідувати їхні приклади і не розумів їх досить різної термінології (наприклад, "ендогенність", "скорочена форма" ',' структурне рівняння ',' опущені змінні '). Ось декілька посилань, які я вважаю корисними (перші повинні бути у вільному доступі, але я боюся, що інші, ймовірно, потребують підписки):

  • Стайгер Д. Інструментальні змінні. Кіберсемінар Академії охорони здоров'я з методів дослідження охорони здоров’я, березень 2002 року. Http://www.dartmouth.edu/~dstaiger/wpapers-Econ.htm

  • Ньюхаус Дж. П., Макклеллан М. Економетрія в дослідженні результатів: використання інструментальних змінних. Щорічний огляд охорони здоров'я 1998; 19: 17-34. http://dx.doi.org/10.1146/annurev.publhealth.19.1.17

  • Гренландія С. Вступ до інструментальних змінних для епідеміологів. Міжнародний журнал епідеміології 2000; 29: 722-729. http://dx.doi.org/10.1093/ije/29.4.722

  • Zohoori N, Savitz DA. Економетричні підходи до епідеміологічних даних: відношення ендогенності та непоміченої неоднорідності до заплутаності. Аннали епідеміології 1997; 7: 251-257. http://dx.doi.org/10.1016/S1047-2797(97)00023-9

Я також рекомендую главу 4:

  • Angrist JD, Pischke JS. Переважно нешкідливі економетрики: супутник емпіриків. Прінстон, Нью-Джерсі: Princeton University Press, 2009. http://www.mostlyharmlesseconometrics.com/

11

Ось кілька слайдів, які я підготував до курсу економетрики в UC Berkeley. Я сподіваюся, що ви знайдете їх корисними --- Я вважаю, що вони відповідають на ваші запитання та наводять кілька прикладів.

На сторінках курсів для PS 236 та PS 239 (курси методів політичної науки випускників) на моєму веб-сайті є також більш досконалі методи лікування: http://gibbons.bio/teaching.html .

Чарлі


Посилання на слайди Берклі вже не дійсне.
rolando2

7

Нетехнічні (як правило, це все, що я добре для будь-якого): Бувають випадки, коли X викликає не тільки Y, але й Y викликає X. Інструментальна змінна - це пристрій, який може «очистити» цей безладний, незручний взаємозв'язок, щоб можна було зробити найкращі оцінки впливу X на Y.

Інструментальна змінна вибирається в силу її взаємозв'язків: вона є причиною X, але, крім дії через X, вона не впливає на Y. Інструмент (або інструменти) використовуються на першому етапі для обчислення нової "версії "X, той, який жодним чином не є функцією Y. Цей новий" передбачуваний "X потім використовується на другому етапі, у більш стандартній регресії, для пояснення / прогнозування Y. Звідси термін регресія" Двоступеневий найменший квадрат ". .

Як правило, IV виявляється в процесах, що переважають або перебувають поза контролем X OR Y, таких як змінні, які залежать від законів, політик, актів природи тощо.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.