Навіщо використовувати відсталий DV як інструментальну змінну?


12

Я успадкував деякий код аналізу даних, який, не будучи економістом, намагаюся зрозуміти. Одна модель виконує регресію інструментальних змінних із наступною командою Stata

ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)

Цей набір даних є панеллю з декількома послідовними спостереженнями за цим набором змінних.

Чому цей код використовує відсталі значення DV як інструменти? Як я розумію (від копання до старого підручника), IV оцінка використовується, коли є проблема через те, що регресор співвідноситься з терміном помилки. Однак нічого не згадується щодо вибору лагів DV як інструментів.

У коментарі до цього рядка коду згадується "причинність". Будь-яка допомога у з'ясуванні того, що було ціллю тут, буде дуже вітається


З вашого питання, можливо, ви читаєте код трохи неправильно. Синтаксис використовує відмінності як "інструменти" для оцінки відставання залежної змінної.
Енді Ш

lara: ти міг би відредагувати своє запитання, щоб чітко пояснити значення проробленого коду статистики?
user603

Відповіді:


7

Редагувати: Враховуючи пояснення щодо статистичного коду, наданого Енді У., я змінив свою відповідь, щоб краще вирішити питання. Ви знайдете стару версію моєї відповіді нижче поточної.

Здається, ваш код - це незграбна спроба DIY'ing оцінювача Ареллано-Бонда (якщо припустити оцінки ivreg за допомогою 2SOLS). Більш детальну інформацію про використання та логіку оцінювача A / B ви можете знайти в цьому приємному оглядовому документі , а також у цьому більш широкому вступі.

У двох словах: хоча оцінювач A / B дійсно є (узагальненим) IV оцінкою, він не використовується для вирішення будь-якого питання причинності. IV в цьому контексті використовуються для забезпечення ефективної оцінки коефіцієнта AR в контексті панельних даних.

Я б не рекомендував переосмислювати колесо тут, а замість цього використовувати готовий інструментарій для таких оцінок. Для статистики ви можете використовувати пакет XTABOND2 (або XTABOND, якщо ви використовуєте STAT11).


стара відповідь:

xtytxtytxtytytxt

ytxt1xt

ytxt1xt1ytxy

ytxt1I(0)


+1 Погодьтеся з цим тлумаченням цього вигляду як DIY Arellano-Bond. NB: Я вважав, що Ареллано-Бонд заслуговує на довіру лише тоді, коли кількість одиниць поперечного перерізу дуже велика --- як і багато сотень. Ареллано натякає стільки ж у своїх статтях та підручнику, вказуючи, що послідовність у кількості одиниць перерізу, а швидкість конвергенції не так швидко.
Сайрус

5

Я не знаю Stata, тому не можу коментувати конкретну модель. Але використання відсталих змінних є досить поширеним підходом, коли йдеться про одночасність зміщення взагалі та створює інструментальні змінні зокрема.

Скажімо, у вас є зворотний зв'язок між двома змінними у вашій моделі: незалежною змінною (наприклад, ціною) та залежною змінною (наприклад, кількістю). Тоді обидва є ендогенними (їх причини виникають всередині моделі), і збурення терміна помилки вплинуть на обидві змінні.

Щоб вирішити це, потрібно зробити незалежну змінну (ціну) зовнішньою, щоб збурення в помилці впливали лише на залежну змінну (кількість). Це досягається шляхом створення нових зовнішніх змінних шляхом регресу інших зовнішніх змінних у вашій моделі за ціною. Ці нові зовнішні змінні є вашими інструментальними змінними (IV). IV отримані з екзогенних термінів і, таким чином, не співвідносяться з помилкою.

Але для цього потрібно розібратися, які змінні є екзогенними, щоб їх можна було використовувати для отримання IV. Ми можемо зазначити, що відсталі змінні "мали місце" в минулому і тому не можуть бути співвіднесені з помилкою в сьогоденні. Таким чином, відсталі змінні є екзогенними і стають зручними кандидатами для отримання IV. (Однак зауважте, що попередній аргумент виходить з ладу, коли помилки автокорельовані.)

Хорошим вступом та посиланням на це є Вступна економетрія: сучасний підхід Волдріджа.


5

Для тих, хто не знайомий із наведеним нижче фрагментом коду від Stata OP, надано

ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)

це рівняння можна прочитати як

Yt=α+β1(Var1)+β2(Var1)+β3(Var1)+β4(Y~t1)

Y~t1

Y~t1=α+Z1(Δ2Yt)+Z2(Δ3Yt)+Z3(Δ4Yt)

(тобто перша стадія рівняння IV знаходиться в дужках у коді Stata)

Дельти представляють різниці другого, третього та четвертого порядку, і вони використовуються як виключені інструменти для оцінки відставання залежної змінної.

L.t1D.D2.

Насправді я не міг придумати жодних логічних міркувань, чому хтось це зробить. Але Квак вказував (посилаючись на цей документ ), що метод Ареллано-Бонда використовує відмінності як інструменти для оцінки авторегресивної складової моделі. (Також по суті я припускав, що відмінності матимуть ефект лише в тому випадку, коли серія буде нестаціонарною, що, за словами Бонда, у тій пов'язаній роботі, відмінності будуть лише слабкими інструментами у випадку, коли серія є випадковою прогулянкою, на стор. 21 )

Як пропозиції щодо подальшого читання матеріалу як вступу до інструментальних змінних,

Інший плакат у цій відповіді (Чарлі), пов’язаний із деякими підготовленими слайдами, які мені подобаються, і які б я запропонував, варто вивчити вступ до інструментальних змінних. Я хотів би також запропонувати цей PowerPoint професор шахти , підготовлений для семінару в якості введення , а також. Як остання пропозиція для тих, хто зацікавлений дізнатися більше про інструментальні змінні, ви повинні знайти роботу Джошуа Ангриста.

Ось моя початкова відповідь


L.t1D.D2.

У всіх застосунках, які я бачив, люди використовують відставання незалежних змінних як інструменти для оцінки відставання залежної змінної (з причин, про які йде мова). Але це ґрунтується на припущенні, що відстаючі незалежні змінні екзогенні терміну помилки у часовому періоді, в який вони застосовуються.

Я не знаю жодного міркування, в якому відмінності залежної змінної вважалися б екзогенними. Наскільки мені відомо, не прийнято практику розрізняти лише одну сторону рівняння, і це дало б досить нелогічні результати ( ось документ, який критикує когось щодо зворотної ситуації, в якій вони включили рівень змінних в якості провісника різний ряд.) Якщо ви переставляєте доданки в рівнянні IV, це насправді схоже на розширений тест Діккі Фуллера.

Хоча найпростішою відповіддю було б запитати того, хто написав код, чи може хтось навести приклад, у якому ця процедура була б прийнятною, або будь-яка ситуація, при якій ця процедура може принести якісь значущі результати? Так само я не можу придумати жодних логічних міркувань, чому різниці впливали б на рівні, за винятком випадків, коли серія нестаціонарна.


Привіт Енді. Я не знаю код статистики. Ось чому я не згадую про код, зірваний у своїй відповіді, який слід розуміти як відповідь на частину питання, сформульовану англійською мовою.
user603

@kwak - Я не критикував ваш пост, я згоден з усім, що ви сказали. Мені просто було цікаво, чи існує якась логіка, чому хтось використовуватиме відмінності як інструменти, про які я не знав. Я не уявляю жодної ситуації, в якій різниці відповідали б будь-якій з вимог такої процедури.
Енді Ш

Привіт Енді:> Я не вважав, що ти коментуєш критику. У вашому дописі висвітлюється ключовий аспект питання, якого ані Роб, ані я (правда) не розуміли. Якщо що, це ілюструє важливість співпраці.
user603

+1. Не бачив усе це раніше - Дякуємо за те, що відмітили проблему, а також збій / міні-курс під час запису статистики. Я взяв ваш перший коментар, щоб зрозуміти, що трактування було помилковим, і я відповів дуже загальним. Я радий, що ти був більш наполегливим і що квак це зрозумів.
ars
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.