Як інтерпретувати коефіцієнт другої стадії в регресії інструментальних змінних за допомогою бінарного інструменту та бінарної ендогенної змінної?


11

(досить довгий пост, вибачте. Він містить багато довідкової інформації, тому сміливо переходьте до питання внизу.)

Вступ: Я працюю над проектом, де ми намагаємось визначити вплив бінарної ендогенної змінної, , на постійний результат, . Ми придумали інструмент , на який ми впевнені, що він призначений як- небудь випадково.x1yz1

Дані: Самі дані є структурою панелі з близько 34 000 спостережень, що поширюються на 1000 одиниць та приблизно 56 часових періодів. приймає значення 1 для приблизно 700 (2%) спостережень, а робить це приблизно для 3000 (9%). 111 (0,33%) спостережень оцінюють 1 як на і на , і вдвічі більше шансів спостереження набрати 1 на якщо воно також 1 на .x1z1z1x1x1z1

Оцінка: Ми оцінюємо наступну модель 2SLS за допомогою itag2-процедури Stata:

x1=π0+π1z1+Zπ+v
y=β0+β1x1+Zβ+u

Де Z - вектор інших екзогенних змінних, x1 - передбачуване значення x1 з першого етапу, а u і v - умови помилки.

Результати: начебто все працює добре; оцінка π1 має високу значимість на першому етапі, а оцінка β1 - дуже значна на другій стадії. Усі ознаки є такими, як очікувалося, включаючи ознаки для інших екзогенних змінних. Однак проблема полягає в тому, що оцінка β1 - коефіцієнта відсотків - неправдоподібна велика (або, принаймні, відповідно до того, як ми її інтерпретували).

y коливається від 2 до приблизно 26 із середнім значенням і медіаною 17, але оцінка становить від 30 до 40 (залежно від специфікації)!β1

Слабкий IV: Перша наша думка полягала в тому, що це було через занадто слабкий інструмент; тобто не дуже корелює з ендогенною змінною, але це насправді не так. Для перевірки слабкості інструменту ми використовуємо пакет пакунків Finlay, Magnusson та Schaffer, оскільки він забезпечує тести, які є надійними для порушення припущення про (що тут актуально, враховуючи, що ми маємо дані панелі та кластеризуємо наші SE в одиничний рівень).i.i.d.

Відповідно до їх AR-тесту, нижня межа 95-відсоткового довірчого інтервалу для коефіцієнта другого ступеня становить від 16 до 29 (знову залежно від специфікації). Ймовірність відхилення практично дорівнює 1 для всіх значень де завгодно до нуля.

Впливові спостереження: Ми спробували оцінити модель з кожним вилученим блоком окремо, з кожним спостереженням, видаленим окремо, та з видаленими кластерами одиниць. Реальних змін немає.

Пропоноване рішення: Хтось запропонував, що ми не повинні підсумовувати передбачуваний ефект інструментального у його первісному метриці (0-1), а в метриці передбачуваної його версії. коливається від -0,01 до 0,1 із середньою середньою величиною приблизно 0,02 та SD приблизно 0,018. Якби ми узагальнили прогнозований ефект за, скажімо, одним збільшенням SD на , це було б (інші технічні характеристики дають майже однакові результати). Це було б більш розумним (але все ще суттєвим). Здається, ідеальне рішення. За винятком того, що я ніколи не бачив, щоб хтось робив це; всі, здається, інтерпретують коефіцієнт другого ступеня, використовуючи метрику вихідної ендогенної змінної.x1x1x1x10.01830=0.54

Запитання: Чи правильно у IV-моделі підсумовувати оціночний ефект (ПОСЛІДНО, дійсно) збільшення ендогенної змінної, використовуючи метрику передбачуваної її версії? У нашому випадку ця метрика передбачається ймовірною.

Примітка. Ми використовуємо 2SLS, хоча ми маємо бінарну ендогенну змінну (що робить перший етап LPM). З цього випливає Angrist & Krueger (2001): "Інструментальні змінні та пошук ідентифікації: від пропозиції та попиту до природних експериментів") Ми також спробували триетапну процедуру, що використовується в Adams, Almeida та Ferreira (2009): " Розуміння взаємозв'язку між засновниками та керівниками та ефективністю фірми ». Останній підхід, який складається з пробітної моделі, за якою слідує 2SLS, дає менші та більш чутливі коефіцієнти, але вони все ще дуже великі, якщо їх інтерпретувати в метриці 0-1 (близько 9-10). Ми отримуємо ті ж результати з ручними обчисленнями, що й у варіанті probit-2sls в ivtreatreg Серуллі.


Ви пробували etregress/treatreg?
Мастеров Димитрій Вікторович

Привіт, Димитрію, дякую за відгук! Зараз я спробував etregress, і це дає дещо подібні результати. Однак, читаючи посібник Stata та Wooldridge (2002): "Економетричний аналіз даних перерізу та панелей", я створюю враження, що така модель лікування-регресія передбачає незнання лікування. Тобто, що залежить від спостережуваних змінних, незалежно від того, чи лікується одиниця, чи ні, вона не залежить від її (потенційного) результату як при лікуванні, так і під контролем.
Бертел

(продовження) У наших даних ми не можемо реально витримати це припущення; ми просто маємо джерело випадкової зміни в . Тому IV видається відповідним варіантом. Якщо я маю припущення правильно, все одно. x
Бертел

Було б дуже корисно мати деякі графіки, наприклад, схеми розсипання чи графіки щільності ядра сировинних переменних та залишків тощо. Пам'ятайте, що plim , навіть невелике співвідношення між інструментом та терміном помилки може спричинити сильну непослідовність оцінки ! β^1=β1+Cov(z1,u)Cov(z1,x1)β1
Arne Jonas Warnke

Відповіді:


2

Це старе питання, але для тих, хто в майбутньому натрапляє на нього, інтуїтивно оцінка 2SLS є з регресії "зменшеної форми"β1α1

y=α0+α1z1+Zα+u

ділиться на від регресії "першого етапу"π1

x1=π0+π1z1+Zπ+v

Отже, якщо оцінки 2SLS "неправдоподібно великі", перевірте оцінки OLS та .β1α1π1

Якщо оцінки "розумні", проблема може полягати в тому, що оцінки "дуже малі". Поділ на "дуже маленький" може створити "неймовірно великий" .α1π1α^1π^1β^1

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.