(досить довгий пост, вибачте. Він містить багато довідкової інформації, тому сміливо переходьте до питання внизу.)
Вступ: Я працюю над проектом, де ми намагаємось визначити вплив бінарної ендогенної змінної, , на постійний результат, . Ми придумали інструмент , на який ми впевнені, що він призначений як- небудь випадково.
Дані: Самі дані є структурою панелі з близько 34 000 спостережень, що поширюються на 1000 одиниць та приблизно 56 часових періодів. приймає значення 1 для приблизно 700 (2%) спостережень, а робить це приблизно для 3000 (9%). 111 (0,33%) спостережень оцінюють 1 як на і на , і вдвічі більше шансів спостереження набрати 1 на якщо воно також 1 на .
Оцінка: Ми оцінюємо наступну модель 2SLS за допомогою itag2-процедури Stata:
Де - вектор інших екзогенних змінних, - передбачуване значення з першого етапу, а і - умови помилки.
Результати: начебто все працює добре; оцінка має високу значимість на першому етапі, а оцінка - дуже значна на другій стадії. Усі ознаки є такими, як очікувалося, включаючи ознаки для інших екзогенних змінних. Однак проблема полягає в тому, що оцінка - коефіцієнта відсотків - неправдоподібна велика (або, принаймні, відповідно до того, як ми її інтерпретували).
коливається від 2 до приблизно 26 із середнім значенням і медіаною 17, але оцінка становить від 30 до 40 (залежно від специфікації)!
Слабкий IV: Перша наша думка полягала в тому, що це було через занадто слабкий інструмент; тобто не дуже корелює з ендогенною змінною, але це насправді не так. Для перевірки слабкості інструменту ми використовуємо пакет пакунків Finlay, Magnusson та Schaffer, оскільки він забезпечує тести, які є надійними для порушення припущення про (що тут актуально, враховуючи, що ми маємо дані панелі та кластеризуємо наші SE в одиничний рівень).
Відповідно до їх AR-тесту, нижня межа 95-відсоткового довірчого інтервалу для коефіцієнта другого ступеня становить від 16 до 29 (знову залежно від специфікації). Ймовірність відхилення практично дорівнює 1 для всіх значень де завгодно до нуля.
Впливові спостереження: Ми спробували оцінити модель з кожним вилученим блоком окремо, з кожним спостереженням, видаленим окремо, та з видаленими кластерами одиниць. Реальних змін немає.
Пропоноване рішення: Хтось запропонував, що ми не повинні підсумовувати передбачуваний ефект інструментального у його первісному метриці (0-1), а в метриці передбачуваної його версії. коливається від -0,01 до 0,1 із середньою середньою величиною приблизно 0,02 та SD приблизно 0,018. Якби ми узагальнили прогнозований ефект за, скажімо, одним збільшенням SD на , це було б (інші технічні характеристики дають майже однакові результати). Це було б більш розумним (але все ще суттєвим). Здається, ідеальне рішення. За винятком того, що я ніколи не бачив, щоб хтось робив це; всі, здається, інтерпретують коефіцієнт другого ступеня, використовуючи метрику вихідної ендогенної змінної.
Запитання: Чи правильно у IV-моделі підсумовувати оціночний ефект (ПОСЛІДНО, дійсно) збільшення ендогенної змінної, використовуючи метрику передбачуваної її версії? У нашому випадку ця метрика передбачається ймовірною.
Примітка. Ми використовуємо 2SLS, хоча ми маємо бінарну ендогенну змінну (що робить перший етап LPM). З цього випливає Angrist & Krueger (2001): "Інструментальні змінні та пошук ідентифікації: від пропозиції та попиту до природних експериментів") Ми також спробували триетапну процедуру, що використовується в Adams, Almeida та Ferreira (2009): " Розуміння взаємозв'язку між засновниками та керівниками та ефективністю фірми ». Останній підхід, який складається з пробітної моделі, за якою слідує 2SLS, дає менші та більш чутливі коефіцієнти, але вони все ще дуже великі, якщо їх інтерпретувати в метриці 0-1 (близько 9-10). Ми отримуємо ті ж результати з ручними обчисленнями, що й у варіанті probit-2sls в ivtreatreg Серуллі.
etregress/treatreg
?