Узгодженість 2SLS з бінарною ендогенною змінною


10

Я прочитав, що оцінювач 2SLS все ще відповідає навіть бінарній ендогенній змінній ( http://www.stata.com/statalist/archive/2004-07/msg00699.html ). На першому етапі замість лінійної моделі буде запущена модель лікування.

Чи є якісь офіційні докази, що свідчать про те, що 2SLS все ще відповідає, навіть коли 1-й етап є моделлю probit або logit?

А що робити, якщо результат також є двійковим? Я розумію, якщо ми маємо бінарний результат та бінарну ендогенну змінну (1-й та 2-й етапи є двома моделями пробіт / логіт), наслідування методу 2SLS дасть суперечливу оцінку. Чи є офіційні докази на це? У економетричній книзі Вулдріджа є певна дискусія, але, я думаю, немає суворих доказів, які б засвідчили невідповідність.

data sim;
     do i=1 to 500000;
        iv=rand("normal",0,1);
             x2=rand("normal",0,1);
        x3=rand("normal",0,1);
        lp=0.5+0.8*iv+0.5*x2-0.2*x3;
        T=rand("bernoulli",exp(lp)/(1+exp(lp)));
        Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
        output;
     end;
     run;

****1st stage: logit model ****;
****get predicted values   ****;         
proc logistic data=sim descending;
     model T=IV;
     output out=pred1 pred=p;
     run;

****2nd stage: ols model with predicted values****;
proc reg data=pred1;
     model y=p;
     run;

коефіцієнт p = 1.19984. Я запускаю лише одне моделювання, але з великим розміром вибірки.


Чи не потрібно додавати посилання link = probit до заяви заяви?
Майк Хантер

Відповіді:


10

Виникло подібне питання щодо першого етапу пробіту та другого етапу OLS. У відповіді я надав посилання на нотатки, які містять формальне підтвердження непослідовності цієї регресії, яка офіційно відома як "заборонена регресія", як її називали Джеррі Хаусман. Основна причина невідповідності підходу пробіту першого етапу / OLS-другого етапу полягає в тому, що ні оператор очікувань, ні оператор лінійних проекцій не проходять через нелінійний перший етап. Тому пристосовані значення пробіту першої стадії лише не співвідносяться із терміном помилки другої стадії під дуже обмежуючими припущеннями, які практично ніколи не виконуються на практиці. Будьте в курсі, що формальне підтвердження непослідовності забороненої регресії є досить детальним, якщо я правильно пам’ятаю.

Якщо у вас є модель де - неперервний результат, а - двійкова ендогенна змінна, ви можете запустити перший етап через OLS а на другому етапі використовуйте встановлені значення замість . Це лінійна імовірнісна модель, на яку ви посилалися. Враховуючи, що для цього лінійного першого етапу немає жодних проблем для очікувань або лінійних прогнозів, ваші оцінки 2SLS будуть узгоджені, хоча і менш ефективні, ніж вони могли б бути, якщо ми врахували б нелінійний характер .У я Х я Х я = + Z ' я тг + η я Х я Х я Х я

Yi=α+βXi+ϵi
YiXi
Xi=a+Ziπ+ηi
X^iXiXi

Узгодженість цього підходу випливає з того, що хоча нелінійна модель може більше відповідати умовним функціям очікування для обмежених залежних змінних, це не має великого значення, якщо вас цікавить граничний ефект. У лінійній моделі ймовірності самі коефіцієнти є граничними ефектами, оціненими середнім значенням, тому, якщо граничний ефект на середньому рівні - це те, що вам потрібно (і зазвичай це люди), то це те, чого ви хочете, якщо лінійна модель дає найкращу лінійну наближення до нелінійних функцій умовного очікування.
Те ж саме справедливо і якщо є двійковим.Yi

Для більш детального обговорення цього питання ознайомтеся з відмінними конспектами лекцій Кіта Баума з цієї теми. З слайду 7 він обговорює використання лінійної моделі ймовірностей у контексті 2SLS.

Нарешті, якщо ви дійсно хочете використовувати probit, тому що ви хочете більш ефективні оцінки, то є ще один спосіб, який також згадується в Wooldridge (2010) "Економетричний аналіз даних перерізів і панелей". Наведена вище відповідь включає його, я повторюю його тут для повноти. Як застосований приклад див. Adams et al. (2009), які використовують триетапну процедуру:

  1. використовувати пробіт для регресу ендогенної змінної на інструменті (ах) та екзогенних змінних
  2. використовувати передбачувані значення з попереднього кроку на першій стадії OLS разом із екзогенними (але без інструментальних) змінних
  3. зробити другий етап як завжди

Ця процедура не підпадає під заборонену проблему регресії, але потенційно забезпечує більш ефективні оцінки вашого параметра, що цікавить.


Привіт Енді, дякую за вашу відповідь. Ви пропонуєте "невідповідність протоколу першого етапу / підходу OLS другого етапу"? Це не те, що я читав у посиланні, яке я дав. Кажуть, що підхід на першому етапі / OLS на другому етапі є послідовним.
Вінсент

Це не те, про що йдеться у повідомленні Статаліста. Якщо ви ознайомитесь з розділом «методи та формули» для команди Treatreg (що тепер називається etregress) в документації, ви побачите, що 2- ступінковий оцінювач не є 2SLS з пробітом першого етапу / OLS другим етапом. Натомість пробіт спочатку використовується для отримання коефіцієнтів небезпеки, які потім використовуються в регресії OLS для отримання послідовних оцінок.
Енді

Дякую, Енді. Це стає цікавим. Схоже, що імітація 2SLS з пробітною моделлю на 1-му етапі не приймається. Я прочитаю "заборонюючу регресію" з теоретичних причин. До речі, я спробував моделювання за допомогою SAS, і результати не виглядають поганими для 2SLS з пробітом 1-го / ols 2nd.
Вінсент

Я розміщую код у головному запитанні і хотів би почути ваші коментарі. Дякую!
Вінсент
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.