Виникло подібне питання щодо першого етапу пробіту та другого етапу OLS. У відповіді я надав посилання на нотатки, які містять формальне підтвердження непослідовності цієї регресії, яка офіційно відома як "заборонена регресія", як її називали Джеррі Хаусман. Основна причина невідповідності підходу пробіту першого етапу / OLS-другого етапу полягає в тому, що ні оператор очікувань, ні оператор лінійних проекцій не проходять через нелінійний перший етап. Тому пристосовані значення пробіту першої стадії лише не співвідносяться із терміном помилки другої стадії під дуже обмежуючими припущеннями, які практично ніколи не виконуються на практиці. Будьте в курсі, що формальне підтвердження непослідовності забороненої регресії є досить детальним, якщо я правильно пам’ятаю.
Якщо у вас є модель
де - неперервний результат, а - двійкова ендогенна змінна, ви можете запустити перший етап
через OLS а на другому етапі використовуйте встановлені значення замість . Це лінійна імовірнісна модель, на яку ви посилалися. Враховуючи, що для цього лінійного першого етапу немає жодних проблем для очікувань або лінійних прогнозів, ваші оцінки 2SLS будуть узгоджені, хоча і менш ефективні, ніж вони могли б бути, якщо ми врахували б нелінійний характер .У я Х я Х я = + Z ' я тг + η я Х я Х я Х я
Yi= α + βХi+ ϵi
YiХiXi=a+Z′iπ+ηi
XˆiXiXi
Узгодженість цього підходу випливає з того, що хоча нелінійна модель може більше відповідати умовним функціям очікування для обмежених залежних змінних, це не має великого значення, якщо вас цікавить граничний ефект. У лінійній моделі ймовірності самі коефіцієнти є граничними ефектами, оціненими середнім значенням, тому, якщо граничний ефект на середньому рівні - це те, що вам потрібно (і зазвичай це люди), то це те, чого ви хочете, якщо лінійна модель дає найкращу лінійну наближення до нелінійних функцій умовного очікування.
Те ж саме справедливо і якщо є двійковим.Yi
Для більш детального обговорення цього питання ознайомтеся з відмінними конспектами лекцій Кіта Баума з цієї теми. З слайду 7 він обговорює використання лінійної моделі ймовірностей у контексті 2SLS.
Нарешті, якщо ви дійсно хочете використовувати probit, тому що ви хочете більш ефективні оцінки, то є ще один спосіб, який також згадується в Wooldridge (2010) "Економетричний аналіз даних перерізів і панелей". Наведена вище відповідь включає його, я повторюю його тут для повноти. Як застосований приклад див. Adams et al. (2009), які використовують триетапну процедуру:
- використовувати пробіт для регресу ендогенної змінної на інструменті (ах) та екзогенних змінних
- використовувати передбачувані значення з попереднього кроку на першій стадії OLS разом із екзогенними (але без інструментальних) змінних
- зробити другий етап як завжди
Ця процедура не підпадає під заборонену проблему регресії, але потенційно забезпечує більш ефективні оцінки вашого параметра, що цікавить.