Що таке різниця у
оцінці відмінностей Різниця у відмінностях (DiD) - це інструмент для оцінки ефектів лікування, порівнюючи відмінності до та після лікування в результатах лікування та контрольній групі. Загалом, ми зацікавлені в оцінці ефекту лікування (наприклад, статусу союзу, ліків тощо) на результат (наприклад, зарплата, здоров'я тощо), як у
де це індивідуальні фіксовані ефекти (характеристики осіб, які не змінюються з часом), - часові фіксовані ефекти, - коваріати, що змінюються часом, як вік людей, іDiYi
Yit=αi+λt+ρDit+X′itβ+ϵit
αiλtXitϵit - термін помилки. Індивіди і час індексуються відповідно і відповідно. Якщо існує кореляція між фіксованими ефектами та то оцінка цієї регресії через OLS буде упереджена, враховуючи, що фіксовані ефекти не контролюються. Це типовий
ухил змінної зміни .
itDit
Щоб побачити ефект від лікування, ми хотіли б знати різницю між людиною у світі, в якому вона отримала лікування, та тим, у якому вона не проводить. Звичайно, лише одна з них спостерігається на практиці. Тому ми шукаємо людей, які мають однакові тенденції до лікування. Припустимо , що ми маємо два періоду і дві групи . Тоді, при припущенні, що тенденції у групах лікування та контролю тривали б так само, як і раніше, за відсутності лікування, ми можемо оцінити ефект лікування як
t=1,2s=A,B
ρ=(E[Yist|s=A,t=2]−E[Yist|s=A,t=1])−(E[Yist|s=B,t=2]−E[Yist|s=B,t=1])
Графічно це виглядатиме приблизно так:
Ви можете просто обчислити ці засоби вручну, тобто отримати середній результат групи в обох періодах та прийняти їх різницю. Потім отримують середній результат групи в обох періодах і приймають їх різницю. Потім прийміть різницю в різницях, і ось ефект лікування. Однак зручніше це робити в регресійних рамках, оскільки це дозволяєAB
- для контролю за коваріатами
- отримати стандартні помилки для ефекту лікування, щоб перевірити, чи є він суттєвим
Для цього можна дотримуватися будь-якої з двох рівнозначних стратегій. Створіть манекен контрольної групи який дорівнює 1, якщо людина перебуває в групі і 0 в іншому випадку, створіть манекен часу який дорівнює 1, якщо і 0 в іншому випадку, а потім регрес
treatiAtimett=2
Yit=β1+β2(treati)+β3(timet)+ρ(treati⋅timet)+ϵit
Або ви просто генеруєте манекен який дорівнює одиниці, якщо людина перебуває в групі лікування І часовий період - це період після лікування, а в іншому випадку дорівнює нулю. Тоді ви б регресували
Tit
Yit=β1γs+β2λt+ρTit+ϵit
де знову є манекеном для контрольної групи, а - манекенами часу. Дві регресії дають однакові результати протягом двох періодів та двох груп. Друге рівняння є більш загальним, хоча воно легко поширюється на кілька груп та періоди часу. У будь-якому випадку, саме так ви можете оцінити параметр різниці в відмінностях таким чином, що ви можете включити контрольні змінні (я вийшов із наведених рівнянь, щоб не захаращувати їх, але ви можете просто включити їх) та отримати стандартні помилки для висновку.γsλt
Чому корисний оцінювач різниці різниць?
Як було сказано раніше, DiD - це метод оцінки ефектів лікування за допомогою неекспериментальних даних. Це найкорисніша особливість. DiD - це також версія оцінки фіксованих ефектів. Тоді як модель фіксованих ефектів передбачає , DiD робить подібне припущення, але на рівні групи, . Тож очікуване значення результату тут - це сума групи та часовий ефект. То яка різниця? Для Ви Робили не обов'язково панельні даних до тих пір , як ваші неодноразові перетини, взяті з того ж агрегатного блоку . Це робить DiD застосованим до більш широкого масиву даних, ніж стандартні моделі з фіксованими ефектами, які потребують панельних даних.E(Y0it|i,t)=αi+λtE(Y0it|s,t)=γs+λts
Чи можна довіряти різниці у відмінностях?
Найважливішим припущенням в DiD є припущення про паралельні тенденції (див. Малюнок вище). Ніколи не довіряйте дослідженню, яке графічно не показує цих тенденцій! Документи у 90-х роках, можливо, відійшли від цього, але сьогодні наше розуміння DiD набагато краще. Якщо немає переконливого графіка, який би показував паралельні тенденції в результатах попереднього лікування для груп лікування та контролю, будьте обережні. Якщо припущення про паралельні тенденції дотримується, і ми можемо правдиво виключити будь-які інші зміни варіанту часу, які можуть заплутати лікування, то DiD є надійним методом.
Інше слово обережності слід застосовувати, коли мова йде про лікування стандартних помилок. Маючи багаторічні дані, вам потрібно відкоригувати стандартні помилки для автокореляції. У минулому цим нехтували, але з часу Бертран та ін. (2004) "Скільки слід довіряти оцінкам відмінностей у відмінності?" ми знаємо, що це питання. У роботі вони містять декілька засобів для боротьби з автокореляцією. Найпростіше - це кластеризація індивідуального ідентифікатора панелі, що дозволяє довільно співвідносити залишки між окремими часовими рядами. Це виправляє як автокореляцію, так і гетеросцедастичність.
Для подальших довідок див. Ці конспекти лекцій Вальдінгера та Пішке .