Налаштування даних для відмінностей у відмінностях


9

Яка установка є правильною для різниці різницької регресійної моделі за допомогою

Yiст=α+γсТ+λгт+δ(Тгт)+ϵiст

де T - манекен, рівний 1, якщо спостереження від групи лікування, а d - манекен, рівний 1 за період часу після лікування

1) Випадкові вибірки з кожної групи та часу (тобто 4 випадкових вибірки)

або

2) Дані на панелі, де відслідковуються однакові одиниці протягом обох часових періодів?

Чи це має значення і якщо ні, то чи можна OLS використовувати в будь-якому випадку?


1
Я не бачив (1) зробленого - аналіз завжди здається = (2). Не впевнений, чому б ви робили (1). Але я не бачив багатьох досліджень з ДІД.
Чарльз

1
Приклади 1 наведені у розділі 13.2 вступної економетрії
Wooldridge

Відповіді:


19

Основне припущення про різницю у різниці (DID) полягає в тому, що обидві групи мають загальну тенденцію змінної результатів до лікування. Це важливо для того, щоб зробити аргумент, що зміна для оброблюваної групи відбувається через лікування, а не тому, що для початку дві групи вже відрізнялися одна від одної.

Якщо ви відбираєте вибірку різних людей до та після лікування, це полегшить аргумент, якщо ваші зразки з груп лікування та контрольної групи насправді не є випадковими та великими. Тож може статися, що хтось збирається запитати у вас: "Як ви можете переконатися, що ефект обумовлений лікуванням, а не лише тим, що ви взяли вибірки на різних людей?" - і на це буде важко відповісти. Цього питання ви можете уникнути, використовуючи дані панелей, оскільки там ви відстежуєте однакові статистичні одиниці з часом, і це, як правило, більш ґрунтовний підхід.

Щоб відповісти на ваше останнє запитання: так, дані мають значення, але ви можете неодмінно використовувати OLS для оцінки свого рівняння вище. Важливою річчю, яку в минулому часто не помічали, є правильна оцінка стандартних помилок. Якщо ви їх не виправите, послідовне співвідношення недооцінить їх на велику кількість, і ви знайдете значні наслідки, хоча, ймовірно, не повинні. В якості посилання та пропозицій щодо вирішення цієї проблеми див. Bertrand et al. (2004) "Скільки слід довіряти оцінкам відмінностей у різницях?" .

Нарешті, якщо у вас є сукупні дані (наприклад, на державному рівні) або якщо ви можете легко агрегувати свої, і якщо ви хочете скористатися більш сучасним економетричним методом, ніж DID, ви можете ознайомитися з Abadie et al. (2010) "Методи синтетичного контролю для порівняльних прикладних досліджень" . Синтетичний метод контролю все частіше застосовується в сучасних дослідженнях і існує добре документально підтверджена процедура для R та Stata. Можливо, це щось цікаве і для вас.


Це чудовий Енді! Чи можу я підсумувати, сказавши, що обидва налаштування даних прийнятні, але про те, що дані панелі простіше зробити аргумент щодо припущень? Це може відповідати обом OLS, але стандартні помилки (особливо я вважаю налаштування даних панелі) сумнівні через можливу послідовну кореляцію. Чи вдале рішення для налаштування панелі з Newey West SE?
B_Miner

6
Так, для першого типу даних вам потрібно більше і чітких припущень. Для стандартних помилок має працювати корекція Newyy West. Насправді це аналогічно одному з методів корекції, запропонованих Bertrand et al. (вони використовують кластеризовані стандартні помилки). Більш свіжий метод використовує завантажувальний інструмент, який працює досить добре (див. Rbnz.govt.nz/research_and_publications/seminars_and_workshops/… ). Сподіваюся, це допомагає!
Енді
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.