Відповідність показника схильності до даних панелі


13

У мене є набір поздовжніх даних про осіб, деякі з них піддавалися лікуванню, а інші - не. Усі особи є у вибірці від народження до 18 років, і лікування відбувається в деякому віці між цим діапазоном. Вік лікування може відрізнятися в різних випадках. Використовуючи відповідність показників схильності, я хотів би співставити оброблені та контрольні підрозділи в парі з точним узгодженням за роком народження, щоб я міг відслідковувати кожну пару від їх народження до 18 років. Загалом є близько 150 лікуваних та 4000 нелікованих осіб. Після узгодження ідея полягає у використанні стратегії різниці у відмінностях для оцінки ефекту від лікування.

Проблема, з якою я стикаюся в даний момент, полягає в тому, щоб виконати відповідність з даними панелі. Я використовую psmatch2команду Stata і порівнююсь за побутовими та індивідуальними характеристиками, використовуючи відповідність балів схильності. Загалом із даними на панелі будуть різні оптимальні збіги у кожному віці. Як приклад: якщо A лікується, B і C є контрольними, і всі вони народилися в 1980 році, то A і B можуть бути узгоджені в 1980 році у віці 0, тоді як A і C узгоджуються в 1981 році у віці 1 і так далі . Також А може відповідати власним значенням попередньої обробки попередніх років.

Щоб вирішити цю проблему, я взяв середнє значення для всіх змінних за часом змінних, так що відповідність може визначити осіб, які в середньому найбільш схожі за тривалість вибірки, і я здійснюю відповідність окремо для кожної вікової групи від 0 до 18 років. На жаль, це все ще відповідає різному блоку управління для кожної лікувальної одиниці у віковій групі.

Якщо хтось міг би спрямувати мене на метод, щоб зробити парне узгодження з даними панелі в Stata, це буде дуже вдячно.

Відповіді:


9

В основному ви повинні створити набір даних широкого формату з усіма характеристиками, які мають відношення до процедури узгодження, виконати відповідність на цьому наборі даних поперечного перерізу, а потім використовувати ідентифікатор для ідентифікації відповідної пари в наборі даних панелі. Ось ще кілька деталей:

  1. Використовуйте reshapeдля створення набору даних широкого формату. Відформатуйте змінні попередньої обробки так, як ви хочете використовувати їх у процедурі відповідності. Ви можете просто взяти середнє значення змінних, якщо у вас є кілька спостережень за однією людиною, але ви можете також запропонувати інші способи (ви також можете зберегти кілька спостережень за одними і тими ж змінними, такими як Health1, Health2 і використовувати їх у відповідності ). Мета - мати набір даних з одним спостереженням на кожного .

  2. За допомогою цього набору даних виконайте процедуру узгодження з psmatch2.

  3. Об’єднайте інформацію про збігаються випадки з оригінальним набором даних. Випадання випадків, які не відповідають і т. Д. Я не впевнений в деталях тут, тому що я не знаю статистичних даних, psmatch2але я думаю, ви зрозуміли цю ідею.

Використовуючи ці кроки, ви можете зіставити випадки на основі всієї інформації про попередню обробку, і у вас є лише одна відповідність на кожну лікувальну одиницю.


3
Я справді не знаю, чому ця публікація була озвучена, оскільки ця відповідь насправді допомагає. Я проголосую за нього знову. Дякую Грег!
Енді

5

У Stata чи будь-якому іншому програмному забезпеченні, про яке я знаю , немає жодного способу зробити це .

Якщо ви намагаєтеся зафіксувати упереджений оцінювач відповідності за допомогою методів передачі даних на панелі, ось один підхід може працювати. Якщо ви можете припустити, що відповідність відповідає певним, але не всім зміщенням відбору, але що зміщення значною мірою залишається постійним у часі, ви можете видалити інваріантну частину зміщення, побудувавши окремі оцінки відповідності у кожному періоді та взявши різниця.

Нехай - період попередньої обробки, а посада. Якщо результат нелікованого стану задовольняєttY0

t = Δ T T + B i a s Δ M t = B i a s Δ M t - Δ M

E[Y0t|X,D=1]E[Y0t|X,D=0]=E[Y0t|X,D=1]E[Y0t|X,D=0]=Bias,
то якщо і , ви можете отриматиΔtM=ΔTT+BiasΔtM=BiasΔtMΔtM=ΔTT

Гекман, Ічімура, Сміт і Тодд 1998 Економетрика та Ейхлер і Лехнер 2002 р. Доповіді про економіку праці є прикладами такого підходу. З іншого боку, 150 оброблених спостережень може бути недостатньою для такого підходу до роботи.


1
Потрібно мати можливість зіставлення осіб у парах за даними на панелі, оскільки ці два документи ( paper1 , paper2 ) роблять це також. На жаль, автори точно не заявляють, як вони це зробили. Ідея, яку ви описуєте з Heckman et al (1998), саме є причиною використання Diff-in-Diff після попарного зіставлення.
Енді

Мені не зрозуміло, що вони роблять відповідність панелей, але ви праві, що процедури розпливчасті. Автори написали pscore, який свідчить про певну готовність допомагати іншим. Можливо, електронний лист до них уточнить речі. Повідомте про те, що вони говорять. Це важливе питання.
Мастеров Димитрій Вікторович

0

Кроки:

  1. Як детально згадував Грег, ви можете використовувати набір даних поперечного перерізу або на засобах попередньої обробки, або на окремому періоді попередньої обробки для створення відповідності.

  2. Використовуючи всю панель, ви призначаєте індикаторні змінні для
    a. лікуєтьсяІндивідуальний
    b. Оброблений Період, останній дорівнює нулю, як тільки відбувається лікування для обробленого Індивідуального.

    Оскільки момент часу, коли оброблений період змінюється від 0 до 1, змінюється для окремих осіб і ніколи не перетворюється на 1 для необроблених, ви повинні призначити ту саму вихідну точку від обробленої відповідності до необробленої відповідності. Це інтуїтивно, але я все ж хотів би бачити хороший посилання, яке виправдовує такий підхід, якого я досі не знайшов.

Регресія буде такою:

depvar = treatedIndvidual + treatedPeriod  + treatedIndvidual*treatedPeriod + controls

де термін взаємодії дає ефект лікування.


-2

Ви думали про використання команди nnmatch ?

Я використовую цю команду, і вона є досить вичерпною. Він враховує різні алгоритми узгодження, а також випадки, коли показник схильності однаковий для деяких осіб контрольної групи. Звичайно, лікування цього випадку залежить від алгоритму відповідності, якщо ви берете k-найближчий сусід чи ядро ​​чи будь-що інше.


У статті, на яку ви посилалися, я не бачу згадок про дані панелі. Ви використовували це для даних панелі? Якщо так, будь ласка, уточнюйте та надайте код, щоб відповісти на питання ОП.
Показники

Точне узгодження простіше, але загальна nnmatch є складнішою, оскільки вона не зберігає відповідні ідентифікатори всередині поточного набору даних, а в окремому. Я закінчу з одним набором даних для кожної вікової групи, які потрібно об'єднати з вихідними даними. Злиття в цьому випадку не працює, оскільки відповідні характеристики не однозначно ідентифікують осіб у вихідних даних. Тож, на жаль, це не дає рішення.
Енді
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.