Основне припущення про різницю у різниці (DID) полягає в тому, що обидві групи мають загальну тенденцію змінної результатів до лікування. Це важливо для того, щоб зробити аргумент, що зміна для оброблюваної групи відбувається через лікування, а не тому, що для початку дві групи вже відрізнялися одна від одної.
Якщо ви відбираєте вибірку різних людей до та після лікування, це полегшить аргумент, якщо ваші зразки з груп лікування та контрольної групи насправді не є випадковими та великими. Тож може статися, що хтось збирається запитати у вас: "Як ви можете переконатися, що ефект обумовлений лікуванням, а не лише тим, що ви взяли вибірки на різних людей?" - і на це буде важко відповісти. Цього питання ви можете уникнути, використовуючи дані панелей, оскільки там ви відстежуєте однакові статистичні одиниці з часом, і це, як правило, більш ґрунтовний підхід.
Щоб відповісти на ваше останнє запитання: так, дані мають значення, але ви можете неодмінно використовувати OLS для оцінки свого рівняння вище. Важливою річчю, яку в минулому часто не помічали, є правильна оцінка стандартних помилок. Якщо ви їх не виправите, послідовне співвідношення недооцінить їх на велику кількість, і ви знайдете значні наслідки, хоча, ймовірно, не повинні. В якості посилання та пропозицій щодо вирішення цієї проблеми див. Bertrand et al. (2004) "Скільки слід довіряти оцінкам відмінностей у різницях?" .
Нарешті, якщо у вас є сукупні дані (наприклад, на державному рівні) або якщо ви можете легко агрегувати свої, і якщо ви хочете скористатися більш сучасним економетричним методом, ніж DID, ви можете ознайомитися з Abadie et al. (2010) "Методи синтетичного контролю для порівняльних прикладних досліджень" . Синтетичний метод контролю все частіше застосовується в сучасних дослідженнях і існує добре документально підтверджена процедура для R та Stata. Можливо, це щось цікаве і для вас.