Тестування рівності коефіцієнтів від двох різних регресій


44

Це здається основним питанням, але я просто зрозумів, що насправді не знаю, як перевірити рівність коефіцієнтів від двох різних регресій. Чи може хтось пролити на це світло?

Більш формально, припустимо, я застосував наступні дві регресії: і де посилається на проектну матрицю регресії , а на вектор коефіцієнтів регресії . Зауважте, що і потенційно дуже різні, з різними розмірами і т. Д. Мене цікавить, наприклад, чи .у 2 = Х 2 & beta ; 2 + ε 2 х я я & beta ; я я Х 1 Х 2 & beta ; 11& beta ; 21

у1=Х1β1+ϵ1
у2=Х2β2+ϵ2
ХiiβiiХ1Х2β^11β^21

Якби вони виходили з тієї ж регресії, це було б банально. Але оскільки вони походять з різних, я не зовсім впевнений, як це зробити. Хтось має ідею чи може дати мені деякі вказівки?

Моя проблема докладно: Першою моєю інтуїцією було дивитись довірчі інтервали, і якщо вони перетинаються, то я б сказав, що вони по суті однакові. Хоча ця процедура не відповідає правильному розміру тесту (наприклад, кожен окремий довірчий інтервал має , але, дивлячись на них спільно, не буде однакової ймовірності). Моя "друга" інтуїція полягала в тому, щоб провести звичайний t-тест. Тобто візьмиα=0,05

β11-β21сг(β11)

де приймається як значення моєї нульової гіпотези. Це не враховує невизначеність оцінки , і відповідь може залежати від порядку регресій (який я називаю 1 і 2). β 21β21β21

Моя третя ідея полягала в тому, щоб зробити це як у стандартному тесті на рівність двох коефіцієнтів з тієї ж регресії, тобто взяти

β11-β21сг(β11-β21)

Ускладнення виникає через те, що обидва походять з різних регресій. Зауважте, що

Vаr(β11-β21)=Vаr(β11)+Vаr(β21)-2Соv(β11,β21)
але оскільки вони з різних регресій, як я можу отримати ?Соv(β11,β21)

Це змусило мене тут задати це питання. Це має бути стандартна процедура / стандартний тест, але я не знайшов нічого, що було б досить подібне до цієї проблеми. Тож, якщо хтось може вказати мені на правильну процедуру, я був би дуже вдячний!


2
Це, мабуть, стосується структурного / одночасного моделювання рівнянь. Одним із способів вирішення цієї задачі є одночасне встановлення обох рівнянь, наприклад, з максимальною ймовірністю, а потім використання тесту на відношення ймовірності обмеженої (рівної моделі параметрів) проти необмеженої моделі. Практично це можна зробити за допомогою програмного забезпечення SEM (Mplus, lavaan тощо)
tomka

2
Чи знаєте ви про начебто непов'язану регресію (SUR)?
Мастеров Димитрій Вікторович

2
Я думаю, що питання, яке ви піднімаєте, тобто як отримати cov обох коефіцієнтів, вирішується SEM, що дасть вам матрицю var-cov всіх коефіцієнтів. Тоді ви, можливо, можете використати тест Wald таким чином, який ви запропонували замість тесту LRT. Крім того, ви також можете використати повторний відбір проб / завантажувальний інструмент, який може бути більш прямим.
tomka

3
Так, ви маєте рацію з цим, @tomka. У моделі SUR (яку ви можете вільно вважати окремим випадком моделей SEM), я можу отримати відповідний тест. Дякую, що вказали мені в цьому напрямку! Я думаю, що я не замислювався над цим, тому що це здається трохи схожим на стрілянину з горобця гарматою, але я не можу думати про кращий спосіб. Якщо ви напишете відповідь, я позначу її як правильну. Інакше я незабаром це напишу, з швидким теоретичним поясненням і, можливо, з прикладом.
coffeinjunky

1
SUR досить простий у виконанні. Ось один приклад із Stata . З R, ви хочете systemfit .
Мастеров Димитрій Вікторович

Відповіді:


30

Хоча це не звичайний аналіз, він насправді викликає інтерес. Прийнята відповідь відповідає тому, як ви задали своє запитання, але я збираюся запропонувати інший досить добре прийнятий прийом, який може бути, а може і не бути еквівалентним (я залишаю це краще розуму, щоб прокоментувати це).

Цей підхід полягає у використанні наступного тесту Z:

Z=β1-β2(SЕβ1)2+(SЕβ2)2

Де - це стандартна помилка β .SЕββ

Це рівняння надають Клог, К.С., Петкова, Е., Харіту, А. (1995). Статистичні методи порівняння коефіцієнтів регресії між моделями. Американський журнал соціології , 100 (5), 1261-1293. і цитується Paternoster, R., Brame, R., Mazerolle, P., & Piquero, A. (1998). Використання правильного статистичного тесту на рівність коефіцієнтів регресії. Кримінологія , 36 (4), 859-866. рівняння 4, яке доступне безкоштовно від платної стіни. Я адаптував формулу Петерностера для використання а не bβбтому що можливо, що вас можуть зацікавити різні DV з якихось жахливих причин і моя пам'ять про Clogg et al. полягала в тому, що їх формула використовувала . Я також пам’ятаю перехресну перевірку цієї формули щодо Коена, Коена, Заходу та Ейкена, і корінь того ж мислення можна знайти там, де довірчий інтервал різниці між коефіцієнтами, рівняння 2.8.6, стор 46-47.β



β1β2
Z=Аβ1-Бβ2(SEАβ1)2+(SEБβ2)2

1
Також я зауважую, що у статті обговорюється випадок, коли одна модель вкладена всередині іншої, а DV-моделі двох моделей однакові. Що робити, якщо ці дві умови не виконані? Натомість у мене дизайнерські матриці двох моделей однакові, але вони мають різні DV. Чи все ще застосовується ця формула? Дуже дякую!
Сіббс азартні ігри

1
@SibbsGambling: Можливо, ви хочете зробити це питання самостійно, щоб привернути більше уваги.
russellpierce

β1β2

12

Для людей із подібним запитанням дозвольте навести простий контур відповіді.

у1у2

(у1у2)=(Х1  00  Х2)(β1β2)+(е1е2)

Це призведе до дисперсійно-коваріаційної матриці, яка дозволяє перевірити рівність двох коефіцієнтів.


11
Я реалізував так, як ви запропонували, і порівняв його із способом, описаним вище. Я виявив, що ключова відмінність полягає в тому, чи є припущення про те, що дисперсія помилок однакова чи ні. Ваш спосіб передбачає, що відхилення помилок є однаковими, і спосіб, який описано вище, не припускає.
KH Kim

2
Це добре працювало для мене. У Stata я зробив щось на кшталт: expand =2, generate(indicator); generate y = cond(indicator, y2, y1); regress y i.indicator##c.X, vce(cluster id); Використання кластеризованих стандартних рахунків помилок для того, що e1 і e2 не є незалежними для одного і того ж спостереження після складання набору даних.
wkschwartz

1
  • Vаr(β1-β2)=Vаr(β1)+Vаr(β2)

  • cоvаr(β1,β2)0

  • (Clogg, CC, Petkova, E., & Haritou, A. (1995). Статистичні методи порівняння коефіцієнтів регресії між моделями. American Journal of Sociology, 100 (5), 1261-1293.) Дає відповідь у спеціальному випадку вкладених рівнянь (тобто, щоб отримати друге рівняння, розгляньте перше рівняння і додайте кілька пояснювальних змінних) Вони кажуть, що це легко здійснити.

  • Якщо я добре це розумію, в цьому спеціальному випадку також може бути реалізований тест Хауссмана. Ключова відмінність полягає в тому, що їх тест вважає істинним другим (повним) рівнянням, тоді як тест Хауссмана вважає істинним перше рівняння.

  • Зауважимо, що Clogg et al (1995) не підходить для даних панелей. Але їх тест узагальнено (Yan, J., Aseltine Jr, RH, & Harel, O. (2013). Порівнюючи коефіцієнти регресії між вкладеними лінійними моделями для кластеризованих даних із узагальненими оціночними рівняннями. Journal of Education and Behevioral Statistics, 38 (2), 172-189.) З пакетом, наданим на R: geepack Див.: Https://www.jstor.org/stable/pdf/41999419.pdf?refreqid=excelsior%3Aa0a3b20f2bc68223edb59e3254c234be&seq=1

І (для пакету R): https://cran.r-project.org/web/packages/geepack/index.html

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.