Чи застосовується процедура Mundlak з фіксованими ефектами для логістичної регресії з манекенами?


12

У мене є набір даних із 8000 кластерами та 4 мільйонами спостережень. На жаль, моє статистичне програмне забезпечення, Stata, працює досить повільно, коли використовує свою панельну функцію даних для логістичної регресії: xtlogitнавіть з 10% підпробою.

Однак при використанні непанельної logitфункції результати з’являються набагато швидше. Тому я можу отримати користь від використання logitмодифікованих даних, які враховують фіксовані ефекти.

Я вважаю, що ця процедура придумана "процедурою фіксованих ефектів Мундлака" (Mundlak, Y. 1978. Об'єднання даних часових рядів та перерізів. Econometrica, 46 (1), 69-85.)

Я знайшов інтуїтивне пояснення цієї процедури в роботі Antonakis, J., Bendahan, S., Jacquart, P., & Lalive, R. (2010). Про висунення причинних претензій: огляд та рекомендації. Лідерство щоквартально, 21 (6). 1086-1120. Цитую:

Один із способів подолати проблему пропущених ефек- тових ефектів та все ж включити змінні рівня 2 - це включити кластерні засоби всіх коваріатів рівня 1 до оціночної моделі (Mundlak, 1978). Засоби кластера можуть бути включені як регресори або відняті (тобто середнє значення кластера) від коваріату рівня 1. Засоби кластера є інваріантними в межах кластера (і змінюються між кластерами) і дозволяють послідовно оцінювати параметри рівня 1 так само, як ніби були включені поправлені ефекти (див. Rabe-Hesketh & Skrondal, 2008).

Тому центрове кластерне середнє здається ідеальним та практичним для вирішення моєї обчислювальної задачі. Однак ці документи, здається, спрямовані на лінійну регресію (OLS).

Чи застосований цей метод центрування в середньому кластері для "реплікації" бінарної логістичної регресії з фіксованими ефектами?

Більш технічним запитанням, яке має призвести до тієї самої відповіді, було б: чи xtlogit depvar indepvars, feз набором даних, рівним logit depvar indepvarsнабору даних B, коли набір даних B є середньосередньою за кластерною версією набору даних A?

Додаткову складність, яку я виявив у цьому середньому кластерному центрі, - як впоратися з манекенами. Оскільки манекени або 0, або 1, чи вони однакові за регресією випадкових та фіксованих ефектів? Чи не слід їх "зосереджувати"?

Відповіді:


9

Спочатку розмежування або в межах перетворень, таких як приниження, недоступні в таких моделях, як logit, оскільки у випадку з нелінійними моделями такі хитрощі не знімають незафіксованих фіксованих ефектів. Навіть якщо у вас був менший набір даних, в який було б можливо включити індивідуальні манекени N-1 для прямої оцінки фіксованих ефектів, це призведе до упереджених оцінок, якщо часовий вимір ваших даних не великий. Усунення фіксованих ефектів у панелі logit не випливає ні з розрізнення, ні з приниженням, а можливе лише завдяки функціональній формі logit. Якщо вас цікавлять деталі, ви можете ознайомитись із цими примітками Седербом на PDF-сторінці 30 (пояснення, чому приниження / перше розмежування logit / probit не допомагає) та на сторінці 42 (введення панельного оцінювача logit).

Інша проблема полягає в тому, що xtlogitі панельні моделі logit взагалі не оцінюють фіксованих ефектів безпосередньо, необхідних для обчислення граничних ефектів. Без них буде дуже незручно інтерпретувати ваші коефіцієнти, які можуть бути невтішними після запуску моделі годинами та годинами.

З таким великим набором даних та згаданими раніше концептуальними труднощами панелі FE, я б дотримувався лінійної моделі ймовірностей. Я сподіваюся, що ця відповідь вас не розчарує, але є багато вагомих причин для надання такої поради: LPM набагато швидше, коефіцієнти можна інтерпретувати відразу (це стосується, особливо, якщо у вас є ефекти взаємодії у вашій моделі, оскільки інтерпретація їх коефіцієнти в нелінійних моделях змінюються!), фіксованими ефектами легко керувати, і ви можете коригувати стандартні помилки для автокореляції та кластерів без часу оцінки, що збільшуються без причини. Я сподіваюся, що це допомагає.


1
Це не рішення, але це відповідь. Дякую :)
Том

1
Невелике значення: p20 цих слайдів робить ваш випадок, але модель корекції Mundlak, відома як «корельовані випадкові ефекти», описана на p47 і, схоже, не містить таких застережень.
кон'югатприор

1

Я вважаю, що умовний logit ("clogit" на Stata) - це альтернативний оцінювач панелі logit з фіксованим ефектом.

http://www3.nd.edu/~rwilliam/stats3/Panel03-FixedEffects.pdf


5
Ласкаво просимо на сайт! Я вважаю, що це не прийнятна відповідь, оскільки питання насправді полягає в тому, як уникнути умовної (фіксованої дії) логістичної регресії за допомогою модифікованої поперечної секційної логістичної регресії з метою прискорення оцінки. Як ваша посилання вказує (у верхній частині сторінки 3), «ми можемо використовувати або Stata« s clogitкоманда або xtlogit, feкоманда , щоб зробити фіксовані ефекти логит аналіз. Обидва дають однакові результати. (Насправді, я вважаю , на xtlogit, feсамому ділі викликає clogit.) »The ОП вже знала xtlogit, feна основі передостаннього абзацу.
Рендел

0

Еллісон обговорювала цю проблему в Allison, (2009), "Моделі регресії з фіксованими ефектами", с.32f.

Еллісон стверджує, що неможливо оцінити безумовну модель з максимальною ймовірністю. Це так, тому що моделі стають упередженими через "проблему випадкових параметрів". Натомість він рекомендує використовувати умовну модель logit (Chamberlain, 1980). Це здійснюється шляхом обумовлення функції ймовірності на кількість подій, що спостерігаються для кожної людини.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.