Як зберегти інваріантні змінні часу у моделі фіксованих ефектів


15

У мене є дані про працівників великої італійської фірми за десять років, і я хотів би побачити, як гендерний розрив у доходах чоловіків і жінок змінювався з часом. Для цього я запускаю об'єднаний OLS:

yit=Xitβ+δmalei+t=110γtdt+εit
де y - прибуток від журналу на рік, Xit включає коваріати, які різняться за індивідуальністю та часом, dt- це манекени року, і malei дорівнює одному, якщо працівник є чоловіком, а в іншому випадку дорівнює нулю.

Зараз у мене є занепокоєння, що деякі коваріати можуть бути пов'язані з непоміченими фіксованими ефектами. Але коли я використовую оцінку фіксованих ефектів (усередині) або перші відмінності, я втрачаю гендерну манекен, оскільки ця змінна не змінюється з часом. Я не хочу використовувати оцінювач випадкових ефектів, тому що часто чую, як люди говорять, що це висуває припущення, які є дуже нереальними і навряд чи можуть виконати.

Чи є способи зберегти гендерну манекен і контролювати фіксований вплив одночасно? Якщо є спосіб, чи потрібно мені кластеризувати чи піклуватися про інші проблеми з помилками тестів гіпотез про гендерну змінну?

Відповіді:


22

Існує кілька потенційних способів утримати гендерну манекену в регресії з фіксованими наслідками.

В оцінювачі
Припустимо, у вас є подібна модель порівняно з вашою об'єднаною моделлю OLS, яка є

yit=β1+t=210βtdt+γ1(malei)+t=110γt(dtmalei)+Xitθ+ci+ϵit
де змінні як раніше. Тепер зауважимо, щоβ1 іβ1+γ1(malei) не можна ідентифікувати, оскільки оцінювач у межах не може їх відрізнити від фіксованого ефектуci . Враховуючи, щоβ1 - перехоплення базового рокуt=1 ,γ1 - гендерний вплив на заробіток у цей період. Що ми можемо визначити в цьому випадкуγ2,...,γ10 оскільки вони взаємодіють із вашими манекенами часу, і вони вимірюють відмінності в часткових наслідках вашої гендерної змінної відносно першого періоду часу. Це означає , що якщо ви помітили збільшення вашої з часом це є показником для збільшення розриву в заробітках між чоловіками та жінками.γ2,...,γ10

Оцінювач першої різниці
Якщо ви хочете знати загальний ефект різниці між чоловіками та жінками з часом, ви можете спробувати наступну модель: де змінна т = 1 , 2 ,

yit=β1+t=210βtdt+γ(tmalei)+Xitθ+ci+ϵit
взаємодіє з гендерною манекенкою, інваріантною за часом. Тепер, якщо ви берете перші відмінності β 1 і c я випадаю, і ви отримаєте y i t - y i ( t - 1 ) = 10 t = 3 β t ( d t - d ( t - 1 ) ) + γ ( t m a l e i -t=1,2,...,10β1ci Тоді γ ( t m a l e i - [ ( t - 1 ) m a
yityi(t1)=t=310βt(dtd(t1))+γ(tmalei[(t1)malei])+(XitXi(t1))θ+ϵitϵi(t1)
і можна визначити різницю статі у заробітках γ . Отже, кінцевим рівнянням регресії буде: Δ y i t = 10 t = 3 β t Δ d t + m a l e i ) + Δγ(tmalei[(t1)malei])=γ[(t(t1))malei]=γ(malei)γ і ви отримуєте свій інтерес. Приємно, що це легко реалізується у будь-якому статистичному програмному забезпеченні, але ви втрачаєте часовий проміжок.
Δyit=t=310βtΔdt+γ(malei)+ΔXitθ+Δϵit


ci1ci2

y~it=X~1it+X~2it+γ(male~i2)+c~i+ϵ~it
X~1it=X1itθ^iX¯1iθ^iX¯1i- середній час для кожної людини. Це не схоже на звичайний оцінювач випадкових ефектів, якого ви хотіли уникнути через групу2 variables are instrumented for in order to remove the correlation with ci. For X~2it the instrument is X2itX¯2i. The same is done for the time-invariant variables, so if you specify the gender variable to be potentially correlated with the fixed effect it gets instrumented with X¯1i, so you must have more time-varying than time-invariant variables.

All of this might sound a little complicated but there are canned packages for this estimator. For instance, in Stata the corresponding command is xthtaylor. For further information on this method you could read Cameron and Trivedi (2009) "Microeconometrics Using Stata". Otherwise you can just stick with the two previous methods which are a bit easier.

Inference
For your hypothesis tests there is not much that needs to be considered other than what you would need to do anyway in a fixed effects regression. You need to take care for the autocorrelation in the errors, for example by clustering on the individual ID variable. This allows for an arbitrary correlation structure among clusters (individuals) which deals with autocorrelation. For a reference see again Cameron and Trivedi (2009).


4

Another potential way for you to keep the gender dummy is the the Mundlak's (1978) approach for a fixed effect model with time invariant variables. The Mundlak's approach would posit that the gender effect can be projected upon the group means of the time-varying variables.

Mundlak, Y. 1978: On the pooling of time series and cross section data. Econometrica 46:69-85.


2

Another method is to estimate the time-invariant coefficients in a second stage equation, using the mean error as the dependent variable.

First, estimate the model with FE. From here you get an estimation of β and γt. For simplicity, let's forget about the year-effects. Define the estimation error u^it as before:

u^ityitXitβ^

The linear predictor u¯i is:

u¯it=1Tu^iT=yit¯x¯iβ^

Now, consider the following second stage equation:

u¯i=δmalei+ci

Assuming that gender is uncorrelated with unobserved factors ci. Then, the OLS estimator of δ is unbiased and time-consistent (this is, it is consistent when T).


To prove the above, replace the original model into the estimator u¯i:

u¯i=x¯iβx¯iβ^+δmalei+ci+t=1TϵitT

The expectation of this estimator is:

E(u¯i)=x¯iβx¯iE(β^)+δmalei+E(ci)+t=1TE(ϵit)T

If assumptions for FE consistency hold, β^ is an unbiased estimator of β, and E(ϵit)=0. Thus:

E(u¯i)=δmalei+E(ci)

This is, our predictor is an unbiased estimator of the time-invariant components of the model.

Regarding consistency, the probability limit of this predictor is:

plimTu¯i=plimT(x¯iβ)plimT(x¯iβ^)+plimTδmalei+plimTci+plimT(t=1TϵitT)

Again, given FE assumptions, β^ is a consistent estimator of β, and the error term converges to its mean, which is zero. Therefore:

plimTu¯i=δmalei+ci

Again, our predictor is a consistent estimator of the time-invariant components of the model.


1

The Mundlak chamberlain device is a perfect tool for this. It is usually referred to as the correlated random effects model because it uses the random effect model to implicitly estimate fixed effects for time variant variables while also estimating the random effects for time invariant variables.

However, in statistical softwares, you implement it thesame as the random effect model but you have to add the means of all time variant covariates.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.