Умовна середня незалежність передбачає неупередженість та послідовність оцінки ОЛС


10

Розглянемо таку модель множинної регресії:

(1)Y=Xβ+Zδ+U.

Тут - вектор стовпця ; a матриця; a вектор стовпця; a матриця; a вектор стовпця; і , термін помилки, вектор стовпців .Yn×1Xn×(k+1)β(k+1)×1Zn×lδl×1Un×1


ПИТАННЯ

Мій лектор, підручник « Вступ до економетрії», 3-е видання. Джеймс Х. Сток і Марк У. Уотсон, с. 281 та Економетрика: Засідання з перегляду екзамену з честю (PDF) , с. 7, висловив мені наступне.

  1. Якщо припустити, що називається умовною середньою незалежністю , що за визначенням означає, що
    (2)E(U|X,Z)=E(U|Z),
  2. і якщо припущення про найменші квадрати виконуються за винятком умовного середнього нульового припущення (тому будемо вважати, що ) (див. 1 -3 нижче),E(U|X,Z)=0E(U|X,Z)=E(U|Z)0

  3. тоді, OLS-оцінювач з в залишається неупередженим та послідовним за цим слабшим набором припущень.β^β(1)

Як я можу довести цю пропозицію? Тобто, що з 1 і 2 вище випливає, що оцінка OLS дає нам об'єктивний та послідовний оцінювач ? Чи є якась дослідницька стаття, яка підтверджує цю пропозицію?ββ


КОМЕНТАР

Найпростіший випадок наведено, розглядаючи модель лінійної регресії та доводить, що оцінка OLS of є неупередженим, якщо для кожного .

Yi=β0+β1Xi+β2Zi+ui,i=1,2,,n,
β 1 β 1 Е ( U я | Х я , Z я ) = Е ( U я | Z я ) Iβ^1β1E(ui|Xi,Zi)=E(ui|Zi)i

ЩО І СПІЛЬНО НОРМАЛЬНО РАЗРЕШЕНОUiZi

Визначте , тоді іТаким чином, може бути переписаний як По випливає, що Тепер, оскільки і спільно нормально розподіляються, теорія нормальних розподілів, пор. Отримуючи умовні розподіли багатоваріантного нормального розподілу , говорить, що (дійсно, нам не потрібно вважати спільну нормальність, а лише цю тотожність) для деякого на векторV=UE(U|X,Z)U=V+E(U|X,Z)

(*)E(V|X,Z)=0.
(1)
(3)Y=Xβ+Zδ+E(U|X,Z)+V.
(2)
(4)Y=Xβ+Zδ+E(U|Z)+V.
UiZi E ( U | Z ) = Z γ l1γ0
(**)E(U|Z)=Zγ
l1γ0 .

Тепер стає Для моделі всі припущення про найменші квадрати виконуються, оскільки термін помилки задовольняє припущення про умовне означає нуль. Це означає , що МНК оцінки з буде несмещенной, якщо ми нехай , і нехай бути від матриці, що складається з і , тоді оцінка OLS в задається, враховуючи наступне:(4)

(5)Y=Xβ+Z(δ+γ)+V.
(5)V& beta ; & beta ; р = δ + γ W = ( X , Z ) п ( до + 1 ) + л Х Z & beta ; ( 5 ) ( & beta ; Т , р Т ) Тβ^βρ=δ+γW=(X,Z)n(k+1)+lXZβ(5)
(β^T,ρ^T)T=(WTW)1WTY=(WTW)1WT(W(βT,ρT)T+V)=(βT,ρT)T+(WTW)1WTV

і таким чином де другий рядок випливає з . Таким чином, є умовно неупередженою оцінкою оскільки оцінка OLS, наведена для моделі coinicides з даною для моделі . Тепер за законом сумарного очікування і, таким чином, є неупередженим оцінником для .

E((β^T,ρ^T)T|W)=(βT,ρT)T+(WTW)1WsTE(V|W)=(βT,ρT)T+(WTW)1WT0=(βT,ρT)T,
() & beta ; & beta(1)(5) Е ( & beta ; )β^β(1)(5)
E(β^)=E(E(β^|W))=E(β)=β,
& beta ; & betaβ^β

(Можна зазначити, що , так що коефіцієнт на не обов'язково є неупередженим.)E(ρ^)=ρ=δ+γδZ

Однак, окремий випадок, викладений вище, передбачає, що та спільно нормально розподіляються, як я можу довести судження без цього припущення?UiZi

Якщо припустити, що завжди достатня, звичайно, (пор. ), але результат я повинен отримати лише з використанням та припущення про найменші квадрати, що виключає умовне середнє нульове припущення ( Дивись нижче).E(U|Z)=Zγ()(2)

ВІДПОВІДАЛО КОНСИСТЕНЦІЮ

Я думаю, можна також побачити, що оцінка відповідає , помічаючи, що в регресійній моделі всі припущення про найменші квадрати виконуються, включаючи припущення, що (новий) помилка терміна задовольняє Умовне середнє нульове припущення (пор. І див. Нижче).β^β(5)V()

Пізніше я можу додати доказ послідовності, який базується на ряді вправ « Вступ до економетрії», 3-е видання. Джеймс Х. Сток і Марк У. Уотсон, гл. 18. Однак цей доказ досить довгий. Але справа в тому, що доказ, наданий у вправах, передбачає , тому мені все ще цікаво, чи достатньо припущення .()(2)

ПІДПРИЄМСТВО 1

У Введення в економетрику 3 - е изд. Джеймс Х. Сток і Марк Уотсон, як сказано, на с. 300, що припущення можна "послабити", використовуючи теорію нелінійної регресії. Що вони означають або можуть означати це?()

НАЙКРАЩІ ПІДГОТОВКИ КВАРТІВ

Тут я виключаю умовне середнє нульове припущення, що оскільки пропозиція, яку ми намагаємося довести тут, дозволяє випадки, коли . Вони є , наприклад , випадки , коли корелює з . Ср. Економетрика: Засідання з перегляду іспиту з відзнакою (PDF) , с. 7.E(U|X,Z)=0E(U|X,Z)0ZU

Припущення про найменші квадрати - наступне.

  1. Спільні розподіли , є iid, де - елемент : th у а і - вектори : th рядів у і .(Yi,Xi,Zi)i=1,2,,n,YiiYXiZiiXZ

  2. Великі викиди малоймовірно, тобто для кожного , і мають кінцеві четверті моменти, де це : й елемент в .iXi,ZiUiUiiU

  3. (X,Z) має повний ранг стовпця (тобто немає ідеальної мультиколінеарності; це забезпечує оберненість ).WTW

  4. ( Припущення про найменші квадрати : Хоча я не думаю, що це є необхідним (і мені було сказано, що це не так), ми можемо також припустити гомоскедастичність, тобто для кожного , і що умовний розподіл заданого є нормальним для кожного (тобто у нас є нормальні помилки.))Var(Ui|Xi,Zi)=σU2iUi(Xi,Zi)i

ПРИМІТКА ПРО ТЕРМІНОЛОГІЮ

У умовне середнє нульове припущення - це припущення, що . Припущенням умовної середньої незалежності є припущення, що .(1)E(U|X,Z)=0E(U|X,Z)=E(U|Z)

Ця термінологія використовується, наприклад, у вступі до економетрії, 3-е видання. Джеймс Х. Сток і Марк У. Уотсон, с. 281; та Економетричний аналіз даних перерізів та панелей, 1-е видання. автор: Джеффрі М. Вулдрідж, с. 607. Див. Також Умовні обмеження незалежності: тестування та оцінка для подібних дискусій.

ДОДАТКОВІ МИСЛИ ТА ПІДПРИЄМСТВО 2

Я думаю, що всупереч Джеймсу Х. Стоку і Марку Уотсону, що умовна середня незалежність не забезпечує об'єктивну оцінку OLS . Це тому, що може приймати нелінійні форми, такі як де - поліном у , або де - якийсь параметр, який ще слід оцінити (тут я використовую матричну експоненцію ), і тоді, я думаю, треба застосувати нелінійну регресію , що, як правило, залишає нас з упередженими оцінками. Також оцінка OLS в (1) може навіть не збігатися з оцінкою OLSβE(U|Z)E(U|Z)=p(Z)p(Z)ZE(U|Z)=exp(Zγ)γββв якщо набуває певних нелінійних форм. (Психологічно я також вважаю, що твердження, зроблене в книзі Сток і Уотсон, занадто добре, щоб бути правдивим.)(4)E(U|Z)

Таким чином, додаткове питання полягає в тому, чи існує якийсь контрприклад твердження, що умовна середня незалежність призводить до неупередженої оцінки OLS?

ПІДПРИЄМСТВО 3

В основному нешкідлива Економетрика Angrist & пішком стверджує , в підрозділі 3.3, стор. 68--91, що за умови умовної незалежності (CI), тобто , незалежної від заданого (це, напевно, сильніша умова, ніж припущення умовної середньої незалежності, наведене вище), існує тісний зв'язок між відповідними оцінками вплив на і коефіцієнти на в регресії на і що мотивує, що за CI оцінка OLS коефіцієнта на вYXWXYXYXWX(1) менш упереджене, ніж якщо CI не дотримується (всі інші рівні).

Тепер чи можна цю ідею якось використати для відповіді на моє головне питання тут?


@ Xi'an Що ти маєш на увазі? Це визначення умовної середньої незалежності, подане в моєму підручнику: Якщо ми в лінійній регресії маємо , то ми говоримо, що у нас умовна середня незалежність. Я просто думав, що мій спосіб його написання був більш загальним. Yi=β0+β1Xi+β2Zi+uiE(ui|Xi,Zi)=E(ui|Zi)
Ілля

@ Xi'an Як би ви визначили "умовне незалежне $ ce" в цьому випадку? Як я вважаю, «умовна незалежність» - це поняття, відмінне від «умовно-середньої незалежності». Вони можуть бути або не бути концептуально пов'язаними.
Ілля

@ Xi'an Ось як я розумію поняття: Умовна незалежність - це просто , але умовна середня незалежність - . P(AB|C)=P(A|C)P(B|C)E(A|B,C)=E(A|C)
Ілля

Де коментар Сіань?
Майкл Р. Черник

@MichaelChernick Його коментар був першим. Я думаю, він, мабуть, видалив його. Як я його пам’ятаю, він сказав, що не передбачає умовної незалежності, і я відповів. E(U|X,Z)=E(U|Z)
Ілля

Відповіді:


4

Це помилково. Як ви зауважуєте, якщо ви уважно читаєте Stock та Watson, вони насправді не схвалюють твердження, що OLS є неупередженим до при умовно-середній незалежності. Вони схвалюють набагато слабше твердження, що OLS є неупередженим до якщо . Потім вони говорять про щось неясне про нелінійні найменші квадрати.ββE(u|x,z)=zγ

Ваше рівняння (4) містить те, що вам потрібно, щоб побачити, що твердження є помилковим. Оцінка рівняння (4) за OLS при пропущенні змінної призводить до зміщення зміщених опущених змінних. Як ви, напевно, пам’ятаєте, термін зміщення від опущених змінних (коли упущена змінна має коефіцієнт 1) контролюється коефіцієнтами з наступної допоміжної регресії: Зсув початкової регресії для становить від цієї регресії, а зміщення на - . Якщо корелює з , після лінійного керування дляE(u|x,z)

E(u|z)=xα1+zα2+ν
βα1γα2xE(u|z)z , тоді буде не нульовим, а коефіцієнт OLS буде зміщений.α1

Ось приклад для доказу пункту:

ξF(),ζG(),νH()all independentz=ξx=z2+ζu=z+z2E(z+z2)+ν

Поглянувши на формулу для , зрозуміло, що Дивлячись на допоміжну регресію, зрозуміло що (відсутній якийсь випадковий вибір ) не буде нульовим.uE(u|x,z)=E(u|z)=z+z2E(z+z2)F,G,Hα1

Ось дуже простий приклад, в Rякому демонструється точка:

set.seed(12344321)
z <- runif(n=100000,min=0,max=10)
x <- z^2 + runif(n=100000,min=0,max=20)
u <- z + z^2 - mean(z+z^2) + rnorm(n=100000,mean=0,sd=20)
y <- x + z + u

summary(lm(y~x+z))

# auxiliary regression
summary(lm(z+z^2~x+z))

Зауважте, що перша регресія дає вам коефіцієнт на який зміщений на 0,63, відображаючи той факт, що "має деякий в ньому", як і . Зауважте також, що допоміжна регресія дає оцінку зміщення приблизно 0,63.xxz2E(u|z)

Отже, про що говорять Сток і Уотсон (і ваш лектор)? Повернемось до вашого рівняння (4):

y=xβ+zγ+E(u|z)+v

Важливий факт, що опущена змінна є лише функцією . Здається, якби ми могли контролювати дійсно добре, цього було б достатньо, щоб очистити зміщення від регресії, навіть якщо може бути співвіднесено з .zzxu

Припустимо, ми оцінили рівняння нижче, використовуючи або непараметричний метод для оцінки функції або використовуючи правильну функціональну форму . Якби ми використовували правильну функціональну форму, ми б оцінили її за нелінійними найменшими квадратами (пояснюючи критичний коментар про NLS): Це дасть нам послідовний оцінювач для оскільки більше немає проблеми, що опускається. f()f(z)=zγ+E(u|z)

y=xβ+f(z)+v
β

Крім того, якби у нас було достатньо даних, ми могли б пройти `` весь шлях '' в контролі для . Ми можемо подивитися на підмножину даних, де , і просто запустити регресію: Це дало б неупереджені, послідовні оцінювачі для за винятком перехоплення, звичайно, яке було б забруднене . Очевидно, ви також можете отримати (інший) послідовний, неупереджений оцінювач, виконавши цю регресію лише в точках даних, для яких . І ще один для точок, де . І т. Д. Тоді у вас буде маса хороших оцінювачів, з яких ви могли б зробити чудового оцінювача, скажімо, якось усереднюючи їх усе разом.zz=1

y=xβ+v
βf(1)z=2z=3

Ця остання думка є натхненням для відповідних оцінювачів. Оскільки у нас зазвичай не вистачає даних, щоб буквально запустити регресію лише для або навіть для пар точок, де тотожно, ми замість цього запустимо регресію для точок, де достатньо близько до тотожності.z=1zz


3

Ви не можете довести цей результат, оскільки він не відповідає дійсності в загальній заяві. Почніть з моделі у вашому еквіваленті. (4)

Y=Xβ+Zδ+(E(U|Z)+V)

де великі дужки позначають фактичний термін помилки (поки немає припущень щодо умовного очікування). Визначте матрицю залишкового виробника чи , яка симетрична, , і ми також маємо . MZ=IZ(ZZ)1ZMZZ=0

За результатами «розділеної регресії» ми маємо це

β^OLSβ=(XMZX)1XMZZδ+(XMZX)1XMZE(UZ)+(XMZX)1XMZV

Перший термін праворуч вже дорівнює нулю. Приймаючи очікувану величину протягом усього, а потім застосовуючи властивість вежі для умовного очікування, третій додаток також буде нульовим (використовуючи умовну середню незалежність у його слабшій формі). Але це настільки, що це слабке припущення бере нас, тому що ми залишимося

E(β^OLS)β=E[(XMZX)1XMZE(UZ)]

Для неупередженості ми хочемо, щоб права сторона була нульовою. Це буде справедливо, якщо є лінійною функцією (як ви знайшли також), оскільки ми знову отримаємо нульовий . Але в іншому випадку абсолютно довільно прямо вважати, що все очікуване значення дорівнює нулю. Ми не повинні приймати спільну нормотивність, але ми маємо припускати лінійність цього умовного очікування (інші властивості також мають цю властивість). Отже, необхідне припущення про неупередженість єE(UZ)ZMZZ
β

E(UX,Z)=E(UZ)=Zγ

і я не можу сказати, чи вона насправді "слабша" чи ні, порівняно із суворою екзогенністю всіх регресорів (оскільки сувора екзогенність заявляється з точки зору середньої незалежності для всіх припущень розподілу, тоді як тут ми повинні обмежувати класи розподілів, що та слідувати).UZ

Не важко показати, що за цим припущенням також буде узгодженим.β^OLS


Гарна відповідь! Я читав це давно і думав, що подумаю про це пізніше. У мене є кілька запитань: як можна довести результати розподілу регресії? Я хотів би оцінити хоча б посилання. Крім того, яка різниця між та ? M zMZMz
Ілля

1
@Monir і просто помилка друку . Для розділених результатів регресії (які є дуже старими та стандартними) див., Наприклад, підручник «Економетрика» Гріна, в главі, де він обговорює алгебраїчний аспект звичайних оцінок найменших квадратів. Він включає доказ. zZz
Алекос Пападопулос
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.