Як вивести дисперсійно-коваріантну матрицю коефіцієнтів у лінійній регресії


36

Я читаю книгу про лінійну регресію і маю деякі проблеми з розумінням дисперсійно-коваріаційної матриці :b

введіть тут опис зображення

Діагональні елементи досить прості, але поза діагоналі трохи складніше, що мене що

σ(b0,b1)=E(b0b1)E(b0)E(b1)=E(b0b1)β0β1

але тут немає і сліду та .β0β1


3
Питання, пов’язані з цим: stats.stackexchange.com/questions/44838/…
ocram

2
Яка книга?
Константинос

Neter et al., Прикладні лінійні регресійні моделі, 1983, стор. 216. Цей самий матеріал можна знайти в Applied Linear статистичних моделей, 5-е видання, сторінка 207.
akavalar

Відповіді:


53

Це насправді класне питання, яке ставить під сумнів ваше основне розуміння регресії.

Спочатку вийміть будь-яку початкову плутанину щодо позначень. Ми дивимось на регрес:

y=b0+b1x+u^

де і є істинних та , а - залишки регресії. Зауважимо, що реальна регресія, що лежить в основі, позначається як:b0b1β0β1Uu^

y=β0+β1x+u

З очікуванням і дисперсії . Деякі книги позначають як і ми адаптуємо цю умову тут. Ми також використовуємо матричне позначення, де b - 2х1 вектор, який містить оцінювачі , а саме . (Також для наочності я ставлюсь до Х як визначено в наступних розрахунках.)E[u]=0E[u2]=σ2b& beta ; & beta ; = [ & beta ; 0 , & beta ; 1 ] ' Ь = [ Ь 0 , Ь 1 ] 'β^β=[β0,β1]b=[b0,b1]

Тепер до вашого питання. Ваша формула коваріації справді правильна, тобто:

σ(b0,b1)=E(b0b1)E(b0)E(b1)=E(b0b1)β0β1

Я думаю, ви хочете знати, як у цій формулі є справжні коефіцієнти ? Вони насправді скасовуються, якщо ми зробимо це на крок далі, розширивши формулу. Для цього зауважте, що дисперсія популяції оцінювача задається:β0,β1

Var(β^)=σ2(XX)1

Ця матриця містить варіації діагональних елементів та коваріацій у позадіагональних елементах.

Щоб прийти до вищенаведеної формули, давайте узагальнимо вашу заяву, використовуючи матричну нотацію. Отже, позначимо дисперсію з а очікування - з .Var[]E[]

Var[b]=E[b2]E[b]E[b]

По суті, ми маємо загальну формулу дисперсії, просто використовуючи матричне позначення. Рівняння розв’язується при заміні в стандартному виразі для оцінювача . Також припустимо, що є неупередженим оцінювачем. Отже, ми отримуємо:b=(XX)1XyE[b]=β

E[((XX)1Xy)2]β22×2

Зауважимо, що у нас з правого боку - 2x2 матриця, а саме , але ви, можливо, вже вгадаєте, що буде з цим терміном незабаром.β2bb

Замінивши нашим виразом на справжній базовий процес генерування даних вище, ми маємо:y

E[((XX)1Xy)2]β2=E[((XX)1X(Xβ+u))2]β2=E[((XX)1XX=Iβ+(XX)1Xu)2]β2=E[(β+(XX)1Xu)2]β2=β2+E[(XX)1Xu)2]β2

оскільки . Крім того, квадратичний термін скасовується як очікувалося.E[u]=0β2

Таким чином, ми маємо:

Var[b]=((XX)1X)2E[u2]

За лінійністю очікувань. Зауважимо, що за припущенням і оскільки є симетричною матрицею і, таким чином, є її транспозицією. Нарешті ми доходимоE[u2]=σ2((XX)1X)2=(XX)1XX(XX)1=(XX)1XXK×K

Var[b]=σ2(XX)1

Тепер, коли ми позбулися всіх термінів. Інтуїтивно, дисперсія оцінювача не залежить від значення справжнього базового коефіцієнта, оскільки це не є випадковою змінною. Результат справедливий для всіх окремих елементів в матриці коваріації дисперсії, як показано в книзі, таким чином, також дійсний і для вимкнених діагональних елементів, а також для для скасування відповідно. Єдина проблема полягала в тому, що ви застосували загальну формулу для дисперсії, яка спочатку не відображає це скасування.ββ0β1

Зрештою, дисперсія коефіцієнтів зводиться до і не залежить від . Але що це означає? (Я вважаю, ви також попросили більш загальне розуміння загальної матриці коваріації)σ2(XX)1β

Подивіться на формулу в книзі. Він просто стверджує, що дисперсія обчислювача збільшується, коли справжній базовий помилка є більш галасливим ( збільшується), але зменшується, коли розширення X збільшується. Оскільки наявність спостережень, розподілених навколо справжнього значення, дозволяє вам, як правило, побудувати точніший і таким чином наближений до істинної . З іншого боку, умови коваріації на позадіагоналі стають практично актуальними при тестуванні гіпотез спільних гіпотез, таких як . За винятком того, що вони трохи підступні, насправді. Сподіваюсь, це пояснює всі питання.σ2 β b 0 = b 1 = 0βb0=b1=0


а коли тримати постійний розкид та зменшувати х, стандартна помилка перехоплення стає меншою, що має сенс.
Theta30

Я не стежу за розширенням площі. Чому не спрощено до ? ((XX)1X)2=((XX)1X)((XX)1X)=X2
Девід

2

У вашому випадку ми маємо

XX=[nXiXiXi2]

Інвертуйте цю матрицю, і ви отримаєте бажаний результат.


1

Здається, що - це прогнозовані значення (очікувані значення). Вони роблять перемикання між і . E ( b 0 ) = β 0 E ( b 1 ) = β 1β0β1E(b0)=β0E(b1)=β1


β 1β0 та взагалі невідомі, до чого вони можуть перейти? β1
qed

Я думаю, що я розумію плутанину, і я думаю, що вони, можливо, повинні були написати а не . Ось ще одна публікація, яка проходить через розрахунок: посилання β 0β0β0
Drew75

2
@qed: вибіркові оцінки невідомих величин.
Glen_b -Встановіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.