Інтервал довіри для різниці засобів у регресії


10

Припустимо, у мене є квадратична модель регресії з помилками задовольняють звичайним припущенням (незалежним, нормальним, незалежним від значень ). Нехай - найменші оцінки квадратів.

Y=β0+β1X+β2X2+ϵ
ϵXb0,b1,b2

У мене є два нових значення та , і мені цікаво отримати інтервал довіри для .Xx1x2v=E(Y|X=x2)E(Y|X=x1)=β1(x2x1)+β2(x22x12)

Оцінка балів - , і (виправте мене, якщо я помиляюся) я можу оцінити дисперсію за використанням оцінок дисперсії та коваріації коефіцієнтів, що надаються програмним забезпеченням.v^=b1(x2x1)+b2(x22x12)

s^2=(x2x1)2Var(b1)+(x22x12)2Var(b2)+2(x2x1)(x2x12)Cov(b1,b2)

Я міг би використати нормальне наближення і взяти як 95% довірчий інтервал для , або я міг би використовувати інтервал довіри завантажувальної версії, але чи є спосіб розробити точний розподіл і використовувати це?v^±1.96s^v


2
Оскільки помилки вважаються нормальними, то параметри оцінки - це лінійні функції даних, звідки й помилки - самі повинні бути нормальними, що передбачає нормальний розподіл для . v^
whuber

Так ви кажете, що нормальний інтервал довіри правильний? Якщо я правильно розумію, за цією логікою ми також використовували б нормальні довірчі інтервали для параметрів. Але ми використовуємо інтервали на основі розподілу t.
марка999

Розподіл t використовується тому, що ви оцінюєте відхилення помилок; якби це було відомо, у вас був би нормальний розподіл, як говорить @whuber.
JMS

Дякуємо за ваш коментар Що я запитую, чи може також розподіл t використовуватися для довірчого інтервалу для v, визначеного у питанні, і якщо так, то на скільки ступенів свободи?
марка999

Варіанти дисперсій та коваріацій залежать в кінцевому рахунку від розрахункової дисперсії залишків. Таким чином, DF, який використовується, є DF у цій оцінці, рівній кількості значень даних мінус кількості параметрів (включаючи постійну).
whuber

Відповіді:


9

Загальний результат ви шукаєте (при зроблених припущеннях) виглядає наступним чином : Для лінійної регресії з предикторами ( у вас є два, і ) і перехоплення, то з спостереженнями, матриця плану , мірної оцінки іpXX2nXn×(p+1)β^p+1aRp+1

aTβ^aTβσ^aT(XTX)1atnp1.

Наслідком цього є те, що ви можете побудувати довірчі інтервали для будь-якої лінійної комбінації вектора, використовуючи той самий -розподіл, який ви використовуєте для побудови довірчого інтервалу для однієї з координат.βt

У вашому випадку і . Знаменник у наведеній вище формулі - це квадратний корінь того, що ви обчислюєте як оцінку стандартної помилки (за умови, що саме це обчислює програмне забезпечення ...). Зауважте, що оцінювач дисперсії повинен бути (звичайним) неупередженим оцінювачем, де ви поділяєте на ступеня свободи , а не кількість спостережень .p=2aT=(0,x2x1,x22x12)σ^2np1n


1
Дякую, це саме та річ, яку я шукав. Але чи є помилка у формулі? Розміри, схоже, не збігаються в . Чи повинен бути матрицею має в першому стовпці? aT(XTX)1aXn×(p+1)
марка999

@ mark999, так, містить стовпців. Я це виправив у відповіді. Дякую. Xp+1
NRH
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.