Чому для гіпотези використовується тестування коефіцієнта лінійної регресії для розподілу Т?


17

На практиці звичайне використання стандартного Т-тесту для перевірки значущості коефіцієнта лінійної регресії. Механіка розрахунку має для мене сенс.

Чому так, що розподіл Т можна використовувати для моделювання стандартної статистики тесту, яка використовується при тестуванні гіпотез лінійної регресії? Стандартна тестова статистика, про яку я маю на увазі тут:

T0=β^β0SE(β^)

Повна і повна відповідь на це питання буде досить довгою, я впевнений. Тож поки ви чекаєте, коли хтось вирішить це, ви можете отримати досить гарне уявлення про те, чому це так, переглянувши деякі замітки, які я знайшов тут в Інтернеті: onlinecourses.science.psu.edu/stat501/node/297 . Зазначимо конкретно, що . t(np)2=F(1,np)
СтатистикаСтудент

1
Я не можу повірити, що це не дублікат, і все-таки всі відгуки (і на запитання, і на відповіді) ... А що з цим ? Або, можливо, це не дублікат, а це означає, що існують (або існували до сьогодні) над основні теми, які не висвітлювалися протягом майже семи років існування перехресної перевірки ... Нічого ...
Річард Харді

@RichardHardy Хм, це звучить як дублікат. Хоча це більш багатослівним, питання в тому , а саме: «Як я можу довести , що для β я , β я - β яβ^i"β^iβisβ^itnk
Палій

Відповіді:


26

Щоб зрозуміти , чому ми використовуємо розподіл Стьюдента, ви повинні знати , що лежить в основі розподілу р і залишкової суми квадратів ( R S S ) , оскільки ці два разом узяті дасть вам розподіл Стьюдента.β^RSS

Легше частина є розподіл р , яке є нормальним розподілом - бачити це примітка , що β = ( Х Т Х ) - 1 х Т У , так що лінійна функція Y , де Y ~ N ( X β , σ 2 I н ) . В результаті він також розподілений нормально, β ~ N ( р , σ 2 ( Х Т Х ) -β^β^(XTX)1XTYYYN(Xβ,σ2In)- дайте мені знатиякщо вам потрібна допомога виведення розподілу р .β^N(β,σ2(XTX)1)β^

Крім того, , де n - кількість спостережень, а p - кількість параметрів, використаних у вашій регресії. Докази цього є дещо більше, але також просто вивести (див. Доказ тут. Чому RSS розподіляється чі квадратними разів np? ).RSSσ2χnp2np

До цього моменту я не розглянув всі в матрицю / вектор позначення, але давайте для простоти використання β I і використовувати його нормальний розподіл , яке дасть нам: β я - β яβ^i

β^iβiσ(XTX)ii1N(0,1)

Крім того, з розподілу чи-квадрата маємо, що: ( n - p ) s 2RSS

(np)s2σ2χnp2

Це було просто перестановкою першого виразу chi-квадрата і не залежить від . Додатково визначимо s 2 = R S SN(0,1) , що є неупередженим оцінкою дляσ2. За визначеннямtn-pвизначення, що ділення нормального розподілу на незалежне чи-квадрат (над його ступенями свободи) дає t-розподіл (для доказу див.:Норма, розділене наs2=RSSnpσ2tnp дає t-розподіл - доказχ2(s)/s), ви отримуєте це:

β^iβis(XTX)ii1tnp

Де .s(XTX)ii1=SE(β^i)

Повідомте мене, чи має це сенс.


яка чудова відповідь! НЕ могли б ви пояснити , чому β я - β я?
β^iβiσ(XTX)ii1N(0,1)
KingDingeling

4

Відповідь насправді дуже проста: ви використовуєте t-розподіл, оскільки він був майже розроблений спеціально для цієї мети.

x1,x2,,xnx¯=i=1nxi/nx¯

σξ=(x¯μ)n/σN(0,1). The trouble's that you usually do not know σ, and can only estimate it σ^. So, Gosset figured out the distribution when you substitute σ with σ^ in the denominator, and the distribution is now called after his pseduonym "Student t".

The technicalities of linear regression lead to a situation where we can estimate the standard error σ^β of the coefficient estimate β^, but we do not know the true σ, therefore Student t distribution is applied here too.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.