Як перевірити, чи нахили в лінійній моделі рівні фіксованому значенню?


9

Припустимо, у нас проста модель лінійної регресії Z=aX+bY і хотів би перевірити нульову гіпотезу H0:a=b=12 проти загальної альтернативи.

Я думаю, що можна використовувати оцінку a^ і SE(a^) і далі застосувати a Z-тестуйте, щоб отримати інтервал довіри навколо 12. Чи це добре?

Інше питання сильно пов'язане з цим. Припустимо, у нас є зразок{(x1,y1,z1),,(xn,yn,zn)} і ми обчислюємо χ2 статистика

i=1n(zixi+yi2)2xi+yi2.
Чи можна використовувати цю статистику для перевірки тієї ж нульової гіпотези?

Відповіді:


8

При лінійній регресії припущення таке Х і Yне є випадковими змінними. Тому модель

Z=аХ+бY+ϵ

алгебраїчно те саме, що

Z-12Х-12Y=(а-12)Х+(б-12)Y+ϵ=αХ+βY+ϵ.

Ось α=а-12 і β=б-12. Термін помилкиϵне впливає. Підходять до цієї моделі, оцінюючи коефіцієнти якα^ і β^відповідно, і перевірити гіпотезу α=β=0 звичайним способом.


Статистика, написана в кінці запитання, не є чі-квадратною статистикою, незважаючи на її формальну подібність до такої. Статистика хі-квадратів включає в себе підрахунки , а не значення даних, і повинна мати очікувані значення у своєму знаменнику, а не коваріати. Це можливо для одного або декількох знаменниківхi+уi2бути нульовим (або близьким до нього), що показує, що щось серйозно не так з цією формулюванням. Якщо навіть це не є переконливим, вважайте, що одиниці вимірюванняZ, Х, і Y може бути будь-що (наприклад, драми, парсекс та пеки), так що лінійна комбінація, як zi-(хi+уi)/2є (загалом) безглуздим. Це нічого не перевіряє.


1
Дякую за вашу відповідь. Це було дуже корисно. Насправді я не був дуже точним у формулюванні другої частини питання. Уявіть, що xs і ys - додатні числа, виміряні в одних і тих же одиницях. Zs (спостережуваний результат) якимось чином вимірює "взаємодію" в тому сенсі, що якщо немає взаємодії, zs має бути (x + y) / 2 (очікуваний результат). Отже, з моєї точки зору, було те саме використовувати регресію з нульовою гіпотезою a = b = 1/2 або порівнювати корисність за допомогою статистики Пірсона chi ^ 2. Це має сенс? Дякую!
Лан

1
@Lan Я думаю, що відповідь Вольфганга чудово ілюструє те, як зробити тест, який ви пропонуєте. Це приклад того, що означало тестування гіпотези «звичайним чином».
whuber

9

Ви можете перевірити цю гіпотезу за допомогою повного порівняно зі зменшеним тестом на моделі. Ось як ви це робите. Спочатку підійде модельZ=аХ+бYі отримати залишки від цієї моделі. Закресліть залишки та підсумуйте їх. Це сума квадратної помилки для повної моделі. Давайте назвемо цеSSЕf. Далі, обчислітьZ-Z^ де Z^=1/2Х+1/2Y. Це ваші залишки під нульовою гіпотезою. Розкладіть їх і підсумуйте. Це сума квадратної помилки для зменшеної моделі. Давайте назвемо цеSSЕr.

Тепер обчисліть:

F = ((SSЕr-SSЕf)/2)/(SSЕf/(н-2)),

де н- розмір вибірки. ПідН0, ця F-статистика слідує за F-розподілом з 2 і н-2 ступенів свободи.

Ось приклад використання R:

x <- rnorm(n)
y <- rnorm(n)
z <- 1/2*x + 1/2*y + rnorm(n) ### note I am simulating under H0 here

res <- lm(z ~ x + y - 1)
summary(res)
SSE.f <- sum(resid(res)^2)

zhat  <- 1/2*x + 1/2*y
SSE.r <- sum((z-zhat)^2)

F <- ((SSE.r - SSE.f) / 2) / (SSE.f / (n-2))
pf(F, 2, n-2, lower.tail=FALSE) ### this is the p-value

Відхиліть нуль, якщо значення p нижче .05 (якщо ваше α справді .05).

Я припускаю, що ви дійсно мали на увазі, щоб ваша модель не містила перехоплення. Іншими словами, я припускаю, що ви справді працюєте з моделлюZ=аХ+бY і ні Z=c+аХ+бY.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.