Ви можете перевірити цю гіпотезу за допомогою повного порівняно зі зменшеним тестом на моделі. Ось як ви це робите. Спочатку підійде модельZ= a X+ b Yі отримати залишки від цієї моделі. Закресліть залишки та підсумуйте їх. Це сума квадратної помилки для повної моделі. Давайте назвемо цеSSЕf. Далі, обчислітьZ-Z^ де Z^= 1 / 2 * Х+ 1 / 2 * Y. Це ваші залишки під нульовою гіпотезою. Розкладіть їх і підсумуйте. Це сума квадратної помилки для зменшеної моделі. Давайте назвемо цеSSЕr.
Тепер обчисліть:
F = ( ( SSЕr- SSЕf) / 2 ) / ( SSЕf/ (п-2)),
де н- розмір вибірки. ПідН0, ця F-статистика слідує за F-розподілом з 2 і n - 2 ступенів свободи.
Ось приклад використання R:
x <- rnorm(n)
y <- rnorm(n)
z <- 1/2*x + 1/2*y + rnorm(n) ### note I am simulating under H0 here
res <- lm(z ~ x + y - 1)
summary(res)
SSE.f <- sum(resid(res)^2)
zhat <- 1/2*x + 1/2*y
SSE.r <- sum((z-zhat)^2)
F <- ((SSE.r - SSE.f) / 2) / (SSE.f / (n-2))
pf(F, 2, n-2, lower.tail=FALSE) ### this is the p-value
Відхиліть нуль, якщо значення p нижче .05 (якщо ваше α справді .05).
Я припускаю, що ви дійсно мали на увазі, щоб ваша модель не містила перехоплення. Іншими словами, я припускаю, що ви справді працюєте з моделлюZ= a X+ b Y і ні Z= c + a X+ b Y.