Я намагаюся зрозуміти походження вигнутої форми довірчих смуг, пов'язаних з лінійною регресією OLS, і як це стосується довірчих інтервалів параметрів регресії (нахилу та перехоплення), наприклад (за допомогою R):
require(visreg)
fit <- lm(Ozone ~ Solar.R,data=airquality)
visreg(fit)
Виявляється, смуга пов'язана з межами ліній, обчислених з перехопленням 2,5% та нахилом 97,5%, а також з перехопленням 97,5% та нахилом 2,5% (хоча і не зовсім):
xnew <- seq(0,400)
int <- confint(fit)
lines(xnew, (int[1,2]+int[2,1]*xnew))
lines(xnew, (int[1,1]+int[2,2]*xnew))
Я не розумію, це дві речі:
- Що з комбінацією 2,5% нахилу та 2,5% перехоплення, а також 97,5% нахилу та 97,5% перехоплення? Вони дають лінії, які чітко знаходяться поза смугою, накресленою вище. Можливо, я не розумію значення інтервалу довіри, але якщо в 95% випадків мої оцінки знаходяться в довірчому інтервалі, це здається можливим результатом?
- Що визначає мінімальну відстань між верхньою та нижньою межею (тобто близькою до точки, де перехрещуються два рядки, додані вище)?
Я думаю, що обидва питання виникають, тому що я не знаю / не розумію, як насправді обчислюються ці смуги.
Як я можу обчислити верхню та нижню межі, використовуючи довірчі інтервали параметрів регресії (не покладаючись на прогноз () або подібну функцію, тобто вручну)? Я намагався розшифрувати функцію predict.lm в R, але кодування поза мною. Буду вдячний за будь-які вказівки щодо відповідної літератури чи пояснень, підходящих для початківців статистики.
Спасибі.