Це питання не стосується конкретно R
, але я вирішив використовувати його R
для ілюстрації.
Розглянемо код для створення довірчих смуг навколо (нормальної) qq-лінії:
library(car)
library(MASS)
b0<-lm(deaths~.,data=road)
qqPlot(b0$resid,pch=16,line="robust")
Я шукаю пояснення (або альтернативне посилання на паперовий / онлайн-документ, що пояснює), як будуються ці групи довіри (я бачив посилання на Fox 2002 у довідкових файлах R, але, на жаль, у мене немає цього книга зручна).
Моє запитання буде зроблено більш точним на прикладі. Ось як R
обчислюються ці конкретні ІС (я скоротив / спростив код, який використовується в car::qqPlot
)
x<-b0$resid
good<-!is.na(x)
ord<-order(x[good])
ord.x<-x[good][ord]
n<-length(ord.x)
P<-ppoints(n)
z<-qnorm(P)
plot(z,ord.x,type="n")
coef<-coef(rlm(ord.x~z))
a<-coef[1]
b<-coef[2]
abline(a,b,col="red",lwd=2)
conf<-0.95
zz<-qnorm(1-(1-conf)/2)
SE<-(b/dnorm(z))*sqrt(P*(1-P)/n) #[WHY?]
fit.value<-a+b*z
upper<-fit.value+zz*SE
lower<-fit.value-zz*SE
lines(z,upper,lty=2,lwd=2,col="red")
lines(z,lower,lty=2,lwd=2,col="red")
Питання в тому, яке обґрунтування формули, яка використовується для обчислення цих SE (наприклад, рядок SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)
).
FWIW ця формула сильно відрізняється від формули звичайних довірчих смуг, що використовуються в лінійній регресії