@jbowman пропонує (приємне) стандартне рішення проблеми оцінки яка відома як модель напруженості .θ = P( X< Y)
Інша непараметрична альтернатива була запропонована в Baklizi and Eidous (2006) для випадку, коли і незалежні. Це описано нижче.YХY
За визначенням ми маємо це
θ = P( X< Y) = ∫∞- ∞ЖХ( у) fY( у) dу,
де є ВПР з і щільність . Потім, використовуючи зразки і можна отримати ядра оцінювачів з і і , отже і оцінку X f Y Y X YЖХХfYYХYf Y θЖХfYθ
θ^=∫∞−∞F^X(y)f^Y(y)dy.
Це реалізовано в наступному коді R за допомогою ядра Гаусса.
# Optimal bandwidth
h = function(x){
n = length(x)
return((4*sqrt(var(x))^5/(3*n))^(1/5))
}
# Kernel estimators of the density and the distribution
kg = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(dnorm((x[i]-data)/hb))/hb
return(r )
}
KG = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(pnorm((x[i]-data)/hb))
return(r )
}
# Baklizi and Eidous (2006) estimator
nonpest = function(dat1B,dat2B){
return( as.numeric(integrate(function(x) KG(x,dat1B)*kg(x,dat2B),-Inf,Inf)$value))
}
# Example when X and Y are Cauchy
datx = rcauchy(100,0,1)
daty = rcauchy(100,0,1)
nonpest(datx,daty)
Для того, щоб отримати довірчий інтервал для ви можете отримати зразок завантаження цього оцінника наступним чином.θ
# bootstrap
B=1000
p = rep(0,B)
for(j in 1:B){
dat1 = sample(datx,length(datx),replace=T)
dat2 = sample(daty,length(daty),replace=T)
p[j] = nonpest(dat1,dat2)
}
# histogram of the bootstrap sample
hist(p)
# A confidence interval (quantile type)
c(quantile(p,0.025),quantile(p,0.975))
Можливо також розглянути інші види інтервалів завантаження.