Інтервал довіри для вибірки Бернуллі

У мене є випадкова вибірка випадкових змінних Бернуллі , де - iidrv і , а - невідомий параметр. $X_1 ... X_N$ $X_i$ $P(X_i = 1) = p$ $p$

Очевидно, що можна знайти оцінку для : . $p$ $\hat{p}:=(X_1+\dots+X_N)/N$

Моє запитання: як я можу побудувати довірчий інтервал для ? $p$

confidence-interval binomial bernoulli-distribution

— Амеба каже Відновити Моніку
джерело

У вікіпедії є детальна інформація про те, як обчислити довірчі інтервали для відбору проб Бернуллі .

Відповіді:

Якщо в , не близько або , і розмір вибірки досить велике (тобто і , довірчий інтервал може бути оцінений з допомогою нормального розподілу і інтервал довіри, побудований таким чином: $\hat{p}$ $1$ $0$ $n$ $n\hat{p}>5$ $n(1-\hat{p})>5$

$\hat{p} \pm z_{1 - α / 2} \sqrt{\frac{\hat{p} (1 - \hat{p})}{n}}$ $\hat{p}\pm z_{1-\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$
$\hat{p} = 0$ $n>30$ $95\%$ $[0,\frac{3}{n}]$ $\hat{p}=1$ $n+1$ $n+b$
$n$ $\hat{p}$

R забезпечує функції , binconf {Hmisc}і binom.confint {binom}які можуть бути використані в такий спосіб:

set.seed(0)
p <- runif(1,0,1)
X <- sample(c(0,1), size = 100, replace = TRUE, prob = c(1-p, p))
library(Hmisc)
binconf(sum(X), length(X), alpha = 0.05, method = 'all')
library(binom)
binom.confint(sum(X), length(X), conf.level = 0.95, method = 'all')

Агресті, Алан; Coull, Brent A. (1998). "Орієнтовний краще, ніж" точний "для інтервальної оцінки біноміальних пропорцій". Американський статистик 52: 119–126.

Йованович, Б.Д. і П.С. Леві, 1997. Погляд на правило трьох. Американський статистик Vol. 51, № 2, стор 137-139

Росс, ТД (2003). "Точні довірчі інтервали для біноміальної пропорції та оцінки швидкості Пуассона". Комп'ютери в біології та медицині 33: 509–531.

— Девід Лебоуер
джерело

(+1) Приємна відповідь. Я думаю, це стане орієнтиром для подібних питань у майбутньому. Однак перехресне повідомлення незвичне; насправді я вважаю, що це нахмурилося, тому що воно накручує багато аспектів системи зворотного зв'язку / посилань / нарізки / коментування. Подумайте про те, як видалити одну з копій та замінити її посиланням у коментарі.

— whuber

@whuber дякую за відгук. Інший примірник я видалив.

— Девід Лебоуер

У першій формулі, що таке z1 та альфа?

— Cirdec

z_{1 - α / 2}

$z_{1-\alpha/2}$

1 - α / 2

${1-\alpha/2}$

α

$\alpha$

3 / n

$3/n$

Максимальні вірогідні вірогідні інтервали

$p$

$\hat{\beta}_0 = \log(\hat{p}/(1-\hat{p}))$

$\alpha$ $\beta_0$

CI (β_{0})_{α} = {\hat{β}}_{0} \pm Z_{α / 2} \sqrt{1 / (n \hat{p} (1 - \hat{p})}

$\text{CI}(\beta_0)_\alpha = \hat{\beta}_0 \pm \mathcal{Z}_{\alpha/2} \sqrt{1/(n\hat{p}(1-\hat{p})}$

$p$

CI (p)_{α} = 1 / (1 + \exp (- CI (β_{0})_{α})

$\text{CI}(p)_\alpha = 1/(1+\exp(-\text{CI}(\beta_0)_\alpha)$

Ця CI має додаткову перевагу в тому, що пропорції лежать в інтервалі між 0 або 1, а ІС завжди вужчий, ніж нормальний інтервал, будучи правильним рівнем. Це можна легко отримати в R, вказавши:

set.seed(123)
y <- rbinom(100, 1, 0.35)
plogis(confint(glm(y ~ 1, family=binomial)))

    2.5 %    97.5 % 
0.2795322 0.4670450

Точні біноміальні довірчі інтервали

$Y = n\hat{p}$ $(n,p)$ $\hat{p}$

{CI}_{α} = (F_{\hat{p}}^{- 1} (0.025), F_{\hat{p}}^{- 1} (0.975))

$\text{CI}_\alpha = (F^{-1}_{\hat{p}}(0.025), F^{-1}_{\hat{p}}(0.975))$

$p$

qbinom(p = c(0.025, 0.975), size = length(y), prob = mean(y))/length(y)
[1] 0.28 0.47

Середні неупереджені довірчі інтервали

$p$ $p_{1-\alpha/2}$

p_{1 - α / 2} : P (Y = 0) / 2 + P (Y > y) > 0.975

$p_{1-\alpha/2} : P(Y = 0)/2 + P(Y > y) > 0.975$

Це також обчислювальний звичай.

set.seed(12345)
y <- rbinom(100, 1, 0.01) ## all 0
cil <- 0
mupfun <- function(p) {
  0.5*dbinom(0, 100, p) + 
    pbinom(1, 100, p, lower.tail = F) - 
    0.975
} ## for y=0 successes out of n=100 trials
ciu <- uniroot(mupfun, c(0, 1))$root
c(cil, ciu)

[1] 0.00000000 0.05357998 ## includes the 0.01 actual probability

Останні два методи реалізовані в epitoolsпакеті в Р.

— АдамО
джерело