Інтервал довіри для вибірки Бернуллі


42

У мене є випадкова вибірка випадкових змінних Бернуллі , де X i - iidrv і P ( X i = 1 ) = p , а p - невідомий параметр.X1...XNXiP(Xi=1)=pp

Очевидно, що можна знайти оцінку для : р : = ( X 1 + + Х N ) / N .pp^:=(X1++XN)/N

Моє запитання: як я можу побудувати довірчий інтервал для ?p


2
У вікіпедії є детальна інформація про те, як обчислити довірчі інтервали для відбору проб Бернуллі .

Відповіді:


52
  • Якщо в , не близько 1 або 0 , і розмір вибірки п досить велике (тобто п р > 5 і п ( 1 - р ) > 5 , довірчий інтервал може бути оцінений з допомогою нормального розподілу і інтервал довіри, побудований таким чином:p^10nnp^>5n(1p^)>5

    p^±z1α/2p^(1p^)n
  • p^=0n>3095%[0,3n] p^=1n+1n+b

  • np^

R забезпечує функції , binconf {Hmisc}і binom.confint {binom}які можуть бути використані в такий спосіб:

set.seed(0)
p <- runif(1,0,1)
X <- sample(c(0,1), size = 100, replace = TRUE, prob = c(1-p, p))
library(Hmisc)
binconf(sum(X), length(X), alpha = 0.05, method = 'all')
library(binom)
binom.confint(sum(X), length(X), conf.level = 0.95, method = 'all')

Агресті, Алан; Coull, Brent A. (1998). "Орієнтовний краще, ніж" точний "для інтервальної оцінки біноміальних пропорцій". Американський статистик 52: 119–126.

Йованович, Б.Д. і П.С. Леві, 1997. Погляд на правило трьох. Американський статистик Vol. 51, № 2, стор 137-139

Росс, ТД (2003). "Точні довірчі інтервали для біноміальної пропорції та оцінки швидкості Пуассона". Комп'ютери в біології та медицині 33: 509–531.


3
(+1) Приємна відповідь. Я думаю, це стане орієнтиром для подібних питань у майбутньому. Однак перехресне повідомлення незвичне; насправді я вважаю, що це нахмурилося, тому що воно накручує багато аспектів системи зворотного зв'язку / посилань / нарізки / коментування. Подумайте про те, як видалити одну з копій та замінити її посиланням у коментарі.
whuber

@whuber дякую за відгук. Інший примірник я видалив.
Девід Лебоуер

У першій формулі, що таке z1 та альфа?
Cirdec

z1α/21α/2α

3/n

7

Максимальні вірогідні вірогідні інтервали

p

β^0=log(p^/(1p^))

αβ0

CI(β0)α=β^0±Zα/21/(np^(1p^)

p

CI(p)α=1/(1+exp(CI(β0)α)

Ця CI має додаткову перевагу в тому, що пропорції лежать в інтервалі між 0 або 1, а ІС завжди вужчий, ніж нормальний інтервал, будучи правильним рівнем. Це можна легко отримати в R, вказавши:

set.seed(123)
y <- rbinom(100, 1, 0.35)
plogis(confint(glm(y ~ 1, family=binomial)))

    2.5 %    97.5 % 
0.2795322 0.4670450 

Точні біноміальні довірчі інтервали

Y=np^(n,p)p^

CIα=(Fp^1(0.025),Fp^1(0.975))

p

qbinom(p = c(0.025, 0.975), size = length(y), prob = mean(y))/length(y)
[1] 0.28 0.47

Середні неупереджені довірчі інтервали

pp1α/2

p1α/2:P(Y=0)/2+P(Y>y)>0.975

Це також обчислювальний звичай.

set.seed(12345)
y <- rbinom(100, 1, 0.01) ## all 0
cil <- 0
mupfun <- function(p) {
  0.5*dbinom(0, 100, p) + 
    pbinom(1, 100, p, lower.tail = F) - 
    0.975
} ## for y=0 successes out of n=100 trials
ciu <- uniroot(mupfun, c(0, 1))$root
c(cil, ciu)

[1] 0.00000000 0.05357998 ## includes the 0.01 actual probability

Останні два методи реалізовані в epitoolsпакеті в Р.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.