Не використовуйте нормальне наближення
Про цю проблему написано багато. Загальна порада - ніколи не використовувати нормальне наближення (тобто асимптотичний / довірчий інтервал довіри), оскільки воно має жахливі властивості покриття. R код для ілюстрації цього:
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")
Для невеликих імовірностей успіху ви можете попросити 95% довірчий інтервал, але насправді отримати, скажімо, 10% довірчий інтервал!
Рекомендації
То що ж нам використовувати? Я вважаю, що нинішні рекомендації є тими, які наведені в статті Оцінка інтервалу для біноміальної пропорції Брауна, Кая та ДасГупта в статистичній науці 2001, т. 16, ні. 2, стор 101–133. Автори дослідили кілька методів обчислення довірчих інтервалів і дійшли наступного висновку.
[W] рекомендуємо інтервал Вілсона або попередній інтервал Джеффрі з рівним хвостиком для малого n та інтервал, запропонований у Agresti та Coull, для більших n .
Інтервал Вілсона також іноді називають бальним інтервалом, оскільки він заснований на переверненні тестової оцінки.
Обчислення інтервалів
Щоб обчислити ці довірчі інтервали, ви можете використовувати цей онлайн-калькулятор або binom.confint()
функцію в binom
пакеті в Р. Наприклад, для 0 успіхів у 25 випробуваннях код R буде:
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
Ось bayes
інтервал Джеффріса. (Аргумент type="central"
необхідний, щоб отримати інтервал з рівним хвастом .)
Зауважте, що вам слід вирішити, який з трьох методів ви хочете використовувати, перш ніж обчислювати інтервал. Перегляд усіх трьох і вибір найкоротшого, природно, дасть вам занадто малу ймовірність покриття.
Швидка, приблизна відповідь
На завершення, якщо ви дотримуєтесь точно нульових успіхів у своїх російських випробуваннях і просто хочете дуже швидкий приблизний довірчий інтервал, ви можете використовувати правило три . Просто діліть число 3 на n . У наведеному вище прикладі n дорівнює 25, тому верхня межа становить 3/25 = 0,12 (нижня межа звичайно 0).