Інтервал довіри навколо біноміальної оцінки 0 або 1


36

Яка найкраща методика обчислення довірчого інтервалу біноміального експерименту, якщо ваша оцінка така, що (або аналогічно ), а розмір вибірки порівняно невеликий, наприклад ?p=0p=1н=25


Наскільки близький до нуля ? Чи дорівнює нулю часто, або в порядку 0,001, або 0,01, або ...? А скільки у вас даних? p^
jbowman

У нас зазвичай більше 800 випробувань. Зазвичай ми очікуємо від 0 до 0,1 дляp^
AI2.0

Використовуйте зв'язаний інтервал Clopper – Pearson. Загальний принцип: Спершу спробуйте інтервал Clopper – Pearson. Якщо комп'ютер не може отримати відповідь, спробуйте метод наближення, такий як звичайне наближення. Згідно з поточною швидкістю комп'ютера, я не думаю, що нам не потрібно наближення у більшості ситуацій.
користувач158565

Для отримання лише верхньої межі довірчого інтервалу з (1- рівень довіри, ми просто використаємо B (1− ; x + 1, n-x), де x - кількість успіхів (або невдач), n - розмір вибірки. У python ми просто використовуємо . Якщо це ІСТИНА, чи можемо ми зробити висновок, що ми 1− впевнені, що верхня межа обмежена значенням, з якого ми обчислюємо ?α αααscipy.stats.beta.ppf(1−$\alpha$;x+1,n−x) αscipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
AI2.0

1
З 800 випробувань звичайне нормальне наближення працюватиме досить добре приблизно до (мої симуляції показали, що реальне покриття 95,5% довірчого інтервалу становить 94,5%.) У 1000 випробувань і фактичне покриття становило приблизно 92,7% (все засновано на 100 000 реплікацій.) Отже, це враховує лише дуже низький рівень , враховуючи кількість випробувань. p = 0,01 pp=0,015p=0,01p
jbowman

Відповіді:


53

Не використовуйте нормальне наближення

Про цю проблему написано багато. Загальна порада - ніколи не використовувати нормальне наближення (тобто асимптотичний / довірчий інтервал довіри), оскільки воно має жахливі властивості покриття. R код для ілюстрації цього:

library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")

Покриття ймовірностей для асимптотичних довірчих інтервалів для біноміальної пропорції.

Для невеликих імовірностей успіху ви можете попросити 95% довірчий інтервал, але насправді отримати, скажімо, 10% довірчий інтервал!

Рекомендації

То що ж нам використовувати? Я вважаю, що нинішні рекомендації є тими, які наведені в статті Оцінка інтервалу для біноміальної пропорції Брауна, Кая та ДасГупта в статистичній науці 2001, т. 16, ні. 2, стор 101–133. Автори дослідили кілька методів обчислення довірчих інтервалів і дійшли наступного висновку.

[W] рекомендуємо інтервал Вілсона або попередній інтервал Джеффрі з рівним хвостиком для малого n та інтервал, запропонований у Agresti та Coull, для більших n .

Інтервал Вілсона також іноді називають бальним інтервалом, оскільки він заснований на переверненні тестової оцінки.

Обчислення інтервалів

Щоб обчислити ці довірчі інтервали, ви можете використовувати цей онлайн-калькулятор або binom.confint()функцію в binomпакеті в Р. Наприклад, для 0 успіхів у 25 випробуваннях код R буде:

> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
  type="central")
         method x  n  mean  lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2         bayes 0 25 0.019  0.000 0.073
3        wilson 0 25 0.000  0.000 0.133

Ось bayesінтервал Джеффріса. (Аргумент type="central"необхідний, щоб отримати інтервал з рівним хвастом .)

Зауважте, що вам слід вирішити, який з трьох методів ви хочете використовувати, перш ніж обчислювати інтервал. Перегляд усіх трьох і вибір найкоротшого, природно, дасть вам занадто малу ймовірність покриття.

Швидка, приблизна відповідь

На завершення, якщо ви дотримуєтесь точно нульових успіхів у своїх російських випробуваннях і просто хочете дуже швидкий приблизний довірчий інтервал, ви можете використовувати правило три . Просто діліть число 3 на n . У наведеному вище прикладі n дорівнює 25, тому верхня межа становить 3/25 = 0,12 (нижня межа звичайно 0).


Дуже багато для вашої відповіді. Уявіть цей приклад із реального життя: архітектору доводиться перевіряти в хмарочосі, чи правильно встановлені всі ізоляційні панелі на стелях. Він відкриває 25 стельових панелей на довільному виборі підлог і знаходить понад усі ці стельові панелі утеплення. Отже, ми можемо зробити висновок, що реальна ймовірність наявності ізоляційної панелі з 95% визначеністю між CI [0,867 до 1] на основі шкали інтервалу Вілсона?
Каспер

2
Я б не сказав, що ви можете зробити це з «95% визначеністю» (Google для «правильної інтерпретації довірчих інтервалів»). Також це ґрунтується на припущенні незалежних випробувань з однаковою ймовірністю успіху, що тут може бути нереально. Можливо, на останніх встановлених панелях був більший ризик неправильно встановити (людина, яка їх встановлювала, втомилася / нудьгувала). Або, можливо, перші були, оскільки людина тоді була менш досвідченою. У будь-якому разі, якщо архітектору сказали перевірити, чи всі панелі встановлені правильно, він повинен виконувати свою роботу, а не просто перевіряти зразок!
Карл Ове Хаффхаммер

5
bayesвикористовує рівномірний попередній (замість Джефрі), коли обидва параметри форми 1. Мені надіслали електронну пошту з обслуговуючим пакетом бінома з цікавості щодо (не) переваг Джефрі перед рівномірним раніше, і він сказав мені, що нова версія використовуватиме формат попереднього за замовчуванням. Тож не дивуйтесь, чи будуть результати в майбутньому незначно відрізнятися.
cbeleites підтримує Моніку

3
Це відмінна відповідь. Він передає всю ключову інформацію, яку ви можете прочитати в документах на цю тему, але дуже стисло та чітко. Якби я міг підняти два рази, я би.
SigmaX

6
binconfМетод Hmiscтакож обчислює ці інтервали. За замовчуванням використовується метод Вілсона.
SigmaX

0

p±zα/2p(1-p)/нπ0π0π0

|p-π0|p(1-p)/н=0
(1+z02/н)π02+(-2p-z02/н)π0+p2=0


1
π0

π0pн

Ось Агресті.
Нік Кокс

@NickCox це інша робота
Джей Шилер Раадт

1
Алан Агрешті опублікував різні тексти. Напевно, ви натякаєте на Вступ до категоричного аналізу даних (2-е видання 2007; 3-е видання заплановане на публікацію в жовтні 2018 року і може мати дату 2019 року) від Джона Вілі.
Нік Кокс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.