Аналіз потужності для біноміальних даних, коли нульовою гіпотезою є, що


10

Я хотів би зробити аналіз потужності для одного зразка з біноміальних даних з , порівняно з , де - частка успіхів у сукупності. Якщо , я міг би використати або нормальне наближення до двочленного, або -test, але при ці обидва не вдається. Я хотів би знати, чи є спосіб зробити цей аналіз. Я дуже вдячний за будь-які пропозиції, коментарі чи посилання. Дуже дякую!H0:p=0H1:p=0.001p0<p<1χ2p=0


То чому ви не використовуєте точний тест Clopper-Pearson?
Стефан Лоран

2
Я сподіваюся, у вас дійсно великий зразок! Це буде важко перевірити.
Пітер Флом

Відповіді:


13

У вас є однобічна, точна альтернативна гіпотеза де і . p 1 = 0,001 p 0 = 0p1>p0p1=0.001p0=0

  • Перший крок - визначити поріг для кількості успіхів, такий, що ймовірність отримати принаймні успіхів у вибірці розміру дуже низька під нульовою гіпотезою (умовно ). У вашому випадку, , незалежно від вашого конкретного вибору для та .ccnα=0.05c=1n1α>0
  • Другий крок - з’ясувати ймовірність досягти хоча б успіхів у вибірці розміру за альтернативної гіпотези - це ваша сила. Тут вам потрібен фіксований такий, щоб розподіл біномів було повністю вказано.cnnB(n,p1)

Другий крок у R з :n=500

> n  <- 500                 # sample size
> p1 <- 0.001               # success probability under alternative hypothesis
> cc <- 1                   # threshold
> sum(dbinom(cc:n, n, p1))  # power: probability for cc or more successes given p1
[1] 0.3936211

Щоб зрозуміти, як змінюється потужність залежно від розміру вибірки, ви можете намалювати функцію живлення: введіть тут опис зображення

nn   <- 10:2000                 # sample sizes
pow  <- 1-pbinom(cc-1, nn, p1)  # corresponding power
tStr <- expression(paste("Power for ", X>0, " given ", p[1]==0.001))
plot(nn, pow, type="l", xaxs="i", xlab="sample size", ylab="power",
     lwd=2, col="blue", main=tStr, cex.lab=1.4, cex.main=1.4)

Якщо ви хочете знати, який розмір вибірки потрібно досягти принаймні заздалегідь заданої потужності, ви можете використовувати значення потужності, обчислені вище. Скажіть, що вам потрібно потужність щонайменше .0.5

> powMin <- 0.5
> idx    <- which.min(abs(pow-powMin))  # index for value closest to 0.5
> nn[idx]     # sample size for that index
[1] 693

> pow[idx]    # power for that sample size
[1] 0.5000998

Тож вам потрібен розмір вибірки принаймні щоб досягти потужності .6930.5


Відповідно pwr.p.test, для потужності 0,5 потрібно не менше 677 спостережень. Але потужність = 0,5 дуже мала!
Джессіка

@caracal Ви використовуєте нормальне наближення для отримання кривої потужності? Точна функція синдрому двочлену не була б такою гладкою. Насправді це пилообработка, яку можна було побачити, чи збільшується вісь розміру зразка. Я обговорюю це у своїй праці в 2002 році в американському статистиці, співавтором якого є Крістін Лю. Також двочлен настільки сильно перекошений при дуже низькому p, що n має бути великим, щоб нормальне наближення працювало добре.
Майкл Р. Черник

2
@MichaelChernick Ні, це не від біноміальних розподілів, а не від нормального наближення. Звичайно, ви праві, що в цілому потужність для біноміального тесту - це пилообразна функція, яка не є монотонною. Але зауважте, що у нас тут є особливий випадок з . Це означає, що область прийняття альтернативної гіпотези завжди починається з 1, незалежно від . При постійному порозі , постійній , потужність - це суворо зростаюча функція . p0=0nc=1p1=0.001n
каракал

@ Джессіка Зауважимо, що pwr.p.test()використовується нормальне наближення, а не точні біноміальні розподіли. Просто введіть, pwr.p.testщоб переглянути вихідний код. Ви знайдете дзвінки із pnorm()зазначенням, що використовується наближення.
каракал

1
@caracal Тож чи можу я поглянути на це так: Під нульовою гіпотезою ймовірність успіху дорівнює 0, отже, якщо ви коли-небудь побачите успіх, ви можете відкинути нульову гіпотезу. Ось чому ви говорите, що поріг дорівнює 1, тому що якщо двочленна сума колись досягне 1, ви можете відхилити помилку типу 2 у 0! Зараз під альтернативою ймовірність першого успіху на n-му випробуванні становить (1-p) p. Ця ймовірність іде до 0, оскільки n переходить до нескінченності. Отже, послідовне правило, що перебуває через зупинку, коли S = 1 матиме потужність 1 для будь-якого p> 0. n1n
Майкл Р. Черник

3

Ви можете легко відповісти на це питання за допомогою pwrпакета в Р.

Вам потрібно буде визначити рівень значущості, потужність та розмір ефекту. Зазвичай рівень значущості встановлюється на 0,05, а потужність - на 0,8. Вища потужність вимагатиме більше спостережень. Нижчий рівень значущості зменшить потужність.

Розмір ефекту для пропорцій, використаних у цій упаковці, становить h Коена. Обрізання для невеликої години часто вважається рівним 0,20. Фактичне скорочення залежить від застосування та може бути меншим у вашому випадку. Менший h означає, що буде потрібно більше спостережень. Ви сказали, що ваша альтернатива . Це дуже малоp=0.001

> ES.h(.001, 0)
[1] 0.0632561

Але ми все одно можемо продовжувати.

 > pwr.p.test(sig.level=0.05, power=.8, h = ES.h(.001, 0), alt="greater", n = NULL)

 proportion power calculation for binomial distribution (arcsine transformation) 

          h = 0.0632561
          n = 1545.124
  sig.level = 0.05
      power = 0.8
alternative = greater

Використовуючи ці значення, вам потрібно щонайменше 1546 спостережень.


1

У вашому конкретному випадку є просте точне рішення:

Відповідно до нульової гіпотези ви ніколи не повинні дотримуватися успіху. Отже, як тільки ви спостерігаєте один успіх, ви можете бути впевнені, що .H0:p=0p0

За альтернативою Кількість випробувань, необхідних для дотримання принаймні 1 успіху, випливає з геометричного розподілу. Отже, щоб отримати мінімальний розмір вибірки для досягнення потужності , потрібно знайти найменший k такий, щоH1:p=0.0011β

1β1(1p)(k1)

Отже, при щоб отримати потужності, вам знадобиться принаймні 1610 зразків.p=0.00180


Читаючи коментарі до рішення 1, я розумію, що це по суті те саме рішення, що і таке, яке ви отримуєте, якщо дотримуватися одного. Тим не менш, ніколи не зашкодить прописати деякі основні результати теорії ймовірностей, не потребуючи приїзду туди за допомогою інтуїції.
плавати
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.