Оцінка ймовірності в процесі Бернуллі шляхом вибірки до 10 відмов: це упередженість?


15

Припустимо, у нас є процес Бернуллі з ймовірністю відмови q (який буде малим, скажімо, q0.01 ), з якого ми робимо вибірку, поки не зіткнемся з 10 відмов. Таким чином , ми оцінюємо ймовірність відмови , як д : = 10 / N , де N являє собою число вибірок.q^:=10/NN

Питання : Чи є чи д зміщена оцінка по д ? І якщо так, чи є спосіб виправити це?q^q

Я стурбований тим, що наполягати на тому, що останній зразок є невдалим зміщенням оцінки.


5
Поточні відповіді не в змозі забезпечити мінімальний дисперсійний неупереджений оцінювач . Дивіться розділ вибірки та оцінки точки статті у Вікіпедії щодо негативного біноміального розподілу . (101)/(N1)
А. Вебб

Відповіді:


10

Це правда , що д є упередженою оцінкою ц в тому сенсі , що E ( Q ) Q , але ви не обов'язково повинні дозволити цьому стримувати вас. Цей точний сценарій може бути використаний як критика проти ідеї про те, що ми завжди повинні використовувати неупереджені оцінки, оскільки тут упередженість є більш артефактом конкретного експерименту, який ми робимо. Дані виглядають так само, як і коли б ми вибрали кількість вибірок заздалегідь, то чому б наші висновки мінялися?q^qE(q^)q

Цікаво, що якби ви збирали дані таким чином, а потім записували ймовірнісну функцію як в біноміальній (фіксований розмір вибірки), так і в негативній біноміальній моделі, ви виявили б, що дві пропорційні одна одній. Це означає , що д є лише звичайною оцінкою максимальної правдоподібності при негативній біноміальної моделі, яка, звичайно, цілком прийнятна оцінка.q^


Чудово! Схоже, що (для моїх цілей) цей ухил не є проблемою.
Беккі

9

Не наполягаючи на тому, що останній зразок є відмовою, яка зміщує оцінку, вона приймає зворотну N

Так у вашому прикладі, але E[10E[N10]=1q. Це близьке до порівняння середнього арифметичного та гармонічного середньогоE[10N]q

Погана новина полягає в тому, що зміщення може зростати, коли стає менше, хоча не набагато, коли q вже малий. Хороша новина полягає в тому, що зміщення зменшується в міру збільшення необхідної кількості відмов. Здається, що якщо вам потрібні f збої, то зміщення обмежено вище мультиплікативним фактором fqqf для малогоq; вам не хочеться такого підходу, коли ви зупиняєтесь після першої відмови ff1q

Зупинившись після відмов, при q = 0,01 ви отримаєте E [ N10q=0.01але E[10E[N10]=100, тоді як приq=0,001ви отримаєтеE[NE[10N]0.011097q=0.001але E[10E[N10]=1000. Зсув приблизно10E[10N]0.001111 мультиплікативний коефіцієнт 109


7

q^k=10q0=0.02

n_replications <- 10000
k <- 10
failure_prob <- 0.02
n_trials <- k + rnbinom(n_replications, size=k, prob=failure_prob)
all(n_trials >= k)  # Sanity check, cannot have 10 failures in < 10 trials

estimated_failure_probability <- k / n_trials
histogram_breaks <- seq(0, max(estimated_failure_probability) + 0.001, 0.001)
## png("estimated_failure_probability.png")
hist(estimated_failure_probability, breaks=histogram_breaks)
abline(v=failure_prob, col="red", lty=2, lwd=2)  # True failure probability in red
## dev.off()

mean(estimated_failure_probability)  # Around 0.022
sd(estimated_failure_probability)
t.test(x=estimated_failure_probability, mu=failure_prob)  # Interval around [0.0220, 0.0223]

E[q^]0.022q^

гістограма q_hat


1
Це справді корисно. На цьому рівні мене не варто турбувати.
Беккі

2
Ви можете написати це моделювання більш стисло, як10+rnbinom(10000,10,0.02)
А. Вебб

@ A.Webb дякую, це хороший момент. Я справді винаходив колесо. Мені потрібно прочитати rnbinom, а потім я відредагую свій пост
Адріан

1
Це було б 10/(10+rnbinom(10000,10,0.02)). Параметризація стосується кількості успіхів / невдач, а не загальної кількості випробувань, тому вам доведеться додати k = 10 назад. Зауважте, що неупереджений оцінювач був би на 9/(9+rnbinom(10000,10,0.02))один менший у чисельнику та знаменнику.
А. Вебб
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.