Кіт Вінстейн,
EDIT: Просто для уточнення, ця відповідь описує приклад, наведений у відповіді Кіта Уінштейна про короля із жорстокою статистичною грою. У відповідях Байесія та Частота використовуються однакові відомості, які ігнорують інформацію про кількість справедливих та несправедливих монет при побудові інтервалів. Якщо ця інформація не буде ігнорована, частофіліст повинен використовувати інтегровану бета-біноміальну ймовірність як розподіл вибірки при побудові інтервалу довіри; в цьому випадку інтервал довіри Клоппер-Пірсон не є відповідним, і його потрібно змінити. Аналогічне коригування має відбутися в байєсівському розчині.
РЕДАКТУВАННЯ: Я також уточнив первинне використання шлангового пірсонського інтервалу.
EDIT: на жаль, мій альфа - це неправильний шлях, а мій інтервал закритої грудки невірний. Мої найскромніші вибачення у @whuber, який правильно вказав на це, але з яким я спочатку не погодився і проігнорував.
ІС з використанням методу Clopper Pearson дуже хороший
Якщо ви отримаєте лише одне спостереження, то інтервал Clopper Pearson можна оцінити аналітично. Припустимо, монета придумана як "успіх" (голови), потрібно вибрати такий, щоθ
[Pr(Bi(1,θ)≥X)≥α2]∩[Pr(Bi(1,θ)≤X)≥α2]
При ці ймовірності і , тому CI Піперсона Піперсона означає, що (і тривіально завжди вірно ), коли . Коли ці ймовірності і , тому CI Clopper Pearson CI означає, що , або коли . Отже, для 95% ДІ ми отримуємо коли , іX=1Pr(Bi(1,θ)≥1)=θPr(Bi(1,θ)≤1)=1θ≥α21≥α2X=1X=0Pr(Bi(1,θ)≥0)=1Pr(Bi(1,θ)≤0)=1−θ1−θ≥α2θ≤1−α2X=0[0.025,1]X=1[0,0.975] коли .X=0
Таким чином, той, хто використовує Clopper Pearson Interval Interval, ніколи не буде обезголовлений. Дотримуючись інтервал, це в основному весь простір параметрів. Але інтервал CP робить це, даючи 100% покриття на нібито 95% інтервал! По суті, частотаністи «обманюють», надаючи 95% -ному довірчому інтервалу більше висвітлення, ніж його / її просили дати (хоча хто б не обдурив у такій ситуації? Якби я був, я б дав цілий [0, 1] інтервал). Якби король попросив точно 95% ІС, цей метод частістів зазнав би невдачі незалежно від того, що насправді сталося (можливо, існує кращий?).
А як з Байєсським інтервалом? (конкретно Байєсівський інтервал найвищої задньої поглинання (HPD))
Оскільки ми апріорі знаємо, що і голови, і хвости можуть підійти, рівномірний вибір є розумним вибором. Це дає задній розподіл . Тепер все, що нам потрібно зробити, це створити інтервал з 95% задньою ймовірністю. Подібно до грушового пільсона CI, розподіл кумулятивного бета тут також аналітичний, так що і встановлення цих значень 0,95 дає коли і коли . Отже два достовірні інтервали є(θ|X)∼Beta(1+X,2−X)Pr(θ≥θe|x=1)=1−(θe)2Pr(θ≤θe|x=0)=1−(1−θe)2θe=0.05−−−−√≈0.224X=1θe=1−0.05−−−−√≈0.776X=0(0,0.776) коли і колиX=0(0.224,1)X=1
Таким чином, байєсівці обезголовлять його за достовірний інтервал HPD у випадку, коли він отримає погану монету, і погана монета вийде з хвостами, які будуть мати шанс .11012+1×110≈0
По-перше, байєсівський інтервал менший за довірчий інтервал. Інша справа, що байєсівці були б ближче до фактичного рівня покриття, на 95%, ніж частофілістів. Насправді байєсівський близько приблизно наближається до 95%, як можна отримати цю проблему. І всупереч твердженню Кіта, якщо обрана погана монета, 10 байесів із 100 в середньому втратять голову (не всі вони, тому що погана монета повинна підіймати голови за інтервал, щоб не містити ). 0.1
Цікаво, що якщо інтервал CP для 1 спостереження використовувався неодноразово (тому ми маємо N таких інтервалів, кожен заснований на 1 спостереженні), а справжня частка становила що-небудь між та , то охоплення 95% ІС завжди буде 100 %, а не 95%! Це однозначно залежить від справжнього значення параметра! Отже, це принаймні один випадок, коли повторне використання довірчого інтервалу не призводить до бажаного рівня впевненості.0.0250.975
Якщо цитувати справжній 95% довірчий інтервал, то за визначенням повинні бути деякі випадки (тобто хоча б один) спостережуваного інтервалу, які не містять справжнього значення параметра . В іншому випадку, як можна виправдати тег 95%? Чи не було б справедливим чи недійсним називати його інтервалом 90%, 50%, 20% або навіть 0%?
Я не бачу, наскільки задовільним є твердження про те, що "це насправді означає 95% або більше" без додаткового обмеження. Це тому, що очевидним математичним рішенням є весь простір параметрів, а проблема - тривіальна. припустимо, я хочу 50% ІС? якщо він обмежує лише помилкові негативи, то весь простір параметрів є дійсним CI, використовуючи лише цей критерій.
Можливо, кращим критерієм є (і це, на мою думку, імпліцитно визначене Кітом) "якомога ближче до 95%, не знижуючись нижче 95%". Байєсівський інтервал мав би покриття ближче до 95%, ніж частофілістський (хоча і не на багато), і не охоплював би 95% покриття ( покриття, коли , і охоплення, коли ).100%X=0100×1012+9101012+1%>95%X=1
На завершення, здається трохи дивним запитувати інтервал невизначеності, а потім оцінювати цей інтервал, використовуючи справжнє значення, про яке ми були невпевнені. "Справедливіше" порівняння, як для впевненості, так і для достовірних інтервалів, мені здається правдою твердження про невизначеність, даного з інтервалом .