Чи обчислення "фактичної ймовірності покриття" те саме, що обчислення "достовірного інтервалу"?


10

Я читав підручник зі статистикою початкового рівня. У главі про максимальну оцінку ймовірності частки успішності в даних з біноміальним розподілом було дано формулу для обчислення довірчого інтервалу, а потім нестандартно згадується

Розглянемо його фактичну ймовірність покриття, тобто ймовірність того, що метод виробляє інтервал, який фіксує справжнє значення параметра. Це може бути трохи менше, ніж номінальне значення.

Далі йде пропозиція побудувати альтернативний "інтервал довіри", який, імовірно, містить фактичну ймовірність покриття.

Я вперше зіткнувся з ідеєю номінальної та фактичної ймовірності покриття. Пробиваючись тут через старі питання, я думаю, що я зрозумів це: є два різні поняття, які ми називаємо ймовірними, перше - наскільки ймовірним є те, що ще не відбулася подія дасть певний результат, а друга наскільки правдоподібним є те, що правда здогадка агента, що спостерігає, про результат вже відбулася події. Також здавалося, що довірчі інтервали вимірюють лише перший тип ймовірності, а те, що називається "достовірні інтервали" вимірюють другий тип ймовірності. Я коротко припустив, що довірчі інтервали - це ті, які обчислюють "номінальну ймовірність покриття", а достовірні інтервали - це ті, які охоплюють "фактичну ймовірність покриття".

Але, можливо, я неправильно трактував книгу (не зовсім зрозуміло, чи різні методи обчислення, які вона пропонує, для довірчого інтервалу та достовірного інтервалу, або для двох різних типів інтервалу довіри), або інших джерел, до яких я приходив моє теперішнє розуміння. Особливо коментар, який я отримав з іншого питання,

Інтервали довіри для частолістських, достовірних для байесів

змусив мене сумніватися у своїх висновках, оскільки книга не описувала байєсівський метод у цій главі.

Тому, будь ласка, уточніть, чи правильно я розумію, чи я допустив логічну помилку в дорозі.


Номінальна ймовірність покриття - це "цільова" ймовірність покриття: та, яку ми намагаємося досягти, коли ми отримуємо метод, що забезпечує інтервал довіри. Фактичне покриття - це "справжнє" покриття. Деякі люди кажуть, що довірчий інтервал є точним, коли фактичне покриття дорівнює номінальному. Scotchi та Unwisdom згадували, що інтервал довіри ніколи не є точним для дискретних даних. Інший приклад - коли ми використовуємо асимптотичний довірчий інтервал: він точний лише тоді, колиn. Я повністю розумію вашу ідею, оскільки "фактичний" також є синонімом "присутній".
Stéphane Laurent

Відповіді:


5

Загалом, реальна ймовірність покриття ніколи не буде дорівнює номінальній ймовірності, коли ви працюєте з дискретним розподілом.

Довірчий інтервал визначається як функція даних. Якщо ви працюєте з біноміальним розподілом, можливі лише кінцеві результати (n+1якщо бути точним), тож існує лише кінцево багато можливих довірчих інтервалів. Оскільки параметрp є безперервним, досить легко зрозуміти, що ймовірність покриття (що є функцією p) не може бути кращим, ніж приблизно 95% (або що завгодно).

Загалом вірно, що методи, засновані на CLT, матимуть ймовірність покриття нижче номінального значення, але інші методи насправді можуть бути більш консервативними.


1
Ось корисне формальне твердження визначення: Дано пробний простір Ω,F,P і невідомий параметр θ, а 1α Процедура довіри складається з пари функційLU:ΩR такий як
P[{ωΩ|[L(ω),U(ω)]θ}]1α.
Ліва частина цього виразу - це coverage probability(зауважте, що це залежить від θ), а РЗС - номінальний рівень довіри . Якщо мінімальний (понадΩ) LHS дорівнює RHS, тоді процедура є точною .
Мудрість

8

Це не має нічого спільного з достовірними інтервалами Байєса і часто-часто довірчими інтервалами. Інтервал довіри 95% (скажімо) визначається як такий, що дає принаймні 95% покриття незалежно від справжнього значення параметраπ. Отже, коли номінальне покриття становить 95%, фактичне покриття може становити 97%, колиπ=π1, 96,5% коли π=π2, але без значення πце менше 95%. Проблема (тобто невідповідність між номінальним та фактичним покриттям) виникає при дискретних розподілах, таких як двочлен.

В якості ілюстрації розгляньте спостереження x успіхи від n біноміальні випробування з невідомою ймовірністю успіху π:

xπUPr(X=x|π=0.7)I(πU0.7)00.39303780.000729010.58180340.010206020.72866160.059535130.84683890.185220140.93715010.324135150.99148760.302526161.00000000.1176491
Перший стовпець показує можливі спостережувані значення . Другий показує точну верхню впевнену межу яку ви обчислили б у кожному випадку. Тепер припустимо, : третій стовпець показує ймовірність кожного спостережуваного значення за цим припущенням; четвертий показує, для яких випадків обчислений довірчий інтервал охоплює справжнє значення параметра, позначаючи їх значенням . Якщо ви ймовірності для випадків, коли інтервал довіри покриває справжнє значення, ви отримаєте фактичне покриття . Для різних істинних значеньx 95%πU=π:[Pr(X>x|π)=0.95]π=0.7x10.989065π, фактичне покриття буде різним:

покриття

Номінальне покриття досягається лише тоді, коли справжні значення параметрів збігаються з доступними верхніми межами.

[Я щойно перечитав ваше запитання і помітив, що автор каже, що фактична може бути меншою, ніж номінальна ймовірність покриття. Тож я вважаю, що вони говорять про приблизний метод обчислення довірчого інтервалу, хоча те, що я сказав вище, все ще йде. Графік може запропонувати повідомити про середній рівень довіри близько але - усереднення за значеннями невідомого параметра?]98%

† Точне в тому сенсі, що фактичне покриття ніколи не менше номінального покриття для будь-якого значення , & рівне йому для деяких значень - @ Почуття Мудрості, а не Стефана.ππ

‡ частіше використовуються інтервали з верхніми та нижніми межами; але трохи складніше пояснити, і є лише один точний інтервал, який слід розглядати лише з верхньою межею. (Див. Блейкер (2000), "Криві довіри та покращені точні довірчі інтервали для дискретних розподілів", Канадський журнал статистики , 28 , 4 та посилання).


Дякую за відповідь. Тепер, коли я знаю, яка фактична ймовірність покриття, чи маєте ви здогад, чому користувач у цьому запитанні надіслав запитання, що пояснюють різницю між достовірними та довірчими інтервалами? Тут я взяв думку про те, що фактична / номінальна проблема покриття. подвійність пов'язана. stats.stackexchange.com/questions/63922/…
rumtscho

Можливо, тому, що ОП дає лише посилання на те, де він бачив терміни "номінальне" та "фактичне" (а не узагальнення чи цитування з нього в питанні, як ви це робили), а потім присвячує решту свого питання своєму неправильному тлумаченню їх використання в цьому контексті.
Scortchi

2

Я думаю, що різниця насправді полягає у використанні наближень, зроблених при обчисленні довірчих інтервалів. Наприклад, якщо ми використовуємо досить стандартний CI

estimate±1.96×estimated standard error

Ми можемо називати це "95% довірчим інтервалом". Однак, як правило, тут робиться кілька наближень. Якщо ми не зробимо наближення, ми можемо обчислити фактичне покриття. Типова ситуація знаходиться під оцінкою стандартної помилки. Тоді інтервали занадто вузькі, щоб захопити справжнє значення з 95% вірогідністю. Вони можуть фіксувати справжнє значення лише з імовірністю сказати 85%. Вірогідність "фактичного покриття" може бути розрахована за допомогою моделювання монте-карло якогось типу (наприклад, генеруйте наборів даних вибірки, використовуючи вибране справжнє значення, потім обчисліть 95% ІС для кожного та виявіть, що насправді містило справжнє значення).1000850

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.