Дискретні функції: Покриття інтервалу довіри?


9

Як розрахувати дискретний інтервал покриття?

Що я вмію робити:

Якби у мене була модель безперервної дії, я міг би визначити 95% довірчий інтервал для кожного з моїх передбачуваних значень, а потім побачити, як часто фактичні значення знаходилися в межах довірчого інтервалу. Я можу виявити, що лише 88% часу мій інтервал довіри 95% покривав фактичні значення.

Що я не знаю, як робити:

Як це зробити для дискретної моделі, наприклад, пуассона або гамма-пуассона? Для цієї моделі я маю на увазі наступне спостереження (із понад 100 000 я планую генерувати :)

№ спостереження: (довільно)

Прогнозоване значення: 1,5

Прогнозована ймовірність 0: .223

Прогнозована ймовірність 1: .335

Прогнозована ймовірність 2: .251

Прогнозована ймовірність 3: .126

Прогнозована ймовірність 4: .048

Прогнозована ймовірність 5: .014 [і 5 або більше дорівнює .019]

... (тощо)

Прогнозована ймовірність 100 (або до якоїсь іншої нереалістичної цифри): .000

Фактичне значення (ціле число, наприклад "4")

Зауважте, що, хоча я давав значення пуассона вище, у фактичній моделі передбачуване значення 1,5 може мати різні прогнозовані ймовірності 0,1, ... 100 у спостереженнях.

Мене бентежить дискретність значень. Очевидно, що "5" знаходиться поза інтервалом 95%, оскільки лише 0,019 на рівні 5 і вище, що менше 0,05. Але 4 буде багато - індивідуально вони знаходяться всередині, але як я спільно оцінювати кількість 4-х більш правильним?

Чому мені все одно?

Моделі, на які я дивлюся, піддаються критиці за точність на сукупному рівні, але дають погані індивідуальні прогнози. Хочу побачити, наскільки гіршими є погані індивідуальні прогнози, ніж сутнісно широкі інтервали довіри, передбачені моделлю. Я очікую, що емпіричне покриття буде гіршим (наприклад, я можу виявити, що 88% значень лежать в межах 95% довірчого інтервалу), але я сподіваюся лише трохи гірше.

Відповіді:


6

Інтервали довіри Неймана не намагаються забезпечити охоплення параметра в разі будь-якого конкретного інтервалу. Натомість вони забезпечують покриття всіх можливих значень параметрів у довгостроковій перспективі. У певному сенсі вони намагаються бути глобально точними за рахунок локальної точності.

Інтервали довіри для біноміальних пропорцій дають чітку ілюстрацію цього питання. Нейманова оцінка інтервалів дає такі неправильні ділянки покриття, як це, що становить 95% інтервалів Клоппера-Пірсона для n = 10 біноміальних випробувань:

Діаграма покриття Clopper-Pearson

Існує альтернативний спосіб зробити висвітлення, який, на мою думку особисто, є набагато більш інтуїтивно доступним та (таким чином) корисним. Покриття за інтервалами може бути визначено умовно за спостережуваним результатом. Це покриття було б місцевим покриттям. Ось сюжет, що показує локальне охоплення трьох різних методів обчислення інтервалів конфіденційності для біноміальних пропорцій: Клопер-Пірсон, оцінки Вілсона та умовно-точний метод, що дає інтервали виходу, ідентичні байєсівським інтервалам, з рівномірним попереднім:

Умовне покриття для трьох типів інтервалу

Зауважте, що метод 95% Clopper-Pearson дає понад 98% локального покриття, але точні умовні інтервали є, точно, точними.

Спосіб думати про різницю між глобальним та локальним інтервалами - це вважати глобальну інверсією тестів гіпотези Неймана-Пірсона, де результатом є рішення, яке приймається на основі врахування довгострокових коефіцієнтів помилок для поточного експериментуйте як учасник глобального набору всіх експериментів, які можуть бути запущені. Локальні інтервали більше схожі на інверсію тестів на значущість рибалки, які дають значення P, що є свідченням проти нуля цього конкретного експерименту.

(Наскільки мені відомо, розмежування між глобальною та локальною статистикою вперше було здійснено в неопублікованій магістерській роботі Клер Ф Леслі (1998). Відсутність впевненості: дослідження придушення певних зустрічних прикладів до теорії Неймана-Пірсона статистичні умовиводи з особливим посиланням на теорію довірчих інтервалів. Ця дисертація виконується бібліотекою Бейліу в Мельбурнському університеті.)


2
Я не думаю, що Клер Леслі вигадала глобальну / локальну відмінність, але вона дуже красиво описала це, з великою кількістю посилань. Я занадто настійно рекомендую її тезу.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.