Клопер-Пірсон для не математиків


12

Мені було цікаво, чи може хтось пояснити мені інтуїцію поза межами CI Clopper-Pearson за пропорціями.

Наскільки мені відомо, кожна CI включає в неї дисперсію. Однак для пропорцій, навіть якщо моя частка дорівнює 0 або 1 (0% або 100%), CI Clopper-Pearson можна розрахувати. Я спробував розглянути формули, і я розумію, що в ньому є щось із відсотками біноміального розподілу, і я розумію, що пошук ІП передбачає ітерації, але мені було цікаво, чи хтось може пояснити логіку та раціональність "простими словами" або з мінімальним математикою ?

Відповіді:


22

Коли ви говорите, що ви звикли до довірчих інтервалів, що містять вираз для дисперсії, ви думаєте про випадок Гаусса, в якому інформація про два параметри, що характеризують сукупність - один її середній, а другий його дисперсія - узагальнюється за вибіркою середня та вибіркова дисперсія. Середнє значення вибірки оцінює середнє значення сукупності, але точність, з якою це робиться, залежить від дисперсії сукупності, оціненої в свою чергу відхиленням вибірки. Біноміальний розподіл, з іншого боку, має лише один параметр - ймовірність успіху в кожному окремому випробуванні, - і вся інформація, що надається вибіркою про цей параметр, узагальнена в загальну кількість "no". успіхи з безлічі незалежних випробувань. Цей параметр визначається як дисперсія, так і середнє значення сукупності.

πxn

Pr(X=x)=(nx)πx(1π)nx

Збільшуйте до тих пір, поки ймовірність або менших успіхів не впаде до 2,5%: це ваша верхня межа. Зменшіть до тих пір, поки ймовірність або більше успіхів не впаде до 2,5%: це ваша нижня межа. (Я пропоную вам насправді спробувати це зробити, якщо з цього не зрозуміло.) Що ви тут робите, це знаходження значень які, сприйняті як нульову гіпотезу, призведуть до того, що її (лише справедливо) відхилено двосхилий тест при значущості 5%. Зрештою, обчислені таким чином межі охоплюють справжнє значення , яким би воно не було, принаймні 95% часу.πxπxππ


+1. Це може заслужити питання самостійно, але я швидко запитаю тут: для конкретного додатку я хотів би отримати єдину міру невизначеності (те, що поводиться як стандартна помилка середнього) для різних пропорцій. Я знаю, що існує ряд процедур біноміального ІС, включаючи Clopper-Pearson. Чи має сенс сприймати ширину такої ІП як міру невизначеності? Або, можливо, ширина / 1,96 / 2, щоб змусити отримати саме SEM в гауссовій межі.
амеба каже, що повернеться Моніка

1
@amoeba: Імовірно, ви думаєте про невеликі розміри вибірки: (1) Ви, мабуть, хочете чогось типу КІ Blaker-Spjotvoll, а не CI на основі тесту з рівними хвостами. (2) Розподіл довіри є досить складним, що зробить ширину будь-якого інтервалу неприємно чутливою до передбаченого вами покриття.
Scortchi
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.