Інтервал довіри навколо відношення двох пропорцій


20

У мене є дві пропорції (наприклад, частота кліків (CTR) на посилання в контрольній макеті та CTR на посилання в експериментальному макеті), і я хочу обчислити 95% довірчий інтервал навколо відношення цих пропорцій.

Як це зробити? Я знаю, що можу використовувати метод дельти для обчислення дисперсії цього співвідношення, але я не впевнений, що робити крім цього. Що я повинен використовувати як середню точку довірчого інтервалу (моє спостережуване співвідношення або очікуване співвідношення, яке відрізняється), і скільки стандартних відхилень навколо цього співвідношення слід взяти?

Чи варто взагалі використовувати дисперсію методу дельти? (Мені не дуже важлива дисперсія, просто інтервал довіри.) Чи варто використовувати теорему Філлера , використовуючи Case 1 (оскільки я виконую пропорції, я думаю, що я задовольняю нормальну вимогу розподілу)? Чи варто просто обчислити зразок завантажувальної програми?


1
У вас є фундаментальна проблема: більшість пропорцій мають позитивний шанс бути нульовим, тому співвідношення (незалежних пропорцій) має позитивний шанс бути невизначеним. Це може спричинити серйозні труднощі для наближених методів (як, наприклад, дельта-метод) і дозволяє припустити, що нормальні наближення слід розглядати більш скептично і перевіряти більш суворо, ніж зазвичай.
whuber

Джозеф Л. Флейс, Брюс Левін, Мюнгі Чо Пайк: Статистичні методи для ставок та пропорцій [1] обговорюють відносний ризик, який є коефіцієнтом двох ставок. У мене немає книги, тому я можу лише пройти тематику та зміст, але, можливо, у вашій бібліотеці є. [1]: onlinelibrary.wiley.com/book/10.1002/0471445428
cbeleites підтримує Моніку

Безумовно, найкращим методом буде відсотковий завантажувач?
Пітер Елліс

Відповіді:


19

Стандартний спосіб зробити це в епідеміології (де співвідношення пропорцій зазвичай називають коефіцієнтом ризику ) - спочатку log-перетворити відношення, обчислити довірчий інтервал за шкалою журналу, використовуючи метод delta та припускаючи нормальний розподіл, потім перетворіть назад. Це краще працює в помірних розмірах вибірки, ніж використання методу дельти в нетрансформованому масштабі, хоча він все ще буде вести себе погано, якщо кількість подій в будь-якій групі дуже малий, і повністю виходить з ладу, якщо в жодній з груп немає подій.

Якщо в двох групах є та успіхи із загальної кількості та , то очевидною оцінкою співвідношення пропорцій єх 2 л 1 н 2 θ = х 1 / п 1х1х2н1н2

θ^=х1/н1х2/н2.

Використовуючи метод delta та припускаючи, що дві групи є незалежними та успіхи розподілені біноміально, можна показати, що ім'я Якщо взяти квадратний корінь, це дає стандартну помилку . Якщо припустити, що звичайно розподіляється, 95% довірчий інтервал для є Показник цього дає 95% довірчий інтервал для відношення пропорцій якSE ( журнал & thetas ; ) увійти & thetas ; увійти & thetas ; увійти & thetas ; & plusmn ; 1,96 SE ( журнал & thetas ; ) . & Thetas ; & thetas ; ехр [ ± 1,96 SE (

Вар(журналθ^)=1/х1-1/н1+1/х2-1/н2.
SE(журналθ^)журналθ^журналθ
журналθ^±1,96SE(журналθ^).
θ
θ^досвід[±1,96SE(журналθ^)].

5
Це чудово працює, якщо і є великими (кілька сотень і більше) ін1н2н1p1н2p210х2=0хi=нi1/2хi1нipiнi4нi

@whuber: "підхід, що нагадує корекцію безперервності" - це використання 1/2, зокрема, звичайного фокусу? (На відміну від деяких інших невеликих псевдокаундів.) Те, як ви це висловили, робить 1/2 звучання в чомусь принциповим =) - це так?
raegtin

хiнi

Чому в цьому випадку квадратний корінь дисперсії є стандартною помилкою, а не стандартним відхиленням?
Мікко

2
@onestop Чи реалізовано це в будь-якому пакеті R?
Богдан Василеску
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.