Як ви пояснюєте різницю між відносним ризиком та абсолютним ризиком?


12

Днями я провів консультацію з епідеміологом. Вона є доктором медичних наук із ступенем епідеміології в галузі охорони здоров'я та має багато статистичної кмітливості. Вона наставляє своїх наукових співробітників та мешканців та допомагає їм у вирішенні статистичних питань. Вона досить добре розуміє тестування гіпотез. У неї була типова проблема порівняння двох груп, щоб дізнатись, чи є різниця в ризику, пов’язаному з отриманням застійної серцевої недостатності (ХСН). Вона перевірила середню різницю в частці суб'єктів, які отримують ХСН. Значення р становило 0,08. Тоді вона також вирішила переглянути відносний ризик і отримала значення р 0,027. Тож вона запитала, чому одна значна, а інша ні. Дивлячись на 95% двосторонні довірчі інтервали для різниці та співвідношення, вона побачила, що середній інтервал різниці містив 0, але верхня межа довіри для співвідношення була меншою за 1. Отже, чому ми отримуємо непослідовні результати. Моя відповідь у той час як технічно правильна, була не дуже задовільною. Я сказав: "Це різні статистичні дані і можуть дати різні результати. Значення р обоє в області незначних значень. Це може бути легко". Я думаю, що повинні бути кращі способи відповісти на це питання мирянами, щоб допомогти їм зрозуміти різницю між тестуванням відносного ризику та абсолютного ризику. В епі-дослідженнях ця проблема виникає багато, оскільки вони часто розглядають рідкісні події, коли рівень захворюваності для обох груп дуже малий, а розміри вибірки не дуже великі. Я трохи подумав над цим і маю кілька ідей, якими я поділюсь. Але спершу я хотів би почути, як дехто з вас впорається з цим. Я знаю, що багато хто з вас працює або консультується в галузі медицини і, напевно, стикався з цим питанням. Що б ти зробив?


Чи включають моделі інші коваріати, крім групового ефекту?
onestop

@onestop Є коваріати, на які вони зацікавлені подивитися, але власне тест порівнював лише основний ефект. Якщо ви хочете прокоментувати, припустивши, що тест був заснований на регресійній моделі або події, припустимо, що ми встигли надати дані про події, щоб відповідати регресійній моделі Кокса, сміливо коментуйте. Я хотів би почути вашу думку. Моє запитання стосується загальної проблеми, а не лише конкретного прикладу.
Майкл Р. Черник

Я мав на увазі, чи було виправлено тест, порівнюючи основний (груповий) ефект для коваріатів, чи не коригував? Якщо не відрегульовано, може бути корисно надати нам таблицю розміром 2 × 2 або подібну, щоб зосередити ідеї.
onestop

Непристосований для цих конкретних тестів.
Майкл Р. Черник

Відповіді:


7

Ну, з того, що ви вже говорили, я думаю, що ви охопили більшу частину цього, але просто потрібно викласти її мовою: один - це різниця ризиків, один - співвідношення. Отже, один тест гіпотези запитує, чи а інший запитує, чи . Іноді це «близько», іноді ні. (Закрийте цитатами, оскільки, очевидно, вони не близькі в звичному арифметичному сенсі). Якщо ризик рідкісний, вони, як правило, "далеко один від одного". наприклад (далеко не 1), тоді як (близько до 0); але якщо ризик високий, то це "близько": (далеко не 0) і (також далеко від 0, принаймні порівняно з рідкісним випадком).p 2p2p1=0.002/.001=2.002-.001=.001.2/.1=2.2-.1=.1p2p1=1.002/.001=2.002.001=.001.2/.1=2.2.1=.1


2
У вас є одна з моїх ідей там, коли кількість невелика, що є загальним при вивченні низьких показників захворюваності, відмінності виглядають невеликими, але коефіцієнти все ще виглядають великими. Ваш числовий приклад дуже вагомий. Мені спокуса додати щось про стійкість оцінок під нульовою гіпотезою. Для деяких це може бути занадто технічно, але на її рівні витонченості, можливо, немає. Припустимо, у двох популяцій номінальний розподіл означає нуль і відому загальну дисперсію. Тоді нормалізована різниця становить N (0,1) під нульовим гітезом, що дає дуже стабільну статистику тесту.
Майкл Р. Черник

1
Але за цими припущеннями співвідношення має розподіл Коші і може бути дуже великим. Можливо, цей аргумент потребує модифікації, оскільки рівень захворюваності повинен бути позитивним і, можливо, розподіл дуже спотворений. Я думаю, що я хочу приклад, який показує, що різниця має дуже стабільний розподіл, а співвідношення не особливо, тому що розмір вибірки невеликий, а знаменник може бути дуже близьким до 0. Хтось отримав хороший наочний приклад?
Майкл Р. Черник

@Peter Ви мали на увазі написати три s не два? Якщо так, ви могли б визначити свою нотацію? pi
onestop

Я думаю, що він мав на увазі р1, коли писав p0. Просто основна помилка. Мати три ps в цьому контексті не має сенсу.
Майкл Р. Черник

1
Я зробив зміну для Пітера. Кричи на мене, якщо я щось зробив не так!
Майкл Р. Черник

6

Зверніть увагу, що в обох тестах ви перевіряєте зовсім іншу гіпотезу з різними припущеннями. Результати не порівнянні, і це занадто поширена помилка.

За абсолютного ризику ви перевіряєте, чи різниться середня різниця пропорцій від нуля. Основна гіпотеза стандартного тесту для цього передбачає, що різниці пропорцій зазвичай розподіляються. Це може стосуватися невеликих розмірів, але не для великих. Технічно ви обчислюєте таку умовну ймовірність:

P(p1p2=0|X)

з і дві пропорції, а ваша пояснювальна змінна. Це еквівалентно тестуванню нахилу наступної моделі:p1p2Xb

p=a+bX+ϵ

де ви припускаєте, що .ϵN(0,σ)

При відносному ризику ви робите щось зовсім інше. Ви перевірити шанси мати позитивний результат , заснований на що пояснює змінної . Отже, ви обчислюєтеX

P(log(p1p2)=0|X)

що еквівалентно тестуванню нахилу в наступній логістичній моделі:

log(p1p)=a+bX+ϵ

при цьому є журналом шансів. Зауважте, що ця гіпотеза формулюється з точки зору шансів, а не пропорцій! Тож припущення моделі також формулюються з точки зору шансів (а точніше - журналу шансів). Ви перевіряєте іншу гіпотезу.log(p1p)

Причина, чому це має значення, наведена у відповіді Пітера Флома: невелика різниця в абсолютних ризиках може призвести до значного значення шансів. Тож у вашому випадку це означає, що частка людей, які перенесли хворобу, не суттєво відрізняється, але шанси перебувати в одній групі значно більше, ніж шанси перебування в іншій групі. Це цілком розумно.


1
Я думаю, що всі ми поки що погоджуємось, що головна причина проблеми полягає в тому, що невеликі відмінності в абсолютному ризику можуть призвести до великих відмінностей у відносному ризику. Адже .2 до 1 має такий же відносний ризик, що і від 0,0002 до 0,0001. Я думаю, що це те послання, яке ми можемо принести додому до непрацівника. Ваше пояснення є чудовим для статистиків, але я не впевнений, що його неважко зрозуміти непрофесіоналам, і можна сказати: «Що робити, якщо ви перевіряєте іншу гіпотезу.
Майкл Р. Черник

Ви все ще намагаєтеся визначити, де ставки відрізняються чи ні. Тож хоча гіпотези різні, результати мають бути послідовними. Зрештою, p1-p2 = 0 - це те саме, що p1 / p2 = 1. "Тому я думаю, що факт, що гіпотези різні, пропускає суть, і це не є задовільним поясненням.
Майкл Р. Черник

@MichaelChernick Я збирався сказати, що різниці пропорцій є умовними, а коефіцієнт шансів - ні. Але це не так, обидва дають абсолютно однаковий результат після перенесення таблиці (у випадку таблиці 2X2). Я виконував деякі симуляції, але я не можу змусити р-значень prop.test(або chisq.testяк це еквівалентно у випадку 2х2) і fisher.testбути більше 0,005. Тож мені цікаво, які тести вона використовувала ...
Joris Meys

Це був би чи квадрат, чи тест Фішера. Найімовірніше, тест Фішера, оскільки вона знає в невеликих зразках, що наближення квадратика чі не є гарним. Коли я роблю статистику для них, я використовую SAS. Вона робила свою роботу за допомогою STATA. Я, мабуть, можу викопати фактичну таблицю.
Майкл Р. Черник

2
Один додатковий розгляд, оскільки ми розбираємося в цьому: який явно відрізняється від і він відрізняється точніше, коли p невеликі - тобто ризик невеликий. Але я намагався якнайшвидше зберегти свою першу відповідь (це максимально просто !)p1-p0log(p1p0)=log(p1)log(p0)p1p0
Пітер Флом - Відновити Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.