Регресія Пуассона для оцінки відносного ризику для бінарних результатів


42

Стислий підсумок

Чому частіше застосовується логістична регресія (з коефіцієнтом шансів) у когортних дослідженнях з бінарними результатами, на відміну від регресії Пуассона (з відносними ризиками)?

Фон

На моєму досвіді курси статистики та епідеміології бакалавратів та випускників, як показує мій досвід, зазвичай вчать, що логістичну регресію слід використовувати для моделювання даних з бінарними результатами, а оцінки ризиків повідомляються як коефіцієнт шансів.

Однак регресія Пуассона (і пов'язана з цим: квазі-Пуассон, негативний біноміал тощо) також може бути використана для моделювання даних з бінарними результатами і за допомогою відповідних методів (наприклад, надійного оцінювача дисперсії сендвіч) вона надає дійсні оцінки ризику та рівня довіри. Наприклад,

З регресії Пуассона можна повідомити про відносні ризики, які, як стверджують деякі, простіше інтерпретувати порівняно з коефіцієнтами шансів, особливо для частих результатів, і особливо для осіб, які не мають сильної статистики. Див. Чжан Дж. Та Ю. К. Ф. Що таке відносний ризик? Метод корекції коефіцієнта шансів у когортних дослідженнях загальних результатів , JAMA. 1998. 18 листопада; 280 (19): 1690-1.

Якщо читати медичну літературу, серед когортних досліджень з бінарними результатами здається, що все-таки набагато частіше повідомляти про коефіцієнти шансів від логістичних регресій, а не про відносні ризики регресії Пуассона.

Запитання

Для когортних досліджень з бінарними результатами:

  1. Чи є вагомі підстави повідомляти про коефіцієнти шансів від логістичних регресій, а не про відносні ризики від регресій Пуассона?
  2. Якщо ні, то чи можна частоту регресій Пуассона з відносними ризиками в медичній літературі віднести здебільшого до відставання між методологічною теорією та практикою серед вчених, клініцистів, статистиків та епідеміологів?
  3. Чи повинні проміжні курси статистики та епідеміології включати більше обговорення регресії Пуассона для отримання бінарних результатів?
  4. Чи слід заохочувати студентів та колег вважати регресію Пуассона над логістичною регресією, коли це доречно?

Якщо ви хочете відносного ризику, чому б ви не просто використовували біноміальну регресію з логічним (а не логістичним) посиланням? Середньо-дисперсійне співвідношення сімейства Пуассонів не має великого сенсу, якщо ви зумовили кількість можливих подій на спостереження.
Ендрю М

@AndrewM Як би ви застосували біноміальну регресію з посиланням на журнал? Позитивні значення регресора означатимуть значення ймовірності, що перевищують 1.
Руфо

[0,1]

@AndrewM Так, я лінійний прогноктор, дякую :). Але навіть коли вам вдається реалізувати модель, я не впевнений, що вона адекватна. Як я вказую в коментарі в першій відповіді, якщо ви поміняєте місцями 0 на 1 і навпаки на змінну відповіді, оскільки посилання журналу не симетричне приблизно 0,5, оцінки відносних ризиків різні ( exp(beta_M1) =/= 1/exp(beta_M2)). Це мене зовсім непокоїть.
Руфо

1
П(Y|Х)/П(Y|Хc)П(Y|Х)/П(Y|Хc)П(Yc|Х)/П(Yc|Хc)

Відповіді:


28

Відповідь на всі чотири ваші запитання, попередні приміткою:

Насправді не все так часто зустрічається в сучасних епідеміологічних дослідженнях, щоб повідомити коефіцієнт шансів від логістичної регресії для когортного дослідження. Це залишається регресійною методикою вибору для дослідження випадків контролю, але більш досконалі методи зараз фактично є еталоном для аналізу у великих журналах з епідеміології , таких як Epidemiology , AJE або IJE. Збільшується тенденція до їх появи у клінічних журналах, що повідомляють результати спостережних досліджень. Існують також деякі проблеми, оскільки регресія Пуассона може використовуватися в двох контекстах: те, про що йдеться, де це заміна моделі біноміальної регресії, і в контексті часу до події, що надзвичайно часто для когорти дослідження. Більш детально у відповіді на це питання:

  1. Для когортного дослідження насправді немає. Є деякі надзвичайно специфічні випадки, коли, скажімо, може бути використана кусково-логістична модель, але це екслігери. Вся суть когортного дослідження полягає в тому, що ви можете безпосередньо виміряти відносний ризик або багато пов'язаних із цим заходів, і не потрібно покладатися на коефіцієнт шансів. Однак я зроблю дві примітки: регресія Пуассона часто оцінює показник, не є ризиком, і, таким чином, оцінка ефекту від нього часто буде відзначатися як коефіцієнт швидкості (головним чином, на мій погляд, тому ви все одно можете скоротити його RR) або коефіцієнт щільності захворюваності (IRR або IDR). Тож переконайтесь, що у своєму пошуку ви справді шукаєте правильні терміни: існує багато когортних досліджень, що використовують методи аналізу виживання. Для цих досліджень регресія Пуассона робить деякі припущення, які є проблематичними, зокрема, що небезпека є постійною. Як таке, набагато частіше аналізувати когортне дослідження, використовуючи моделі пропорційних ризиків Кокса, а не моделі Пуассона, та повідомляти про що випливає з ним коефіцієнт небезпеки (HR). Якщо натиснути, щоб назвати метод "за замовчуванням", за допомогою якого аналізувати когорту, я б сказав, що в епідеміології насправді переважає модель Кокса. У цього є свої проблеми, і деякі дуже хороші епідеміологи хотіли б це змінити,

  2. Є дві речі, до яких я можу віднести нечастоту - нечастота, яку я не обов'язково думаю, що існує в тій мірі, яку ви пропонуєте. Перше - так - "епідеміологія" як сфера не зовсім закрита, і ви отримуєте величезну кількість паперів від клініцистів, соціологів тощо, а також епідеміологів різного статистичного походження. Логістична модель зазвичай викладається, і з мого досвіду багато дослідників звернуться до звичного інструменту над кращим інструментом.

    Друге - це фактично питання про те, що ви маєте на увазі під «когортним» вивченням. Щось на зразок моделі Кокса чи моделі Пуассона потрібна реальна оцінка часу та часу людини. Можна отримати когортне дослідження, яке слідкує за дещо закритим населенням на певний період - особливо на ранніх прикладах "Вступ до Епі", де методи виживання, такі як моделі Пуассона чи Кокса, не настільки корисні. Логістична модель можеслід використовувати для оцінки коефіцієнта шансів, який при достатньо низькій поширеності захворювання наближає відносний ризик. Інші методи регресії, які безпосередньо оцінюють її, як біноміальна регресія, мають проблеми конвергенції, які легко можуть зірвати нового учня. Пам'ятайте, що документи, про які ви цитуєте, обидва використовують метод регресії Пуассона, щоб вирішити питання конвергенції біноміальної регресії. Але відповідні біномальні когортні дослідження - це насправді невеликий шматочок "пирога когортного дослідження".

  3. Так. Відверто кажучи, методи аналізу виживання повинні бути запропоновані раніше, ніж часто. Моя теорія домашніх улюбленців полягає в тому, що причина цього не в тому, що такі методи, як логістична регресія, легше кодувати . Методи, які простіше кодувати, але мають набагато більші застереження щодо обґрунтованості оцінок їх ефекту, викладаються як "базовий" стандарт, що є проблемою.

  4. Вам слід заохочувати учнів та колег використовувати відповідний інструмент. Взагалі для цієї галузі, я думаю, вам, мабуть, буде краще запропонувати розглянути модель Кокса щодо регресії Пуассона, оскільки більшість рецензентів швидко (і повинні) викликати побоювання щодо припущення постійної небезпеки. Але так, чим швидше ви зможете їх відійти від "Як я вдягну своє питання в модель логістичної регресії?" тим краще нам буде все. Але так, якщо ви дивитесь на дослідження без часу, студентів слід ознайомити як з біноміальною регресією, так і з альтернативними підходами, як, наприклад, пуассонова регресія, які можна використовувати у випадку проблем конвергенції.


Якщо ви говорите про інші методи регресії, які безпосередньо оцінюють її [відносний ризик, я вважаю], як біноміальна регресія, є проблеми конвергенції [...] , як би ви застосували біноміальну регресію, щоб вона створювала відносний ризик? @AndrewM пропонує посилання на журнал, але я не розумію, як би ви уникнули проблеми з оцінкою ймовірності успіху вище 1.
Rufo

@Rufo Біноміальна модель з логістичним зв’язком при роботі на когорті оцінить відносний ризик. Те, що іноді ці моделі оцінюють ймовірність більше 1, справді є однією з причин, що біноміальні моделі важче реалізувати, ніж ідеально. Але мені вдалося їх використовувати - корисно, що у ваших даних часто є ймовірності набагато нижче 1, тому модель може ніколи не закінчитися проблемою, яка вас хвилює.
Фоміт

p

9

Я надто міркую над поширеністю логістичних моделей у літературі, коли модель відносного ризику була б більш доречною. Ми, як статистики, надто добре знайомі з дотриманням конвенції або дотриманням аналізу "спадного меню". Вони створюють набагато більше проблем, ніж вони вирішують. Логістична регресія викладається як "стандартний інструмент" для аналізу бінарних результатів, коли людина має результат "так / ні", наприклад, смерть або втрата працездатності.

Регресія Пуассона часто навчається як метод аналізу підрахунків . Дещо підкреслено, що така модель ймовірності працює надзвичайно добре для моделювання результатів 0/1, особливо коли вони рідкісні. Однак логістична модель також добре застосовується з рідкісними результатами: коефіцієнт шансів приблизно є коефіцієнтом ризику, навіть із вибіркою, залежною від результатів, як і з дослідженнями випадків контролю. Те ж саме не можна сказати щодо моделей відносного ризику чи Пуассона.

Модель пуассона також корисна, коли люди можуть мати "результат" не один раз, і вас можуть зацікавити кумулятивні захворювання, такі як спалахи герпесу, госпіталізація або рак молочної залози. З цієї причини коефіцієнти експоненції можна інтерпретувати як відносні ставки . Щоб враховувати різницю між ставками та ризиками: Якщо на 1000 осіб-років є 100 випадків, але всі 100 випадків траплялися в одній людині, частота (показник) все ще становить 1 випадок на 10 осіб-років. В умовах надання медичної допомоги все ще потрібно лікувати 100 випадків, а щеплення 80% людей має 80% зниження захворюваності (апріорі). Однак ризик принаймні одного результату становить 1/1000. Характер результату та питання разом визначають, яка модель підходить.

вар(у)=Е(у)(1-Е(у))

Я розумію, що якщо науковий інтерес полягає у оцінці відносних показників, існує гібридна модель: відносна регресія ризику, яка є ГЛМ, використовуючи структуру логістичної дисперсії та середню структуру Пуассона. Тобто: журнал(Е[Y|Х])=β0+β1Хвар(Y)=Е[Y](1-Е[Y])

До речі, стаття Чжан дає упереджену оцінку умовиводу, засновану на відносній оцінці ризику, яка не враховує змінності в терміні перехоплення. Ви можете виправити оцінювач шляхом завантаження.

Щоб відповісти на конкретні запитання:

  1. Якщо результат рідкісний, вони приблизно однакові. Якщо результат є загальним, відхилення оцінки відносної ставки від Пуассона можуть бути надмірно завищеними, і ми можемо віддавати перевагу коефіцієнту шансів як упередженій, але ефективної оцінки зв'язку між бінарним результатом та кількома експозиціями. Я також вважаю, що дослідження контрольних випадків виправдовують використання коефіцієнта шансів як міри, які не змінюються залежно від результатів вибірки. Скотт і Дикий 97 обговорюють методи навколо цього. Звичайно, інші журнали, можливо, не мають спеціалізованих статистичних рецензентів.

2.3. Я думаю, що ви звинувачуєте і припускаєте, що багато чого відбувається в медичному огляді та вчених.

  1. Ви завжди повинні заохочувати своїх учнів використовувати відповідні моделі, коли це можливо.

http://biostats.bepress.com/cgi/viewcontent.cgi?article=1128&context=uwbiostat


2
"Я розумію, що якщо науковий інтерес полягає у оцінці відносних показників, існує гібридна модель: відносна регресія ризику, яка є ГЛМ, використовуючи структуру логістичної дисперсії та середню структуру пуассона": Також відома як біноміальна регресія з посиланням на журнал.
Ендрю М

2
@AndrewM Дійсно. Насправді я думаю, що це краща мова. Дякуємо, що вказали на це. Я відредагував питання, щоб включити посилання на робочий документ від Томаса Ломлі, який підкреслює, що модель Пуассона є "робочою моделлю", оскільки це неправильне припущення середньо-відхилення.
AdamO

Що ви маєте на увазі під назвою "Якщо результат рідкісний, вони приблизно однакові"? Який максимальний відсоток "рідкісного" результату для використання АБО замість RR для оцінки поширеності?
vasili111

1
@ vasili111 - це гаряча дискусія з чіткою відповіддю. Сьогодні ви бачите багато критики людей, які роблять «рідкісне» припущення, коли частота випадків була зовсім не такою рідкісною, як, наприклад, більше 1/30. А з багатоваріантними моделями все що завгодно!
AdamO
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.