Чи є функціональна різниця між коефіцієнтом шансів і коефіцієнтом небезпеки?


10

У логістичній регресії коефіцієнт шансів 2 означає, що подія в 2 рази більш вірогідна, якщо врахувати прогноз на один одиницю. У регресії Кокса коефіцієнт небезпеки 2 означає, що подія відбуватиметься вдвічі частіше в кожний момент часу, враховуючи прогнозування на один одиницю. Це практично не те саме?

У чому ж тоді перевага при регресії Кокса та отриманні коефіцієнтів небезпеки, якщо ми можемо отримати функціонально ту саму інформацію з коефіцієнта шансів логістичної регресії?

Відповіді:


12

коефіцієнт шансів 2 означає, що подія в 2 рази більш вірогідна, враховуючи прогнозування прогнозу на одну одиницю

Це означає, що шанси збільшаться вдвічі, що не збігається з подвоєнням ймовірності.

У регресії Кокса коефіцієнт небезпеки 2 означає, що подія відбуватиметься вдвічі частіше в кожний момент часу, враховуючи прогнозування на один одиницю.

Окрім трохи рукоділля, так - частота зустрічається вдвічі. Це як масштабна миттєва ймовірність.

Це практично не те саме?

Вони майже однакові, коли подвоєння шансів події майже те саме, що подвоєння небезпеки події. Вони не схожі автоматично, але за деяких (досить поширених) обставин вони можуть дуже тісно відповідати.

Ви можете розглянути різницю між шансами та ймовірністю більш ретельно.

Дивіться, наприклад, перше речення тут , з якого чітко видно, що шанси - це відношення ймовірності до його доповнення. Так, наприклад, збільшення шансів (на користь) з 1 до 2 - це те саме, що ймовірність, що збільшується від12 до 23. Коефіцієнти збільшуються швидше, ніж збільшується ймовірність. Для дуже малих ймовірностей шанси на користь та ймовірність дуже схожі, тоді як шанси проти проти стають все більш схожими на (у тому сенсі, що співвідношення піде на 1), зворотні ймовірності, оскільки ймовірність стає невеликою. Коефіцієнт шансів - це просто співвідношення двох комплектів шансів. Збільшення коефіцієнта шансів при утриманні постійної базової коефіцієнта відповідає збільшенню інших шансів, але може бути або не бути подібною до відносної зміни ймовірності.

Ви також можете задуматися про різницю між небезпекою та ймовірністю (див. Мою попередню дискусію, де я згадую про махання рукою; зараз ми не забуваємо про різницю). Наприклад, якщо ймовірність дорівнює 0,6, ви не можете її подвоїти - але миттєву небезпеку 0,6 можна подвоїти до 1,2. Вони не те саме, що щільність ймовірності не є ймовірністю.


2
+1 Лише коментуючи зазначення, що деякі форми аналізу історії подій використовують інше визначення функції небезпеки (наприклад, год(т) у дискретних моделях історії подій у часі - це ймовірність події, яка відбудеться в той час т обумовлене тим, що не відбулося до того часу, і як таке 2×0,6не було б сенсу в таких моделях).
Олексій

1
Дякую, це безумовно актуально. Це пов'язано з тим, що дискретний pmf ніде не може перевищувати 1, тоді як щільність однозначно може.
Glen_b -Встановити Моніку

3

Це гарне запитання. Але те, що ви насправді запитуєте, має бути не в тому, як трактується статистика, а в тому, які припущення лежать в основі кожної вашої моделі (небезпека чи логістика). Логістична модель - це статична модель, яка ефективно прогнозує ймовірність того, що подія відбудеться в певний час із заданою спостережуваною інформацією. Однак модель небезпеки або модель Кокса - це модель тривалості, яка моделює показники виживання з часом. Ви можете задати запитання на кшталт "яка ймовірність того, що споживач сигарет виживе до 75-річного віку, порівняно з тим, що не має споживач з вашою логістичною регресією" (враховуючи, що у вас є інформація про смертність для когорти до 75 років) . Але якщо замість цього ви хочете скористатися повнотою часового виміру своїх даних, то використання моделі небезпеки буде більш доцільним.

Зрештою, хоча це дійсно зводиться до того, що ви хочете моделювати. Чи вірите ви, що ви моделюєте, це разова подія? Використовуйте логістичний. Якщо ви вважаєте, що ваша подія має фіксований або пропорційний шанс виникнення кожного періоду протягом спостережуваного часового спектру? Використовуйте модель небезпеки.

Методи вибору не повинні базуватися на тому, як ви інтерпретуєте статистику. Якби це було, тоді різниці між OLS, LAD, Tobit, Heckit, IV, 2SLS або низкою інших методів регресії не було б. Натомість слід базуватися на тій формі, на яку ви вважаєте, що лежить в основі основної моделі, яку ви намагаєтеся оцінити.


-1 (Змішані) логістичні моделі, безумовно, можуть моделювати коефіцієнти виживання з часом. Див. Наприклад Allison, PD (1982). Методи дискретного часу для аналізу історії подій . Соціологічна методологія , 13 (1982), 61–98, або Еллісон, PD (1984). Аналіз історії подій: Регресія для даних про поздовжні події (т. 12). Сейдж Беверлі-Хіллз, Каліфорнія.
Олексій
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.