Звітування про результати логістичної регресії


13

У мене є такий результат регресії логістики:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   0.5716     0.1734   3.297 0.000978 ***
R1           -0.4662     0.2183  -2.136 0.032697 *  
R2           -0.5270     0.2590  -2.035 0.041898 *  

Чи доцільно повідомити про це наступним чином:

Бета-коефіцієнт, коефіцієнт коефіцієнта, значення Zvalue, P. Якщо так, то як я можу отримати коефіцієнт коефіцієнта?


Відповіді:


9

Пропоновані вами звіти для таблиці виглядають розумними, хоча значення z та p-значення є зайвими. У багатьох знайомих мені журналах взагалі не повідомляється z-value / p-value, а лише використовуються зірочки для повідомлення статистичної значущості. Я також бачив логістичні таблиці лише з наведеними коефіцієнтами непарності, хоча я особисто віддаю перевагу як коефіцієнтам коефіцієнта журналу, так і коефіцієнтам шансів, якщо простір дозволяє в таблиці.

Але різні місця можуть мати різні посібники щодо процедур звітування, тому очікуване може відрізнятися. Якщо я надсилаю газету до журналу, я часто бачу, як інші недавні газети складають свої таблиці і просто імітують їх. Якщо це ваш власний особистий папір, запитання до того, хто може переглядати, було б розумним проханням. Як я вже згадував вище, обмеження місця в деяких майданчиках може заважати вам повідомляти в кінцевому підсумку зайву інформацію (наприклад, як коефіцієнт коефіцієнта журналу та коефіцієнт шансів). Деякі місця можуть змусити вас повідомляти результати повністю у тексті!

Існує також питання про те, які ще зразки моделей потрібно звітувати. Хоча в багатьох журналах, з якими я знайомий, часто повідомляються про значення псевдо , ось на сайті розміщена тема, в якій обговорюються слабкі сторони різних заходів. Я особисто вважаю за краще звітувати про класифікаційні тарифи, але, знову ж таки, підозрюю, що це змінюється залежно від місця (я можу уявити, що деякі журнали спеціально вимагають повідомити про один із псевдозалежних заходів ).R 2R2R2

Для отримання коефіцієнта непарності просто експонентуйте коефіцієнт регресії (тобто візьміть де основа природного логарифму, а - розрахунковий коефіцієнт логістичної регресії.) Хороша здогадка будь-якою статистичною мовою для її обчислення . е βеβ^еβ^exp(coefficient)

Також на замітку, хоча це сьогодні прийнята відповідь, Лейон і Френк Гаррелл дають дуже корисні поради. Хоча, як правило, завжди хочеться, щоб статистичні дані у запитанні десь були подані, інші відповіді на поради щодо інших заходів є корисними способами оцінки розмірів ефекту щодо інших оцінених ефектів у моделі. Графічні процедури також корисні для вивчення відносних розмірів ефектів і див. Ці два документи про перетворення таблиць у графіки як приклади ( Kastellec & Leoni, 2007 ; Gelman et al., 2002 )


Посилання "Kastellec & Leoni, 2007" розірвано, але ось приклад з тієї ж папери з кодом.
ACNB

11

Відповідь на це питання може залежати від вашого дисциплінарного походження.

Ось деякі загальні міркування.

Бета-версію в логістичній регресії досить важко інтерпретувати безпосередньо. Таким чином, явне повідомлення про них є лише дуже обмеженим. Ви повинні дотримуватися коефіцієнтів шансів або навіть граничних ефектів. Граничний ефект змінної x є похідною від ймовірності того, що ваші залежні змінні рівні 1, відносно x. Цей спосіб представлення результатів дуже популярний серед економістів. Особисто я вважаю, що граничні наслідки миряни легше розуміють (але не лише вони ...), ніж коефіцієнти шансів.

Ще одна цікава можливість - використання графічних дисплеїв. Місце, де ви знайдете кілька ілюстрацій такого підходу, - це книга Гельмана та Хілла . Я вважаю це навіть кращим, ніж повідомлення про граничні ефекти.

Щодо питання про те, як отримати коефіцієнт шансів, ось як це зробити в R:

model <- glm(y ~ x1 + x2, family=binomial("logit"))
oddrat <- exp(coef(model))

Чи є у вас приклади перетворення оцінок граничного ефекту в таблиці (або конкретні посилання на сторінки у Гельмана та Хілла?)
Andy W

1
Гельман і Хілл насправді не використовують граничні ефекти, а скоріше графіки, що базуються на прогнозованих ймовірностях. Погляньте на п'яту главу, починаючи зі сторінки 79.

10

Це лише в окремих випадках, коли коефіцієнти та їх анти-журнали (коефіцієнти шансів) є хорошими підсумками. Це коли лінійні зв’язки лінійні і є один коефіцієнт, пов'язаний з предиктором, і коли зміна однієї одиниці є хорошою основою для обчислення коефіцієнта шансів (більше ОК для віку, не стільки для показників білої крові, що мають діапазон 500-100 000). Взагалі, корисні речі, такі як коефіцієнт шансів між квартальним діапазоном. Детальніше про це я маю на http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf, і rmsпакет R робить це все автоматично (обробка нелінійних термінів та взаємодій, обчислення квартілів X, тощо).


5

Це, мабуть, залежить від вашої аудиторії та дисципліни. Відповідь нижче - те, що зазвичай робиться для журналів епідеміології та в меншій мірі медичних журналів.

Щоб бути тупими, нас не хвилює значення p. Якщо серйозно, ми цього не робимо. Епідеміологія навіть не дозволить вам повідомити про них, якщо у вас є справді, дуже гостра потреба, і поле по суті слідує відповідності.

Ми можемо навіть не перейматися бета-оцінками, залежно від питання. Якщо ваш звіт орієнтований на щось більш методологічне чи імітаційне, я б, мабуть, повідомив про бета-оцінку та стандартну помилку. Якщо ви намагаєтеся повідомити про ефект, який оцінюється в чисельності населення, я б дотримувався коефіцієнта шансів і 95% довірчого інтервалу. Це м'ясо вашої оцінки, і що читачі в цій галузі будуть шукати.

Вище були розміщені відповіді про те, як отримати коефіцієнт шансів, але для ІЛИ та 95% ІС:

OR = exp(beta)
95% CI = exp(beta +/- 1.96*std error)

дякую за відповідь! чи можу я запитати, що означає 1,96 у розрахунку?
upabove

1
Немає проблем :) Довірчий інтервал 95% - це проміжок, який повинен охоплювати приблизно від 2,5-го перцентилету до 97,5-го перцентиля нормального розподілу вашої бета-оцінки. Кожна з цих точок становить приблизно 1,96 стандартних відхилень від середнього значення (у цьому випадку бета).
Фоміт

так, але чи варто робити це для кожного бета-коефіцієнта? також змінюється 1,96? також це двочленні дані, це все ще засноване на нормальному розподілі?
upabove

2
Так - для кожного бета-коефіцієнта можна отримати коефіцієнт шансів і 95% -ний межа довіри. 1,96 не зміниться, якщо ви не хочете обчислити інший перцентиль для довірчого інтервалу (90%, 99% тощо), але оскільки 95% є стандартними, робити це не потрібно. І поки ви працюєте за шкалою журналу, параметри моделі логістичної регресії зазвичай розподіляються. Як тільки ви їх експонуєте, це перестає бути правдою.
Фоміт
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.