Логістична регресія та перегин


11

У нас є дані з бінарним результатом і деякими коваріатами. Я використовував логістичну регресію для моделювання даних. Просто простий аналіз, нічого надзвичайного. Кінцевим результатом має бути крива доза-відповідь, де ми показуємо, як змінюється ймовірність для конкретного коваріату. Щось на зразок цього:

введіть тут опис зображення

Ми отримали певну критику від внутрішнього рецензента (не чистого статистичного персонажа) за вибір логістичної регресії. Логістична регресія передбачає (або визначає), що точка перегину кривої S у формі шкали ймовірності становить вірогідність 0,5. Він стверджував, що не було б причин вважати, що точка перегину дійсно є ймовірністю 0,5, і ми повинні вибрати іншу модель регресії, яка дозволяє точці перегину змінюватись так, що фактична позиція визначається на основі даних.

Спочатку мене зловили його аргументи, оскільки я ніколи не замислювався над цим питанням. У мене не було аргументів, чому було б обґрунтовано вважати, що точка перегину становить 0,5. Провівши деякі дослідження, я все ще не маю відповіді на це питання.

Я зіткнувся з 5-параметричною логістичною регресією, для якої точка перегину є додатковим параметром, але, здається, ця модель регресії зазвичай використовується при формуванні кривих доза-відповідь з постійним результатом. Я не впевнений, чи можна і як це можна поширити на змінні бінарних відповідей.

Я думаю, моє головне питання - чому або коли нормально вважати, що точка перегину для логістичної регресії дорівнює 0,5? Це навіть має значення? Я ніколи не бачив, щоб хтось відповідав на логістичну регресійну модель і явно обговорював питання точки перегину. Чи існують альтернативи для створення кривої реакції на дозу, де точка перегину не обов'язково становить 0,5?

Просто для повноти - код R для створення наведеної картини:

dat <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")
dat$rank <- factor(dat$rank)
logit <- glm(admit ~ gre + gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,ylab="Probability", xlab="Dose")

Редагувати 1:

На додаток до того, що Скортчі сказав в одному з коментарів: Рецензент дійсно стверджував, що біологічно може бути ймовірніше, що зміна кривизни відбудеться раніше ніж на 0,5. Тому його опір проти припущення, що точка перегину знаходиться на рівні 0,5.

Редагувати 2:

Як реакція на коментар Френка Харрелла:

Наприклад, я змінив свою модель вище, щоб включити квадратичний і кубічний термін gre(що є "дозою" в цьому прикладі).

logit <- glm(admit ~ gre+I(gre^2)+I(gre^3)+  gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(admit=1, gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,xlim=c(-2000,4000),ylab="Probability", xlab="Dose")

введіть тут опис зображення

Незважаючи на те, що greв цьому випадку, мабуть, не має сенсу додавати квадратичний і кубічний термін, ми бачимо, що форма кривої дози та відповіді змінилася. Дійсно, зараз ми маємо дві точки перегину приблизно в 0,25 і близько 0,7.


2
Хіба це не те саме, що просити дослідити нелінійні зв’язки предикторів з логічними шансами відповіді?
Scortchi

Відповіді:


8

Як зачіпав @scortchi, рецензент працював під хибним враженням, що неможливо моделювати нелінійні ефекти прогнокторів на шкалі logit в контексті логістичної регресії. Оригінальна модель швидко припустила лінійність усіх прогнозів. Розслабляючи припущення про лінійність, використовуючи, наприклад, обмежені кубічні сплайни (природні сплайни), вся форма кривої є гнучкою, і точка перегину вже не є проблемою. Якби був один прогноктор і було б його розширено за допомогою регресійного сплайна, можна сказати, що логістична модель передбачає лише припущення про гладкості та незалежності спостережень.


Я мушу визнати, що я не дуже знайомий з регресією сплайну. Як би я тому робив це разом з логістичною регресією (в R). Я змінив своє початкове повідомлення (редагування 2), щоб включити поліноміальні терміни в предиктор. Чи можу я використати це як альтернативу для згладжування сплайну. Звичайно, я не маю такої ж гнучкості, яку я би мав із сплайнами.
Франциск

1
@Franco: власні стратегії регресійного моделювання Франка Харрелла - книга , веб-сайт , пакет R - повинні змусити вас йти. Короткий обговорення деяких з переваг регресії сплайнів тут ; але ви праві, звичайно, що поліноми є альтернативою.
Scortchi

4

Мені здається, що рецензент просто шукав щось сказати. Перш ніж вивчити такі особливості специфікації, як точка передбачуваного перегину, існує низка припущень, які ми зробили, щоб дійти до оцінної моделі. Все можна поставити під сумнів і обговорити - використання логістичної функції, яка є можливою первинною ціллю: хто сказав нам, що умовний розподіл основного терміна помилки є логістичним? Ніхто.

Отже, питання полягає в тому, що означає зміна кривизни? Наскільки важливим для досліджуваного явища реального світу може бути точка, в якій відбувається ця зміна кривизни, щоб ми могли розглянути можливість її «керування даними»? Віддаляючись від принципу парситу?

Питання не в тому, "чому точка перегину повинна бути 0,5?" Але "наскільки це може бути оманливим для наших висновків, якщо він залишиться в 0,5?".


2
Це здається трохи невигідним. Ми не знаємо, що рецензент не мав вагомих причин оскаржувати це припущення, а не інші, які він міг оскаржити. Залиште в один бік дивний спосіб його викладення в точці перегину, і можливе неправильне уявлення про логістичну регресію, і він, в основному, запитує, чому модель дозволяє зсунути криву і розтягнутись, але не зігнутися, що цілком може заслуговувати на відповідь.
Scortchi

@Scortchi "дивний спосіб його викладати" ... "можливе помилкове уявлення про логістичну регресію" ... Якщо саме це потрібно для раціоналізації критики рецензента, він не повинен був переглянути реферат.
Алекос Пападопулос

1
Як і у @Scortchi, я вважаю це занадто гострим. У багатьох більш активних людей тут є досвід різних наук, а не основної статистики. Бути статистиком, чистим чи іншим, не є ані важливим, ані достатнім, щоб дати гарну пораду (хоча майже у всіх випадках це явно допоможе).
Нік Кокс

@Nick Cox Я приймаю "різкість", і я просто видалив своє останнє речення, як знак консенсусу. Моя думка полягає в тому, що питання в загальному вигляді припущення про модель не має значення - моделі завжди хибні. Отже, якщо ймовірність зміни кривизни якимось чином є критичною для досліджуваного явища реального світу, тоді рецензент дійсно мав рацію запитати, що цей пункт стає керованим даними. Але якщо рецензент просто прокоментував "чому при p = 0,5, а не в іншому місці?", Цей коментар не є конструктивним.
Алекос Пападопулос

2
Дякую за це Я погоджуюся з вашою загальною позицією: (a) обговорення достоїнств різних підходів та (b) обговорення того, як ми повинні обговорити ці, і те і те, і це справедлива гра. Зауваження щодо окремих людей або навіть груп, навпаки, не є корисними (хоча я теж іноді переживаю межу в роздратованості ...).
Нік Кокс

0

У mho, логіт регресія є розумним вибором для відповіді на дозу. Звичайно, ви можете використовувати probit, log-log, c-log-log посилання та порівнювати корисність придатності (DEV, BIC, CAIC тощо). Але найпростіша логітна регресія дає комфортну формальну оцінку точки перегину LD50 = -b0 / b1. Ми пам’ятаємо, що це конкретний момент, для якого ми отримуємо мінімальну невизначеність (пор., LD16, LD84 та будь-які інші будуть мати ширший ІС, див. «Пробіт-аналіз» Фінні, 1947, 1977). завжди (?) краще було використовувати логарифм дози, а потім просто перетворити 95% ІС у вихідну шкалу. Яка природа інших коваріатів у моделі? Я натякаю на можливість використовувати мультимодельний підхід ... Безумовно, сплайни гнучкі, але формальні параметри інтерпретуються простіше!

Дивіться http://www.epa.gov/ncea/bmds/bmds_training/software/overp.htm


0

Точка перегину 0,5 є невеликою частиною більшого питання: логічне рівняння за побудовою симетричне. І в більшості його похідних модельований ефект має причину бути симетричним. наприклад, коли один гравець виграє, інший гравець програє, або ефект, що відповідає за насичення, - це той самий фізичний ефект, що відповідає за початковий ріст тощо. Отже, якщо є причина, чому походження поведінки з низьким рівнем X має те саме походження оскільки поведінка справедливої ​​руки або з будь-якої іншої причини проблема симетрична, то ви маєте своє обгрунтування.

якщо ні, можливо, наступною найпростішою моделлю є узагальнене логістичне рівняння. у нього більше параметрів, і ви можете додати обмеження, щоб вони не були усіма вільними параметрами. це, мабуть, більш бажано, ніж додані вами помилки, оскільки вони додають полиці, де перша похідна коливається вперед і назад - така річ має тенденцію створювати вигадані помилкові точки локальної рівноваги, якщо ви намагаєтесь оптимізувати деяке значення очікування цього розповсюдження. узагальнена форма порушить симетрію, але плавно.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.