Логістична регресія та порядкові незалежні змінні


10

Я знайшов цю публікацію:

Так. Коефіцієнт відображає зміну коефіцієнтів журналу для кожного приросту зміни порядкового предиктора. Ця (дуже поширена) специфікація моделі передбачає, що предиктор має лінійний вплив на всі його кроки. Щоб перевірити припущення, ви можете порівняти модель, в якій ви використовуєте порядкову змінну як єдиний предиктор, та ту, в якій ви дискретизуєте відповіді і трактуєте їх як численні предиктори (як би ви, якби змінна була номінальною); якщо остання модель не приводить до значно кращого пристосування, доцільно трактувати кожен приріст як лінійний ефект.

- @ dmk38 12 грудня '10 о 5:21

Скажіть, будь ласка, де можна знайти щось опубліковане, що підтримує цю заяву? Я працюю з даними і хотів би використовувати порядкові незалежні змінні в логістичній регресії.


Дивіться подібне запитання stats.stackexchange.com/q/195246/3277
ttnphns

Відповіді:


2

Як зазначає @Scortchi , ви також можете використовувати ортогональні многочлени. Ось коротка демонстрація в R:

set.seed(3406)
N      = 50
real.x = runif(N, 0, 10)
ord.x  = cut(real.x, breaks=c(0,2,4,6,8,10), labels=FALSE)
ord.x  = factor(ord.x, levels=1:5, ordered=TRUE)
lo.lin = -3 + .5*real.x
p.lin  = exp(lo.lin)/(1 + exp(lo.lin))
y.lin  = rbinom(N, 1, prob=p.lin)

mod.lin = glm(y.lin~ord.x, family=binomial)
summary(mod.lin)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)   
# (Intercept)  0.05754    0.36635   0.157  0.87520   
# ord.x.L      2.94083    0.90304   3.257  0.00113 **
# ord.x.Q      0.94049    0.85724   1.097  0.27260   
# ord.x.C     -0.67049    0.77171  -0.869  0.38494   
# ord.x^4     -0.09155    0.73376  -0.125  0.90071   
# ...

8

Будь-яка гарна книга з логістичної регресії матиме це, хоча, можливо, не саме цими словами. Спробуйте категоричний аналіз даних Agresti для дуже авторитетного джерела.

Це також випливає з визначення логістичної регресії (або інших регресій). Існує мало методів, явно призначених для порядкових незалежних змінних. Звичайні варіанти трактують це як категоричне (яке втрачає порядок) або як безперервне (що робить припущення, зазначене в тому, що ви цитували). Якщо ви ставитесь до цього як до безперервного, програма, яка робить аналіз, не знає, що це порядковий. Скажімо, ваш IV - це "наскільки вам подобається президент Обама?" і ваш вибір відповідей - це шкала Лікерта від 1. "Дуже багато" до 5. "Зовсім не". Якщо ви ставитесь до цього як до безперервного, то (з точки зору програми) відповідь "5" - це 5 разів відповідь "1". Це може бути або не бути необґрунтованим.


3
Розділ 5.4.6. І ви можете поширити ідею, використовуючи ортогональні поліноми для кодування порядкового предиктора.
Scortchi

Дякую за ваші коментарі, вони дуже допоможуть у моєму аналізі.
Фредеріко

2
@Frederico, якщо відповідь Петра вирішила ваше запитання, ви повинні прийняти його, натиснувши прапорець нижче під загальним числом голосів зліва.
gung - Відновіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.