Логістична регресія: тлумачення суцільних змінних


11

У мене було кілька запитань щодо інтерпретації коефіцієнтів шансів для безперервних змінних в логістичній регресії. Мені здається, що це основні питання щодо логістичної регресії (і, мабуть, про регресію взагалі), і хоча я трохи соромлюсь, що не знаю відповідей, я проковтну свою гордість і запитаю їх, щоб я знав їх у майбутнє!

Ось моя ситуація ... Я дивлюся на зразок молоді, яка прийняла рішення, яка в рамках стажування була зарахована до програми навчання професійних навичок. Я хотів побачити, наскільки вік, у якому вони звільнялися з програми, передбачив працевлаштування шість місяців після звільнення від програми.

(Також майте на увазі, що в моделі є інші прогнози, але я виключив їх, оскільки вони не є статистично значущими, і я хочу, щоб це було максимально зрозумілим.)

Прогноз: Вік звільнення з навчальної програми (середній вік = 17,4, SD = 1,2, діапазон 14,3-20,5)

Результат: працевлаштований чи ні (працевлаштовано = 1, не працює = 0)

Результат: Коефіцієнт шансів 3,01 (p <.005) (Я виключив доброту підходящої статистики тощо), тому що я шукаю відповіді лише на інтерпретацію коефіцієнта шансів; я відчуваю себе комфортно з оцінкою відповідності моделі, CI тощо)

Якщо говорити про це: Коли вік збільшується на рік, шанси на роботу через півроку після звільнення збільшуються на три одиниці.

Запитання:

1) Коли я кажу: "Коли вік збільшується на один рік ...", що є початковим моментом для віку?

Чи починається вік з нуля? Наприклад, "Коли вік збільшується від 0 [тобто найнижчий вік, якщо ви розміщували цю модель на графіку] ..."

Чи починається вік з найнижчого віку серед діапазону віків у вибірці? Наприклад, "З віком збільшується з 14,3 ..."

АБО

Чи починається вік із середнього віку вибірки? Наприклад, "З віком збільшується з 17,4 ...",

2) Чи допоможе мені центрування інтерпретувати цей результат АБО це ефективно лише в інтерпретації y-int? Якщо це допоможе, я думав зробити або середнє центрування, або відняти найнижчий вік у діапазоні від усіх інших віків у вибірці. Будь-які пропозиції?

3) Нарешті, чи доречно сказати, що порівняно із 14-річною молоддю, 17-річна молодь в дев'ять разів частіше працевлаштовується? Я запитую, бо знаю, що логістична регресія передбачає сигмоїдальний зв’язок, і мені цікаво, чи збільшиться цей коефіцієнт збільшення на 3 одиниці в будь-якій точці по лінії регресії.

Дуже дякую!

Аарон


1
Ви могли б бути зацікавлені в цьому .
чакраварти

4
Видалення "незначних" змінних дуже проблематично.
Френк Харрелл

@FrankHarrell Ви могли б детальніше пояснити, чому видалення незначних змінних у цьому випадку дуже проблематично?
Марк Уайт

Про це детально йшлося на цьому сайті. Коротко він руйнує стандартні помилки, значення P, охоплення довірчого інтервалу тощо.
Френк Харрелл

Відповіді:


6

1) Так як це коефіцієнти відносини це не має значення , де ви почати. Коефіцієнт для 18-річного віку в 3 рази більший, ніж для 17-річного. Або шанси для 17-річного віку становлять 1/3, ніж для 18-річного. Однакові речі. Якщо ви хочете отримати ймовірність того, що людина певного віку буде працевлаштована, ви можете скористатися формулою з оцінкою параметрів (а не ОР). Або ви можете отримати програму, яку ви використовуєте, щоб зробити це за вас.

2) Чи допоможе центрування - це питання думки. Я не вважаю чіткішими орієнтованими моделі, але деякі люди це роблять.

3) Коефіцієнт не зовсім такий, як "вірогідний" (хоча багато людей говорять так, як ніби), а шанси для 17-річного віку будуть в 27 разів більше, ніж для 14-річного.

Нарешті, я з обережністю ставлюся до цієї моделі. Модель передбачає, що АБО однакове між 14 та 15, 15 та 16 тощо. Мені це здається малоймовірним, виходячи з того, що я знаю про цю тему.


0

Середні шанси на участь у навчальній проблемі для особи є # кратною шансою для іншої особи, яка на рік молодша / старша, після того, як всі інші змінні будуть постійними.

Це мій прийом.


1
Чи можете ви розширити, як це додає до попередньої відповіді?
mdewey
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.