Чи можу я скористатися множинною регресією, коли я змішав категоричні та безперервні прогнози?


12

Схоже, ви можете використовувати кодування для однієї категоріальної змінної, але у мене є дві категоріальні та одна безперервна змінна предиктора. Чи можу я використовувати для цього кілька регресій в SPSS, і якщо так, як? Дякую!


Я впевнений, що зможете , але я боюся, що не знаю як !
onestop

Я б запропонував ввести щось подібне до регресу в довідковій документації, що постачається з SPSS. Для будь-якого пакету статистики має бути хліб та масло
ймовірність

Я не знаю, що ви маєте на увазі під кодуванням однієї категоріальної змінної. Чи можете ви навести приклад у синтаксисі? Ваша залежна змінна безперервна чи категорична?
Енді Ш

Відповіді:


8
  1. Якщо це питання синтаксису SPSS, відповідь просто поміщає категоричну змінну, кодовану відповідним чином, у список змінних для "незалежних змінних" разом із суцільною.
  2. Щодо статистики: Чи є ваша категоріальна змінна двійкова? Якщо це так, вам потрібно використовувати фіктивний або інший дійсний контрастний код. Якщо вона не є двійковою, чи є ваша категорична змінна порядковою чи номінальною? Якщо номінальний, то знову ж таки, ви повинні використовувати якусь контрастну кодову стратегію - фактично моделюючи вплив кожного рівня змінної на результат або "залежну" змінну. Якщо категоріальна змінна порядкова, то швидше за всерозумне, що потрібно зробити - це ввести його як є у модель, як і в режимі безперервного прогнозу (тобто "незалежної") змінної. У цьому випадку ви припускаєте, що приріст між рівнями змінної категоричного предиктора ("незалежний"); лише рідко це буде помилкою, але коли вона є, ви знову повинні використовувати контрастний код і моделювати вплив кожного рівня. Це питання виникає на цьому форумі досить часто - ось хороший аналіз
  3. Як поводитися з відсутніми даними, на мій погляд, зовсім окрема справа. Я розумію, що парне видалення не розглядається як коректний підхід для багатоваріантної регресії. Список також досить поширений, але може також упереджувати результати, і це, звичайно, прикро. Багаторазова імпутація - справа краси.

У мене питання щодо DMK38. Вище ви пишете, що нормально додати категоричну змінну в модель такою, якою є, коли вона є порядковою. Я радий прочитати це ;-) Чи є у вас гарне джерело, яке згадує про це, щоб я міг додати його до своєї статті? Дуже дякую за вашу відповідь! Lilian
Lilian Jans-Beken

1
@ LilianJans-Beken: Див. Постійну залежну змінну з порядковою незалежною змінною та логістичною регресією та порядковими незалежними змінними . Можливо, ви не хочете скористатися більш складними методами, але зауважте, що навіть якщо ви щасливі вважати прогнозувача інтервальним масштабом, обмежувати його у лінійній залежності з відповіддю не потрібно. І не відчувайте себе зобов'язаними приймати рівні інтервали між суміжними рівнями, якщо щось інше здається більш розумним.
Scortchi


2

Ви, безумовно, можете, дотримуючись того самого методу, який ви б застосували для першого категоричного прогноктора. Створіть фіктивні змінні так само, як і для першої такої змінної. Але часто простіше використовувати команду Unianova SPSS. Ви можете знайти це в будь-якому посібнику з синтаксису, що надрукується, або отримати доступ до нього через Аналіз ... Загальна лінійна модель ... Уніваріант.

Незважаючи на те, що це трохи складніше, команда Regression має ряд переваг перед Unianova. Головним є те, що ви можете вибрати "пропущений попарно" (не потрібно програвати справу просто тому, що для нього не вистачає значення для одного або двох прогнокторів). Ви також можете отримати багато цінних діагнозів, таких як часткові графіки та статистика впливу.


1
@ rolando - хороша відповідь. Незважаючи на те, що відсутні парні підходи, як правило, плутають порівняння ефектів, оскільки вони ґрунтуються на різній кількості спостережень. Можливо, варто пам’ятати.
richiemorrisroe

Я думаю, що твій трохи заплутаний, парний недолік має значення лише у тому випадку, коли ти працюєш повністю окремими моделями (наприклад, використовуючи покрокову процедуру вибору моделі). Якщо ви вводите всі змінні в модель, вона все одно відміняє значення пропущених значень.
Andy W

@ richiemorrisroe - я згоден, варто пам’ятати. @ Andy W - Щойно у SPSS підтвердили, що, використовуючи лише примусовий вхід, пропущені попарно та пропущені в списку, дають різні результати в усіх відношеннях, включаючи різні df.
rolando2

Я все ще думаю, що ваш розгублений, як SPSS може повертати різні набори результатів, оголошуючи пропущені попарно, якщо вона не складає значення для відсутніх даних? Ось приклад використання імітованих даних, які я розмістив у текстовому файлі, dl.dropbox.com/u/3385251/SPSS_missing_Listwise_vs_Pairwise.txt . Наразі я оскаржив вашу відповідь, оскільки вся ця розмова про те, як команда регресії обробляє відсутні дані, є заплутаною, не має нічого спільного з оригінальним питанням ОП і, ймовірно, вводить в оману.
Енді Ш

1

Простий спосіб перетворити категоричні змінні в набір фіктивних змінних для використання в моделях в SPSS - це використання синтаксису do повтору. Це найпростіше використовувати, якщо ваші категоричні змінні є в числовому порядку.

*making vector of dummy variables.
vector dummy(3,F1.0).
*looping through dummy variables using do repeat, in this example category would be the categorical variable to recode. 
do repeat dummy = dummy1 to dummy3 /#i = 1 to 3.
compute dummy = 0.
if category = #i dummy = 1.
end repeat.
execute. 

В іншому випадку ви можете просто запустити набір операторів if, щоб зробити ваші фіктивні змінні. У моїй поточній версії (16) немає вродженої здатності автоматично задавати набір змінних фіктивних змін у команді регресії (як, наприклад, у Stata, використовуючи команду xi ), але я не здивуюся, якщо вона буде доступна в новій новій версії. Також врахуйте пункт №2 dmk38, ця схема кодування передбачає номінальні категорії. Якщо ваша змінна є порядковою, можна використовувати більше розсуду.

Я також погоджуюся з dmk38, і говорити про те, що регресія є кращою, оскільки її здатність конкретно визначати відсутні дані є цілком окремим питанням.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.