Мені доводиться робити бінарну логістичну регресію з безліччю незалежних змінних. Більшість з них є бінарними, але деякі категоричні змінні мають більше двох рівнів.
Який найкращий спосіб боротися з такими змінними?
Наприклад, для змінної з трьома можливими значеннями я припускаю, що потрібно створити дві фіктивні змінні. Тоді, в процесі поетапної регресії, краще протестувати обидва змінні манекена одночасно, або протестувати їх окремо?
Я буду використовувати SPSS, але це я не дуже добре пам’ятаю, тож: як SPSS вирішує цю ситуацію?
Більше того, для порядкової категоріальної змінної добре використовувати фіктивні змінні, які відтворюють порядковий масштаб? (Наприклад, при використанні трьох фіктивних змінних для 4-стану порядкового змінної, покласти 0-0-0
на рівні , на рівні 2 , для рівня 3 і для рівня 4 , замість того , , і для 4 рівнів.)1-0-0
1-1-0
1-1-1
0-0-0
1-0-0
0-1-0
0-0-1