Я хочу включити термін та його квадрат (змінні предиктора) до регресії, тому що я припускаю, що низькі значення позитивно впливають на залежну змінну, а високі значення мають негативний ефект. повинен захопити ефект більш високих значень. Тому я очікую, що коефіцієнт буде позитивним, а коефіцієнт буде від'ємним. Крім , я включаю й інші змінні прогнози.
У деяких публікаціях я читав, що в цій справі корисно зосередити змінні, щоб уникнути мультиколінеарності. Коли ви проводите множинні регресії, коли слід зосереджувати свої провідникові показники, а коли їх стандартизувати?
Чи слід зосереджувати обидві змінні окремо (в середньому), чи слід лише центр а потім взяти квадрат, або я повинен лише центр і включати оригінальний ?
Це проблема, якщо - числова змінна?
Щоб не була змінною лічильника, я подумав про поділ її на теоретично визначену площу, наприклад 5 квадратних кілометрів. Це має бути трохи схожим на обчислення точкової точки.
Однак я боюся, що в цій ситуації моє початкове припущення про ознаку коефіцієнтів більше не витримає, як коли і x² = 4
=
але буде менше, тому що .