Зміщення / масштабування змінних не вплине на їх кореляцію з відповіддю
Щоб зрозуміти, чому це правда, припустимо, що кореляція між і є . Тоді кореляція між та єYХρY( X- а ) / б
c o v (Y, ( X- а ) / б )S D ((X- а ) / б ) ⋅ S D ( Y)=c o v (Y, X/ б)S D (X/ b)⋅ S D (Y)=1б⋅ c o v ( Y, X)1бS D (X) ⋅ S D ( Y)= ρ
що випливає з визначення кореляції та трьох фактів:
c o v (Y, X+ а ) = c o v ( Y, X) +c o v (Y, а )= 0= c o v ( Y, X)
c o v (Y, a X) = a c o v ( Y, X)
S D (aX) = a ⋅ S D ( X)
Отже, з точки зору пристосування до моделі (наприклад, або встановлених значень) зміщення або масштабування змінних (наприклад, розміщення їх на одній шкалі) не змінить модельR2 , оскільки коефіцієнти лінійної регресії пов'язані з кореляціями між змінними. Це змінить лише шкалу ваших коефіцієнтів регресії , про що слід пам’ятати, коли ви інтерпретуєте вихід, якщо ви вирішите трансформувати свої прогнози.
Редагувати: вищесказане передбачає, що ви говорите про звичайну регресію з перехопленням. Ще кілька пунктів, пов’язаних із цим (спасибі @cardinal):
Перехоплення може змінюватися, коли ви перетворюєте свої змінні, і, як @cardinal в коментарях зазначає, коефіцієнти змінюватимуться, коли ви зміните свої змінні, якщо ви не будете перехоплювати з моделі, хоча я припускаю, що ви цього не робите, якщо у вас немає вагома причина (див., наприклад, цю відповідь ).
Якщо ви регулюєте свої коефіцієнти якимось чином (наприклад, Лассо, регресія хребта), то центрування / масштабування вплине на придатність. Наприклад, якщо ви (покарання за регресію хребта), ви не можете відновити еквівалентну придатність після стандартизації, якщо в першу чергу всі змінні не були в одній шкалі, тобто не існує постійного кратного, який би стягував одне й те саме.∑β2i
Щодо того, коли / чому дослідник може захотіти трансформувати прогнози
Поширена обставина (обговорювана в наступній відповіді @Paul) полягає в тому, що дослідники стандартизують своїх прогнозів, щоб усі коефіцієнти були в одній шкалі. У цьому випадку розмір точкових оцінок може дати грубе уявлення про те, які прогноктори мають найбільший ефект після стандартизації чисельної величини прогноктора.
Ще одна причина, яку дослідник може захотіти масштабувати дуже великі змінні, полягає в тому, що коефіцієнти регресії не знаходяться в надзвичайно крихітних масштабах. Наприклад, якщо ви хотіли переглянути вплив чисельності населення країни на рівень злочинності (не могли б придумати кращого прикладу), ви можете виміряти чисельність населення в мільйонах, а не в початкових одиницях, оскільки коефіцієнт може бути щось на зразок ..00000001