Плутанина, пов'язана з нормалізацією даних


9

Я намагаюся вивчити лінійну регресійну модель. Однак у мене є певна плутанина, пов'язана з нормалізацією даних. Я нормалізував функції / предиктори до нульової середньої та одиничної дисперсії. Чи потрібно мені те ж саме робити для цілі. Якщо так, чому?


1
Чому ви нормалізували функції / предиктори?
Пітер Флом

4
До речі, я вважаю, що «стандартизація» є кращим терміном для цього.
Scortchi

Відповіді:


6

Нормалізація цілі при лінійній регресії не має значення. При лінійній регресії ваша форма буде мати форму Коли ви прогнозуєте в центрі, постійний член завжди буде середнім значенням . Отже, якщо ви відцентруєте перед запуском регресії, ви отримаєте , але всі ваші інші коефіцієнти залишаться незмінними.

y^i=a0+axi.
xia0yiyia0=0

(Це, як говориться, нормалізація прогнозів --- як ви зараз робите --- - хороша ідея.)


1
Чому нормалізація прогнозів хороша ідея?
Scortchi

@Stefan. Так, коли я центрую прогнози, я отримую постійний термін середнім y. Але я не зрозумів, як це стає середньою. Чи можете ви сказати мені математику за цим? a0
користувач34790

2
@Scortchi Нормалізація прогнозів не є необхідною, але може полегшити інтерпретацію коефіцієнтів регресії: Після нормалізації великі коефіцієнти відповідають важливим предикторам. Також без нормалізації коефіцієнти термінів взаємодії можуть бути серйозно оманливими. Якщо говорити, нормалізація не вплине на прогнози, отримані від вашої моделі, тому нормалізація має значення лише в тому випадку, якщо ви збираєтесь інтерпретувати коефіцієнти регресії.
Стефан Вагер

1
@ user34790 Математику відпрацьовано на сайті pmean.com/10/LeastSquares.html
Стефан Вагер

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.