Узагальнені найменші квадрати: від коефіцієнтів регресії до коефіцієнтів кореляції?


10

Щонайменше квадрати з одним предиктором:

y=βx+ϵ

Якщо і стандартизовані до встановлення (тобто ), то:xyN(0,1)

  • β - такий самий, як коефіцієнт кореляції Пірсона, .r
  • β однакова у відображеній регресії:x=βy+ϵ

Для узагальнених найменших квадратів (GLS) застосовується те саме? Тобто, якщо я стандартизую свої дані, чи можу я отримати коефіцієнти кореляції безпосередньо з коефіцієнтів регресії?

Експериментуючи з даними, відбита GLS призводить до різних коефіцієнтів, а також я не впевнений, що вважаю, що коефіцієнти регресії відповідають моїм очікуваним значенням для кореляції. Я знаю, що люди цитують коефіцієнти кореляції GLS, тому мені цікаво, як вони до них дістаються, а отже, що вони насправді мають на увазі?β

Відповіді:


4

Відповідь "так", коефіцієнти лінійної регресії - це кореляція предикторів з відповіддю, але тільки якщо ви використовуєте правильну систему координат .

Щоб побачити, що я маю на увазі, згадайте, що якщо і центрировані та стандартизовані, то кореляція між кожним та є лише крапковим продуктом . Також рішення лінійної регресії є найменшим квадратомx1,x2,,xnyxiyxity

β=(XtX)1Xty

Якщо так трапиться, то (матриця ідентичності), тоXtX=I

β=Xty

і ми відновлюємо вектор кореляції. Часто привабливо переробити проблему регресії з точки зору предикторів які задовольняють , знаходячи відповідні лінійні комбінації вихідних предикторів, що роблять це відношення справжнім ( або рівнозначно лінійна зміна координат); ці нові прогнози називаються основними компонентами.x~iX~tX~=I

Таким чином, відповідь на ваше запитання - так, але лише тоді, коли передбачувачі самі не мають співвідношення . Інакше вираз

XtXβ=Xty

показує, що бета-версії повинні бути змішані разом із співвідношеннями між самими передбачувачами, щоб відновити кореляційні відповіді-відповідь.

Як бічне зауваження, це також пояснює, чому результат завжди вірний для однієї змінної лінійної регресії. Після того, як вектор прогноктора стандартизований, тоді:x

x0tx=ixi=0

де - вектор перехоплення всіх. Таким чином, (два стовпці) дані матриця автоматично задовольняє , і результат.x0XXtX=I

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.