Множинна регресія або частковий коефіцієнт кореляції? І відносини між ними


35

Я навіть не знаю, чи має це питання сенс, але в чому різниця між множинною регресією та частковою кореляцією (крім очевидних відмінностей між кореляцією та регресією, на що я не прагну)?

Я хочу з’ясувати наступне: у
мене є дві незалежні змінні ( , ) та одна залежна змінна ( ). Тепер окремо незалежні змінні не співвідносяться із залежною змінною. Але для даного зменшується, коли зменшується. Тож чи аналізую я це за допомогою множинної регресії або часткової кореляції ?x1x2yx1 yx2

редагувати, щоб сподіватися покращити моє запитання: я намагаюся зрозуміти різницю між багаторазовою регресією та частковою кореляцією. Отже, коли y зменшується для даного x1 коли x2 зменшується, це пов'язано з комбінованим впливом та на (множинна регресія) чи це пов'язано з усуненням ефекту (часткова кореляція)?x1x2yx1


3
На яке предметне запитання ви намагаєтесь відповісти?
gung - Відновіть Моніку

Дивіться також дуже схоже запитання stats.stackexchange.com/q/50156/3277 .
ttnphns

Відповіді:


32

Коефіцієнт множинної лінійної регресії та часткова кореляція безпосередньо пов'язані і мають однакове значення (p-значення). Частковий r - лише інший спосіб стандартизації коефіцієнта, поряд з бета- коефіцієнтом (стандартизований коефіцієнт регресії) 1 . Отже, якщо залежна змінна y, а незалежні рівні x 1 і x 2, то1yx1x2

Beta:βx1=ryx1ryx2rx1x21rx1x22

Partial r:ryx1.x2=ryx1ryx2rx1x2(1ryx22)(1rx1x22)

Ви бачите , що числители ті ж , які говорять , що обидва формули вимірюють один і той же унікальний ефект від . Я спробую пояснити, як дві формули структурно однакові та як їх немає.x1

Припустимо, у вас є z-стандартизовані (середнє значення 0, дисперсія 1) всі три змінні. Тоді чисельник дорівнює коваріації між двома видами залишків : (a) залишки, залишені при прогнозуванні на x 2 [обидві змінні стандартні], і (b) залишки, залишені при прогнозуванні x 1 на x 2 [обидва змінні стандартні] . Більш того, дисперсія залишків (а) дорівнює 1 - r 2 y x 2 ; дисперсія залишків (b) дорівнює 1 - r 2 x 1 x 2 .yx2x1x21ryx221rx1x22

Формула часткової кореляції потім чітко видається формулою звичайного Пірсона , обчисленої в цьому випадку між залишками (а) та залишками (б): Пірсон r , як ми знаємо, коваріація ділиться на знаменник, який є середнім геометричним значенням дві різні дисперсії.rr

Стандартизований коефіцієнт бета структурно схожий на Пірсона , лише те, що знаменник є геометричним середнім дисперсією з власним "Я" . Варіант залишків (а) не враховувався; його було замінено другим підрахунком дисперсії залишків (b). Таким чином, бета - це коваріація двох залишків відносно дисперсії одного з них (конкретно, тієї, що стосується прогнозуючого інтересу, x 1 ). Хоча часткове співвідношення, як уже зазначалося, - це та сама коваріація щодо їх гібридної дисперсії. Обидва типи коефіцієнта є способами стандартизації ефекту x 1 в середовищі інших прогнокторів.rx1x1

Деякі числові наслідки різниці. Якщо R-квадрат множинної регресії на x 1 і x 2 трапляється дорівнює 1, то обидва часткові кореляції предикторів із залежними будуть також 1 абсолютне значення (але бета, як правило, не буде 1). Дійсно, як говорилося раніше, r y x 1 . x 2 - співвідношення між залишками та залишками . Якщо те, що не x 2 в межах y, то саме те , що не x 2 в межах x 1yx1x2ryx1.x2y <- x2x1 <- x2x2y x2x1то немає нічого в , що не є ні х 1 , ні х 2 : повний підходить. Що б не було кількість незрозумілого (по х 2 ) частина залишається в у ( 1 - г 2 г х 2 ), якщо він захоплений щодо високо незалежної частини х 1 (по 1 - г 2 х 1 х 2 ), r y x 1 . х 2 буде високим. β x 1yx1x2x2y1ryx22x11rx1x22ryx1.x2βx1з іншого боку, буде високим лише за умови, що захоплена незрозуміла частина сама по собі є істотною частиною y .yy


З наведених вище формул отримує (і відступає від 2-провісника регресії до регресії з довільним числом предикторів ) Формула перетворення між бета і відповідним частковим г:x1,x2,x3,...

ryx1.X=βx1var(ex1X)var(eyX),

де означає збір усіх прогнозів, крім поточного ( x 1 ); e y X - залишки від регресування y на X , а e x 1X - залишки від регресування x 1 на X , змінні в обох цих регресіях вводять їх стандартизованими .Xx1eyXyXex1Xx1X

Примітка: якщо нам потрібно обчислити часткові кореляції з кожним предиктором x, ми зазвичай не будемо використовувати цю формулу, вимагаючи зробити дві додаткові регресії. Швидше, операції зйомки (часто використовуються в покроковому режимі та алгоритми регресії всіх підмножин) будуть виконані або буде обчислена матриця кореляції зображень .yx


β x 1 = b x 1 σ x 11 - відношення між необробленимbта стандартизованимβ-коефіцієнтами в регресії з перехопленням.βx1=bx1σx1σybβ


Дякую. Але як я вирішую, з ким іти, наприклад, для цілей, описаних у моєму питанні?
користувач34927

2
Очевидно, ви вільні вибирати: числівники однакові, тому вони передають ту саму інформацію. Що стосується вашого (не до кінця уточненого) питання, то, схоже, йдеться про теми "може рег. Coef. Бути 0, коли r не 0"; "може рег. coef. бути не 0, коли r дорівнює 0". На цьому сайті багато питань. Наприклад, ви можете прочитати stats.stackexchange.com/q/14234/3277 ; stats.stackexchange.com/q/44279/3277 .
ttnphns

Я спробував уточнити своє питання ..
user34927

Виправлення X1 ("x1 задано") = видалення (керування) ефекту X1. Не існує такого поняття, як "комбінований ефект" при множинній регресії (якщо не додати взаємодію X1 * X2). Ефекти в регресії мультиплексу є конкурентними. Ефекти лінійної регресії є фактично частковими кореляціями.
ttnphns

1
Почекайте трохи, @ user34927. to prove that the DV (Y) is significantly correlated with one of two IVs (X1) if the effect of the other IV (X2) is removedЕфект знятий звідки ? Якщо ви "вилучите" X2 як з Y, так і з X1, тоді з'явиться заголовок. між Y і X1 - часткова кореляція. Якщо ви "вилучите" X2 лише з X1, тоді з'явиться заголовок. між Y і X1 називається частковою (або напів частковою) кореляцією. Ви справді запитували про це ?
ttnphns

0

Просто випадково наткнувся на цей протектор. У вихідній відповіді у формулі для коефіцієнт βx1SSY/SSX1 is missing, that is

βx1=ryx1ryx2 rx1x21rx1x22×SSYSSX1,
where SSY=i(yiy¯)2 and SSX1=i(x1ix¯1)2.

You are giving the formula of b. My answer was about β.
ttnphns
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.