Коефіцієнт множинної лінійної регресії та часткова кореляція безпосередньо пов'язані і мають однакове значення (p-значення). Частковий r - лише інший спосіб стандартизації коефіцієнта, поряд з бета- коефіцієнтом (стандартизований коефіцієнт регресії) 1 . Отже, якщо залежна змінна y, а незалежні рівні x 1 і x 2, то1yx1x2
Beta:βx1=ryx1−ryx2rx1x21−r2x1x2
Partial r:ryx1.x2=ryx1−ryx2rx1x2(1−r2yx2)(1−r2x1x2)−−−−−−−−−−−−−−−−√
Ви бачите , що числители ті ж , які говорять , що обидва формули вимірюють один і той же унікальний ефект від . Я спробую пояснити, як дві формули структурно однакові та як їх немає.x1
Припустимо, у вас є z-стандартизовані (середнє значення 0, дисперсія 1) всі три змінні. Тоді чисельник дорівнює коваріації між двома видами залишків : (a) залишки, залишені при прогнозуванні на x 2 [обидві змінні стандартні], і (b) залишки, залишені при прогнозуванні x 1 на x 2 [обидва змінні стандартні] . Більш того, дисперсія залишків (а) дорівнює 1 - r 2 y x 2 ; дисперсія залишків (b) дорівнює 1 - r 2 x 1 x 2 .yx2x1x21−r2yx21−r2x1x2
Формула часткової кореляції потім чітко видається формулою звичайного Пірсона , обчисленої в цьому випадку між залишками (а) та залишками (б): Пірсон r , як ми знаємо, коваріація ділиться на знаменник, який є середнім геометричним значенням дві різні дисперсії.rr
Стандартизований коефіцієнт бета структурно схожий на Пірсона , лише те, що знаменник є геометричним середнім дисперсією з власним "Я" . Варіант залишків (а) не враховувався; його було замінено другим підрахунком дисперсії залишків (b). Таким чином, бета - це коваріація двох залишків відносно дисперсії одного з них (конкретно, тієї, що стосується прогнозуючого інтересу, x 1 ). Хоча часткове співвідношення, як уже зазначалося, - це та сама коваріація щодо їх гібридної дисперсії. Обидва типи коефіцієнта є способами стандартизації ефекту x 1 в середовищі інших прогнокторів.rx1x1
Деякі числові наслідки різниці. Якщо R-квадрат множинної регресії на x 1 і x 2 трапляється дорівнює 1, то обидва часткові кореляції предикторів із залежними будуть також 1 абсолютне значення (але бета, як правило, не буде 1). Дійсно, як говорилося раніше, r y x 1 . x 2 - співвідношення між залишками та залишками . Якщо те, що не x 2 в межах y, то саме те , що не x 2 в межах x 1yx1x2ryx1.x2y <- x2
x1 <- x2
x2y x2x1то немає нічого в , що не є ні х 1 , ні х 2 : повний підходить. Що б не було кількість незрозумілого (по х 2 ) частина залишається в у ( 1 - г 2 г х 2 ), якщо він захоплений щодо високо незалежної частини х 1 (по 1 - г 2 х 1 х 2 ), r y x 1 . х 2 буде високим. β x 1yx1x2x2y1−r2yx2x11−r2x1x2ryx1.x2βx1з іншого боку, буде високим лише за умови, що захоплена незрозуміла частина сама по собі є істотною частиною y .yy
З наведених вище формул отримує (і відступає від 2-провісника регресії до регресії з довільним числом предикторів ) Формула перетворення між бета і відповідним частковим г:x1,x2,x3,...
ryx1.X=βx1var(ex1←X)var(ey←X)−−−−−−−−−−√,
де означає збір усіх прогнозів, крім поточного ( x 1 ); e y ← X - залишки від регресування y на X , а e x 1 ← X - залишки від регресування x 1 на X , змінні в обох цих регресіях вводять їх стандартизованими .Xx1ey←XyXex1←Xx1X
Примітка: якщо нам потрібно обчислити часткові кореляції з кожним предиктором x, ми зазвичай не будемо використовувати цю формулу, вимагаючи зробити дві додаткові регресії. Швидше, операції зйомки (часто використовуються в покроковому режимі та алгоритми регресії всіх підмножин) будуть виконані або буде обчислена матриця кореляції зображень .yx
β x 1 = b x 1 σ x 11 - відношення між необробленимbта стандартизованимβ-коефіцієнтами в регресії з перехопленням.βx1=bx1σx1σybβ