Коефіцієнт визначення у множинній лінійній регресії: У множинній лінійній регресії коефіцієнт визначення може бути записаний у вигляді парних кореляцій для змінних, використовуючи квадратичну форму:
R2=rTy,xr−1x,xry,x,
де - вектор співвідношень між вектором відповіді та кожним із пояснюючих векторів, і є матриця кореляцій між пояснювальними векторами (докладніше про це див цей родинний питання ). У випадку двоваріантної регресії у вас є:ry,xrx,x
R2=[rY,X1rY,X2]T[1rX1,X2rX1,X21]−1[rY,X1rY,X2]=11−r2X1,X2[rY,X1rY,X2]T[1−rX1,X2−rX1,X21][rY,X1rY,X2]=11−r2X1,X2(r2Y,X1+r2Y,X2−2rX1,X2rY,X1rY,X2).
У вашому запитанні ви не вказали вказівки одновимірних кореляцій, тому без втрати загальності ми позначимо . Підставлення значень і виходу:D≡sgn(rY,X1)⋅sgn(rY,X2)∈{−1,+1}r2Y,X1=0.3r2Y,X2=0.4
R2=0.7−20.12−−−−√⋅D⋅rX1,X21−r2X1,X2.
Це можливо для , оскільки можлива, що об'єднана інформація з двох змінних буде більшою, ніж сума її частин. Це цікаве явище називається «посиленням» (див., Наприклад, Lewis and Escobar 1986 ).R2>0.7