Чи є різниця між


22

Коефіцієнт кореляції зазвичай записується з великої літери але іноді - ні. Цікаво, чи дійсно є різниця між r 2 і R 2 ? Чи може r означати щось інше, ніж коефіцієнт кореляції?Rr2R2r


8
Я здивований, що це питання було оскаржене - воно чітке та чітко визначене та охоплює питання, де термінологія використовується неузгоджено. Гірше, тому що це чутливе до регістру - важка тема пошуку роз'яснень! Крім того , що може бути використаний для двох абсолютно різних речей, ситуація стає ще гірше , коли ми розглядаємо модель без точки перехоплення, коли R 2 , коефіцієнт детермінації, навіть не те ж саме , як квадрат R . Це не дивно, що капелюх людей може вважати позначення заплутаним. rR2R
Срібляста рибка

Відповіді:


18

Повідомлення з цього приводу, здається, трохи відрізняються.

використовується в контексті множинної кореляції і називається "коефіцієнтом множинної кореляції". Це кореляція між що спостерігаються відповідями Y і Y , встановленимидопомогою моделі. Y зазвичай передбачається з декількох предикторов X я , наприклад , Y = β 0 + β 1 X 1 + β 2 X 2 , де перехоплюють і нахил коефіцієнти р я був оцінений з даних. Зауважте, що 0RYY^Y^XiY^=β^0+β^1X1+β^2X2β^i .0R1

Символ - "коефіцієнт кореляції вибірки", що використовується в двовимірному випадку - тобто є дві змінні, X і Y - і це зазвичай означає співвідношення між X і Y у вашому вибірці. Ви можете трактувати це як оцінку співвідношення ρ між двома змінними у широкій сукупності. Для співвіднесення двох змінних не потрібно визначати, яка з них є предиктором, а яка - відповіддю. Дійсно, якщо ви знайшли кореляцію між Y і X, це було б те саме, що кореляція між X і Y , оскільки кореляція симетричнаrXYXYρYXXY. Зауважте, що коли символ r використовується таким чином, при r < 0 (від'ємна кореляція), якщо дві змінні мають лінійно зменшується співвідношення (у міру того, як одна йде вгору, інша має тенденцію знижуватися).1r1rr<0

Там, де нотація стає непослідовною, коли є дві змінні, і Y , і виконується проста лінійна регресія . Це означає , що ідентифікують одну змінну, Y , в якості змінної відгуку, а інший, X , в якості змінної провісника і підгонки моделі Y = β 0 + β 1 X . Деякі люди також використовують символ г , щоб вказати кореляцію між Y і Y в той час як інші (для сумісності з множинноїрегресії) записи RXYYXY^=β^0+β^1XrYY^R. Зауважте, що кореляція між спостережуваними та пристосованими відповідями обов'язково більша або дорівнює нулю. Це одна з причин мені не подобається використання символ в цьому випадку: кореляція між X і Y може бути негативною, в той час як кореляція між Y і Y є позитивною (насправді це буде просто модуль співвідношення між X і Y ), але обидва можуть бути записані символом r . Я бачив, як деякі підручники та статті у Вікіпедії майже взаємозамінно перемикаються між двома значеннями r і вважають це зайвим заплутаним. Я вважаю за краще використовувати символ RrXYYY^XYrrRкореляції між і Y в одиночній і множинної регресії.YY^

У простій і множинної regresion, то до тих пір , поки існує загальний термін перехоплення встановлена в моделі, між Y і Y являє собою просто квадратний корінь з коефіцієнта детермінації R 2RYY^R2 (часто званий «відсоток дисперсії пояснив» або подібний). У випадку простої лінійної регресії конкретно, тоді R2=r2 де я пишу для співвідношення між X і Y , і R 2 може представляти або коефіцієнт визначення регресії, або квадрат кореляції міжrXYR2 і Y . Оскільки - 1 r 1 і 0 R 1 , це означає, що R = | r | . Так, наприклад, якщо ви отримаєте кореляцію між X і Y з г = - 0,7 , то зв'язок між Y і підігнаній Y від простої лінійної регресії Y = & beta ; 0 + β 1 XYY^1r10R1R=|r|XYr=0.7YY^Y=β^0+β^1Xбуде а коефіцієнт визначення буде R 2 = 0,49, тобто майже половина варіації відповіді пояснюється вашою моделлю.R=0.7R2=0.49

Якщо в моделі не було включено жодного терміна перехоплення, то символ неоднозначний. Зазвичай він розраховується як коефіцієнт визначення, але це, як правило, обчислюється іншим способом, ніж звичайний , тому будьте уважні, читаючи результати зі свого статистичного програмного забезпечення. Тоді це вже не те саме, що квадрат множинної кореляції R , а також у двовимірному випадку він не дорівнює r 2 !R2Rr2

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.