Якщо лінійна регресія пов'язана з кореляцією Пірсона, чи існують якісь регресійні методи, пов'язані з кореляціями Кендалла та Спірмена?


27

Можливо, це питання є наївним, але:

Якщо лінійна регресія тісно пов'язана з коефіцієнтом кореляції Пірсона, чи існують якісь регресійні методи, тісно пов'язані з коефіцієнтами кореляції Кендалла та Спірмена?


3
В якості простого прикладу , де у вас є один пояснювальний і залежні змінний: лінійна регресія рядів від та дасть коефіцієнт кореляції Спірмена як коефіцієнт регресії. І в цьому випадку і є взаємозамінними в регресії. xyxy
COOLSerdash

2
Всього кілька думок. Кендалл і Спірман є коефіцієнтами кореляції на основі рангів. Потім шукані відносини між і повинні включати їхні ряди. Однак обчислення рангів вводить залежність між спостереженнями, що в свою чергу накладає залежність між помилками, усуваючи лінійну регресію. Однак в інших умовах моделювання структури залежності між і з копулами зробило б можливим зв'язок з та / або Spearman можливим, залежно від вибору копули. τρxyxyτρ
QuantIbex

1
@QuantIbex означає, що залежність обов'язково означає ? E[εiεj]0
shadowtalker

Відповіді:


21

Існує дуже простий засіб, за допомогою якого можна використовувати майже будь-який захід кореляції, щоб відповідати лінійним регресіям, і який відтворює найменші квадрати при використанні кореляції Пірсона.

Вважайте, що якщо нахил відносини , кореляція між і повинна бути .βyβxx0

Дійсно, якби це було не що інше, як , існувало б якесь невлаштоване лінійне відношення - саме так би підбирався міра кореляції.0

Таким чином, ми можемо оцінити нахил, знайшовши нахил , завдяки якому вибіркова кореляція між і дорівнює . У багатьох випадках - наприклад, при використанні рангових заходів - кореляція буде покроковою функцією значення оцінки нахилу, тому може бути інтервал, де він дорівнює нулю. У цьому випадку ми зазвичай визначаємо оцінку вибірки як центр інтервалу. Часто крок-функція в якийсь момент стрибає з вище нуля до нижче нуля, і в цьому випадку оцінка знаходиться в точці стрибка.β~yβ~xx0

Це визначення працює, наприклад, з усіма способами, що ґрунтуються на рейтингах та міцними кореляціями. Він також може бути використаний для отримання інтервалу для схилу (звичайним способом - шляхом пошуку схилів, що позначають межу між просто значущими кореляціями та просто незначними співвідношеннями).

Це визначає лише схил, звичайно; як тільки оцінюється схил, перехоплення може базуватися на оцінці відповідного місця, обчисленій на залишках . З кореляцій, заснованих на ранзі, медіана є загальним вибором, але існує багато інших відповідних варіантів.yβ~x

Ось кореляція, побудована проти нахилу для carданих в R:

введіть тут опис зображення

Кореляція Пірсона перетинає 0 на схилі найменших квадратів, 3.932
Кореляція Кендалла перетинає 0 на схилі Філ-Сен, 3.667
Кореляція Спірмена перетинає 0, даючи нахил "лінії Спірмена" 3,714

Це три оцінки нахилу для нашого прикладу. Тепер нам потрібні перехоплення. Для простоти я просто використовувати середню залишку для першого перехоплення та медіану для двох інших (це не має великого значення в даному випадку):

           intercept
 Pearson:  -17.573 *     
 Kendall:  -15.667
 Spearman: -16.285

* (невелика різниця від найменших квадратів пояснюється помилкою округлення в оцінці схилу; без сумніву, в інших оцінках є аналогічна помилка округлення)

Відповідні пристосовані лінії (використовуючи ту ж колірну гамму, що і вище):

введіть тут опис зображення

Редагувати: Для порівняння, нахил кореляції квадранта становить 3,333

І кореляційні нахили Кендалла, і кореляційні нахили Спірмена є значно більш надійними для впливових людей, ніж найменші квадрати. Дивіться тут драматичний приклад у справі Кендала.


(+1) Чудове пояснення! Чи є якась причина, чому Кендалл, здається, є більш відданою перевагою Спірмена в цьому контексті (принаймні, судячи з того, що кореляція Кендалла відповідає оцінці нахилу, який має ім'я, Теїл-Сен, тоді як Спірман - ні)?
Амеба повідомляє, що повернеться Моніка

4
Існує низка причин, чому це, мабуть, так і є. По-перше, лінія Тейль-Сен має просто описаний оцінювач (медіана парних схилів), якого не вистачає Спірмена; у невеликих зразках дуже підходить для обчислення вручну. Кореляція Кендалла наближається до нормальності швидше і є більш математично відстежуваною . Дивіться також тут і тут .
Glen_b -Встановити Моніку

20

Модель пропорційних шансів (PO) узагальнює тести Вілкоксона та Крускала-Уолліса. Кореляція Спірмена, коли є двійковою, є статистикою тесту Вілкоксона, просто переведеною. Тож можна сказати, що модель PO - це уніфікуючий метод. Так як модель ПО може мати стільки ж, як перехоплює є унікальні значення (менш одного), він обробляє як порядкове і безперервне .XYY

Чисельник статистичної оцінки в моделі PO є точно статистикою Вілкоксона.χ2

Модель PO - це особливий випадок більш загальної моделі сімейства кумулятивної ймовірності (деяка кумулятивна посилання виклику), включаючи пробіт, пропорційні небезпеки та додаткові моделі журналів журналів. Для вивчення конкретного випадку дивіться розділ 15 моїх роздаткових матеріалів .


4

Аарон Хан (1987 в економетриці) запропонував оцінку максимальної кореляції рейтингу, яка відповідає моделям регресії шляхом максимізації тау. Даггерті і Томас (2012 в психологічній літературі) нещодавно запропонували дуже подібний алгоритм. Існує велика робота над MRC, що ілюструє його властивості.

Аарон К. Хан, непараметричний аналіз узагальненої регресійної моделі: Оцінювач максимальної рейтингової кореляції, Журнал економетрики, Том 35, Випуски 2–3, липень 1987, Сторінки 303-316, ISSN 0304-4076, http: // dx.doi.org/10.1016/0304-4076(87)90030-3 . ( http://www.sciencedirect.com/science/article/pii/0304407687900303 )

Dougherty, MR, & Thomas, RP (2012). Міцне прийняття рішень у нелінійному світі. Психологічний огляд, 119 (2), 321. Отримано з http://damlab.umd.edu/pdf%20articles/DoughertyThomas2012Rev.pdf .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.