Кендалл Тау чи Рор Спірмена?


69

У яких випадках слід віддати перевагу тому, ніж іншому?

Я знайшов когось, хто претендує на перевагу Кендалл, з педагогічних міркувань , чи є інші причини?


Дивіться також пов’язане питання stats.stackexchange.com/q/18112/3277 .
ttnphns

1
На жаль, посилання у вашому запитанні мертве. Я припускаю, що ви маєте на увазі Noether (2007, Teaching Statistics ) . Ви хочете відредагувати його?
Стефан Коласа

Відповіді:


40

Я виявив, що кореляція Спірмена використовується в основному замість звичайної лінійної кореляції при роботі з цілочисленними оцінними балами за шкалою вимірювання, коли вона має помірну кількість можливих балів або коли ми не хочемо покладатися на припущення про біваріантні відносини . У порівнянні з коефіцієнтом Пірсона інтерпретація тау Кендалла мені здається менш прямою, ніж інтерпретація Спірмена, в тому сенсі, що вона кількісно визначає різницю між відсотками конкордантних і дискордантних пар серед усіх можливих попарних подій. На моє розуміння, танда Кендалла більше нагадує гамму Гудмана-Крускаля .

Я щойно переглянув статтю Ларрі Віннер у програмі J. Statistics Educ. (2006), в якому обговорюється використання обох заходів, результати змагань NASCAR Winston Cup у гонках за 1975-2003 роки .

Я також знайшов відповідь @onestop про співвідношення Пірсона чи Спірмена з ненормальними даними цікавими в цьому відношенні.

Слід зазначити, що тау Кендалла ( версія) має підключення до Сомерс D (і C Харрелл в) використовується для прогнозного моделювання (дивись , наприклад, Інтерпретація Сомерс D в рамках чотирьох простих моделей Р.Б. Ньюсона і посилання 6 в ньому, а також статті Ньюсона опубліковано в Stata Journal 2006). Огляд тестів за підсумковим рангом надається в Ефективному обчисленні інтервалів довіри до ножа для статистики рангів , опублікованому в JSS (2006).


Дякую chl за відповідь, я прийняв це за саму сферу його застосування. Найкраще, Таль
Тал Галілі

Спірмен, що використовується на двох цілих змінних, регулярно посилається на зв'язки, які, здається, краще справляються з тау Кендалла.
vinnief

29

Я посилаюсь на почесного джентльмена на свою попередню відповідь : "... інтервали довіри для r S Spearman менш надійні і менш інтерпретовані, ніж інтервали довіри для τ-параметрів Кендалла", згідно Kendall & Gibbons (1990).


1
Я думаю, що подяка належить Роджеру Ньюсону, про що я лише цитую його статтю.
onestop

22

Знову дещо філософська відповідь; основна відмінність полягає в тому, що Rho Спірмена - це спроба розширити ідею R ^ 2 (= "пояснення дисперсії") щодо нелінійних взаємодій, тоді як Тау Кендалла, скоріше, є тестовою статистикою для нелінійного тесту кореляції. Так, Тау слід використовувати для тестування нелінійних кореляцій, Rho як розширення R (або для людей, знайомих з R ^ 2 - пояснення Тау малодостовірній аудиторії в обмежений час болісно).


6
Ви можете пояснити, будь ласка, "нелінійні взаємодії". Схоже, Spearman Rho відображає міру коефіцієнта валідності з точки зору психометрії. Я не знаю про природу Тау.
Subhash C. Davar

Я не розумію, що стосується психометрії вашого коментаря.
Лео Леопольд Герц 준영

1
xx2

1
Це справедливо лише тоді, коли х неотрицательно.
aocall

17

Ось цитата Ендрю Гілпіна (1993), яка виступає за те, що Кендалл τ над Спірманом ρ з теоретичних причин:

"[Кендалл ] наближається до нормального розподілу швидше, ніж , оскільки , розмір вибірки збільшується; і також є більш простежуваним математично, особливо коли зв'язки є." τρNτ

Довідково

Гілпін, А.Р. (1993). Таблиця для перетворення Тау Кендалла в Rho Spearman в контексті вимірювання величини ефекту для мета-аналізу. Навчально-психологічний вимір, 53 (1), 87-92.


3

FWIW, цитата Myers & Well (дослідження дизайну та статистичний аналіз, друге видання, 2003, стор. 510). Якщо ви все ще дбаєте про p-значення;

Сейгель і Кастеллан (1988, непараметрична статистика для поведінкових наук) зазначають, що, хоча і Spearman , як правило, мають різні значення при обчисленні для одного і того ж набору даних, коли тести значущості для і Spearman базуються на їх розподілу вибірки вони отримають однакові p-значення .τρτρ


Чи знаєте ви, чи пропонують вони якусь підтримку щодо цієї претензії? Я не бачу, як це насправді може бути правдою взагалі (вони досить часто можуть бути схожими, але я дійсно не бачу, як може стверджуватися твердження про те, що вони будуть однаковими). [Цікаво, чи справді
Сіґель

Я перевірив Siegel & Castellan (2ed p253). Вони кажуть щось дещо інше ... але насправді це трохи гірше, ніж вищенаведений парафраза, навіть із додаванням "приблизно" (гірше, оскільки вони обмежують це так, щоб це було під нулем, але оскільки вони обумовлюють дані це не допоможе. У будь-якому випадку для фіксованого порядку всі можливі порядкові порядки однаково вірогідні за H0.) Факт, що вони думають, що кондиціонування на нулі після кондиціонування даних має значення, викликає занепокоєння. Цікаво, чи мали намір сказати щось інше, чи вони насправді неправильно розуміютьxy
Glen_b

В якості контрприкладу візьміть n = 7 і точні p-значення. Нехай x = 1,2,3,4,5,6,7, і y = 2,1,4,3,7,6,5 ... сперман дає p = 0,048, Кендалл дає 0,136 ... зовсім не схожий. Інша композиція дає однакове значення для кендала, але сперман має р = 0,302. Існує багато таких прикладів та різних розмірів вибірки
Glen_b

3
Ось сюжет для випадку n = 8. Як ви бачите , є багато варіацій між р-значеннями для двох показників кореляції: i.stack.imgur.com/5JMbj.png ... Я можу підправити Q & A на цьому
Glen_b

1
Ось два приклади наборів даних (після ранжирування), які показують два випадки (на цей раз з n = 9), де р-значення кореляції Спірмана однакові, але значення p кореляції Кендалла зовсім інші: i.stack.imgur. com / 3ILD8.png
Glen_b
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.