Що це вказує, коли співвідношення Спірмена на певну суму менше, ніж Пірсон?


12

У мене є маса пов'язаних наборів даних. Перламутрові кореляції між їх парами, як правило, безумовно більші, ніж співвідношення спермана. Це говорить про те, що будь-яка кореляція є лінійною, але можна очікувати, що навіть якщо пером та сперман були однакові. Що це означає, коли існує певний розрив між кордоном та співвідношенням спермана та більший розмір груші? Здається, це є послідовною функцією для моїх наборів даних.


Дуже схоже запитання з великим відповіддю тут
Colin T Bowers

Відповіді:


14

Кореляція Спірмена - це лише кореляція Пірсона, використовуючи ранги (статистику порядку) замість фактичних числових значень. Відповідь на ваше запитання полягає в тому, що вони не вимірюють одне і те ж. Пірсон: лінійний тренд, Спірмен: монотонний тренд. Те, що кореляція Пірсона вище, означає, що лінійна кореляція більша за рангову кореляцію. Ймовірно, це пов'язано з впливовими спостереженнями в хвостах розподілу, які мають великий вплив відносно їх ранжированих значень. Випробування на асоціацію, що використовують кореляцію Пірсона, мають більшу силу, коли лінійність зберігається в даних.


1
Я знав, що сперман - це просто піани на рядах. Мені потрібно зрозуміти, чи можуть бути якісь інші маршрути, які також могли б спричинити це, але впливові спостереження за хвостами, які є лінійно корельованими, ніж основна маса даних, але які втрачають свій вплив при заміні їх рейтингу, безумовно, спричинить те, що я є бачачи.
Джон Робертсон

0

Кореляція Пірсона передбачає кілька припущень для його точності: 1) кожна змінна зазвичай розподілена; 2) гомоскедастичність, дисперсія кожної змінної залишається постійною; 3) Лінійність, тобто ділянка розсіяння, що зображує взаємозв'язок, показує точки даних, що симетрично розташовуються навколо лінії регресії.

Кореляція Спірмена - непараметрична альтернатива Пірсону, заснована на ранзі спостережень. Кореляція Спірмена дозволяє розслабити всі три припущення щодо набору даних та вивести кореляції, які все ще є досить точними.

З ваших даних випливає, що це, ймовірно, суттєво порушує одне або кілька згаданих припущень істотно, так що дві кореляції суттєво відрізняються.

З огляду на те, що у вас є великий розрив між двома кореляціями, ви повинні дослідити, чи змінні вашого набору даних є нормально розподіленими, гомосептичними та лінійними в межах діаграми розсіювання.

Наведене вище дослідження полегшить ваше рішення щодо того, чи є коефіцієнт кореляції Спірмена чи Пірсона більш репрезентативним.


2
Ви, напевно, думаєте про асоційований тест висновку, використовуючи -розподіл, а не описову міру. Однак, як правило, цей тест описується таким, що має інші припущення, ніж ті, які ви заявили. Наприклад, біваріантна нормальність, більш сильне припущення, ніж нормально нормальні розподіли. Будь ласка, надайте посилання на ваші заяви. t
каракал

4
Неправильно. Висновок про кореляцію Пірсона не потребує жодного з цих припущень. Можна було б мати криволінійний зв’язок з гетероседастичними, ненормальними даними, і тест кореляції Пірсона (який еквівалентний висновку для лінійної регресійної моделі) використовується для виявлення тенденції першого порядку. Інтерпретація кореляції Пірсона як сили тенденції першого порядку все ще зберігається. Мало обставин, коли тенденція першого порядку, виміряна кореляцією Пірсона, не є достатньою для аналізу.
AdamO
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.