Канонічний кореляційний аналіз із ранговою кореляцією


15

Канонічний кореляційний аналіз (CCA) має на меті максимізувати звичайну кореляцію Пірсона між продуктом і моментом (тобто коефіцієнт лінійної кореляції) лінійних комбінацій двох наборів даних.

Тепер розглянемо той факт , що цей коефіцієнт кореляції тільки вимірює лінійні асоціацій - це причина того, чому ми використовуємо, наприклад, Spearman- ρ або Кендал з'єднання (ранг) коефіцієнти кореляції вимірюють довільний монотонний (не обов'язково лінійна) між змінними.τ

Отже, я думав про наступне: одне обмеження CCA полягає в тому, що він лише намагається зафіксувати лінійну асоціацію між сформованими лінійними комбінаціями завдяки своїй цільовій функції. Не було б можливо розширити CCA в якому - то сенсі, максимізуючи, скажімо, Spearman- замість Pearson- ?ρr

Чи призвела б така процедура до чогось статистично інтерпретаційного та змістовного? (Чи має сенс - наприклад - виконувати CCA у рангах ...?) Мені цікаво, чи допоможе це, коли ми маємо справу з ненормальними даними ...


4
Чи подобається вам НЕПОЗНАЧЕННЯ - лінійний канонічний аналіз, який оптимально масштабує (монотонно перетворює) змінні для максимізації канонічних кореляцій?
ttnphns

@ttnphns: Дякую за ідею, я про неї раніше не чув і виглядає дуже цікаво! Однак я не думаю, що це стосується питання: наскільки я розумію, це по суті поєднання оптимального масштабування та CCA - але оптимальне масштабування має сенс лише для категоричних змінних. Схоже, це не сильно змінюється для постійних змінних, виміряних за шкалою відношення (що я маю на увазі!). Але виправте мене, якщо я помиляюся.
Tamas Ferenci

1
@ttnphns: Ну, так само, як ви іноді використовуєте співвідношення Спірмена на безперервних змінних! (Звичайно, він обробляє дані як порядкові ... але ми ніколи не використовуємо їх на безумовно безперервних змінних для характеристики загальної монотонної (і не тільки лінійної) асоціації між змінними.) Тому я вважав, що це має сенс і в CCA ...
Тамас Ференці

@Glen_b, ти маєш рацію. Зрозуміло, рангові кореляції мають будь-яку монотонність - будь то порядкові чи безперервні дані. Я настільки здивований своїм власним коментарем вище, що видаляю його.
ttnphns

Ви можете спробувати використати Kernel CCA, що конкретно при використанні з радіальними базовими функціями дозволяє нам проектувати дані в нескінченний розмірний підпростір.
roni

Відповіді:


6

Я використовував обмежені кубічні розширення сплайну при обчисленні канонічних змінних. Ви додаєте нелінійні базові функції до аналізу точно так, як додавали б нові функції. Це призводить до нелінійного аналізу основних компонентів. Див R Hmiscпакет «s transcanфункції для прикладу. R homalsпакет займає це набагато далі.


1
Дякую! Підхід, описаний у домашніх, був для мене новим, але, безумовно, цікавим.
Тамас Ференці

4

Стандартний метод CCA працює з матрицею коефіцієнта кореляції моменту продукту. Для найбільшої величини КК він створює дві складові змінні z1 (n) і z2 (n) лінійною комбінацією двох матриць (з n рядками і m1 і m2 змінними), так що abs (кореляція (z1, z2)) є максимальною. Ця цільова функція може бути досягнута безпосередньо, навіть якщо кореляція (z1, z2) не є продуктом моменту, а визначена по-іншому.

Mishra, SK (2009) "Примітка про аналіз ординального канонічного кореляції двох наборів рейтингових оцінок"

http://papers.ssrn.com/sol3/papers.cfm?abrief_id=1328319

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.