Читаючи Вікіпедію про канонічний кореляційний аналіз (CCA) для двох випадкових векторів і , мені було цікаво, чи головний компонентний анліз (PCA) такий, як CCA, коли ?
Читаючи Вікіпедію про канонічний кореляційний аналіз (CCA) для двох випадкових векторів і , мені було цікаво, чи головний компонентний анліз (PCA) такий, як CCA, коли ?
Відповіді:
Нехай - а - матриць даних, що представляють два набори даних із вибірками (тобто спостереження за вашими випадковими векторами рядків та ) у кожному з них.
CCA шукає лінійну комбінацію змінних у та лінійну комбінацію змінних у таким чином, щоб вони були максимально співвіднесені між собою; тоді вона шукає наступну пару, під обмеженням нульової кореляції з першою парою; тощо.
У випадку (і ) будь-яка лінійна комбінація в одному наборі даних тривіально має кореляцію з тією ж лінійною комбінацією в іншому наборі даних. Отже, всі пари CCA матимуть кореляції , а порядок пар довільний. Єдине обмеження, що залишається, полягає в тому, що лінійні комбінації повинні бути неспорідненими між собою. Існує нескінченна кількість способів вибору неспоріднених лінійних комбінацій (зауважте, що ваги не повинні бути ортогональними в -вимірному просторі), і будь-який з них дасть дійсне рішення CCA. Один із таких способів дійсно дається PCA, оскільки будь-які два ПК мають нульову кореляцію.
Таким чином, рішення PCA дійсно буде дійсним рішенням CCA, але в цьому випадку існує нескінченна кількість не менш хороших рішень CCA.
Математично CCA шукає правий ( ) і лівий ( ) сингулярні вектори , що в цьому випадку дорівнює , при цьому будь-який вектор є власним вектором. Отже може бути довільним. Потім CCA отримує лінійні комбіновані ваги як і . У цьому випадку воно зводиться до прийняття довільної основи і перетворення його в , що справді дасть некорельовані напрямки .
vectors X and Y
це дві змінні (стовпці даних) або два випадки (рядки); враховуючи, що ми будемо проводити аналіз змінних. 2)X and Y are the same
Ви хотіли сказати, що X = Y або будь-який інший шлях?