Як відбілити дані за допомогою аналізу основних компонентів?


18

Я хочу перетворити свої дані таким чином, що відхилення будуть одна, а коваріації будуть нульовими (тобто я хочу відбілити дані). Крім того, засіб має бути нульовим.X

Я знаю, що потраплю туди, зробивши Z-стандартизацію та перетворення PCA, але в якому порядку я повинен їх робити?

Додам, що складене відбілююче перетворення повинно мати вигляд .xWx+b

Чи існує метод, подібний до PCA, який виконує саме ці перетворення і дає мені формулу виду вище?


(Перший мій коментар був заснований на неправильному читанні вашого запитання.) PCA дає вам нульові коваріації; Ви можете стандартизувати ПК згодом, якщо бажаєте. Це здається дивним, але ви можете це зробити.
Нік Кокс

@ NickCox Можливо, це здається дивним, оскільки трансформовані дані тоді сферичні, що здається неінформативним. Однак мені потрібно знати саме перетворення, а не кінцевий результат. Досі не знаю, як виглядатиме трансформація. Я все ще читаю на PCA, хоча.
Angelorf

Відповіді:


31

Спочатку ви отримуєте середній нуль, віднімаючи середнє значення μ=1Nx .

По-друге, ви отримуєте нуль covariances, роблячи PCA. Якщо є ковариационной матрицею даних, то PCA становить виконання eigendecomposition , де є ортогональна матриця обертання, що складається з власних векторів , та - діагональна матриця із власними значеннями по діагоналі. Матриця дає поворот, необхідний для декореляції даних (тобто відображає оригінальні функції до основних компонентів).ΣΣ=UΛUUΣΛU

По-третє, після обертання кожен компонент матиме дисперсію, задану відповідним власним значенням. Отже, щоб відхилення дорівнювали , потрібно розділити на квадратний корінь .1Λ

Всі разом перетворення відбілювання - . Ви можете відкрити дужки, щоб отримати потрібну форму.xΛ1/2U(xμ)


Оновлення. Дивіться також цю пізню нитку для більш детальної інформації: Чим відрізняється відбілювання від ZCA та відбілювання PCA?


2
Я думаю, вам потрібно розділити квадратні корені власних значень, оскільки це питання масштабування за SD, а не дисперсії.
Нік Кокс

@NickCox: так, звичайно, ти маєш рацію. Я виправив свою відповідь. Дякую!
амеба каже, що повернеться Моніка

1
Я емпірично підтвердив формулу. Дякуємо, що допомогли мені!
Angelorf
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.