Я дізнався про PCA кілька лекцій тому на уроці, і, переконуючись більше про цю захоплюючу концепцію, я дізнався про рідкісний PCA.
Мені хотілося запитати, чи не помиляюсь, це таке рідкісне PCA: У PCA, якщо у вас є точок даних із змінними, ви можете представляти кожну точку даних у розмірному просторі перед застосуванням PCA. Після застосування PCA ви можете знову представити його в тому ж розмірному просторі, але, на цей раз, перший головний компонент буде містити найбільшу дисперсію, другий буде містити другий самий дисперсійний напрямок тощо. Таким чином, ви можете усунути останні кілька основних компонентів, оскільки вони не спричинять багато втрат даних, і ви можете стиснути дані. Правильно?п
Рідкий PCA вибирає основні компоненти таким чином, щоб ці компоненти містили менше ненульових значень у своїх векторних коефіцієнтах.
Як це має допомогти вам краще інтерпретувати дані? Хтось може навести приклад?