Запитання з тегом «pca»

Аналіз основних компонентів (PCA) - це метод лінійного зменшення розмірності. Це зводить багатоваріантний набір даних до меншого набору побудованих змінних, зберігаючи якомога більше інформації (стільки варіацій). Ці змінні, які називаються основними компонентами, є лінійними комбінаціями вхідних змінних.

1
У дослідженнях асоціації, пов’язаних з геномом, які основні компоненти?
У дослідженнях асоціації, пов’язаних з геномом (GWAS): Які основні компоненти? Для чого вони використовуються? Як вони обчислюються? Чи можна проводити дослідження асоціації, пов’язане з геном, без використання PCA?
20 pca  genetics  gwas 

1
Геометричне розуміння PCA у предметному (подвійному) просторі
Я намагаюся зрозуміти, як працює аналіз основних компонентів (PCA) у предметному (подвійному) просторі . Розглянемо 2D набір даних з двома змінними, x1x1x_1 і , і точок даних (матриця даних дорівнює та передбачається центром). Звичайна презентація PCA полягає в тому, що ми розглядаємо точок у , записуємо матрицю коваріації та знаходимо …

2
Як інтерпретувати PCA за даними часових рядів?
Я намагаюся зрозуміти використання PCA в останній статті журналу під назвою "Зображення мозкової активності в масштабі з кластерними обчисленнями" Freeman et al., 2014 (безкоштовний pdf доступний на веб-сайті лабораторії ). Вони використовують PCA за даними часових рядів і використовують ваги PCA для створення карти мозку. Дані - це дані середнього …

1
Не нормалізація даних до PCA дає краще пояснене співвідношення дисперсії
Я нормалізував мій набір даних, потім запустив 3-х компонентний PCA, щоб отримати невеликі пояснені коефіцієнти дисперсії ([0,50, 0,1, 0,05]). Коли я не нормалізував, а побілив мій набір даних, то побіг 3-компонентний PCA, я отримав високі пояснені коефіцієнти дисперсії ([0.86, 0.06,0.01]). Оскільки я хочу зберегти якомога більше даних у 3-х компонентах, …
19 pca 

2
PCA та дослідницький факторний аналіз на одному і тому ж наборі даних: відмінності та схожість; факторна модель проти PCA
Мені хотілося б знати, чи є логічний сенс проводити аналіз основних компонентів (PCA) та дослідницький факторний аналіз (EFA) на одному і тому ж наборі даних. Я чув, що фахівці прямо рекомендують: Зрозуміти, яка мета аналізу, і вибрати PCA або EFA для аналізу даних; Зробивши один аналіз, не потрібно робити іншого …

3
Зв'язок між регресією хребта та регресією PCA
Я пам’ятаю, що десь в Інтернеті прочитав зв’язок між регресією хребта (з регуляризацією) та регресією PCA: використовуючи регресію з гіперпараметром , якщо , то регресія еквівалентна видаленню ПК змінна з найменшим власним значенням.ℓ2ℓ2\ell_2ℓ2ℓ2\ell_2λλ\lambdaλ → 0λ→0\lambda \to 0 Чому це правда? Чи має це щось спільне з процедурою оптимізації? Наївно, я …

1
Розміщення стрілок на біплоті PCA
Я хочу реалізувати біплот для аналізу основних компонентів (PCA) в JavaScript. Моє запитання полягає в тому, як я можу визначити координати стрілок з виводу сингулярного розкладання вектора (SVD) матриці даних?U,V,DU,V,DU,V,D Ось приклад біплота виробництва R: biplot(prcomp(iris[,1:4])) Я спробував розглянути це у статті Вікіпедії про біплот, але це не дуже корисно. …
18 pca  svd  biplot 

1
Сліпого розділення опуклої суміші?
Припустимо, у мене є незалежних джерел, і я спостерігаю опуклі суміші: Х 1 , Х 2 , . . . , X n m Y 1nnnX1,X2,...,XnX1,X2,...,XnX_1, X_2, ..., X_nmmmY1...Ym=a11X1+a12X2+⋯+a1nXn=am1X1+am2X2+⋯+amnXnY1=a11X1+a12X2+⋯+a1nXn...Ym=am1X1+am2X2+⋯+amnXn\begin{align} Y_1 &= a_{11}X_1 + a_{12}X_2 + \cdots + a_{1n}X_n\\ ...&\\ Y_m &= a_{m1}X_1 + a_{m2}X_2 + \cdots + a_{mn}X_n \end{align} з …
18 pca  ica 

1
Як відбілити дані за допомогою аналізу основних компонентів?
Я хочу перетворити свої дані таким чином, що відхилення будуть одна, а коваріації будуть нульовими (тобто я хочу відбілити дані). Крім того, засіб має бути нульовим.ХX\mathbf X Я знаю, що потраплю туди, зробивши Z-стандартизацію та перетворення PCA, але в якому порядку я повинен їх робити? Додам, що складене відбілююче перетворення …

1
Що саме називається "головним компонентом" в PCA?
Припустимо є вектор , який максимізує дисперсію проекції даних з конструкцією матриці .XуuuХXX Тепер я бачив матеріали, які називають (першим) основним компонентом даних, який також є власним вектором з найбільшим власним значенням.уuu Однак я також бачив, що основною складовою даних є .ХуXuX u Очевидно, і і різні речі. Хто-небудь може …

2
Компоненти з низькою дисперсією в PCA, чи вони справді просто шум? Чи є спосіб перевірити це?
Я намагаюся вирішити, чи буде зберігатися компонент PCA, чи ні. Існує gazillion критеріїв, заснованих на величині власного значення, описаного та порівняного, наприклад, тут чи тут . Однак у моїй заяві я знаю, що мале (est) власне значення буде малим порівняно з великим (st) власним значенням, і всі критерії, засновані на …
18 pca 

2
Які чотири осі на біплоті PCA?
Коли ви будуєте біплот для аналізу PCA, у вас є основні компоненти компонентів PC1 на осі x, а PC2 - на осі y. Але які дві інші осі праворуч і вгорі екрана?
18 r  pca  biplot 

1
Які переваги ядра PCA перед звичайним PCA?
Я хочу реалізувати алгоритм у статті, яка використовує ядро ​​SVD для розкладання матриці даних. Тому я читав матеріали про методи ядра та PCA ядра тощо. Але це все ще дуже незрозуміло для мене, особливо якщо мова йде про математичні деталі, і у мене є кілька питань. Чому методи ядра? Або …
18 pca  svd  kernel-trick 

3
Чому ми розділяємо стандартне відхилення, а не якийсь інший стандартизуючий коефіцієнт, перш ніж робити PCA?
Я читав таке обґрунтування (із записів до курсу cs229) про те, чому ми ділимо вихідні дані на його стандартне відхилення: незважаючи на те, що я розумію, про що йдеться в поясненні, мені незрозуміло, чому поділ на стандартне відхилення дозволить досягти такої мети. Це говорить так, що всі більше на тій …

2
Аналіз зважених основних компонентів
Після деяких пошуків я знаходжу дуже мало щодо включення ваг спостереження / помилок вимірювань у аналіз основних компонентів. Те, що я знаходжу, зазвичай покладається на ітеративний підхід до включення зважувань (наприклад, тут ). Моє запитання, чому такий підхід необхідний? Чому ми не можемо використовувати власні вектори зваженої матриці коваріації?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.