Запитання з тегом «pca»

Аналіз основних компонентів (PCA) - це метод лінійного зменшення розмірності. Це зводить багатоваріантний набір даних до меншого набору побудованих змінних, зберігаючи якомога більше інформації (стільки варіацій). Ці змінні, які називаються основними компонентами, є лінійними комбінаціями вхідних змінних.

1
PCA та кореспондентський аналіз у їхньому відношенні до Біплота
Біплот часто використовується для відображення результатів аналізу основних компонентів (та відповідних методик). Це подвійне або накладення розсіювання показуючи компонентів навантаження і компонентів оцінки одночасно. Сьогодні мене повідомив @amoeba, що він дав відповідь, відходячи від мого коментаря, на запитання, яке запитує про те, як виробляються / масштабуються координати біплотів; і його …

2
Як факторний аналіз пояснює коваріацію, тоді як PCA пояснює дисперсію?
Ось цитата з книги Бішопа "Розпізнавання образів та машинне навчання", розділ 12.2.4 "Факторний аналіз": У відповідності з виділеної частини, факторний аналіз фіксує ковариации між змінними в матриці WWW . Цікаво, ЯК ? Ось як я це розумію. Скажімо, xxx - спостережувана ppp -вимірна величина, WWW - матриця завантаження факторів, а …

3
Чи має ознака балів чи навантажень в PCA чи FA значення? Чи можу я перевернути знак?
Я провів аналіз основних компонентів (PCA) з R, використовуючи дві різні функції ( prcompі princomp), і зауважив, що бали PCA відрізняються за ознакою. Як це може бути? Врахуйте це: set.seed(999) prcomp(data.frame(1:10,rnorm(10)))$x PC1 PC2 [1,] -4.508620 -0.2567655 [2,] -3.373772 -1.1369417 [3,] -2.679669 1.0903445 [4,] -1.615837 0.7108631 [5,] -0.548879 0.3093389 [6,] 0.481756 …
37 r  pca  factor-analysis 

3
Лінійність PCA
Однак PCA вважається лінійною процедурою: PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),ПСА(Х)≠ПСА(Х1)+ПСА(Х2)+…+ПСА(Хн),\mathrm{PCA}(X)\neq \mathrm{PCA}(X_1)+\mathrm{PCA}(X_2)+\ldots+\mathrm{PCA}(X_n), де . Це означає, що власні вектори, отримані PCA на матрицях даних , не дорівнюють власним векторам, отриманим PCA, на суму матриць даних . Але не визначення лінійної функції :X=X1+X2+…+XnХ=Х1+Х2+…+ХнX=X_1+X_2+\ldots+X_nX i fXiХiX_iXiХiX_ifff f(x+y)=f(x)+f(y)?f(х+у)=f(х)+f(у)?f(x+y)=f(x)+f(y)? То чому PCA вважається "лінійним", якщо він не задовольняє цій …
35 pca  linear 

3
PCA і поїзд / тест розділилися
У мене є набір даних, для якого у мене є кілька наборів двійкових міток. Для кожного набору міток я готую класифікатор, оцінюючи його за допомогою перехресної перевірки. Я хочу зменшити розмірність за допомогою аналізу основних компонентів (PCA). Моє запитання: Чи можливо зробити PCA один раз для всього набору даних, а …

3
Чому t-SNE не використовується як метод зменшення розмірності для кластеризації чи класифікації?
У недавньому призначенні нам сказали використовувати PCA на цифрах MNIST, щоб зменшити розміри з 64 (8 x 8 зображень) до 2. Потім нам довелося кластеризувати цифри за допомогою Гауссової моделі суміші. PCA, що використовує лише 2 основних компоненти, не дає чітких кластерів, і в результаті модель не в змозі створити …

1
Яка інтуїтивно зрозуміла причина обертання у Факторному аналізі / PCA та як вибрати відповідне обертання?
Мої запитання Яка інтуїтивно зрозуміла причина обертання факторів у факторному аналізі (або компонентів у PCA)? Моє розуміння: якщо змінні майже однаково завантажені у верхніх компонентах (або факторах), то, очевидно, складно диференціювати компоненти. Тож у цьому випадку можна використовувати обертання для кращої диференціації компонентів. Це правильно? Які наслідки ротації? На які …

1
Як PCA допоможе в аналізі кластеризації k-означає?
Передумови : Я хочу класифікувати житлові райони міста на групи на основі їх соціально-економічних характеристик, включаючи щільність житлових одиниць, густоту населення, площу зелених насаджень, ціну житла, кількість шкіл / медичних центрів / дитсадок тощо. Хочу зрозуміти, на скільки різних груп можна розділити житлові райони та які їх унікальні характеристики. Ця …

1
Мета функції PCA: який зв'язок між максимальною дисперсією та мінімізацією помилок?
Алгоритм PCA можна сформулювати за допомогою кореляційної матриці (припустимо, що дані вже нормалізовані, і ми розглядаємо лише проекцію на перший ПК). Цільову функцію можна записати так:XXX maxw(Xw)T(Xw)s.t.wTw=1.maxw(Xw)T(Xw)s.t.wTw=1. \max_w (Xw)^T(Xw)\; \: \text{s.t.} \: \:w^Tw = 1. Це добре, і для його вирішення використовуємо множники Лагрангія, тобто переписуємо їх як: maxw[(Xw)T(Xw)−λwTw],maxw[(Xw)T(Xw)−λwTw], \max_w …
32 pca  optimization 

3
PCA щодо кореляції чи коваріації: чи PCA щодо кореляції коли-небудь має сенс? [зачинено]
В основному аналізі компонентів (PCA) можна вибрати або коваріаційну матрицю, або кореляційну матрицю, щоб знайти компоненти (з відповідних власних векторів). Вони дають різні результати (завантаження ПК та бали), оскільки власні вектори між обома матрицями не рівні. Я розумію, що це спричинене тим, що вектор і його стандартизація Z не можуть …

3
Побудова автоінкодера в Тенсдорфлоу, щоб перевершити PCA
Гінтон і Салаххутдінов у зменшенні розмірності даних за допомогою нейронних мереж Science 2006 запропонували нелінійну PCA шляхом використання глибокого автокодера. Я кілька разів намагався створити і навчити автокодер PCA з Tensorflow, але мені ніколи не вдалося отримати кращий результат, ніж лінійний PCA. Як я можу ефективно тренувати автокодер? (Пізніше редагуйте …

1
Зменшення розмірності (SVD або PCA) на великій розрідженій матриці
/ редагувати: подальше спостереження зараз ви можете використовувати irlba :: prcomp_irlba / редагувати: слідкувати за моєю власною публікацією. irlbaтепер є аргументи "центр" і "шкала", які дозволяють використовувати його для обчислення основних компонентів, наприклад: pc <- M %*% irlba(M, nv=5, nu=0, center=colMeans(M), right_only=TRUE)$v У мене є велика кількість розрізнених Matrixфункцій, які …

5
Виявлення значних прогнозів з багатьох незалежних змінних
У наборі даних про дві групи, що не перетинаються (пацієнти та здорові, загальна ), я хотів би знайти (із незалежних змінних) значних прогнозів для постійної залежної змінної. Кореляція між предикторами є. Мені цікаво з'ясувати, чи пов’язаний будь-який з предикторів із залежною змінною "насправді" (а не прогнозувати залежну змінну якомога точніше). …

3
Візуалізуючи мільйон, видання PCA
Чи можливо візуалізувати результати аналізу основних компонентів способами, які дають більше розуміння, ніж просто зведені таблиці? Чи можна це зробити, коли кількість спостережень велика, скажімо ~ 1e4? І чи можна це робити в R [інші середовища]?

4
Як виконати зменшення розмірності за допомогою PCA в R
У мене великий набір даних, і я хочу виконати зменшення розмірності. Зараз скрізь я читаю, що для цього можу використовувати PCA. Однак я все ще не можу отримати, що робити після розрахунку / виконання ПКС. У R це легко зробити за допомогою команди princomp. Але що робити після розрахунку PCA? …
30 r  pca 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.