Запитання з тегом «pca»

Аналіз основних компонентів (PCA) - це метод лінійного зменшення розмірності. Це зводить багатоваріантний набір даних до меншого набору побудованих змінних, зберігаючи якомога більше інформації (стільки варіацій). Ці змінні, які називаються основними компонентами, є лінійними комбінаціями вхідних змінних.

1
Який багаторазовий метод порівняння використовувати для lmer-моделі: lsmeans або glht?
Я аналізую набір даних, використовуючи модель змішаних ефектів з одним фіксованим ефектом (умовою) та двома випадковими ефектами (учасник, обумовлений в рамках проекту та пари). Модель була згенерована з lme4пакетом: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Далі я провів перевірку коефіцієнта ймовірності цієї моделі проти моделі без фіксованого ефекту (умови) і маю суттєву різницю. У моєму …

1
Чим відрізняється звичайна PCA від імовірнісної PCA?
Я знаю, що звичайний PCA не дотримується імовірнісної моделі спостережуваних даних. Отже, в чому полягає основна відмінність PCA від PPCA ? У латентній змінній моделі PPCA містяться, наприклад, спостережувані змінні , латентні (незабезпечені змінні x ) та матриця W , яка не повинна бути ортонормальною, як у звичайній PCA. Ще …
15 pca 

2
Створення єдиного індексу з декількох основних компонентів або факторів, збережених у PCA / FA
Я використовую аналіз основних компонентів (PCA) для створення індексу, необхідного для мого дослідження. Моє питання - як я повинен створити єдиний індекс, використовуючи збережені основні компоненти, обчислені за допомогою PCA. Наприклад, я вирішив зберегти 3 основні компоненти після використання PCA, і я обчислив бали для цих 3 основних компонентів. Які …

1
Регресія в налаштуваннях
Я намагаюся зрозуміти, чи варто йти на регресію хребта , LASSO , регресію основного компонента (PCR) або часткові найменші квадрати (PLS) у ситуації, коли існує велика кількість змінних / ознак ( ) та менша кількість зразків ( n < p ), і моя мета - передбачення.pppn<pn<pn np>10np>10np>10n Змінні ( і …


5
Чи можна використовувати декілька регресій для прогнозування одного основного компонента (ПК) від кількох інших ПК?
Нещодавно користувач у списку розсилки R-help запитав про надійність використання балів PCA в регресії. Користувач намагається використовувати деякі результати на ПК, щоб пояснити зміни в іншому ПК (див. Повну дискусію тут ). Відповідь була: ні, це не звучить, оскільки ПК є ортогональними один для одного. Чи може хтось пояснити трохи …
15 regression  pca 

1
Чи є необхідна кількість дисперсії, зібрана PCA, щоб зробити пізніші аналізи?
У мене є набір даних з 11 змінними і PCA (ортогональний) було зроблено для зменшення даних. Визначивши кількість компонентів, які потрібно зберегти, для мене було видно з моїх знань про тему та графік обстеження (див. Нижче), що двох основних компонентів (ПК) було достатньо для пояснення даних, а інші компоненти були …
15 variance  pca 

4
Які змінні пояснюють, які компоненти PCA, і навпаки?
Використовуючи ці дані: head(USArrests) nrow(USArrests) Я можу зробити PCA так: plot(USArrests) otherPCA <- princomp(USArrests) Я можу отримати нові компоненти otherPCA$scores і частка дисперсії, поясненої компонентами з summary(otherPCA) Але що робити, якщо я хочу знати, які змінні в основному пояснюються основними компонентами? І навпаки: пояснюється, наприклад, PC1 або PC2 murder? Як …

1
У чому значення власних векторів взаємної інформаційної матриці?
Дивлячись на власні вектори матриці коваріації, ми отримуємо напрями максимальної дисперсії (перший власний вектор - це напрямок, у якому дані найбільше змінюються тощо); це називається основним компонентним аналізом (PCA). Мені було цікаво, що значить би дивитись на власні вектори / значення матриці взаємної інформації, чи вказували б вони у напрямку …

1
Як "Основна теорія факторного аналізу" застосовується до PCA, або як визначаються навантаження PCA?
Зараз я переживаю слайд, який я маю для "факторного аналізу" (PCA, наскільки я можу сказати). У ній виведена "фундаментальна теорема факторного аналізу", яка стверджує, що матрицю кореляції даних, що надходять в аналіз ( ), можна відновити за допомогою матриці факторних навантажень ( A ):RR\bf RAA\bf A R = A A⊤R=AA⊤\bf …

2
Чому сферичність, діагностована Тестом Бартлетта, означає, що PCA є невідповідним?
Я розумію, що Тест Бартлетта стосується визначення того, чи є ваші зразки з популяцій з однаковими відмінностями. Якщо вибірки є з популяцій з однаковими дисперсіями, то ми не можемо відкинути нульову гіпотезу тесту, і тому аналіз основних компонентів є недоцільним. Я не впевнений, де криється проблема з цією ситуацією (маючи …

3
PCA на текстових даних з великими розмірами до випадкової лісової класифікації?
Чи є сенс робити PCA перед проведенням випадкової лісової класифікації? Я маю справу з текстовими даними з високими розмірами, і я хочу зробити зменшення функції, щоб уникнути прокляття розмірності, але чи не випадкові ліси вже мають якесь зменшення розмірності?

1
Що означають стрілки в біколоті PCA?
Розглянемо наступний PCAP біплот: library(mvtnorm) set.seed(1) x <- rmvnorm(2000, rep(0, 6), diag(c(5, rep(1,5)))) x <- scale(x, center=T, scale=F) pc <- princomp(x) biplot(pc) Існує купа червоних стрілок, що вони означають? Я знав, що перша стрілка, позначена символом "Var1", повинна вказувати на самий різний напрямок набору даних (якщо ми вважаємо їх 2000 …
14 r  pca  linear-algebra  biplot 

3
Як я можу інтерпретувати те, що я отримую з PCA?
Як частина завдання університету, я повинен провести попередню обробку даних на досить величезному, багатоваріантному (> 10) необробленому наборі даних. Я не статистик у будь-якому сенсі цього слова, тому я трохи розгублений у тому, що відбувається. Заздалегідь вибачте за те, що, мабуть, смішно просте запитання - моя голова крутилася після перегляду …
14 pca 

2
Чи можу я використовувати CLR (централізоване перетворення коефіцієнта журналу) для підготовки даних для PCA?
Я використовую сценарій. Це для основних записів. У мене є кадр даних, який показує різні елементарні композиції в стовпцях на заданій глибині (у першому стовпці). Я хочу виконати з нею PCA, і я плутаюсь щодо методу стандартизації, який я повинен вибрати. Хто-небудь з вас використовував цю програму clr()для підготовки ваших …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.