Запитання з тегом «pca»

Аналіз основних компонентів (PCA) - це метод лінійного зменшення розмірності. Це зводить багатоваріантний набір даних до меншого набору побудованих змінних, зберігаючи якомога більше інформації (стільки варіацій). Ці змінні, які називаються основними компонентами, є лінійними комбінаціями вхідних змінних.

1
Як вибрати ядро ​​для PCA ядра?
Які способи вибрати, яке ядро ​​призведе до гарного поділу даних у кінцевому виведенні даних за допомогою PCA ядра (аналіз основних компонентів), і які способи оптимізації параметрів ядра? Якщо можливо, умови Лаймана були б дуже вдячні, і посилання на документи, що пояснюють такі методи, також були б непоганими.

3
Чому ми використовуємо PCA для прискорення алгоритмів навчання, коли ми могли просто зменшити кількість функцій?
Під час курсу машинного навчання я дізнався, що одне поширене використання PCA ( Principal Component Analysis ) - це прискорити інші алгоритми машинного навчання. Наприклад, уявіть, що ви тренуєте логістичну модель регресії. Якщо у вас є навчальний набір для i від 1 до n, і виявляється, що розмір вашого вектора …

1
Етапи, зроблені при факторному аналізі порівняно з кроками, виконаними в PCA
Я знаю, як виконати PCA (аналіз основних компонентів), але я хотів би знати кроки, які слід використовувати для факторного аналізу. Для виконання PCA розглянемо , наприклад, матрицю :AAA 3 1 -1 2 4 0 4 -2 -5 11 22 20 Я обчислив його кореляційну матрицю B = corr(A): 1.0000 0.9087 …

4
Вибір моделі PCA за допомогою AIC (або BIC)
Я хочу використати інформаційний критерій Akaike (AIC), щоб вибрати відповідну кількість факторів для вилучення в PCA. Єдине питання полягає в тому, що я не впевнений, як визначити кількість параметрів. Розглянемо матрицю , де представляє кількість змінних, а кількість спостережень, таких що . Оскільки матриця коваріації симетрична, то при максимальній оцінці …

2
PCA та випадкові ліси
Для нещодавнього змагання Kaggle я (вручну) визначив 10 додаткових функцій для мого навчального набору, які потім будуть використовуватися для тренування випадкового класифікатора лісів. Я вирішив запустити PCA на набір даних з новими функціями, щоб побачити, як вони порівнюють один одного. Я виявив, що ~ 98% дисперсії несе перший компонент (перший …

5
Чи можна використовувати PCA, щоб зробити змінний вибір для кластерного аналізу?
Я повинен зменшити кількість змінних для проведення кластерного аналізу. Мої змінні сильно корелюються, тому я думав зробити факторний аналіз PCA (аналіз основних компонентів). Однак якщо я використовую отримані оцінки, мої кластери не зовсім коректні (порівняно з попередніми класифікаціями в літературі). Питання: Чи можу я використовувати матрицю обертання для вибору змінних …

2
Які максимізують перші чинники факторного аналізу?
При аналізі основних компонентів першими основними компонентами є ортогональні напрямки з максимальною дисперсією. Іншими словами, перший головний компонент вибирається як напрямок максимальної дисперсії, другий головний компонент вибирається як напрямок, ортогональний до першого з максимальною дисперсією тощо.kкkkкkk Чи існує аналогічне тлумачення факторного аналізу? Наприклад, я думаю, що перші фактори - це …

2
Як використовувати аналіз основних компонентів для вибору змінних для регресії?
В даний час я використовую аналіз основних компонентів для вибору змінних, які використовуватимуться при моделюванні. На даний момент я роблю вимірювання A, B і C у своїх експериментах. Що я дійсно хочу знати: чи можу я зробити менше вимірювань і припинити запис C і або B, щоб заощадити час і …

1
Різниця між впровадженнями наукових програм PCA і TruncatedSVD
Я розумію взаємозв'язок між основним компонентним аналізом та сингулярним декомпозицією значення на алгебраїчному / точному рівні. Моє запитання щодо реалізації scikit-learn . Документація говорить: " [усіченийSVD] дуже схожий на PCA, але працює на вибіркових векторах безпосередньо, а не на коваріаційній матриці. ", Що відображало б алгебраїчну різницю між обома підходами. …
12 pca  scikit-learn  svd  scipy 

2
Як виконати перехресну перевірку PCA для визначення кількості основних компонентів?
Я намагаюся написати власну функцію для аналізу основних компонентів, PCA (звичайно, там вже багато написано, але мені просто цікаво реалізувати речі власноруч). Основна проблема, з якою я зіткнулася, - це крос перехресної перевірки та обчислення прогнозованої суми квадратів (PRESS). Не має значення, яку перехресну валідацію я використовую, це питання головним …

4
Виконання PCA лише матрицею відстані
Я хочу об'єднати масивний набір даних, для якого у мене є лише попарні відстані. Я реалізував алгоритм k-medoids, але це займає занадто багато часу, тому я хотів би почати, зменшивши розмір моєї проблеми, застосувавши PCA. Однак єдиним способом, яким я знаю виконати цей метод, є використання матриці коваріації, якої у …

2
Чи унікальні рішення PCA?
Коли я запускаю PCA на певному наборі даних, чи рішення мені надається унікальним? Тобто, я отримую набір 2d координат на основі проміжних відстаней. Чи можливо знайти хоча б ще одне розташування точок, яке б відповідало цим обмеженням? Якщо відповідь "так", як я можу знайти таке різне рішення?
12 pca 

4
Як виконати PCA для даних дуже високої розмірності?
Щоб виконати аналіз основних компонентів (PCA), ви повинні відняти засоби кожного стовпця з даних, обчислити матрицю коефіцієнтів кореляції, а потім знайти власні вектори та власні значення. Ну, швидше, це те, що я зробив для його реалізації в Python, за винятком того, що він працює лише з невеликими матрицями, оскільки метод …
12 pca  python 

3
Чи є якесь значення зменшення розмірності набору даних, де всі змінні приблизно ортогональні?
Припустимо, у мене є -вимірний набір даних, де розміри приблизно ортогональні (мають нульову кореляцію).NNNNNNN Чи є якась утиліта з точки зору: Візуалізація Представлення (для ефективності класифікатора) Або інші критерії виконати зменшення розмірності даних?

1
Яка різниця між "навантаженнями" та "кореляційними навантаженнями" в PCA та PLS?
Одне загальне, що потрібно робити при аналізі головних компонентів (PCA) - це побудувати два навантаження один на одного для дослідження взаємозв'язків між змінними. У документі, що супроводжує пакет PLS R для регресії головних компонентів та регресії PLS, є інший графік, який називається графіком кореляційних навантажень (див. Рисунок 7 та сторінку …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.