Чому сферичність, діагностована Тестом Бартлетта, означає, що PCA є невідповідним?


14

Я розумію, що Тест Бартлетта стосується визначення того, чи є ваші зразки з популяцій з однаковими відмінностями.

Якщо вибірки є з популяцій з однаковими дисперсіями, то ми не можемо відкинути нульову гіпотезу тесту, і тому аналіз основних компонентів є недоцільним.

Я не впевнений, де криється проблема з цією ситуацією (маючи набір даних гомоскедастики). У чому полягає проблема з набором даних, де базовий розподіл усіх ваших даних однаковий? Я просто не бачу великої справи, якщо ця умова існує. Чому це зробить PCA недоцільним?

Я не можу знайти будь-яку хорошу інформацію в Інтернеті. Хтось має досвід інтерпретації, чому цей тест має відношення до PCA?

Відповіді:


15

У відповідь на назву питання.

1

Уявіть собі, що багатоваріантна хмара абсолютно сферична (тобто її коваріаційна матриця пропорційна матриці тотожності). Тоді 1) будь-які довільні розміри можуть обслуговувати основні компоненти, тому рішення PCA не є унікальним; 2) всі компоненти мають однакові дисперсії (власні значення), тому PCA не може допомогти зменшити дані.

Уявіть другий випадок, коли багатоваріантна хмара еліпсоїдальна з довгастістю строго по осях змінних (тобто її матриця коваріації є діагональною: всі значення дорівнюють нулю, крім діагоналі). Тоді обертання, що має на увазі перетворення PCA, буде нульовим; Основними компонентами є самі змінні, лише упорядковані та потенційно повернені до знаків. Це банальний результат: жоден PCA не був потрібний для відмови від слабких розмірів для зменшення даних.


1


14

Схоже, є два тести, які називаються тестом Бартлетта . Той, на який ви посилаєтесь (1937), визначає, чи є ваші зразки з популяцій з однаковими відмінностями. Здається ще одна перевірка того, чи є кореляційна матриця для набору даних матрицею ідентичності (1951). Це має більше сенсу, що ви не запускали PCA на даних за допомогою матриці кореляції ідентичності, оскільки ви просто отримаєте назад свої оригінальні змінні, оскільки вони вже некорельовані. Порівняйте, наприклад,


2
+1 Це вирішує плутанину краще, ніж інша відповідь.
HelloWorld
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.