Я хочу зменшити розмірність систем вищого порядку і захопити більшу частину коваріації на переважно двовимірне або 1 мірне поле. Я розумію, що це можна зробити за допомогою аналізу основних компонентів, і я використовував PCA у багатьох сценаріях. Однак я ніколи не використовував його з булевими типами даних, і мені було цікаво, чи є сенс робити PCA з цим набором. Так, наприклад, зробіть вигляд, що у мене є якісні або описові показники, і я призначаю "1", якщо цей показник дійсний для цього виміру, і "0", якщо його немає (двійкові дані). Так, наприклад, зробіть вигляд, що ви намагаєтесь порівняти сім гномів у Білосніжці. Ми маємо:
Doc, Dopey, Bashful, Grumpy, Sneezy, Sleepy і Happy, і ви хочете влаштувати їх на основі якостей, і зробили так, як це:
Так, наприклад, Bashful має непереносимість лактози і не перебуває у списку честі A. Це суто гіпотетична матриця, і моя реальна матриця матиме ще багато описових стовпців. Моє запитання: чи все-таки було б доречно робити PCA на цій матриці як засіб пошуку подібності між особами?
a means of finding the similarity between individuals
. Але це завдання для кластерного аналізу, а не PCA.