Передумови: Я запитав сотні учасників мого опитування, наскільки вони зацікавлені у вибраних областях (п’ятибальною шкалою Лікерта, 1 зазначає "не зацікавлений" та 5 - "зацікавлений").
Потім я спробував PCA. На малюнку нижче - проекція перших двох основних компонентів. Кольори використовуються для статі, а стрілки PCA - оригінальні змінні (тобто інтереси).
Я помітив що:
- Точки (респонденти) досить добре розділені другим компонентом.
- Не залишилось жодної точки стрілки.
- Деякі стрілки значно коротші за інші.
- Змінні, як правило, створюють кластери, але не спостереження.
- Здається, що стрілки, спрямовані вниз (на чоловіків), - це в основному інтереси чоловіків, а стрілки вгору - в основному інтереси жінок.
- Деякі стрілки не спрямовані ні вниз, ні вгору.
Запитання: Як правильно інтерпретувати відносини між крапками (респондентами), кольорами (стать) та стрілками (змінними)? Які ще висновки щодо респондентів та їх інтересів можна отримати з цього сюжету?
Дані можна знайти тут .