Я знаю, що мета PCA - зменшити розмірність
Люди часто це припускають, але насправді PCA - це лише представлення ваших даних на ортогональній основі. Ця основа все ще має ту саму розмірність, що і ваші вихідні дані. Нічого не втрачено ... ще. Частина зменшення розмірності повністю залежить від вас. Те, що PCA забезпечує, - це те, що верхні розміри вашої нової проекції є найкращими розмірами, якими можуть бути представлені ваші дані. Що найкраще означає? Ось тут і пояснюється дисперсія.k k
очевидно, не в цьому випадку
Я б не був так впевнений у цьому! З вашого другого сюжету візуально виглядає так, що багато інформації з ваших даних можна спроектувати на горизонтальну лінію. Це 1 вимір, а не оригінальний сюжет, який був у двох вимірах! Очевидно, що ви втрачаєте деяку інформацію, оскільки ви видаляєте вісь Y, але чи прийнятна ця втрата інформації, це ваш дзвінок.
Є багато питань, що стосуються того, що PCA є на сайті, тому я рекомендую вам перевірити їх тут , тут , тут або тут . Якщо у вас є інші запитання після цього, будь ласка, опублікуйте їх, і я з радістю допоможу.
Як власне питання:
яку історію ви можете розповісти про температуру проти морозива в сюжеті PCA?
Оскільки нові координатні осі є лінійною комбінацією вихідних координат, то ... в основному нічого! PCA дасть вам відповідь на кшталт (складені числа):
PC1PC2=2.5×ice cream−3.6×temperature=−1.5×ice cream+0.6×temperature
Це вам корисно? Можливо. Але я б не здогадався :)
Відредаговано
Я додам цей ресурс, який, на мою думку, є корисним, оскільки інтерактивні діаграми є класними.
Знову відредаговано
Щоб уточнити, що найкраще означаєk
PCA намагається знайти розміри, які дають найбільшу дисперсію, коли дані проектуються на них. Якщо припустити, що ваші дані мають розміри, перші ПК пояснюють більшу дисперсію ваших даних, ніж будь-які інші розміри. Ось що я маю на увазі під найкращим . Незалежно від того, чи це вам корисно, чи ні.n>kkk k