Я припускаю, що частина цього питання полягає в тому, чи існують інші показники, крім кумулятивної відсоткової дисперсії (CPV) та аналогічного підходу сюжетного опису. Відповідь на це - так, багато .
Чудовий документ про деякі варіанти - Валле 1999:
Це стосується CPV, але також паралельного аналізу, перехресної перевірки, варіації помилки відновлення (VRE), методів, заснованих на інформаційних критеріях та ін. Ви можете дотримуватися рекомендацій, викладених у статті після порівняння та використання VRE, але перехресне підтвердження на основі PRESS також добре працює, на мій досвід, і вони отримують хороші результати і з цим. На мій досвід, CPV - це зручно і просто і робить гідну роботу, але ці два способи, як правило, краще.
Є й інші способи оцінити, наскільки хороша ваша модель PCA, якщо ви знаєте більше про дані. Один із способів - порівняти передбачувані навантаження PCA з справжніми, якщо ви їх знаєте (що б ви зробили при моделюванні). Це можна зробити, обчисливши зміщення розрахункових навантажень до справжніх. Чим більший ваш ухил, тим гірше ваша модель. Як це зробити, ви можете ознайомитись з цією статтею, де вони використовують цей підхід для порівняння методів. Він не використовується в реальних випадках, хоча ви не знаєте справжніх завантажень PCA. Це менше говорить про те, скільки компонентів ви вилучили, ніж про упередженість вашої моделі через вплив сторонніх спостережень, але вона все ще служить показником якості моделі.