Існує багато різних способів виготовлення біплота PCA, тому немає однозначної відповіді на ваше запитання. Ось короткий огляд.
Ми припускаємо, що матриця даних має n точок даних у рядках і є по центру (тобто кошти стовпців - це всі нулі). Наразі ми не припускаємо, що вона була стандартизованою, тобто ми розглядаємо PCA на коваріаційній матриці (а не на кореляційній матриці). PCA дорівнює сингулярному розкладанню значення X = U SХнви можете ознайомитись з моєю відповіддю:Зв'язок між SVD та PCA. Як використовувати SVD для виконання PCA?
X = U S V⊤,
У біплоті PCA два перші основні компоненти побудовані у вигляді діаграми розсіювання, тобто перший стовпчик побудований проти другого стовпця. Але нормалізація може бути різною; наприклад, можна використовувати:U
- Стовпці : це основні компоненти, масштабовані до одиниці суми квадратів;U
- Стовпці : це стандартизовані основні компоненти (дисперсія одиниці);n−1−−−−−√U
- Стовпці : це "сирі" основні компоненти (проекції на основні напрямки).US
Далі, оригінальні змінні зображуються у вигляді стрілок; тобто координати i- ї кінцевої точки стрілки задаються значенням i -ї у першому та другому стовпцях(x,y)ii . Але знову ж таки, можна вибрати різні нормалізації, наприклад:V
- Колонки : Я не знаю, якою може бути тут інтерпретація;VS
- Стовпчики : це вантажі;VS/n−1−−−−−√
- Стовпці : це головні осі (також основні напрямки, також власні вектори).V
Ось як все це виглядає для набору даних Fisher Iris:
9XUSαβVS(1−α)/β9 є "належними біплотами": а саме поєднанням будь-якого підмножини зверху та безпосередньо безпосередньо внизу.
[Яку б комбінацію не використовували, може знадобитися масштабування стрілок за деяким довільним постійним коефіцієнтом, щоб і стрілки, і точки даних відображалися приблизно в одній шкалі.]
VS/n−1−−−−−√Un−1−−−−−√
Цей [конкретний вибір], ймовірно, надасть найбільш корисну графічну допомогу в інтерпретації багатоваріантних матриць спостережень за умови, звичайно, що їх можна адекватно наблизити до другого рангу.
USV .
US Візуалізація мільйона, видання PCA - це показує PCA винного набору даних.
biplot
UVSbiplot
0.8biplot
n/(n−1)1Стрілки базових змінних у біклоті PCA в Р. )
PCA на кореляційній матриці
X1
Тут навантаження ще привабливіші, бо (крім вищезазначених властивостей) вони дають 1R=1
Подальше читання: