Що означають стрілки в біколоті PCA?


14

Розглянемо наступний PCAP біплот:

library(mvtnorm)
set.seed(1)
x  <- rmvnorm(2000, rep(0, 6), diag(c(5, rep(1,5))))
x  <- scale(x, center=T, scale=F)
pc <- princomp(x)
biplot(pc)

введіть тут опис зображення

Існує купа червоних стрілок, що вони означають? Я знав, що перша стрілка, позначена символом "Var1", повинна вказувати на самий різний напрямок набору даних (якщо ми вважаємо їх 2000 точками даних, кожна з яких є вектором розміру 6). Я також звідкись читаю, найрізноманітнішим напрямком повинен бути напрямок 1-го власного вектора.

Однак, читаючи код біплоту в Р. Рядок про стрілки:

if(var.axes)
    arrows(0, 0, y[,1L] * 0.8, y[,2L] * 0.8, col = col[2L], 

Де yнасправді матриця навантаження, яка є матрицею власного вектора. Отже, схоже, що перша стрілка насправді вказує з (0, 0)на (y[1, 1], y[1, 2]). Я розумію, що ми намагаємось побудувати стрілку високої розміру на 2D площині. Ось чому ми беремо 1-й і 2-й елемент y[1, ]вектора. Однак я не розумію:

Чи не повинен напрямок першого власного вектора бути позначеним вектором y[, 1], а не y[1, ]? (Знову ж, ось yматриця власного вектора, отримана за допомогою PCA або шляхом ейгендекомпозиції t(x) %*% x.) Тобто власними векторами повинні бути вектори стовпців, а не горизонтальні вектори.

Хоча ми будуємо їх на двовимірній площині, нам слід намалювати 1-й напрямок, який повинен бути від (0, 0)вказівки до (y[1, 1], y[2, 1])?


2
Також розгляньте спробу використання форматування, доступного для запитань на сайті, див. Розширену довідку щодо розмітки . Я бачу, що жодне з ваших попередніх запитань не має відповідей, і якщо ви їх редагуєте трохи легше для читання, вони опиняться вгорі списку і можуть залучати відповіді.
Енді Ш

@Andy W Відмінні посилання
кон'югатprior

@Andy W: Після прочитання ваших чудових посилань я все ще думаю, що у коду R biplot.princomp є помилка: завантажувальну матрицю (матрицю власного вектора) слід перенести, перш ніж надсилати в biplot.princomp ... Будь-які думки?
Луна


@Andy W: чи хочете ви помістити свої коментарі у відповідь, щоб я міг прийняти вашу відповідь? Це чудово! Дуже дякую!
Луна

Відповіді:


9

Добре, здається, Кевіну Райтві слід віддати більшу частину кредиту, щоб спробувати пояснити плутанину (з списку розсилки R-довідки );

Стрілки не спрямовані в самий різний бік даних. Основні компоненти вказують у самих різних напрямках даних. Але ви не намічаєте дані в оригінальній шкалі, ви наводите дані за обертаною шкалою, і, таким чином, горизонтальна вісь є найбільш різним напрямком даних.

Стрілки вказують у напрямку змінних, як проеціюється у 2-й площині біплота.

Немає помилок.

Кевін Райт

Майкл Грінакре є надзвичайно чудовою безкоштовною онлайн-книгою про біплоти, Біплоти на практиці , а просто читання першої глави повинно допомогти мотивувати, звідки беруться координати стрілок. На сайті також є декілька інших питань, які схожі, і вас можуть зацікавити, див. Інтерпретація біплотів в аналізі основних компонентів у R та Інтерпретація сюжетного фактора MDS на двох прикладах. Також перегляньте питання з біплотом у пошуку на сайті , оскільки існує ще декілька потенційних зацікавлень (можливо, навіть, якщо би зробити тег біплотом, було б корисно в цей момент, враховуючи кількість запитань, які вони виникли).

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.