Лінійність PCA


35

Однак PCA вважається лінійною процедурою:

ПСА(Х)ПСА(Х1)+ПСА(Х2)++ПСА(Хн),

де . Це означає, що власні вектори, отримані PCA на матрицях даних , не дорівнюють власним векторам, отриманим PCA, на суму матриць даних . Але не визначення лінійної функції :Х=Х1+Х2++ХнX i fХiХif

f(х+у)=f(х)+f(у)?

То чому PCA вважається "лінійним", якщо він не задовольняє цій самій основній умові лінійності?


Колись я писав чи чув (вибачте, не можу згадати, де чи коли), що PCA "належить до сімейства лінійних процедур", оскільки він покладається на лінійні залежності між змінними. Він використовує матрицю кореляції Пірсона та шукає лінійні комбінації найвищої дисперсії.
Łukasz Deryło

4
Характер цього питання може стати дещо зрозумілішим, розглядаючи набагато простішу і рутиннішу установку звичайної регресії найменших квадратів: це архетип лінійної статистичної процедури. Проте, процес оцінки коефіцієнтів найменших квадратів є явно нелінійної функцією матриці даних , про що свідчить за формулою & beta ; = ( X ' X ) - 1 х ' у . (Зауважте, що це лінійна функція вектора відповіді у .)Хβ^=(Х'Х)-1Х'уу
whuber

4
Можливо, варто пам’ятати, що f (x) = x + 1 теж є "лінійною функцією" ... але вона не задовольняє тому, що ви щойно сказали ... що повинно щось пояснити.
Мехрдад

Це тому, що (X1+X2)T(X1+X2)X1TX1+X2TX2
Габріель Ромон

Відповіді:


39

Коли ми говоримо, що PCA є лінійним методом, ми посилаємось на зменшення відображення розмірності з просторового простору R p в простір нижнього розміру R k . У PCA це відображення задається множенням x на матрицю власних векторів PCA і так явно лінійне (матричне множення лінійне): z = f ( x ) = Vx . Це на відміну від нелінійних методів зменшення розмірності , де відображення зменшення розмірності може бути нелінійним.f:хzRpRкх

z=f(х)=Vх.

З іншого боку, верхніх власних векторів Vк обчислюються з матриці даних X R n × p, використовуючи те, що ви назвали P C A ()у своєму запитанні: V = P C A ( X ), іцевідображення, безумовно, нелінійне: воно включає обчислення власних векторів коваріаційної матриці, що є нелінійною процедурою. (Як тривіальний приклад, помноживши X на2VRp×кХRн×pПСА()

V=ПСА(Х),
Х2збільшує матрицю коваріації на , але її власні вектори залишаються такими ж, як вони нормалізуються, щоб мати одиницю довжини.)4

Те, що я отримав 35 підказок за цю тривіальну відповідь, є досить смішним (і в основному через те, що ця тема на деякий час перебуває у питаннях гарячої мережі).
амеба каже, що повернеться до Моніки

5

"Лінійний" може означати багато речей, і не використовується виключно формально.

PCA не часто визначається як функція у формальному сенсі, і тому не передбачається виконання вимог лінійної функції, коли описується як така. Він частіше описується, як ви сказали, як процедура, а іноді і алгоритм (хоча цей останній варіант мені не подобається). Часто говорять про лінійність неофіційним, не чітко визначеним способом.

PCA можна вважати лінійним, наприклад, у наступному сенсі. Він належить до сімейства методів, які вважають, що кожна зміннаХi

ХifY(α)
αRкYкY

Тепер для PCA, кожен fi

fY(α)=i=1кαiYi
Y

Yαij


3

PCA забезпечує / є лінійним перетворенням.

Якщо взяти карту , пов'язану з конкретним аналізом, скажімо , , тоМПСА(Х1+Х2)М(Х1+Х2)=М(Х1)+М(Х2)

Винуватець у тому, що ПСА(Х1+Х2)ПСА(Х1)ПСА(Х2)


Як порівняння - дуже простий приклад процесу, який використовує лінійне перетворення, але не є самим лінійним перетворенням:

Обертання D(v)v[х,у]=[1,0]

D([1,1])[0,2]

і

D([0,1])[-1,0]

але

D([1,1]+[0,1]=[1,2])[-0,78,2.09][-1,2]

це подвоєння кута, що включає обчислення кутів, не є лінійним і є аналогічним твердженню амеби, що обчислення власного вектора не є лінійним

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.