PCA, ICA та лаплакійські власні карти


11

Питання

Мене дуже цікавить метод Лаплаціанських власних карт. В даний час я використовую його для зменшення розмірів на моїх наборах медичних даних.

Однак я зіткнувся з проблемою за допомогою методу.

Наприклад, у мене є деякі дані (спектральні сигнали), і я можу використовувати PCA (або ICA), щоб отримати деякі ПК (або ІС). Проблема полягає в тому, як отримати аналогічні компоненти зменшених розмірів вихідних даних за допомогою LE?

Відповідно до методу власних карт Лаплаціа, нам потрібно вирішити узагальнену задачу про власне значення, яка є

Lу=λDу

Тут - власний вектор. Якщо я побудую, наприклад, 3 найкращих власних вектора (рішення відповідно до 3 власних значень), результати не можна інтерпретувати.у

Однак, коли я будую основні 3 ПК та 3 найкращих ІС, результати завжди, здається, наочно (візуально) представляють вихідні дані .х

Я припускаю, що причина полягає в тому, що матриця визначається ваговою матрицею (матриця суміжності ), а дані оснащені тепловим ядром для створення , яке використовує експоненціальну функцію. Моє запитання - як відновити зменшені компоненти (а не власний вектор матриці )?LWхWхуL


Дані

Мій набір даних обмежений і це не просто продемонструє проблему. Тут я створив проблему з іграшками, щоб показати, що я маю на увазі і що хочу запитати.

Будь ласка, дивіться картинку,

По-перше, я створюю декілька синусоїд A, B, C, що відображаються червоними кривими (перший стовпець рисунка). A, B і C мають 1000 зразків, іншими словами, збережені в 1х1000 векторах.

По-друге, я змішував джерела A, B, C, використовуючи випадково створені лінійні комбінації, наприклад, , в яких - випадкові значення. Змішаний сигнал знаходиться в дуже високомірному просторі, наприклад, , 1517 є випадковим чином обраним просторовим простором. Я показую лише перші три ряди сигналу M зеленими кривими (другий стовпець рисунка).М=r1А+r2Б+r3Сr1,r2,r3ММR1517 рік×1000

Потім я запускаю PCA, ICA та лаплаціанські власні карти, щоб отримати результати зменшення розмірів. Я вирішив використовувати 3 ПК, 3 ІС та 3 ЛЕ, щоб зробити справедливе порівняння (сині криві показали відповідно 3-й, 4-й та останній стовпчик рисунка відповідно).

З результатів PCA та ICA (3-й, 4-й стовпець рисунка) ми бачимо, що ми можемо інтерпретувати результати як деяке зменшення розмірів, тобто для результатів ICA ми можемо відновити змішаний сигнал за (я не впевнений, чи зможемо ми також отримати з результатами PCA, але результат здається мені цілком правильним).М=б1ЯС1+б2ЯС2+б3ЯС3М=а1ПС1+а2ПС2+а3ПС3

Однак, будь ласка, подивіться на результати ЛЕ, я ледь можу інтерпретувати результати (останній стовпець рисунка). Здається, що зі скороченими компонентами щось "не так". Також хочу зазначити, що врешті-решт графік останнього стовпця є власним вектором у формуліуLу=λDу

У вас людей було більше ідей?

Фіг.1 за допомогою 12 найближчих сусідів і сигми в нагрівальному ядрі дорівнює 0,5: Стовпці зліва направо: оригінальний сигнал, змішаний сигнал, ПК, ІМС, ЛЕ

Фіг.2 за допомогою 1000 найближчих сусідів та сигми в нагрівальному ядрі дорівнює 0,5: Стовпці зліва направо: оригінальний сигнал, змішаний сигнал, ПК, ІМС, ЛЕ

Вихідний код : Код Matlab з необхідним пакетом


2
Що ви маєте на увазі під скороченими компонентами x? Ви хочете сказати, низькомірне вбудовування x?
катафалк

Це звучить цікаво. Чи можете ви дати більш детальну характеристику, як насправді виглядають ваші дані?
Placidia

Відповіді:


4

Відповідь на ваше запитання дає відображення внизу сторінки 6 оригінального паперу про лаплакійські власні карти :

хi(f1(i),,fм(i))

Так, наприклад, вбудовування точки х5 у, скажімо, топ-2 "компонентів" задано (f1(5),f2(5)) де f1 і f2 - це власні вектори, що відповідають двом найменшим ненульовим власним значенням з узагальненої задачі про власне значення Lf=λDf.

Зауважте, що на відміну від PCA, отримати вбудований зразок непросто. Іншими словами, ви можете отримати вбудовування точки, яка вже була розглянута при обчисленніL, але не (легко), якщо це новий пункт. Якщо вам цікаво зробити останнє, знайдіть цей документ .


Я трохи заплутаний у тому, що ви розглядаєте як свої змінні. Як я розумію, ваша матрицяМскладається з 1517 зразків з 1000-мірного простору. Коли ви робите PCA (або ICA) на цій матриці, ви зможете відновити основні варіанти варіації досить добре: наприклад, у стовпці 3 на малюнках рядок 1,2,3 відповідає основам C, A, B відповідно. Це має сенс. Однак у вашому коді під час виконання LEM ви викликаєте функціюМТ( mixedSignal'), що не відповідає вищесказаному.
Шантану

Отже, спочатку в матриці М, які ви змінні та які ваші спостереження? По-друге, з вашого аналізу випливає, що ви не просто шукаєте вбудовуванняМвикористовуючи LEM, але також еквівалент власних векторів, як у PCA, правда? Ви не можете зробити це LEM, принаймні, не просто. Прочитайте цей документ, щоб зрозуміти, чому.
Шантану

Якщо все, що ви шукаєте, - це вбудовування, то це легко дається на карті хi(f1(i),,fм(i)). Шукайте мою відповідь для деталей. У своєму коді змініть рядок 47 та використовуйте mixedSignalзамість його перенесення; результат mappedXотримає тривимірне вбудовування ваших 1517 точок.
Шантану

PS: Вище я мав на увазі "Ви не можете зробити це за допомогою LEM, принаймні, не просто".
Шантану

2

Ось посилання на веб-сторінку курсу проф. Троссета, а також він пише книгу http://mypage.iu.edu/~mtrosset/Courses/675/notes.pdf, яка оновлюється щотижня або близько того. Наведено також функції R для лаплакійських власних карт. Просто спробуйте самі. Ви також можете розглянути цей документ від Белкіна

Дякую Абхіку, студенту проф. Тросета


1

На відміну від PCA-лаплакійських власних карт використовуються узагальнені власні вектори, що відповідають найменшим власним значенням. Він пропускає власний вектор з найменшим власним значенням (може бути нульовим) і використовує власні вектори, що відповідають наступним кільком найменшим власним значенням. PCA - це максимальна дисперсія, що зберігає вбудовування, використовуючи ядро ​​/ грам матрицю. Laplacian Eigenmaps ставиться скоріше як проблема мінімізації стосовно комбінаторного графіка лаплаціана (див. Статті Троссета).


Усі зацікавлені, будь ласка, ще раз перегляньте моє запитання. Я прикладу кілька прикладів. Дуже дякую.
Samo Jerom
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.