Поясніть кроки алгоритму LLE (локального лінійного вбудовування)?


13

Я розумію, що основний принцип алгоритму для LLE складається з трьох етапів.

  1. Пошук сусідства кожної точки даних за деяким показником, таким як k-nn.
  2. Знайдіть ваги для кожного сусіда, який позначає вплив, який має сусід на точку даних.
  3. Побудуйте низькомірне вбудовування даних на основі обчислених ваг.

Але математичне пояснення кроків 2 та 3 є заплутаним у всіх прочитаних нами текстових підручниках та інтернет-ресурсах. Я не в змозі міркувати, чому формули використовуються.

Як ці кроки виконуються на практиці? Чи існує інтуїтивний спосіб пояснення використовуваних математичних формул?

Посилання: http://www.cs.nyu.edu/~roweis/lle/publications.html

Відповіді:


10

Y

ζ(Y)=(YWY)2=Y(IW)(IW)Y
Wwijijjii
U=Gβ
UK×1вектор одиниць, - матриця грамів для всіх найближчих сусідів об'єкта , а - вектор ваг які відповідають обмеженням суми до єдності. Нехай - симетрична додатна семидефінітна матриця відстані для всіх пар K-найближчих сусідів -вимірного об'єкта . Можна показати, що дорівнює матриці відстані вдвічі по центру з елементами GK×KiβK×1DK×KpxiGτ
τlm=12(dlm21Kldlm21Kmdlm2+lmdlm2).
Коефіцієнти регресії визначаються чисельно за допомогою і перевіряються для підтвердження вони дорівнюють єдності. Значення вбудовані в ряд з на різних позиціях стовпців , відповідних K-найближчих сусідів об'єктаK
βK×1=(ττ)K×K1τUK×1,
βiWi, а також транспозиційні елементи. Це повторюється для кожного го об’єкта набору даних. Це гарантує зауваження, що якщо кількість найближчих сусідів занадто мала, то може бути рідким, що спричинить ейгенаналіз. Було помічено, що найближчих сусідів привели до матриць, які не містили патологій під час ейгенаналізу. Цільова функція зведена до мінімуму шляхом знаходження найменших ненульових власних значень Скорочена форма представлена ​​символомiKWK=9W
(IW)(IW)E=ΛDE.
XY=E де має розміри на основі двох найменших власних значень . En×2Λ


"K = 9 найближчих сусідів" Чи не це залежить від розмірності ? Наприклад, якщо має менше 9 розмірів, то матриця ваги однозначно не визначається. Це викликає проблеми з LLE? YYW
Скотт

Так, але якщо є, скажімо, 8 вимірів, то для випадкових даних буквально кожну точку можна записати ідеально як лінійну комбінацію 9 інших, у нескінченну кількість способів.
Скотт

Завжди є сценарії "що якщо" при впровадженні методики, і саме тому використовуються обмеження параметрів.
NXG Logic
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.