Ефективність регресії керневого хребта


11

Регресія хребта може бути виражена як де - передбачувана мітка , в визначити матрицю, об'єкт , який ми намагаємося знайти мітку, і \ mathbf {X} п \ d раз матрицю п об'єктів \ mathbf { x} _i = (x_ {i, 1}, ..., x_ {i, d}) \ в \ mathbb {R} ^ d таким, що:

y^=(XX+aId)1Xx
y^Idd×dxXn×dnxi=(xi,1,...,xi,d)Rd

X=(x1,1x1,2x1,dx2,1x2,2x2,dxn,1x1,2xn,d)

Ми можемо це ядро ​​наступним чином:

y^=(K+aId)1k

де K - матриця n×n ядер K функційK

К=(К(х1,х1)К(х1,х2)К(х1,хн)К(х2,х1)К(х2,х2)К(х2,хн)К(хн,х1)К(хн,х2)К(хн,хн))

і \ mathbf {K} N \ раз 1 вектор - стовпець функцій ядра Докн×1К

к=(К(х1,х)К(х2,х)К(хн,х))

Запитання:

(a) якщо в об'єктах більше ніж розмірів, чи є сенс не використовувати ядра? Наприклад, нехай буде матрицею тоді буде і ми перетворимо матрицю замість матриця нам доведеться інвертувати, якби ми використовували ядра. Чи означає це, що якщо ми не повинні використовувати ядра?хiХ50×3Х'Х3×33×350×50гн

(b) чи слід використовувати найпростіше можливе ядро? Схоже, ядра в регресії хребта використовуються для заперечення впливу розмірності і не для використання певних властивостей простору функцій (на відміну від підтримуючих векторних машин). Хоча ядра можуть змінювати відстані між об'єктами, чи є якісь популярні ядра часто використовувані в регресії хребта?

(С) , що є тимчасової складністю коника регресії і / або ядер коника регресії?О


"ефективність" має інше значення в статистиці. Ви мали на увазі «складність обчислень»? (у назві)
Спогад

Я мав на увазі "алгоритмічну ефективність". Хоча це правда, що мої запитання суттєво зводять це до «обчислювальної складності».
Гелікс

Відповіді:


5

(a) Метою використання ядра є вирішення проблеми нелінійної регресії в цьому випадку. Хороше ядро ​​дозволить вам вирішити проблеми в можливо нескінченномірному просторі функцій. Але використовувати лінійне ядро та виконувати регресію хребта ядра у подвійному просторі - це те саме, що вирішити задачу в первинному просторі тобто, це не приносить жодної переваги (це набагато повільніше, оскільки кількість вибірки зростає, як ви спостерігали).К(х,у)=ху

(b) Одним з найпопулярніших варіантів є квадратне експоненціальне ядро який є універсальним (див. Посилання нижче). Ядер існує багато, і кожне з них призведе до внутрішнього продукту (і, отже, метрики) до вашого простору функцій.К(х,у)=досвід(-τ2||х-у||2)

(c) Пряма реалізація вимагає розв’язання лінійного рівняння розміру , тому це . Існує багато швидших методів наближення, таких як наближення Ністрьома. Це область активних досліджень.нО(н3)

Список літератури:

  1. Бхарат Шріпербумудур, Кенджі Фукумізу та Герт Ланкрієт. Про співвідношення універсальності, характерних ядер та вбудовування заходів RKHS. Journal of Machine Learning Research, 9: 773–780, 2010.
  2. Бернгард Шлькопф, Олександр Дж. Смола. Навчання за допомогою ядер: Підтримка векторних машин, регуляризація, оптимізація та після 2002 року
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.