Як довести, що радіальною базовою функцією є ядро?


35

Як довести, що функція радіальної основи є ядром? Наскільки я розумію, щоб довести це, ми повинні довести одне з наступного:k(x,y)=exp(||xy||2)2σ2)

  1. Для будь-якого набору векторів матриця = - це додатне напіввизначене.x1,x2,...,xnK(x1,x2,...,xn)(k(xi,xj))n×n

  2. Можна подати відображення наприклад = .Φk(x,y)Φ(x),Φ(y)

Будь-яка допомога?


1
Тільки для того, щоб пов’язати це більш очевидно: карта особливостей також обговорюється в цьому питанні , зокрема відповідь Марка Клайсена, заснована на серії Тейлора і моїх, в яких обговорюється як RKHS, так і загальна версія вбудовування подана Дугласом нижче. L2
Дугал

Відповіді:


26

Дзен, що використовується методом 1. Ось метод 2: Зобразіть на сферично симетричний розподіл Гаусса з центром у у просторі Гільберта . Стандартне відхилення та постійний коефіцієнт повинні бути налаштовані, щоб це працювало точно. Наприклад, в одному вимірі,xxL2

exp[(xz)2/(2σ2)]2πσexp[(yz)2/(2σ2)2πσdz=exp[(xy)2/(4σ2)]2πσ.

Отже, використовуємо стандартне відхилення і масштабуємо розподіл Гаусса, щоб отримати . Останнє масштабування відбувається тому, що норма нормального розподілу взагалі не дорівнює . до(х,у)=Ф(х),Ф(г)л21σ/2k(x,y)=Φ(x),Φ(y)L21


2
@Zen, Дуглас Заре: дякую за чудові відповіді. Як я повинен зараз вибрати офіційну відповідь?
Лев

23

Я буду використовувати метод 1. Перевір відповідь Дугласа Заре на підтвердження, використовуючи метод 2.

Я доведу випадок, коли - дійсні числа, тому . Загальний випадок випливає з цього ж аргументу mutatis mutandis і варто це зробити.до ( х , у ) = ехр ( - ( х - у ) 2 / 2 σ 2 )x,yk(x,y)=exp((xy)2/2σ2)

Не втрачаючи загальності, припустимо, що .σ2=1

Запишіть , де - характерна функція випадкової величини з розподілом.h ( t ) = exp ( - t 2k(x,y)=h(xy)ZN(0,1)

h(t)=exp(t22)=E[eitZ]
ZN(0,1)

Для дійсних чисел і , маємо що тягне за собою, що - позитивна напіввизначена функція, яка називається ядром.x1,,xna1,,an

j,k=1najakh(xjxk)=j,k=1najakE[ei(xjxk)Z]=E[j,k=1najeixjZakeixkZ]=E[|j=1najeixjZ|2]0,
k

Щоб зрозуміти цей результат в більш широкому розумінні, ознайомтеся з теоремою Бохнера: http://en.wikipedia.org/wiki/Positive-definite_function


2
Це вдалий початок, у правильному напрямку, із двох застережень: (a) не дорівнює показаним очікуванням (перевірте знак у експоненті) та (b) це, мабуть, обмежує увагу на випадок, коли і - скаляри, а не вектори. Я тим часом підтримав позицію, тому що експозиція приємна і чиста, і я впевнений, що ви швидко усунете ці невеликі прогалини. :-)h(t)xy
кардинал

1
Ткс! Я поспішаю сюди. :-)
Дзен

1
Вибачте, я дійсно не бачу, як ви тут керуєте mutatis mutandis. Якщо ви розробляєте норму перед переходом на форму, тоді ви отримали продукти, і ви не можете поміняти товари та суму. І я просто не бачу, як виробити норму після переходу на h-форму, щоб отримати гарний вираз. Ви можете трохи повести мене туди? :)h
Альбуркерк

23

Я додам третій метод, просто для різноманітності: створення ядра з послідовності загальних етапів, відомих для створення ядер pd. Нехай позначає домен ядер нижче та карти функцій.Xφ

  • Масштабування: Якщо є ядром pd, то для будь-якої постійної .κγκγ>0

    Доведення: якщо - карта функції , є дійсною картою функцій для .φκγφγκ

  • Підсумки: Якщо та є ядрами pd, то .κ1κ2κ1+κ2

    Доведення: Об’єднайте функції карт та , щоб отримати .φ1φ2x[φ1(x)φ2(x)]

  • Обмеження: Якщо є ядрами pd, а існує для всіх , то - пд.κ1,κ2,κ(x,y):=limnκn(x,y)x,yκ

    Доведення: для кожного і кожного ми маємо, що . Якщо встановити обмеження як це те саме властивість для .m,n1{(xi,ci)}i=1mX×Ri=1mciκn(xi,xj)cj0nκ

  • Продукти: Якщо і є ядрами pd, так це .κ1κ2g(x,y)=κ1(x,y)κ2(x,y)

    Доведення: Очевидно випливає з теореми про продукт Шура , але Schölkopf і Smola (2002) дають наступне приємне, елементарне підтвердження. Нехай бути незалежним. Отже Матриці коваріації повинні бути psd, тому враховуючи матрицю коваріації це доводить.

    (V1,,Vm)N(0,[κ1(xi,xj)]ij)(W1,,Wm)N(0,[κ2(xi,xj)]ij)
    Cov(ViWi,VjWj)=Cov(Vi,Vj)Cov(Wi,Wj)=κ1(xi,xj)κ2(xi,xj).
    (V1W1,,VnWn)
  • Повноваження: Якщо є ядром pd, то так же для будь-якого додатного цілого числа .κκn(x,y):=κ(x,y)nn

    Доказ: негайно від власності "товари".

  • Експоненти: Якщо є ядром pd, то це так .κeκ(x,y):=exp(κ(x,y))

    Доведення: маємо ; використовувати властивості "повноваження", "масштабування", "суми" та "обмеження".eκ(x,y)=limNn=0N1n!κ(x,y)n

  • Функції: Якщо - ядро ​​pd, а , також.κf:XRg(x,y):=f(x)κ(x,y)f(y)

    Доказ: Використовуйте карту функцій .xf(x)φ(x)

Тепер зауважимо, що Почніть з лінійного ядра , застосуйте "масштабування" за допомогою , застосуйте "експоненти" та застосуйте "функції" за допомогою .κ(x,y)=xTy1

k(x,y)=exp(12σ2xy2)=exp(12σ2x2)exp(1σ2xTy)exp(12σ2y2).
κ(x,y)=xTy xexp(-11σ2xexp(12σ2x2)
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.