Як зрозуміти ефект RBF SVM


17

Як я можу зрозуміти, що робить ядро ​​RBF у SVM? Я маю на увазі, що я розумію математику, але чи є спосіб зрозуміти, коли це ядро ​​стане корисним?

Чи будуть результати від kNN пов'язані зі SVM / RBF, оскільки RBF містить векторні відстані?

Чи є спосіб отримати відчуття ядра полінома? Я знаю, чим вище розмірність, тим хитріше. Але я хотів би зрозуміти, що ядра роблять, а не спробувати всі можливі ядра та вибрати найбільш вдалі.

Відповіді:


29

Можна, можливо, почати з одного з моїх відповідей тут:
Нелінійна класифікація SVM з ядром RBF

У цій відповіді я намагаюся пояснити, що намагається зробити функція ядра. Як тільки ви зрозумієте, що він намагається зробити, під час подальшої діяльності ви можете прочитати мою відповідь на питання про Quora: https://www.quora.com/Machine-Learning/Why-does-the-RBF- радіальна основа-функція-ядро-карта-в-нескінченно-мірний простір / відповідь / Арун-Ієр-1

Відтворення вмісту відповіді на Quora, якщо у вас немає облікового запису Quora.

Запитання: Чому ядро ​​RBF (радіальна основа) відображає ядро ​​у нескінченний розмірний простір? Відповідь: Розглянемо поліноміальне ядро ​​ступеня 2, визначене, де x , y R 2 і x = ( x 1 , x 2 ) , y = ( y 1 , y 2 ) .

к(х,у)=(хТу)2
x,yR2x=(x1,x2),y=(y1,y2)

Тим самим функцію ядра можна записати як, Тепер спробуємо придумати карту особливостей Φ , щоб функція ядра могла бути записана як k ( x ,

k(x,y)=(x1y1+x2y2)2=x12y12+2x1x2y1y2+x22y22
Φ .к(х,у)=Φ(х)ТΦ(у)

Розглянемо наступну карту функцій В основному, ця функція карта - це зіставлення точок в R 2до точок в R 3. Також зауважте, щоΦ(x)TΦ(y)=x 2 1 y 2 1 +2x1x2y1y2+x 2 2 y 2 2, що по суті є нашою функцією ядра.

Φ(x)=(x12,2x1x2,x22)
R2R3
Φ(x)TΦ(y)=x12y12+2x1x2y1y2+x22y22

R3R2R3

Rn

Тепер, приїжджаючи до RBF.

R2

k(x,y)=exp(xy2)=exp((x1y1)2(x2y2)2)
=exp(x12+2x1y1y12x22+2x2y2y22)
=exp(x2)exp(y2)exp(2xTy)
k(x,y)=exp(x2)exp(y2)n=0(2xTy)nn!
Now, if we were to come up with a feature map Φ just like we did for the polynomial kernel, you would realize that the feature map would map every point in our R2 to an infinite vector. Thus, RBF implicitly maps every point to an infinite dimensional space.

Exercise Question : Get the first few vector elements of the feature map for RBF for the above case?

Now, from the above answer, we can conclude something:

  • It may be quite hard to predict in general what the mapping function Φ looks like for arbitrary kernel. Though, for some cases like polynomial and RBF we can see what it looks like.
  • Even when we know the mapping function, the exact effect that kernel will have on our set of points may be hard to predict. However, in certain cases we can say some things. For example, look at the Φ map given above for degree 2 polynomial kernel for R2. It looks like Φ(x)=(x12,2x1x2,x22). From this we can determine that this map collapses diametrically opposite quadrants i.e first and third quadrant are mapped to same set of points and second and fourth quadrant are mapped to the same set of points. Therefore, this kernel allows us to solve XOR problem! In general, however, it might be harder to predict such behaviour for multidimensional spaces. And it gets harder in the case of RBF kernels.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.