Який діапазон пошуку для визначення оптимальних параметрів С і гамма для SVM?


32

Я використовую SVM для класифікації і намагаюся визначити оптимальні параметри для лінійних та RBF ядер. Для лінійного ядра я використовую перехресний вибір параметрів для визначення C, а для ядра RBF я використовую пошук сітки для визначення C та гамми.

У мене є 20 (числових) ознак та 70 прикладів навчання, які слід класифікувати на 7 класів.

Який діапазон пошуку слід використовувати для визначення оптимальних значень параметрів С та гамма?

Відповіді:


31

Перегляньте практичний посібник з класифікації SVM для деяких покажчиків, зокрема, сторінка 5.

Ми рекомендуємо "пошук по сітці" на і γ, використовуючи перехресну перевірку. Випробуються різні пари значень ( C , γ ) і вибирається одне з найкращою точністю перехресної перевірки. Ми виявили, що спроба експоненціально зростаючих послідовностей C і γ є практичним методом ідентифікації хороших параметрів (наприклад, C = 2 - 5 , 2 - 3 , , 2 15 ; γ = 2 - 15 , 2 - 13 ,Cγ(C,γ)Cγ ).C=25,23,,215;γ=215,213,,23

Не забудьте спочатку нормалізувати ваші дані, і якщо зможете, зібрати більше даних, оскільки, як виглядає, ваша проблема може бути сильно невизначеною.


Чи слід проводити тестування з боку експертів вручну? не існує бібліотеки для її досягнення?
x-rw

11

σC

Cσc1/cDijρσCs2s2=1niKii1n2i,jKijn×nK

2kk{2,...,2}

Звичайно, ми сказали @ciri, нормалізація даних тощо - це завжди хороша ідея.


Я думаю, що є кілька рівних рецептур ядра rbf. Один з гаммою, а інший із сигмою, тобто гамма = 1/2сигма ^ 2. Чи відповідає гама у наведеній евристиці вище гамма, сигма чи сигма ^ 2? Я знайшов інші описи того ж евристичного, які призначені для гамми.
техніка

12σ2

@fabee Чи потрібно рівне тестування проводити вручну? не існує бібліотеки для її досягнення?
x-rw
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.