Відповіді:
Я б запропонував наступні теоретичні настанови. Коли ви використовуєте ядро Gaussian RBF, ваша розділювальна поверхня базуватиметься на комбінації дзвіноподібних поверхонь, зосереджених на кожному опорному векторі. Ширина кожної дзвоноподібної поверхні буде обернено пропорційною . Якщо ця ширина менша, ніж мінімальна пара для ваших даних відстань, ви, по суті, маєте надмірний розмір. Якщо ця ширина більша, ніж максимальна пара для ваших даних відстань, всі ваші бали належать до одного класу, і ви також не маєте хороших показників. Тож оптимальна ширина повинна бути десь між цими двома крайнощами.
Ні, це по суті залежить від даних. Пошук сітки (над гіпер-параметрами, трансформованими журналом) - це дуже хороший метод, якщо у вас є лише невелика кількість гіпер-параметрів для настройки, але не робіть роздільну здатність сітки занадто тонкою або ви, ймовірно, перенастроюєте настройку критерій. Для проблем із більшою кількістю параметрів ядра, я вважаю, що симплексний метод Nelder-Mead добре працює.
pair-wise distance for your data
= проста евклідова відстань після масштабування?