Оскільки ви плутаєтесь, дозвольте мені почати з констатації проблеми та вирішення ваших питань по черзі. У вас є розмір вибірки 10000, і кожен зразок описується функціональним вектором . Якщо ви хочете виконати регресію за допомогою функцій радіальної бази Гаусса, тоді шукайте функцію вигляду f ( x ) = ∑ j w j ∗ g j ( x ; μ j , σ j ) , j = 1 .. m, де г яx∈R31
f(x)=∑jwj∗gj(x;μj,σj),j=1..m
giваші базові функції. В Зокрема, вам потрібно знайти
ваги
ж J так , що для заданих параметрів
М J і
сг J мінімізувати помилку між
у і відповідним прогнозом
у =
ф ( х ) - як правило , ви будете мінімізувати помилку найменших квадратів.
mwjμjσjyy^f(x^)
Що саме є параметром Mu індексу j?
Вам потрібно знайти базисні функції g j . (Ще потрібно визначити число m ) Кожна базисна функція матиме μ j та σ j (також невідомо). Підписка j коливається від 1 до m .mgjmμjσjj1m
Чи вектор?μj
Так, це точка в . Іншими словами, це точка десь у вашому просторі функцій, і μ має визначатися для кожної з m базових функцій.R31μm
Я читав, що це регулює розташування базових функцій. Так це не означає щось?
jthμj
Тепер для сигми, яка "керує просторовою шкалою". Що саме це?
σ
R1R2R1σσσσσ
R1xgj(x)gj(x)gj(x)
Кожна основна функція перетворює вхідний вектор x у скалярне значення
x∈R31
exp(−∥x−μj∥222∗σ2j)
У результаті ви отримуєте скаляр. Скалярний результат залежить від відстані точки від центру заданогоі скаляр .xμj∥x−μj∥σj
Я бачив деякі реалізації, які намагаються використовувати такі параметри, як .1, .5, 2.5 для цього параметра. Як обчислюються ці значення?
Звичайно, це один із цікавих і складних аспектів використання функцій радіальної основи Гаусса. якщо здійснити пошук в Інтернеті, ви знайдете багато пропозицій щодо визначення цих параметрів. Я дуже просто викладу одну можливість, засновану на кластеризації. Ви можете знайти цю та кілька інших пропозицій в Інтернеті.
Почніть з кластеризації 10000 зразків (ви можете спочатку використовувати PCA для зменшення розмірів, після чого кластеризується k-Means). Ви можете дозволити - кількість кластерів, які ви знайдете (як правило, використовуючи перехресну перевірку для визначення найкращого ). Тепер створіть радіальну функцію для кожного кластеру. Для кожної радіальної функції нехай буде центром кластера (наприклад, середнім, центроїдом тощо). Нехай відображає ширину кластера (наприклад, радіус ...) Тепер продовжуйте і виконайте свою регресію (цей простий опис - лише огляд - для цього потрібно багато роботи на кожному кроці!)mmgjμjσj
* Звичайно, крива дзвінка визначається від - до тому матиме значення скрізь на лінії. Однак значення, далекі від центру, незначні∞∞