Я початківець з машинного навчання. У SVM роздільна гіперплан визначається як . Чому ми кажемо вектор ортогональним для роздільної гіперплани?
Я початківець з машинного навчання. У SVM роздільна гіперплан визначається як . Чому ми кажемо вектор ортогональним для роздільної гіперплани?
Відповіді:
Геометрично вектор w спрямований ортогонально до лінії, визначеної . Це можна зрозуміти так:
Спочатку візьміть . Тепер зрозуміло, що всі вектори, , що зникають внутрішнього добутку задовольняють цьому рівнянню, тобто всі вектори, ортогональні w, задовольняють це рівняння.x w
Тепер перекладіть гіперплан подалі від початку над вектором a. Рівняння для площини тепер стає: , тобто знаходимо, що для зміщення , що є проекцією вектора на вектор .b = a T w a w
Без втрати загальності ми можемо, таким чином, вибрати перпендикуляр до площини, і в цьому випадку довжина яка представляє найкоротший, ортогональний відстань між початком і гіперпланом.
Отже, вектор є ортогональним для роздільної гіперплани.
Причина, чому нормальна для гіперплощини, полягає в тому, що ми визначаємо його таким чином:
Припустимо, у нас (гіпер) площина в 3d-просторі. Нехай - точка на цій площині, тобто . Тому вектор від початку до цієї точки просто . Припустимо, що у нас на площині є довільна точка . Вектор, що приєднується до і , задається тоді: Зауважимо, що цей вектор лежить у площині.
Тепер нехай є нормальним (ортогональним) вектором для площини. Тому: Тому: Зауважимо, що - це просто число і в нашому випадку дорівнює , тоді як просто а - . Отже, за визначенням є ортогональним для гіперплощини.
Нехай межа рішення буде визначена як . Розглянемо точки та , які лежать на межі рішення. Це дає нам два рівняння:
Віднімання цих двох рівнянь дає нам . Зауважимо, що вектор лежить на межі рішення, і він спрямований від до . Оскільки крапковий добуток дорівнює нулю, повинен бути ортогональним до , і, в свою чергу, до межі рішення.