Я трохи плутаю різницю між SVM та перцептроном. Дозвольте спробувати узагальнити своє розуміння тут, і, будь ласка, не соромтесь виправити, де я помиляюся, і заповнити те, що я пропустив.
Perceptron не намагається оптимізувати роздільну "відстань". Поки він знаходить гіперплан, який розділяє два набори, це добре. SVM, з іншого боку, намагається максимізувати "вектор підтримки", тобто відстань між двома найближчими протилежними точками вибірки.
SVM, як правило, намагається використовувати "функцію ядра" для проектування вибіркових точок на простір високих розмірів, щоб зробити їх лінійно відокремленими, в той час як персептрон передбачає, що точки вибірки лінійно відокремлюються.