Ви насправді потрапили на щось відкрите питання в літературі. Як ви кажете, існують різноманітні ядра (наприклад, лінійна, радіальна основна функція, сигмоїдна, полінома), і вони будуть виконувати ваше завдання класифікації у просторі, визначеному відповідними рівняннями. Наскільки мені відомо, ніхто не остаточно показав, що одне ядро завжди найкраще виконує завдання одного типу класифікації тексту проти іншого.
Одне, що слід враховувати, - це те, що кожна функція ядра має 1 або більше параметрів, які потрібно оптимізувати для вашого набору даних, а це означає, що якщо ви робите це належним чином, у вас має бути друга навчальна колекція, в якій ви зможете дослідити найкращі значення для цих параметрів. (Я кажу, друга колекція витримки, тому що ви вже повинні мати таку, яку ви використовуєте, щоб визначити найкращі функції введення для вашого класифікатора.) Я ще раз зробив експеримент, в якому я здійснив масштабну оптимізацію кожного з ці параметри для простого текстового завдання класифікації і виявили, що кожне ядро виявилося досить добре, але зробили це в різних конфігураціях. Якщо я добре пам'ятаю свої результати, сигмоїд виявився найкращим, але зробив це в дуже конкретних налаштуваннях параметрів - тих, на які мені знадобилося більше місяця.