Я хотів би навчити SVM для класифікації справ (TRUE / FALSE) на основі 20 атрибутів. Я знаю, що деякі з цих ознак сильно співвідносяться. Тому моє запитання: чи SVM чутливий до співвідношення чи надмірності між ознаками? Будь-яка довідка?
Я хотів би навчити SVM для класифікації справ (TRUE / FALSE) на основі 20 атрибутів. Я знаю, що деякі з цих ознак сильно співвідносяться. Тому моє запитання: чи SVM чутливий до співвідношення чи надмірності між ознаками? Будь-яка довідка?
Відповіді:
Лінійне ядро: ефект тут аналогічний ефекту мультиколінеарності при лінійній регресії. Ваша вивчена модель може бути не особливо стабільною щодо невеликих варіацій тренувального набору, оскільки різні весові вектори матимуть подібні результати. Прогнози набору тренувань, однак, будуть досить стабільними, а також тестують прогнози, якщо вони надходять з одного розподілу.
Ядро RBF: Ядро RBF розглядає лише відстані між точками даних. Таким чином, уявіть, що ви насправді маєте 11 атрибутів, але один з них повторюється 10 разів (досить крайній випадок). Тоді цей повторний атрибут сприятиме відстані в 10 разів більше, ніж будь-який інший атрибут, і вивчена модель, можливо, буде набагато більше впливати на цю особливість.