Я хочу спробувати використовувати векторні машини підтримки (SVM) у своєму наборі даних. Перш ніж спробувати проблему, мене попередили, що SVM не справляються з надзвичайно незбалансованими даними. У моєму випадку я можу мати 95-98% 0 і 2-5% 1.
Я намагався знайти ресурси, які говорили про використання SVM на рідкісних / незбалансованих даних, але все, що я міг знайти, - це "sparseSVM" (які використовують невелику кількість векторів підтримки).
Я сподівався, що хтось може коротко пояснити:
- Наскільки добре SVM, як очікується, зробить із таким набором даних
- Які, якщо такі є, зміни повинні бути внесені до алгоритму SVM
- Які ресурси / документи обговорюють це