Я хотів би, щоб моя навчена модель була протестована на незбалансованому наборі даних. Чи є алгоритми для створення синтетичних даних із збалансованого міченого набору даних (спам / не-спам)?
Ви завжди можете врівноважити будь-який набір даних, просто підкресливши один клас.
—
user2974951