Скажімо, у мене є ряд рядків для проблеми класифікації:
Де є ознаками / провісниками та - клас, до якого належить поєднання функцій рядка.
Багато комбінацій функцій та їх класи повторюються в наборі даних, який я використовую для встановлення класифікатора. Мені просто цікаво, чи допустимо видалення дублікатів (я в основному виконую group by X1 ... XN Y
в SQL)? Дякую.
PS:
Це для набору даних лише для двійкової присутності, де пріори класів досить перекошені