Яка ваша думка щодо надмірного зразка в класифікації взагалі та алгоритму SMOTE зокрема? Чому б ми не просто застосували витрати / штрафи для коригування дисбалансу в даних про клас та будь-яку незбалансовану вартість помилок? Для моїх цілей точність прогнозування майбутнього набору експериментальних одиниць є кінцевим показником.
Для довідки, документ SMOTE: http://www.jair.org/papers/paper953.html