У мене є рідкісні функції, які є прогностичними, також у мене є деякі щільні риси, які також є прогностичними. Мені потрібно поєднати ці функції разом, щоб поліпшити загальну продуктивність класифікатора.
Тепер, справа в тому, що я намагаюся поєднати їх разом, щільні риси, як правило, більше домінують над розрідженими характеристиками, отже, покращуючи AUC лише на 1% порівняно з моделлю, що має лише щільні функції.
Хтось стикався з подібними проблемами? Дійсно оцініть вкладені матеріали, начебто застрягли. Я вже спробував багато різних класифікаторів, комбінацію класифікаторів, перетворення функцій та обробку за допомогою різних алгоритмів.
Заздалегідь дякую за допомогу.
Редагувати :
Я вже спробував пропозиції, які наведені в коментарях. Я помітив, що майже 45% даних, розріджені функції дійсно добре, я отримую AUC приблизно 0,9 із лише рідкісними функціями, але для решти ті щільні функції добре справляються з AUC приблизно 0,75. Я наче намагався відокремити ці набори даних, але отримав AUC 0,6, тому я не можу просто тренувати модель та вирішувати, які функції використовувати.
Щодо фрагмента коду, я спробував стільки речей, що не знаю, чим саме поділитися :(