Я дізнаюся про вибір функції. Я бачу, чому це було б важливо і корисно для побудови моделей. Але зупинімося на контрольованих навчальних (класифікаційних) завданнях. Чому вибір завдань важливий для класифікаційних завдань?
Я бачу багато літератури, написаної про вибір функції та її використання для контрольованого навчання, але це спантеличує мене. Вибір функцій - це визначення того, які функції викинути. Інтуїтивно, викидання деяких особливостей здається самозакоханим: це викидання інформації. Здається, що передача інформації не повинна допомогти.
І навіть якщо видалення деяких функцій допомагає, якщо ми викидаємо деякі функції, а потім подаємо решту в алгоритм, що контролюється, чому нам це потрібно робити самостійно, а не дозволяти керованому алгоритму навчання керувати ним? Якщо якась функція не є корисною, чи не повинен якийсь гідний алгоритм навчання під контролем неявно виявити це та вивчити модель, яка не використовує цю функцію?
Настільки інтуїтивно я б очікував, що вибір функції буде безглуздою вправою, яка ніколи не допомагає і може іноді нашкодити. Але той факт, що це так широко використовується і написано, змушує мене підозрювати, що моя інтуїція непрацездатна. Чи може хто-небудь надати інтуїцію, чому вибір функцій корисний і важливий під час навчання під контролем? Чому це покращує ефективність машинного навчання? Це залежить від того, який класифікатор я використовую?