У мене є одне питання щодо необхідності використання методів вибору функцій (значення випадкових лісів, значення важливості функції або методи вибору функцій Univariate тощо) перед запуском алгоритму статистичного навчання.
Ми знаємо, щоб уникнути перевитрати, ми можемо ввести штраф за регуляризацію вагових векторів.
Отже, якщо я хочу зробити лінійну регресію, то я можу ввести параметри регуляризації L2 або L1 або навіть еластичну чисту мережу. Щоб отримати рідкісні рішення, штраф L1 допомагає у виборі функцій.
Тоді ще потрібно зробити вибір функції перед запуском регуляризації L1, наприклад, Lasso ?. Технічно Лассо допомагає мені зменшити функції на штраф L1, то чому потрібен вибір функції перед запуском альго?
Я прочитав статтю дослідження, в якій говорилося, що виконання Anova тоді SVM дає кращі показники, ніж використання SVM. Тепер питання: SVM по суті робить регуляризацію, використовуючи норму L2. Для того, щоб досягти максимального запасу, це мінімізація норми весового вектора. Таким чином, він виконує регуляризацію в своїй об'єктивній функції. Тоді технічно такі алгоритми, як SVM, не повинні турбуватися щодо методів вибору функцій ?. Але у звіті все ще йдеться про те, що вибір Univariate Feature перед тим, як звичайний SVM є більш потужним.
Хтось із думками?