Використання LASSO лише для вибору функцій


10

У моєму класі машинного навчання ми дізналися про те, наскільки регресія LASSO дуже гарна при виборі функцій, оскільки використовує регуляризацію .л1

Моє запитання: чи зазвичай люди використовують модель LASSO лише для вибору функцій (а потім переходять до скидання цих функцій в іншу модель машинного навчання), або вони зазвичай використовують LASSO для вибору функції та фактичної регресії?

Наприклад, припустимо, що ви хочете зробити регресію хребта, але ви вважаєте, що багато ваших особливостей не дуже хороші. Було б розумним запустити LASSO, взяти лише ті функції, які не є нульовими за алгоритмом, а потім використовувати лише ті, що скидають ваші дані в регресійну модель хребта? Таким чином, ви отримуєте перевагу регуляризації для вибору функції функції, але також і перевагу регуляризації для зменшення перевитрати. (Я знаю, що це, в основному, означає еластичну чисту регресію, але, схоже, вам не потрібно включати як терміни і в кінцевій функції регресії.)л1л2л1л2

Окрім регресії, це мудра стратегія при виконанні завдань класифікації (використання SVM, нейронних мереж, випадкових лісів тощо)?


1
Так, використання ласо для вибору функцій для інших моделей є гарною ідеєю. Крім того, вибір функцій на основі дерева також може бути поданий для інших моделей
karthikbharadwaj

1
Ласо виконує вибір функції лише в лінійних моделях - він не перевіряє на взаємодії вищого порядку чи нелінійність у прогнозах. Приклад того, як це може бути важливо: stats.stackexchange.com/questions/164048/… Ваш пробіг може відрізнятися.
Sycorax каже, що повернеться до Моніки

Відповіді:


11

Практично будь-який підхід, який робить певну форму вибору моделі, а потім проводить подальший аналіз, як ніби раніше не було вибору моделі, як правило, має погані пропорції. Якщо не існують переконливих теоретичних аргументів, підкріплених доказами, наприклад, великими моделювальними дослідженнями для реалістичних розмірів вибірки та показниками порівняно зі співвідношеннями розмірів вибірки, щоб показати, що це виняток, можливо, такий підхід матиме незадовільні властивості. Мені невідомі такі позитивні докази такого підходу, але, можливо, це є хтось інший. Зважаючи на те, що є розумні альтернативи, які дозволяють досягти всіх бажаних цілей (наприклад, еластична сітка), такий підхід важко виправдати, використовуючи натомість такий підозрілий спеціальний підхід.


3
погоджено .... справа в тому, що все повинно вписуватися в рамку кросвалідизації ... тому вам слід зробити кілька вкладених перехресних перевірок, щоб зробити дві окремі регуляції (інакше ви зіткнетеся з проблемами), а вкладене кросваліфікація використовує менше даних для кожна частина.
seanv507

1

Окрім усіх відповідей вище: Можна розрахувати точний тест на перестановку chi2 для таблиць 2x2 та rxc. Замість того, щоб порівнювати наше спостережуване значення статистики хі-квадрата з асимптотичним розподілом хі-квадрата, нам потрібно порівняти його з точним розподілом перестановки. Нам потрібно переставити наші дані усіма можливими способами, підтримуючи постійні поля рядків та стовпців постійними. Для кожного перестановленого набору даних ми обчислили статистику chi2. Потім ми порівнюємо спостережуваний chi2 із (відсортованою) статистикою chi2. Рейтинг реального тестового показника серед перетворених статистичних даних chi2 дає p-значення.


Чи можете ви додати детальну відповідь, будь ласка? У його нинішньому вигляді незрозуміло, як можна було б обчислити точний тест chi2.
Антуан Вернет
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.