LASSO / LARS проти загального до конкретного (GETS) методу


15

Мене цікавить, чому методи вибору моделі LASSO та LARS настільки популярні, хоча вони в основному є лише варіаціями поетапного вибору вперед (і, отже, страждають від залежності від шляху)?

Аналогічно, чому загальновиробничі (GETS) методи вибору моделі здебільшого ігноруються, хоча вони й краще, ніж LARS / LASSO, оскільки вони не страждають від покрокової проблеми регресії? (основна довідка для GETS: http://www.federalreserve.gov/pubs/ifdp/2005/838/ifdp838.pdf - найновіший алгоритм у цьому починається із широкої моделі та пошуку дерева, що дозволяє уникнути залежності шляху, і було показано, що часто краще, ніж LASSO / LARS).

Це просто здається дивним, ЛАРС / ЛАССО, здається, отримує набагато більше викриттів і цитат, ніж загальне для конкретного (GETS), хтось має думки?

Не намагаючись розпочати бурхливі дебати, більше шукаючи раціонального пояснення того, чому література, схоже, зосереджується на LASSO / LARS, а не на GETS, і мало хто насправді вказує на недоліки LASSO / LARS.


Що ви маєте на увазі під залежним від цього шляху ? Також, є якась більш авторитетна довідка, яку ви можете дати GETS? Я з цим не знайомий.
кардинал

Ось краща, більш "авторитетна" довідка, яка також згадує Лассо: degruyter.com/view/j/jtse.2011.3.1/jtse.2011.3.1.1097/… .
tortilla

Також збирався додати те, що я мав на увазі: значить, ви додаєте значні регресори по черзі, але такий підхід не дозволяє вам скинути один, якщо на основі кореляції між регресорами один може стати незначним. Таким чином, як тільки один доданий, існує залежність шляху, що цей регресор тепер встановлений і його не можна скинути. Чи не так?
tortilla

1
Можливо, що змінні можуть опуститися на середину ласо, якщо його шлях коефіцієнта перетне нуль по шляху. Чи знайомі ви з Efron та ін. оригінальна стаття про ЛАРС? Це пояснює це досить детально приємним геометричним колоритом.
кардинал

2
Я думаю, що Лассо популярний, тому що він фактично перетворює проблему вибору моделі від однієї з перевірок гіпотез до оцінки параметрів.
ймовірністьлогічний

Відповіді:


2

Відмова: Мене лише віддалено знайомий з роботою над вибором моделі Девідом Ф. Хендрі серед інших. Я знаю, проте, від шанованих колег, що Хендрі досяг дуже цікавого прогресу в проблемах вибору моделі в рамках економетрики. Щоб оцінити, чи статистична література не приділяє належної уваги його роботі з вибору моделі, знадобиться набагато більше роботи з мого боку.

Однак цікаво спробувати зрозуміти, чому один метод чи ідея породжують набагато більше активності, ніж інші. Без сумніву, в моді є і аспекти моди. Як я бачу, у Лассо (і друзів) є одна головна перевага - це рішення дуже легко вираженої проблеми оптимізації. Це є ключовим для детального теоретичного розуміння рішення та розроблених ефективних алгоритмів. Недавня книга " Статистика високомірних даних " Бюльмана та Ван Де Гера ілюструє, як багато вже відомо про ласо.

Ви можете робити нескінченні симуляційні дослідження, і, звичайно, можна застосовувати методи, які ви вважаєте найбільш релевантними та підходящими для конкретного застосування, але для частин статистичної літератури також повинні бути отримані значні теоретичні результати. Це ласо викликало багато активності, що відображає те, що є теоретичні питання, до яких можна реально підійти, і вони мають цікаві рішення.

Інша справа, що ласо або варіація цього працює добре в багатьох випадках. Я просто не переконаний, що правильно, що ласо настільки легко перевершує інші методи, як пропонує ОП. Можливо, з точки зору (штучного) вибору моделі, але не з точки зору прогнозованих показників. Жодна із згаданих посилань, здається, не порівнює насправді Gets і lasso.


2

чому методи вибору моделі LASSO та LARS настільки популярні, хоча вони в основному є лише варіаціями поетапного вибору вперед

Існує різниця між вибором підмножини LASSO та (GETS): LASSO зменшує коефіцієнти до нуля залежним від даних способом, в той час як вибір (GETS) підмножини не робить. Це здається перевагою LASSO над (GETS) підбором підмножини, навіть якщо час від часу він може вийти з ладу (для цього потрібна настройка параметрів, що зазвичай робиться за допомогою перехресної перевірки, і іноді у нас може трапитися погана настройка).

(GETS) методи <...> роблять краще, ніж LARS / LASSO

Ефективність роботи GETS здається порівнянної якості з LASSO, коли це робиться неупередженими (?) Дослідниками (хоча це не обов'язково так у документах, де пропонується нова версія GETS - але саме так можна було б очікувати); дивіться деякі посилання в цій темі .

Можливо, сер Хендрі і Ко отримують хороші результати за допомогою GETS завдяки специфіці їх застосування (переважно макроекономічне моделювання часових рядів)? Але чому це могло бути? Це окреме питання .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.