Зв'язок LASSO між


10

Я розумію, що регресія LASSO полягає в тому, що коефіцієнти регресії вибираються для вирішення проблеми мінімізації:

minβyXβ22 s.t.β1t

На практиці це робиться за допомогою множника Лагранжа, що дозволяє вирішити проблему

minβyXβ22+λβ1

Який взаємозв'язок між λ та t ? Вікіпедія безпомилково стверджує, що це "залежно від даних".

Чому мені все одно? По-перше, на інтелектуальну цікавість. Але мене також турбують наслідки для вибору λ шляхом перехресної перевірки.

Зокрема, якщо я роблю поперечну перехресну перевірку, я підключаю n різних моделей до n різних розділів моїх навчальних даних. Потім я порівнюю точність кожної з моделей за невикористаними даними для заданої λ . Але те саме λ передбачає різне обмеження ( t ) для різних підмножин даних (тобто, t=f(λ) є "залежними від даних").

Чи не є проблемою перехресної перевірки, яку я насправді хочу вирішити, щоб знайти t який дає найкращі компромісні точності?

Я можу отримати приблизне уявлення про розмір цього ефекту на практиці, обчисливши для кожного перехресної валідації і і переглянувши отриманий розподіл. У деяких випадках мається на увазі обмеження ( ) може значно відрізнятися від моїх підмножин перехресної перевірки. Де по суті я маю на увазі коефіцієнт варіації .β1т т > > 0λtt>>0


5
Запрошення скасувати незрозумілий потік. Питання поза моїм досвідом, але здається досить сформульованим.
mkt - Відновіть Моніку

Відповіді:


2

Це стандартне рішення для регресії хребта :

β=(XX+λI)1Xy

Ми також знаємо, що , тому це має бути правдоюβ=t

(XX+λI)1Xy=t
.

що непросто вирішити для .λ

Ваша найкраща ставка - просто продовжувати робити те, що ви робите: обчислюйте на одній підвідбірці даних для кількох значень .tλ

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.