Який зв’язок між регуляризацією та методом множників лагранжу?


12

Для запобігання перевитрати людей люди додають термін регуляризації (пропорційний площі суми параметрів моделі) з параметром регуляризації до функції витрат лінійної регресії. Чи цей параметр збігається з множником лагранжу? Тож чи регуляризація така ж, як метод множника лагранжу? Або як пов’язані ці методи? λλ

Відповіді:


11

Скажімо, ми оптимізуємо модель з параметрами θ , мінімізуючи деякий критерій f(θ) з обмеженням на величину вектора параметрів (наприклад, для реалізації структурного підходу до мінімізації ризиків шляхом побудувавши вкладений набір моделей зростаючої складності), нам знадобиться вирішити:

minθf(θ)s.t.θ2<C

Лагранжан для цієї проблеми є (застереження: я думаю, це був довгий день ... ;-)

Λ(θ,λ)=f(θ)+λθ2λC.

Тому легко можна побачити, що регульована функція витрат тісно пов'язана з обмеженою задачею оптимізації, при цьому параметр регуляризації пов'язаний з постійною регулюючою обмеженням ( ) і по суті є множником Лагранжа. λC

Це ілюструє, чому, наприклад, регресія хребта реалізує структурну мінімізацію ризику: регуляризація еквівалентна обмеження на величину вагового вектора, а якщо то будь-яка модель, яка може бути зроблена, підкоряючись обмеженню,C1>C2

θ2<C2

також будуть доступні в рамках обмеження

θ2<C1 .

Отже, зменшення створює послідовність просторів гіпотез, що збільшують складність.λ

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.