ККТ проти необмеженої постановки регресії ласо


20

L1 пеналізована регресія (aka lasso) представлена ​​у двох складах. Нехай обидві цілі функції

Q1=12||YXβ||22Q2=12||YXβ||22+λ||β||1.
Тоді два різних рецептури -
argminβQ1
умови
||β||1t,
і, що еквівалентно
argminβQ2.
Використовуючи умови Каруша-Куна-Таккера (KKT), легко зрозуміти, наскільки умова стаціонарності для першої рецептури еквівалентна прийняттю градієнта другого складу та встановленню його рівним 0. Що я не можу знайти, ані зрозуміти. , як гарантується, що умова комплементарної млявості для першого складуλ(||β||1t)=0 буде виконана розчином другого складу.

Відповіді:


16

Дві рецептури еквівалентні в тому сенсі, що для кожного значення у першій рецептурі існує значення λ для другого складу таким чином, що обидві рецептури мають однаковий мінімізатор β .tλβ

Ось виправдання:

Розглянемо рецептуру ласо: Нехай мінімалізатор будеβ∗,аb=| | β| | 1. Моє твердження полягає в тому, що якщо ви встановитеt=bв першій рецептурі, тоді рішення першої рецептури також будеβ. Ось доказ:

f(β)=12||YXβ||22+λ||β||1
βb=||β||1t=bβ

Розглянемо першу рецептуру Якщо можливонехай ця друга композиція має рішення β такимщо| | & Beta ; | | 1<| | β| | 1=b(відзначте строго менше знака). Тоді легко бачитищоF( бета )<п(& beta

min12||YXβ||22 s.t.||β||1b
β^||β^||1<||β||1=b суперечить тому, що β є рішенням для ласо. Таким чином, рішення першого складу також є β .f(β^)<f(β)ββ

Оскільки , то умова додаткової в'ялості виконується в точці розчину β .t=bβ

Отже, задавши формулу ласо з , ви побудуєте обмежену формулу, використовуючи t, що дорівнює значенню норми l 1 розчину ласо. І навпаки, з урахуванням обмеженої рецептури з t , ви знайдете λ таким, що розчин ласо буде рівним розчину обмеженої рецептури.λtl1tλ

(Якщо ви знаєте про субградієнти, ви можете знайти це , розв’язавши рівняння X T ( y - X β ) = λ z , де z | | β | | 1 )λXT(yXβ)=λzz||β||1)


1
Відмінно. Щойно ви бачите рішення, ви завжди почуваєтесь німими за те, щоб не потрапити туди самостійно. Я припускаю , що ви маєте в виду, в пошуку протиріччя, припустимо , що ми знаходимо β такі , що | | & Beta ; | | 1 < | | β | | 1 = b ? β^||β^||1<||β||1=b
goodepic

Вважайте відповідь прапором правильною
bdeonovic

2
Ви можете уточнити , чому f(β^)<f(β)
goofd

Це доводить, що рішення першої рецептури також повинно мати l1-норму b. Як можна довести, що два рішення дійсно однакові?
broncoAbierto

1
Крім того, Лассо не завжди має єдине рішення, тому ми не можемо посилатися на на Мінімайзер. arxiv.org/pdf/1206.0313.pdf . Ми могли б, однак, відносяться до набору Мінімайзер і показати , що деякі & beta ; ≠ & beta ; * повинні належати до цього набору. β^β
broncoAbierto

3

Я думаю, що ідея elexhobby для цього доказу є вдалою, але я не думаю, що це абсолютно коректно.

Показавши , що існування рішення для першого , такі , що | | β | | < | | бета * призводить до протиріччя, ми можемо тільки припускати необхідність, не те .β^β^<ββ = β *β^=ββ^=β

Я пропоную замість цього зробити наступне:

Для зручності позначимо через та першу та другу формули відповідно. Припустимо, що має унікальне рішення, , з . Нехай має рішення, . Тоді ми маємо, що(вона не може бути більшою через обмеження) і тому . Якщо то не є рішенням , що суперечить нашим припущенням. ЯкщоР 2 Р 2 & beta ; * | | & beta ; * | | = Ь Р 1 & beta ; ≠ & beta ; * | | & beta ; | | | | & beta ; * | | F ( & beta ; ) F ( & beta ; * ) е ( & beta ; ) < F ( & beta ; * ) β * P 2 F ( β )P1P2P2ββ=bP1β^ββ^βf(β^)f(β)f(β^)<f(β)βP2β = β *f(β^)=f(β)тоді , оскільки ми вважали, що рішення є унікальним.β^=β

Однак, можливо, у Лассо є кілька рішень. З леми 1 arxiv.org/pdf/1206.0313.pdf ми знаємо, що всі ці рішення мають однаковий -норм (і, звичайно, однакове мінімальне значення). Ми встановили цю норму як обмеження для і продовжуємо.Р 11P1

Позначимо через безліч рішень , з . Нехай є рішення, . Тоді ми маємо, що і , отже . Якщо для деяких (а значить, і для всіх), то , що суперечить нашим припущенням. Якщо для деяких то не є набором рішень дляР 2 | | & beta ; | | = б & beta ; S Р 1 & beta ; ∉ S | | & beta ; | | | | & beta ; | | & beta ; S F ( & beta ; ) F ( & beta ; ) & beta ; S F ( & beta ; ) = е ( & beta ; ) & beta ; S & beta ; ∈ SSP2β=b βSP1β^Sβ^ββSf(β^)f(β)βSf(β^)=f(β)βSβ^S& beta ; S S P 2 . Отже, кожен розчин P 1 знаходиться в S , тобто будь-який розчин P 1 також є розчином для P 2 . Залишається довести, що взаємодоповнювальне значення теж є.f(β^)<f(β)βSSP2P1SP1P2

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.