Інтуїтивно кажучи, груповий ласо може віддавати перевагу ласо, оскільки він надає нам можливість включити (певний тип) додаткову інформацію в нашу оцінку для справжнього коефіцієнта . Як крайній сценарій, враховуючи наступне:β∗
За допомогою поставте як підтримку . Розглянемо оцінювач "oracle" що є груповим ласо з двома групами - одна справжня підтримка і один доповнення. Нехай - найменше значення що робить . Зважаючи на характер групового штрафу за ласо, ми знаємо, що при переходить від до (для деяких невеликихy∼N(Xβ∗,σ2I)S={j:β∗j≠0}β∗
β^=argminβ∥y−Xβ∥22+λ(|S|1/2∥βS∥2+(p−|S|)1/2∥βSC∥2),
λmaxλβ^=0λλmaxλmax−ϵϵ>0 ), рівно одна група буде входити в підтримку , який в народі вважається оцінкою для . Завдяки нашому групуванню, з великою часткою ймовірності, вибрана група буде , і ми зробили ідеальну роботу.
β^SS
На практиці ми не дуже добре підбираємо групи. Однак групи, не дивлячись на кращий, ніж екстремальний сценарій вище, все ж допоможуть нам: вибір все одно буде зроблений між групою справжніх коваріатів та групою неправдивих коваріатів. Ми все ще позичаємо сили.
Це формалізовано тут . Вони показують, за деяких умов, що верхня межа похибки прогнозування групового ласо нижня, ніж нижня межа похибки прогнозування простого ласо. Тобто вони довели, що групування робить нашу оцінку кращою.
Що стосується вашого другого запитання: (звичайна) ласова кара є кусочно лінійною, і це породжує кусочно-лінійний шлях рішення. Інтуїтивно зрозуміло, що у випадку групового ласо, покарання вже не є кусочно лінійним, тому у нас більше немає цієї властивості. Великий довідник по кусково - лінійності шляхів вирішення є тут . Дивіться їх пропозицію 1. Нехай і . Вони показують, що шлях рішення групового ласо є лінійним тоді і лише тоді, коли є кусочно постійною. Звичайно, це не так, оскільки наша кара має глобальну кривизну.L(β)=∥y−Xβ∥22J(β)=∑g∈G|g|1/2∥βg∥2
(∇2L(β^)+λ∇2J(β^))−1∇J(β^)
J