Чи може збільшитися, коли


11

Якщо β=argminβyXβ22+λβ1 , може β2 збільшується, коли λ збільшується?

Я думаю, що це можливо. Хоча β1 не збільшується, коли λ збільшується (мій доказ ), β2 може збільшуватися. На малюнку нижче показана можливість. Коли λ збільшується, якщо β рухається (лінійно) від P до Q , тоді β2 збільшується, тоді як β1 зменшується. Але я не знаю, як побудувати конкретний приклад (тобто побудувати X і y ), щоб профіль β демонстрував цю поведінку. Будь-які ідеї? Дякую.

введіть тут опис зображення

Відповіді:


10

Відповідь - так, і у вас є графічний доказ у прямо там.2

Знайдіть визначення еквівалентності векторних норм. Ви виявите, що де - розмірність вектора . Отже, є деяка приміщення для норми порівняно з нормою .

x2x1nx2,
nx21

Насправді проблему, яку ви хочете вирішити, можна вказати як:

Знайдіть таким, що одночасно d

x+d2>x2
x+d1<x1.

Першу нерівність , розгорнемо і побачимо, що і що, припускаючи, що і , отримуємо з другої нерівності, яку ми повинні мати Будь-який що відповідає цим обмеженням, збільшить норму при зменшенні норми .

2ixidi>idi2
xi0xi+di0
idi<0.
d21

У вашому прикладі, , , і і d[0.4,0.3]Tx:=P[0.5,0.6]T

idi0.1<0,
2iPidi0.04>0.25idi2.

Але як це пов’язано з побудовою і ? Xy
ziyuang

3

Дякую за відповідь @ TommyL, але його відповідь не є безпосередньою щодо побудови та . Я якось сам це "вирішую". По-перше, коли збільшується, не збільшуватиметься, коли кожна монотонно зменшується. Це відбувається, коли є ортонормальним, в якому ми маємоXyλβ2βiX

βi=sign(βiLS)(βiLSλ)+

Геометрично в цій ситуації переміщується перпендикулярно до контуру норми , тому не може збільшуватися.β1β2

Власне, Hastie та ін. згадані у статті " Попередня ступінчаста регресія та монотонне ласо" , необхідна і достатня умова монотонності профільних шляхів:

введіть тут опис зображення

У розділі 6 статті вони побудували штучний набір даних на основі кусково-лінійних функцій основи, що порушує вищевказану умову, демонструючи немонотонність. Але якщо нам пощастить, ми також можемо створити випадковий набір даних, що демонструє подібну поведінку, але більш простим способом. Ось мій R-код:

library(glmnet)
set.seed(0)
N <- 10
p <- 15
x1 <- rnorm(N)
X <- mat.or.vec(N, p)
X[, 1] <- x1
for (i in 2:p) {X[, i] <- x1 + rnorm(N, sd=0.2)}
beta <- rnorm(p, sd=10)
y <- X %*% beta + rnorm(N, sd=0.01)
model <- glmnet(X, y, family="gaussian", alpha=1, intercept=FALSE)

Я навмисно дозволяю стовпцям сильно корелювати (далеко не ортонормальний випадок), і у істинної є як великі позитивні, так і негативні записи. Ось профіль (не дивно, що активовано лише 5 змінних):Xββ

введіть тут опис зображення

і відношення між та :λβ2

введіть тут опис зображення

Таким чином , ми можемо бачити , що в протягом деякого інтервалу , зростає як збільшується.λβ2λ

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.