Як масштабується Лассо з розміром матриці дизайну?


10

Якщо у мене є матриця проектування ХRн×г , де - кількість спостережень розмірності , яка складність рішення для з LASSO, wrt і ? Я думаю, що відповідь має стосуватися того, як одна ітерація LASSO масштабується з цими параметрами, а не як масштабує кількість ітерацій (конвергенції), якщо ви не відчуваєте іншого.нгβ^=аргмінβ12н||Хβ-у||2+λ||β||1нг

Я прочитав це попереднє запитання щодо складності LASSO , але це, мабуть, суперечить дискусії про glmnet тут і тут . Я знаю, що існує багато алгоритмів, включаючи підхід GLMnet GLM, але я пишу статтю про заміну компонента LASSO на батьківський алгоритм і хотів би включити дискусію про складність LASSO в цілому, особливо з і . Я також хотів би дізнатися про складність glmnet у базовій нерідкій справі, але згаданий документ є дещо заплутаним, оскільки вся складність алгоритму не є явною.гн


3
Незрозуміло, чому ця відповідь stats.stackexchange.com/a/190717/28666 (у потоці, до якого ви зв’язалися) не відповідає на ваше запитання. Чи можете ви докладно? Що суперечить з чим?
амеба

Сторінка 6 в [pdf] [1] зазначає "Таким чином, повний цикл через всі d змінних коштує ". Однак питання, яке ви посилаєтесь на стан O ( d 2 n ) . Чи пропускаю я цикл тут, щоб отримати складність d 2 ? [1]: jstatsoft.org/article/view/v033i01О(гн)О(г2н)г2
rnoodle

@amoeba Посилання, яке ви надаєте, є алгоритмом LARS - я хочу знати про підхід GLM.
rnoodle

Посилання для найменшого кутового регресу та O ( d n ) для координатного спуску є правильними. Різниця полягає в тому, що (1) LARS знаходить точне рішення в O ( d 2 n ) (і роблячи це, переходячи весь шлях можливого λ зі складністю, рівною задачі OLS до всієї задачі, яка також масштабується як O ( d 2 n ) ), тоді як (2) координатний спуск робить "лише" один крок наближення в O ( dО(г2н)О(гн)О(г2н)λО(г2н) , сходячись / «знижуючись» ближче до мінімуму проблеми LASSO. LARS використовує d кроків. З координатним спуском ... ніхто не знає. О(гн)г
Секст Емпірік

Відповіді:


3

Відповіді з посилань,

  • для найменшого кутового регресуО(г2н)
  • для координатного спускуО(гн)

, правильні.


Різниця в тому

Рівняння ЛАРС записуються в закритому вигляді і знаходять точне рішення

О(г2н)

поки

О(гн)


гО((г-к)н+к2)г-кк

г2нггг>>100г=100


Масштабування ЛАРС - проблема, пов'язана з обчислювальною складністю. Масштабування координатного спуска - це проблема, що включає складність обчислень та конвергенцію.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.