У стисненому зондуванні існує гарантія теореми про те, що має унікальне розріджене рішення c (докладнішу інформацію див. У додатку).c
Чи існує аналогічна теорема для лассо? Якщо є така теорема, вона не тільки гарантує стабільність ласо, але й надасть лассо більш змістовне тлумачення:
lasso може виявити вектор розрідженого коефіцієнта регресії який використовується для генерування відповіді на .
Я задаю це питання двом причинам:
Я думаю, що "ласо сприяє рідкісному рішенню" - це не відповідь на те, навіщо використовувати ласо для вибору функцій, оскільки ми навіть не можемо сказати, у чому перевага вибраних нами функцій.
Я дізнався, що Лассо відомий тим, що нестійкий для вибору функцій. На практиці нам доводиться запускати зразки завантажувальної програми, щоб оцінити її стабільність. Яка найважливіша причина, що викликає цю нестабільність?
Додаток:
Дано . - розріджений вектор ( ). Процес породжує відповідь . Якщо має NSP (властивість нульового простору) порядку та коваріаційна матриця не має власного значення, близького до нуля, з'явиться унікальне рішення
Те, що ця теорема також говорить, це також, якщо не має NSP порядку , вирішувати .
Редагувати:
Отримавши ці чудові відповіді, я зрозумів, що розгубився, коли задав це питання.
Чому це питання бентежить:
Я прочитав дослідницький документ, в якому ми маємо вирішити, скільки функцій (стовпців) матиме матриця проекту (допоміжні функції створюються з первинних ознак). Оскільки це типова задача, очікується , що буде добре побудований таким чином, що рішення ласо може бути хорошим наближенням до реального розрідженого рішення.
Міркування зроблено з теореми, яку я згадав у додатку: Якщо ми прагнемо знайти -розгалужений розчин , краще мати NSP порядку .
Для загальної матриці , якщо порушено, то
не можливе стабільне і надійне відновлення з і
відповідає , відповідає
... як очікується від зв'язку , вибір дескриптора стає більш нестабільним, тобто для різних навчальних наборів вибраний дескриптор часто відрізняється ...
Друга цитата - це частина, яка мене бентежить. Мені здається, коли нерівність буде порушена, це не просто рішення, можливо, унікальне (не згадане), але дескриптор також стане більш нестабільним.