Цей пост слідує за цим: Чому оцінка хребта стає кращою за OLS, додаючи константу до діагоналі?
Ось моє запитання:
Наскільки мені відомо, регуляризація хребта використовує (евклідова відстань). Але чому ми використовуємо квадрат цієї норми? (пряме застосування призведе до квадратного кореня суми бета-квадрата).ℓ 2
Для порівняння, ми не робимо цього для LASSO, який використовує для регуляризації. Але ось це "реальна" норма (просто сума квадрата бета-абсолютних значень, а не квадрат цієї суми).ℓ 1
Може хтось допоможе мені уточнити?