Йдеться про регуляризацію. Припустимо, ви б хотіли підлаштувати криву і використовуєте функцію квадратних втрат (ви можете вибрати іншу). Заfit
Ви хочете відновити параметри, які керують процесом, який генерував цю криву. А тепер уявіть, що ви хотіли б підігнати цю криву, використовуючи 100-й многочлен (лише для прикладу). Ви з великою ймовірністю збираєтеся переозброїти або зафіксувати кожен перегин і шум кривої. Крім того, ваші можливості передбачення поза вказаним інтервалом тренувальних даних будуть, ймовірно, дуже поганими. Отже, термін регуляризації додається до цільової функції з деякою вагою, помноженою на коефіцієнт регуляризації - l_1, l_2 або на замовлення. У випадку l_2, який, мабуть, простіше зрозуміти, це призведе до того, що великі значення параметрів будуть змушені зменшити ака-усадку. Ви можете подумати про регуляризацію або зменшення як наведення свого алгоритму до рішення, яке може бути кращим рішенням.