Дві альтернативи регуляризації:
- Маю багато-багато спостережень
- Використовуйте більш просту модель
Джефф Гінтон (співавтор зворотного пропонування) одного разу розповів історію інженерів, які сказали йому (сильно перефразовуючи): "Джеффо, нам не потрібен відвал у наших глибоких мережах, оскільки у нас так багато даних". А його відповідь була: "Ну, тоді ви повинні будувати ще більш глибокі мережі, поки не переобладнаєте, а потім використовуєте відсіву". Хороша порада в сторону, ви, очевидно, можете уникнути регуляризації навіть із глибокими сітками, якщо є достатньо даних.
Маючи фіксовану кількість спостережень, ви також можете вибрати більш просту модель. Можливо, вам не потрібна регуляризація для оцінки перехоплення, нахилу та відхилення помилок у простому лінійному регресії.