Я прочитав пару статей про ініціалізацію ядра, і багато робіт згадують, що вони використовують регуляризацію ядра L2 (часто з ).
Хтось робить щось інше, ніж ініціалізувати зміщення з постійним нулем і не регулювати його?
Папери ініціалізації ядра
- Мішкін і Матас: Все, що вам потрібно, - це добрий ініт
- Ксав'є Глоро та Йошуа Бенджо: Розуміння труднощів у навчанні глибоких нейронних мереж
- Він та ін: Поглиблення глибоко в випрямлячі: перевершення продуктивності людського рівня за класифікацією ImageNet