Запитання з тегом «gradient-descent»

2
Чи завжди середня квадратична помилка є опуклою в контексті нейронних мереж?
Кілька ресурсів, про які я згадував, згадували, що MSE чудовий тим, що він опуклий. Але я цього не розумію, особливо в умовах нейронних мереж. Скажімо, у нас є наступне: ХХX : навчальний набір даних YYY : цілі ΘΘ\Theta : набір параметрів моделі (модель нейронної мережі з нелінійностями)fΘfΘf_\Theta Тоді: MSE( Θ …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.