Як працює термін імпульсу алгоритму зворотного розповсюдження?


9

Оновлюючи ваги нейронної мережі за допомогою алгоритму зворотного розповсюдження з періодом імпульсу, чи слід застосовувати швидкість навчання і до терміну імпульсу?

Більшість інформації, яку я міг знайти про використання імпульсу, мають рівняння, виглядаючи приблизно так:

Wi=WiαΔWi+μΔWi1

де - швидкість навчання, а - термін імпульсу.αμ

якщо термін більше, ніж термін то в наступній ітерації від попередньої ітерації матиме більший вплив на вагу, ніж поточний.μαΔW

Чи є це метою терміну імпульсу? чи має виглядати рівняння більше таким чином?

Wi=Wiα(ΔWi+μΔWi1)

тобто. масштабування всього за ступенем навчання?

Відповіді:


10

Використання зворотного поширення з імпульсом в мережі з різних ваг на ую поправку на вагу даютьсяnWkiWk

ΔWk(i)=αEWk+μΔWk(i1) де є варіацією втрати .EWkWk

Введення швидкості імпульсу дозволяє послабити коливання в градієнтному спуску. Геометричну ідею, що стоїть за цією ідеєю, можливо, найкраще зрозуміти з точки зору аналізу власного простору в лінійному випадку. Якщо співвідношення між найнижчим і найбільшим власним значенням велике, то виконання градієнтного спуску повільне, навіть якщо швидкість навчання велика через обумовленість матриці. Імпульс вносить деяке врівноваження в оновлення між власними векторами, пов'язаними з нижчими та більшими власними значеннями.

Більш детально я посилаюсь

http://page.mi.fu-berlin.de/rojas/neural/chapter/K8.pdf


Що означає нижній підвісок?
Девід Річербі

Гаразд, тому термін імпульсу включається при обчисленні ΔWkтермін, а не доданий при обчисленні "нової" вагової вартості? Просто для уточнення, чи повинен ваш термінμWk(i1) бути μΔWk(i1)? чи це пропорція фактичної ваги, а не зміна курсу? дякую за вашу відповідь та за посилання на папір.
guskenny83

дякую за вказівку на помилку. ЗвичайноΔWk(i1)
nico

Що ви маєте на увазі під "варіацією збитку"? Це щось на зразок "варіації помилки"?
starbeamrainbowlabs

Це не означає нічого, крім похідної помилки щодо ваг.
nico
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.