Що саме являє собою блок залишкового навчання в контексті глибоких залишкових мереж у глибокому навчанні?


12

Я читав статтю « Глибоке залишкове навчання для розпізнавання зображень» і у мене виникли труднощі з розумінням на 100%, що означає залишковий блок обчислювально. Читаючи їхній документ, вони мають малюнок 2:

введіть тут опис зображення

що ілюструє, яким повинен бути Залишковий блок. Чи обчислення залишкового блоку просто те саме, що:

у=σ(W2σ(W1х+б1)+б2+х)

Або це щось інше?

Іншими словами, можливо, спробувати відповідати позначенням статті, це:

Ж(х)+х=[W2σ(W1х+б1)+б2]+х

це правда?

Зауважте, що після підсумовування кола на папері з’являється слово ReLU, тому вихід залишкового блоку (який я позначав ) повинен бути:у

σ(Ж(х)+х)=σ([W2σ(W1х+б1)+б2]+х)

з однією додатковою нелінійністю ReLU .σ


є х - позитивний relu (x) = x
Рей Таєк

Відповіді:


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.