Я читав статтю « Глибоке залишкове навчання для розпізнавання зображень» і у мене виникли труднощі з розумінням на 100%, що означає залишковий блок обчислювально. Читаючи їхній документ, вони мають малюнок 2:
що ілюструє, яким повинен бути Залишковий блок. Чи обчислення залишкового блоку просто те саме, що:
Або це щось інше?
Іншими словами, можливо, спробувати відповідати позначенням статті, це:
це правда?
Зауважте, що після підсумовування кола на папері з’являється слово ReLU, тому вихід залишкового блоку (який я позначав ) повинен бути:
з однією додатковою нелінійністю ReLU .
є х - позитивний relu (x) = x
—
Рей Таєк