Я вивчав архітектуру сіамської нейронної мережі, запровадженої Яном Лекуном та його колегами в 1994 році для розпізнавання підписів ( "Перевірка підписів за допомогою нейронної мережі затримки в часі сіамської " .pdf , NIPS 1994)
Я зрозумів загальну ідею цієї архітектури, але насправді не можу зрозуміти, як працює розмноження в цьому випадку. Я не можу зрозуміти, які цільові значення нейромережі, що дозволить зворотному розповсюдженню правильно встановити ваги кожного нейрона.

У цій архітектурі алгоритм обчислює схожість косинуса між кінцевими уявленнями двох нейронних мереж. У статті зазначено: "Бажаний вихід є для невеликого кута між виходами двох підмереж (f1 і f2), коли пред'являються справжні підписи. , і великий кут, якщо один із підписів є підробкою ".
Я не можу реально зрозуміти, як вони могли використовувати бінарну функцію (косинусне схожість між двома векторами) в якості цілі для запуску розмноження.
Як обчислюється зворотне розповсюдження в сіамських нейронних мережах?