Ми визначаємо архітектуру вузького місця як тип, знайдений у статті ResNet, де [два шари конвеєра 3x3] замінені на [один 1x1 conv, один 3x3 conv та інший 1x1 conv шар].
Я розумію, що шари conv 1x1 використовуються як форма зменшення розмірів (і відновлення), що пояснюється в іншій публікації . Однак мені незрозуміло, чому ця структура настільки ефективна, як оригінальний макет.
Деякі хороші пояснення можуть включати: Яка довжина кроку використовується та на яких шарах? Які приклади вхідних та вихідних розмірів кожного модуля? Як зображені карти 56x56 на схемі вище? Чи позначає 64-d кількість фільтрів, чому це відрізняється від 256-d фільтрів? Скільки ваг або ФЛОП використовуються на кожному шарі?
Будь-яка дискусія дуже вдячна!