1) C1 у шарі 1 має 6 функціональних карт, чи це означає, що є шість згорткових ядер? Кожне згорнуте ядро використовується для створення карти функцій на основі вхідних даних.
Є 6 згорткових ядер, і кожне з них використовується для створення карти функцій на основі вхідних даних. Ще один спосіб сказати це, що є 6 фільтрів або тривимірні набори ваг, які я просто назву вагами. Те, що на цьому зображенні не показує, що, мабуть, повинно бути зрозумілішим, це те, що зображення зазвичай мають 3 канали, наприклад, червоний, зелений та синій. Отже, ваги, які відображають вас від входу до C1, мають форму / розмір 3x5x5, а не лише 5x5. Ті ж тривимірні ваги або ядро застосовуються по всьому зображенню 3x32x32 для створення двовимірної карти об'єктів у C1. У цьому прикладі є 6 ядер (кожне 3x5x5), так що в цьому прикладі робиться 6 функціональних карт (кожне 28x28, оскільки у кроку дорівнює 1, а прокладка дорівнює нулю), кожне з яких є результатом застосування ядра 3x5x5 через вхід.
2) S1 у шарі 1 має 6 функціональних карт, C2 у шарі 2 має 16 карт. Як виглядає процес отримання цих 16 функціональних карт на основі 6 функціональних карт у S1?
Тепер зробіть те саме, що ми зробили в першому шарі, але зробіть це для другого шару, за винятком цього разу кількість каналів не 3 (RGB), а 6, шість для кількості карт / фільтрів функцій у S1. Зараз існує 16 унікальних ядер кожної форми / розміру 6x5x5. кожне ядро 2-го шару застосовується по всьому S1 для створення двовимірної карти функцій на C2. Це робиться 16 разів для кожного унікального ядра в шарі 2, всі 16, щоб генерувати 16 карт карт у шарі 2 (кожен 10х10, оскільки крок 1 і прокладка дорівнює нулю)
джерело: http://cs231n.github.io/convolutional-networks/