Чи не було б кілька фільтрів у згортковому шарі вивчити один і той же параметр під час тренування?


11

Виходячи з того, що я дізнався, ми використовуємо кілька фільтрів у конвеєрному шарі CNN для вивчення різних детекторів функцій. Але оскільки ці фільтри застосовуються аналогічно (тобто ковзають і примножуються до областей введення), чи не просто вони засвоїли б однакові параметри під час тренування? Отже, використання декількох фільтрів буде зайвим?

Відповіді:


6

У мене була така ж плутанина в розумінні цього факту. Плутанина виникає у початківців, оскільки в експліциті книги не згадується, що фільтри різні.

оскільки ці фільтри застосовуються аналогічно

Фільтри застосовуються аналогічно, але значення комірки в матриці відрізняється один від одного. Так вони витягують із зображення різні риси.

Чи не вони б просто навчились однаковим параметрам під час тренування

Ні, вони не вивчають один і той же параметр, оскільки фільтри зараз різні. Тож використання декількох фільтрів не є зайвим.


Дякую за відповідь. Що саме їх відрізняє? Як ми гарантуємо, що вони навчаються різним параметрам під час тренінгу? Це їх початкові значення?
cjbayron

1
різні значення кожної комірки роблять їх різними. Як і деякі виявляють нахилу лінію, деякі виявлять лінію кривої 45 градусів тощо. Отже, всі вони різні.
ironman

1
Так, я розумію, що різні значення змушують фільтри виявляти різні функції. Але як ці фільтри навчаються по-різному під час тренувань?
cjbayron

3
Якщо фільтри запускаються однаково, вони залишаться таким. Випадкова ініціалізація означає, що вони починаються різними, і звідти вони дізнаються різні речі. Для отримання додаткової інформації знайдіть порушення симетрії в нейронних мережах.
Аарон

4

Я знайшов відповідь на це питання: https://www.quora.com/Why-does-each-filter-learn-different-features-in-a-convolutional-neural-network

Тут написано: "... (оптимізація) алгоритм виявляє, що втрати не зменшуються, якщо два фільтри мають однакові ваги та ухили, тому він врешті-решт змінить один з фільтрів (ваги та ухили), щоб зменшити втрати при цьому вивчення нової функції ".

Дякую за відповіді. Вдячний :)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.