Яке значення має кількість фільтрів згортки у згортковій мережі?


16

Що означає кількість фільтрів у шарі згортки?
Як це число впливає на ефективність або якість архітектури? Я маю на увазі, чи слід завжди обирати більшу кількість фільтрів? що з них добре? і як люди призначають різну кількість фільтрів для різних шарів? Я маю на увазі перегляд цього питання: як визначити кількість згорткових операторів у CNN?
У відповіді вказано 3 шару згортки з різною кількістю фільтрів і розміром. Знову в цьому запитанні: кількість карт функцій у конволюційних нейронних мережах ви можете побачити із зображення, що у нас є 28 * 28 * 6 фільтрів для першого шару та 10 * 10 * 16 фільтр для другого шару conv. Як вони придумують ці цифри, це через спроби та помилки? Спасибі заздалегідь


Відповіді:


8

Що означає кількість фільтрів у шарі згортки? - Я зазвичай люблю вважати фільтри як детектори функцій. Незважаючи на те, що це залежить від проблемного домену, важливістю # детекторів функцій є інтуїтивно зрозуміла кількість функцій (наприклад, ребер, ліній, частин об'єкта тощо), які мережа може потенційно вивчити. Також зауважте, що кожен фільтр формує карту функцій. Карти функцій дозволяють вам вивчити пояснювальні фактори в межах зображення, тому чим більше # фільтрів означає, тим більше навчається мережа (не обов'язково весь час важлива - насичення і конвергенція найбільше значення)

Як це число впливає на продуктивність або якість архітектури? - Я не думаю, що ви знайдете хорошу відповідь на такі типи питань, оскільки ми все ще намагаємось формалізувати те, що відбувається всередині чорної скриньки DL. Інтуїтивно ще раз ви дізнаєтесь про більш надійну нелінійну функцію, чим більше фільтр-банків, але продуктивність залежить від типу завдання та даних. Зазвичай ви хочете знати, з якими даними ви маєте справу для визначення # параметрів у вашій архітектурі (включаючи фільтр). Скільки фільтрів мені потрібно? більше схоже на запитання, наскільки складні (спеціально) зображення в моєму наборі даних. Не існує жодного формального поняття, яке б стосується # фільтрів до продуктивності. Це все експериментально та ітеративно. Багато попереджень та помилок для запобігання.


Хороша відповідь, додавши до вищезазначених питань: CNN, однак, більше не є чорними полями. Насправді ви можете бачити функції, засвоєні картками функцій. Кількість фільтрів, встановлених у шарі, дозволяє дозволити контейнерам ENOUGH в мережі вивчати відповідні функції (або їх комбінації). Яка достатня кількість -> залежить від набору даних. Скажімо, мережа CNN на рівні X потребує щонайменше 24 карт функцій для вивчення важливих функцій, тому ви надаєте, скажімо, 32, працюючи над ідеєю, що ви надаєте мережі дихальний простір і даєте їй вирішити самостійно, можливо, деякі з 32 є надлишковими або злегка різноманітними.
MANU
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.