Запитання з тегом «conv-neural-network»

Конволюційні нейронні мережі - це тип нейронної мережі, в якому існує лише підмножина можливих зв'язків між шарами для створення перекриваються областей. Їх зазвичай використовують для наочних завдань.

2
Яка різниця між ініціалізатором масштабності дисперсії та ініціалізатором xavier?
Під час впровадження ResNet Tensorflow я вважаю, що вони використовують ініціалізатор дисперсійного масштабування, а також ініціалізатор xavier є популярним. Я не маю надто багато досвіду щодо цього, що краще на практиці?

4
Чи корисно використовувати CNN для класифікації 1D-сигналу?
Я працюю над класифікацією сну. Я прочитав деякі дослідницькі статті з цієї теми, багато з них використовували метод SVM або ансамблю. Чи корисно використовувати звивисту нейронну мережу для класифікації одновимірного ЕЕГ-сигналу? Я новачок у цій роботі. Вибачте мене, якщо я попрошу щось не так?


6
Зворотні шари: накладати чи не прокладати?
Архітектура AlexNet використовує нульові прокладки, як показано на малюнку: Однак у статті немає пояснень, чому це введення вкладено Курс Standford CS 231n вчить, що ми використовуємо набивки для збереження просторових розмірів: Мені цікаво, це єдина причина, коли нам потрібні набивки? Я маю на увазі, якщо мені не потрібно зберігати просторовий …

5
Яка різниця між "трансферним навчанням" та "адаптацією домену"?
Чи є якась різниця між «трансферним навчанням» та «адаптацією домену»? Я не знаю про контекст, але я розумію, що ми маємо деякий набір даних 1 і тренуємось на ньому, після чого у нас є ще один набір даних 2, для якого ми хочемо адаптувати свою модель, не перекваліфікуючись з нуля, …

4
Чим відрізняється Conv1D від Conv2D?
Я переглядав документи про згортку keras і знайшов два типи конвультури Conv1D і Conv2D. Я здійснив деякий пошук в Інтернеті, і це те, що я розумію про Conv1D та Conv2D; Conv1D використовується для послідовностей, а Conv2D - для зображень. Я завжди думав, що звивисті нервові мережі використовуються лише для зображень …

2
Чому необхідне об'єднання максимумів у конволюційних нейронних мережах?
Найбільш поширені конволюційні нейронні мережі містять об'єднання шарів для зменшення розмірів вихідних ознак. Чому я не міг досягти того самого, просто збільшивши крок конволюційного шару? Що робить шар об'єднання необхідним?

4
Про CNN, ядра та інваріантність масштабу / обертання
У мене є пара питань, які мене бентежать стосовно CNN. 1) Особливості, отримані за допомогою CNN, - інваріантність масштабу та обертання? 2) Ядра, які ми використовуємо для згортання з нашими даними, вже визначені в літературі? що це за ядра? це різне для кожної програми?

2
Що викликає раптові падіння помилок у навчанні / тесті під час тренування нейронної мережі?
Я бачив сюжети тесту / тренувальної помилки, які раптово падають у певні епохи під час тренувань нейронної мережі, і мені цікаво, що викликає ці стрибки продуктивності: Це зображення взято з Kaiming He Github, але подібні сюжети з'являються у багатьох роботах.

1
кількість функціональних карт у конволюційних нейронних мережах
Під час вивчення конволюційної нейронної мережі у мене виникають запитання щодо наступного малюнка. 1) C1 у шарі 1 має 6 функціональних карт, чи це означає, що є шість згорткових ядер? Кожне згорнуте ядро ​​використовується для створення карти функцій на основі вхідних даних. 2) S1 у шарі 2 має 6 функціональних …

3
Що робить крок згортки в конволюційній нейронній мережі?
Я вивчаю конволюційні нейронні мережі (CNN) завдяки їх застосуванню в комп'ютерному зорі. Я вже знайомий зі стандартними нейронними мережами, що рухаються вперед, тому я сподіваюся, що деякі люди тут можуть допомогти мені зробити додатковий крок у розумінні CNN. Ось що я думаю про CNN: У традиційних NN-каналах подачі даних у …

1
Яке значення має кількість фільтрів згортки у згортковій мережі?
Що означає кількість фільтрів у шарі згортки? Як це число впливає на ефективність або якість архітектури? Я маю на увазі, чи слід завжди обирати більшу кількість фільтрів? що з них добре? і як люди призначають різну кількість фільтрів для різних шарів? Я маю на увазі перегляд цього питання: як визначити …

4
Скільки даних вам потрібно для звивистої нейронної мережі?
Якщо у мене є конволюційна нейронна мережа (CNN), яка має близько 1 000 000 параметрів, скільки тренувальних даних потрібно (припустимо, я роблю стохастичний градієнтний спуск)? Чи є якесь правило? Додаткові зауваження: Коли я виконував стохастичний градієнтний спуск (наприклад, 64 патчів за 1 ітерацію), після ~ 10000 ітерацій точність класифікатора може …

1
Що таке часова класифікація коннекціоністів (CTC)?
Я хочу зробити проект оптичного розпізнавання символів (OCR). Після деяких досліджень я натрапив на архітектуру, яка здається цікавою: CNN + RNN + CTC. Мені знайомі стислі нейронні мережі (CNN) та періодичні нейронні мережі (RNN), але що таке часова класифікація коннекціоністів (CTC)? Мені б хотілося пояснення в умовах непростої людини.

1
Чому важливо включити термін корекції зміщення для оптимізатора Адама для глибокого навчання?
Я читав про оптимізатора Адама для глибокого навчання і натрапив на таке речення у новій книзі « Глибоке навчання » Беґніо, Гудфллоу та Кортвіла: Адам включає коригування зміщення оцінок як моментів першого порядку (термін імпульсу), так і (безцентрованих) моментів другого порядку для обліку їх ініціалізації при початку. видається, що основною …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.