Статистика та великі дані conv-neural-network

2

Яка різниця між ініціалізатором масштабності дисперсії та ініціалізатором xavier?

Під час впровадження ResNet Tensorflow я вважаю, що вони використовують ініціалізатор дисперсійного масштабування, а також ініціалізатор xavier є популярним. Я не маю надто багато досвіду щодо цього, що краще на практиці?

20 machine-learning neural-networks deep-learning conv-neural-network tensorflow

4

Чи корисно використовувати CNN для класифікації 1D-сигналу?

Я працюю над класифікацією сну. Я прочитав деякі дослідницькі статті з цієї теми, багато з них використовували метод SVM або ансамблю. Чи корисно використовувати звивисту нейронну мережу для класифікації одновимірного ЕЕГ-сигналу? Я новачок у цій роботі. Вибачте мене, якщо я попрошу щось не так?

20 neural-networks svm conv-neural-network signal-processing

2

Що роблять повністю пов'язані шари в CNN?

Я розумію згортання та об'єднання шарів, але не можу побачити причину повністю з'єднаного шару в CNN. Чому попередній шар безпосередньо не з'єднаний з вихідним шаром?

19 neural-networks deep-learning conv-neural-network

6

Зворотні шари: накладати чи не прокладати?

Архітектура AlexNet використовує нульові прокладки, як показано на малюнку: Однак у статті немає пояснень, чому це введення вкладено Курс Standford CS 231n вчить, що ми використовуємо набивки для збереження просторових розмірів: Мені цікаво, це єдина причина, коли нам потрібні набивки? Я маю на увазі, якщо мені не потрібно зберігати просторовий …

19 conv-neural-network convolution

5

Яка різниця між "трансферним навчанням" та "адаптацією домену"?

Чи є якась різниця між «трансферним навчанням» та «адаптацією домену»? Я не знаю про контекст, але я розумію, що ми маємо деякий набір даних 1 і тренуємось на ньому, після чого у нас є ще один набір даних 2, для якого ми хочемо адаптувати свою модель, не перекваліфікуючись з нуля, …

19 deep-learning terminology conv-neural-network transfer-learning domain-adaptation

4

Чим відрізняється Conv1D від Conv2D?

Я переглядав документи про згортку keras і знайшов два типи конвультури Conv1D і Conv2D. Я здійснив деякий пошук в Інтернеті, і це те, що я розумію про Conv1D та Conv2D; Conv1D використовується для послідовностей, а Conv2D - для зображень. Я завжди думав, що звивисті нервові мережі використовуються лише для зображень …

19 machine-learning neural-networks conv-neural-network keras

2

Чому необхідне об'єднання максимумів у конволюційних нейронних мережах?

Найбільш поширені конволюційні нейронні мережі містять об'єднання шарів для зменшення розмірів вихідних ознак. Чому я не міг досягти того самого, просто збільшивши крок конволюційного шару? Що робить шар об'єднання необхідним?

18 deep-learning conv-neural-network pooling

4

Про CNN, ядра та інваріантність масштабу / обертання

У мене є пара питань, які мене бентежать стосовно CNN. 1) Особливості, отримані за допомогою CNN, - інваріантність масштабу та обертання? 2) Ядра, які ми використовуємо для згортання з нашими даними, вже визначені в літературі? що це за ядра? це різне для кожної програми?

18 neural-networks deep-learning conv-neural-network

2

Що викликає раптові падіння помилок у навчанні / тесті під час тренування нейронної мережі?

Я бачив сюжети тесту / тренувальної помилки, які раптово падають у певні епохи під час тренувань нейронної мережі, і мені цікаво, що викликає ці стрибки продуктивності: Це зображення взято з Kaiming He Github, але подібні сюжети з'являються у багатьох роботах.

18 conv-neural-network

1

кількість функціональних карт у конволюційних нейронних мережах

Під час вивчення конволюційної нейронної мережі у мене виникають запитання щодо наступного малюнка. 1) C1 у шарі 1 має 6 функціональних карт, чи це означає, що є шість згорткових ядер? Кожне згорнуте ядро використовується для створення карти функцій на основі вхідних даних. 2) S1 у шарі 2 має 6 функціональних …

16 machine-learning neural-networks deep-learning pattern-recognition conv-neural-network

3

Що робить крок згортки в конволюційній нейронній мережі?

Я вивчаю конволюційні нейронні мережі (CNN) завдяки їх застосуванню в комп'ютерному зорі. Я вже знайомий зі стандартними нейронними мережами, що рухаються вперед, тому я сподіваюся, що деякі люди тут можуть допомогти мені зробити додатковий крок у розумінні CNN. Ось що я думаю про CNN: У традиційних NN-каналах подачі даних у …

16 neural-networks deep-learning conv-neural-network convolution

1

Яке значення має кількість фільтрів згортки у згортковій мережі?

Що означає кількість фільтрів у шарі згортки? Як це число впливає на ефективність або якість архітектури? Я маю на увазі, чи слід завжди обирати більшу кількість фільтрів? що з них добре? і як люди призначають різну кількість фільтрів для різних шарів? Я маю на увазі перегляд цього питання: як визначити …

16 deep-learning conv-neural-network

4

Скільки даних вам потрібно для звивистої нейронної мережі?

Якщо у мене є конволюційна нейронна мережа (CNN), яка має близько 1 000 000 параметрів, скільки тренувальних даних потрібно (припустимо, я роблю стохастичний градієнтний спуск)? Чи є якесь правило? Додаткові зауваження: Коли я виконував стохастичний градієнтний спуск (наприклад, 64 патчів за 1 ітерацію), після ~ 10000 ітерацій точність класифікатора може …

15 machine-learning neural-networks deep-learning conv-neural-network

1

Що таке часова класифікація коннекціоністів (CTC)?

Я хочу зробити проект оптичного розпізнавання символів (OCR). Після деяких досліджень я натрапив на архітектуру, яка здається цікавою: CNN + RNN + CTC. Мені знайомі стислі нейронні мережі (CNN) та періодичні нейронні мережі (RNN), але що таке часова класифікація коннекціоністів (CTC)? Мені б хотілося пояснення в умовах непростої людини.

15 machine-learning deep-learning conv-neural-network rnn

1

Чому важливо включити термін корекції зміщення для оптимізатора Адама для глибокого навчання?

Я читав про оптимізатора Адама для глибокого навчання і натрапив на таке речення у новій книзі « Глибоке навчання » Беґніо, Гудфллоу та Кортвіла: Адам включає коригування зміщення оцінок як моментів першого порядку (термін імпульсу), так і (безцентрованих) моментів другого порядку для обліку їх ініціалізації при початку. видається, що основною …

15 machine-learning neural-networks optimization conv-neural-network adam

Запитання з тегом «conv-neural-network»