Чим звивистий шар відрізняється від звичайної згорткової мережі?


9

Зараз я працюю над відтворенням результатів цього документу . У статті вони описують спосіб використання CNN для вилучення функцій, і мають акустичну модель, яка є Dnn-hmm і перевірена за допомогою RBM.

Підрозділ III розділу A визначає різні способи подання вхідних даних. Я вирішив вертикально скласти графіки спектра статичної, дельтової та дельтової дельти.

Отже, як таке: введіть тут опис зображення

Потім у статті описано, якою має бути мережа. Вони заявляють, що вони використовують згорткову мережу, але нічого не стосується структури мережі ?. Далі більше, чи ця мережа завжди називається згорткою? Я впевнений, що бачу будь-яку різницю в порівнянні зі звичайною мережевою згортковою нейронною мережею (cnn).

У статті зазначено це стосовно різниці:

(з розділу III підрозділу B)

Однак, складний склад відрізняється від стандартного повністю пов'язаного прихованого шару у двох важливих аспектах. По-перше, кожна згорнута одиниця отримує вхід лише з локальної області введення. Це означає, що кожен блок представляє деякі особливості локальної області вводу. По-друге, одиниці згортки можуть бути самі організовані в декілька функціональних карт, де всі одиниці в одній картці особливостей мають однакові ваги, але отримують дані з різних місць нижнього шару

Інше, що мені було цікаво - чи справді в статті зазначено, скільки вихідних параметрів потрібно для подачі акустичної моделі dnn-hmm. Я не можу, здається, розшифрувати кількість фільтрів, розміри фільтрів .. загалом про інформацію про мережу?


Мене теж цікавить це. Здогадуюсь, я можу розпочати щедрість, щоб прискорити процес.
Ламда

Відповіді:


4

Здається, що згортковий шар точно такий же, як і звичайний згортковий шар. Зі своєї роботи вони стверджують, що термін "шар CNN" зазвичай відноситься до згорткового шару, за яким йде шар об'єднання. Намагаючись зменшити плутанину, вони називають згорткову частину "слоєм згортання", а частину об'єднання "слоєм об'єднання":

У термінології CNN пара шарів згортки та об'єднання на фіг. 2 послідовно називається одним «шаром CNN». Таким чином, глибокий CNN складається з двох або більше цих пар підряд. Щоб уникнути плутанини, ми будемо називати згортання та об'єднання шарів як згортання та об'єднання шарів відповідно.

Як не дивно, це посилило плутанину, що призвело до цієї посади. На той час я гадаю, що не було звичних мати кілька згорткових шарів поспіль перед шаром об'єднання, але ми часто бачимо це в сучасних архітектурах.

Щоб відповісти на ваше інше запитання щодо структури мережі; вони вказують структуру мережі, яку вони використовують у розділі Експерименти (Розділ VB). Щоб сподіватися зменшити плутанину, я замінив слово "ply" на "шар":

У цих експериментах ми використовували один згортання [шар], один об'єднання [шар] та два повністю пов'язаних прихованих шару на вершині. Повністю з'єднані шари мали по 1000 одиниць у кожному. Параметри згортання та об'єднання були: розмір пулу 6, розмір зсуву 2, розмір фільтра 8, 150 карт функцій для FWS та 80 карт карт на смугу частот для LWS.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.