1D згортка в нейронних мережах


9

Я розумію, як працює згортка, але я не розумію, як 1D згортки застосовуються до 2D даних.

2D згортка

У цьому прикладі ви можете бачити 2D згортку в 2D даних. Але як би це було, якби 1D згортка? Просто 1D ядро ​​ковзає таким же чином? А якщо кроку було 2?

Дякую!


1
Просто подивіться на перший рядок кожної матриці.
Пьотр Мігдал

Чи можете ви надати мені приклад?
Густаво

1d згортки насправді не будуть корисні для суворого 2d-зображення. Зображення без масштабу сірого кольору є технічно 3D, оскільки вони мають три кольорові канали.
Етан

1
@Gustavo На кшталт цього: toto-share.com/wp-content/uploads/2011/11/… Якщо тільки ви не маєте на увазі 1x1 згортання (у сенсі нейронних мереж), це вже інша річ.
Пьотр Мігдал

Моя проблема полягає в згортаннях, таких як: d3kbpzbmcynnmx.cloudfront.net/wp-content/uploads/2015/11/… Є два згортки, один з розміром ядра 3 та інший розміром 2 ... Але ці ядра мають 1D або розмір xk ?
Густаво

Відповіді:


2

Дозволяє x1,,xnбути послідовністю векторів (наприклад, векторів слів). Нанесення згорткового шару рівнозначно застосуванню однакових вагових матриць до всіх n-грамів, деn- висота вашого фільтра. Наприклад, якщоn=3, ви можете візуалізувати його наступним чином:

введіть тут опис зображення

Для трохи більш математичного пояснення ви можете перевірити Джи Янг Лі, Френка Дернонкура. " Послідовна класифікація короткого тексту з періодичними та згортковими нейронними мережами ". NAACL 2016 . розділ 2.1.2:

введіть тут опис зображення


1

1D згортки використовуються в згорткових мережах для відбору проб вниз і відбору проб в розмірі фільтра. Конволюційні мережі створюють ці фільтрувальні карти, проходячи через мережу, ви можете реально уявити їх як 3-й вимір. Звичайний базовий вимір розміру карти фільтра - це розмір 3, оскільки у нас часто будуть RGB-зображення, що проходять через нашу мережу.

Ці 1D згортання можуть бути корисні для відбору проб вниз, виконуючи деяку операцію, а потім підняття вибірки назад до того ж виміру. Це цілком корисно з міркувань продуктивності.

Щоб по-справжньому зрозуміти, я пропоную прочитати:

Мережа в мережі - http://arxiv.org/abs/1312.4400

Заглиблюючись з звивинами - https://www.google.com/url?sa=t&source=web&rct=j&url=http://www.cs.unc.edu/~wliu/papers/GoogLeNet.pdf&ved=0ahUKEwi89oeuxqnLAhXhuIMKHZrTCe0QFggkMAE&usg=AFQjCNGCEEnUgrgCn- rrECNQ72wI3PH1Qw & sig2 = VhjfaMvuskNIDVKhFfNiqQ


4
Це здається, що ви говорите про 1x1 згортки (в сенсі нейронних мереж), а не про одновимірні згортки.
Пьотр Мігдал

Правильно, я припускав, що нейронні мережі були залучені. Я наткнувся на посилання на це питання на / r / MLQuestions на reddit, тому я припустив, що це стосується ML. Але для простого згортання це не так актуально: P.
Етан
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.