Як саме DropOut працює з згортковими шарами?


10

Випадання ( папір , пояснення ) встановлює вихід деяких нейронів до нуля. Отже, для MLP у вас може бути така архітектура для набору даних квітів Iris :

4 : 50 (tanh) : dropout (0.5) : 20 (tanh) : 3 (softmax)

Це діятиме так:

softmax(W3tanh(W2mask(D,tanh(W1input_vector)))

з , W 1R 50 × 4 , D { 0 , 1 } 50 × 1 , W 2R 20 × 50 , W 3R 20 × 3 (ігнорування упереджень заради простоти).input_vectorR4×1W1R50×4D{0,1}50×1W2R20×50W3R20×3

З іD=(d)ij

dijB(1,p=0.5)

де операція множиться D в точці на M (див. продукт Адамара ).mask(D,M)DM

Отже, ми щоразу відбираємо вибірку матриці і таким чином випадання стає множенням вузла на 0.D

Але для CNN мені незрозуміло, що саме випадає. Я бачу три можливості:

  1. Випадання повних карт функцій (звідси ядро)
  2. Видалення одного елемента ядра (заміна елемента ядра на 0)
  3. Видалення одного елемента карти об’єктів

Будь ласка, додайте до відповіді посилання / цитату.

Мої думки

Я думаю, що Лазань (3) (див. Код ). Це може бути найпростішим у здійсненні. Однак ближче до початкової ідеї може бути (1).

Схоже на Caffe (див. Код ). Для tensorflow, користувач повинен вирішити ( код - я не впевнений, що станеться, коли noise_shape=Noneбуде передано).

Як має бути

(2) та (3) не мають великого сенсу, оскільки це призведе до того, що мережа додасть інваріантності просторовим положенням, що, мабуть, не бажано. Отже (1) є єдиним варіантом, який має сенс. Але я не впевнений, що станеться, якщо ви використовуєте реалізацію за замовчуванням.


Я задав питання також у групі користувачів Lasagne .
Мартін Тома

Я друг зауважив, що (2) та (3) може бути недоброю ідеєю, оскільки це може змусити мережу просторово поширювати інформацію.
Мартін Тома

Відповіді:


1

lW(l+1)

Для більш детальної інформації я думаю, що розділ 3 у цьому документі може допомогти вам: Максимальне об'єднання та згортання . Зокрема 3.2.

Під час тестування ви використовуєте всі вузли мережі, але ваги фільтра масштабуються на ймовірність збереження, як це пояснено у статті.

Будь ласка, не соромтеся уточнити або виправити мою відповідь.

Сподіваюсь, це допоможе хоч трохи.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.