DropOut та DropConnect - це обидва методи, призначені для запобігання «співнадійності» одиниць у нейронній мережі. Іншими словами, ми хочемо, щоб одиниці самостійно отримували функції зі своїх даних, а не покладалися на інші нейрони.
Припустимо, у нас є така багатошарова мережа, як ця (топологія насправді не має значення). Ми стурбовані тим, що жовті приховані одиниці в середньому шарі спільно адаптуються.
Опускати
Щоб застосувати DropOut, ми випадковим чином вибираємо підмножину одиниць і затискаємо їх вихід до нуля, незалежно від введення; це ефективно видаляє ці одиниці з моделі. Різні підмножини одиниць вибираються випадковим чином кожного разу, коли ми представляємо навчальний приклад.
Нижче наведено дві можливі конфігурації мережі. У першій презентації (ліворуч) 1-я та 3-я одиниці відключені, але 2-я та 3-я одиниці були вибрані випадковим чином у наступній презентації. У тестовий час ми використовуємо повну мережу, але масштабуємо ваги, щоб компенсувати той факт, що всі вони тепер можуть стати активними (наприклад, якщо ви скинете половину вузлів, ваги також повинні бути вдвічі меншими).
DropConnect
DropConnect працює аналогічно, за винятком того, що ми відключаємо окремі ваги (тобто встановлюємо їх на нуль) замість вузлів, тому вузол може залишатися частково активним. Схематично це виглядає приблизно так:
Порівняння
Обидва ці методи працюють, оскільки вони ефективно дозволяють тренувати декілька моделей одночасно, а потім оцінювати їх для тестування. Наприклад, жовтий шар має чотири вузли, і, таким чином, 16 можливих станів DropOut (усі включені, №1 вимкнено, №1 та №2 відключені тощо).
DropConnect - це узагальнення DropOut, оскільки воно створює ще більше можливих моделей, оскільки майже завжди більше з'єднань, ніж одиниць. Однак ви можете отримати подібні результати на індивідуальному випробуванні. Наприклад, мережа DropConnect праворуч ефективно скинула блок №2, оскільки всі вхідні з'єднання були видалені.
Подальше читання
Оригінальні документи досить доступні і містять більше деталей та емпіричних результатів.