Схожість
В основному обидва типи алгоритмів були розроблені, щоб відповісти на одне загальне питання в машинному навчанні:
З урахуванням прогнозів (факторів) - як включити взаємодії між цими факторами з метою підвищення продуктивності?x1,x2,…,xp
Один із способів - просто запровадити нові прогноктори: Але це виявляється поганою ідеєю через величезну кількість параметрів та дуже специфічний тип взаємодій.xp+1=x1x2,xp+2=x1x3,…
І алгоритми багаторівневого моделювання, і алгоритми глибокого навчання відповідають на це питання, вводячи значно розумнішу модель взаємодій. І з цієї точки зору вони дуже схожі.
Різниця
Тепер дозвольте спробувати дати зрозуміти, у чому полягає велика концептуальна різниця між ними. Для того, щоб дати певне пояснення, давайте подивимось припущення, які ми робимо у кожній з моделей:
Багаторівневе моделювання: 1 шари, які відображають структуру даних, можуть бути представлені у вигляді Байєсової ієрархічної мережі . Ця мережа є фіксованою і зазвичай надходить із доменних додатків.1
Глибоке навчання: 2 дані були створені взаємодією багатьох факторів. Структура взаємодій не відома, але може бути представлена у вигляді шаруватої факторизації: взаємодії вищого рівня отримуються шляхом перетворення уявлень нижчого рівня.2
Принципова відмінність походить від фрази "структура взаємодій не відома" в "Глибокому навчанні". Можна припустити деякі пріоритети щодо типу взаємодії, але все ж алгоритм визначає всі взаємодії під час процедури навчання. З іншого боку, ми повинні визначити структуру взаємодій для багаторівневого моделювання (ми дізнаємось лише змінювати параметри моделі згодом).
Приклади
x1,x2,x3{x1}{x2,x3}
х1х2х1х3х2х3 . Звичайно, частково на результати впливатиме кореляція помилок, але це не так важливо для прикладу.
При глибокому вивченні, наприклад, у багатошарових машинах Больцмана з обмеженим обмеженням ( RBM ) з двома прихованими шарами та лінійною функцією активації, ми матимемо всі можливі поліноміальні взаємодії зі ступенем меншим або рівним трьох.
Загальні переваги та недоліки
Багаторівневе моделювання
(-) потрібно визначити структуру взаємодій
(+) результати зазвичай простіше інтерпретувати
(+) може застосовувати методи статистики (оцінювати інтервали довіри, перевіряти гіпотези)
Глибоке навчання
(-) вимагає величезної кількості даних для тренувань (і часу для тренування також)
(-) результати, як правило, неможливо інтерпретувати (надається у вигляді чорного поля)
(+) ніяких експертних знань не потрібно
(+) колись добре навчений, зазвичай перевершує більшість інших загальних методів (не специфічних для застосування)
Сподіваюся, це допоможе!