Де і чому блищить глибоке навчання?


20

З усіма медіа-розмовами про глибоке вивчення цих днів я прочитав деякі елементарні речі про це. Щойно я виявив, що це просто ще один метод машинного навчання для вивчення шаблонів з даних. Але моє запитання: де і чому цей метод світить? Чому всі говорять про це саме зараз? Тобто в чому суєта?


4
Подивіться на якісні лекції Джету Гінтона та Ендрю Нга, щоб отримати легкий огляд того, чому це так добре.
Jase

Відповіді:


22

Основні переваги:

(1) Не потрібно передавати інженерні функції для нелінійних проблем навчання (заощаджуйте час та масштабуйте майбутнє, оскільки ручна інженерія дехто сприймає як короткотермінову допомогу)

(2) Вивчені функції іноді кращі, ніж найкращі ручні функції, і можуть бути настільки складними (комп’ютерне бачення - наприклад, обличчясті функції), що інженеру знадобиться занадто багато людського часу.

(3) Може використовувати незазначені дані для попередньої підготовки мережі. Припустимо, у нас є 1000000 зображень без маркування та 1000 зображень із міткою. Зараз ми можемо кардинально вдосконалити алгоритм керованого навчання, попередньо підготувавшись до 1000000 зображень без маркування з глибоким навчанням. Крім того, в деяких областях у нас є стільки без маркування даних, але мічені дані важко знайти. Цінним є алгоритм, який може використовувати ці немечені дані для покращення класифікації.

(4) Емпірично розгромило багато орієнтирів, які бачили лише додаткові покращення до впровадження методів глибокого навчання.

(5) Один і той же алгоритм працює в декількох областях із сирими (можливо, з незначними попередніми обробками) входами.

(6) Тримає вдосконалення, оскільки в мережу подається більше даних (якщо припускати стаціонарні розподіли тощо).


1

Ще один важливий момент, окрім сказаного (у мене немає достатньої кількості представників, щоб просто додати це як коментар), це те, що це генеративна модель (принаймні мережі глибоких переконань), і таким чином ви можете взяти вибірку з вивчених розподілів - це може мають деякі основні переваги в певних програмах, де потрібно генерувати синтетичні дані, відповідні вивченим класам / кластерам.


1
Це не загальна властивість глибокого навчання, а конкретна модель, про яку йдеться. Наприклад, ви можете зробити вибірку з гаусса, але не з логістичної регресії. Ви також можете пробувати з різних моделей глибокого навчання, наприклад, мереж глибокої віри, як ви вже говорили, глибоких машин Больцмана, глибоких прихованих гауссових моделей тощо. Але ви не можете взяти вибірку з дреднетів, які є моделями, які використовувались у всіх вражаючих додатки.
bayerj

... Чому ви не можете взяти вибірку з логістичної регресії?
Hong Ooi

p(c|х)

1
Але те ж саме стосується і гауссової регресійної моделі, якщо ви маєте на увазі базову лінійну регресію.
Hong Ooi
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.