Глибокі нейронні мережі - тільки для класифікації зображень?


14

Усі приклади, які я знайшов, використовуючи глибокі переконання або звивисті нейронні мережі, використовують їх для класифікації зображень, виявлення символів або розпізнавання мови.

Чи корисні глибокі нейронні мережі також корисні для класичних завдань регресії, де функції не структуровані (наприклад, не розташовані в послідовності чи сітці)? Якщо так, чи можете ви навести приклад?


3
Ваше перше речення викликає звивисті нейронні мережі. Здається, ви плутаєте їх із мережами глибоких переконань. Вони не однакові, хоча обидва є формами нейронних мереж.
MSalters

1
Я погодився б з @msalters, але сказав би, що мережі з глибокою вірою є справді глибокими мережами і мали обмежений успіх, тоді як конволюційні мережі більше схожі на гібридно-адаптивні фільтри зображень s у згорткових шарах з наступною дрібною nn.
seanv507

Що ви маєте на увазі під "спостереженнями", які "не структуровані (не розташовані в послідовності чи сітці)"? Ви посилаєтесь на зображення "структуровані" в тому сенсі, що окремі пікселі розташовані на сітці? Але тоді це "структуровані" функції, а не "спостереження" (це були б окремі образи)?
Амеба каже: Відновити Моніку

Я б сказав, що всі мережі згортки є глибокими, не всі глибокі мережі - це згортання, і так само всі мережі глибоких вірувань є глибокими, не всі глибокі мережі - це мережі глибоких вірувань. Дійсно, у вас можуть бути глибокі мережі, які не є ні глибокими, ні звивистими, їх просто важко навчати. Звичайно, є можливість для безглуздих дискусій щодо термінології.
Ліндон Уайт

Не можна застосовувати згорнуту мережу до неструктурованих даних (не в послідовності / сітці тощо). Це в основному не має сенсу. Згорнута мережа тісно пов'язана з перетворенням Фур'є вхідного сигналу - наприклад, для послідовностей, що перетворюють її з часової області в частотну область.
Ліндон Уайт

Відповіді:


8

Характеристика зображень, що робить їх підданими класифікації з глибокою нейронною мережею, полягає в тому, що є безліч особливостей (можливо, мільйони, якщо не мільярди пікселів з RGB, інтенсивністю тощо), і якщо у вас є точні мітки, це не галасливі дані. Камери в наші дні дуже хороші, і вони нічого не міняють. Завдяки Інтернету, у нас зараз багато чітко маркованих зображень. Глибока мережа може виражати довільно складні функції, що є проблемою з галасливими даними, оскільки ви можете дуже легко переповнювати шум, тому багато методів навчання схильні штрафувати складні моделі. Що стосується розпізнавання зображень, правда, справжня функція здається насправді дуже складною, ми не маємо уявлення про те, як виглядає функціональна форма, і ми навіть не знаємо, які відповідні особливості у багатьох випадках.

Це не означає, що ви не можете використовувати глибокі мережі для вивчення функцій, що не мають нічого спільного із зображеннями. Вам потрібно бути дуже обережним щодо недоліків, здебільшого, що це дуже схильне до переозброєння, але також, що це обчислювально дорого і може зайняти тривалий час для тренувань (не так вже й багато проблем із паралельними SGD та GPU). Іншим недоліком є ​​те, що ви маєте дуже мало-зовсім не інтерпретаційність моделі, що насправді не має значення для класифікації зображень. Ми просто намагаємось змусити комп’ютери визнати різницю між шимпанзе та орангутаном. Людське розуміння формули не має значення. Для інших областей, особливо медичної діагностики, політичних досліджень тощо, ви хочете або навіть потребуєте людського розуміння.


5

Звичайно, ви можете використовувати глибокі нейронні мережі для багатьох проблем, крім розпізнавання зображень чи мови. Проблема полягає в тому, якщо вона вам справді потрібна.

Глибокі нейронні мережі набагато потужніші, ніж простий MLP, однак вони також забирають більше ресурсів і складніше розвиватися. Таким чином, вони використовуються в дійсно складних областях. Ви можете використовувати їх для вирішення легших проблем, але зазвичай простіші моделі також отримують хороші результати.

Використання глибоких нейронних мереж для легких проблем буде як вбивство мух базукою, ви впевнені, що ви їх вб'єте, але не змогли знайти більш простий спосіб?


2
Це невідповідь. Що легко, що важко? Прогнозування фондового ринку / екстраполяція з обмежених прикладів / ... Є чимало важких проблем, чи глибокі nns хороші для всіх?
seanv507

Я не говорив, що глибокі нейронні мережі можуть вирішити що завгодно. Я мав на увазі те, що вони використовуються в складних доменах, де у вас є величезна кількість записів. Я знаю, що вони не можуть вирішити кожну проблему, але справа не в цьому. Справа в тому, що вони можуть бути застосовані до інших проблем, крім розпізнавання зображень / мови, але вони мають недоліки, які варто враховувати у випадках, коли можна застосувати інші моделі.
davidivad

5

Я погоджуюся з відповіддю давідівада. Але я також думаю, що застосування глибоких нейронних мереж до зображень полягає в тому, що зображення (і, що ще важливіше, мічені зображення) збирати порівняно недорого. В інших сферах збирання даних у великих масштабах може бути дуже дорогим, особливо в рамках обмежень типового промислового чи урядового підприємства. Складнощі цього питання полягають у тому, що в багатьох додатках явище, що цікавить, є порівняно рідкісним, тому з них можна буде вивчити кілька прикладів, тому навіть відносно масштабні зусилля щодо збору даних можуть принести незначну кількість членів якогось класу.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.