Чи обмежена можливість розпізнавання шаблонів CNN для обробки зображень?


21

Чи можна використовувати конволюційну нейронну мережу для розпізнавання візерунків у проблемній області, де немає попередніх зображень, скажімо, графічно представляючи абстрактні дані? Чи завжди це буде менш ефективно?

Цей розробник каже, що поточна розробка може йти далі, але не, якщо існує межа розпізнавання зображень.


1
Я бачу тут щонайменше два питання. Як ви думаєте про розкол? Крім того, питання було б набагато якіснішим, якби ви могли розширити те, що ви шукали, заголовок питання.
Ерік Платон

@EricPlaton Трохи посилила його. Головне моє запитання - про характер взаємозв'язку між CNN та зображеннями. Яка б ваша пропозиція щодо другого питання?
dynrepsys

Дякую, питання мені добре (хоча зараз я маю видалити свою відповідь ~). Щодо другого питання, як щодо підходу "що таке улов"? "Це завжди менш ефективно?" все ще добре, якщо хтось може придумати зустрічний приклад.
Ерік Платон

"Чи може бути використана конволюційна нейронна мережа для розпізнавання образів у проблемній області, де немає попередніх зображень, скажімо, графічно представляючи абстрактні дані?" Ви запитуєте, чи можемо ми представити будь-які дані як зображення та застосувати CNN? Як читати набір даних із 100 особливостями і представляти його у вигляді зображення 10х10?
rcpinto

Відповіді:


10

Конволюційні мережі (CNN) покладаються на математичну згортку (наприклад, 2D або 3D згортки), яка зазвичай використовується для обробки сигналів. Зображення - це тип сигналу, і згортання можна однаково використовувати для звуку, вібрацій тощо. Отже, в принципі CNN можуть знаходити додатки до будь-якого сигналу та, ймовірно, більше.

На практиці вже існує робота над NLP (як згадував Метью Грейвс), де деякі люди обробляють текст із CNN, а не з рекурсивними мережами. Деякі інші роботи стосуються обробки звуку (тут немає посилань, але я ще не опублікував роботу, яка триває).


Оригінальний зміст: Відповідаючи на оригінальне запитання, яке змінилося зараз. Можливо, потрібно видалити цю .

Дослідження змагальних мереж (і пов'язаних з ними) показують, що навіть глибокі мережі легко можна обдурити , що змушує їх побачити собаку (або будь-який об’єкт) у тому, що здається випадковим шумом, коли людина дивиться на неї (стаття має чіткі приклади).

Інше питання - генералізаційна потужність нейронної мережі. Конволюційні мережі вразили світ своєю здатністю узагальнити спосіб краще, ніж інші методи. Але якщо в мережі подаються лише зображення котів, вона розпізнає лише котів (і, ймовірно, бачить котів всюди, як за результатами змагальних мереж). Іншими словами, навіть CNS важко узагальнюють занадто далеко, ніж те, чого вони навчились.

Межу розпізнавання важко точно визначити. Я б просто сказав, що різноманітність даних про навчання підштовхує межу (я припускаю, що подальша деталізація повинна призвести до більш відповідного місця для обговорення).


5

Проста відповідь - «ні, вони не обмежуються зображеннями»: CNN також використовуються для обробки природних мов. (Дивіться тут для вступу.)

Я ще не бачив, як вони застосовувались до графічних даних, але я не дивився; Є кілька очевидних речей, які слід спробувати, тому я оптимістично налаштований, що це спрацює.


3

Конволюціонное нейронна мережа може бути застосований не тільки для розпізнавання зображень , але і для відеоаналізу і розпізнавання, обробки природної мови, в іграх (наприклад , Go ) або навіть для виявлення наркотиків шляхом прогнозування взаємодії між молекулами і біологічні білки вікі .

Тому він може бути використаний для різних проблем, використовуючи згортки та підсистеми шарів, з'єднані з більш повно пов'язаними шарами. Їх простіше тренувати, тому що мають менше параметрів, ніж повністю пов'язані мережі з однаковою кількістю прихованих одиниць. UFLDL


3

Звитий нейронну мережу можна використовувати там, де закономірності локально співвідносяться і перекладаються (як у переміщуваному). Це так, тому що CNN містять фільтри, які шукають певні локальні структури скрізь на вході. Ви знайдете локальні та перекладені візерунки у зображеннях, тексті, часових рядах тощо.

Не має великого сенсу використовувати CNN, якщо ваші дані більше нагадують пакет функцій з нерелевантним порядком. У цьому випадку у вас можуть виникнути проблеми з виявленням шаблонів, які містять функції, які, можливо, знаходяться далі у вхідному векторі. Ви не знайдете в своїх даних локальних та перекладних шаблонів, якщо зможете переупорядкувати точки даних вхідних векторів без втрати інформації.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.