Чи може одна нейронна мережа обробляти розпізнавання двох типів об'єктів, або її слід розділити на дві менші мережі?


9

Зокрема, вбудований комп'ютер (з обмеженими ресурсами) аналізує прямий відеопотік із камери дорожнього руху, намагаючись вибрати хороші кадри, які містять номерні знаки проїжджаючих автомобілів. Після розміщення пластини кадр передається в бібліотеку OCR для отримання реєстрації та подальшого використання.

У моїй країні поширені два типи номерних знаків - прямокутний (типовий) та квадратний - насправді дещо прямокутний, але «вищий, ніж ширший», з реєстрацією, розділеною на два ряди.

(Є ще кілька типів, але нехтуємо ними; вони невеликі відсотки і, як правило, належать до транспортних засобів, які лежать поза нашими інтересами.)

Через обмежені ресурси та потребу в швидкій обробці в режимі реального часу максимальний розмір мережі (кількість комірок та з'єднань), з якою система може працювати.

Чи було б краще розділити це на дві менші мережі, кожна з яких розпізнає один тип реєстраційних табличок, чи велика одна мережа краще обробляє два типи?

Відповіді:


6

Ну, я не знаю, який тип особливостей ви надаєте своїй нейронній мережі. Однак загалом я б пішов з єдиною нейронною мережею. Здається, що у вас немає обмежень у ресурсах для навчання вашої мережі, і єдиною проблемою є ресурси, коли ви застосовуєте свою мережу.

Вся справа в тому, що, ймовірно, у двох проблем є спільні речі (наприклад, обидва типи плит прямокутні). Це означає, що якщо ви використовуєте дві мережі, кожна повинна знову вирішити одну і ту ж підпроблему (загальну частину). Якщо ви використовуєте лише одну мережу, загальна частина проблеми потребує вирішення меншої кількості осередків / ваг, а інші ваги / комірки можуть бути використані для кращого розпізнавання.

Зрештою, якби я був на вашому місці, я б спробував їх обох. Я думаю, що це єдиний спосіб бути справді впевненим, що є найкращим рішенням. Якщо говорити теоретично, можливо, ми не включимо деякі фактори.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.