Використовуйте AI або нейронну мережу для виявлення логотипу

10

Я намагаюся виявити логотип телеканалу всередині відеофайлу, тому просто даю вхідне .mp4відео, виявляю, чи є у нього такий логотип у певному кадрі, скажімо, перший кадр чи ні.

У нас є логотип заздалегідь (хоча він може бути не 100% однакового розміру), і місце розташування завжди виправлено.

У мене вже є підхід, орієнтований на відповідність шаблону. Але для цього потрібно, щоб шаблон був% 100 однакового розміру. Я хотів би використовувати для цього глибоке навчання та нейромережу. Як я можу це зробити? Я вважаю, що CNN може мати більш високу ефективність?

— Тіна Дж
джерело

1

Ласкаво просимо до AI! Чудова тема.

— DukeZhou

1

@DukeZhou Tnx! Я сподіваюся, що я отримаю правильні відповіді вказівниками на деякі зразкові коди.

— Tina J

5

Щоб виконати розпізнавання зображень, ви повинні знайти спосіб представити зображення з певними функціями.

Однією з визначальних характеристик хорошого алгоритму розпізнавання зображень є його здатність виявляти чіткі області, тобто регіони, які містять найбільше інформації

На даний момент велика увага приділяється глибокому вивченню контентної класифікації зображень. Ви можете досягти гідних результатів, застосувавши глибоке навчання, що має три або більше шарів CNN, де кожен шар відповідає за витяг однієї або декількох особливостей зображення.

— Сет Сімба
джерело

Дякую. Я сам не хлопець CNN. Але чи є вказівник на вихідний код, який дав зображення логотипу, він може виявити, чи існує він чи ні?

— Тіна J

3

Гей, будь ласка, перевіри DeepLogo на Github від Сатоя Ковіча. Він написаний на Python і використовує CNN для розпізнавання логотипу торгової марки. Я розмістив посилання нижче. Ура. github.com/satojkovic/DeepLogo

— Seth Simba

3

Оскільки це вхід для відео, а логотипи зазвичай нерухомі, оскільки вони шаруються над прямими або записаними кадрами або апаратним, або програмним забезпеченням, завдання не є складним. Логотипи також зазвичай мають обмежену палітру кольорів і чіткі краї. Особливості їхніх шрифтів, коли вони вимовляють слова або абревіатури, зазвичай також узгоджуються. Це загальні аспекти, які можна використовувати в глибокому навчанні.

Як і в іншому подібному питанні, опублікованому цим автором, комбінація шарів LSTM та CNN може бути навчена пошуку та ізоляції логотипу. За допомогою деяких хитрощів зображення, зображення за логотипом також можна реконструювати з розумною точністю та надійністю з пікселів навколо логотипу за допомогою подібного набору методів навчання.

Це кілька вихідних точок розвитку.

— Дуглас Дазееко
джерело