Я намагаюся виявити логотип телеканалу всередині відеофайлу, тому просто даю вхідне .mp4
відео, виявляю, чи є у нього такий логотип у певному кадрі, скажімо, перший кадр чи ні.
У нас є логотип заздалегідь (хоча він може бути не 100% однакового розміру), і місце розташування завжди виправлено.
У мене вже є підхід, орієнтований на відповідність шаблону. Але для цього потрібно, щоб шаблон був% 100 однакового розміру. Я хотів би використовувати для цього глибоке навчання та нейромережу. Як я можу це зробити? Я вважаю, що CNN може мати більш високу ефективність?