Не квадратні зображення для класифікації зображень


9

У мене є набір даних із широкими зображеннями: 1760x128. Я читав, хоча навчальні посібники та книги, і більшість із них зазначає, що вхідні зображення повинні бути квадратними, а якщо ні, вони перетворюються на квадратні, щоб навчатись у вже навчених (на квадратних зображеннях) cnns. Чи є спосіб тренувати cnn для не квадратних зображень, чи слід шукати інший варіант, як підкладка?

Відповіді:


4

Існує кілька способів вирішити проблему залежно від класифікатора. Розсувні Windows - це метод, який мені найбільше знайомий, він використовується для методів нейронної мережі. Цей метод включає зйомку невеликого під-зображення та зміщення його вгору та вниз з деякими перекриттями. Деякі проблеми включають в себе пошук оптимальних параметрів зсуву та кілька масштабних питань.

Остаточне виявлення зазвичай визначається тим, наскільки впевненим класифікатором є те, що кожне з зображень належить до цього класу: наприклад, більшість голосів, загальна вірогідність або загальна відстань від межі рішення. Я перерахував деякі матеріали нижче. Перший - це метод класифікатора HOG, але поняття ті ж.

  1. Розпізнавання об'єктів розсувних Windows
  2. Виявлення категорій об’єктів: розсувні Windows
  3. Інтегральне розпізнавання, локалізація та виявлення OverFeat за допомогою згорткових мереж

2

Це взагалі не повинно створювати проблем, якщо ви використовуєте CNN. Я зробив CNN для розпізнавання облич, і оскільки обличчя зазвичай приблизно на 70% ширше, ніж вони високі, я використовував навчальні зображення розміром 80х100 пікселів (трохи додаткової ширини, якщо голова була під кутом). Однак ваші фільтри все одно повинні бути квадратами.

Все, що зміни, полягало б у тому, що тепер вам потрібно буде відстежувати ширину та висоту для своїх активаційних / об'єднаних карт, а не лише одне значення, яке визначає розмір. Наприклад -

Вхідне зображення 80 x 100 Застосування фільтру згортки 5 x 5 дає карту активацій на 76 x 96 Застосування 2 x 2 об'єднання дає карту об'єднаних активацій на 38 x 48

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.