Змінення розміру зображення та обшивка для CNN


14

Я хочу навчити CNN для розпізнавання зображень. Зображення для тренувань не мають фіксованого розміру. Наприклад, я хочу, щоб розмір вводу для CNN становив 50x100 (висота x ширина), наприклад. Коли я змінюю розмір невеликих розмірів зображень (наприклад, 32x32) до розміру введення, вміст зображення занадто сильно розтягується по горизонталі, але для деяких зображень середнього розміру це виглядає нормально.

Що є правильним методом зміни розміру зображень, уникаючи руйнування вмісту?

(Я думаю про розміщення зображень з 0 до повного розміру після зміни їх розміру до певної міри, зберігаючи співвідношення ширини та висоти. Чи було б це нормально з цим методом?)

Відповіді:


10

Це питання про stackoverflow може допомогти вам. Підводячи підсумок, деякі дослідники глибокого навчання вважають, що нанесення великої частини зображення не є хорошою практикою, оскільки нейронна мережа повинна дізнатись, що набивна область не має значення для класифікації, і вона не повинна вчитися тому, якщо ви наприклад, використовуйте інтерполяцію.


5

У вас є кілька варіантів:

Для невеликих зображень:

  • вибір за допомогою інтерполяції
  • накладіть зображення за допомогою нулів

Якщо ви не можете підтримувати співвідношення сторін за допомогою поглинання, ви можете збільшити вибірку, а також обрізати зайві пікселі у найбільшому розмірі. Звичайно, це призведе до втрати даних, але ви можете кілька разів зміщувати центр урожаю. Це допоможе вашій моделі бути більш надійною.


Для великих зображень:

  • вибірка
  • обрізати до введеного розміру

Нарешті, якщо ви використовуєте повністю згорнуту мережу (FCN), вам не потрібно змінювати розмір зображень.

TL; DR:

так, набивання нулями - це вірний варіант.


якщо я підготував ваги для повністю згорнутої мережі, яка приймає 3 об'єднані відеокадри, як я можу використовувати ці ваги для мережі з тією ж архітектурою, за винятком того, що розмір вводу збільшується до об'єднаних 11 кадрів? Я лише роблю прогнози, не тренуюсь далі. Моє запитання тут: datascience.stackexchange.com/questions/55737/…
mLstudent33

3

Ви можете виконати наступне: Спочатку змініть розміри зображень до певної міри, а потім наклейте зображення з усіх боків, що може допомогти у збереженні функцій на зображенні.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.