Ідея Neural Networks полягає в тому, що їм потрібна невелика попередня обробка, оскільки важкий підйом виконується за алгоритмом, який відповідає за вивчення особливостей.
Переможці Data Science Bowl 2015 чудово описують свій підхід, тому більшість змісту цієї відповіді взято з:
Класифікація планктону з глибокими нейронними мережами . Я пропоную вам прочитати її, особливо частину про попередню обробку та збільшення даних .
- Змініть розмір зображень
Що стосується різних розмірів, роздільної здатності або відстані, ви можете зробити наступне. Ви можете просто змінити масштаб найбільшої сторони кожного зображення на фіксовану довжину.
Інший варіант - використовувати openCV або scipy. і це дозволить змінити розмір зображення в розмірі 100 ліній (ширина) і 50 рядків (висота):
resized_image = cv2.resize(image, (100, 50))
Ще один варіант - використовувати модуль scipy, використовуючи:
small = scipy.misc.imresize(image, 0.5)
- Збільшення даних
Збільшення даних завжди покращує продуктивність, хоча сума залежить від набору даних. Якщо ви хочете доповнити дані, щоб штучно збільшити розмір набору даних, ви можете зробити наступне, якщо справа стосується (це не застосовуватиметься, якщо, наприклад, були зображення будинків чи людей, де, якщо ви повернете їх на 180 градусів, вони втратили б всю інформацію але не, якщо ви перевернете їх як дзеркало):
- обертання: випадковий з кутом між 0 ° і 360 ° (рівномірний)
- переклад: випадковий зі зміщенням між -10 та 10 пікселями (рівномірний)
- масштабування: випадковий з коефіцієнтом масштабу між 1 / 1,6 і 1,6 (рівномірний журнал)
- гортання: так чи ні (bernoulli)
- нахил: випадковий з кутом від -20 ° до 20 ° (рівномірний)
- розтягування: випадковий з коефіцієнтом розтягування від 1 / 1,3 до 1,3 (рівномірний журнал)
Результати можна побачити на зображеннях чаші Data Science.
Попередньо оброблені зображення
доповнені версії одних і тих же зображень
-Інші прийоми
Вони стосуватимуться інших властивостей зображення, таких як освітлення, і вже пов'язані з основним алгоритмом, як простий крок попередньої обробки. Перевірте повний список у: Підручник з UFLDL