Я працюю в мережі згортки для розпізнавання зображень, і мені було цікаво, чи можу я вводити зображення різного розміру (хоча не дуже різного).
Про цей проект: https://github.com/harvardnlp/im2markup
Вони кажуть:
and group images of similar sizes to facilitate batching
Тож навіть після попередньої обробки зображення все ще мають різні розміри, що має сенс, оскільки вони не вирізають частину формули.
Чи є проблеми з використанням різних розмірів? Якщо є, як я повинен підійти до цієї проблеми (оскільки формули не всі вмістяться в одному розмірі зображення)?
Будь-який внесок буде дуже вдячний