Розпізнавання зображень


11

Шукаю систему з відкритим кодом, яка дозволяє комерційному використанню розпізнавати зображення на масивній і органічно зростаючій колекції двовимірних зображень, де єдиними відомими варіантами будуть:

  • Розмір масштабування зображення,
  • Кут знімка зображення,
  • Зміщення кольорової синхронізації, що означає, що через нерівномірності зйомки та візуалізації колір вихідного зображення змінюється залежно від конкретного випадку,
  • Обрізання фотографії,
  • Додавання водяного знака або тексту,
  • Можливі варіації фокусування, тобто зйомка полягала не в фокусі, а не в тому, що застосовано фільтр для обробки зображень.

Я добре з тим, що потрібно тренувати програму, доки прибуток від цього окупнеться - це сказало, що довгостроково я очікую, що кількість двовимірних примірників зросте за початкові кілька тисяч до сотні тисяч; але це довгостроково, і я би радий просто мати рішення, яке добре працює для роботи з навчальним набором з 1000 екземплярів та 10 прикладів на приклад.

ОНОВЛЕННЯ: Ліцензію потрібно використовувати для комерційного внутрішнього розповсюдження без випуску вихідного коду, навіть внутрішнього для всіх, хто має двійковий код. Код ніколи не буде продаватися, він використовується лише внутрішнім, але не кожен користувач матиме доступ до вихідного коду, лише до інтерфейсу.


2
Чи розглядали ви OpenCV?

+1 @pwny: Дякую - так ні, я ніколи не пробував жодної системи комп'ютерного зору (CV), просто намагаюся зрозуміти, чи правильний спосіб, який я думаю про проблему. Я б зазначив, якими є зображення, але оскільки це стосується підприємницької діяльності, а система резюме буде лише для внутрішнього використання, я намагаюся не констатувати, що система буде обробляти, але проблеми, з якими вона стикається. Якщо OpenCV відповідає поточним вимогам, будь ласка, опублікуйте це як відповідь та спробуйте зв’язати пов’язані документи, які охоплюють функціональні вимоги, якщо це можливо. Ще раз дякую!

1
Відповідно до закону про авторські права, такого поняття, як "внутрішній розподіл", немає. Тому більшість ліцензій (все, що мені відомо) не обмежуються обмеженнями в цьому відношенні.
MSalters

+1 @MSalters: Дякую, чи є у вас посилання на "відповідно до закону про авторські права" - це означає, що ви, схоже, говорите, що це зазначено в Законі про авторські права США, хоча, можливо, я просто читаю ваш коментар.

1
@blunders: Технічно - це ТРІПС (стаття 1.3), яка встановлює, що до юридичної особи (наприклад, корпорації) слід поводитися як з фізичною особою.
MSalters

Відповіді:


10

Це може бути трохи низьким рівнем, але OpenCV може надати вам інструменти, необхідні для створення такого програмного забезпечення для розпізнавання зображень. Звичайно, OpenCV не пропонує все необхідне з коробки (я думаю, я не професіонал), але він має на меті забезпечити необхідне для комп'ютерного зору в режимі реального часу.

Ви можете почати читати документацію тут . На цій сторінці також вказано кілька хороших книг.

Сподіваюся, це допомагає, удачі!


Чи означає ліцензія GPLV2 OpenCV, що вона не може бути розповсюджена всередині системи із закритим джерелом? Дякую!

Де ви бачите ліцензію GPLV2? У першому пункті на домашній сторінці він вказаний як ліцензія BSD.

@deterb: у нижньому колонтитулі, внизу сторінки.

@deterb: З'являється, посилання GPL призначене для MoinMoin Wiki Engine, що використовується для вікі для OpenCV, а не для OpenCV - дякую за вказівку на мою помилку!

+1 @pwny: Отже, як вказує, OpenCV знаходиться під ліцензією BSD, яка зазначена на домашній сторінці веб-сайту (з'являється ліцензія нижнього колонтитулу GPLV2 не поширюється на OpenCV), а також намагалася підтвердити це, завантаживши OpenCV та шукаючи ліцензію пошуку в межах всі його файли; які повертають серед інших сторонніх ліцензій - ліцензію, яка, як видається, є для OpenCV у формі ліцензії BSD, хоча в ній не зазначено, що це ліцензія BSD. Отже, продовжуючи це, ваша відповідь - це величезна допомога, і здається досить хорошою, щоб рухатися вперед. Дякую!


2

Просто для додання обговорення я зараз працюю над узгодженням зображень, і я виявив, що ORB OpenCV є вільним; однак SURF і SIFT не є. Ви можете розглядати цей приклад як можливу вихідну точку.


1

Пастек http://www.pastec.io повинен відповідати вимогам початкового питання.

Це індекс з відкритим кодом та пошукова система розпізнавання зображень, випущених під LGPL. Це дозволяє легко додавати, видаляти та шукати відповідні зображення в індексі за допомогою простого HTTP API. Він заснований на OpenCV і використовує дескриптор ORB, який не є патентом на відміну від SURF та SIFT.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.