Алгоритми комп'ютерного зору (як це можливо?)


9

Нещодавно я наткнувся на компанію, яка створила технологію комп'ютерного зору, яка здатна автоматично виявляти крадіжки крадіжок та оповіщати своїх користувачів.

ПОСИЛАННЯ

Перегляд деяких відео та прикладів, наданих компанією, залишив мене зовсім збентежений і вражений тим, як на землі вони, можливо, досягли цієї функціональності.

Я розумію, що ніхто тут не зможе точно сказати мені, як цього можна досягти, але хтось знає - і міг би вказати на мене - дослідження в цій галузі або, можливо, надати детальну інформацію про те, як щось подібне може бути здійснено або керівництво з того, з чого можна почати?

Я розумів, що алгоритми комп'ютерного зору були багато років від того, щоб бути цим складним. Чи реально таке застосування? Хто бажає ризикувати здогадками про те, як вони цього домоглися?


2
Це не здається таким складним. Ігри виявляють зіткнення весь час між предметами; чому ви не могли виявити зіткнення між людиною та полицею предметів, а потім підняти тривогу, коли ця людина йшла до дверей, не заплативши?
Роберт Харві

Саме так. Це просто розпізнавання об'єктів та виявлення зіткнень. Якщо вони не підключили його до сканера, його легко перейти, перемістивши предмети над сканером, але трохи вище його. Схоже, об’єкт зіткнувся зі сканером, але насправді цього не зробив.
Ендрю Т Фіннелл

У будь-якому випадку, жоден із механізмів виявлення, описаних на веб-сайті (кохана, втрата кошика та самовивірка), не вимагає нічого навіть віддаленого, що є складним. Вони перевіряють у дуже обмеженій зоні (лічильник каси) і можуть перехресно перевіряти предмети, помічені в кошику, на предмет сканування штрих-коду, що насправді було відскановано.
Роберт Харві

1
Вибачте, що розгубився. Давайте візьмемо приклад для кохання. У мене є два пункти, один предмет низької вартості, один високий. Я ставлю предмет низької вартості під дорожній і сканую. У цей момент ми можемо порівняти те, що було скановано в POS-системі, з тим, що видно на камері в руці касира, але це вимагає від системи можливості "зрозуміти, що вкладається в сумку", проти сотні тисяч потенціалів предметів через камеру граничної якості. Це здається надзвичайно складним. Що я пропускаю?
Максим Гершкович

6
Я думаю, ви занадто багато припускаєте про те, наскільки добре це працює. Б'юсь об заклад, що у вас є пристойний рівень помилок, і грати в систему, ймовірно, дуже просто. Я сприймаю це як більшу систему типу повітродувки, де вона просто визначає потенційні місця у відео, які потребують людського огляду. Як така, неточність добре переноситься.
chris

Відповіді:


5

Ви дезінформували про сучасний стан. Кілька років тому я працював у компанії, яка будувала такі системи для самих різних цілей. Один був надзвичайно успішною системою контролю за вибухом в аеропорт, яка могла легко визначити різницю між людиною, яка ходить неправильним шляхом по передпокої виходу, та речами, такими як кулі в русі, або люди, що прямували правильним шляхом. Розпізнати об’єкти в сцені в режимі реального часу непросто, але ми робили це на вбудованих процесорах, а не на суперкомп'ютерах.

Я там не бачив нічого, що не було б правдоподібним.


4

Насправді ця компанія використовує гібрид комп'ютерного зору та огляд вручну в Індії. Це не чистий комп’ютерний зір, особливо для таких елементів, як люба. Насправді я знаю одного ритейлера, який має досить неполадки з цією системою не через продуктивність системи, яку я зберігаю, а пропускну здатність відео доставки до Індії. Це ручне кодування полягає в тому, як вони зменшують помилки і є типовим технічним запитом у деяких постачальників зараз.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.