Чи є алгоритми комп'ютерного зору, спеціально орієнтовані на зображення глибини?


9

Я розглядав алгоритми виявлення маркерів для використання з додатком на основі kinect, і більшість робіт, які мені вдалося знайти, явно зосереджені на виявленні функцій у "звичайних" зображеннях.

Однак апаратне забезпечення kinect забезпечує (по суті, після того, як ви відрегулювали) значення 11-бітної глибини на піксель.

На цьому глибинному зображенні також є різні візуальні артефакти від тіней, відлитих по краях предметів (див., Наприклад, сильну чорну облямівку у цьому відео http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).

Хоча деякі традиційні методи машинного зору (наприклад, виявлення ребер) добре справляються з цим, інші - ні, і здається, що в мережі мало інформації, що це обговорює.

Як простий приклад, використання значення глибини робить тривіальним виявлення орієнтації блоку маркера, як тільки ви його знайдете.

Отже, хтось бачив якісь дискусії / документи / тощо, які б охоплювали обробку зображення на глибині для виявлення функцій?

Чи може хтось порекомендувати хороший алгоритм виявлення маркерів "глибини" (ефективні блоки орігамі замість друкованих б / ш маркерів)?

Що я робив до цих пір, це adhoc експериментувати з використанням opencv для обробки зображень, але це не там, де майже стабільно або досить швидко.

Якщо ви посилаєтесь на комерційний продукт машинного зору без якогось випробування, будь ласка, зазначте у своїй відповіді, чому ви вважаєте, що це доречно.


Для цього є багато паперів і програм. На жаль, не можна відповісти більш докладно, щодо низької пропускної здатності. Дивіться додаток RGBDemo, воно включає розпізнавач об'єктів. Також бібліотека PointCloud (PCL), ROS, OpenCV для програмного забезпечення та, імовірно, Google Scholar для паперів. Ви згадуєте, що OpenCV не задовольняє вас, але PCL та RGBDemo можуть бути.

Я не шукаю втілення демо-версії, яка демонструє kinect, або деякі демонстрації ПК, які показують, як генерувати 3d-модель з kinect чи інструментарію для обробки зображень (тобто opencv). Я шукаю алгоритми розпізнавання функцій на основі зображення глибини.

RGBDemo реалізує ці алгоритми. Прочитайте код або посилання на код.

Відповіді:


8

Мій улюблений дескриптор функції 2.5D / 3D для реєстрації та розпізнавання - це спінове зображення (оригінальний папір + більше деталей у кандидатській дисертації та програмне забезпечення, доступне у КМУ).

Серед інших останніх досягнень (у режимі онлайн для пошуку відповідних алгоритмів) є: 3D-просіювання, гістограма функцій швидкої точки, нормально вирівняні радіальні функції (NARF), дескриптори глибинного ядра. Старі методи просто використовували властивості поверхні, такі як кривизна та краї, щоб ідентифікувати патчі області.

Що найкраще? Залежить від того, що ви хочете знайти, інваріантності точки зору, додаткового захаращення тощо.


7

Ви зрозуміли всі ключові слова правильно, я здивований, що ви справді не знайшли жодної пов’язаної статті, шукаючи матеріал.

На щастя, у мене є доступ до цифрової бібліотеки IEEE Xplore. Раніше мені не потрібен жоден із цих конкретних алгоритмів, але це виглядає дуже цікаво, тому ось кілька результатів швидкого пошуку, які, на мою думку, можуть бути доречними (не судіть їх за назви, подивіться на їх конспекти):

На жаль, я не думаю, що ви можете отримати доступ до будь-якого з цих робіт безкоштовно, принаймні, не через бібліотеку IEEE Xplore. Якщо у вас немає доступу, ви, ймовірно, можете зайти до науковця Google , і там є кілька безкоштовних баз даних з паперу (я використовував базу даних Mendeley назад, коли ще не мав доступу до IEEE). Крім того, лише частини Googling абстрактних або випадкових частин статті іноді дають певні результати (ви можете натрапити на майже готові попередньо опубліковані версії статті).

Пошуковими запитами, які я використовував для пошуку згаданих робіт, були: 3D-зображення , зображення глибини , кінект . Можливо, ви також захочете переробити обробку під час пошуку перших двох запитів.

Сподіваюсь, це дещо допоможе! Мені шкода, що більше не можу зайнятися темою, звучить дуже цікаво.



@mankoff просто з реферату, я просто бачу роботу, зосереджену на відстеженні, і, здається, вона зосереджена на використанні прямої інформації з не дуже великим виявленням функцій. Але потім я просто прочитав конспект, так що не впевнений.

Поглиблення назв паперу достатньо, щоб знайти PDF-файли для декількох цих робіт. Ще одне хороше джерело - CiteSeer: citeseerx.ist.psu.edu/index Дякую за список робіт!
Rethunk
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.