Дескриптори характеристик масштабу та обертання


16

Чи можете перелічити дескриптори функцій масштабу та обертового інваріанта для використання у виявленні функцій.

Додаток призначений для виявлення автомобілів та людей на відео, знятому безпілотником, за допомогою багатокласного класифікатора.

Поки я дивився на SIFT та MSER (що є афінним інваріантом). Я також дивився на LESH, LESH заснований на локальній енергетичній моделі, але розрахований таким чином, що не є ротаційно-інваріантним, я намагався придумати спосіб використання локальної енергії, побудувати обертально інваріантний дескриптор функцій, я читаю тут Які існують безкоштовні альтернативи SIFT / SURF, які можна використовувати в комерційних програмах? , що "якщо призначити орієнтацію на точку інтересу і відповідно обертати патч зображення, ви отримуєте обертальну інваріантність безкоштовно", але не знаю, чи це навіть полегшує або як я можу застосувати це до своєї проблеми, будь-яка допомога буде вдячний, спасибі


Використовуйте ORB (орієнтований ШВИДКО та поворотний БРІФ) з бібліотеки OpenCV.
Жорсткий Вардан

Відповіді:


9

Що стосується альтернатив SIFT / SURF, питання, яке ви пов’язали, дає дуже хороші відповіді.

Я міг прочитати ще два питання:

  • "як я міг побудувати корисний (наприклад, інваріант обертання) дескриптор"?
  • "Щодо твердження з пов'язаного питання, як він здійснює вільну обертальну інваріантність?"

Побудова дескрипторів функцій

Це дійсна тема дослідження. Хороші дескриптори функцій - це не те, що кожен може побудувати в другій половині дня. Люди публікують статті, коли вони успішно моделюють дескриптори з бажаними властивостями. Це причина, що наразі використовується лише декілька найсучасніших дескрипторів, і це також я радимо вам зробити: знайти дескриптори функцій, які відповідають вашим потребам .

Досягнення обертальної інваріантності "безкоштовно"

Ви можете визначити домінуючий градієнт або орієнтацію за патчем зображення (область вашої функції). Потім поверніть патч зображення так, щоб градієнт завжди виглядав у тому ж напрямку, наприклад (вгору). Наприклад, якби у вас було зображення та зображення, їх домінуючі градієнти вказували б відповідно ліворуч ( ) та праворуч ( ), і коли ви обертаєте їх на цю суму, ви отримуєте однакові зображення.0|black->gray->white||white->gray->black|-9090

Таким чином, ви завжди будете обчислювати дескриптор на патчі зображення з однаковою домінуючою орієнтацією (обертається патч), і таким чином ви досягнете обертальної інваріантності.


4

Ще один спосіб отримати обертальну інваріантність безкоштовно - це вибирати обертально інваріантні об'єкти. Наприклад, коло або кільце інваріантні обертанням.

Функція витяжки : Виконання виявлення краю. Для кожного сусідства NxNпікселів обчисліть напрямок ребра та величину 2D гістограми. Знайдіть усі точки, які мають високу загальну величину та високий кутовий розкид . Видаліть усі точки, що не мають радіальної симетрії.

Дескриптор ознак: Знайдіть центр кожного кругового об’єкта. Оскільки об’єкт круговий, він не має домінуючого кута градієнта. Всі кути рівні. Таким чином, радіальний профіль (сума піксельної величини в полярних координатах) є дескриптором інваріантного кута.


До речі, це одна з причин того, що довідники виготовляються як кола на електричних платах:

введіть тут опис зображення


ми говоримо про дескриптори ключових точок (функцій) . Якщо ми говорили про особливості (точки інтересу) , то виявлення кругових патчів може бути корисним - вони ротаційно інваріантні в поєднанні з кожним дескриптором. Але дескриптор, розрахований на круговий патч, не є - біле коло з горизонтальним діаметром чорного кольору, а з вертикальним дало б дуже різні дескриптори, якщо не застосовується обертально інваріантний метод
пенелопа

@penelope, чому б і ні? Розглянемо наступний дескриптор - мініатюру патча, і ви порівнюєте його з іншими дескрипторами з нормалізованою перехресною кореляцією. Ви не можете помилитися з іншими об'єктами таким чином.
Андрій Рубштейн

Вибачте, я не розумію, що ви маєте на увазі під "мініатюрою пластиру", можете пояснити? І дескриптор: нормалізована корсовая кореляція виправлення - це те, що робить його ротаційно інваріантним, а не факт, що ваш патч був кільцем чи колом.
пенелопа

@penelope, я думаю, зараз, коли я був недостатньо зрозумілий. Я спробую розширити його завтра. Дякую за ваші коментарі.
Андрій Рубштейн

З нетерпінням чекаю цього :)
пенелопа

1

Я б скоріше заглянув у KAZE / AKAZE, які однаково добре працюють із значним прискоренням. Випадки деформації також допускаються. OpenCV нещодавно отримала реалізацію через GSoC 2014. Ви можете знайти її тут .


1

Якщо ви перезаписуєте локальний патч навколо точки функції для координатно-полярних координат (з початком у точці, що цікавить), зміни масштабу відповідають перекладу вздовж осі журнал-радіал, тоді як обертання відповідають перекладам (з обертанням) по кутовій осі. Якщо потім обчислити двовимірне перетворення Фур'є, переклади в радіальному та кутовому напрямках стають зрушеннями фази в частотній області. Якщо потім обчислити абсолютне значення перетворення Фур'є, фаза повністю зникає, а зміни масштабу та обертання вихідного пластиру зображення стають непомітними. Отже, абсолютне значення 2D перетворення Фур'є зображення в лого-полярних координатах буде вашим дескриптором функції.

Ну, принаймні теоретично. На практиці вам потрібно обмежити радіальне розширення вашого пластиру. Це означає, що вам потрібно обрізати значну частину своїх даних, перш ніж обчислити перетворення Фур'є (що насправді є рядом Фур'є), тому переклад уздовж логічно-променевого напрямку в координатно-полярних координатах не відповідає точно просто зсув фази в частотній області більше, тому метод не є ідеально масштабним. Я підозрюю, що якщо ви використовуєте якусь функцію вікна - без розривів - на координаті радіус лог-радіус і помножуєте її на інтенсивність кольорів, цю проблему дещо пом’якшите.

Однак дескриптор функції він все одно повинен бути ідеально обертовим.

Довідка: Інваріація масштабу без вибору масштабу


0

Ви також можете перевірити ШВИДКО та КРІШКО .


Наскільки я шукав, FAST - це лише детектор, який використовується у багатьох різних комбінаціях дескрипторів. І, FAST і BRISK вже згадуються у питанні, яке пов’язувала сама ОП, тож я припускаю, що у нього вже є інформація про існування цих методів.
пенелопа
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.