Математика виявлення кутових точок Харріса


23

Це математичний вираз для виявлення кута Гарріса:

Це математичний вираз для виявлення кута Гарріса ...

Але у мене є такі сумніви:

  1. Яке фізичне значення та v ? Багато посилання говорять , що це величина , з допомогою якого вікно ш зрушені. Так на скільки зміщене вікно? Один піксель чи два пікселі?uvw
  2. Чи підсумовується підсумок по позиціях пікселів, що перебуває у вікні?
  3. Припустимо, просто , I ( x , y ) - інтенсивність одиничного пікселя при ( x , y ) або підсумовування інтенсивності всередині вікна з центром у ( x , y ) ?w(x,y)=1I(x,y)(x,y)(x,y)
  4. Згідно з wiki, вони кажуть, що зображення є 2D, позначається I, а потім просить розглянути патч зображення над областю , потім використовує позначення I ( x , y )(x,y)I(x,y)

Мені здається незрозумілим зрозуміти математичне пояснення. Хтось має ідею?


2
Ознайомтеся з цією лекцією про кутовий детектор Харріса. Це дуже ясно: youtube.com/watch?v=P35WsRDnTsU&t=41m12s

Я написав пост у своєму особистому блозі, який ґрунтується на лекції вище. matlabcorner.wordpress.com/2012/11/17/…
Андрій Рубштейн

Відповіді:


31

Сенс цієї формули дійсно досить простий. Уявіть, що ви берете дві однакові за розміром невеликі області зображення, синю та червону:

введіть тут опис зображення

Функція вікна дорівнює 0 поза червоним прямокутником (для простоти можна вважати, що вікно просто постійне всередині червоного прямокутника). Таким чином, функція вікна вибирає, які пікселі ви хочете подивитися, і присвоює відносні ваги кожному пікселю. (Найчастіше це вікно Гаусса, оскільки воно обертально симетричне, ефективне для обчислення та підкреслення пікселів поблизу центру вікна.) Синій прямокутник зміщується на (u, v).

Далі ви обчислюєте суму різниці у квадраті між частинами зображення, позначеними червоним та синім кольором, тобто ви віднімаєте їх піксель за пікселем, розподіляєте різницю та підсумовуєте результат (припускаючи, що для простоти вікно = 1 в області, яку ми шукаємо у). Це дає вам одне число для кожного можливого (u, v) -> E (u, v).

Давайте подивимося, що станеться, якщо обчислимо це для різних значень u / v:

Спочатку збережіть v = 0:

введіть тут опис зображення

Це не повинно дивуватись: різниця між частинами зображення є найменшою, коли зміщення (u, v) між ними дорівнює 0. Зі збільшенням відстані між двома патчами також збільшується сума квадратичних різниць.

Зберігаючи u = 0:

введіть тут опис зображення

Діаграма виглядає аналогічно, але сума квадратних відмінностей між двома частинами зображення набагато менша, коли ви зміщуєте синій прямокутник у напрямку до краю.

Повний сюжет E (u, v) виглядає так:

введіть тут опис зображення

Сюжет трохи схожий на "каньйон": Є лише невелика різниця, якщо ви змістите зображення в бік каньйону. Це тому, що цей патч зображення має домінуючу (вертикальну) орієнтацію.

Ми можемо зробити те ж саме для іншого виправлення зображення:

введіть тут опис зображення

Тут графік E (u, v) виглядає інакше:

введіть тут опис зображення

Незалежно від того, яким способом ви зміните патч, він завжди виглядає інакше.

Тож форма функції E (u, v) щось говорить про патч зображення

  • якщо E (u, v) скрізь біля 0, у патчі зображень немає текстури, яку ви дивитесь
  • якщо E (u, v) має форму "каньйон", патч має домінуючу орієнтацію (це може бути край або текстура)
  • якщо E (u, v) має "конусоподібну форму", пластир має текстуру, але не має домінуючої орієнтації. Саме такий патч шукає кутовий детектор.

Багато посилань кажуть, що це величина, на яку вікно 'змістилося' ... так на скільки зміщене вікно? Один піксель ... два пікселі?

Зазвичай ви взагалі не обчислюєте E (u, v). Вас цікавить лише його форма в околиці (u, v) = (0,0). Отже, ви просто хочете розширення Тейлора E (u, v) поблизу (0,0), що повністю описує його "форму".

Чи підсумовується підсумок по позиціях пікселів, що перебуває у вікні?

Математично кажучи, більш елегантно дозволити підсумовувати діапазон у всіх пікселях. Практично кажучи, немає сенсу підсумовувати пікселі, де вікно 0.


ніж тонна Nikie ....
rotating_image

2
Я знав, що ви отримаєте чудову відповідь тут, @rotating_image
karlphillip

ніж karlphillip ..
rotating_image

1
Мільйон грошей!
Phonon
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.