Розуміння теорії масштабу простору


10

У теорії просторового масштабу представлення масштабу-простору сигналу , (у випадку зображення ) задається як: де - гауссове ядро ​​з параметром а - згортка. Змінюючи параметр ми отримуємо більш-менш згладжене зображення. Оскільки в результаті більш грубе подання (параметр ) не буде містити дрібних об'єктів або шуму.д = 2 L ( х , у , т ) = г ( х , у , т ) * е ( х , у ) г ( х , у ; t ) t t tf(х),х=(х1,...,хг)г=2L(х,у;т)=г(х,у;т)f(х,у)г(х,у;т)ттт

Основний момент - знайти спосіб виявлення масштабних інваріантних функцій, правда? Так що для деякого зображення в розмірі його зменшення в розмірі копіювання такі функції, як ключові точки, будуть виявлені правильно, навіть якщо розмір відрізняється, не знаходячи інших ключових точок шуму.

  1. У роботі вони використовують нормовані похідні. . Який сенс використання похідної нормованої, як це допомагає в масштабній інваріантності?γδξ,γ-ноrм=тγ/2δхγ

  2. З цього зображення ми можемо бачити, що майже на одних і тих же позиціях знайдені різні ключові точки (різні за розміром). Як це можливо?

Виявлені функції

Якщо ви можете пояснити покроковий алгоритм виявлення інваріантних масштабів функцій, це було б чудово. Що насправді робиться? Похідні можна взяти за або . Blob можна виявити, взявши похідну за змінними . Як тут допомагає похідна від ?х,утL(х,у)т

Документ, який я читав, є: Виявлення функцій з автоматичним вибором масштабу

Відповіді:


3
  1. γтт

  2. Ви можете знайти ключові точки в декількох масштабах в одному місці. Це тому, що ви шукаєте локальні максимуми над масштабами. Ось інтуїція: придумайте образ обличчя. У тонкому масштабі ви отримуєте крапку, відповідну носу. За шкалою курсу ви отримуєте кашку, що відповідає всьому обличчю. Дві краплі зосереджені в одній точці, але мають різні масштаби.

  3. Ось весь алгоритм:

    • Визначте, які функції зображення вас цікавлять (наприклад, краплі, кути, краї)
    • Визначте відповідну "функцію детектора" щодо похідних, наприклад, лаплаціан для крапель.
    • Обчисліть похідні, необхідні для вашої функції детектора, в різних масштабах.
    • тмγ/2м
    • Обчисліть функцію детектора на весь простір масштабу.
    • х,у,т
    • Це ваші інтереси, або ключові точки.

Редагувати:

  1. тγ/2
  2. тхутху
  3. Ви хочете знайти локальні максимуми над масштабами, тому що у вас можуть бути особливості зображення різного розміру в одному місці. Придумайте зображення концентричних кіл, як бичків. Це дасть вам високу відповідь лаплакійця в декількох масштабах. Або придумайте зображення справжнього людського ока, відфільтрованого лаплаціанцем у різних масштабах. Ви отримаєте високу реакцію в тонкій шкалі для зіниці, високу реакцію, середню шкалу райдужної оболонки і високу реакцію при грубій шкалі для всього ока.

Вся справа в тому, що ви не знаєте, в якому масштабі можуть бути випереджені функції, що цікавлять вас. Так ви дивитесь на всі масштаби.


тγ/2тттх,у

х,у,тт

@maximus Перегляньте редагування відповіді.
Діма

@maximus, я помилявся раніше. гамма - не рівень масштабу. Я зафіксував відповідь.
Діма
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.