Отже, я читав статтю про SURF (Bay, Ess, Tuytelaars, Van Gool: Speeded-Up Robust Features (SURF) ) і не можу зрозуміти цей параграф нижче:
Завдяки використанню коробних фільтрів та інтегральних зображень нам не доведеться ітеративно застосовувати один і той же фільтр до виходу попередньо відфільтрованого шару, але натомість можна застосовувати фільтри коробки будь-якого розміру з точно однаковою швидкістю безпосередньо на вихідне зображення та навіть паралельно (хоча остання тут не експлуатується). Тому простір масштабу аналізується шляхом збільшення масштабу фільтру, а не ітераційного зменшення розміру зображення, фіг.4.
This is figure 4 in question.
PS: У статті є пояснення цілісного зображення, проте весь зміст статті базується на конкретному вище пункті. Якщо хтось прочитав цей документ, чи можете ви коротко згадати, що тут відбувається. Математичне пояснення є досить складним, щоб добре зрозуміти спочатку, тому мені потрібна допомога. Дякую.
Редагувати, кілька питань:
1.
Кожна октава підрозділяється на постійну кількість рівнів масштабу. Через дискретний характер інтегральних зображень мінімальна різниця масштабу між двома наступними шкалами залежить від довжини lo позитивних чи негативних часток похідної часткового другого порядку у напрямку деривації (x або y), яка встановлюється на a третина довжини розміру фільтра. Для фільтра 9x9 ця довжина lo дорівнює 3. Для двох послідовних рівнів ми повинні збільшити цей розмір як мінімум на 2 пікселі (по одному пікселю на кожній стороні), щоб розмір був нерівномірним і таким чином забезпечив наявність центрального пікселя . Це призводить до загального збільшення розміру маски на 6 пікселів (див. Рисунок 5).
Figure 5
Я не міг зрозуміти рядки у заданому контексті.
Для двох послідовних рівнів ми повинні збільшити цей розмір як мінімум на 2 пікселі (по одному пікселю на кожній стороні), щоб розмір був нерівномірним і таким чином забезпечив наявність центрального пікселя.
Я знаю, що вони намагаються зробити щось із довжиною зображення, якщо його навіть вони намагаються зробити його дивним, щоб був центральний піксель, який дозволить їм обчислити максимум або мінімум градієнта пікселя. Я трохи не знаю щодо його контекстуального значення.
2.
Для обчислення дескриптора використовується вейвлет Хаар.
Як середній регіон має низький але високий.
3.
У чому полягає необхідність мати приблизний фільтр?
4. У мене немає проблем з тим, як вони дізналися розмір фільтра. Вони "робили" щось емпірично. Однак у мене є певна проблема з цією частиною рядка
Вихід фільтра 9x9, введений у попередньому розділі, розглядається як початковий шар масштабу, до якого ми будемо називати масштаб s = 1,2 (наближення похідних Гаусса до σ = 1,2).
Як вони дізналися про значення σ. Крім того, як робиться розрахунок масштабування, показаний на зображенні нижче. Причиною, яку я заявляю про це зображення, є те, що значення s=1.2
продовжує повторюватися, не чітко вказуючи на його походження.
5.
Матриця Гессі, представлена з точки зору, L
є згортанням градієнта другого порядку Гауссового фільтра та зображення.
Однак, як кажуть, "апроксимований" визначник містить лише терміни, що містять фільтр Гаусса другого порядку
Значення w
:
Моє запитання, чому визначальний коефіцієнт обчислюється так, як вище, і який зв'язок між приблизною матрицею Гессіана та Гессея.