Яка різниця між різницею Гаусса, Лапласа Гаусса та мексиканського капелюха Вейлета?


10

У резюме використовуються три методи, які здаються дуже схожими один на одного, але з тонкими відмінностями:

  • Лаплаціан Гаусса: 2[г(х,у,т)f(х,у)]
  • Різниця гауссів: [г1(х,у,т)f(х,у)]-[г2(х,у,т)f(х,у)]
  • Зведення з вейвлетом Рікера : Рікер(х,у,т)f(х,у)

Наскільки я це зараз розумію: DoG - це наближення LoG. Обидва використовуються при виявленні крапок, і обидва по суті виконують функції смугових фільтрів. Здається, що мексиканська вейкет Hat / Ricker, як видається, досягає такого ж ефекту.

Я застосував усі три методи до імпульсного сигналу (з необхідним масштабуванням, щоб отримати величини схожими), і результати досить близькі. Насправді LoG та Ricker виглядають майже однаково. Єдина реальна різниця, яку я помітив, - це у DoG, у мене було 2 вільних параметра, щоб настроїти ( і σ 1 ) проти 1 для LoG та Ricker. Я також виявив, що вейвлет був найпростішим / найшвидшим, оскільки це можна було зробити за допомогою однієї згортки (зробленої шляхом множення в просторі Фур’є з FT ядра) vs 2 для DoG, а згортання плюс лаплаціан для LoG. σ1σ1

Результати обертання вейвлет Рікера, Лаплаціа Гаусса та Різниця Гаусса

  • Які порівняльні переваги / недоліки кожної техніки?
  • Чи існують різні випадки використання, коли одне перекреслює іншого?

Я також маю інтуїтивну думку, що на дискретних зразках LoG та Ricker вироджуються до однієї операції, оскільки може бути реалізований як ядро [ - 1 , 2 , - 1 ]2 .

[-1,2,-1]або[0-10-14-10-10]для 2D зображень

Застосування цієї операції до гаусса породжує вейкет Ricker / Hat. Крім того, оскільки LoG і DoG пов'язані з рівнянням дифузії тепла, я вважаю, що я можу змусити обидва збігатися з достатньою кількістю параметрів.

(Я все ще мочу ногами від цього матеріалу, щоб вільно виправити / уточнити щось із цього!)

Відповіді:


6

Лаплас Гаусса

Зображення Лапласа Гаусса (LoG) можна записати якf

2(fг)=f2г

з ядра Гаусса і згортка. Тобто, Лаплас зображення, згладжений ядром Гаусса, ідентичний зображенню, складеному з ядром Лапласа Гауссова. Цю згортку можна додатково розширити, у випадку 2D, якг

f2г=f(2х2г+2у2г)=f2х2г+f2у2г

Таким чином, можна обчислити його як додавання двох згортків вхідного зображення з другими похідними ядра Гаусса (у 3D це 3 згортки тощо). Це цікаво тим, що ядро ​​Гаусса є роздільним, як і його похідні. Це є,

f(х,у)г(х,у)=f(х,у)(г(х)г(у))=(f(х,у)г(х))г(у)

Це означає, що замість 2D згортки ми можемо обчислити те саме, використовуючи два 1D згортки. Це економить багато обчислень. Для найменшого тонкого гауссового ядра у вас буде 5 зразків у кожному вимірі. Для двовимірної згортки потрібно 25 множень та доповнень, двох 1D згортків потрібно 10. Чим більше ядро, чи більше розмірів у зображенні, тим значнішими є ці обчислювальні заощадження.

Таким чином, LoG можна обчислити, використовуючи чотири 1D згортки. Однак саме ядро ​​LoG не можна розділити.

2

Оператор вейкетів або мексиканських капелюхів Ricker ідентичний LoG, аж до масштабування та нормалізації .

Різниця гауссів

f

fг(1)-fг(2)=f(г(1)-г(2))

Так, як і у LoG, DoG можна розглядати як єдину нероздільну 2D згортку або суму (різницю в цьому випадку) двох відокремлених згортків. Бачачи це таким чином, схоже, що немає жодних обчислювальних переваг використання DoG над LoG. Однак DoG - це регульований смуговий фільтр, LoG не може бути налаштований таким же чином, і його слід сприймати як похідний оператор. DoG також природним чином з'являється в масштабі простору, де зображення фільтрується в багатьох масштабах (гауссі з різними сигмами), різниця між наступними масштабами - це DoG.

Існує наближення до ядра DoG, яке можна розділити, зменшуючи обчислювальні витрати вдвічі, хоча це наближення не є ізотропним, що призводить до обертової залежності фільтра.

Я колись показав (для себе) еквівалентність LoG і DoG, для DoG, де різниця в сигмах між двома ядрами Гаусса нескінченно мала (аж до масштабування). У мене немає записів про це, але це було не важко показати.

Інші форми обчислення цих фільтрів

Відповідь Лорана згадує рекурсивну фільтрацію, а ОП згадує обчислення в області Фур'є. Ці поняття стосуються як LoG, так і DoG.

Гаусові і його похідні можуть бути обчислені з використанням рекурсивного фільтра причино-анти-причинного. Отже всі згадані вище згортки 1D можна застосовувати в постійному часі сигми. Зауважте, що це ефективно лише для великих сигм.

Аналогічно, будь-яка згортання може бути обчислена в області Фур'є, тому ядра DoG і LoG 2D можуть бути перетворені в домен Фур'є (а точніше - обчислені там) і застосовані шляхом множення.

На закінчення

Немає суттєвих відмінностей у складності обчислень цих двох підходів. Я ще не знаходжу вагомих причин, щоб наблизити логотип за допомогою DoG.


Це фантастична відповідь! Я збираюся оновити це як нову відповідь, а не те , що відповідь Лорана невірна чи неповна, але вам знадобився час, щоб додати чудовий другий погляд на відповідь на рік.
DeusXMachina

2
DoG і LoG зустрічаються за шкалою «кора»
Лоран Дюваль

4

Вейвлет Рікера, (ізотропний) вейвлет Марра, мексиканська шапка або лаплакійський гауссів належать до тієї ж концепції: безперервні допустимі вейвлети (що відповідають певним умовам). Традиційно вейвлет Ricker - це 1D версія. Вейвлет Марра або мексиканський капелюх - це імена, наведені в контексті 2D-розкладу зображень, ви можете розглянути, наприклад, Розділ 2.2 Панорами на багатомасштабні геометричні зображення, переплітаючи просторову, спрямовану та частотну селективність , Обробка сигналів, 2011, Л. Жак та ін ін. Лаплаціан Гаусса - багатовимірне узагальнення.

Однак на практиці люди приймають різні типи дискретизацій, на різних рівнях.

3×33×3

(0-10-14-10-10)

(-1-1-1-18-1-1-1-1)
5×5

σ1σ2

Але використовуються інші співвідношення, наприклад, у деяких лаплакійських пірамідах, які перетворюють DoG в більш загальні смугові фільтри або крайові детектори.

Остання посилання: Збіг зображень за допомогою узагальнених точок масштабу-простору , Т. Ліндеберг, 2015.


1
Дуже просвічую, дякую! Так виглядає, як у Fast Gaussian Smoothing, що DoG має обчислювальні переваги в тому, що це можна зробити безпосередньо в просторовій області, тому я передбачаю, наприклад, обробку сигналів на мікросхемі для CCD / інтегрованого комп'ютерного зору. Також панорама виглядає загалом як фантастичне читання, дякую!
DeusXMachina

Швидкими наближеннями ви дійсно можете здійснити ряд операцій, незалежних від масштабу
Laurent Duval

1
Звідки походить співвідношення 1.6? Якщо виписуєте математику, ви можете бачити, що існує точна еквівалентність між другою похідною Гаусса і різницею Гаусса з нескінченно малою різницею сигми (аж до масштабування).
Кріс Луенго

1
З Marr and Hildreth, 1980, додаток B, вони називають це "найкращим інженерним наближенням", з компромісом між пропускною здатністю та чутливістю, заснованим на кривих заслуг, змінюючи співвідношення ширини. У минулому я познайомився з деякими творами людьми в Делфті з однойменною назвою. Збіг?
Лоран Дюваль

1
@LaurentDuval: Я зробив докторську ступінь в Делфті. Там немає інших людей з моїм іменем, AFAIK. Я бачу, як ви могли отримати (суб'єктивний) оптимум на основі чутливості та пропускної здатності. Якщо коефіцієнт занадто малий, відгук занадто низький, ймовірно, більше залежить від шуму дискретизації, ніж будь-що інше; якщо коефіцієнт занадто високий, це не цікавий фільтр. Має сенс. Дякую!
Кріс Луенго
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.