Що позначає частотна область у випадку зображень?


110

Я просто дізнався про частотну область в зображеннях.

Я можу зрозуміти частотний спектр у випадку хвиль. Він позначає, які частоти присутні у хвилі. Якщо ми намалюємо спектр частоти , то отримаємо імпульсний сигнал при та . І ми можемо використовувати відповідні фільтри для отримання конкретної інформації.- f + fcos(2πft)f+f

Але що означає частотний спектр у випадку зображень? Коли ми знімаємо FFT зображення у OpenCV, ми отримуємо дивну картину. Що позначає це зображення? А яке його застосування?

Я читав деякі книги, але вони дають багато математичних рівнянь, а не фізичних наслідків. Тож чи може хтось надати просте пояснення частотної області в зображеннях з простим застосуванням її в обробці зображень?


5
Найкращий спосіб зрозуміти, що таке трансформація - це пограти з подачею простих входів до зворотного перетворення.
ендоліт

1
Дивіться також це цікаве пояснення від Стіва Еддінса blogs.mathworks.com/steve/2009/12/04/…
Алессандро Якопсон

@endolith Так! заздалегідь потрібні певні знання про домен, щоб повністю зрозуміти, що відбувається і чому це відбувається ..
SIslam

дорога частотна область зображення представляють інтенсивність потужності у ватах щодо певної частоти в гертисі, наприклад (dc-компонент, низька та висока частота)
mntaser

Відповіді:


93

Але що означає частотний спектр у випадку зображень?

"Математичні рівняння" важливі, тому не пропускайте їх цілком. Але 2d FFT теж має інтуїтивну інтерпретацію. Для ілюстрації я обчислив обернену FFT з кількох зразкових зображень:

введіть тут опис зображення

Як бачите, у частотній області встановлений лише один піксель. Результатом в області зображення (я відображав лише реальну частину) є "обертовий косинус" (уявна частина буде відповідним синусом).

Якщо я встановив інший піксель у частотній області (зліва):

введіть тут опис зображення

Я отримую іншу частоту 2d частоти.

Якщо я встановив більше ніж один піксель у частотній області:

введіть тут опис зображення

ви отримуєте суму двох косинусів.

Так як 1d хвиля, яка може бути представлена ​​як сума синусів і косинусів, будь-яке 2d зображення може бути представлене (вільно кажучи) у вигляді суми "обернутих синусів і косинусів", як показано вище.

коли ми знімаємо Fft зображення у opencv, ми отримуємо дивну картину. Що позначає це зображення?

Він позначає амплітуди і частоти синусів / косинусів, які при складанні дадуть вам оригінальне зображення.

А яке його застосування?

Насправді їх занадто багато, щоб їх усіх назвати. Кореляцію та згортання можна обчислити дуже ефективно за допомогою FFT, але це більше оптимізація, ви не «дивитесь» на результат FFT для цього. Він використовується для стиснення зображення, тому що високочастотні компоненти, як правило, є лише шумом.


3
Ви можете вказати, що є високочастотною частиною, а яка низькочастотною частиною у зображенні частотної області?
Абід Рахман К

4
@arkiaz: На показаних нами зображеннях найвища частота знаходиться в центрі зображення, найнижча частота (тобто середнє вхідне зображення) - верхній лівий піксель у результаті FFT. Саме це дає вам більшість реалізацій FFT. Якщо відображається результат FFT, звичайно переміщувати найнижчу частоту до центру відображуваного зображення.
Нікі Естнер

1
@Mohammad: Я використав InverseFourierфункцію Mathematica . Чи не робить октава / матлаб ifft2те саме?
Нікі Естнер

1
@JimClay Для кольорових зображень я б фактично рекомендував використовувати домен YUV . Y = абсолютна інтенсивність і УФ = колір. Навіть для кольорових зображень більшість інформації, яка вас цікавить, знаходиться в частині інтенсивності зображення. Ви використовуєте все ті ж математичні інструменти, просто не забудьте перетворити назад.
Atav32

4
Це було б чудово, як анімація, як перенести точку навколо і показати, як хвилі змінюють ширину та кут
ендоліт

29

Я думаю, що це було добре викладено у добре відомому "посібнику DSP" ( глава 24, розділ 5 ):

Аналіз Фур'є використовується при обробці зображень приблизно так само, як і при одновимірних сигналах. Однак зображення не мають кодованої інформації в частотній області, що робить методи набагато менш корисними. Наприклад, коли перетворення Фур'є приймається звуковим сигналом, заплутана форма хвилі часу перетворюється в легко зрозумілий спектр частот.

Для порівняння, прийняття перетворення Фур'є зображення перетворює пряму інформацію в просторовій області в скремблірованную форму в частотній області. Коротше кажучи, не чекайте, що перетворення Фур'є допоможе вам зрозуміти інформацію, закодовану у зображеннях.

Звичайно, існує якась структура та значення, що стоїть, здавалося б, випадковою схемою, отриманою за допомогою прийняття DFT типового зображення (наприклад, наведений нижче приклад), але це не в такій формі, як людський мозок готовий зрозуміти інтуїтивно, принаймні щодо зорового сприйняття.

Імгур

Ось ще одна цікава і досить читабельна експозиція того, що міститься у перетворенні Фур’є зображення і як його можна інтерпретувати. Він має серію зображень, які дозволяють зрозуміти, яка відповідність між перетвореним Фур'є та оригінальним зображенням.

редагування: також подивіться на цю сторінку , яка демонструє —на кінець —, як більшість сприйнято важливої ​​інформації зображення зберігається у фазовому (кутовому) компоненті подання частоти.

редагувати 2: ще один приклад значення фази та величини у представленні Фур'є: "Розділ 3.4.1. Значення фази та величини" підручника TU Delft " Основи обробки зображень " це наочно демонструє:

Імгур


Гей! Я спробував перейти за другим посиланням у вашому запитанні ( "інша цікава і досить читабельна виставка ..." ), але посилання не працює. Я також спробував посилання, подане в коментарях, але не працює. Чи можете ви знайти та редагувати робоче посилання, будь ласка?
пенелопа

@penelope Ви друга людина, яка помітила проблеми із посиланням (див. мій попередній коментар). Насправді сторінка здається нестабільною. Як я вже говорив раніше, я заміню посилання версією Web Archive. Дякуємо, що вказали на це!
waldyrious

1
Насправді приклади та пояснення на (нарешті працює) посилання чудові :)
Пенелопа

12

Хвиля - одновимірна хвиля; це залежить лише від . Хвиля - двовимірна хвиля. Це залежить від і . Як бачите, у вас є дві частоти в будь-якому напрямку.t f ( x , y ) = c o s ( ω x + ψ y ) x yf(t)=cos(ωt)tf(x,y)=cos(ωx+ψy)xy

Тому перетворення Фур'є (FFT) дасть вам , як і FFT дає вам . І якщо ваш вхід - це функція, що підсумовує 2D косинуси, то ваш 2D FFT буде сумою частот цих косинусів - знову ж таки прямим аналогом 1D FFT.ω , ψ c o s ( ω x ) ωcos(ωx+ψy)ω,ψcos(ωx)ω


10

Можливо, варто відзначити, що аналіз Фур’є - це окремий випадок поняття, яке називається ортогональними функціями . Основна ідея полягає в тому, що ви розбиваєте складний сигнал на лінійну суперпозицію простіших "базових" функцій. Ви можете виконати обробку або аналіз на основі базисних функцій, а потім підбити підсумки за базовими функціями, щоб отримати результат для вихідного сигналу.

Для того, щоб це працювало, існують певні математичні вимоги до базових функцій, тобто вони в ідеалі утворюють ортонормальну базу. У випадку перетворення Фур'є базовими функціями є складні експоненти. Однак є багато інших функцій, які також можуть бути використані для цього.


Це правда. Які ще існують базові функції? Я думаю, що вейвлети даубеши, але чи є й інші? Що б їх диференціювало?
Космічний

Напевно, найвідомішими є многочлени; представлення функції як набору многочленів відоме як її серія Тейлора . Ця серія легко обчислюється з похідних функцій.
MSalters

2
Одним із способів пошуку базових функцій є застосування аналізу основних компонентів . Отримані в результаті "власні зображення" часто мають більш інтуїтивний вигляд, ніж функції sin / cos. Для прикладу див. Eigenfaces . Частотна область все ще є актуальною для сприйняття (наші очі / мозок мають крайові детектори, чутливі до частоти, особливо коли відбувається рух); основні функції просто не дуже значущі як зображення.
Ден Брайант

PCA - це приємна основа обчислювальної техніки, яка широко зрозуміла, але є багато інших, які роблять різні припущення щодо того, як формувалися дані; Незалежний аналіз компонентів (ICA) - один із популярних прикладів. Трохи далі, існують алгоритми навчання загальної функції функціонування за допомогою рідкого кодування (наприклад, Дж. Майрал та ін., "Інтернет-навчання словника для розрідженого кодування", ICML 2009), а потім підходи "особливого навчання", розроблені глибокими мережами люди.
lmjohns3

1
Чому функції повинні бути ортогональними?
Quantum231

8

На зображеннях зростаюча частота пов'язана з більш різкими переходами яскравості або кольору. Крім того, шум зазвичай вбудовується у високий кінець спектру, тому низькочастотна фільтрація може використовуватися для зменшення шуму.


1
значить, ви маєте на увазі, що різкі переходи часом розцінюються як шум?
Абід Рахман К

1
Так, інколи. Поширені приклади включають шум комарів (дзвін навколо країв), шум JPEG-блоку на краях макроблоків і, звичайно, зерно. Розглянемо зображення простого градієнта. Додавання зерна до цього зображення збільшує його високочастотний вміст, вводячи хвилинні переходи на всьому зображенні.
Емре

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.