Який фізичний зміст згортки двох сигналів?


49

Якщо ми поєднуємо 2 сигнали, ми отримуємо третій сигнал. Що представляє цей третій сигнал стосовно вхідних сигналів?



1
Це просто "зворотне, зміщення, множення та сума", не більше.
чаохуанг

Він має значення "усереднення", в термінах обробки сигналів, що може означати видалення високочастотних компонентів.
Giwrgos Rizeakos

3
Я деякий час шукав ресурс, який пояснює фізичний зміст згортки, і я, нарешті, знайшов його тут: colah.github.io/posts/2014-07-U
Understanding-

Розглянемо будь-яку фізичну або механічну систему, тоді вхід до системи дорівнює x (n), параметри, які ми визначаємо алеади, є h (n). робоча функція для роботи системи - y (N) = x (N) * h (N), наприклад: розглянути синусоїду як вхід до мультиплікатора, як правило, множник працює з такою кількістю аналогових схем правильно, ми можемо змінити працездатність пристрою, просто змінивши Параметри, то параметри, які ми передаємо, - h (n)
user6151179

Відповіді:


40

Немає особливого «фізичного» значення для операції згортання. Основне використання згортки в техніці полягає в описі виходу лінійної системи, інваріантної за часом (LTI) . Поведінка вводу-виводу системи LTI може бути охарактеризовано через імпульсну характеристику , а вихід системи LTI для будь-якого вхідного сигналу може бути виражений як згортання вхідного сигналу з імпульсною характеристикою системи.x(t)

А саме, якщо сигнал застосовується до системи LTI з імпульсною характеристикою h ( t ) , то вихідним сигналом є:x(t)h(t)

y(t)=x(t)h(t)=x(τ)h(tτ)dτ

Як я вже говорив, фізичної інтерпретації не так багато, але ви можете подумати про згортання якісно як про «розмазування» енергії, присутньої в в часі, залежно від форми імпульсної реакції h ( t ) . На інженерному рівні (суворі математики не схвалюють), ви можете отримати деяке розуміння, уважніше вивчивши структуру самого інтеграду. Ви можете вважати вихід y ( t ) як суму нескінченної кількості копій імпульсної відповіді, кожна зміщена на дещо іншу затримку часу ( τ ) і масштабується відповідно до значення вхідного сигналу на значення tx(t)h(t)y(t)τtщо відповідає затримці: .x(τ)

Таке трактування подібне до перетворення дискретного часу (обговорюється у відповіді Атула Інгле) до межі нескінченно короткого періоду вибірки, який знову не є повністю математичним, але створює пристойно інтуїтивний спосіб візуалізації дії для системи безперервного часу.


2
Інтеграл повинен бути х(τ)год(т-τ).
Атул Інгле

1
Але це не просто зміщення сигналу, а потім взяття вихідної суми, один із сигналів спочатку відміняється на відміну від кореляції. А якщо один із сигналів є імпульсною відповіддю, то це нормально, але що робити, якщо два сигнали відрізняються, як згортання 2 образи.
pj

@ParagJain: Насправді це просто взяття суми багатьох (насправді нескінченного числа) масштабованих копій імпульсної відповіді. Термін відгуку імпульсу не змінюється відносно змінної часу t . Для перехресної кореляції, як ви зазначали, знак на τ всередині аргументу імпульсної відповіді змінюється на + . Не має значення, чи дійсно h ( t ) є реакцією системи LTI чи ні; це може бути зображення, як ви запропонували, або будь-який сигнал з цього приводу. Дія, що розмазується, створена згорткою, така ж, як описано у відповідях тут. год(т-τ)тτ+год(т)
Джейсон Р.

20

Особливо корисне інтуїтивне пояснення, яке добре працює для дискретних сигналів, - це думати про згортку як «зважену суму відлуння» або «зважену суму пам’яті».

На мить припустимо, що вхідний сигнал до дискретної системи LTI з функцією передачі є дельта-імпульсом δ ( n - k ) . Свиток y ( n )h(n)δ(nk) Це лише відлуння (або пам'ять) функції передачі із затримкою k одиниць.

y(n)=м=-δ(м-к)год(н-м)=год(н-к).

Тепер подумайте про довільний вхідний сигнал як суму зважених функцій δ . Тоді вихід - зважена сума затримок версій h (n).х(н)δ

Наприклад, якщо , тоді запишіть x ( n ) = δ ( n ) + 2 δ ( n - 1 ) + 3 δ ( n - 2 ) .х(н)={1,2,3}х(н)=δ(н)+2δ(н-1)+3δ(н-2)

Вихід системи - це сума відлуння , h ( n - 1 ) і h ( n - 2 ) з відповідними вагами 1, 2 і 3 відповідно.год(н)год(н-1)год(н-2)

Отже, .у(н)=год(н)+2год(н-1)+3год(н-2)


1
Буде дуже корисно додати графічне зображення кожного з ваших рівнянь. Деякі люди (такі як я) краще розуміють згортання, коли візуально дивляться на це.
PhilMacKay

1
@PhilMacKay Для графічного зображення (власне табличного подання) дискретної згортки дивіться цю відповідь .
Діліп Сарват

1
"відлуння" справді слід замінити на "спогади". Пам'ять минулих речей: Пруст.
rrogers

Графічне зображення, яке показує згортання двох сигналів коробки, див. Blog.mbedded.ninja/programming/signal-processing/convolution
gbmhunter

11

Хороший інтуїтивний спосіб розуміння згортки - це дивитись на результат згортки з точковим джерелом.

Наприклад, 2D згортка точки з хибною оптикою космічного телескопа Хаббла створює таке зображення:

введіть тут опис зображення

А тепер уявіть, що станеться, якщо на малюнку є дві (або більше) зірок: ви отримуєте цей візерунок двічі (або більше), орієнтований на кожну зірку. Світловість візерунка пов'язана зі світністю зірки. (Зверніть увагу, що зірка практично завжди є точковим джерелом.)

Ці схеми в основному є множенням точкового джерела на згорнуту картину, при цьому результат зберігається в пікселі таким чином, що він відтворює візерунок, коли отриману картину переглядають у повному обсязі.

Мій особистий спосіб візуалізації алгоритму згортання - це цикл на кожному пікселі вихідного зображення. На кожному пікселі ви множите на значення згорнутого візерунка, і ви зберігаєте результат на пікселі, відносне положення якого відповідає шаблону. Зробіть це на всіх пікселях (і підсумовуйте результати по кожному пікселю), і ви отримуєте результат.


6

Подумайте про це ... Уявіть собі, що барабан бив його неодноразово, щоб чути музику, правильно? Ваша барабанна палиця вперше приземлиться до мембрани через удар, який вона буде вібрувати, коли ви вдарите її вдруге, вібрація внаслідок першого удару вже в деякій мірі загнила. Отже, який би звук ви не почули - це поточне биття та сума затухаючої реакції попередніх ударів. Отже, якщо - сила удару на k- му моменті, то вплив буде силою x час впливух(к)кх

Який

х(к)гк

Де - нескінченно малий час ударугк

і ви чуєте звук @ , тоді минувший час буде t - k , припустимо, якщо мембрана барабана має ефект розпаду, визначений функцією h ( u ) , де u минув час, в нашому випадку t - k , тому реакція впливу @ k буде h ( t - k ) . Тож ефект x ( k ) d k на час t буде множенням обох, тобто x ( k ) h ( tтт-кгод(у)ут-ккгод(т-к)х(к)гк .х(к)год(т-к)гк

Таким чином, загальний ефект музики, яку ми чуємо, буде інтегрованим ефектом усіх впливів. Це теж від негативної нескінченності до плюс нескінченності. Це те, що відомо як згортка.


цікава ілюстрація :)
tomab

4

Ви також можете думати про згортання як розмазування / згладжування одного сигналу іншим. Якщо у вас є сигнал з імпульсами та іншим, скажімо, одним квадратним імпульсом, результатом будуть розмиті або згладжені імпульси.

Інший приклад - два квадратних імпульси, що згорнулися, виходять у вигляді сплющеної трапеції.


4

Якщо ви сфотографуєте камеру з розфокусованою лінзою, то результат - це згортання сфокусованого зображення з функцією розточення точок дефокусу.

Розподіл ймовірностей суми пари кісток - це згортання розподілів ймовірностей окремих кісток.

Довге множення - це згортання, якщо ви не переходите від однієї цифри до другої. А якщо перегорнути одне з чисел. {2, 3, 7}, що складається з {9, 4}, це {8, 30, 55, 63}

      2   3   7
   X      4   9
---------------
     18  27  63 
  8  12  28
---------------
  8  30  55  63

(Ви можете закінчити множення, перенісши "6" з 63 на 55 тощо.)


3

У сигналах та системах зазвичай використовується згортка з вхідним сигналом та імпульсною реакцією для отримання вихідного сигналу (третій сигнал). Простіше бачити згортку як "зважену суму минулих входів", оскільки минулі сигнали також впливають на вихід струму.

Я не впевнений, чи це відповідь, яку ви шукали, але я зняв відео про неї нещодавно, оскільки це мене тривалий час турбувало. https://www.youtube.com/watch?v=1Y8wHa3fCKs&t=14s Ось коротке відео. Вибачте, будь ласка, мою англійську лол.


2

Ще один спосіб поглянути на згортку - це вважати, що у вас є дві речі:

  • DATA - величини, безумовно, пошкоджені деяким шумом - і у випадкових положеннях (у часі, просторі, назвіть це)
  • PATTERN = деякі знання про те, як повинна виглядати інформація

згортання DATA з (дзеркальним симетриком) PATTERN - це ще одна величина, яка оцінює - пізнання PATTERN - наскільки ймовірно, що вона знаходиться в кожному з положень в межах DATA.

Технічно в кожній позиції ця кількість є співвідношенням (це дзеркало ПАТЕРНУ) і, таким чином, вимірює вірогідність журналу за деякими загальними припущеннями (незалежний шум Гауса). Згортання дозволяє обчислювати його в кожній позиції (у просторі, часі ...) паралельно.



2

Фізичний сенс - це сигнал, що проходить через систему LTI! Згортання визначається як фліп (один із сигналів), зсув, множення та сума. Я збираюся пояснити свою інтуїцію щодо кожного.

1. Чому ми згортаємо один із сигналів у згортці? Що це означає?

Тому що остання точка в поданні вхідного сигналу насправді є першою, яка надходить у систему (помітити часову вісь). Звиток визначається для систем лінійно-тимчасових інваріантів. Це все пов'язано з часом і тим, як ми його представляємо в математиці. У згортанні є два сигнали, один представляє вхідний сигнал, а один представляє системну відповідь. Отже, перше питання тут: Що таке сигнал системної відповіді? Відповідь системи - це вихід системи в заданий час tна вхід із лише одним ненульовим елементом у заданий час t(імпульсний сигнал, який зміщується на t).

2. Чому сигнали множать точку на точку?

Знову ж таки, давайте звернемось до визначення сигналу системної реакції. Як було сказано, це сигнал, який формується через зміщення імпульсної функції шляхом tпобудови виведення для кожного з них t's. Ми також можемо уявити вхідний сигнал як суму імпульсних функцій з різними амплітудами (масштабами) та фазами. Добре, тому системна реакція на вхідний сигнал у будь-який даний момент часу сама відповідь сигналу множиться на (або масштабується на) амплітуду входу в даний момент часу.

3. Що означає зміщення?

Сказавши це (1 і 2), зсув виконується для отримання виходу системи для будь-якої точки вхідного сигналу за один раз t.

Я сподіваюся, що це допоможе вам, люди!


2

х1х2х2х1

Більш тривалий "системний погляд" випливає: Подумайте про ідеальне ( платоністське ) бачення точки. Голова шпильки, дуже тонка, десь на порожньому просторі. Ви можете абстрагувати його як Дірак (дискретний або безперервний).

Точка в просторі

Подивіться на це здалеку, або як недалекоглядна людина (як я), вона розмивається. А тепер уявіть, що сенс також дивиться на вас. З точки зору "точки зору", ви також можете бути сингулярністю. Точка може бути і короткозорою, і середовище між вами обома (ви як сингулярність і точка) може бути непрозорою.

Отже, згортання схоже міст через неспокійну воду . Ніколи не думав, що я можу тут процитувати Саймона та Гарфункеля . Два явища, що намагаються захопити одне одного. Результатом є розмиття одного розмитого іншого, симетрично. Розмиття не повинні бути однаковими. Ваше короткозоре розмивання рівномірно поєднується з нечіткістю об'єкта. Симетрія така, що якщо нечіткість предмета стає вашим зором, і навпаки, загальна розмитість залишається такою ж. Якщо одна з них ідеальна, інша - незаймана. Якщо ви прекрасно бачите, ви бачите точну розмитість об’єкта. Якщо об'єкт є ідеальною точкою, ви отримуєте точну міру вашої короткозорості.

журнал -Fourier-домен, це можна інтерпретувати як суму розмиття .

Ви можете перевірити, але чому? Інтуїтивна математика: згортання

розмиття


1

Те, як ви чуєте звук у заданому середовищі (кімната, відкритий простір тощо) - це згортання аудіосигналу з імпульсною реакцією цього середовища.

У цьому випадку імпульсна характеристика представляє такі характеристики середовища, як звукові відбиття, затримка та швидкість звуку, яка змінюється залежно від температури.


1

Перефразовуючи відповіді:

Для обробки сигналів - це зважена сума минулого в сучасність. Зазвичай один термін - це історія напруги на вході у фільтр, а другий термін - це фільтр або щось таке, що має "пам'ять". Звичайно, у відеообробці всі сусідні пікселі займають місце "минулого".

Для ймовірності - це перехресна ймовірність події з урахуванням інших подій; кількість способів отримати число 7 в лайно - це шанс отримати: 6 і 1, 3 і 4, 2 і 5. тобто сума ймовірностей P (2), кратна ймовірності P (7-2): P ( 7-2) P (2) + P (7-1) * P (1) + .....


1

Згортання - це математичний спосіб поєднання двох сигналів для формування третього сигналу. Це одна з найважливіших методик DSP ... чому? Тому що, використовуючи цю математичну операцію, можна витягнути системну імпульсну відповідь. Якщо ви не знаєте, чому важлива відповідь на імпульс системи, прочитайте про це в http://www.dspguide.com/ch6.htm . Використовуючи стратегію розкладання імпульсу, системи описуються сигналом, який називається імпульсною реакцією. Згортання є важливим, оскільки воно пов'язує три цікаві сигнали: вхідний сигнал, вихідний сигнал та імпульсну характеристику . Це формальна математична операція, так само як множення, додавання та інтеграція. Додавання займає два числа і виробляє третє число, тоді як згортка приймає два сигнали і видає третій сигнал . У лінійних системах згортка використовується для опису зв'язку між трьома цікавими сигналами: вхідним сигналом, імпульсною характеристикою та вихідним сигналом (від Стівена У. Сміта). Знову ж таки, це дуже пов'язане з концепцією імпульсного реагування, про яку вам потрібно прочитати.


-2

Імпульс викликає послідовність виводу, яка фіксує динаміку системи (майбутнє). Перегортаючи цей імпульсний відгук, ми використовуємо його для обчислення виходу з зваженої комбінації всіх попередніх вхідних значень. Це дивовижна подвійність.


-3

Простіше кажучи, це означає перенести дані з одного до іншого домену, де нам легше працювати. Конвуляція пов'язана з трансформацією Лапласа, і іноді легше працювати в області s, де ми можемо робити основні доповнення до частот. а також, оскільки перетворення Лапласа є функцією один на один, ми, швидше за все, не пошкодимо вхід. Перш ніж спробувати зрозуміти, що означає загальна теорема конвуляції у фізичному значенні, слід замість цього почати з частотної області. додавання та скалярне множення слід за тим самим правилом, що перетворення Лапласа є лінійним оператором. c1.Lap (f (x) + c2.Lap g (x) = Коло (c1.f (x) + c2.g (x)). Але що є Lap f (x) .Lap g (x). що визначає теорему конвуляції.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.