Ідея згортки
Моя улюблена експозиція теми - в одній з лекцій Бреда Осгуда про перетворення Фур'є . Обговорення згортки починається близько 36:00, але вся лекція має додатковий контекст, який варто переглянути.
Основна ідея полягає в тому, що, коли ви визначаєте щось на зразок перетворення Фур'є, а не працюєте безпосередньо з визначенням весь час, корисно отримати властивості вищого рівня, які спрощують обчислення. Наприклад, одна така властивість полягає в тому, що перетворення суми двох функцій дорівнює сумі перетворень, тобто
F{f+g}=F{f}+F{g}.
Це означає, що якщо у вас є функція з невідомим перетворенням, і вона може бути розкладена як сума функцій з відомими перетвореннями, ви в основному отримуєте відповідь безкоштовно.
Тепер, оскільки у нас є тотожність на суму двох перетворень, це природне питання запитати, що тотожність для добутку двох перетворень, тобто
F{f}F{g}= ?.
Виявляється, коли ви обчислюєте відповідь, згортання - це те, що з’являється. Вся деривація викладена у відео, і оскільки ваше питання здебільшого концептуальне, я не буду його резюмувати тут.
Наслідком такого наближення до згортання є те, що це невід'ємна частина способу трансформації Лапласа (з якого трансформація Фур’є є особливим випадком) перетворює лінійні постійні коефіцієнти звичайних диференціальних рівнянь (LCCODE) в алгебраїчні рівняння. Той факт, що таке перетворення доступне для того, щоб зробити аналітично відстежувані LCCODE, є великою частиною причини, чому вони вивчаються в обробці сигналів. Наприклад, цитувати Оппенгайма і Шафера :
Оскільки їх математично відносно легко охарактеризувати і тому, що вони можуть бути розроблені для виконання корисних функцій обробки сигналів, клас лінійних інваріантних систем зсуву буде вивчений широко.
Отже, одна з відповідей на питання полягає в тому, що якщо ви використовуєте методи перетворення для аналізу та / або синтезу систем LTI, рано чи пізно, згортання виникне (неявно або явно). Зауважимо, що такий підхід до введення згортки є дуже стандартним у контексті диференціальних рівнянь. Наприклад, дивіться цю лекцію Mth Arthur Mattuck . Більшість презентацій або представляють інтеграл згортки без коментарів, потім отримують його властивості (тобто витягають його з капелюха), або підшивають і хизуються про дивну форму інтеграла, говорять про гортання та перетягування, обертання часом тощо, тощо. .
Причина, що мені подобається в підході професора Осгуда, полягає в тому, що він уникає всього цього цукру, а також надає, на мою думку, глибокого розуміння того, як математики, ймовірно, прийшли до ідеї в першу чергу. І я цитую:
Я сказав: "Чи існує спосіб поєднання F і G у часовій області, щоб у частотній області множилися спектри, перетворення Фур'є множилися?" І відповідь - так, є, цим складним інтегралом. Це не так очевидно. Ви б не вставали з ліжка вранці і записували це, і очікували, що це вирішить цю проблему. Як ми це отримуємо? Ви сказали, припустимо, що проблема вирішена, подивіться, що має статися, і тоді нам доведеться визнати, коли саме час оголосити перемогу. І саме час оголосити перемогу.
Тепер, будучи недоброзичливим математиком, ви висвітлюєте свої сліди і говорите: "Ну, я просто збираюся визначити згортку двох функцій за цією формулою".
Системи LTI
У більшості текстів DSP згортання зазвичай вводиться по-іншому (що дозволяє уникнути будь-яких посилань на методи перетворення). Виражаючи довільний вхідний сигнал як суму масштабованих і зміщених одиничних імпульсів,x(n)
x(n)=∑k=−∞∞x(k)δ(n−k),(1)
де
δ(n)={0,1,n≠0n=0,(2)
визначаючі властивості лінійних інваріантних систем часу призводять безпосередньо до суми згортки, що включає імпульсний відгук . Якщо система, визначена оператором LTI L , виражається як y ( n ) = L [ x ( n ) ] , то, застосовуючи повторювані властивості, а саме лінійністьh(n)=L[ δ(n) ]Ly(n)=L[ x(n) ]
L[ ax1(n)+bx2(n) ]Transform of the sum of scaled inputs=aL[ x1(n) ]+bL[ x2(n) ]Sum of scaled transforms,(3)
та інваріантність часу / зрушення
L[ x(n) ]=y(n) −→−−−impliesL[ x(n−k) ]=y(n−k),(4)
система може бути переписана як
y(n)=L[∑k=−∞∞x(k)δ(n−k)]Tranform of the sum of scaled inputs=∑k=−∞∞x(k)L[δ(n−k)]Sum of scaled transforms=∑k=−∞∞x(k)h(n−k).Convolution with the impulse response
Це дуже стандартний спосіб подання згортки, і це ідеально елегантний і корисний спосіб зробити це. Подібні похідні можна знайти в Оппенгаймі та Шафер , Проакісі та Манолакісі , Рабінері та Голді , і я впевнений у багатьох інших. Деякий більш глибоке розуміння [що йде далі , ніж стандартні введення] даються Діліпа в його чудовому відповіді тут .
Зауважте, однак, що це виведення є чимось магічним трюком. Подивившись ще один погляд на те, як сигнал розкладається в , ми можемо побачити, що він вже у формі згортки. Якщо(1)
(f∗g)(n)f convolved with g=∑k=−∞∞f(k)g(n−k),
то просто x ∗ δ . Оскільки функція дельти є елементом ідентичності для згортання, сказати, що будь-який сигнал може бути виражений у такій формі - це дуже схоже на те, що будь-яке число n може бути виражене як n + 0 або n × 1 . Тепер, вибір опису сигналів таким способом є геніальним, оскільки він веде безпосередньо до ідеї імпульсної реакції - просто ідея згортки вже «випалена» до розкладання сигналу.(1)x∗δnn+0n×1
З цієї точки зору, згортка суттєво пов'язана з ідеєю дельта-функції (тобто це двійкова операція, яка має дельта-функцію як її елемент ідентичності). Навіть не враховуючи його відношення до згортки, опис сигналу вирішально залежить від ідеї дельта-функції. Тоді виникає питання, звідки у нас в першу чергу ідея функції дельти? Наскільки я можу сказати, це йде як мінімум назад, як і у статті Фур'є з Аналітичної теорії тепла, де це неявно. Одним із джерел для отримання додаткової інформації є цей документ про походження та історію розвитку Алехандро Домінгес.
Тепер це два основних підходи до ідеї в контексті теорії лінійних систем. Один віддає перевагу аналітичному огляду, а інший підтримує числове рішення. Я думаю, що обидва корисні для повного уявлення про важливість згортки. Однак у дискретному випадку, нехтуючи лінійними системами цілком, є сенс, в якому згортання є значно старшою ідеєю.
Помноження множин
Гілберт Странг в цій лекції, що починається близько 5:46, дає добру презентацію ідеї про те, що дискретна згортання є просто поліноміальним множенням . З цієї точки зору, ідея сходить повністю до впровадження позиційних систем числення (які представляють числа неявно як поліноми). Оскільки Z-перетворення представляє сигнали як поліноми в z, то і в цьому контексті виникне згортання - навіть якщо Z-перетворення формально визначено як оператор затримки без використання складного аналізу та / або як особливий випадок Лапласа Перетворити .