Існує кілька ключових відомостей, які вам потрібні, щоб зрозуміти, як DFT дозволяє змістити зображення.
По-перше, теорія Фур'є: Мабуть, простіше спочатку подивитися на безперервний (тобто аналоговий) випадок. Уявіть, що у вас є якась функція, назвіть це g (t). Для простоти скажемо, що g (t) - це аналоговий аудіо запис, тому це одновимірна функція, яка є безперервною, і представляє миттєвий тиск як функцію часу.
Тепер g (t) - це один із способів представити нашу аудіозапис. Інша - G (f). G (f) - перетворення Фур'є з g (t). Отже, G (f) == FT (g (t)). G (f) має всю ту саму інформацію, що і g (t), але вона представляє цю інформацію в частотній області замість часової області. Існує кілька прискіпливих деталей щодо перетворень Фур'є, про які я не згадую.
Ви можете вважати G (f) як "розподіл частот", що міститься в g (t). Отже, якщо g (t) - синусоїда (тобто чистий тон), то G (f) буде скрізь нульовим, крім частоти цього тону. Це, мабуть, хороший момент зазначити, що G (f) взагалі є складною функцією - тобто, вона повертає складні числа, які можна думати, що мають реальний і уявний компонент або величину і фазу.
δ(w)δ
Гаразд, тож зараз у нас під ременем є безперервні ФТ.
Ось друге розуміння: дискретна трансформація Фур'є - це перетворення Фур'є, оскільки вибірковий сигнал - аналоговий сигнал. У цьому випадку "дискретний" відноситься до квантування домену функції (часу або частоти), а не до діапазону. (Вибірковий цифровий сигнал, який ви отримуєте зі своєї звукової карти, кількісно визначається як у домені, так і в діапазоні.)
Цифровий байт-потік, який ви отримуєте зі своєї звукової карти, містить "зразки" вихідного безперервного (аналогового) сигналу з мікрофона. Якщо взяти DFT зразка g (t), ми все одно отримаємо G (f). Пам'ятайте, що G (f) - це просто інший спосіб подання інформації, що міститься в g (t). Якщо ми підкорялися теорії Найквіста , вибірковий сигнал g (t) містить всю "інтелект" вихідного безперервного сигналу, тому наш дискретний G (f) повинен містити всю інформацію з нашого вихідного безперервного сигналу. В батьківському відношенні G (f) все ще є складною функцією.
Ось тут і приходить магія зміщення субпікселів, але в цьому випадку я пишу про зміщення звукового сигналу в часі менше, ніж на зразок, оскільки це те саме.
eiπ2
Це означає, що ми можемо перенести аудіозапис у часі (на будь-яку кількість, яку ми виберемо, включаючи частку вибіркового часу), просто змінивши фазу G (t). Насправді це твердження, можливо, трохи надто випадкове. Для не квантованого вибіркового сигналу фазу можна регулювати довільно (це є причиною того, що я раніше розрізняв квантування домену та діапазону). Однак для квантованого вибіркового сигналу (наприклад, наш байт-потік аудіо) розмір кроку квантування (тобто кількість біт) визначає роздільну здатність, за допомогою якої ми можемо регулювати фазу. Коли ми обернемо перетворення Фур'є G (f) (або DIFT це для цього відібраного сигналу), новий набір зразків g '(t) = DIFT (G (F)) буде зміщений у часі на суму, яку ми виберемо.
Застосовувати це до своїх пікселів просто означає використовувати двовимірний FT замість обговорюваного тут 1-мірного FT.