DFT з геометрично розташованими бункерами?


16

Традиційна дискретна трансформація Фур'є (DFT) та її двоюрідний брат, FFT, дають баки, розміщені однаково. Іншими словами, ви отримуєте щось на кшталт перших 10 герц у першому біні, 10,1 - 20 у другому і т. Д. Однак мені потрібно щось трохи інше. Я хочу, щоб діапазон частот, охоплений кожним відрізком, геометрично збільшувався. Припустимо, я вибираю множник 1,5. Тоді ми маємо від 0 до 10 у першому біні, я хочу 11 - 25 у другому біні, 26 - 48 у третьому і т. Д. Чи можна змінити алгоритм DFT так, щоб він поводився таким чином?


Ви завжди можете розрахувати DFT у цікавих місцях. Також мені спадають на думку дискретні вейвлет-перетворення та фільтри . Можливо, варто їх подивитися.


2
Погано сформульовано. Те, що ви хочете, не є ні новим, ні вдосконаленням у багатьох випадках.
hotpaw2


2
DFT і FFT не є родичами. Вони дають однакові результати.
Фонон

Відповіді:


17

Щоб процитувати мою дисертацію:

Колекція перетворень отримує назву постійної Q і схожа на перетворення Фур'є.

Розрахунок дискретного перетворення Фур'є може бути дуже ефективним при використанні швидкого перетворення Фур'є. Однак ми помічаємо, що енергія сигналу поділяється на частотні відряди однакового розміру по всьому спектру. Хоча в багатьох випадках це корисно, ми помічаємо ситуації, коли такий рівномірний розподіл є неоптимальним. Важливий приклад такого випадку спостерігається при аналізі музичних частот. У західній музиці частоти, що складають музичну шкалу, геометрично розташовані між собою. Отже, ми бачимо, що карта між частотними відрядами дискретного перетворення Фур'є та частотами музичних шкал є недостатньою, тому сенси погано збігаються. Постійне перетворення Q вирішує це питання.

Метою постійної Q є створення набору логарифмічно розміщених частотних відрізків, в яких ширина частотного відрізка є добутком попереднього. В результаті ми можемо створити однакову кількість бін на музичну ноту в межах звукового спектру, таким чином підтримуючи постійний рівень точності для кожної музичної ноти. Бінки частоти стають ширшими до більш високих частот і звужуються до нижчих частот. Це поширення в точності виявлення частоти тісно імітує спосіб, яким система слуху людини реагує на частоти.

Крім того, тісне узгодження нот у західних масштабах робить константа Q особливо корисною для виявлення нот; визначення значення музичної ноти, а не явного значення частоти. Крім того, константа Q спрощує процес аналізу тембру. Частоти музичної ноти, що грає на інструменті, часто складаються з гармонійно пов'язаних частин. Тембр інструменту можна характеризувати співвідношеннями гармонік. При постійному Q перетворенні гармоніки однаково розташовані між собою в бункерах незалежно від основної частоти. Це значно спрощує процес ідентифікації інструменту, що грає на ноті в будь-якій точці шкали, просто переміщуючи характеристику по бункерах.

Ефективний алгоритм перетворення дискретного перетворення Фур'є (який може бути обчислений з FFT) у перетворення постійного Q детально описаний у Brown and Puckette (1992).


1

У DFT (FFT) є значні математичні припущення. Найбільш вагомим у цьому випадку є те, що ви здійснюєте усічене нескінченно-синусоїдальне перетворення. Друга полягає в тому, що сигнали усіченого часу та усіченої частоти приймаються за модульно обернені (кругові). Бункери, розміщені у звичайній ППФ, утворюють ортонормічну множину лише завдяки цим припущенням (і рівномірному арифметичному інтервалу). Отже, пара <частота частот є цілком оборотними.

Постійна трансформація Q не обрізається так добре, тому будь-яка практична реалізація не дає ідеального орто-нормального сполучення. Ядро є нескінченно довгим експоненціально розпадається синусоїдою і тому не може мати кругову перевагу, зазначене вище. Якщо не врізати, вони утворюють ортонормальний набір.

Перетворення вейвлетів, як правило, розташовані з потужністю 2, що не дуже корисно для оцінки дрібнозернистої частоти.

Пропозиція нерівномірно розмістити стандартний синусоїдний DFT буде пропускати інформацію у широко розташованій області, тоді як вона дублюватиме інформацію у щільно розташованій області. Якщо тільки для кожної частоти використовується інша функція аподінізації ... дуже дорого.

Одним з практичних рішень є зробити повторну процедуру на півперспектр-> десяткове на 2, щоб отримати підрозділи, засновані на октаві, щоб задовольнити деяку помилку оцінки мінімаксу на октаву. Співвідношення порід-спектр-> десяткове за співвідношенням може бути встановлено у будь-якому співвідношенні для досягнення будь-якої потреби в деталізації. Все ще досить обчислювальний інтенсивний, хоча

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.