Коли я повинен обчислити PSD замість простого спектру величини FFT?


12

У мене є тридцять другий мовленнєвий сигнал, який відбирався на частоті 44,1 кГц. Тепер я хотів би показати, які частоти має мова. Однак я не впевнений, що було б найкращим способом зробити це. Здається, іноді можна обчислити абсолютне значення перетворення Фур'є, а іноді спектральну щільність потужності. Якщо я правильно розумію, останній працює так, що я поділяю свій сигнал на частини, виконайте FFT частково за частиною і якось підсумовуйте їх. Функції вікна якимось чином задіяні. Чи можете ви мені це трохи уточнити? Я новачок у DSP.


1
Розбиття сигналу на сегменти, пошук спектру кожного, а потім усереднення спектрів може допомогти зменшити шум, але також зменшує роздільну здатність. дивіться en.wikipedia.org/wiki/Welch%27s_method
endolith

Відповіді:


8

Тепер я хотів би показати, які частоти має мова. Однак я не впевнений, що було б найкращим способом зробити це. Здається, іноді можна обчислити абсолютне значення перетворення Фур'є, а іноді спектральну щільність потужності.

Якщо ви хочете надати своєму аналізу фізичний сенс, тоді перейдіть до спектральної щільності потужності (PSD). Це тому, що це просто надасть вам потужність вашого сигналу в кожному діапазоні частот. З іншого боку, якщо ви не хочете / не піклуєтесь про фізичний зміст, але хочете знати, як амплітуди фур'є кожного діапазону змінюються відносно один одного, ви можете дотримуватися абсолютної величини.

х[н]Х(f)|Х(f)||Х(f)|2

Якщо я правильно розумію, останній працює так, що я поділяю свій сигнал на частини, виконайте FFT частково за частиною і якось підсумовуйте їх. Функції вікна якимось чином задіяні. Чи можете ви мені це трохи уточнити? Я новачок у DSP.

Ні, це неправда. Те, про що ви тут говорите, відноситься до короткочасного перетворення Фур'є (STFT). Це просто подрібнення сигналу доменного часу, вдівництво його, а потім прийняття триножної форми. Зрештою, у вас все ще буде складна матриця. Якщо ви вирішите взяти його абсолютну величину, у вас з'явиться абсолютна матриця перетворення фур'є. Якщо ви візьмете його абсолютну величину в квадрат, ви матимете матрицю спектральної щільності потужності.


3

Важливо зрозуміти щось подібне до мовного сигналу - це те, що його частотні компоненти відрізняються часом . Для подання мови в частотній області ми зазвичай приймаємо досить коротке вікно сигналу, в межах якого можна припустити, що спектр мови не сильно змінюється (як правило, 10 мс). Таким чином, ми обчислюємо спектр потужності для кожного наступного вікна 10 мс за допомогою STFT (часто з деяким перекриттям між вікнами) і трактуємо кожен наступний спектр як "знімок" частотних компонентів мови в цей конкретний час. Часто послідовні спектри будуються в 3D-графіці, такому як спектрограма, з часом на осі X, частотою на осі Y та величиною, зображеною як помилковий колір або інтенсивність сірого масштабу в кожному місці X, Y.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.