Чи може DCT використовуватися для спектра величини звуку, а не DFT?


13

Як я розумію, DCT має половину розміру бункера як DFT однакового розміру N. DFT також включає фазову інформацію, але часто це не потрібно, коли потрібен лише спектр величини.

  • Чи може DCT використовуватися для забезпечення спектру величини з подвоєною щільністю (половина відстані між собою) DFT або втрачається інформація про фази?
  • Як щодо 50% перекриття?

4
Я вважаю, що DCT включає також фазову інформацію, вона просто не використовує складні числа. "Справжній FFT" також використовує половину пам'яті та половину часу для обчислення для тієї самої інформації, викидаючи однакові негативні частоти. "реальна частина FFT подвійної довжини така ж, як DCT, за винятком фазового зсуву напівпроби у функціях основи синусоїдальної основи"
ендоліт

Справді, принаймні знак коефіцієнта можна вважати фазою бідної людини
Лоран Дюваль

Відповіді:


3

Так, DCT можна використовувати для забезпечення спектру величини з подвійною щільністю. Я не зовсім розумію перекриття, але я припускаю, що оскільки DCT охоплює менше, ви думали, що буде перекриття. Щоб надати відповідь на питання, дозвольте зробити короткий огляд на використання DCT в основному для обробки зображень.

По-перше, нам потрібно зробити деякі припущення. Для того, щоб використовувати DCT, вам потрібно мати реальний сигнал. Це за визначенням. Поки ви говорите, DCT має половину розміру бункера порівняно з DFT розміром N, ви припускаєте, що сигнал є низькочастотним сигналом. Інакше не так вже й багато.

Для використання DCT при стисненні, оскільки DFT зображення буде симетричним, він видає зайву інформацію (одного бічного дзеркала буде достатньо для відтворення сигналу). Тому ядро ​​DCT використовується для отримання більш щільної інформації порівняно з DFT. Це справедливо і для низькочастотних аудіосигналів, їх можна використовувати так само. Хоча це робить щільніше, коефіцієнти збільшуються, оскільки ядро ​​DCT охоплює обидві сторони (реальну та уявну частини) сигналу.

Моє головне - це обробка зображень, тому я спробував зіставити концепції та пояснення DCT та DFT в обробці зображень. Однак одна з різниць між зображенням та аудіо може бути розмірами. Під час обробки зображень ви знаєте розміри (рядки та стовпці для FFT та інших цілей обробки). Я здогадуюсь, що вам потрібно якось розділити вектор аудіоданих для подальшої обробки. Не знаючи даних, це може бути проблемним (я не впевнений).

Ось зображення, зроблене з Інтернету, але я не записував його там, де я його взяв, може бути wikipedia;

Обробка зображення

Як бачите, перетворене зображення представлене в DCT за спектром величин без проблем. Більш компактним і щільним способом і погляньте на величину коефіцієнтів. Це більше, ніж у два рази від DFT. DFT симетричний, ви можете просто розділити його на два. Одна частина є зайвою. І ще одне - DCT може зберігати інформацію не лише половини DFT, а майже чверті DFT. Це, як правило, перехід DCT до зображень DFT.


Чи не можна FFT розділити на четверті, оскільки він є надмірним як у X, так і в Y розмірах?
ендоліт

Чому так виглядає, що FFT містить більше інформації, а DCT містить більше нулів?
ендоліт

Перше запитання, я не зовсім розумію, що ви маєте на увазі під розмірами X та Y? По-друге, це через різницю в їх ядрах. Він не схожий на те, що DCT містить більше нулів, він фактично містить більше нулів, ніж звичайна перетворення Фур'є (DFT). Це пояснюється знову ж таки різницею їх ядер.
Гефест

Я маю на увазі, що зображення є реальним сигналом, тому FFT містить зайву інформацію. Негативна половина FFT - це лише дзеркало позитивної половини в обох вимірах.
ендоліт

0
  • Як щодо 50% перекриття?

З цього питання я розумію, що ви замислюєтесь про те, щоб виконати локалізовану, блокову обробку у формі ковзання Фур'є чи спектрограми.

  • Чи може DCT використовуватися для забезпечення спектру величини з подвоєною щільністю (половина відстані між собою) DFT або втрачається інформація про фази?

Якщо говорити про спектр величини, то, звичайно, частина фази (будь то аргумент складного коефіцієнта Фур’є або знак коефіцієнта DCT) все одно буде втрачена .

Тому, звичайно, ви можете підключити багато ядер замість віконної трансформації Фур'є всередині короткострокової формули Фур'є лише для аналізу. Різні породи DCT, їх перекриті версії (LOT, MDCT), з хорошими ортогональними та віконними властивостями, навіть можуть бути перевернуті (синтез).

У аудіо, (нескладних) версіях DCT або перекритих версіях часто використовуються для аналізу, виявлення виникнення та нахилу (сліпе поділ джерел), наприклад, є STFT, MDCT та перевертає інструментарій Matlab від A. Liutkus. Великий час аналіз частоти інструменти (LTFAT) також володіє:

  • Швидкі TF-перетворення з лінійною шкалою частоти часу: Gabor (STFT), Wilson і віконний MDCT
  • Рідка регресія в домені Gabor і WMDCT

Я не дуже добре знаю аудіо. Однак 50% або 75% перекриття дуже поширені, і мало хто користується іншими налаштуваннями. Однак дуже часто застосовувати принаймні два розміри вікна , довгу стаціонарну частину, коротку - перехідну, щоб допомогти подолати обмеження частоти частоти "одне вікно".

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.