Теорія лінійного прогнозного кодування (LPC)


9
  • Яка теорія стоїть за LPC?
  • Чому, як вважають, деякі реалізації LPC є більш толерантними до квантування помилок передачі чи кодування, ніж інші схеми кодування стисненого голосу?

  • Чи можна застосовувати методи LPC для згладжування або короткочасного "прогнозування", подібного до використання методів фільтра Калмана?

  • За яких умов чи обмежень діє використання LPC?

"Чому, як вважається, LPC є більш толерантним до помилок передачі чи кодування, ніж деякі інші схеми кодованого голосового стиснення?" Хто сказав, що? Я не дуже добре знаю LPC, але я вважав, що це стосується зменшення надмірності, що матиме зворотний ефект.
ендоліт

Це питання вводить в оману, оскільки воно є помилковим. Будь ласка, закрийте та виправте це.
Діпан Мехта

Тут є багато питань і приміщень. Які (-ла), на вашу думку, потрібні ремонт?
hotpaw2

1
Заява Why are(were) certain implementations of LPC said to be more tolerant of transmission or encoding errors quantization than other compressed voice encoding schemes?досить хибна. Чи можете ви навести будь-яку посилання, яка конкретно говорить про те, що краще за інших?
Діпан Мехта

1
Це власне питання. Я чув це десь, але не знаю, чому це могло бути заявлено.
hotpaw2

Відповіді:


14

По-перше, сказати, що лінійне прогностичне кодування (LPC) є "більш терпимим до помилок передачі чи кодування", не зовсім вірно. Форма, в якій передаються коефіцієнти, робить велику різницю. Наприклад, якщо розв’язуються коефіцієнти лінійного прогнозування, вони можуть бути дуже чутливими до квантування, подібно до коефіцієнтів фільтра IIR високого порядку (це тому, що фільтр синтезу буде IIR, але про це пізніше). Однак якщо вони передаються в іншій формі, цю проблему можна легко усунути.

Один із способів - перенести коефіцієнти відбиття. Якщо рекурсивно вирішувати фільтр лінійного прогнозування k-го порядку, найвищий коефіцієнт порядку на кожному етапі називається коефіцієнтом відбиття. Вони можуть бути використані разом, щоб повністю охарактеризувати систему (що легко видно з рекурсії Левінсона). Насправді ви можете використовувати їх усі разом для формування ґраткового фільтра. Ці фільтри часто використовуються, коли квантування викликає занепокоєння, оскільки вони набагато стійкіші до низького числа бітів. Крім того, якщо величина цих коефіцієнтів відбиття обмежена одиницею, вам гарантується стабільний фільтр BIBO, який є критичним для LPC, де фільтр використовується для синтезу сигналу. Існують і інші методи, такі як лінії спектральних пар, які часто використовуються, але не є

Тепер, щоб вирішити перше питання, теорія ЛПК обертається навколо моделювання голосових шляхів. По суті, ми моделюємо промову як вібрацію повітря, як вхід до трубки якоїсь структури. Ви можете шукати деякі ресурси, які детально розбираються для деталізації цієї моделі (довжина трубок, інтенсивність повітря, структура тощо). Ці ресурси відносять ці структури безпосередньо до фільтрів IIR, що реагують на різні подразники, наприклад, білий шум.

Отже, коли ми вирішуємо коефіцієнти лінійного прогнозування, ми шукаємо такі коефіцієнти, що якщо ми вводимо наш сигнал (голос, наприклад) у фільтр FIR, створений з коефіцієнтів, ми отримуємо білий шум як вихід. Тож подумайте, що це означає. Ми вкладаємо високу оцінкукорельований сигнал і виводить послідовність білого шуму. Тож фактично ми знімаємо всю лінійну залежність цього сигналу. Ще один спосіб поглянути на це - це те, що вся змістовна інформація міститься в коефіцієнтах, які усувають цю лінійну залежність. Тому ми можемо перенести ці коефіцієнти (або якусь їх форму, як описано вище), і приймаючий кінець може відтворити сигнал. Це робиться шляхом інвертування лінійного прогнозного фільтра FIR для створення фільтра IIR та введення білого шуму. Таким чином, стиснення відбувається від усунення цієї лінійної залежності та перенесення коефіцієнтів. Ось чому метод Бурга також іноді називають методом максимальної ентропії, оскільки він спрямований на максимізацію "випадковості" або білизни вихідного шуму у фільтрі лінійного прогнозування. Ще один спосіб подивитися на це,

Щоб відповісти на ваше остаточне запитання, я не впевнений, що ви повністю задаєте. LPC, або лінійне прогностичне кодування, призначене для "стиснення" сигналу, припускаючи, що його можна ефективно моделювати, як було обговорено раніше. Ви, звичайно, можете використовувати лінійне передбачення, щоб зробити "короткострокове прогнозування", як ви вже згадували. Це є неявним підґрунтям методів високої роздільної здатності АР, що використовуються для оцінки спектральної щільності потужності. Послідовність автокореляції може бути рекурсивно розширена з її кінцевої форми від обмеженого запису даних до нескінченності як теоретичної послідовності автокореляції невикритої послідовності. Ось чому методи AR оцінювання ПСД не виявляють явищ побічної хвороби.


1
"теорія ЛПК обертається навколо моделювання голосових шляхів" Чи завжди це правда? FLAC використовує LPC для загальних аудіосигналів, а не лише для голосу.
ендоліт

3
Мої вибачення, я спочатку дізнався це через аналогію голосових акордів як фізичної моделі, звідки це і з’явилося. Як я вже сказав, є місця, де вони заглиблюються в це набагато глибше. Але ви маєте рацію, LPC підходить для загальних форм звукових хвиль. Як я вже згадував, він добре працює в будь-якому імпульсивному спектрі. Як наслідок, він погано працює на галасливих сигналах, коли спектр менш імпульсивний (це тому, що шумні сигнали краще моделюються як процеси ARMA).
Брайан
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.