Моя проблема полягає в тому, що я не знаю енергії фонового шуму, тому я не можу просто обмежити енергію. Обробка проводиться в режимі реального часу, і у мене є близько 500 мсек для вирішення. В ідеалі, я хотів би, щоб тихі приголосні вважалися немовкою.
6
У мене недостатньо інформації, щоб дати повну відповідь, але ваша проблема називається виявленням голосової активності . Не існує єдиного узгодженого найкращого способу зробити це, і якщо ви подивитесь, ви, мабуть, натрапите на багато різних підходів. Можливо, деякі інші зможуть розібрати це трохи більше.
—
Джейсон R
@Michael Litvin, існує клас нелінійних фільтрів (використовується в "детектуванні енергії" за назвою "Teager-Kaiser". Я думаю, що це підмножина того, що відомо як "ядра вольтера". Вибачте, я не можу надати будь-які Додаткову інформацію, але якщо ви шукаєте ці слова, ви можете знайти те, що шукаєте. Я знаю, що метод Тіджера-Кайзера використовується для "коли" звуки китів починають VS просто фоновий шум.
—
Spacey