Запитання з тегом «audio»

Звук, або з точки зору обробки сигналу, аудіосигнал - це аналогове або цифрове зображення звуку, як правило, електричної напруги.

6
Що потрібно знати, щоб створити синтезатор програмного забезпечення?
Для того, хто має певний досвід розробки програмного забезпечення, любить його синтезатори та знає [самі] основи цифрового аудіопрезентації, які перші кроки він повинен виконати, щоб запрограмувати синтезатор музики, DSP-мудрий?
19 audio 

3
Покажіть іншим, як я чую себе
Sooo .. Я думав над цим матеріалом. Всі ми знаємо, що ми звучимо інакше, ніж ми чуємо власний голос. Неважко дізнатися, як чують нас інші, записуючи себе та слухаючи його. А як же навпаки? Чи є спосіб перетворити наш голос таким чином, щоб інші могли нас почути, коли ми сприймаємо …

4
Бібліотеки для виявлення голосової активності (не розпізнавання мови)
Після мого попереднього запитання мені було цікаво, чи існують бібліотеки виявлення мовлення. Під виявленням мовлення я маю на увазі проходження звукового буфера та повернення індексу того, де починається і зупиняється мова. Отже, якщо у мене є 10 секунд вибірки аудіо на 44 кГц, я очікую масив чисел, таких як: 44000 …
18 audio  speech 

3
людський мовний фільтр
Хтось знає про фільтр для послаблення мовлення? Я пишу програмне забезпечення для розпізнавання мовлення і хотів би відфільтрувати все, крім людської мови. Сюди можна віднести фоновий шум, шум, що видається хитрим мікрофоном або навіть фоновою музикою. Я вже впровадив фільтр першого порядку, який компенсує відкат 6 дБ спектру потужності, але …

1
Знайдіть подібну музику за допомогою FFT Spectrums
Я експериментував кілька тижнів, щоб знайти спосіб знайти / знайти подібні пісні в бібліотеці, що містять різні жанри музики. Першою моєю спробою було виявити такі функції, як Tempo, або скільки басів є у Піснях, щоб сформувати групи, але я не вдався далеко до цього підходу (Об'єм гучності, заснованого на виявленні …
16 audio  fft  music 

4
Функція вилучення для класифікації звуку
Я намагаюся отримати функції із звукового файлу та класифікувати звук як належний до певної категорії (наприклад: собачий гавкіт, двигун транспортного засобу тощо). Мені хотілося б зрозуміти наступні речі: 1) Це взагалі можливо? Існують програми, які можуть розпізнавати мовлення та розрізняти різні типи гавкіт собаки. Але чи можна мати програму, яка …

2
Як витягнути голосову частину зі стереосигналу?
Зараз я обробляю MP3-файл і стикаюся з цією проблемою. Мій MP3 - стереокодування. Що я хочу зробити, це витягнути голосову частину для подальшої обробки (незалежно від режиму вихідних сигналів, моно або стерео). Наскільки мені відомо, звук кодується в різні роз’єднані піддіапазони частот у MP3. Я думаю, що я можу обмежувати …

4
Нижчі частоти сильніші у FFT?
Я розраховую FFT з мікрофонного входу. Я зауважую, що на низьких частотах завжди, здається, є більша потужність (більша дБ), ніж більш висока. Я вирізав дані в кадри 24576 байт (4096 * 6). Застосувати вікно Хеммінга: input[i] *= (0.54d - 0.46d*(double) Math.Cos((2d*Math.PI*i)/fs)); Запустіть його через FFTW Process1D(). Перетворити із складних чисел: …
15 audio  fft 

1
Отримання гучності треку за допомогою RMS
Я намагаюся обчислити гучність звукової доріжки, яку я зберегла в буфері. Буфер містить дані сигналу PCM, і я хочу отримати, наскільки він "голосний", використовуючи Root Mean Squared. Я припускаю, що можу це зробити у часовій області, замість того, щоб переходити на частотну область. Який би був псевдокод для цього? Я …

2
Коли починається трек сміху?
Один із моїх вихідних проектів завів мене в глибокі води обробки сигналів. Як і у всіх моїх кодових проектах, які вимагають певної математики, я більш ніж радий налаштувати свій шлях до рішення, незважаючи на відсутність теоретичного обгрунтування, але в цьому випадку я цього не маю, і хотів би порадити з …

4
Найефективніший спосіб вилучення частотних компонентів аудіосигналу з точністю до людини в режимі реального часу
Я намагаюся розробити, як (якщо можливо) витягнути частотні компоненти довільного звукового зразка (як правило, музики) таким чином, як FFT, але в дослідженні алгоритму FFT я дізнаюся, що це певне суворі обмеження для цієї мети. Існує 3 проблеми, які представляє FFT: Оскільки роздільна здатність біт FFT еквівалентна розміру вашого вікна, для …

4
Scipy - аудіообробка
Я шукаю хороші інструменти для обробки звукових сигналів. наприклад, аналіз мови та музики, автоматична ідентифікація мови тощо. Чи надає бібліотека Scipy функції для обробки аудіо? Чи є у нього гарний інструмент для обробки аудіосигналів? Чи можете ви, будь ласка, запропонувати інструмент для цього?

2
Яка конструкція смугового фільтра дасть найкоротший імпульсний відгук?
Проектування простого ІІР діапазону фільтра Батерворта з центральною частотою 500 Гц і пропускною здатністю 1 октави дає мені наступну частотну характеристику ... Тепер, якщо я беру імпульсну відповідь і нормалізую її і перетворюю в дБ, ми можемо спостерігати занепад імпульсної відповіді. Занепад імпульсної реакції приблизно лінійний з часом, коли будується …

5
Визначте, де починається спів з голосового запису
У мене є невеликий додаток у стилі караоке, де користувач співає 4 рядки пісні, з розривом на одну секунду між кожним рядком. Немає музики, що підтримує музику, тому голос є лише голосом, сподіваємось, що проблему легше вирішити. Я шукаю найбільш надійний спосіб точно визначити, де в моєму записі користувач починає …

2
Які методи можна використовувати для виявлення та видалення відлуння з аудіосистеми?
Фон Я розробляю систему, яка буде мати один невеликий мікрофон і динаміки для використання в налаштуваннях типу телефону. Найпростіший приклад, який я можу навести, - це розмова по Skype, де ви використовуєте динаміки своїх комп’ютерів та настільний мікрофон. Мене турбує звук від динаміків, які отримують мікрофон і надсилають назад оригінальній …
14 audio 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.