Покажіть іншим, як я чую себе


18

Sooo .. Я думав над цим матеріалом. Всі ми знаємо, що ми звучимо інакше, ніж ми чуємо власний голос. Неважко дізнатися, як чують нас інші, записуючи себе та слухаючи його.

А як же навпаки?

Чи є спосіб перетворити наш голос таким чином, щоб інші могли нас почути, коли ми сприймаємо власний голос? Я вважаю це досить цікавим питанням. На жаль, я не зміг знайти нічого в Інтернеті після кількох пошуків Google. Ніхто не думав про це чи це неможливо через якусь причину, яку я не бачу?

Будь-які висновки щодо цього були б вдячні :).


5
Ви можете зробити цю проблему якомога простішою: зробіть запис своєї промови, яка, слухаючи вас через навушники, звучить так само, як звучить ваша промова, коли ви говорите в анехогенній камері. Не знаєте, як це зробити.
Оллі Ніемітало

2
Я просто хотів запропонувати саме це. Однак чи справді потрібно виключити вплив приміщення? Направність вашого голосу як джерела звуку, безумовно, є фактором, але я думаю, що цей метод, ймовірно, спрацює досить добре, якщо запис буде зроблений там, де відбувається "процедура настройки".
яблука

Відповіді:


10

Це не неможливо, але це також не буде прогулянка по парку.

Що б ви намагалися зробити, це додати до голосового сигналу ті вібрації, які надходять до вуха через кістки і не доступні нікому іншим.

Але це простіше сказати, ніж зробити точно.

Поширення звуку через носій дуже залежить від його щільності . Звук рухається при ~ 1500м / с у воді та з меншим розсіюванням, ніж він рухається у повітрі (~ 340м / с). Кістка щільніше повітря, тому звук повинен швидше проходити через кістку. Це означає, що "ваш" звук починає спочатку збуджувати ваші вуха, а потім звук, який ви сприймаєте через "звичайний" повітряний канал. Насправді кістка має внутрішню структуру, яка може впливати на те, як через неї проходять різні частоти, але в діапазоні частот, про які ми говоримо, можливо, ми можемо розглядати її як рівноцінне тверде тіло. Це може бути приблизним лише тому, що будь-яка спроба вимірювання повинна бути інвазивною, але також тому, що слух є суб'єктивним.

Слух або сприйняття звуку - це ВЕЛИЧЕЗНА СТОРІНКА тут. Саме вухо, зовнішнє вухо (видимий шматочок), канал і внутрішній механізм працюють разом дуже складними способами. Це предмет психоакустики . Одним із прикладів цієї складної обробки є фантомні тони, де мозок заповнює речі, які, як передбачається, є там. Мозок сам, можливо, вже розробив способи виділення самогенеруваного сигналу, які ще недоступні для нас.

Але, спрощений ( спрощений! ) Спосіб засвідчити відмінності між тим, як слухати власне звучання, а не це:

Запишіть коротке і просте слово (наприклад, "Fishbone" - слово, яке має як низькі частоти (b, o, n), так і високі частоти (F, sh, i, e)) з невеликою тишею і проведіть його через еквалайзер через навушники. Почніть відтворення та синхронізуйте себе, вимовляючи слово із записом (так, щось на кшталт "Fishbone ... Fishbone ... Fishbone ..."). Тепер спробуйте пограти з еквалайзером, поки те, що ви почуєте і те, що вимовляєте, не стане подібним.

У цей момент настройки еквалайзера представляли б різницю між звуком і тим, що він сприймається через вас, і теоретично, будь-яка інша мова, пропущена через цей еквалайзер, імітувала б, як він потрапляє до ваших вух, як би ви створили його з джерело всередині вашого тіла.

Сподіваюся, це допомагає.


1
це, мабуть, неможливо через індивідуальні відмінності сприйняття та неможливість кількісної оцінки цієї суб'єктивності. Однак різниці можуть бути незначними, як, наприклад, у випадку кожного виготовленого ковпачка 1000uF насправді трохи відрізняється ...
Fat32

1
@ Fat32 Я не міг визначитися з неможливістю, оскільки технічно можна було кількісно оцінити / виміряти внесок другого каналу, який встановлюється через кістки, і за допомогою обґрунтованих припущень прийти з деяким наближенням. На кшталт того, як відчуває себе в медичному стані, який абсолютно відрізняється з точки зору "пацієнта". Це було б краще наближення, ніж просто EQ. Але в точці сприйняття, так, саме зараз неможливо було б запропонувати остаточний «фільтр», який би перетворив звуковий кліп відповідно до вимоги.
A_A

повторно заявлене по-іншому: якщо такий же точний фізичний стимул створюється в кохлеях двох різних людей, вони (ймовірно) почують два різних сприйняття, і те, що вони насправді чують (афаїк) - це власне переживання, закрите для будь-якого зовнішнього інквізиту будь-якого роду, але математичного ... Втім, люди можуть спілкуватися акустично - це результат дискретного характеру мови.
Fat32

Дуже дякую! Це було дуже інформативно і корисно, і в той же час дуже дивовижно xD. Я побоювався, що кожна людська кісткова структура змінює звук по-різному .. але я не думав про саме вухо як про інше порушення. Ну, принаймні, їх МОЖЕ існувати певна функція для кожної людини, яка відповідно переводить звук.
Данкінгдев

@KevinFiegenbaum Дякую, що повідомили мені. Сприйняття - джерело багато мислення. Мозок з'єднується з реальністю через органи чуття та створює та підтверджує (або відкидає) моделі того, що, ймовірно, відбувається. Оптичні ілюзії - це випадки, коли два "здогадки" (моделі) відповідають одному і тому ж поясненню, і мозок не може визначитися, тому він перемикається між ними. Усі органи чуття надходять до мозку вже закодованими, і реально знати, як їх переживає людина, неймовірно складно . Найкраще, що ми можемо зробити, - це розумна здогадка. Всього найкращого.
A_A

11

Найбільш практична спроба, яку мені відомо, - це Вон та Бергер (2005) . Вони одночасно реєстрували вокалізації в роті за допомогою мікрофона та на черепі з домашнім віброметром. Потім вони оцінювали відповідні функції передачі за допомогою лінійного прогнозного кодування та згладжування цепстрального.


0

Перш ніж розчаруватися, дозвольте запропонувати вам спробувати інший підхід.

Як я бачу, у вас є дві дуже різні частини: знати рівняння, яке потрібно зробити (персоналізований для кожної людини), і застосувати його до певного сигналу (ваш голос).

1-а частина: модель внутрішньої системи слуху людини

Є професіонали, які працюють над тим, щоб збирати дані про це, стандартизувати цей процес тощо. Афаїк, є зусилля щодо розробки заходів та графіків поза класичною аудіограмою (яка вимірює повітряні та кісткові сигнали). Деякі з них є "тестами прослуховування" (більш суб'єктивними, але й цікавими).

Вирівняйте цих професіоналів. Якщо ви стежите за їх роботою, вам просто потрібні їх результати. Нехай вони роблять важкий підйом. Вони знають свою частину, яка зайняла в них десятки років розслідування. Вони просуваються в потрібних знаннях. Що таке: свого роду аудіограма для вимірювання того, як хтось чує "всередині". Б'юсь об заклад, вони так графікують. І вам просто потрібен той графік.

2-а частина: моделювання

Я зробив щось подібне до того, що ви намагаєтеся зробити. З аудіограми будь-якої людини ви можете почути самостійно, як він / її. Це робиться за допомогою ffmpeg. Перевірити це можна тут: comomeoyes.com

В основному ви записуєте свій голос, і алгоритм вирівнює його з вашою персоналізованою аудіограмою. Таким чином, ви можете ввести аудіограму людини зі зниженням слуху і слухати, як він / вона вас чує.

Я розумію, ви хотіли б зробити те саме, але з іншою аудіограмою, яка моделює, як внутрішня слухова система вирівнює звук.

Гадаю, що така аудіограма вже може існувати, і аудіологи, медики, лікарі з оториноларингології, дослідники тощо можуть обговорювати те, які саме акустичні тести потрібно зробити, щоб отримати необхідні дані для моделювання корисного графіка з вимірювань.

Удачі. Ваша спроба може допомогти іншим.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.