Чи є якісь математичні переваги для більш високих показників вибірки?


18

Зважаючи на те, що більшість людей так і не чує стільки частот вище 20 кГц, я ніколи не розумів точних аргументів щодо використання частоти дискретизації вище 48 кГц. На 48 кГц я розумію, що простіше побудувати фільтр низьких частот з трохи більшою пропускною здатністю для видалення збитку, але я не розумію, чому хто-небудь хотів би записати на 96 кГц.

Для проектів, які мають суто цифровий характер, тобто використовують чистий цифровий синтез і не записують жодного матеріалу, який би перетворився з аналогового -> цифрового, чи є якась перевага у використанні частот дискретизації вище 44,1 кГц?

У всьому іншому, чи є взагалі якась користь від використання 96 кГц? Чи корисно це в подальшому застосуванні певного типу операцій DSP? Або це суто плацебо ефект для вуха?

Примітка. Тут є інші питання, які задають питання про те, які частоти дискретизації використовувати для різних типів записуючих проектів, але тут я прошу реальних, важких фактів з будь-яких математичних чи DSP-причин, що підтримують використання більш високих частот вибірки.

Відповіді:


19

Я завжди використовую подвійні показники вибірки, якщо це можливо, з двох важливих причин.

Перша причина: позбутися характеристик антивізійного фільтра при роботі з аналоговими джерелами звуку. Що таке фільтр проти зображень?

Скажімо, я записую на 44100 Гц.
Якби я записав синусоїду менше 10 КГц, ви змогли б чітко побачити синусоїду, коли побудуєте в графіку зразкові значення.
Якщо я вибираю синусоїду 0dB FS з частотою 22,5 кГц, зразки читають 1 і -1 по черзі.

Тепер ось проблема. Якщо я записую синусоїду 0dB FS з частотою 30 кГц і будувати зразки, кожен зразок займає більше половини синусоїдального періоду, і - якщо ви відтворюєте зразки - він повертає синусою 11 кГц. (Якщо ви мені не вірите, просто зробіть простий малюнок.) Така поведінка називається "ефект зображення".

Це означає, що перед вибіркою сигналу ми маємо бути впевнені, що немає частот, присутніх вище, так званої "найквістської частоти" (що становить половину швидкості вибірки). При використанні цифрових джерел звуку, які надають звуки вже відібрані, це насправді не так вже й велика справа, оскільки їх іноді просто можна запрограмувати, щоб ніколи не генерувати сигнал, що перевищує половину частоти дискретизації, або вони можуть фільтрувати все за допомогою лінійної фази цегляний стіновий фільтр, який не впливає на решту.

Але, якщо ви відбираєте сигнал з аналогового джерела, ця фільтрація проводиться до того, як сигнал буде відібраний. Єдиний спосіб фільтрувати аналоговий звук - це використання електронної схеми. А оскільки фільтр повинен мати дуже круту криву, він впливатиме на частоти в межах чутного діапазону , навіть якщо фільтр не був призначений для нього. Зараз у A / D-перетворювачах є досить хороші фільтри, тому проблема мінімальна, але слухати її стає відносно дратує, коли ви кілька днів працюєте на аудіо 44,1 КГц, порівняно з використанням 96 КГц. Фільтр, який буде застосовано при зменшенні зразка 96 назад до 44.1, звичайно, є цифровим фільтром і, ймовірно, набагато кращої якості. І він застосовується лише тоді, коли ви повністю виконаєте всі роботи, тому це вам не набридає.

Друга причина: позбутися характеристик сигналу замирання.

Коли ви записуєте з роздільною здатністю 24 біт і плануєте мати свого майстра на 16 біт, вам знадобиться сигнал затухання, щоб замаскувати помилки округлення. Тепер шум - це не дуже приємна річ у вашій записі, і хоча широкосмуговий шум найкращий для маскування помилок округлення, формування шуму може бути великим поліпшенням, що застосовується до сигналу замирання, щоб зробити його менш тривожним. Тепер, якщо запис був зроблений за допомогою 96 кГц, ви можете перетворити шум у форму більшості замираючого сигналу на частотах, що перевищують 24 кГц, тому їх ніхто не почує. Шум тремтячого звуку в кінці запису остаточно відфільтрований, в той момент, коли ви зменшуєте вибірку свого проекту до 44,1 КГц.

Отже, підсумки: чи корисно це під час запису аналогових матеріалів:

  • Однозначно так. У вас менше збурень від антивізійного фільтра і менше збурень від сигналу замирання при використанні при правильному формуванні шуму.

Чи корисно це при роботі з цифровими речами, які підійшли до мого softsynth?

  • Так, все ще корисно, якщо ви плануєте працювати з 24 бітами та освоювати їх до 16 біт. Ви можете багато чого отримати від шуму, що формує сигнал замирання.

"оскільки вони іноді можуть бути просто запрограмовані, щоб ніколи не генерувати сигнал, що перевищує половину частоти дискретизації. Але, безумовно, правда: " або вони можуть відфільтрувати все, використовуючи фільтр цегляної стіни лінійної фази, який не впливає на решту " Я не впевнений, що це можливо. Для того, щоб відфільтрувати ультразвук з хвилі, що генерується в цифровому режимі, вам потрібно буде згенерувати його на більш високій частоті вибірки в першу чергу (що все-таки буде псевдонімом, але не настільки, як у звуковій смузі). Ви не можете фільтрувати частоти, які вже є псевдонімом.
ендоліт

3
"Тепер, якщо запис був зроблений за допомогою 96 кГц, ви можете перетворити шум у формі більшості тремтячого сигналу на частотах, що перевищують 24 кГц, так що ніхто їх не почує. Шум тремтячого в кінці запису остаточно відфільтрований, в той момент, коли ви зменшуєте вибірку ваш проект повертається до 44,1 КГц. " Я також не думаю, що це правильно. Якщо ви відфільтруєте всю жиру, то на вашому виході більше не буде жодної тріщини? Це повернеться до спотворення квантування?
ендоліт

Знову перший коментар: Ви абсолютно праві. Я думаю, що я мав на увазі сказати, що коли ви використовуєте цифровий ефект, ви можете очікувати, що слід потурбуватися про частотний діапазон його виходу. Якщо говорити так, якщо вихід виходить з псевдонімом в першу чергу, збільшення частоти вашої власної вибірки не змінить це. Щодо вашого другого коментаря: цікаво; він повністю залежить від фільтрів, що використовуються до попереднього сканування. Якби шум був зображений назад, він, очевидно, маскував би квантовий шум, але він би не звучав точно так само. Думаю, я міг би сформувати свій шум навколо остаточного найквістського частування
The Pellmeister

1
Деякі види операцій можуть перетворювати частотні компоненти вище 24 кГц в частотні компоненти нижче 20 кГц і навпаки. Якщо звук не зберігається зі швидкістю вибірки між першою та останньою такою операцією, втрата інформації на проміжних стадіях може мати чутний вплив на кінцевий вихід.
supercat

12

Для проектів, які мають суто цифровий характер, тобто використовують чистий цифровий синтез і не записують жодного матеріалу, який би перетворився з аналогового -> цифрового, чи є якась перевага у використанні частот дискретизації вище 44,1 кГц?

Так. Деякі приклади:

Створення частот, які ви не хочете

Збудження від цифрового синтезу

Багато генераторів квадратних / пилоподібних / трикутних хвиль написані наївно, оскільки вони створюють нескінченну кількість гармонік, які відчужуються і звучать явно погано . ( ..., +1, +1, +1, +1, −1, −1, −1, −1, ...це не правильна квадратна хвиля, і спотворені гармоніки видаватимуть звуки радіостанції на задньому плані під час портаменто.)

Якщо частота дискретизації вище, цей ефект зменшується, оскільки частота випромінювання знаходиться далі від аудіодіапазону.

Звичайно, було б краще, якби генератор був написаний таким чином, що повністю виключає згладжування , але ви не завжди можете контролювати це як користувач. Навіть добре написані - це зазвичай компроміси, з "зменшеним" псевдонімом , не повністю обмеженим діапазоном, тому більша швидкість вибірки все ще допомагає.

Збудження від цифрового спотворення

Так само, коли ви використовуєте будь-який цифровий нелінійний спотворення, він створює нескінченну кількість гармонік або інтермодуляційних продуктів. Ті, які будуть вироблятися вище частоти Найквіста, насправді повертаються в чутний діапазон.

Хоча теоретично можливо спотворити обмеженим діапазоном , кодери плагінів насправді не роблять цього. Кожен плагін, який я випробовував на гітарі, має псевдонім, рівну обробку на 96 кГц.

Я не впевнений, з якою проблемою це практично. Багато речей спричиняє невеликі обсяги спотворень, як компресор чи об'єм, зникають, але кількість вже незначна, тому відчужена кількість ще більш незначна. Для сильних спотворень іноді встановлені частоти також можуть бути не помітні, оскільки вони закопані в шумі. Незалежно від цього, більша частота вибірки допоможе мінімізувати будь-які шкідливі наслідки.

Відсутність частот ви робите покупку

Інша можлива стурбованість полягає в тому, що синтезовані ультразвукові частоти можуть стати корисними згодом при обробці, навіть якщо ви не можете їх почути безпосередньо під час запису:

Зміна частоти від зміни часу

Якщо ви переймеруєте хвилю, щоб сповільнити її, наприклад, у програвачі звукового звуку, ці ультразвукові частоти стануть чутними частотами. Якби ви відфільтрували їх, щоб уникнути згладжування з меншою швидкістю вибірки, уповільнений звук не мав би високого кінця.

Спотворення / модуляція

Як було сказано раніше, спотворення створить нові частоти інтермодуляції в місцях суми та різниці від частот у вихідній записі. Цього разу ми стурбовані бажаними звуковими частотами, що виробляються викривленням / модуляцією ультразвукових частот (не пов’язаних із згладжуванням). Якщо ці ультразвукові частоти не будуть записуватись до спотворення, у виходу буде відсутня звукова частота, яку вони виробляють, і він точно не імітуватиме аналогічний аналоговий ефект.

Знову ж таки, я не впевнений, чи це практично проблема, але це, принаймні, правдоподібно, і більш високі показники вибірки, що включають ультразвукове дослідження, покращать її.

Взагалі, робота з більш високими показниками вибірки дає «запас» для запобігання проблем із ефектами та іншим чином, які можуть бути виконані неправильно. Як і фотокопіювання фотокопії, чим краща якість кожної копії, тим менше деградації буде в кінцевому продукті.

Марно для відтворення

Це не означає, що більш високі показники вибірки є хорошою ідеєю для відтворення готової суміші. Їх немає. Як описано вище, спотворення ультразвуку може видавати чутний звук, а гучномовці - найменш лінійна річ у аудіо ланцюжку, тому ви хочете усунути будь-яке ультразвук із остаточної суміші, щоб запобігти його спотворення динаміком.

Більш високі показники вибірки для відтворення музики не приносять користі; їх слід використовувати лише на етапах запису та обробки. Дивіться 24/192 Завантаження музики ... і чому вони не мають сенсу .


1
+1 для згадування неправильних генераторів квадратних хвиль. Також те ж саме можна сказати і про пиляні та трикутні хвилі ...
Відобразити назву

Цифрове підсилення на частоту до 96 КГц або вище часто допомагає для відтворення, оскільки аудіо вихід може легко утримуватись від будь-якого небажаного вмісту в діапазоні від 22 кГц до 48 кГц. Побудувати аналоговий фільтр, щоб знищити що-небудь про 48 кГц, не пошкодивши нічого нижче 22 КГц, набагато простіше, ніж побудувати один, щоб убити все вище 26 КГц, не пошкодивши нічого нижче 22 КГц. Якщо аудіо буде перетворено на 96 КГц для відтворення, а у нього - 96 КГц, то він також може тримати його на 96 КГц, а не перетворювати його та конвертувати.
supercat

@supercat Це для запису, а не для відтворення. Легко зробити надзвичайно крутий цифровий фільтр, щоб видалити все вище 20 кГц перед відтворенням. Зробити аналоговий фільтр для видалення ультразвуку перед проведенням відбору проб складно / дорого, тому АЦП використовують передискретизацію із значно більшими швидкостями (МГц), а потім використовують цифрові фільтри для видалення ультразвуку та перетворення їх до нормальної швидкості, наприклад 96 кГц.
ендоліт

5

Теоретично (і практично) вагомий привід мати більш високий показник вибірки, ніж удвічі більше, ніж межа слуху людини.

Причину цього легко візуалізувати, порівнюючи з редагуванням зображень - якщо у вас є лише зображення 800x600 px із загальним знімком цегляної стіни з високим контрастом, риб'ячої сіткою, смугастим текстилем чи іншою тонко розташованою текстурою з високим контрастом, ви можете лише обертати 45 ° кратні, не викликаючи ефекту муару і розмивання деталей. Що стосується звуку, спотворення, що виникають при редагуванні, мають різні терміни, але застосовуються ті самі принципи теоретичної вибірки теорії Найквіста-Шеннона. Згладжування - це більш вживаний термін, ніж «ефект зображення», якщо вибірковий звук має вміст частоти вище половини частоти дискретизації (називається частотою Найквіста).

На практиці, як уже пояснив Пелле десять Кейт, фільтр із низькопрохідною цегляною стіною недосяжний, але завжди є деякий градієнт (ухил) на відрізаному.

Ще одна вагома причина для запису з більш високою частотою дискретизації - це досягнення більш точного стереообразу, оскільки слух людини значною мірою покладається на невеликі різниці в часі (приблизно 5-20 мс, а фізично це різниці фаз) між вухами для локалізації джерел звуку. Голову "тінь" та інші аспекти також грають роль.

При частоті дискретизації аудіо компакт-дисків 44100 Гц кожен зразок представляє 22,6 мікросекунд, і, наприклад, один період частоти 882 Гц має 50 зразків. Крім того, досить велика затримка в 20 мс затримки триває 50 зразків. Отже, лише 25 зразків на цій середній частоті означають скасування фази на 180 °.

Отже, частота дискретизації 44,1 КГц є досить хорошою, але насправді не має великого запасу для редагування.

Ще одна річ, про яку слід пам’ятати, - це використовувати відшарування (так само, як і для редагування зображень), щоб запобігти шуму квантування. А далі ви запитаєте, чи слід використовувати 24-бітове квантування замість 16 біт ...?


Чи було показано, що ультразвук все ще впливає на наше стерео сприйняття, хоча ми не можемо свідомо його чути?
ендоліт

1
Ні, вплив міжвузних різниць у часі на стереообразування найбільше впливає на низькі частоти (нижче 1500 Гц), де відстань вух коротша за довжину хвилі, тому існує різниця фаз. На більш високих частотах різниця в рівні звуку більше впливає на локалізацію звуку. Дивіться: en.wikipedia.org/wiki/Interaural_time_difference#Duplex_theory
peterhil

4

Ще одна вагома причина використовувати більш високий показник вибірки - це подолати недоліки в реалізації плагінів. Багато авторів плагінів неправильно враховують ефекти нелінійних сигнальних операцій, що розширюють пропускну здатність, і, як результат, ви можете отримати ефекти відчуження, перш ніж виходити з поля.

Наприклад, компресор - це в основному підсилювач, керований напругою ... він множує один сигнал (звуковий сигнал) на інший сигнал (посилення). Множення 2 сигналів також відоме як кільцева модуляція або гетеродінінг; це призводить до отримання сигналів суми та різниці двох входів. Якщо ви помножите синус 15 кГц на синус 10 кГц, ви отримаєте вихідний сигнал, який містить 5 кГц і 25 кГц. Якщо коефіцієнт посилення компресора має дуже швидку атаку, а вхідний сигнал має широку пропускну здатність, компонентний сигнал "сума" може легко переходити межу Fs / 2 на тимчасовій основі, що призводить до помилкового згладженого низькочастотного сміття у вашому виході сигнал.

Справжнє виправлення цього полягає в тому, щоб плагін був реалізований за допомогою внутрішньовигульованої внутрішньої вибірки, але якщо ви не можете цього зрозуміти, наступне найкраще - запустити систему на максимальній висоті FS. У вас не буде жодного фактичного аудіовмісту в стратосфері, але ви захищені від того, щоб плагін міг пройти через межу.


2

Для чого це варто, математичне обгрунтування, принаймні, для потреб аудіосвіту, як правило, описується теоремою вибірки Найквіста-Шеннона , іноді просто називається теоремою Найквіста, яка в основній мові просто говорить про те, що повністю відтворити форма хвилі з максимальною частотою n Гц, вам потрібно 2n зразків в секунду.


1
Так, але Nyquist-Shannon використовує фільтри з цегляної стіни, що фізично неможливо.
ендоліт

1

Під час запису з кількох треків я вважаю, що глибина біту важливіша за швидкість вибірки.

Так, наприклад, 24-бітним було б краще, ніж 16-бітовим. Це пов'язано з тим, як ваші доріжки змішуються між собою, і щось, що називається "помилки округлення", коли недостатньо бітів.

Більшість апаратних та програмних засобів тепер можуть легко підтримувати 96k і 24bit, тому реально не потрібно погоджуватися на менше.

Зважаючи на це, ви, очевидно, можете зробити якісний запис, використовуючи старіші обладнання 16 / 44.1.

Це більше про талант, ніж про обладнання.


2
Хоча це не відповідає дійсності, робота з 24 бітами вказує на той недолік, що вам доведеться використовувати дитингу, якщо ви хочете повернутися до 16 біт. Шум відмирання може бути значно зменшений, якщо застосовувати сигнал 96 КГц при використанні форми шуму. (див. іншу відповідь для деталей)
The Pellmeister

1
Все професійне аудіо програмне забезпечення працює з 32 або 64 бітним плаваючою комою внутрішньо під час суміші, незалежно від глибини біта, що використовується під час запису.
близько

3
@PelletenCate, якщо ви працюєте з 16 бітами, ви вже закручені, оскільки ви додаєте шум квантування на кожному нетривіальному кроці редагування. Це дуже неправильно, якщо випливає, що робота з 24 і більше бітами призводить до такого недоліку.
Відображення імені

Я поставив це +1. Я не повинен описувати це як недолік, тому що це не так. Однак я мушу сказати, що і квантовий шум, і несформований шум гудіння звучать на суміші 44/16. Моя думка полягає в тому, що перемикаючи на 24 біти, ви даєте собі можливість змінити одну проблему (шум від квантування) на іншу (шум дихання), який можна ефективно зменшити, записавши більш високу частоту вибірки.
The Pellmeister

0

"... реальні, важкі факти з будь-яких математичних чи DSP-причин, що підтримують використання більш високих показників вибірки."

Так звані реальні факти походять від справжніх інженерів-аудіо, є можливість знайти їх декілька, але, швидше за все, швидше шукати в Інтернеті статті, написані власне інженерами. Просити тут означає, що ви погоджуєтесь на нас, я не є інженером по звуку, але можу використовувати засоби пошуку.

Щось, що слід врахувати, - це ваш звуковий підлогу. В інших відповідях йдеться про те, як ви можете додавати шум і згадувати помилку замирання та квантування, але найближчим до будь-якої іншої відповіді, що стосується згадки про підлогу, був цей примх: "... іноді встановлені частоти також можуть бути не помітні, оскільки вони закопані в шумі. ".

Якщо ви записуєтесь на будівельному майданчику, залізничному вокзалі чи суднобудівному заводі, ви можете коштувати дешево і записувати на 44.1, якщо ви не прагнете досконалості - інакше так само, як і відео, це 4: 2: 2, а не 4: 2: 0, так це для Більше аудіо Біт, але не більше 32 (для ВАС, внутрішньо в Програмному забезпеченні більше 32) і більш високий рівень дискретизації, але не більше 96 кГц (знову ж таки для Вас, використовуйте внутрішньо Програмне забезпечення та обладнання, яке працює з більш високою частотою вибірки).

Спробуйте в цих статтях, щоб розпочати пошук поради інженера - ви б не відвідували legaladvice. stackexchange для критичної інформації, тому навчіться вчитися, в кінцевому рахунку це те, наскільки ви дбаєте, наскільки турбується ваша аудиторія, рівень вашого майстерності та що ви можете собі дозволити.

Чому 88.2 - http://www.soundonsound.com/sound-advice/q-why-882khz-best-sample-rate-recording

Чому 24/96? - http://www.premiersoundfactory.com/modules/pico/content0035.html

Багато місць в Інтернеті, включаючи безкоштовні онлайн-курси.

Коротка версія - так, є причина, і це важкий факт - не кидайте помилок на початку і сподівайтеся, що їх обрізати пізніше, ви б не хотіли, щоб хтось говорив, коли ви намагаєтесь записати чи незнайомих людей, що пробігають постріл. - все ж є відео, у яких є і те, і багато пальців вгору.

Пам'ятайте, що хак потрібно запам’ятати - це голосний запис без відсікання за найвищими витратами, які ви можете собі дозволити (час, місце для зберігання, вміння, гроші та тип введення даних (IE: Будівельний майданчик), аудиторія) та порубайте найтихіші нюанси за допомогою шумозахисту, щоб позбутися кволий квантування та шум гудіння (що ви, можливо, ніколи не помічали, поки ми не згадали про це).

[Написано з наміром бути простою відповіддю без фактичних помилок і не має на меті образити прихильників аудіо або професійних аудіоінженерів]

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.