Десь я читав, що музика в основному дискретизується на 44,1 кГц, тоді як ми можемо чути лише до 20 кГц. Чому це?
Десь я читав, що музика в основному дискретизується на 44,1 кГц, тоді як ми можемо чути лише до 20 кГц. Чому це?
Відповіді:
Зауважте, що обґрунтування публікується у багатьох місцях: Вікіпедія: Чому 44,1 кГц?
44,100 було обрано компанією Sony, оскільки це добуток квадратів перших чотирьох простих чисел. Це робить його подільним за багатьма іншими цілими числами , що є корисною властивістю в цифровій вибірці.
44100 = 2^2 * 3^2 * 5^2 * 7^2
Як ви помітили, 44100 також трохи вище межі слуху людини вдвічі. Трохи вище частина дає фільтри деяку свободу дій, тому робить їх менш дорогими (менше фішок відкидається).
Як зазначає Рассел у коментарях, ділимий на багато інших аспект цілих чисел мав негайну користь у момент вибору вибіркової швидкості. Ранній цифровий аудіо був записаний на існуючих аналогових носіях для запису відео, які підтримували, залежно від регіону, або NTSC, або PAL, відео специфікації. NTSC і PAL мали різні лінії на поле та поля в секунду, коефіцієнт LCM (разом із зразками на лінію) становить 44100 .
Швидкість Nyquist вище, ніж удвічі більша смуга частот сигналу базової смуги, який ви бажаєте зробити без двозначності (наприклад, згладжування).
Вибирайте вибірку з меншою швидкістю, ніж удвічі 20 кГц, і ви не зможете визначити різницю між дуже високими та дуже низькими частотами, лише переглядаючи зразки, завдяки псевдоніму.
Додано: Зауважте, що будь-який сигнал кінцевої довжини має нескінченну підтримку в частотній області, тому не є строго обмеженим діапазоном. Це ще одна причина, для якої потрібно відібрати вибірку будь-якого нескінченного джерела звуку трохи вище, ніж удвічі найвищого спектра частоти (в сигналі базової смуги), щоб уникнути значного згладжування (крім лише причин відключення кінцевого переходу фільтра).
В основному, пропускна здатність вдвічі є загальною вимогою до вибірки сигналу, таким чином, кГц - мінімум. Потім ще трохи корисно впоратися з недосконалою фільтрацією та квантуванням . Деталі випливають.
Теоретично вам потрібно не те, що потрібно на практиці. Це стосується цитати (приписується багатьом):
У теорії немає різниці між теорією та практикою. На практиці є.
Я не є спеціалістом у галузі аудіо, але мене пройшли навчання якісними людьми відбору звуку / стискання звуку. Мої знання можуть бути іржавими, прийміть це обережно.
По-перше, стандартна теорія вибірки працює за деякими припущеннями: лінійними системами та інваріацією часу. Тоді, як відомо, теоретичне явище безперервної смуги, теоретично, може бути вибіркове приблизно вдвічі більше пропускної здатності (або вдвічі більше максимальної частоти для сигналів базової смуги) без втрат. Частота "Найквіст" часто визначається як:
мінімальна швидкість, з якою сигнал може бути відібраний без введення помилок
Це частина аналізу "теореми вибірки". Важливим є "може бути". Є частина синтезу: безперервний сигнал " можна реконструювати" аналогічно за допомогою кардинальних синусів. Це не єдина методика, і вона не враховує низькочастотну попередню фільтрацію, нелінійні (такі як квантування, насичення) та інші коефіцієнти часового варіанту.
Слухання людини - це не проста тема. Прийнято вважати, що людина чує частоти від 20 Гц до 20 000 Гц. Але такі точні межі у Герца не є рисою природи для всіх людей. Поступова втрата чутливості до більш високих частот часте з віком. З іншого боку:
В ідеальних лабораторних умовах людина може чути звук аж до 12 Гц і до 28 кГц, хоча поріг різко зростає на 15 кГц у дорослих
Слух не лінійний: є пороги прослуховування та страждання . Він не інваріантний за часом. Є маскуючі ефекти як за часом, так і за частотою.
Якщо діапазон від 20 Гц до 20 000 Гц є загальним діапазоном, а теоретично 40 000 Гц теоретично вистачить, потрібно трохи додатково впоратися з додатковими спотвореннями. Основне правило говорить про те, що на 10% більше нормально (в пропускну здатність сигналу), і 44,100 Гц це просто робить. Це сягає кінця 1970-х. Чому не використовується 44 000 Гц? В основному завдяки стандартам, встановленим популярністю компакт-дисків, технологія яких як завжди базується на компромісі. Крім того, 44 100 - це добуток квадратів перших чотирьох простих чисел ( ), отже, є невеликі коефіцієнти, вигідні для обчислень (як FFT).2 2 × 3 2 × 5 2 × 7 2
Отже, від до (і кратні), ми маємо баланс безпеки, квантування, зручності використання, обчислень та стандартів.44,1
Існують і інші варіанти: наприклад, формат DAT був випущений з вибіркою 48 кГц, спочатку складною конверсією. 96 кГц обговорюється щодо квантування (або бітової глибини) у якій швидкості вибірки та глибині біта я повинен використовувати? Це суперечлива тема, див. 24-бітні 48кГц-вірші 24-бітні 96 кГц . Наприклад, ви можете перевірити вибіркові ставки Audacity .
Чому саме 44,1 кГц вже відповіли - але зосередитись на аспекті вашого питання, що стосується межі людського сприйняття, причина досить проста.
Роздільна здатність в часі має бути достатньо тонкою, щоб можна було генерувати всі можливі форми хвиль до межі, яка відчутна. Відповідно до теореми вибірки , роздільна здатність повинна бути такою, щоб частота вибірки була щонайменше вдвічі більшою за цю частоту. Інтуїтивно, на найвищій частоті, вам потрібно щонайменше 2 бали, щоб представити максимум і мінімум вашого сигналу - даючи цю квадратну хвилю Ассі-арт:
_ _
|_| |_
Щоб вірно відтворити сигнал, чим швидше швидкість вибірки, тим краще. Вибрано ~ 40 кГц, оскільки більшість людей не можуть визначити різницю (при реконструкції) це низька швидкість вибірки. Коли було введено вибірку аудіо, пам'ять і зберігання були дорогими, а більш високі показники вибірки були недешевими.
У подвоєній верхній межі слуху людини два зразки на цикл є дуже поганою реконструкцією, навіть якщо вони відповідають критеріям Найквіста для відбору пробних сигналів, проста діаграма із зображенням синусоїди з двома зразками на цикл покаже вам, наскільки бідними є два зразки за цикл у відтворенні форми хвилі. Ви можете буквально перетворити синусоїду в квадратну хвилю; це гарна річ на 20 кГц ніхто не може сказати. Я думаю, що собака могла хоч.