Дійсно, той факт, що файли вже стиснуті, не є вирішальною проблемою. Це так: стиснення в цілому може працювати лише в тому випадку, якщо в даних є якась надмірність . Це практично завжди відбувається для нестиснених файлів - однак, це не обов'язково очевидно, що таке надмірність. Алгоритми стиснення загального призначення в основному націлені на те, що очевидно в текстових файлах: багато слів з’являються не один раз, а багато разів в однаковій формі, можливо, фрази слів можна поєднувати і т. Д. Тощо. Алгоритми досить непогані узагальнюючи це на що завгодно, від списків телефонних номерів, кодованих ASCII, у китайській поезії до двійкового машинного коду, але вони не можуть працювати для будь -яких даних. Зокрема, медіафайли - це концептуальноаналогові дані в галасливому цифровому зображенні. Це означає, що насправді взагалі не існує жодного виду скорочення текстових файлів: деякі мотиви можуть повторюватися, але завжди з дещо іншою конфігурацією шуму датчика. Ось чому всі стислі формати зображення / AV використовують певно вибране перетворення як перший крок кодування, як правило, заснований на DCT або вейвлетах . Ці перетворення, грубо кажучи, переміщують частини зображення та частини шуму в різні місця, тому вони можуть бути добре відокремлені, і при стисненні втрат ви зберігаєте лише ту інформацію, яку ви вважаєте найбільш важливою, яка не включає шум, тоді як " хороша інформація "має багато надмірності. (Це насправді не так, як це працює, але начебто.)
Якби компресори загального призначення використовували ці перетворення, ефект був би протилежним: більшість цифрових відомостей насправді було б класифіковано як якийсь шум, оскільки йому не вистачає «гладкої» структури, яку ви знайдете в аналогових сигналах. А після стиснення відео з втратами, очевидно, ні аналогової гладкості, ні цифрового повторення не знайти більше (якби це було, кодеки використовували б інший етап bzip або щось таке!)