Ответить на тему  [ Сообщений: 2 ] 
Как распознать диск CD, записанный из файлов MP3 
Автор Сообщение
Активный участник
Аватара пользователя

Зарегистрирован: 12 янв 2009, 21:23
Сообщения: 278
Откуда: Одесса
Ответить с цитатой
Введение:
Не секрет, что сейчас вся Сеть наводнена mp3 и ему подобными извращениями (в дальнейшем, я буду называть lossy-форматы словом фарш). Естественно, что возникает великое искушение для пиратства --- накачать фарша, потом сделать из него AudioCD и продавать по соответствующим ценам. Далее, несчастный потребитель покупает этот CD, думая, что имеет на нём точную копию, но увы --- это всего лишь декодированный в WAV фарш, а, следовательно, о сохранении оригинального спектра можно забыть. 

Данная статья посвящена тому, как можно попытаться отличить подделку от нормального CD-DA-релиза. Итак, приступим.

О mpeg-сжатии звука:
Для начала немножко теории и математики (если Вы не профессионал, а просто хотите пользоваться готовым рецептом, который работает, этот абзац можете смело пропустить). Грубо говоря, первое, что происходит при кодировании в фарш --- так это разложение сигнала по гармоникам (для mp3 это обычное преобразование Фурье, но могут использоваться и другие базисы). Тем самым звуковой волне cопоставляется набор коэффициентов Фурье, которые, как мы знаем, стремятся к нулю. Идея проста: давайте возьмём и часть коэффициентов выкинем (от этого мало что изменится, тем более, что высокие частоты человеческое ухо слышит обычно хуже). Это и есть главное место, где теряется информация (само преобразование Фурье как таковое --- это изоморфизм и потому обратимо). После этого коэффициенты округляются и сжимаются другими алгоритмами (при этом уже потерь данных не происходит). При декодировании проводится обратное преобразование Фурье, и перед нами предстаёт почти что исходная волна (правда, со срезанными высокочастотными гармониками). То, на сколько сильно рубят верхние частоты, определяет битрейт (чем выше битрейт, тем, как правило, граница обрубания выше).
 
Сравнение различных типов битрейтов:
Какие битрейты были заготовлены для теста: 

А теперь попробуем узнать, что происходит со спектром, т.е. с частотами, если звук из нормального состояния перекодировать в формат mp3. Узнав какой спектр соответствует какому битрейту, мы даже сможем узнать какой примерно битрейт использовался в данном аудиодиске/треке? Я думаю догадаться не сложно что для этого нужно.… Догадались? 
Я взял оригинальный Audio CD и скопировал один и тот же трек в формат mp3 разных битрейтов. Также для наглядности была сделана копия в несжатом формате – wav. После чего, все скопированные треки были записаны на диск и проверены программой Tau Analyzer. По подробнее. 
Копировались треки в наиболее часто встречающиеся постоянные битрейты (CBR): 96, 112, 128, 160, 192, 224, 256, 320 kb/s; переменные битрейты 3 уровней качества: VBRLQ (low quality. среднее значение 131 kb/s), VBRMQ (mediumquality. среднее значение 177 kb/s), VBRHQ (high quality. среднее значение 287 kb/s). 
При копировании было установлено максимально качественное качество кодирования. 
Для всех VBR: минимальный уровень 32 kb/s, максимальный - 320 kb/s. 
Конкретно для каждого VBR уровень качества в соответствии с 10 бальной шкалой (применяется в WinAmp и др. программах): VBR HQ – 0,VBR MQ – 5, VBR LQ – 9. 
Скопировав и запустив программу для записи CD (использовал Nero Burning ROM 6.3.1.6), выбираем запись Audio дисков. Добавляем все треки в mp3 формате, также не забываем про нашу wav версию. Пишем. После записи включаем Tau Analyzer и начинаем проверку. 

Результаты сканирования: 

Результаты показали то, что и следовало ожидать, даже больше. Все заведомо сжатые треки программа распознала, т.е. справилась со своей прямой задачей. 
Спектрограммы и Амплитудно-Частотные Характеристики (которые также поставляются с этим описанием в графических форматах .jpg) показали следующее (здесь приведены урезанные изображения, а именно - спектрограмма только одного канала. Справа – шкала в kHz): 

CBR 96 kb/s - Подходит только в качестве ознакомительного материала, с последующим получением (скачиванием или приобретением) более качественного звука. Звук жестко срезается на 11,2 kHz:



CBR 112 kb/s – Что-то среднее между 96 и 128 kb/s. Встречается очень редко (поэтому и был включен в тест) - в основном это старые mp3, кодировавшиеся еще в конце 90-х. Звук жестко срезается на 12,5 kHz:



CBR 128 kb/s– Помните такие слова: "mp3 с битрейтом в 128 kb/s теоретически соответствует CD качеству"? Может теоретически и так, но практически… Звук жестко срезается на 14,0 kHz



CBR 160 kb/s – Уже более-менее терпимо. Этот битрейт, в общем-то, может занять место в вашей коллекции, хотя все равно он не является качественным. Его часто используют для записи радиомиксов ди-джеев, где большего и не надо. Звук срезается на 16,5 kHz, из которых 0,5 kHz занимает легкий "пушок"



CBR 192 kb/s - Качество нормальное. Видно, что он как бы состоит из битрейта 160 (в роли основания), и некоторого не густого слоя «добавки». Такой битрейт считается оптимальным по соотношению качество / размер. Также является самым подходящим для кодирования записей с виниловых пластинок, которые не способны воспроизводить (точнее на которые, в силу законов физики, нельзя записать) звук выше 20 kHz. Соответственно все что вы увидите в такой записи выше – это шумы и трески. Если это ненужный материал, то зачем же его держать? Звук "заканчивается" на 18,5 kHz.



CBR 224 kb/s - Качество хорошее. Данный битрейт не так распространен, как 192 или 256, он является промежуточным.
Звук "заканчивается" на 19,4 kHz.



CBR 256 kb/s - Качество отличное. Многие меломаны стремятся копировать Audio CD диск именно с таким битрейтом.
Звук "заканчивается" на 20,0 kHz.



CBR 320 kb/s - Качество максимальное для формата mp3. Бытует мнение о том, что его использовать нет смысла, ибо разницу на слух между 256 и 320 заметить невозможно. Скорее всего, из-за того, что домашняя аудиосистема среднего класса воспроизводит частоты 40 Hz – 20kHz. По спектрограмме очень похож на оригинальный звук (формата wav), однако, визуально различия можно заметить. Звук "заканчивается" на 21,5 kHz.



VBR LQ (131)- Качество плохое. По спектрограмме похож на 96, только файл mp3 будет занимать объем на 1/4 больше. Такое вас устраивает?
Звук жестко срезается на 11,2 kHz.



VBR MQ (177)- Качество терпимое. Наверное, по спектрограмме был бы похож на 144 kb/s (не исследовался, но в природе встречается крайне редко).
Звук срезается на 15,3 kHz.



VBR HQ (287)- Качество хорошее. По спектрограмме похож на 224, но в отличие от него, тут идет упор на то, чтобы сохранить высокие частоты, взамен слегка подрезав низкие (что это такое, и почему так делается, вы найдете в других статьях, задача которых будет рассказать, что такое пресеты кодека lame, принцип действия и для чего они нужны). Отчетливо виден срез верхних частот, да и объем mp3 файла будет на 1/4 больше.
Звук "заканчивается" на 19,5 kHz.



WAV (он же оригинал) - Качество оригинальное, т.е. без сжатия. Спектрограмма без каких либо обрывов.



Все спектрограммы битрейтов в одном изображении (использован один и тот же фрагмент трека).



Вместо заключения еще пару фактов и мифов

Существует миф о том, что если в базе данных об AudioCD FreeDB и CDDB нет информации о диске, то диск является пиратским или разжатым с mp3. Это не так! Во-первых, эти базы не являются официальным источником информации, т.е. они составлены простыми пользователями, такими же, как и мы, поэтому в ней всегда полно ошибок, неточностей, а иногда и есть записи о пиратских бездарно составленных сборниках. А во-вторых, тот факт, что существуют программы, которые могут использовать FreeDB и CDDB для mp3 записей, например Tag Scanner.

Некоторые лицензионные диски, программа может распознать как разжатые с mp3. Но это не так. Дело в том, что действительно существует так, что фирма выпустила некачественный материал. Например, в студии несовременная аппаратура, либо записи очень старые и их решили почистить от шумов и тресков. Возможно, есть еще какие-либо причины этого. Также не стоит подозревать в mp3-шном происхождении диска с ди-джейским миксом. Как уже было сказано выше, в нем могли быть использованы при сведении композиций CD носители, на которых были записаны раскодированные mp3. Как это бывает? Например, данный сет ди-джей сыграл на CD (т.е. использовал CD) из-за того, что ему понравились какие-либо композиции, которых у него нет на виниле, а только в mp3 формате (полученные из интернета).Mp3 записываются на СD-R и затем используется при миксовке на CD вертушках. Вот и получается такая ситуация, что некоторые треки с хорошим спектром (на CD-R была записана композиция с другого AudioCD источника, например альбома), а некоторые с обрезанным.

В тесте было использовано:

Компакт диск формата Audio CD 2004 года выпуска, без наличия ошибок при чтении. Трек "Барбитура - Feel 4 U" продолжительностью 6 мин 07 сек.
Привод компакт дисков Mitsumi CR-487 ETE.
Программа для копирования: WinAmp 5.01. с mp3 кодеками при копировании в CBR - GoGo (after 3.0), VBR - Lame 3.90. Копировалось в stereo.
Программа для записи дисков Nero Burning ROM 6.3.1.6 Виртуальный привод Nero ImageDrive 2.27
Программа Tau Analyzer 1.2


Последний раз редактировалось _stas_ 19 июн 2009, 22:08, всего редактировалось 1 раз.



19 июн 2009, 22:02
Профиль
Новичок

Зарегистрирован: 18 ноя 2014, 09:57
Сообщения: 1
Ответить с цитатой
Вся гадкость сжатия по алгоритму mpeg - это далеко не только обрубание высоких частот. На старых записях винила тоже высоких частот не очень много, но от этого они вовсе не звучат плохо.

Насколько мне известно, для уменьшения размера файла применяется ещё сжатие динамического диапазона громкости звука, с вытекающими отсюда повышенными шумами квантования. Но и это ещё не всё. На мой взгляд, самое убийственное для звука в этом алгоритме сжатия - это применяемое прорежение спектра. Что это означает? Как было сказано выше, звуковой поток делится на некоторые промежутки (фреймы), к которым в отдельности применяется преобразование Фурье для разложения этих кусочков на гармоники со своими весовыми коэффициентами, т.е. получают вектор коэффициентов ряда Фурье. В этом ряде ищутся гармоники с близкими значениями частот, но разными по амплитуде. При этом гармоника с более высокой амплитудой как бы маскирует звучание гармоники с более низкой амплитудой. А раз маскирует, значит эту другую гармонику, которая с меньшей амплитудой, можно убрать из спектра. Всё это рассчитывается по определённым кривым маскирования, форма которых взята из усреднённых психоакустических тестов. Т.е. амплитуда гармоники не вылезла за значение кривой маскирования, значит её убирают. Понятное дело, что при понижении битрейта таких гармоник убирается всё больше, т.к. требования к количеству гармоник по отношению к кривым маскирования понижаются.

Необратимая потеря этого метода состоит в том, что слух у всех людей разный, и маскировка сигналов для них происходит по-разному. К тому же, если гармоника явно не слышна, это вовсе не означает, что она не даёт свой вклад в печатление от звука. Неизведанных мест в теории психоакустики ещё целый воз и маленькая тележка. Никто никогда не задумывался, почему человек не слышит частоты ниже 16...20 Гц, даже если их амплитуда огромна? Вы думаете барабанная перепонка не колышется? Ещё как колышется.

Прорежение спектра сигнала даёт максимально негативный эффект в области верхней середины и ВЧ, ну т.е. там, где более плотный спектр и там где ухо очень чувствительно (на НЧ ухо менее ко всему чувствительно, на этих частотах человек даже не слышит стереэффекта). От этого звук становится более тембрально бедным, сухим, металлическим. Высокие частоты в музыке вообще превращаются в какое-то шуршание (правильно, из них все соки выжали). В связи с этим, при воспроизведении mp3-музыки можно получить довольно парадоксальные эффекты (из своего опыта). Это когда выкручиваешь эквалайзером максимальное усиление высоких частот, и они вроде бы громко звучат, но при этом в мозгу остаётся стойкое ощущение, что субъективно их всё равно очень мало и при этом они давят на уши. И никак сначала не поймёшь в чём дело. А дело в бедном спектре. Кстати, про давит на уши, т.е. про неприятные ощущения. Хотите хорошее сравнение? Всем доводилось слушать чистый тон звука, хотя бы в школе на уроке физики? Ну т.е. одну единственную гармонику? Все помнят как этот звук неприятен и давит на уши? А вот если к этому тону добавить несколько других гармоник (по частотам), то неприятный эффект мигом исчезает. Тембрально богатый звук всегда приятнее тембрально бедного.


18 ноя 2014, 11:42
Профиль
Показать сообщения за:  Поле сортировки  
Ответить на тему   [ Сообщений: 2 ] 

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Создано на основе phpBB® Forum Software © phpBB Group
Designed by ST Software.
Русская поддержка phpBB
[ Time : 0.096s | 11 Queries | GZIP : Off ]