Pull to refresh

Comments 92

UFO just landed and posted this here
Предлагаю провести совершенно ненормальный, но тем не менее наглядный
Наглядный, но тем не менее абсолютно некорректный.
Простите, но я и сам писал про его абсурдность.
Статья опоздала где-то лет на десять :)

Самый лучший формат хранения — mp3 320кбпс, так как и качество ок и открывается везде вообще где можно представить и размер уже не имеет значения.
имхо, mp3 V0 получше будет в отношении размер-качество
забавное сравнение. для себя я выбрал огг-320для плеера и лосслесс-форматы для дома.
и, кстати, пишется «lossless»
<grammar_nazi>Всё верно. Маленькое примечание: по правилам русского языка «сс» должно редуцироваться до одиночного «с» (лослес-форматы, лослес-кодирование; аналогично: твитер, не «твиттер»).</grammar_nazi> :)
Ну что Вы, это ж русское слово, наше, родное :)
А я про конкретный контекст: в русскоязычной традиции заимствований, как правило двойные согласные из языка-оригинала редко переходят (редкие исключения: масса, тонна, касса, гамма).
На этом хочется остановиться и не превращать Хабр в Special Olympics ;)
После того как я переводил технический текст, стал писать «рекомендации» с двумя «м» и еще парочку слов неправильно.
и еще парочку слов неправильно.

«аддресс» и «пасспорт»?
Не совсем) В адресе иногда порываюсь написать два «с», а еще «программу» пытаюсь с одной «м» написать порой.
Спасибо за замечание, исправил.
Fraunhofer IIS лучший энкодер мп3. лично сравнивал с lame.
Качество звучания между двумя этими кодировщиками сильно различается.
У Fraunhofer'a все кристально чисто на тех битрейдах где у лэйма плавают и звенят верхи. разница перестаёт ощущаться от 320 и выше.
UFO just landed and posted this here
согласен. Нужно искать декодер, который понимает этот ключ.
«Старый кодер OggEnc GT3 при максимальном качестве q10 обеспечивает прозрачное звучание даже после тысячи перекодирований»
Вы вначале поста говорите, что кому-то предстоит обзавестись хорошей акустикой, вы бы сами это сделали. На хороших наушниках (колонках — не знаю) уже пару раз мп3 320кбпс прогоните из лосси в лосслесс туда-сюда и уже существенная разница на лицо, или, точнее, на ухо.
Вообще-то MP3 320kbps и Ogg Vorbis q10 — это немножко разные вещи.
Я бы сказал, достаточно сильно разные.
Эксперименты конечно это всегда здорово, но тут уже начинает попахивать «британскими учеными», то есть «экспериментом ради эксперимента»: «Британские ученые скрестили слона и слона. Не для того, чтобы получить гибрид, а чиста позырить.»

Применимость полученных «знаний» стремится к нулю, несмотря на потраченное время. «Нет, такая наука нам не нужна!» (с)
Вы совершенно правы, изначально это и был эксперимент ради эксперимента. Но результаты мне показались интересными, поэтому я и опубликовал их.
я бы не сказал, что они интересны. очевидны — вот точная формулировка
Без подобного эксперимента нельзя было бы однозначно сделать выводы о характере искажений в разных форматах, например.
И из этого еще сделали выводы.
Совершенно согласен! Британские изыски. Суровые и беспощадные!
Этот тест чем-то сродни справедливо закиданному какашкми «Сравнение некоторых коллекций С++/C#/Java». Был тут такой недавно, да сплыл.
В таблице 256кбпс половина ссылок ведет на один и тот же файл.
А вообще любопытно, конечно, хотя не совсем понял, почему артефакты при 50-разовом кодировании и декодировании должны побуждать меня хранить музыку во flac. Каждый раз конвертить, когда заливаешь в телефон или плеер, мне как-то не в кайф.
Наглядно — да, только что изменится после прочтения — неясно, ведь те, кто понимает и слышит разницу — и так хранят в lossless, а кто не слышит — и будет продолжать складировать mp3…

Разницу действительно не на чем угодно и не кто угодно услышит, хотя по моей статистике при наличии техники и правильного помещения 192 vs lossless отличают почти все
Ну как минимум все смогут увидеть разницу того же 320kbps, хоть и после n-ого кодирования. А решать конечно каждый будет сам.
Сложнее продемонстрировать другой эффект lossy-кодеков — они ведь почти все основаны на аппроксимации спектра, в рассчете на то, что мозг восстановит недостающие гармоники.
А эффект состоит в том, что это лишняя работа для мозга и повышается утомляемость.

В чистом виде это проверить очень тяжело, т.к. слишком много влияющих факторов — техника, погода, решаемые задачи… Пробовал на себе — слушал несколько дней только mp3 и только lossless — разница ощутима, но эксперимент не чистый
Вот это интересно. Впервые об этом слышу. Можете подробнее написать?) Можно в личку, или в идеале — напишите топик об этом)
Это относительно известный факт среди людей, много работающих со звуком (сюда же включается чрезмерно низкое качество аппаратуры, например — большое количество наводок/шумов), но исследований вроде никто не проводил.

Ближайшая аналогия — читать книгу через грязное стекло — все видно, читается, но устанете заметно быстрее. Суть кодирования с потерями — выкидывается наименее значимая информация. Например можно в тексте постирать часть палочек у букв, а ваш мозг все равно их восстановит и текст прочитает:
это понятно, но интересно было бы почитать еще где нибудь об этом))
И вредно ли, получается, слушать постоянно музыку в мп3?)
Навскидку не смог найти достоверного источника с подтверждением или опровержением —
подобное исследование крайне не выгодно производителям mp3-плееров и прочих продавцов музыки в mp3
само ппрослушивание мп3 не вредно, при сжатии просто обрезается исходный трек. вот если слушать с помехами, тогда уши «устанут гораздо быстрее».

прослушивание музыки на плохой акустике — другой, гораздо более важный, вопрос.
Весьма интересная идея :) Никогда её не слышал.

Мне сложно представить как может проводиться такой эксперимент, но опрашивать человеков вряд ли имеет смысл — скорее, стоит считывать какие-то объективные «мозговые» показатели.
Кстати да — можно на томографе, смотреть активность мозга, только как-то нужно отличать просто мысли от искомой паразитной нагрузки (по идее другой участок будет сильнее грузиться), думаю что есть методика, вопрос только в том, достаточна ли точность измерений чтобы сделать вывод
Дело в том, что mp3 кодирование рассчитано на удаление не слышных среднестатистическому человеческому уху составляющих звукового спектра. В вашем примере я вижу покоцанный текст, а вот в mp3 я не слышу удаленных при кодировании частот, ибо не обладаю острым слухом и не должен их слышать.
И чего этой мой мозг будет восстанавливать интересно? В случае с буквами все понятно, я знаю как они выглядят и строю ассоциативные предположения. В случае с музыкой, что я буду восстанавливать? Какие гармоники? Я понятия не имею как оно звучит в lossless. Я просто слышу то, что слышу.

И почитайте теорему Котельникова
Причем тут теорема Найквиста-Котельникова? Она справедлива только для идеального ЦАП-АЦП в ваакуме с бесконечной точностью самих отсчетов, и то есть некоторые ньюансы:
ради интереса на досуге постройте график синуса с частотой Найквиста (половина частоты дискретизации) и на бумажке постройте для него дискретные отсчеты в точках n/F (F-частота дискретизации), после чего восстановите по ним исходный сигнал — будете удивлены, но получится 0, если же сдвинуть фазу синуса — то после восстановления амплитуда сигнала будет меньше и только при фазах -/+ pi/4 (с учетом периода) восстановится то, что кодировалось ;)

Но это все про PCM, а mp3 это дальнейшее сжатие PCM. И дело не только в удалении частот — существует психоакустическая кривая чувствительности слуха, в общих чертах — в районе 1 кГц максимальная чувтвительность, а вниз и вверх по спектру падает. Идея lossy кодеков в том, что там где чувствительность меньше, там можно кодировать менее точно, плюс используются эффекты маскирования частот — после преобразования Фурье выбираются гармоники с наибольшей амплитудой, а соседние — выкидываются, количество отсчетов на диапазон — как раз по кривой чувствительности.

Вот только часто выкидываются частоты, которые в состоянии легко различить подавляющее большинство здоровых людей:
(картинка отсюда)
От куда информация про мозг? Требуем пояснений, ибо все это очень смахивает на бред, рожденный британскими учеными.
это эмпирическое наблюдение, отрицать то, что в среде с помехами человек не будет больше уставать чем в среде без помех, вот это было бы бредом.
С другой стороны, lossless — это по сути содержимое компакт-диска, где тоже применяется кодирование и дискретизация и они не идеальны (дальше идёт DVD-Audio). Поэтому мозг всё равно занимается восстановлением, но уже на в такой мере как в mp3.
Да, любая оцифровка аналогового сигнала — уже большие потери, но в случае PCM их все же ощутимо меньше, главным образом теряется фазировка высоких частот (например частота 22050 Гц в CD-Audio вообще может всего только с двумя противоположными фазами быть закодирована), которая и так не сильно воспринимается ухом — мы все-таки слышим наличие и интенсивность частоты, а не ее фазу.
Гармоники же не пропадают и кроме шума квантования (который замечательно маскируют с помощью dither noise shaping) явных артефактов нет.
лишь только избранный услышит разницу, избранный
Странно как-то. Я всё кодирую через vorbis-tools посредством oggenc -q 7 (Linux). От flac не могу отличить даже на крутой акустике (медведь?). С 320 mp3 всё несколько иначе. Собственно по размеру он в 1,5 раза больше огга. Отличить тоже проблематично, но достаточно чуть понизить битрейт (хотя бы чтобы результирующий размер файла был как у oggenc -q 7) и уже слышна разница. И учитывая, что -q 7 — это не порог качества для OGG, то я однозначно за ogg.
Понимаете ли, если бесконечно долго гонять бит по кругу, он рано или поздно исчезнет.
Никто не кричит, что если соединить вместе сто патчкордов, то данные начнут пропадать, они просто для этого не предназначены, и по дну моря никто их прокладывать не собирается.
Именно поэтому единственный вывод, который я предложил — это мысль о lossless форматах. Там ведь можно хоть до посинения гонять туда-сюда любую музыку, и при этом она останется неизменной.
Кстати, а вы проверили это?
FLAC-и при кодировании/декодировании дают WAV-ы с идентичным MD5-хешем. Я проверял.
Простите, но зачем сравнивать уровень регрессивной ошибки, если все пользуются однопроходным кодированием? Сравнили бы лучше частотное распределение на разных исходниках с разным битрейтом.
Да зачем? Это уже сравнивали, и неоднократно.
А вот такое тестирование еще не проводили :)
Ну и что, что бесполезно? Зато интересно было почитать.
«Речь многих обезьян, видите ли, напоминает человеческую, записанную, значить, на магнитофонную плёнку и пущенную задом наперёд с большой скоростью».

:)
Я бы уже давно перешел на FLAC, даже специально дополнительный винт бы купил, но к сожалению, мой Tattoo и братовский SE-W610i не поддерживают этот формат. Так что ждем дальше…

П.с. AAC на Тату есть, но мне он не нравится (даже не могу объяснить чем).
Зачем вам этот формат, если ваша техника не обеспечит соответствующее качество звука?
Техника же меняется со временем — как телефоны, так и плееры. Не скачивать же заново, когда уже появится возможность услышать в лучшем качестве. Я, так же, стараюсь сливать лослесс, хоть и нет смысла в этом на колонках BBK. Знаю, что обязательно их сменю на лучшие.
Я как-то пробовал попеременно сжимать-разжимать разнами енкодерами… чтобы проявились артефакты всех сразу… забавно получилось.

Сейчас для себя разрабатываю такую систему: музыка хранится в формате FLAC на большом-большом диске. Оттуда она и слушается. Резервная копия хранится на другом физическом диске меньшего объёма в формате OGG, конвертирование происходит автоматически в фоне.
конвертирование происходит автоматически в фоне.
А как? В линуксе небось?
Да, сейчас стоит ubuntu 8.04, но решение, в принципе, переносимое.

Вдобавок к автоматичемкому конвертированию прикручена MySQL база файлов, директорий, тэгов с именами исполнителей и прочими параметрами, а также контрольными суммами файлов md5 и tth. Вы не представляете, как это упрощает и ускоряет поиск…
Отдельная база в SQL не удобнее встроенной библиотеки плеера, например, Foobar или Winamp. В Rythmbox тоже есть, но я ей не успел долго попользоваться.
Может и так, но используя MySQL я получаю переносимость, стандартные средства резервного копирования, возможность организации весьма гибких запросов. Скажем, может ли библиотека Winamp хранить, скажем, TTH-хэши мультимедиа-файлов? А ведь именно хэши зачастую являются идентификаторами файлов в файлообменных сетях.
а зачем такая резервная копия? чтобы потом ещё раз чем-нибудь пережать для прослушивания на другом устройстве? Я бы наоборот — ещё понял: под рукой хранить то, что умеет привычный плеер.
Привычный плеер умеет FLAC — его и храню под рукой.

ТАКАЯ резервная копия — разумный для меня компромисс между полным дублированием информации и полным отказом от резервной копии.
Кстати, мне все не дает покоя лослес на плеере. Хабра-меломаны, считаете ли вы это оправданным, и если да, то почему?
Для себя я решил, что раз уж почти не могу в double blind test отличить ogg v9 от флака на плеере (cowon d2 + rockbox + sennheeiser ie4), то флак там не нужен. А вот на компе все-таки слышно разницу. Поэтому на плеер заливаю перекодированный лослес, а дома слушаю на нормальной акустике флак и прочее.
Если слушать плеер в метро или другом шумном месте — то всё равно, в каком формате.
Я тоже не отличу, скорее всего, FLAC от MP3 V0, но заливаю, все равно, FLAC — мне лень гонять туда-сюда форматы.
(cowon d2 + rockbox + sennheeiser MX400 + бортовая магнитола Sony в машине)
lossless на плеере оправдан хотя бы тем что его перекодировать не нужно (при аппаратной поддержке, конечно)
Зато жрет в 5 раз больше места. У меня рокбокс хоть даже и куе-списки понимает, но я все равно перекодирую все в огг — так даже есть надежда, что когда-нибудь мне будет не лень проиндексировать всю базу музыки (40гб) на плеере. 400 гигов на компе я ни в жизнь не рассортирую.
Ну и к чему всё это?
Кто в здравом уме будет кодировать файлы по 10-50 раз?
И ещё вывод «может стать лишь одним из поводов задуматься о хранении домашней колекции музыки lossless форматах». Да никто не кодирует свою коллекцию по 50 раз, поэтому вывод не в тему. Вывод тут мог бы быть другой — «мне нечем заняться, поэтому я это всё и придумал».
Видимо, чтобы некоторые команды (lame, oggenc, oggdec) всё же выводились в stdout.
Количество скачиваний музыкальных файлов из статьи уже перевалило за 10000, так что судя по всему кому-то кроме меня это все-таки тоже интересно :)
В каком-то из топиков была ссылка на файл с синусоидой 18 КГц — взрослый не услышит. Скачали её тоже не одну тысячу раз, наверное.
тому, кто додумается так оригинально проверять качество кодеков, нужно либо не знать, что такое четность багов, либо очень нестандартно мыслить :) респект
Посоветуйте, с какими параметрами кодера можно конвертировать mono, 16bit, 44100 в mp3 с максимально возможным битрейтом? В Sound Forge максимум получается 128. Можно больше?
Попробуйте:
lame -V 0
Это должно дать наилучшее качество.
Вместо множества @ лучше сделайте echo off.
Как эксперт в области аудио, заявляю — данный тест, а соответственно и пост, что-то между абсурдом и глупостью…

Во-первых, VBR-кодирование само по себе вещь достаточно странная и имеет место быть только при ОООЧЕНЬ большом желании сэкономить немного на выходе.
Во-вторых, множественное VBR-перекодирование это уже нонсенс на грани помешательства — естественно звук будет ухудшаться с каждым проходом — логичнее было делать CBR-перекодирование и сравнивать выход.
В-третьих, накой такой тест вообще нужен с точки зрения практики? Пост напоминает скорее какие-то больные мысли и совсем не связан с заголовком. Что-то из области жёлтой прессы и псевдонаучных изысканий.
— зы: OGG уделывает старичка MP3 по всем параметрам кроме одного, технической поддержки. А то, что Вы здесь понаписали — бред!
Глупость или нет, но эксперимент уже проделан :) Зачем этот эксперимент нужен, я описал в предисловии: чтобы каждый мог услышать самостоятельно ту самую разницу на любой акустике. А почему вы — эксперт — считаете, что все это вообще не имеет права на жизнь?
Что касается CBR, попробуйте:
mp3_xcode fortuna.wav fortuna_c256x99 99 "-b 256"
У меня результат получился ИМХО даже немного хуже варианта с VBR, хотя размер файла больше.
>> считаете, что все это вообще не имеет права на жизнь?
Думаю, потому, что это бессмысленно в условиях реальной практики применения lossless-кодирования.
Вот Вы упомянули, в качестве оправдания Ваших изысканий, что в настоящий момент не существует «идеальной акустики» позволяющей услышать все изъяны ужатого контента. Так вот, близкая к понятию «идеальная» существует — электро-, пьезо- и аэростатика! Изъяны кодирования конечно слышны, но только на низких битрейтах
Насчёт aoTuV версии. Он сильно оптимизирован под низкие битрейты (q3 и ниже), на больших же оптимизации практически никак не проявляются. ИМХО, для вашего теста стоило брать Oggenc2.86 использующий libVorbis v1.3.1.
Я пробовал libvorbis 1.3.1 для этого теста, но на высоких битрейтах он показал себя примерно так же, как и aoTuV. Даже при q10 в результате звук сильно искажается. Думаю, причина в том, что в первых версиях aoTuV был реализован какой-то «улучшайзер» (нечто вроде лёгкого эквалайзера), который затрагивает все битрейты. А поскольку код aoTuV b2 был перемещен в libvorbis с версии 1.1.1. Именно поэтому при q10 они дают плохой результат. А GT3 основан на libvorbis 1.0.0 (ясное дело, без кода aoTuV), поэтому при максимальном качестве (похоже, из-за отсутствия «улучшайзеров») даже после 1000 перекодирований дает отличный результат.
Sign up to leave a comment.

Articles