Узнать максимальный битрейт. Самый подробный гайд по настройке OBS для стрима Twitch

Бытовая техника 16.07.2019

Бытовая техника

Итак, вы собрали себе достойный компьютер, познали дао мидера в Dota 2 и решили таки запустить свою первую трансляцию. Или прокомментировать чей-нибудь матч. Разумеется, на Twitch.tv.

Поздравляем, вы только что в первый окунулись в невероятно бурную реку с крутым руслом и кучей подводных камней. К счастью, со всякими хитрыми вопросами типа вещания с хромакеем или комментирования крупных ивентов можно будет разобраться позже, а пока можно разобраться с базовыми проблемами.

Например, выбором оптимального битрейта.

Предлагаем вашему перевод блога одного из комментаторов студии Moonduck.TV Pimpmuckl’а, посвященный базовым настройкам стрима по Dota 2.

Битрейт - самый важный аспект стрима. Постараемся же выжать максимально возможное для вас качество.

Первым делом для этого нужно скачать тестер качества вашего трафика с Twitch.tv с сайта Team Liquid. Запускаем программу и убираем из теста все региона, кроме «домашнего». Тест по Европе, например, будет выглядеть вот так:

Отлично, теперь выбираем себе сервер с лучшим битрейтом/качеством, берем его тестовые результаты и вычитаем из них 500кбит/сек. Получившийся в результате показатель записываем себе как «максимальный битрейт». Сокращенно - макс-битрейт.

Если вам удалось добиться статуса партнера Twitch.tv (например, вы транслируете какой-нибудь турнир), то можете смело ставить тот же макс-битрейт как «максимальный битрейт» уже в настройках вашей стримеркой программы (например, Open Broadcaster Software > Настройки > Кодирование). Один нюанс: больше 3,500кбит/сек смысла ставить нет по той простой причине, что Twitch не пропустит такой большой поток.

Если же статуса партнера у вас нет, ваш потолок - 2,500. За этой границей стрим начнет лагать.

Также следует подумать о вашей целевой аудитории. Есть на земном шаре регионы, где с интернетом все не так хорошо, как в какой-нибудь Москве, и если у главных зрителей какого-нибудь локального ивента нет подключения быстрее 2мбит/сек, то лучше «успокоить» свой стрим до 1,500кбит/сек, чтобы избавить аудиторию от буфферинга.

Разрешение

Разрешение видео мы будем выставлять, отталкиваясь от битрейта:

500–1,000 кбит/сек: 480p 30fps
1,000–1,500: 540p 30fps
1,500–2,000: 720p 30fps
2,000–3,500: 720p 60fps
3,500: 900p 60fps

Напоминаем, что речь сейчас идет именно о трансляции Dota 2. даже не пытайтесь выставить на стриме CS:Go или Overwatch 900p60 или какого-нибудь другого FPS.

720p 60fps – золотой стандарт, к которому следует стремиться. И качество будет хорошее, и у всяких девайсов типа Chromecast с передачей такого потока проблем не будет.

Всякие мелочи

В «расширенных настройках» OBS можно дополнительно поиграться с оптимизацией. Например, подкрутить пресет x264 CPU, сменив значение «по умлочанию» veryfast на fast. Это, грубо говоря, даст прирост в качестве видео за счет большей нагрузки на CPU.

Правда, в 90% случаев таки лучше оставаться на veryfast и играться этим параметром, только если в вашем компьютере стоит очень хороший процессор.

Еще один прием для владельцев GCN AMD CPU: проставьте в расширенных настройках opencl=true, и система начнет работать чуть шустрее.

Nota bene: галочку напротив «Encode in Full Range» не ставим никогда. Раньше эта опция нужна была, так как некоторые программы типа VLC могли некорректно отображать цвета в видео, но сейчас такой проблемы не существует вовсе.

Если в вашем компьютере стоит не сильно мощный процессор, можно поменять параметр «Кодировщик». NVENC/AMD VCE гораздо меньше грузят компьютер, правда, в этом случае придется пожертвовать качеством видеопотока. Ставить Intel QuickSync также имеет смысл: по качеству потока эта опция заметно обгоняет предыдущие две, но до x264 все равно не дотягивает.

Ну и наконец, геймерам, играющим на карте с измененным ландшафтом (напомним еще раз, речь идет о Dota 2), на сравнительно слабых ПК лучше переключиться на стандартную карту. Ландшафт из Battle Pass последнего The International удушит любые попытки стриминга на бюджетном компьютере.

Правда, если уж ваше железо может потянуть этот ландшафт, видеопоток с кодировкой x264 получится даже чуть лучше по качеству. Соль в том, что арена Battle Pass сама по себе очень светлая, а в x264 яркие цвета «весят» меньше в битрейте/качестве, чем темные тона. Соответственно, «светлый» стрим будет выглядеть опрятнее, чем «темный» стрим с тем же самым битрейтом.

Тем не менее, моим основным выбором все-таки является ландшафт по умолчанию.

В наши дни очень много разговоров о том, что мы потеряли настоящую музыку с приходом форматов сжимающих аудио, таких, как MP3, AAC и похожих. Действительно ли это так? Спасут ли музыку Lossless форматы? Может ли вообще неподготовленный слушатель отличить музыку в форматах MP3 от FLAC? Давайте разберемся в этом вопросе.

Что такое битрейт (Bitrate)?

Вероятно, вы уже слышали термин «битрейт» раньше, и вы, вероятно, имеете общее представление о том, что это значит, но, возможно, неплохо познакомиться с ее официальным определением, чтобы вы знали, как все это работает.

Битрейт — это число бит или количеству данных, которые обрабатываются в течение определенного периода времени. В аудио это обычно означает килобит в секунду. Например, музыка, которую вы покупаете в iTunes, составляет 256 килобит в секунду, то есть в каждой секунде песни содержится 256 килобайт данных.

Чем выше битрейт трека, тем больше места он займет на вашем компьютере . Как правило, аудио CD занимает довольно много места, поэтому стало обычной практикой сжимать эти файлы, чтобы вы могли записать больше музыки на ваш жесткий диск (или iPod, Dropbox или что-то еще). Именно здесь вступают в спор форматы «без потерь» и «с потерями».

Lossless и Lossy форматы: в чём разница?

Когда мы говорим «без потерь», мы имеем в виду, что мы действительно не изменили исходный файл . То есть мы скопировали трек с компакт-диска на наш жесткий диск, но не сжали его до такой степени, что мы потеряли какие-либо данные. Это, по сути, так же, как и оригинальная дорожка компакт-диска.

Однако, чаще всего вы, вероятно, копируете свою музыку в Lossy формате. То есть вы взяли компакт-диск, скопировали его на жесткий диск и сжали треки, чтобы они не занимали много места. Типичный альбом, вероятно, занимает 100 МБайт или около того. Тот же альбом в формате без потерь, такой как (также известный как Apple Lossless), займет около 300 Мбайт, так что стало обычной практикой использовать форматы с потерями для более быстрой загрузки и большей экономии жесткого диска.

Проблема заключается в том, что когда вы сжимаете файл для экономии места, вы удаляете куски данных. Точно так же, как когда вы берете изображение с высоким качеством, и сжимаете его в JPEG, ваш компьютер берет исходные данные и «обманывает» определенные части изображения, делая его в основном таким же, но с некоторой потерей ясности и качественный.

В качестве примера возьмем два изображения, приведенных ниже : правый справа явно сжат, и в результате качество уменьшилось.

Помните, что вы экономите место на жестком диске сжимая музыку в Lossy форматы, что может иметь большое значение для iPhone с 32 ГБ памяти, но по соотношению объём/качество это всего лишь компромисс.

Существуют различные уровни сжатия : 128 Кбит/с, например, занимают очень мало места, но также будут иметь низкое качество воспроизведения, чем более крупный файл 320 Кбит/с, который, в свою очередь, ниже качеством, чем эталонный файл с 1,411 Кбит/с. 1,411 Кбит/с — это качество уровня Audio CD, которого, в большинстве случаев, более чем достаточно.

Вся проблема не в том, как сильно сжата музыка, а на каком оборудовании вы её слушаете.

Действительно ли битрейт имеет значение?

Поскольку память с каждым годом становиться всё дешевле, прослушивание звука с более высоким битрейтом, или вовсе в Lossless форматах, начинает становиться всё более популярной. Но стоит ли это времени, усилий и занятого объёма памяти в вашем телефоне или компьютере?

Я не люблю отвечать на вопросы таким образом, но, к сожалению, ответ: это зависит.

Часть уравнения — это оборудование, которое вы используете . Если вы используете качественную пару наушников или динамиков, вы привыкли к большому частотному и динамическому диапазонам. Таким образом, вы, скорее всего, заметите недостатки, которые возникают при сжатии музыки в файлы с более низким битрейтом. Вы можете заметить, что в низкокачественных MP3-файлах отсутствует определенный уровень детализации; Тонкие фоновые треки могут быть более трудными для восприятия, верхние и низкие частоты не будут такими динамичными, или вы можете услышать искажения в вокале солиста. В этих случаях вам может потребоваться дорожка с более высоким битрейтом.

Однако, если вы слушаете свою музыку с помощью пары дешёвых наушников на вашем iPod , вы, вероятно, не заметите разницы между файлом со скоростью 128 Кбит/с и файлом 320 Кбит/с, не говоря уже музыке без потерь 1,411 Кбит/с. Помните, когда я показывал вам изображение несколькими абзацами выше и отметил, что вам, вероятно, пришлось вглядываться в него, чтобы увидеть недостатки? Ваши наушники подобны усеченной версии изображения: они сделают эти недостатки трудными для восприятия, так как они физически не способны сыграть вам музыку так, как нужно.

Другая часть уравнения, конечно, ваши собственные уши. Некоторым людям может быть очень тяжело отличить два разных битрейта по простой причине — они мало слушают музыку. Навык слуха, как и любой другой, развивается с практикой. Если вы часто и много слушаете любимую музыку, ваш слух становится более точным и начинает улавливать мелкие детали и полутона. Но до тех пор не имеет особого значения, какой битрейт вы используете?

Так какой формат и битрейт вы должны выбрать для себя? Хватит ли вам 320 Кбит/с, или вам обязательно нужен Lossless формат?

Дело в том, что трудно услышать разницу между файлом без потерь и MP3-файлом 320 Кбит/с. Чтобы услышать разницу, вам понадобится серьезное высококачественное оборудование, хороший слух и определенный тип музыки (например, классическа или джаз).

Для подавляющего большинства людей, 320 Кбит/с более чем достаточно для прослушивания.

Что ещё нужно учесть?

Музыка, записанная , может быть полезна. Файлы, в формате Lossless более надежны в будущем, в том смысле, что вы всегда можете сжать их до Lossy формата, когда вам это понадобится, но вы не можете сделать наоборот и восстановить исходное CD качество из MP3 файла. Это, опять же, одна из фундаментальных проблем с онлайн-магазинами музыки: если вы создали огромную библиотеку музыки в iTunes и в один прекрасный день решили, что вам нужно больше битрейта, вам придется снова ее покупать, но только на этот раз в формате CD.

Когда это возможно, я всегда покупаю или копирую музыку в Lossless формате для целей резервного копирования.

Я понимаю, что аудиофилам, это как иголка под ногти. Как я уже говорил, все зависит от вас, вашего слуха и оборудования, которое у вас есть.

Сравните два трека, записанного в Lossless и Lossy форматах. Попробуйте несколько разных аудиоформатов, послушайте их некоторые время и наблюдайте, будет ли разница для вас или нет.

В худшем случае вы потратите несколько часов на прослушивание своей любимой музыки — не так страшно, правда? Наслаждайся этим!

Развенчание популярных мифов о цифровом звуке.

2017-10-01T15:27

Audiophile"s Software

Примечание : для лучшего понимания нижеизложенного текста очень рекомендую ознакомиться с основами цифрового звука .

Также многие затронутые ниже моменты освещены в моей публикации «Ещё раз о печальной правде: откуда на самом деле берётся хорошее звучание?» .

Чем больше битрейт, тем качественнее трек

Это далеко не всегда так. Для начала напомню, что такое битрейт (bitrate, а не bitraid). Фактически это скорость потока данных в килобитах на секунду при воспроизведении. Т. е., если мы возьмем размер трека в килобитах и разделим на его продолжительность в секундах, получим его битрейт - т. н. file-based bitrate (FBR), обычно он не слишком отличается от битрейта аудиопотока (причиной различий является наличие в треке метаданных - тегов, «вшитых» изображений и т. п.).

Теперь возьмем пример: битрейт несжатого PCM аудио, записанного на обычном Audio CD, рассчитывается следующим образом: 2 (канала) × 16 (бит на каждый семпл) × 44100 (семплов в секунду) = 1411200 (бит/с) = 1411.2 кбит/с. А теперь возьмём и сожмём трек любым lossless кодеком («lossless» - «беспотерьный», т. е. такой, который не приводит к потере какой-либо информации), например кодеком FLAC. В результате мы получим битрейт ниже исходного, но качество при этом останется неизменным - вот вам и первое опровержение.

Сюда ещё кое-что стоит добавить. Битрейт на выходе при lossless сжатии может получиться самый разный (но, как правило он меньше, чем у несжатого аудио) - зависит это от сложности сжимаемого сигнала, а точнее от избыточности данных. Таким образом, более простые сигналы будут сжиматься лучше (т. е. имеем меньший размер файла при такой же продолжительности => меньший битрейт), а более сложные - хуже. Именно поэтому классическая музыка в lossless имеет меньший битрейт, чем, скажем, рок. Но надо подчеркнуть, что битрейт тут ни в коем случае не является показателем качества звукового материала.

Теперь поговорим о lossy сжатии (с потерями). Прежде всего надо понимать, что существует множество разных кодеров и форматов, и даже в пределах одного формата качество кодирования у разных кодеров может отличаться (например, QuickTime AAC кодирует намного качественнее устаревшего FAAC), не говоря уже о превосходстве современных форматов (OGG Vorbis, AAC, Opus) над MP3. Проще говоря, из двух одинаковых треков, закодированных разными кодерами с одним битрейтом, какой-то будет звучать лучше, а какой-то - хуже.

Кроме того, существует такое понятие, как апконверт . Т. е., можно взять трек в формате MP3 с битрейтом 96 кбит/с и конвертировать его в MP3 320 кбит/с. Мало того, что при этом качество не улучшится (ведь потерянные при предыдущем кодировании в 96 кбит/с данные уже не вернуть), оно даже ухудшится. Тут стоит указать, что на каждом этапе lossy кодирования (с любым битрейтом и любым кодером) в аудио вносится определенная порция искажений.

И даже более. Есть еще один нюанс. Если, скажем, битрейт аудиопотока - 320 кбит/с, это не значит, что все 320 кбит ушли на кодирование той самой секунды. Это характерно для кодирования с постоянным битрейтом и для тех случаев, когда человек, надеясь получить максимальное качество, форсирует слишком большой постоянный битрейт (как пример - установка 512 кбит/с CBR для Nero AAC). Как известно, количество бит, выделяемое на тот или иной фрейм, регулируется психоакустической моделью. Но в случае, когда выделенное количество намного ниже установленного битрейта, то не спасает даже резервуар бит (о терминах читайте в статье «Что такое CBR, ABR, VBR?») - в итоге мы получаем бесполезные «нулевые биты», которые просто «добивают» размер фрейма до нужного (т. е. увеличивают размер потока до заданного). Кстати, это легко проверить - сожмите полученный файл архиватором (лучше 7z) и посмотрите на степень сжатия - чем она больше - тем больше нулевых битов (т. к. они приводят к избыточности), тем больше зря потраченного места.

Кодеки lossy (MP3 и прочие) способны справитьcя c современной электронной музыкой, но не способны качественно закодировать классическую (академическую), живую, инструментальную музыку

«Ирония судьбы» здесь в том, что на самом деле всё с точностью до наоборот. Как известно, академическая музыка в подавляющем большинстве случаев следует мелодическим и гармоническим принципам, а также инструментальному составу. С математической точки зрения это обуславливает относительно простой гармонический состав музыки. Так преобладание консонансов продуцирует меньшее количество побочных гармоник: например, для квинты (интервал, в котором основные частоты двух звуков различаются в полтора раза) общей для двух звуков будет каждая вторая гармоника, для кварты, где частоты различаются на одну треть - каждая третья, и т. п. Кроме того, наличие фиксированных соотношений частот, обусловленных использованием равномерно темперированного строя, также упрощает спектральный состав классической музыки. Живой инструментальный состав классики обуславливает отсутствие в ней шумов, характерных для электронной музыки, искажений, резких скачков амплитуды, а также отсутствие избытка высокочастотных составляющих.

Перечисленные выше факторы приводят к тому, что классическая музыка намного легче сжимается, прежде всего, чисто математически. Если вы помните, математическое сжатие работает за счёт устранения избыточности (описывая похожие фрагменты информации с использованием меньшего количества битов), а также за счёт предсказания (т. н. предикторы предсказывают поведение сигнала, а затем кодируется только отклонение реального сигнала от предсказанного - чем точнее они совпали, тем меньше битов нужно для кодирования). В данном случае относительно простой спектральный состав и гармоничность обуславливают высокую избыточность, устранение которой даёт значительную степень компрессии, а малое количество всплесков и шумовых компонентов (являющихся случайными и непредсказуемыми сигналами) обуславливает хорошую математическую предсказуемость подавляющей части информации. И это я уже не говорю об относительно небольшой средней громкости классических треков и о часто встречающихся промежутках тишины, для кодирования которых информация практически не требуется. В итоге мы можем без потерь сжать, например, некоторую сольную инструментальную музыку до битрейтов ниже 320 кбит/с (кодеры TAK и OFR на такое вполне способны).

Так вот, во-первых, дело в том, что математическое сжатие, лежащее в основе lossless кодирования, является также и одним из этапов lossy кодирования (читайте Понятно об MP3 кодировании). А во-вторых, т. к. в lossy используется преобразование Фурье (разложение сигнала на гармоники), то простота спектрального состава даже вдвойне облегчает кодеру работу. В итоге, сравнивая оригинальный и закодированный семпл классической музыки в слепом тесте, мы с удивлением обнаруживаем, что никаких отличий найти не можем, даже при относительно низком битрейте. И самое смешное - что когда мы начинаем совсем понижать битрейт кодирования, первое, что обнаруживает отличия - фоновые шумы в записи.

Что же касается электронной музыки - с ней кодерам приходится очень нелегко: шумовые составляющие имеют минимальную избыточность, и вместе с резкими скачками (какими-нибудь пилообразными импульсами) являются крайне непредсказуемыми сигналами (для кодеров, которые «заточены» под естественные звуки, ведущие себя совершенно иначе), прямое же и обратное преобразование Фурье с отбросом отдельных гармоник психоакустической моделью неминуемо даёт эффекты пре- и пост-эхо, слышимость которых кодеру далеко не всегда легко оценить... Добавьте еще к этому высокий уровень ВЧ составляющих - и получите большое количество киллер-семплов, с которыми на средне-низких битрейтах не справляются даже наиболее продвинутые кодеры, как ни странно, именно среди электронной музыки.

Также забавляют мнения «опытных слухачей» и музыкантов, которые при полном непонимании принципов lossy кодирования начинают утверждать, что они слышат, как инструменты в музыке после кодирования начинают фальшивить, частоты плавают и т. п. Это, возможно, ещё было бы справедливо для допотопных кассетных плееров с детонацией, но в цифровом аудио всё точно: частотная составляющая либо остаётся, либо отбрасывается, смещать тональность тут попросту нет надобности. Более того: наличие у человека музыкального слуха совершенно не означает наличие у него хорошего частотного слуха (например, способности воспринимать частоты >16 кГц, которая с возрастом сходит на нет) и отнюдь не облегчает ему задачу поиска артефактов lossy кодирования, т. к. искажения эти имеют характер очень специфический и требуют опыта слепого сравнения именно lossy аудио - надо знать, на чём и где искать.

DVD-Audio звучит лучше, чем Audio CD (24 бита против 16-ти, 96 кГц против 44.1 и т. п.)

К сожалению, люди обычно смотрят только на цифры и очень редко задумываются о влиянии того или иного параметра на объективное качество.

Рассмотрим для начала разрядность. Этот параметр отвечает не за что иное, как за динамический диапазон, т. е., за разницу между самым тихим и самым громким звуками (в дБ). В цифровом аудио максимальный уровень - это 0 dBFS (FS - full scale), а минимальный - ограничен уровнем шумов, т. е., фактически динамический диапазон по модулю равен уровню шумов. Для 16-битного аудио динамический диапазон рассчитывается как 20 × log 10 2 16 , что равняется 96.33 вБ. При этом динамический диапазон симфонического оркестра - до 75 дБ (в основном около 40-50 дБ).

А теперь представим реальные условия. Уровень шума в комнате - около 40 дБ (не забываем, что дБ - величина относительная. В данном случае за 0 дБ принимается порог слышимости), максимальная громкость музыки достигает 110 дБ (чтобы не было дискомфорта) - получаем разность 70 дБ. Таким образом получается, что динамический диапазон более 70 дБ в данном случае просто бесполезен. Т. е. при диапазоне выше или громкие звуки будут достигать болевого порога, или тихие звуки будут поглощаться окружающими шумами. Достичь уровня окружающих шумов менее 15 дБ очень трудно (так как на этом уровне находится громкость человеческого дыхания и прочих шумов обусловленных, человеческой физиологией), в итоге диапазон в 95 дБ для прослушивания музыки оказывается совершенно достаточным.

Теперь о частоте дискретизации (частота семплирования, sample rate). Этот параметр отвечает за частоту квантования по времени и непосредственно влияет на максимальную частоту сигнала, которую можно описать данным представлением аудио. По теореме Котельникова она равна половине частоты дискретизации. Т. е. для обычной частоты семплирования в 44100 Гц максимальная частота составляющих сигнала - 22050 Гц. Максимальная же частота. которая воспринимается человеческим ухом - чуть выше 20000 Гц (и то, при рождении; по мере взросления порог опускается до 16000 Гц).

Лучше всего данная тема раскрыта в статье Загрузки в формате 24/192 - почему они не имеют смысла .

Разные программные плееры звучат по-разному (e. g. foobar2000 лучше Winamp и т. п.)

Чтобы понять, почему это не так, надо разобраться, что собой представляет программный плеер. По сути это декодер, обработчики (опционально), плагин вывода (на один из интерфейсов: ASIO, DirectSound, WASAPI. etc.), ну и конечно же GUI (графический интерфейс пользователя). Т. к. декодер в 99.9 % случаев работает по стандартному алгоритму, а плагин вывода - это всего лишь часть программы, которая передает поток звуковой карте через один из интерфейсов, то причиной различий могут быть только обработчики. Но дело в том, что обработчики обычно по-умолчанию выключены (или должны быть выключены, т. к. главное для хорошего плеера - уметь передать звук в «первозданном» виде). В итоге, предметом сравнения тут могут быть только возможности обработки и вывода, в которых, кстати говоря, необходимости очень часто вообще нет. Но даже если такая необходимость и есть - то это уже сравнение обработчиков, а никак не плееров.

Разные версии драйвера звучат по-разному

В основании этого утверждения лежит банальное незнание принципов работы звуковой карты. Драйвер - это программное обеспечение, необходимое для эффективного взаимодействия устройства с операционной системой, также обычно предоставляющее графический интерфейс пользователя для возможности управления устройством, его параметрами и т. д. Драйвер звуковой карты обеспечивает распознавание звуковой карты как звукового устройства Windows, сообщает ОС о поддерживаемых картой форматах, обеспечивает передачу несжатого PCM (в большинстве случаев) потока на карту, а также даёт доступ к настройкам. Кроме того, в случае наличия софтовой обработки (средствами CPU), драйвер может содержать различные DSP (обработчики). Потому, во-первых, при отключенных эффектах и обработке, если драйвер не обеспечивает точную передачу PCM на карту, это считается грубейшей ошибкой, критическим багом. И случается такое крайне редко . С другой стороны, различия между драйверами могут быть в обновлении алгоритмов обработки (ресемплеров, эффектов), хотя это случается тоже отнюдь не часто. К тому же, для достижения наивысшего качества эффекты и любую обработку драйвером всё равно следует исключать.

Таким образом, обновления драйверов в основном ориентированы на повышение стабильности работы и устранение ошибок, связанных с обработкой. Ни то, ни другое в нашем случае на качество воспроизведения не влияет, потому в 999 случаях из 1000 драйвер влияния на звук не оказывает.

Лицензионные Audio CD звучат лучше, чем их копии

Если при копировании не произошло ошибок (неустранимых) чтения/записи и у оптического привода устройства, на котором будет воспроизводится диск-копия, нет проблем с его чтением, то такое утверждение ошибочно и легко опровергается .

Режим кодирования Stereo дает лучшее качество, чем Joint Stereo

Это заблуждение главным образом касается LAME MP3, так как все современные кодеры (AAC, Vorbis, Musepack) используют только режим Joint Stereo (и это уже о чём-то говорит)

Для начала стоит упомянуть, что режим Joint Stereo успешно используется при lossless сжатии. Суть его заключается в том, что сигнал перед кодированием раскладывается на сумму правого и левого канала (Mid) и на их разность (Side), а затем происходит отдельное кодирование этих сигналов. В пределе (для одинаковой информации в правом и левом канале) получается двойная экономия данных. А так как в большинстве музыки информация в правом и левом каналах довольно схожа, то этот метод оказывается очень эффективным и позволяет значительно увеличить степень сжатия.

В lossy принцип тот же. Но здесь в режиме постоянного битрейта качество фрагментов со схожей информацией в двух каналах будет увеличиваться (в пределе - удваиваться), а для VBR режима в таких местах будет просто уменьшаться битрейт (не забываем, что главная задача VBR режима - стабильно поддерживать заданное качество кодирования, используя минимально возможный битрейт). Так как во время lossy кодирования приоритет (при распределении битов) отдаётся сумме каналов, чтобы избежать ухудшения стереопанорамы, используется динамическое переключение между режимами Joint Stereo (Mid/Side) и обычным (Left/Right) стерео на базе фреймов. Кстати говоря, причиной данного заблуждения послужило несовершенство алгоритма переключения в старых версиях LAME, а также наличие режима Forced Joint, в котором автопереключение отсутствует. В последних версиях LAME режим Joint включен по умолчанию и менять его не рекомендуется.

Чем шире спектр, тем качественнее запись (о спектрограммах, auCDtect и частотном диапазоне)

В наше время на форумах, к несчастью, очень распространено измерение качества трека «линейкой по спектрограмме». Очевидно, по причине простоты такого способа. Но, как показывает практика, в действительности всё намного сложнее.

А дело тут вот в чем. Спектрограмма визуально демонстрирует распределение мощности сигнала по частотам, но не может дать полного представления о звучании записи, наличии в ней искажений и артефактов компрессии. Т. е., по сути всё, что можно определить по спектрограмме, - это частотный диапазон (и частично - плотность спектра в районе ВЧ). Т. е., в лучшем случае, путем анализа спектрограммы можно выявить апконверт. Сравнение же спектрограмм треков, полученных путем кодирования различными кодерами, с оригиналом - полнейший абсурд. Да, вы сможете выявить различия в спектре, но вот определить, будут ли они (и в какой степени) восприниматься человеческим ухом - практически невозможно. Нельзя забывать, что задача lossy кодирования - обеспечить результат неотличимый человеческим ухом от оригинала (никак не глазом).

Это же относится и к оценке качества кодирования путём анализа треков на выходе программой auCDtect (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect - это лишь оболочки для единственной в своем роде консольной программы auCDtect). Алгоритм auCDtect тоже фактически анализирует частотный диапазон и всего лишь позволяет определить (с определенной долей вероятности), было ли на каком-либо из этапов кодирования применено MPEG сжатие. Алгоритм заточен под MP3, потому его легко «обмануть» с помощью кодеков Vorbis, AAC и Musepack, так что даже если программа пишет «100% CDDA» - это не значит, что закодированное аудио на 100% соответствует исходному.

И возвращаясь непосредственно к спектрам. Популярно также стремление некоторых «энтузиастов» во что бы то ни было отключить lowpass (НЧ) фильтр в кодере LAME. Здесь на лицо непонимание принципов кодирования и психоакустики. Во-первых, кодер обрезает высокие частоты только с одной целью - сэкономить данные и использовать их для кодирования наиболее слышимого диапазона частот. Расширенный частотный диапазон может фатально сказаться на общем качестве звучания и привести к слышимым артефактам кодирования. Более того, отключение среза на 20 кГц - вообще совершенно неоправданно, так как частоты выше человек попросту не слышит.

Существует некая «волшебная» предустановка эквалайзера, способная значительно улучшить звучание

Это не совсем так, во-первых, потому, что каждая отдельно взятая конфигурация (наушники, акустика, звуковая карта) обладает своими собственными параметрами (в частности, своей амплитудно-частотной характеристикой). И потому к каждой конфигурации должен быть свой, уникальный подход. Проще говоря, такая предустановка эквалайзера существует, но она отличается для разных конфигураций. Суть же её заключается в корректировке АЧХ тракта, а именно - в «выравнивании» нежелательных провалов и всплесков.

Также среди людей далеких от непосредственной работы со звуком очень популярна настройка графического эквалайзера «галочкой», что фактически представляет собой повышение уровня НЧ и ВЧ составляющих, но в то же время приводит к приглушению вокала и инструментов, спектр звучания которых находится в районе средних частот.

Перед конвертированием музыки в другой формат следует «разжимать» её в WAV

Сразу отмечу, что под WAV подразумеваются PCM данные (импульсно-кодовая модуляция) в контейнере WAVE (файл с расширением *.wav). Эти данные представляют собой не что иное, как последовательность битов (нулей и единиц) группами по 16, 24 или 32 (в зависимости от разрядности), каждая из которых представляет собой двоичный код амплитуды соответствующего ей семпла (например, для 16 бит в десятичном представлении это значения от -32768 до +32768).

Так вот, дело в том, что любой обработчик звука - будь то фильтр или кодер - как правило работает только с этими значениями, то есть только с несжатыми данными. Это значит, что для преобразования звука, скажем, из FLAC в APE, просто необходимо сначала декодировать FLAC в PCM, а затем уже закодировать PCM в APE. Это как для перепаковки файлов из ZIP в RAR, надо сначала распаковать ZIP.

Однако, если вы пользуетесь конвертером или просто продвинутым консольным кодером, промежуточное преобразование в PCM происходит на лету, иногда даже без записи во временный WAV файл. Именно это и вводит людей в заблуждения: кажется, что форматы конвертируются непосредственно один в другой, но на самом деле в такой программе обязательно есть декодер входного формата, выполняющий промежуточное преобразование в PCM.

Таким образом, ручное преобразование в WAV не даст вам совершенно ничего, кроме лишней траты времени.

Очень часто мне задают один и тот же вопрос – какой битрейт лучше выставлять при выводе фильма . И поскольку это один из самых главных параметров, влияющих на качество конечного изображения, я решил более подробно рассмотреть его в этой статье, а так же дать свои рекомендации по выбору оптимального значения.

Что же такое битрейт.

Битрейт это количество информации передаваемой либо сохраняемой за определённый промежуток времени. Обычно за секунду. В видео принято обозначать им коэффициент сжатия и измеряется он мегабитами (Mbps) либо килобитами (kbps) в секунду. И чем больше его значение, тем качественнее картинка. Проще говоря, когда в кодеке выставляем битрейт мы как бы говорим ему, что у нас есть, например, только 16 мегабит (это 2 мегабайта) на одну секунду видео и он уже пытается при помощи своих алгоритмов сжатия сохранить картинку с наименьшими потерями. Соответственно, чем больше это значение, тем меньше кодеку приходится ужимать изображение, но размер получаемого файла при этом увеличивается.

Обычно в программах для монтажа и конвертации видео есть возможность выбрать один из трех режимов сжатия:

1. С постоянным битрейтом. (Constant bitrate, CBR) В этом режиме выставленный битрейт не меняется на протяжении всего кодирования и поэтому размер конечного файла можно точно рассчитать.

2. С переменным битрейтом. (Variable bitrate, VBR) При выборе этого режима мы уже выставляем максимально возможный битрейт, а кодек сам выбирает необходимый для каждой конкретной сцены в видеоролике. Благодаря этому размер конечного файла может быть меньше, чем при выборе режима с постоянным битрейтом. Но рассчитать его уже сложнее. (Можно ориентироваться на максимальный битрейт при подсчёте)

3. С усредненным битрейтом (Average bitrate, ABR) В этом режиме мы уже выставляем минимально и максимально допустимый битрейт. Как и в случае с переменным кодек сам его подбирает, но уже только в этих пределах. Качество кодирования при этом лучше. Так как кодек не может уйти за минимальный предел битрейта.

Лично я всегда выбираю режим с постоянным битрейтом потому, что это даёт мне возможность точно рассчитать размер конечного файла и предсказуемое качество картинки. (ну не доверяю я кодеку )

Ну а теперь к практике. Точнее к цифрам.

Сейчас достаточно много, как форматов, так и кодеков для сжатия видео. Но наиболее качественным, по моему мнению, пока остаётся H.264. Тем более, что его рекомендуют видеосервисы Youtube и Vimeo . Именно поэтому я буду ориентироваться на самый распространенный формат видеозаписи Full HD (1920×1080) и кодек H.264.

Какой же тогда выставлять битрейт?

Для YouTube и Vimeo советую выставлять битрейт от 10 до 16 mbps (мегабит в секунду. Соответственно это будет от 10000 до 16000 kbps ). Этого вполне достаточно для получения хорошей картинки и небольшого размера файла.

Если вам необходимо получить лучшее качество и средний размер файла, то рекомендую выставлять битрейт в пределах 18 — 25 mbps .

Ну а для сохранения максимального качества картинки – 50 mbps.

Но тут ещё есть один нюанс. Нужно смотреть, какой битрейт у вас на оригинальных видео. Если они, например, записаны с 10 mbps , то выставлять при рендере 25 mbps нет никакого смысла . Так как размер файла увеличится, а качество останется таким же. В этом случае можно оставить 10 mbps . То есть для максимально возможного качества можно ориентироваться на битрейт оригинальных видео файлов, не превышая их значений.

Для того чтобы его узнать нужно в браузере Windows кликнуть правой кнопкой мыши на нужном файле, зайти в свойства и выбрать вкладку подробно.

Там в пункте «Скорость передачи данных» будет указан битрейт на который можно ориентироваться. Здесь же можно увидеть разрешение и частоту кадров.

Ещё замечу, что максимальный битрейт при создании Blu-Ray диска составляет 35 mbps.

Если же вы создаёте диски в DVD формате , то выставляйте битрейт в пределах 5 – 9 mbps. И я рекомендую всё-таки использовать 9 mbps для получения максимального качества. (для разрешения 720×576 этого вполне достаточно)

Кстати, чем меньше разрешение видео, тем меньше нужен битрейт.

Ну а напоследок парочка формул для вычисления размера видеофайла и необходимого битрейта:

Допустим мы выставили 50 mbps и рендерим 1 час видео , тогда (50 (битрейт в мегабитах) * 3600(количество секунд в часе)) / 8 (переводим в мегабайты) = 22500 мегабайт . То есть 1 час видео при битрейте 50mbps будет занимать 21,97 Гигабайта (22500/1024=21,97 переводим в гигабайты)

Ну а если нам нужно рассчитать необходимый битрейт, чтобы уместить 1 час видео на 8 гигабайт , то нужно (7800 (приблизительно 8 гигабайт в мегабайтах) / 3600 (секунд в часе)) * 8 (переводим мегабайты в мегабиты) = 17,3mbps.

На этом я пожалуй и закончу. Если статья была вам полезна, то ставьте лайки, подписывайтесь на новости и оставляйте комментарии.

Удачного вам рендера.

Битрейт указывается как одна из главных характеристик видео и аудиозаписей. Большинство пользователей привыкло думать, что он определяет качество загружаемого файла. Но что такое битрейты и как они на самом деле характеризуют музыкальные файлы и видеоролики? Рассмотрим это подробнее.

Что такое битрейты?

Битрейт - это величина, которая отображает количество единиц информации (мегабит или килобит), вмещенных в одну секунду воспроизведения файла. Соответственно, он измеряется в мегабитах в секунду (Mbps) или килобитах в секунду (Kbps). Иначе битрейт можно охарактеризовать как ширину пропускной полосы. Эта характеристика важна для тех, кто хочет конвертировать файлы, потому что при одной и той же продолжительности больший битрейт приведет к увеличению файла. Помимо размера, меняется и качество звука. Уменьшение размера при понижении битрейта называется сжатием.

Распространенный музыкальный представляет собой аудиофайл, сжатый до такой степени, что на стандартный диск помещается до 12-ти часов музыки. При этом качество остается достаточно высоким благодаря психоакустическому сжатию: из всего диапазона убираются звуки с теми частотами и уровнями громкости, которые не улавливаются человеческим ухом. Отобранные звуки формируются в обособленные блоки, называемые фреймами. Фреймы имеют одинаковую продолжительность звучания и сжимаются по заданному алгоритму. Когда проигрывается музыка, сигнал воссоздается из декодированных блоков в определенной последовательности.

Какое обычно используется сжатие?

Битрейт аудио чаще всего составляет 256 Кбит/с. При таком значении аудиозапись сжимается в размере приблизительно в 6 раз, благодаря чему на один диск можно записать в 6 раз больше музыки, чем до сжатия. Если битрейт понизить до 128 Кбит/с, то на один диск поместится уже в 12 раз больше музыки, однако качество звучания будет заметно ниже. Музыка, записанная в качестве 128 Кбит/с, чаще всего предлагается для прослушивания в интернете, т. к. в погоне за повышением скорости загрузки страниц владельцы ресурсов идут на любые жертвы. Многие пользователи отмечают, что ее качество далеко от идеального.

Теперь, когда стало ясно, что такое битрейты, самое время определить их оптимальный уровень. Как любители, так и профессионалы бесконечно спорят, как битрейт влияет на качество звука и влияет ли вообще. На музыкальных альбомах, как правило, указывается битрейт. Один и тот же диск, записанный в качестве 128 Кбит/с и 256 Кбит/с, будет различаться по цене в два раза.

Оптимальный битрейт при разных условиях прослушивания

Для многих людей двенадцатикратное сжатие не представляет какого-либо ущерба, в то время как другие утверждают, что не могут слушать музыку с битрейтом ниже, чем 320 Кбит/с. Парадоксально, но правы и те и другие. Дело в том, что в конечном счете качество воспроизведения зависит не от а от условий воспроизведения и даже от типа музыки.

Например, песня проигрывается на магнитофоне, установленном в отечественном автомобиле. В таком случае качество на уровне 192 Кбит/с будет вполне достаточным. Более высокий битрейт улучшит качество звука, но разница не будет заметна из-за высокого уровня шума во время поездки. Если же музыка играет на домашнем компьютере или портативном плеере, то требуется не менее 256 Кбит/с. Если же сигнал не подвергается изменениям, передается на внешние устройства и выводится на дорогие импортные колонки, то следует по возможности прибегать к минимальному сжатию. Оно возможно при битрейте 320 Кбит/с.

Оптимальный битрейт для различных музыкальных стилей

Музыка с высоким битрейтом нужна не всегда. Популярная музыка, как правило, достаточно хорошо звучит при битрейте 192-256 Кбит/с. Более высокое качество установить можно, но смысла в этом нет: поп-композиции недолговечны, поэтому сохранение места на дисках должно быть приоритетным. Кроме того, качество исходных записей тоже посредственное, поэтому повышение битрейта может никак не повлиять на качество воспроизводимого файла. Для прослушивания в транспорте и на неофициальных вечеринках среднего качества вполне хватит.

Если же речь идет о классической музыке, произведениях легендарных рок-групп или редких авторских песнях, то качество должно быть превыше всего. При приобретении такой музыки нужно посмотреть на битрейт, указанный на упаковке диска. Если песня загружается из Интернета, то такая информация должна присутствовать на странице скачивания. Кроме того, битрейт отображается в плеере во время проигрывания.

Битрейты видеофайлов

Выше говорилось о том, что такое битрейты аудиозаписей. Но что такое битрейт видео? Учитывая, что видео воспроизводится как последовательность звуков и изображений, то определение битрейта будет аналогичным. Наличие видеоряда утяжеляет файл, но в конечном счете изображения для процессора - это такие же нули и единицы, как и звуки. Принцип шифрования информации одинаков для всех типов файлов.