Какой битрейт лучше для твича. Самый подробный гайд по настройке OBS для стрима Twitch

Инструмент 13.08.2019

Инструмент

Правильная настройка OBS – задача не такая сложная как может показаться. Но если у тебя возникают трудности, то читай наш подробный гайд.

Open Broadcaster Software (OBS) – самая популярная программа для того, чтобы сделать стрим на твиче. Она бесплатная, имеет хороший функционал и позволяет делать качественные стримы – что еще надо для счастья?

Начинаем настройку ОБС для стрима на Твиче

Лучше всего скачать программу с официального сайта https://obsproject.com/, а не искать где-то на торрентах и файлобменниках. Так надежнее и гарантированно, ты установишь чистую программу без лишних вирусов и прочей грязи.

После установки начинаем первоначальный процесс настройки. Для этого в верхнем меню выбираем пункт «Настройки -> Настройки».

Общие настройки

Тут выбираем язык интерфейса и добавляем профиль для вещания. Профиль – будет хранить все настройки. По сути мы настраиваем именно профиль. Соответственно профилей может быть несколько с разными настройками. Это удобно, чтобы в будущем не менять все настройки, а просто переключить профиль на нужный.

Несколько профилей может пригодится, если ты планируешь периодически стримить на разные платформы, а не только на Твич.

Кодирование

Один из самых важных пунктов в настройках. Именно от этих значений будет в будущем зависеть качество картинки и звука на стриме.

Твич уже давно требует от стримеров установки постоянно битрейта, поэтому обе галочки CBR обязательно должны быть активными.

В зависимости от того, какое разрешение стрима ты планируешь установить нужно вписать значение битрейта. Твич рекомендует устанавливать такие значения:

1080p: 3000-3500
720p: 1800-2500
480p: 900-1200
360p: 600-800
240p: до 500

Размер буфера должен иметь такое же значение, как и битрейт. Учитывай, что чем выше битрейт – тем качественнее картинка будет на стриме, но при этом будет больше нагрузка на твой компьютер, сеть и компьютеры зрителей. Далеко не у всех зрителей хватит интернета, чтобы нормально смотреть стрим 1080р с максимальным битрейтом. Поэтому этот показатель надо тестировать.

Аудио кодирование лучше использовать AAC и битрейт в пределах 64-128. Это рекомендует Твич и мы опять же ему верим.

Трансляция

Тут все достаточно просто. Режим выбираем «Прямой эфир», сервис – «Twitch / Justin.tv», сервер лучше выбирать ближайший, но тут надо тестить и смотреть. Не всегда ближайший географически сервер покажет лучшие результаты.

Автопереподключение обязательно оставляет включенным. Задержку автопереподключения рекомендуется выставлять в пределах 5-10, но все ставят 10 и норм.

Задержка – крутая вещь, если ты играешь в какую-то игру и не хочешь, чтобы противники спалили что-то важное. Например, играя в доту, обычно ставять задержку на срок действия вардов, чтобы соперники, которые будут втихаря палить стрим, не видели где стоят варды. Но тут смотри и решай сам, делать так или нет. Учитывая, что задержка устанавливается в секундах, поэтому если надо поставить задержку в 5 минут, нужно прописать 300 в это поле.

Также обращай внимание на все строки, которые ОБС пишет красным. Там бывают толковые советы и замечания.

Остальные настройки можешь установить по своему усмотрению – они не влияют на качество стрима. Например, можно дополнительно сохранять стрим на компьютер, это позволит гарантированно сохранить стрим, потому что на Твиче случается всякое и запись может удалится. Поэтому если ты помимо стримов записи потом выкладываешь еще и на ютуб, эту галочку лучше установить и сохранять все на комп. Удалить лишнее всегда успеется.

Видео

Тут нужно выбрать разрешение и частоту кадров для своей трансляции, которая дойдет до зрителей. Опираться нужно на качество своего железа и интернет подключения. Оптимальным являются показатели 720р и 1080р в 60fps. Если даже 720р лагает при 60 кадров в секунду, тогда ставь 30 кадров, картинка будет очень хорошей, но все же уже не идеальной.

Масштабирование лучше никогда не включать, так как это очень сильно режет качество.

Аудио

Важный раздел для новичков, потому что очень часто на их стримах все жалуются не так на качество видео, как на качество звука. Поэтому попробуем разобрать что делать. И так.

Выбираем устройство для воспроизведения звука (динамики, колонки или свои наушники) и микрофон.

Дальше, если хочешь, чтобы звук записывался с микрофона не постоянно, а только в моменты, когда нажимаешь клавишу – отметь необходимую галочку и в правом от нее поле выбери клавишу, которая будет это делать. Можно выбрать 2 разные клавиши, но смысла в этом мало.

Задержка НиГ позволяет записывать звук в буфер, а не транслировать его сразу же в онлайн. Такое нужно, если интернет у тебя не очень, и зрители жалуются, что окончания фраз просто обрываются. Тут лучше всего увеличивать постепенно по 100 мс, если проблема серьезная и тестировать.

Клавиши для включения/выключения микрофона и звука – понятно.

Усиление приложений по умолчанию 1. Нужно увеличивать или уменьшать это значение, если нужно чтобы на стриме был также звук не только из игры и микрофона, а и других приложений. Например, из скайпа или чтобы на фоне играла какая-то музыка. С усилинием нужно аккуратно, увеличивать по 1 и смотреть. Сильное увеличение позволить сделать сильно громче, но может также и сильно исказить звуки, снизив качество.

Усиление микрофона – то же, что предыдущее, только уже для твоего микрофона.

Смещение позволяет устранить рассинхрон в аудио и видео. Надо тестировать. Кто-то играет без, у кого-то наоборот без этой настройки получается плохой стрим. Тестируй, проверяй, подстраивай.

Обрати внимание, что измененные параметры будут использоваться, только на следующий запуск. Соответсвенно, если есть какие-то проблемы со звуком, то просто изменить что-то в настройках не выйдет. Чтобы они вступили в силу, придется перезапустить стрим. Поэтому лучше сначала потренироваться и все хорошо настроить, а потом уже идти со своим стримом в массы.

Расширенные настройки

Важный пункт, но тут в идеале оставить почти все по умолчанию. Многопоточная оптимизация устанавливаем активно, время буферизации – 400 мс (это требование Твича). Приоритет процесса – Средний.

Предустановка x264 CPU по умолчанию лучше оставить veryfast. Но, если у тебя очень мощный топовый процессор, то можно снизить это значение. Качество стрима вырастет, но сильно вырастет и нагрузка на ЦП.

Интервал ключевых кадров – 2 (требование Твича). CFR ставим галочку. Остальное можно не трогать.

Кто-то ставить галочку подгона звука под тайминг видео, но это скорее опциально и не обязательно. Она понадобиться, только если звук сильно отстает или опережает картинку.

Шумовой гейт

Тут ты можешь установить пределы, которые в которых микрофон будет работать и воспринимать звук. Это позволяет отфильтровать ненужные звуки и шумы, которые могут попасть в стрим (шум соседей, звуки с улицы и т.д.). Надо тестировать и подстраивать под себя, потому что стримят с разными эмоциями и, соответственно разные показатели звука.

Настройка OBS для стрима на Твиче

На этом основная настройка ОБС завершена. Далее для того, чтобы норм стримчик получился нужно еще сделать сцену и , но это уже другая история и будет рассмотрена в другой статье. Если остались какие-то вопросы – задавай в комментариях.

07. 09.2017

Блог Дмитрия Вассиярова.

Что такое битрэйт? Или сказ о качестве видеопотока

Здравствуйте, дорогие читатели.

Тема нашего разговора - что такое битрейт видео - будет интересна как тем, кто записывает ролики на диски или выкладывает в сеть, так и тем, кто их смотрит. Ведь от данного параметра зависит качество картинки.

В этой статье вы не только познакомитесь с термином, но и узнаете, каких видов бывает битрейт и каково его оптимальное значение для видеозаписей в разных ситуациях.

Объяснение термина

С помощью битрейта исчисляется количество бит, которые содержатся в секунде видеопотока. Данное понятие используется при определении эффективности передачи данных по каналу, то есть, каков должен быть его минимальный размер, чтобы ролик воспроизводился без задержек.

Чтобы вы лучше понимали, что означает данный термин, расскажу о нем без технических словечек. Итак, любой видеоролик является чередованием кадров. Для нормального восприятия человеческим глазом оптимальной частотой кадров является 24 штуки в секунду.

Если при записи видео на жесткий диск оставлять каждый кадр в первоначальном размере, то не хватит никакого места; не говоря уже о том, сколько времени потребуется, чтобы выложить его в интернет.

Давайте прикинем вместе: 1 кадр стандартного разрешения 1920 х 1080 будет весить 2 073 600 байта, то есть почти 2 Мб. В 1 секунде таких кадров 24 - получается 48 Мб. Сколько выходит в минуту? Умножаем 48 Мб на 60 с - размер минутного ролика составляет 2880 Мб, а это практически 3 Гб. Что говорить о фильме продолжительностью 1,5 часа?

Решением этой задачи является кодирование файла при помощи кодеков, то есть сжатие. Его степень и отображает битрейт, который отвечает за оптимальное соотношение качества картинки и размера видео. Ведь если его пережать, то вы получите неприятную зернистость изображения, то есть ролик будет легкий, но картинка вся в пикселях.

Виды битрейта

При сжатии видео вам дается на выбор 3 режима: постоянный, изменяющийся и усредненный. Начнем по порядку:

Постоянный битрейт (Constant bitrate, CBR). Вы задаете нужное значение и оно не меняется на протяжении всего ролика. Преимущество этого варианта в том, что вы заранее знаете, какой будет конечный размер файла.
Но есть и недостаток, особенно по отношению к звуку. Он может нарастать в процессе воспроизведения, что может потребовать изменения битрейта. Так как он не получит желаемого, пострадает качество.

Переменный (Variable, VBR). В данном случае вы работаете в паре с кодеком. Ваша задача выставить максимальный битрейт, а программы - подбирать необходимое значение для каждой сцены. Таким образом, устранен «минус» предыдущего режима. Вдобавок объем файла может получиться даже меньше ожидаемого, но предугадать итог невозможно.
Усредненный (Average, ABR). Из названия ясно - это нечто среднее между первым и вторым режимом. Здесь вы задаете не только максимальный, но и минимальный битрейт, а кодек сам подбирает его в этих пределах, исходя из динамики видео. Его качество получается лучше, чем при переменном варианте, потому что битрейт не достигает значения ниже установленной вами величины.

Измерение битрейта

Измеряется данный параметр битами в секунду. Вы привыкли исчислять в байтах? Знайте, что в одном байте содержится 8 бит. Если число получается большим, добавляются приставки «кило» (1 включает в себя 1024 бит/с), «мега» (то же количество, только килобитов), «гига» (аналогичное число в мегабайтах) или «тера» (1024 гигов в 1 Тбит/с). Вместо обозначения «бит/с» чаще в интернете можно встретить другой вариант - bps.

Влияние битрейта на качество видео таково, что с ростом первого увеличивается и второе. Но возьмите во внимание, что с добавлением битов будет расти и размер файла, так как кодеку не приходится сильно ужимать запись.

Средние значения

Конечно, к каждому файлу нужно подходить индивидуально при выставлении битрейта, все же приведу вам усредненные примеры:

Для выкладывания роликов на YouTube или Vimeo подойдет значение 10-16 mbps.

Хотите получить лучшее качество и средний вес файла? Можете дотянуть битрейт до 18-25 mbps.
Максимальное качество сохранится, если вы установите число 50 mbps.

Еще важно: предельной цифрой для записи Blu-Ray диска является 35 mbps, а оптимальной для DVD - 9 mbps.

Как правильно задавать битрейт?

Нужно опираться на значение исходного варианта. Например, если оригинал записан с битрейтом 10 mbps, то подняв значение до 30, вы добьетесь только увеличения объема файла, а картинка останется прежней.

Где посмотреть, сколько килобит имеется в секунде ролика? Открываем его свойства через меню правой кнопки мыши.

Также учитывайте, что для меньшего разрешения видео требуется и меньший битрейт.

Выполняем подсчет

Можно рассчитать битрейт самостоятельно. К примеру, вы собираетесь кодировать 2-часовой фильм отличного качества, чтобы записать его на DVD-диск. Объем накопителя составляет 4482 Мб, а продолжительность киноленты 7200 секунд. Ведем расчет по такой формуле: (4482\7200)х8х1000=4980 кбит\с.

Еще следует оставить примерно 200 кбит на кодировку звука и 100 кбит на создание меню. В целом, всегда для этих дел зарезайте битрейт приблизительно на 7 %. Получается, что оптимальное значение в данном случае составляет 4700 кбит\с.

Не хотите заморачиваться с подсчетами? Воспользуйтесь программой «Bitrate Calculator». Причем есть бесплатная версия как для установки на компьютер, так и онлайн.

Вот вы и познакомились с битрейтом. Есть еще вопросы по компьютерной теме? В наших статьях вы найдете нужные ответы.

Здравствуйте, уважаемые читатели сайта сайт. Пришло время для второй серии «Мамкиного стримера», и сегодня рассмотрим первоначальную настройку OBS. В прошлый раз мы собрали и потестили оптимальное оборудование для стрима в Full HD 60 FPS.

Я постараюсь максимально быстро и информативно рассказать про важные пункты, подобрать оптимальные настройки для разных компьютеров под каждый кодировщик: NVENC, x264, Quick Sync и AVC Encoder для видеокарт AMD.

У некоторых может возникнуть вопрос, почему OBS, а не Xsplit. Во-первых, OBS бесплатна. А во-вторых, менее требовательна к ресурсам ПК. И при одинаковых пресетах OBS будет загружать компьютер меньше. Давайте уже начнем!

Учтите, что эти значения руководствуются критериями качества на youtube. Т.е. эти значения во многом соответствую не игровой тематике, а формату видеороликов, снятых на камеру.

"Супер качество" - это максимальный функциональный предел; при стриме игр смысла выставлять его особо нет, т.к. визуально качество будет практически такое же как и в "Высоком качестве".

Поэтому для игр "Низкое качество" зачастую является приемлемым. Например, на твиче считается нормальным брать битрейт 1800 для стрима в 720p - это дефолтное значение в OBS для данной платформы.

АПДЕЙТ: Твич повысил максимальный битрейт с 3500 до 6000. Так что если у вас мощный комп, можно смело ставить, например, 720 в 60фпс с битрейтом 5к

Также важно понимать, что выбор битрейта зависит от конкретной игры. Если вы играете в пиксельную игру вроде Realm of the Mad God, большой битрейт погоды не сделает, т.к. сама игра не блещет графикой. Также высокое качество картинки не важно в статичных играх вроде Hearthstone, где большинство зрителей и так в курсе какая карта что делает.

Мой личный выбор для большинства игр - битрейт для youtube:
720p (разрешение 1280x720), 30 фпс - 2500
1080p (разрешение 1920x1080), 30 фпс - 4300

Регулировка интервала между ключевыми кадрами может улучшить качество картинки и более эффективно использовать выбранный битрейт. Ключевой кадр кодируется полностью, следующий за ним содержит только отличия от ключевого, третий – отличия от второго и так далее до следующего ключевого кадра.

Для не слишком динамичных игр интервал можно повысить, поскольку там картинка кардинально и быстро не меняется. Для динамичных больше одного ключевого кадра в 3 секунды ставить не рекомендую – картинка будет сильно замылена.

Предустановка использования ЦП отвечает за нагрузку процессора и качество картинки. Если процессор мощный, то можно повысить параметр, получив более качественную картинку.

И наоборот, если машина не справляется со стримом и игрой одновременно, то стоит понизить использование ЦП, чтобы видео было плавнее. Рекомендуемое значение для слабых и средних процессоров «Veryfast».

Пункт профиль напрямую зависит от вашего железа. Для более старых комплектующих желательно устанавливать main, для более новых – high. При этом потеря качества будет минимальна.

Отдельный пункт «Настройка» под профилями - это некая оптимизация для вашей трансляции. Рекомендую устанавливать параметр нулевой задержки, который как раз и предназначен для потокового видео.

Теперь рассмотрим настройки трансляции через NVENC H.264 кодек для видеокарт NVIDIA. Особых отличий здесь нет. Всё та же строчка с битрейтом, пресетами и профилями.

Пресеты здесь уже обозначены по-человечески, и из названия можно понять, как повысить качество картинки и как снизить нагрузку на видеокарту. Однако параметр уровень (чего?) – это уже более точная поднастройка, куда нам, нубам, пока еще лезть рано. Поэтому оставляем его в режиме «авто».

При использовании двухпроходного кодирования качество картинки улучшится, но нагрузка на GPU возрастет. Но это адекватная цена, поэтому ставим галочку.

Если ты мажор и у тебя несколько видеокарт в SLI, то в следующем пункте GPU устанавливай значение «один» для двух видеокарт, значение два – для трех и тд. Если у тебя только одна видеокарта, то оставляй значение «ноль».

Использование B-кадров означает, что данный кадр ссылается на два соседних – предыдущий и следующий. Это ускоряет отрисовку и снижает нагрузку на железо. Оставляем значение в 2.

Стриминг через видеокарты AMD. Здесь есть тоже свои пресеты, в которых достаточно поменять битрейт на желаемый под ваше разрешение.

Если перейти в режим просмотра «Эксперт», то можно максимально детально настроить кодер под свои нужды. Однако я на этом заострять внимание не буду, так как, во-первых, это растянет видео на час, а во-вторых – мало кто использует видеокарты AMD для стриминга.

Quick Sync

Также есть возможность кодирования трансляции через Quick Sync и встроенного видеоядра в процессоры Intel. Однако качество будет ниже среднего, хоть и снизится основная нагрузка на процессор.

Для включения технологии необходимо зайти в BIOS и изменить пункт мульти-монитора в разделе встроенного видеоядра на Enable. На разных материнских платах название может отличаться. Далее настройка аналогичная как для стриминга через процессор.

Следующий пункт – «Аудио». Здесь вы можете подключить несколько аудио устройств для воспроизведения в трансляции, выбрать качество, определить количество каналов, задать задержку включения и выключения микрофона.

Аудио битрейт для стрима должен также отличатся в зависимости от вашего разрешения, иначе звук может лагать. Рекомендую следующие значения аудио битрейта:

240p (426 x 240) - 32 kbps (mono)
270p (480x270) - 40 kbps (mono)
360p (640x360) - 48 kbps
480p (854x480) - 64 kbps
540p (960x540) - 96 kbps
720p (1280x720) - 128 kbps
1080p (1920x1080) - 128 kbps

При стриминге на низких разрешениях (до 720) можно попробовать и более высокий аудиобитрейт, экспериментируйте.

В разделе «Видео» задается нативное разрешение экрана, выходное разрешение для трансляции и определяется максимальное значение FPS.

Фильтр масштабирования – очень полезная функция. Объясню, чем отличаются методы и какой лучше подобрать под ваш компьютер.

Первый метод - билинейный . Он подходит для слабых компьютеров и среднего качества трансляции. Картинка будет немного замылена, особенно в динамических сценах. Но потребляемые ресурсы будут значительно меньше.

Второй метод – бикубический. Его стримеры используют чаще всего. Оптимальное сочетание нагрузки и качества изображения.

Третий и самый ресурсозатратный метод – Ланцоша . Качество трансляции будет максимальным, как и нагрузка на ПК. Не рекомендую использовать с процессорами слабее Ryzen 5 1400, Intel Сore i5 6400 и видеокартах младше GTX 1060 с 6 GB.

В разделе «Горячих клавиш» можно задать комбинации или отдельные бинды на быстрое включение определенных функции или смены сцен трансляции.

В «Расширенных настройках» советую поставить приоритет процесса на высокий, чтобы фоновые обновления или другой софт не занимали необходимые ресурсы. Цветовой формат, пространство и диапазон лучше не трогать.

Настройка первого стрима

Теперь создадим нашу первую сцену с игрой и нашей веб-камерой. Для начала слева внизу нажимаем на плюс и создаем первую сцену.

Правее находятся источники, которые мы будем постепенно заполнять.

Начнем с добавления игры, которую будем транслировать. Нажимаем в источниках «плюс», выбираем «Захват игры».

Итак, вы собрали себе достойный компьютер, познали дао мидера в Dota 2 и решили таки запустить свою первую трансляцию. Или прокомментировать чей-нибудь матч. Разумеется, на Twitch.tv.

Поздравляем, вы только что в первый окунулись в невероятно бурную реку с крутым руслом и кучей подводных камней. К счастью, со всякими хитрыми вопросами типа вещания с хромакеем или комментирования крупных ивентов можно будет разобраться позже, а пока можно разобраться с базовыми проблемами.

Например, выбором оптимального битрейта.

Предлагаем вашему перевод блога одного из комментаторов студии Moonduck.TV Pimpmuckl’а, посвященный базовым настройкам стрима по Dota 2.

Битрейт - самый важный аспект стрима. Постараемся же выжать максимально возможное для вас качество.

Первым делом для этого нужно скачать тестер качества вашего трафика с Twitch.tv с сайта Team Liquid. Запускаем программу и убираем из теста все региона, кроме «домашнего». Тест по Европе, например, будет выглядеть вот так:

Отлично, теперь выбираем себе сервер с лучшим битрейтом/качеством, берем его тестовые результаты и вычитаем из них 500кбит/сек. Получившийся в результате показатель записываем себе как «максимальный битрейт». Сокращенно - макс-битрейт.

Если вам удалось добиться статуса партнера Twitch.tv (например, вы транслируете какой-нибудь турнир), то можете смело ставить тот же макс-битрейт как «максимальный битрейт» уже в настройках вашей стримеркой программы (например, Open Broadcaster Software > Настройки > Кодирование). Один нюанс: больше 3,500кбит/сек смысла ставить нет по той простой причине, что Twitch не пропустит такой большой поток.

Если же статуса партнера у вас нет, ваш потолок - 2,500. За этой границей стрим начнет лагать.

Также следует подумать о вашей целевой аудитории. Есть на земном шаре регионы, где с интернетом все не так хорошо, как в какой-нибудь Москве, и если у главных зрителей какого-нибудь локального ивента нет подключения быстрее 2мбит/сек, то лучше «успокоить» свой стрим до 1,500кбит/сек, чтобы избавить аудиторию от буфферинга.

Разрешение

Разрешение видео мы будем выставлять, отталкиваясь от битрейта:

500–1,000 кбит/сек: 480p 30fps
1,000–1,500: 540p 30fps
1,500–2,000: 720p 30fps
2,000–3,500: 720p 60fps
3,500: 900p 60fps

Напоминаем, что речь сейчас идет именно о трансляции Dota 2. даже не пытайтесь выставить на стриме CS:Go или Overwatch 900p60 или какого-нибудь другого FPS.

720p 60fps – золотой стандарт, к которому следует стремиться. И качество будет хорошее, и у всяких девайсов типа Chromecast с передачей такого потока проблем не будет.

Всякие мелочи

В «расширенных настройках» OBS можно дополнительно поиграться с оптимизацией. Например, подкрутить пресет x264 CPU, сменив значение «по умлочанию» veryfast на fast. Это, грубо говоря, даст прирост в качестве видео за счет большей нагрузки на CPU.

Правда, в 90% случаев таки лучше оставаться на veryfast и играться этим параметром, только если в вашем компьютере стоит очень хороший процессор.

Еще один прием для владельцев GCN AMD CPU: проставьте в расширенных настройках opencl=true, и система начнет работать чуть шустрее.

Nota bene: галочку напротив «Encode in Full Range» не ставим никогда. Раньше эта опция нужна была, так как некоторые программы типа VLC могли некорректно отображать цвета в видео, но сейчас такой проблемы не существует вовсе.

Если в вашем компьютере стоит не сильно мощный процессор, можно поменять параметр «Кодировщик». NVENC/AMD VCE гораздо меньше грузят компьютер, правда, в этом случае придется пожертвовать качеством видеопотока. Ставить Intel QuickSync также имеет смысл: по качеству потока эта опция заметно обгоняет предыдущие две, но до x264 все равно не дотягивает.

Ну и наконец, геймерам, играющим на карте с измененным ландшафтом (напомним еще раз, речь идет о Dota 2), на сравнительно слабых ПК лучше переключиться на стандартную карту. Ландшафт из Battle Pass последнего The International удушит любые попытки стриминга на бюджетном компьютере.

Правда, если уж ваше железо может потянуть этот ландшафт, видеопоток с кодировкой x264 получится даже чуть лучше по качеству. Соль в том, что арена Battle Pass сама по себе очень светлая, а в x264 яркие цвета «весят» меньше в битрейте/качестве, чем темные тона. Соответственно, «светлый» стрим будет выглядеть опрятнее, чем «темный» стрим с тем же самым битрейтом.

Тем не менее, моим основным выбором все-таки является ландшафт по умолчанию.

Развенчание популярных мифов о цифровом звуке.

2017-10-01T15:27

Audiophile"s Software

Примечание : для лучшего понимания нижеизложенного текста очень рекомендую ознакомиться с основами цифрового звука .

Также многие затронутые ниже моменты освещены в моей публикации «Ещё раз о печальной правде: откуда на самом деле берётся хорошее звучание?» .

Чем больше битрейт, тем качественнее трек

Это далеко не всегда так. Для начала напомню, что такое битрейт (bitrate, а не bitraid). Фактически это скорость потока данных в килобитах на секунду при воспроизведении. Т. е., если мы возьмем размер трека в килобитах и разделим на его продолжительность в секундах, получим его битрейт - т. н. file-based bitrate (FBR), обычно он не слишком отличается от битрейта аудиопотока (причиной различий является наличие в треке метаданных - тегов, «вшитых» изображений и т. п.).

Теперь возьмем пример: битрейт несжатого PCM аудио, записанного на обычном Audio CD, рассчитывается следующим образом: 2 (канала) × 16 (бит на каждый семпл) × 44100 (семплов в секунду) = 1411200 (бит/с) = 1411.2 кбит/с. А теперь возьмём и сожмём трек любым lossless кодеком («lossless» - «беспотерьный», т. е. такой, который не приводит к потере какой-либо информации), например кодеком FLAC. В результате мы получим битрейт ниже исходного, но качество при этом останется неизменным - вот вам и первое опровержение.

Сюда ещё кое-что стоит добавить. Битрейт на выходе при lossless сжатии может получиться самый разный (но, как правило он меньше, чем у несжатого аудио) - зависит это от сложности сжимаемого сигнала, а точнее от избыточности данных. Таким образом, более простые сигналы будут сжиматься лучше (т. е. имеем меньший размер файла при такой же продолжительности => меньший битрейт), а более сложные - хуже. Именно поэтому классическая музыка в lossless имеет меньший битрейт, чем, скажем, рок. Но надо подчеркнуть, что битрейт тут ни в коем случае не является показателем качества звукового материала.

Теперь поговорим о lossy сжатии (с потерями). Прежде всего надо понимать, что существует множество разных кодеров и форматов, и даже в пределах одного формата качество кодирования у разных кодеров может отличаться (например, QuickTime AAC кодирует намного качественнее устаревшего FAAC), не говоря уже о превосходстве современных форматов (OGG Vorbis, AAC, Opus) над MP3. Проще говоря, из двух одинаковых треков, закодированных разными кодерами с одним битрейтом, какой-то будет звучать лучше, а какой-то - хуже.

Кроме того, существует такое понятие, как апконверт . Т. е., можно взять трек в формате MP3 с битрейтом 96 кбит/с и конвертировать его в MP3 320 кбит/с. Мало того, что при этом качество не улучшится (ведь потерянные при предыдущем кодировании в 96 кбит/с данные уже не вернуть), оно даже ухудшится. Тут стоит указать, что на каждом этапе lossy кодирования (с любым битрейтом и любым кодером) в аудио вносится определенная порция искажений.

И даже более. Есть еще один нюанс. Если, скажем, битрейт аудиопотока - 320 кбит/с, это не значит, что все 320 кбит ушли на кодирование той самой секунды. Это характерно для кодирования с постоянным битрейтом и для тех случаев, когда человек, надеясь получить максимальное качество, форсирует слишком большой постоянный битрейт (как пример - установка 512 кбит/с CBR для Nero AAC). Как известно, количество бит, выделяемое на тот или иной фрейм, регулируется психоакустической моделью. Но в случае, когда выделенное количество намного ниже установленного битрейта, то не спасает даже резервуар бит (о терминах читайте в статье «Что такое CBR, ABR, VBR?») - в итоге мы получаем бесполезные «нулевые биты», которые просто «добивают» размер фрейма до нужного (т. е. увеличивают размер потока до заданного). Кстати, это легко проверить - сожмите полученный файл архиватором (лучше 7z) и посмотрите на степень сжатия - чем она больше - тем больше нулевых битов (т. к. они приводят к избыточности), тем больше зря потраченного места.

Кодеки lossy (MP3 и прочие) способны справитьcя c современной электронной музыкой, но не способны качественно закодировать классическую (академическую), живую, инструментальную музыку

«Ирония судьбы» здесь в том, что на самом деле всё с точностью до наоборот. Как известно, академическая музыка в подавляющем большинстве случаев следует мелодическим и гармоническим принципам, а также инструментальному составу. С математической точки зрения это обуславливает относительно простой гармонический состав музыки. Так преобладание консонансов продуцирует меньшее количество побочных гармоник: например, для квинты (интервал, в котором основные частоты двух звуков различаются в полтора раза) общей для двух звуков будет каждая вторая гармоника, для кварты, где частоты различаются на одну треть - каждая третья, и т. п. Кроме того, наличие фиксированных соотношений частот, обусловленных использованием равномерно темперированного строя, также упрощает спектральный состав классической музыки. Живой инструментальный состав классики обуславливает отсутствие в ней шумов, характерных для электронной музыки, искажений, резких скачков амплитуды, а также отсутствие избытка высокочастотных составляющих.

Перечисленные выше факторы приводят к тому, что классическая музыка намного легче сжимается, прежде всего, чисто математически. Если вы помните, математическое сжатие работает за счёт устранения избыточности (описывая похожие фрагменты информации с использованием меньшего количества битов), а также за счёт предсказания (т. н. предикторы предсказывают поведение сигнала, а затем кодируется только отклонение реального сигнала от предсказанного - чем точнее они совпали, тем меньше битов нужно для кодирования). В данном случае относительно простой спектральный состав и гармоничность обуславливают высокую избыточность, устранение которой даёт значительную степень компрессии, а малое количество всплесков и шумовых компонентов (являющихся случайными и непредсказуемыми сигналами) обуславливает хорошую математическую предсказуемость подавляющей части информации. И это я уже не говорю об относительно небольшой средней громкости классических треков и о часто встречающихся промежутках тишины, для кодирования которых информация практически не требуется. В итоге мы можем без потерь сжать, например, некоторую сольную инструментальную музыку до битрейтов ниже 320 кбит/с (кодеры TAK и OFR на такое вполне способны).

Так вот, во-первых, дело в том, что математическое сжатие, лежащее в основе lossless кодирования, является также и одним из этапов lossy кодирования (читайте Понятно об MP3 кодировании). А во-вторых, т. к. в lossy используется преобразование Фурье (разложение сигнала на гармоники), то простота спектрального состава даже вдвойне облегчает кодеру работу. В итоге, сравнивая оригинальный и закодированный семпл классической музыки в слепом тесте, мы с удивлением обнаруживаем, что никаких отличий найти не можем, даже при относительно низком битрейте. И самое смешное - что когда мы начинаем совсем понижать битрейт кодирования, первое, что обнаруживает отличия - фоновые шумы в записи.

Что же касается электронной музыки - с ней кодерам приходится очень нелегко: шумовые составляющие имеют минимальную избыточность, и вместе с резкими скачками (какими-нибудь пилообразными импульсами) являются крайне непредсказуемыми сигналами (для кодеров, которые «заточены» под естественные звуки, ведущие себя совершенно иначе), прямое же и обратное преобразование Фурье с отбросом отдельных гармоник психоакустической моделью неминуемо даёт эффекты пре- и пост-эхо, слышимость которых кодеру далеко не всегда легко оценить... Добавьте еще к этому высокий уровень ВЧ составляющих - и получите большое количество киллер-семплов, с которыми на средне-низких битрейтах не справляются даже наиболее продвинутые кодеры, как ни странно, именно среди электронной музыки.

Также забавляют мнения «опытных слухачей» и музыкантов, которые при полном непонимании принципов lossy кодирования начинают утверждать, что они слышат, как инструменты в музыке после кодирования начинают фальшивить, частоты плавают и т. п. Это, возможно, ещё было бы справедливо для допотопных кассетных плееров с детонацией, но в цифровом аудио всё точно: частотная составляющая либо остаётся, либо отбрасывается, смещать тональность тут попросту нет надобности. Более того: наличие у человека музыкального слуха совершенно не означает наличие у него хорошего частотного слуха (например, способности воспринимать частоты >16 кГц, которая с возрастом сходит на нет) и отнюдь не облегчает ему задачу поиска артефактов lossy кодирования, т. к. искажения эти имеют характер очень специфический и требуют опыта слепого сравнения именно lossy аудио - надо знать, на чём и где искать.

DVD-Audio звучит лучше, чем Audio CD (24 бита против 16-ти, 96 кГц против 44.1 и т. п.)

К сожалению, люди обычно смотрят только на цифры и очень редко задумываются о влиянии того или иного параметра на объективное качество.

Рассмотрим для начала разрядность. Этот параметр отвечает не за что иное, как за динамический диапазон, т. е., за разницу между самым тихим и самым громким звуками (в дБ). В цифровом аудио максимальный уровень - это 0 dBFS (FS - full scale), а минимальный - ограничен уровнем шумов, т. е., фактически динамический диапазон по модулю равен уровню шумов. Для 16-битного аудио динамический диапазон рассчитывается как 20 × log 10 2 16 , что равняется 96.33 вБ. При этом динамический диапазон симфонического оркестра - до 75 дБ (в основном около 40-50 дБ).

А теперь представим реальные условия. Уровень шума в комнате - около 40 дБ (не забываем, что дБ - величина относительная. В данном случае за 0 дБ принимается порог слышимости), максимальная громкость музыки достигает 110 дБ (чтобы не было дискомфорта) - получаем разность 70 дБ. Таким образом получается, что динамический диапазон более 70 дБ в данном случае просто бесполезен. Т. е. при диапазоне выше или громкие звуки будут достигать болевого порога, или тихие звуки будут поглощаться окружающими шумами. Достичь уровня окружающих шумов менее 15 дБ очень трудно (так как на этом уровне находится громкость человеческого дыхания и прочих шумов обусловленных, человеческой физиологией), в итоге диапазон в 95 дБ для прослушивания музыки оказывается совершенно достаточным.

Теперь о частоте дискретизации (частота семплирования, sample rate). Этот параметр отвечает за частоту квантования по времени и непосредственно влияет на максимальную частоту сигнала, которую можно описать данным представлением аудио. По теореме Котельникова она равна половине частоты дискретизации. Т. е. для обычной частоты семплирования в 44100 Гц максимальная частота составляющих сигнала - 22050 Гц. Максимальная же частота. которая воспринимается человеческим ухом - чуть выше 20000 Гц (и то, при рождении; по мере взросления порог опускается до 16000 Гц).

Лучше всего данная тема раскрыта в статье Загрузки в формате 24/192 - почему они не имеют смысла .

Разные программные плееры звучат по-разному (e. g. foobar2000 лучше Winamp и т. п.)

Чтобы понять, почему это не так, надо разобраться, что собой представляет программный плеер. По сути это декодер, обработчики (опционально), плагин вывода (на один из интерфейсов: ASIO, DirectSound, WASAPI. etc.), ну и конечно же GUI (графический интерфейс пользователя). Т. к. декодер в 99.9 % случаев работает по стандартному алгоритму, а плагин вывода - это всего лишь часть программы, которая передает поток звуковой карте через один из интерфейсов, то причиной различий могут быть только обработчики. Но дело в том, что обработчики обычно по-умолчанию выключены (или должны быть выключены, т. к. главное для хорошего плеера - уметь передать звук в «первозданном» виде). В итоге, предметом сравнения тут могут быть только возможности обработки и вывода, в которых, кстати говоря, необходимости очень часто вообще нет. Но даже если такая необходимость и есть - то это уже сравнение обработчиков, а никак не плееров.

Разные версии драйвера звучат по-разному

В основании этого утверждения лежит банальное незнание принципов работы звуковой карты. Драйвер - это программное обеспечение, необходимое для эффективного взаимодействия устройства с операционной системой, также обычно предоставляющее графический интерфейс пользователя для возможности управления устройством, его параметрами и т. д. Драйвер звуковой карты обеспечивает распознавание звуковой карты как звукового устройства Windows, сообщает ОС о поддерживаемых картой форматах, обеспечивает передачу несжатого PCM (в большинстве случаев) потока на карту, а также даёт доступ к настройкам. Кроме того, в случае наличия софтовой обработки (средствами CPU), драйвер может содержать различные DSP (обработчики). Потому, во-первых, при отключенных эффектах и обработке, если драйвер не обеспечивает точную передачу PCM на карту, это считается грубейшей ошибкой, критическим багом. И случается такое крайне редко . С другой стороны, различия между драйверами могут быть в обновлении алгоритмов обработки (ресемплеров, эффектов), хотя это случается тоже отнюдь не часто. К тому же, для достижения наивысшего качества эффекты и любую обработку драйвером всё равно следует исключать.

Таким образом, обновления драйверов в основном ориентированы на повышение стабильности работы и устранение ошибок, связанных с обработкой. Ни то, ни другое в нашем случае на качество воспроизведения не влияет, потому в 999 случаях из 1000 драйвер влияния на звук не оказывает.

Лицензионные Audio CD звучат лучше, чем их копии

Если при копировании не произошло ошибок (неустранимых) чтения/записи и у оптического привода устройства, на котором будет воспроизводится диск-копия, нет проблем с его чтением, то такое утверждение ошибочно и легко опровергается .

Режим кодирования Stereo дает лучшее качество, чем Joint Stereo

Это заблуждение главным образом касается LAME MP3, так как все современные кодеры (AAC, Vorbis, Musepack) используют только режим Joint Stereo (и это уже о чём-то говорит)

Для начала стоит упомянуть, что режим Joint Stereo успешно используется при lossless сжатии. Суть его заключается в том, что сигнал перед кодированием раскладывается на сумму правого и левого канала (Mid) и на их разность (Side), а затем происходит отдельное кодирование этих сигналов. В пределе (для одинаковой информации в правом и левом канале) получается двойная экономия данных. А так как в большинстве музыки информация в правом и левом каналах довольно схожа, то этот метод оказывается очень эффективным и позволяет значительно увеличить степень сжатия.

В lossy принцип тот же. Но здесь в режиме постоянного битрейта качество фрагментов со схожей информацией в двух каналах будет увеличиваться (в пределе - удваиваться), а для VBR режима в таких местах будет просто уменьшаться битрейт (не забываем, что главная задача VBR режима - стабильно поддерживать заданное качество кодирования, используя минимально возможный битрейт). Так как во время lossy кодирования приоритет (при распределении битов) отдаётся сумме каналов, чтобы избежать ухудшения стереопанорамы, используется динамическое переключение между режимами Joint Stereo (Mid/Side) и обычным (Left/Right) стерео на базе фреймов. Кстати говоря, причиной данного заблуждения послужило несовершенство алгоритма переключения в старых версиях LAME, а также наличие режима Forced Joint, в котором автопереключение отсутствует. В последних версиях LAME режим Joint включен по умолчанию и менять его не рекомендуется.

Чем шире спектр, тем качественнее запись (о спектрограммах, auCDtect и частотном диапазоне)

В наше время на форумах, к несчастью, очень распространено измерение качества трека «линейкой по спектрограмме». Очевидно, по причине простоты такого способа. Но, как показывает практика, в действительности всё намного сложнее.

А дело тут вот в чем. Спектрограмма визуально демонстрирует распределение мощности сигнала по частотам, но не может дать полного представления о звучании записи, наличии в ней искажений и артефактов компрессии. Т. е., по сути всё, что можно определить по спектрограмме, - это частотный диапазон (и частично - плотность спектра в районе ВЧ). Т. е., в лучшем случае, путем анализа спектрограммы можно выявить апконверт. Сравнение же спектрограмм треков, полученных путем кодирования различными кодерами, с оригиналом - полнейший абсурд. Да, вы сможете выявить различия в спектре, но вот определить, будут ли они (и в какой степени) восприниматься человеческим ухом - практически невозможно. Нельзя забывать, что задача lossy кодирования - обеспечить результат неотличимый человеческим ухом от оригинала (никак не глазом).

Это же относится и к оценке качества кодирования путём анализа треков на выходе программой auCDtect (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect - это лишь оболочки для единственной в своем роде консольной программы auCDtect). Алгоритм auCDtect тоже фактически анализирует частотный диапазон и всего лишь позволяет определить (с определенной долей вероятности), было ли на каком-либо из этапов кодирования применено MPEG сжатие. Алгоритм заточен под MP3, потому его легко «обмануть» с помощью кодеков Vorbis, AAC и Musepack, так что даже если программа пишет «100% CDDA» - это не значит, что закодированное аудио на 100% соответствует исходному.

И возвращаясь непосредственно к спектрам. Популярно также стремление некоторых «энтузиастов» во что бы то ни было отключить lowpass (НЧ) фильтр в кодере LAME. Здесь на лицо непонимание принципов кодирования и психоакустики. Во-первых, кодер обрезает высокие частоты только с одной целью - сэкономить данные и использовать их для кодирования наиболее слышимого диапазона частот. Расширенный частотный диапазон может фатально сказаться на общем качестве звучания и привести к слышимым артефактам кодирования. Более того, отключение среза на 20 кГц - вообще совершенно неоправданно, так как частоты выше человек попросту не слышит.

Существует некая «волшебная» предустановка эквалайзера, способная значительно улучшить звучание

Это не совсем так, во-первых, потому, что каждая отдельно взятая конфигурация (наушники, акустика, звуковая карта) обладает своими собственными параметрами (в частности, своей амплитудно-частотной характеристикой). И потому к каждой конфигурации должен быть свой, уникальный подход. Проще говоря, такая предустановка эквалайзера существует, но она отличается для разных конфигураций. Суть же её заключается в корректировке АЧХ тракта, а именно - в «выравнивании» нежелательных провалов и всплесков.

Также среди людей далеких от непосредственной работы со звуком очень популярна настройка графического эквалайзера «галочкой», что фактически представляет собой повышение уровня НЧ и ВЧ составляющих, но в то же время приводит к приглушению вокала и инструментов, спектр звучания которых находится в районе средних частот.

Перед конвертированием музыки в другой формат следует «разжимать» её в WAV

Сразу отмечу, что под WAV подразумеваются PCM данные (импульсно-кодовая модуляция) в контейнере WAVE (файл с расширением *.wav). Эти данные представляют собой не что иное, как последовательность битов (нулей и единиц) группами по 16, 24 или 32 (в зависимости от разрядности), каждая из которых представляет собой двоичный код амплитуды соответствующего ей семпла (например, для 16 бит в десятичном представлении это значения от -32768 до +32768).

Так вот, дело в том, что любой обработчик звука - будь то фильтр или кодер - как правило работает только с этими значениями, то есть только с несжатыми данными. Это значит, что для преобразования звука, скажем, из FLAC в APE, просто необходимо сначала декодировать FLAC в PCM, а затем уже закодировать PCM в APE. Это как для перепаковки файлов из ZIP в RAR, надо сначала распаковать ZIP.

Однако, если вы пользуетесь конвертером или просто продвинутым консольным кодером, промежуточное преобразование в PCM происходит на лету, иногда даже без записи во временный WAV файл. Именно это и вводит людей в заблуждения: кажется, что форматы конвертируются непосредственно один в другой, но на самом деле в такой программе обязательно есть декодер входного формата, выполняющий промежуточное преобразование в PCM.

Таким образом, ручное преобразование в WAV не даст вам совершенно ничего, кроме лишней траты времени.