PETELIN.RU | Статьи | Во власти звука. Часть 1
surround,Dolby,Digital,AC-3
PETELIN.RU > Статьи > Во власти звука. Часть 1

Во власти звука. Часть 1

Роман Петелин, Юрий Петелин

Современный кинотеатр. Современный фильм (разумеется, американский). На экране каскад эффектов и трюков: герой-одиночка в очередной раз спасает мир. Представители темных сил штабелями падают под его ударами. Затем, конечно, оживают, множатся и вновь падают… Фильм захватывает вас, заставляет забыть обо всем. Изображение великолепно: яркое, четкое, красочное, динамичное. А звук! Кажется, будто пули "вжикают" прямо возле уха. Чуть слышный шелест возникает где-то вдали позади и слева - и вот он уже превращается в оглушительный рокот двигателя. Мгновение - автомобиль проносится рядом с вами и вскоре вместе с сопровождающим его звуком исчезает в лабиринте улиц и домов где-то впереди и справа.

Если происходит взрыв, так такой, что кажется, вот-вот зрители начнут вылетать из кресел. Стук каблуков по асфальту явственно слышен где-то позади. Создается впечатление, будто это именно вас преследует по пятам злодей из фильма. Музыка, то мощная и энергичная, то густая и тягучая, то прозрачная и звонкая заполняет собой окружающее пространство. Со всех сторон слышны какие-то вздохи, невнятное бормотание, низкочастотный гул, который, похоже, вы ощущаете уже и не ушами, а то ли всем телом, то ли непосредственно мозгом. Вы во власти звука, вы порабощены им. Вы живете, умираете и воскресаете вместе с героем фильма. Вы устаете от его усилий, любите его любовью и боитесь его страхами…

Как удалось создателям фильма взять под контроль ваше сознание, погрузить вас в фантастический мир, в котором действительность неотличима от вымысла? Чудо? Нет, просто квазиобъемный, многоканальный звук - surround. А если уж говорить о чуде, то оно заключается в том, что создать подобный звук теперь можете и вы. Причем, для этого не понадобится арендовать студию звукозаписи, расположенную где-нибудь в Голливуде. Достаточно владеть компьютером, недорогой звуковой картой и уметь работать со специальными программами.

Конечно, мы не беремся в короткой статье научить вас конструировать виртуальные звуковые миры. Этой проблеме посвящено много наших книг (причем, довольно толстых), которые при желании вы сможете найти. Просто рассчитываем в очередной раз показать, что современные средства обработки звука могут служить великолепной иллюстрацией существования магии ПК.

Немного истории, или от stereo к surround

С тех пор, как существует звукозапись, и слушатели, и конструкторы аппаратуры испытывают неистребимое желание сделать звук, записанный и затем воспроизведенный, в максимальной степени похожим на оригинал. Чего только не делают разработчики аудиотехники для того, чтобы приблизиться к идеалу: сражаются с шумом, минимизируют искажения, расширяют частотный и динамический диапазоны элементов тракта записи-передачи-воспроизведения звукового сигнала. А кроме всего прочего они стремятся заставить звуковое поле, создаваемое акустическими системами, передавать слушателю информацию о направлении на источники звуков и об акустических свойствах того помещения, в котором производилась запись.

На начальном этапе своего развития звукозапись и радиовещание были монофоническими. Звук, раздающийся из динамика, до неузнаваемости отличался от живого звука концертного зала: искаженный баланс между различными музыкальными инструментами, искаженный тембр и, главное, полностью утраченная пространственность. Это очень серьезный недостаток. Ведь слуховой анализатор человека обладает способностью к пеленгации источников звука, что помогает нам ориентироваться в пространстве. Если же все звуки исходят из одной точки - это кажется противоестественным.

Первые эксперименты по получению объемного звучания проводились еще в 30-е годы прошлого века. Сравнительные испытания многоканальных и монофонических систем дали удивительные результаты. Было установлено, что при воспроизведении даже 2-х раздельных каналов субъективное качество звука резко улучшается. А самое поразительное заключается в том, что эксперты предпочитали стереозвук даже в тех случаях, когда им предъявляли объективно более качественные, но монофонические фонограммы. Решающим преимуществом стала возможность пространственной локализации кажущихся источников звука (рис. 1).


Рис. 1. Распределение кажущихся источников звука на стереопанораме

На первом этапе разработчики решили ограничиться двумя каналами. Это, конечно, в первую очередь было обусловлено небогатыми возможностями аппаратуры тех времен: грампластинки реально позволяли разместить сигналы только двух полноценных каналов. Стереозвук дает некоторую прозрачность звучания: партии отдельных инструментов становятся более различимыми на фоне оркестра. Кроме того, стереосистема способна воспроизвести подобие звуковой атмосферы помещения, в котором выполнялась запись. Постепенно появились стереофонические грампластинки и стереопроигрыватели, стереомагнитофоны, стереофоническое радиовещание. Однако и стереозвучание лишено естественности реального звукового поля, а стереопанорама ограничена углом между направлениями на громкоговорители и получается плоской.

Одной из первых попыток преодоления недостатков, присущих стереофоническим системам, стала квадрофония (для воспроизведения используются 4 акустические системы). Первые бытовые квадросистемы появились в начале 70-годов прошлого века. Казалось, что их ждет славное будущее. Однако ожидания не сбылись. Свою роль сыграли несовершенство и большая стоимость приборов четырехканальной записи-воспроизведения. Но главное заключается в другом: с переходом от "стерео" к "квадро" в те времена новое качество звука не возникло. При квадрофонии 70-годов прошлого века не получалась круговая стереопанорама - слушатель ощущал обычную стереопанораму перед собой и еще одну стереопанораму сзади себя. Все мнимые источники звука располагались в одной плоскости на линиях между динамиками, поэтому объемного звучания по-прежнему не было. Эти недостатки обусловлены не столько ограниченными возможностями четырехканального воспроизведения звука, сколько трудностями реализации панорамирования кажущихся источников звука при записи. При подготовке фонограмм для современных многоканальных систем этот фактор учитывается. Важную роль при этом играет именно компьютер, способный справиться с моделированием объемных реверберационных процессов и предоставляющий звукорежиссеру удобные регуляторы для перемещения источников звука по круговой панораме. Но в те далекие времена квадрофония отступила, а стереофония победила и продолжила развитие по линии миниатюризации аппаратуры, улучшения ее технических и потребительских качеств, перехода к новым носителям - компакт-кассетам и компакт-дискам. Перед звукозаписывающими компаниями и производителями аудиоаппаратуры все еще существовал широчайший фронт работ и емкий рынок сбыта. В который раз они предлагали слушателям смену фонотек. Накопленный за предшествующие десятилетия музыкальный материал, обновленный и адаптированный сначала под монофонические катушечные магнитофоны, затем реализованный на компакт-кассетах в стереоформате, в очередной раз предлагался меломанам, но теперь уже на лазерных дисках.

Однако на границе двух веков стереофония, кажется, все-таки начала сдавать свои позиции. Цифровые технологии записи звука, а также емкие, удобные и дешевые носители сняли ранее существовавшую проблему хранения многоканальных фонограмм большой длительности. Кроме того, в звуке, передающем акустические свойства окружающего пространства, появилась острая потребность. Виртуальные графические миры компьютерных игр становятся все более сложными и похожими на реальность, а, значит, требуют и адекватного звукового оформления. Кинематограф, переживший кризис в состязании с телевидением, возродился в виде домашних кинотеатров и кинозалов нового формата, основное отличие которых от предшественников кроется не в изображении, а в принципиально новом звуке (хотя и качество изображения тоже улучшилось, благодаря DVD и современным проекционным средствам).

Новая эра в звукозаписи началась в результате исследований, выполненных инженерами Dolby Laboratories (http://dolby.com). Это был принципиально новый подход к передаче многоканального звука. Отличие от традиционного способа заключалось, прежде всего, в том, что для хранения аудиосигналов двух дополнительных каналов использовалось матричное кодирование, т. е. их подмешивание к основным двум каналам. Изменился и способ размещения акустических систем - дополнительно к традиционному для квадрофонии расположению акустических систем (по углам помещения) добавлен центральный канал, размещенный между правым и левым фронтальными каналами, чтобы сохранить широкую стереобазу для зрителей, сидящих на боковых местах, а за спинами размещен канал эффектов. Так появилась система нового кинотеатрального звучания Dolby ® Stereo. Впервые формат Dolby ® Stereo был применен в фильме "Star Wars" в 1975 году.

Системой воспроизведения совершенно нового качества, совместимой со старым стандартом звукозаписи, стала система Dolby ® Pro Logic ®. В ней был применен декодер, реализующий пространственную фокусировку звуковых образов - технологию, используемую для снижения взаимного проникновения сигналов одного канала в другой. В Dolby ® Pro Logic ® также появилась возможность создавать задержку звукового сигнала в тыловом канале. Тем самым было обеспечено согласование геометрических и акустических характеристик конкретного помещения, с характеристиками "эталонного кинозала", под который при производстве сводится многоканальный звук.

А потом наступила эпоха цифрового кодирования и цифровой записи многоканального объемного звука, и появилась система Dolby® Digital. Для кодирования цифрового звука в ней используется алгоритм, называемый AC-3 (Dolby's third generation audio coding algorithm - алгоритм кодирования звука Dolby третьего поколения). AC-3 представляет собою алгоритм компрессии многоканального звука (количество независимых каналов от 1 до 6) с потерями. Достижения в области психоакустики, учитывающие особенности человеческого слухового аппарата, используются в нем для принятия решения о том, какую часть информации в аудиосигнале можно отбросить, чтобы это было не очень заметно для слушателя. Объемность акустических сцен, более чёткая детализация, естественность перемещений источников звука из фронтальной области в тыловую, стереофоническое звучание в тыловой области - все это обеспечило успех системы.

Следующий шаг эволюции систем объемного звучания - система Dolby® Digital EX, которую можно считать надстройкой над Dolby® Digital. В Dolby® Digital EX, как и в Dolby® Digital физически может кодироваться до 6 независимых каналов (5.1), однако, за счет использования матричного кодирования, в левый и в правый тыловые каналы подмешивается информация еще одного или двух surround-каналов. Благодаря такому решению сохранена совместимость с оборудованием Dolby® Digital, и в то же время, за счет введения дополнительных surround-каналов (6.1, 7.1) на оборудовании Dolby® Digital EX достигается еще больше высокая точность локализации звуковых источников в пространстве.

В настоящее время можно говорить о распространении нового потребительского формата: DVD-audio. Звуковые данные на этом носителе могут храниться с использованием различных алгоритмов кодирования, включая Dolby® Digital. Однако в связи с большой емкостью носителя DVD (4,7 Гб на однослойном диске) необходимость сжатия звуковой информации с потерями отпадает. На DVD-audio можно хранить многоканальные записи в формате вплоть до 24-бит/96 кГц без какого либо сжатия и, соответственно, без каких-либо потерь.

Формат 5.1

Основным потребительским форматом фонограмм пространственного звучания в настоящее время является формат 5.1. Обозначение "5.1" указывает на количество каналов, но не несет в себе информации о каком-либо определенном способе кодирования многоканального звука. Используется пять каналов с полным частотным диапазоном (левый передний, центральный, правый передний, левый задний и правый задний), а также один низкочастотный канал (с диапазоном от 3 до 120 Гц), подключаемый к сабвуферу (рис. 2).


Рис. 2. Размещение излучателей звука в системе 5.1

В системе 5.1 формируется круговая панорама. Поскольку на сверхнизких частотах наш слух практически лишен способности определять направление на источник звука, место расположения сабвуфера не имеет существенного значения. Сабвуфер применяется и в обычных стереосистемах. В его канал подается низкочастотная часть спектра суммарного сигнала стереоканалов, в результате чего обеспечивается гарантированное воспроизведение басовых звуков. Однако в системе 5.1 канал низкочастотных эффектов играет особую роль. Его стоит рассматривать не как низкочастотную компоненту многополосной акустической системы, а именно как независимый канал низкочастотных эффектов.

По мнению специалистов, формат 5.1 является наиболее перспективным, поскольку поддерживается основными разработчиками. Важно, что имеются подходящие носители (DVD).

И хотя пока не принят единый стандарт и одновременно существует несколько систем кодирования для 5.1, однако фиаско "первобытной" квадрофонии вряд ли повторится, даже если "выживет" не одна, а несколько различных систем кодирования. Принципиальное отличие формата 5.1 от квадрофонии тридцатилетней давности заключается в том, что в данном случае аудиосигнал имеет цифровую форму, поэтому создание универсального декодера, способного работать со звуком, закодированным различными системами, не вызовет особых трудностей и не приведет к заметному удорожанию аппаратуры.

В успехе формата 5.1 заинтересованы производители аудио-, видеоаппаратуры, компьютеров, компьютерных комплектующих и программ. К нему с интересом относятся потребители: зрители, слушатели, геймеры. Звукорежиссеры и музыканты находят в этом формате новые выразительные средства для реализации творческих замыслов и усиления влияния на наши эмоции. Формат действительно придает воспроизводимому звуку новое качество: слушатель окружен им. Правда, виртуальный звуковой мир и в этом случае не дотягивает до реального. В синтезированном звуковом пространстве источник звука может находиться справа, слева, спереди, сзади, перемещаясь в этих "координатах". А у настоящего звукового пространства, кроме того, есть еще "верх" и "низ".

Особенности сведения в круговую панораму

Основным инструментом сведения многоканального звука является микшер, снабженный средствами панорамирования. В стереоформате для размещения кажущегося источника звука в определенном месте предназначен регулятор панорамы. Им вы устанавливаете относительные уровни звуковых сигналов, которые подаются в каждый из двух каналов и, тем самым, определяете положение источника звука между двумя акустическими системами. При работе с многоканальным звуком вам надо управлять аналогичным процессом в 5 каналах, кроме того, конечно, требуется также регулировать и канал сабвуфера. Поэтому при использовании традиционного микшера для позиционирования одного источника звука необходимо манипулировать несколькими регуляторами. Заметим, что состояние фейдеров, управляющих уровнем сигнала, и регуляторов панорамы в каждом канале трудно сопоставить с положением кажущегося источника звука на круговой панораме. Еще сложнее заставить звук перемещаться по заданной траектории. Это возможно только в микшерах с автоматизацией. В качестве регулятора круговой панорамы в микшере, предназначенном для работы с многоканальным звуком, очень подошел бы джойстик.

Ко всему прочему, микшер, способный работать с объемным звуком, должен иметь не один, а несколько выходов (по числу каналов). Например, в системе 5.1 у микшера должно быть не менее 6 выходов. Оборудование стереофонической студии звукозаписи стоит недешево, а уж о цене студии формата 5.1 и подумать страшно!

Дороговаты также и устройства записи многоканального звука. Они должны иметь 6 и более каналов. Причем крайне желательно, чтобы звук в них представлялся не менее чем 24 разрядами.

Микшеры и цифровые магнитофоны - устройства, многоканальные по своей сути. Поэтому некоторые из моделей, предназначенных для работы со стереозвуком, можно с большим или меньшим удобством применять и в студии формата 5.1. А вот с эквалайзерами, приборами динамической обработки и особенно эффектами дело обстоит сложнее. Конечно, можно обеспечить 6 каналов, собрав "батарею" из 3-х двухканальных приборов. Однако об осмысленной регулировке параметров в этом случае говорить не приходится.

Достойной заменой цифровым магнитофонам и аппаратным микшерам могут служить программные мультитрековые студии и имеющиеся в составе некоторых из них виртуальные микшеры, позволяющие управлять панорамированием с помощью обычной мыши.

Не всякий владелец домашней студии стереофонического формата может позволить себе иметь мониторную акустическую стереосистему. Однако в случае сведения в стерео приемлемым выходом из положения являются относительно дешевые мониторные наушники. А в формате 5.1 стереонаушники вас не спасут. Без пяти широкополосных акустических систем (а также сабвуфера) не обойтись.

При работе со стереозвуком основными требованиями к мониторам являются: равномерность их частотной характеристики, низкий уровень искажений и полная идентичность двух акустических систем.

Аналогичные требования можно было бы предъявить и к пяти широкополосным мониторам формата 5.1. Они вроде бы тоже должны быть абсолютно одинаковыми. Но в таком случае сведение в круговую панораму вы будете осуществлять в условиях, отличающихся от тех, в которых будут находиться многие слушатели вашей композиции. Дело в том, что у большинства владельцев домашних театров тыловые акустические системы не только по мощности слабее фронтальных, но, кроме того, они могут иметь конструктивное исполнение другого типа. В свою очередь, центральная акустическая система зачастую отличается от крайних передних. Получается, что впечатление слушателя может не совпадать с тем, которое замышляли вы.

Что касается канала низкочастотных эффектов системы 5.1, то при сведении музыкальной композиции сабвуфер вообще не должен использоваться, если по художественному замыслу в музыкальной композиции не присутствует эффект типа взрыва, выстрела из пушки и т.п.

Серьезно занимаясь проблемой обработки звука, мы на протяжении многих лет внимательно следим за публикациями, имеющими отношение к этой теме. Поэтому можем уверенно констатировать, что работ, посвященных вопросам технологи сведения в стерео, не так уж и много. А вот статей, содержащих конкретные рекомендации по созданию многоканальных записей, практически нет совсем. Видимо, это можно объяснить тем, что проблема нова, отсутствует необходимый опыт, нет сложившихся традиций. Во всяком случае, самостоятельные музыкальные произведения, сведенные в круговую панораму, еще не стали массовым явлением. Многоканальный звук, в основном, существует как дополнение к видеоизображению. Ясно, что подходы к панорамированию звука для саундтрека кинофильма и звука музыкальной композиции, должны отличаться. При сопровождении видео требуется размещать основной звук спереди, так как именно на экране перед зрителем происходит действие. Задние каналы используются для придания звуку объема и реализации специальных эффектов. Конечно, при работе с surround-музыкой можно ориентироваться на наработки, имеющиеся в области создания звука для современной кинопродукции. Т. е. можно поместить основной звук спереди, а тыловые каналы использовать для воссоздания акустики окружающей среды и перемещения второстепенных источников звука. И все же, если речь идет о музыкальном произведении, которое создается без расчета на увязку с видеосюжетом, то автор может пользоваться полной свободой в применении новых выразительных средств, заложенных в собственно круговой панораме. Например, вы можете "посадить" слушателя среди исполнителей, передвигать вокруг него все звуковое поле или отдельные источники звука, перемещать их в "глубину" панорамы.

Правда, спецэффекты панорамирования лучше использовать в меру. Например, вряд ли есть смысл конструировать виртуальный рояль, клавиатура которого, судя по звучанию, выглядит окружностью, охватывающей слушателя. Звуки ударных, помещенных в тыловые каналы, и особенно внезапные громкие звуки, раздающиеся сзади, вполне могут стать причиной, по которой ваше песня не станет хитом. Мало кому понравится, если придется то и дело рефлекторно оборачиваться или подскакивать от испуга.

При подготовке стереофонических записей мы вынуждены сознательно ограничивать себя в использовании возможностей стереопанорамы применительно к некоторым музыкальным инструментам. Причем ограничения продиктованы не только художественными, но и техническими соображениями. Например, совершенно нет смысла смещать бас с центра стереопанорамы. Во-первых, потому, что, все равно, в области низких частот стереоэффект проявляется очень слабо. Во-вторых, если бас панорамировать влево или вправо, то мощность одной из акустических систем не будет использоваться в полной мере. Аналогичные проблемы имеются и в системах 5.1, хотя задачу формирования низкочастотных звуков здесь решает сабвуфер. Одна из таких проблем - использование центрального канала. В кино он предназначен для привязки доминирующих звуков к изображению, чтобы зрители, сидящие не по центру, воспринимали эти звуки исходящими с экрана. В музыке те звуки, которые в стерео обычно направляются в левый и правый каналы равномерно (основной вокал, бас, часть барабанов), лучше распределять между центральным и фронтальными каналами. Это позволит избежать перегрузки центрального канала. Кроме того, различимость звуков увеличивается, если одни из них больше направлять в центральный канал, а другие - одновременно в левый и правый передние каналы.

При сведении в круговую панораму появляется дополнительные признаки, по которым слух может выделять отдельные партии: направление на источник звука в пределах 360 и, в какой-то мере, расстояние до него (глубина панорамы). Поэтому нет особой необходимости производить частотную фильтрацию с целью выделения одних звуков на фоне других, а также изменять громкость инструментов по ходу песни или компрессировать отдельные аудиосигналы.

Все, о чем мы рассказали выше, может показаться вам фантастикой, которую способны превратить в реальность лишь таинственные владельцы коммерческих студий-гигантов. Однако в эпоху бурного расцвета компьютерных технологий многие сказки становятся былью. В последнее время разработчики наиболее продвинутого музыкального "софта" считают своим долгом дополнять очередные версии средствами обработки многоканального звука. О некоторых из таких программ и пойдет речь во второй части статьи.

Продолжение