PETELIN.RU > Статьи > Динамическая обработка аудиосигналов на ПК. Часть I
Уроки музыки на
компьютере
Урок 10.
Динамическая обработка
аудиосигналов на ПК.
Часть I
Юрий Петелин
В предыдущей
статье я рассказал о программных
средствах устранения шума и
искажений звука, в том числе
перечислил те операции по
"звукочистке", которые
необходимо проделать с записью
песни, начиная с исправления ошибок
в установке микрофона и завершая
мастерингом, выполненным так, чтобы
группа композиций, записанная на
диск, с эстетической точки зрения
представляла собой единое целое.
Данная тема настолько серьезна, что
ей стоит посвятить несколько
ближайших статей.
Начну, как и в
прошлый раз, с основного тезиса:
звук, записанный любителем в
условиях домашней компьютерной
студии, хотя, конечно, и не
сравнится по качеству с
результатами работы
профессиональных студий, но может
быть приближен к ним.
Пишу, а краем уха
слушаю, что там бубнит телевизор.
Вот фильм, отрекомендованный в
анонсе, как "суперпроект". Царь
Петр при смерти, борьба за престол.
Страсти бушуют... По другим каналам
следователь Турецкий отыскивает
похищенные раритетные фолианты,
знатоки тряхнули стариной и снова
ведут свое следствие, потому что,
оказывается, все еще "кто-то
кое-где у нас порой честно жить не
хочет"… Такие разные истории, но
что-то общее в них есть. Это общее -
звук. Плохой звук. Ужасный звук,
записанный профессионалами в
профессиональных студиях. Особенно
в "суперпроекте": когда на
мгновения стихают стоны умирающего
царя и крики приближенных,
отчетливо проступают фоновые
звуки, даже становится слышно, как
работают лентопротяжные механизмы
камер.
Напрашиваются
такие выводы:
1. Ясно, что в нашей
стране фильмы давно уже не
переозвучивают в звуковой студии.
Наверное, денег на это нет. Каким
записан звук на съемочной площадке,
таким и идет в смонтированную
ленту.
2. Некоторые
профессионалы не применяют
средства компьютерного
шумоподавления. Не очень понятно,
почему. Не знают о них? Некогда
почитать специальную литературу?
Но и элементарных сведений, что
содержатся на пяти страницах моей
предыдущей статьи, для начала
хватило бы.
3. Некоторые из тех
людей, кто занимаются записью звука
для телефильмов, не умеют применять
приборы динамической обработки.
Как раз о
динамической обработке мы сейчас
поговорим. Тема эта сложная, но если
вы сосредоточитесь, то обязательно
все поймете, и звук в ваших проектах
станет профессиональным. Ну не
профессиональным, а любительским,
но таким, что все им заслушаются.
Сомневающимся предлагаю оценить
работы читателей, записанные на
диске, который сопровождает новую
книгу "Sonar. Секреты
мастерства". Кстати, ничто не
мешает вам попробовать свои силы. В
музыкальном сборнике на следующем
подобном диске вполне может
оказаться и ваша композиция.
Итак, динамическая
обработка. Формально она
заключается в изменении
динамического диапазона
аудиосигналов. Но для применения ее
во благо качеству звука этой фразы
явно недостаточно. Поэтому начнем с
начала.
Уровень и
динамический диапазон звукового
сигнала
Источник звуковых
колебаний излучает в окружающее
пространство энергию. Количество
звуковой энергии, проходящей за
секунду через площадь в 1 м2,
расположенную перпендикулярно
направлению распространения
звуковых колебаний, называют
интенсивностью (силой) звука.
Когда мы ведем
обычный разговор, мощность потока
энергии приблизительно равен 10
мкВт. Мощность самых громких звуков
скрипки может составлять 60 мкВт, а
мощность звуков органа - от 140 до 3200
мкВт.
Человек слышит
звук в чрезвычайно широком
диапазоне звуковых давлений
(интенсивностей). Одной из опорных
величин этого диапазона является
стандартный порог слышимости -
эффективное значение звукового
давления, создаваемого
гармоническим звуковым колебанием
частоты 1000 Гц, едва слышимым
человеком со средней
чувствительностью слуха.
Порогу слышимости
соответствует интенсивность звука
Iзв0 = 10-12 Вт/м2 или звуковое давление
pзв0 = 2Ч10-5 Па.
Верхний предел
определяется значениями Iзв. макс. =
1 Вт/м2 или pзв. макс. = 20 Па. При
восприятии звука такой
интенсивности у человека
появляются болевые ощущения.
В области звуковых
давлений, существенно превышающих
стандартный порог слышимости,
величина ощущения пропорциональна
не амплитуде звукового давления
pзв, а логарифму отношения pзв/pзв0.
Поэтому звуковое давление и
интенсивность звука часто
оценивают в логарифмических
единицах децибелах (дБ) по
отношению к стандартному порогу
слышимости.
Диапазон
изменения звуковых давлений от
абсолютного порога слышимости до
болевого порога составляет для
разных частот от 90 дБ до 130 дБ.
Если ухо человека
воспринимает одновременно два или
несколько звуков различной
громкости, то более громкий звук
заглушает (поглощает) слабые звуки.
Происходит так называемая
маскировка звуков, и ухо
воспринимает только один, более
громкий, звук. Сразу после
воздействия на ухо громкого звука
снижается восприимчивость слуха к
слабым звукам. Эта способность
называется адаптацией слуха.
Таким образом,
порог слышимости в значительной
степени зависит от условий
прослушивания: в тишине или же на
фоне шума (или другого мешающего
звука). В последнем случае порог
слышимости повышается. Это
свидетельствует о том, что помеха
маскирует полезный сигнал.
Слуховой аппарат
человека обладает определенной
инерционностью: ощущение
возникновения звука, а также его
прекращения появляется не сразу.
Аудиосигнал
является случайным процессом. Его
акустические или электрические
характеристики непрерывно
изменяются во времени. Пытаться
отследить случайные изменения
реализаций этого хаоса - занятие,
имеющее не много смысла. Обуздать
его величество случай, придать ему
черты детерминированности можно,
используя усредненные параметры,
такие, как уровень аудиосигнала.
Уровень
аудиосигнала характеризует сигнал
в определенный момент и
представляет собой выраженное в
децибелах выпрямленное и
усредненное за некоторый
предшествующий промежуток времени
напряжение аудиосигнала.
Под динамическим
диапазоном аудиосигнала понимают
отношение максимального звукового
давления к минимальному или
отношение соответствующих
напряжений. В таком определении нет
сведений о том, какое давление и
напряжение считается максимальным
и минимальным. Наверное, поэтому
определенный таким образом
динамический диапазон сигнала,
называется теоретическим. Наряду с
этим динамический диапазон
аудиосигнала можно определить и
экспериментально как разность
максимального и минимального
уровней для достаточно длительного
периода. Это значение существенно
зависит от выбранного времени
измерения и типа измерителя
уровней.
Динамические
диапазоны музыкальных и речевых
акустических сигналов разных
типов, измеренные с помощью
приборов, составляют в среднем:
- 80 дБ для
симфонического оркестра
- 45 дБ для хора
- 35 дБ для
эстрадной музыки и
солистов-вокалистов
- 25 дБ для речи
дикторов
При записи уровни
необходимо регулировать.
Объясняется это тем, что исходные
(необработанные) сигналы зачастую
имеют большой динамический
диапазон (например, до 80 дБ у
симфонической музыки), а в домашних
условиях аудиопрограммы
прослушиваются в диапазоне порядка
40 дБ.
Ручной
регулировке уровней присущ
недостаток. Время реакции
звукорежиссера составляет около 2 с
даже если партитура композиции ему
заранее известна. Это приводит к
погрешности в поддержании
максимальных уровней музыкальных
программ до 4 дБ в обе стороны.
Усилители,
акустические системы да и уши
человека нужно защищать от
перегрузок, вызванных резкими
скачкообразными изменениями
амплитуды аудиосигнала -
ограничивать сигнал по амплитуде.
Динамический
диапазон сигнала нужно
согласовывать с динамическими
диапазонами устройств записи,
усиления, передачи.
Для увеличения
дальности действия FM радиостанций
динамический диапазон
аудиосигнала нужно сжимать. Для
снижения уровня шума в паузах
динамический диапазон желательно
увеличивать.
В конце концов,
мода, диктующая свои условия во
всех сферах человеческой
деятельности, в том числе и в
звукозаписи, требует насыщенного,
плотного звучания современной
музыки, которое достигается резким
сужением ее динамического
диапазона.
Звуковая волна
(огибающая громкости) фрагмента
оперы С. Рахманинова "Алеко",
и современной
танцевальной музыки.
В классической
музыке важны нюансы, танцевальная
музыка должна быть
"сильнодействующей".
Этим диктуется
необходимость в применении
устройств автоматической
обработки уровней сигналов.
Устройства
динамической обработки
Устройства
автоматической обработки уровней
сигналов можно классифицировать по
ряду критериев, наиболее важные
среди них: инерционность
срабатывания и выполняемая
функция.
По критерию
инерционности срабатывания
различают безинерционные
(мгновенного действия) и
инерционные (с изменяющимся
коэффициентом передачи)
авторегуляторы уровня:
Когда на входе
безинерционного авторегулятора
уровень сигнала превышает
номинальное значение, на выходе
вместо синусоидального сигнала
получается трапецевидный. Хотя
безинерционные авторегуляторы
просты, их применение приводит к
сильным искажениям.
Инерционным
называется такой авторегулятор
уровня, у которого коэффициент
передачи автоматически изменяется
в зависимости от уровня сигнала на
входе. Эти авторегуляторы уровня
искажают форму сигналов только в
течение незначительного интервала
времени. Подбором оптимального
времени срабатывания такие
искажения можно сделать
малоощутимыми на слух.
В зависимости от
выполняемых функций инерционные
авторегуляторы уровня
подразделяют на:
Ограничители
квазимаксимальнных уровней
Автостабилизаторы
уровня
Компрессоры
динамического диапазона
Экспандеры
динамического диапазона
Компандерные
шумоподавители
Пороговые
шумоподавители (гейты)
Устройства со
сложным преобразованием
динамического диапазона
Основной
характеристикой устройства
динамической обработки служит
амплитудная характеристика -
зависимость уровня выходного
сигнала от уровня сигнала на входе.
Ограничитель
уровня (лимитер) - это
авторегулятор, у которого
коэффициент передачи изменяется
так, что при превышении
номинального уровня входным
сигналом уровни сигналов на его
выходе остаются практически
постоянными, близкими к
номинальному значению. При входных
сигналах, не превышающих
номинального значения,
ограничитель уровня работает как
обычный линейный усилитель.
Лимитер должен реагировать на
изменение уровня мгновенно.
Амплитудная характеристика
лимитера
Автостабилизатор
уровня предназначен для
стабилизации уровней сигналов. Это
бывает необходимо для выравнивания
громкости звучания отдельных
фрагментов фонограммы. Принцип
действия автостабилизатора
аналогичен принципу действия
ограничителя. Отличие заключается
в том, что номинальное выходное
напряжения автостабилизатора
приблизительно на 5 дБ меньше
номинального выходного уровня
ограничителя.
Компрессор -
такое устройство, коэффициент
передачи которого возрастает по
мере уменьшения уровня входного
сигнала. Действие компрессора
приводит к повышению средней
мощности и, следовательно,
громкости звучания
обрабатываемого сигнала, а также к
сжатию его динамического
диапазона.
Амплитудная характеристика
компрессора
Экспандер
имеет обратную по отношению к
компрессору амплитудную
характеристику. Применяют его в том
случае, когда необходимо
восстановить динамический
диапазон, преобразованный
компрессором.
Амплитудная характеристика
экспандера
Компандер -
система, состоящая из
последовательно включенных
компрессора и экспандера. Она
используется для снижения уровня
шумов в трактах записи или передачи
звуковых сигналов.
Пороговый
шумоподавитель (гейт) - это
авторегулятор, у которого
коэффициент передачи изменяется
так, что при уровнях входного
сигнала меньше порогового
амплитуда сигнала на выходе близка
к нулю. При входных сигналах,
уровень которых превышает
пороговое значение, пороговый
шумоподавитель работает как
обычный линейный усилитель.
Авторегуляторы
для сложного преобразование
динамического диапазона, имеют
несколько каналов управления.
Например, сочетание ограничителя,
автостабилзатора, экспандера и
порогового шумоподавителя
позволяет стабилизировать
громкость звучания различных
фрагментов композиции, выдерживать
максимальные уровни сигнала и
подавлять шумы в паузах.
Структура
устройств динамической обработки
Инерционный
регулятор уровня имеет основной
канал и канал управления. Если
сигнал подается в канал управления
со входа основного канала, мы имеем
дело с прямой регулировкой, а если с
выхода - с обратной.
Основной канал в
схеме с прямой регулировкой
включает в себя усилители звуковых
частот, линию задержки и
регулируемый элемент. Последний
под воздействием управляющего
напряжения способен изменять свой
коэффициент передачи. Основной
канал в схеме с обратной
регулировкой содержит в себе все
перечисленные элементы за
исключением линии задержки.
Принципиально
важные элементы канала управления -
детектор и интегрирующая
(сглаживающая) цепь. До тех пор пока
напряжение на входе схемы не
превышает порогового (опорного),
канал управления не вырабатывает
управляющего сигнала, и
коэффициент передачи
регулируемого элемента не
изменяется. При превышении порога
детектор вырабатывает импульсное
напряжение, пропорциональное
разности текущего значения сигнала
и опорного напряжения.
Интегрирующая цепь усредняет
разностное напряжение и
вырабатывает управляющее
напряжение, пропорциональное
уровню сигнала на входе канала
управления.
Линия задержки,
имеющаяся в основном канале схемы с
прямой регулировкой, позволяет
каналу управления работать с
некоторым упреждением. Всплеск
уровня сигнала будет обнаружен им
раньше, чем сигнал достигнет
регулируемого элемента. Поэтому
существует принципиальная
возможность устранения
нежелательных переходных
процессов. Перепады уровня могут
быть обработаны практически
идеально. Однако фазочастотная
характеристика аналоговой линии
задержки отлична от линейной.
Различие фазовых сдвигов для
разных спектральных составляющих
сигнала приводит к искажению формы
широкополосного сигнала при
прохождении линии задержки.
Цифровые линии задержки лишены
этого недостатка, но для их
применения сигнал необходимо
сначала оцифровать. В виртуальных
устройствах обработки сигнал
обрабатывается в цифровой форме, а
проблемы с алгоритмической
реализацией функциональных
элементов отсутствуют.
Временные
характеристики
Кроме величины
опорного (порогового) напряжения,
как правило, регулировать можно
время интегрирования сглаживающей
цепи. При малом времени
интегрирования канал управления
фактически является пиковым
измерителем уровня, при большом -
среднеквадратическим. В
высококачественных аппаратных
устройствах динамической
обработки (и во всех программных)
имеется возможность изменения
времени реакции канала управления
на события двух типов:
1. Превышение
порогового значения при
возрастании уровня сигнала (момент
включения устройства динамической
обработки).
2. Спад уровня
сигнала ниже порогового значения
(момент выключения устройства
динамической обработки).
Итак, задача
канала управления заключается в
обнаружении момента пересечения
аудиосигналом порога, измерении
уровня аудиосигнала относительно
порога и выработке управляющего
напряжения.
Существо
обработки зависит от вида
характеристики регулируемого
элемента основного канала.
Например, если с ростом
управляющего напряжения,
подаваемого на регулируемый
элемент, его коэффициент передачи
уменьшается, то получается
компрессор, если увеличивается, то
экспандер.
В основном канале,
как правило, можно также изменять
коэффициенты передачи усилителей и
время срабатывания регулирующего
элемента при его включении и
выключении. Чтобы реализовать
сложные алгоритмы динамической
обработки, нужно использовать не
один, а несколько основных каналов
и каналов управления.
Для оценки
инерционности устройств
динамической обработки введены две
временные характеристики: время
срабатывания и время
восстановления.
Для регулируемых
звеньев всех устройств
динамической обработки, кроме
шумоподавителя, срабатыванием
принято считать реакцию устройства
на увеличение уровня сигнала, а
восстановлением - на его
уменьшение. Для шумоподавителя это
соответственно уменьшение
усиления при пропадании полезного
сигнала и восстановление усиления
при появлении полезного сигнала.
На рисунке
приведен пример резкого увеличения
уровня сигнала (звуковая волна
вверху) и результата отработки
скачка уровня компрессором.
Заметна задержка в срабатывании
компрессора после появления скачка
и запаздывание с выключением после
завершения пика сигнала.
Проявление инерционности
устройства динамической обработки
Выбор временных
параметров устройств динамической
обработки в основном определяется
назначением и типом устройства.
Инерционные
ограничители уровня,
предназначенные для защиты мощных
усилительных и акустических систем
от перегрузок, должны иметь
минимальное (стремящееся к нулю)
время срабатывания. Однако с учетом
того, что аудиосигналы нарастают не
мгновенно, это теоретически
обоснованное требование на
практике смягчается. Для
ограничителей уровня выбирают
время срабатывания в пределах 0,5 - 1,0
мс, а время восстановления 1,5 с. Для
речевых компрессоров время
срабатывания должно составлять 1 - 2
мс, а время восстановления - 300 мс. У
музыкальных компрессоров эти
параметры, как правило, выбирают
оперативно в соответствии с
динамическими свойствами музыки.
Особенно критично время
восстановления.
Именно
неправильный выбор временных
параметров компрессора и является
одной из причин плохого звука в
фильмах, о которых шла речь в начале
статьи. Кроме этого: не те
микрофоны, не там расположены, не те
устройства динамической обработки,
шумящая аппаратура… Конечно,
звукооператоры могут ссылаться на
сложные условия записи звука в
неприспособленных помещениях. Но
все познается в сравнении. Если вы
иногда смотрите сериал "Убойная
сила 2", то не могли не заметить,
что в нем речь персонажей
разборчива, музыка в звуковую ткань
вплетена очень естественно, а звук
не замаскирован такими шумами,
которые бы не соответствовали
замыслу режиссера, даже в том
случае, когда съемки ведутся на
самом настоящем рынке.