ПН-ПТ с 10:00 до 19:00

Звукорежиссура без звукорежиссера. Как современные автоматические алгоритмы обработки звука могут заменить человека

27.03.2014 Статьи

При работе с комплексными системами звукоусиления время от времени возникают ситуации, когда управление звуком необходимо, а возможности задействовать штатного и тем более приглашенного звукорежиссера нет. В таком случае полагаться приходится исключительно на автоматику, которая сегодня может не только заменить человека, но и превзойти его. Автоматические системы управления звуком сегодня широко применяются на объектах самого разного типа. Университеты, больницы, религиозно-культовые, спортивные, развлекательные и правительственные учреждения, объекты бизнес- и транспортной инфраструктуры сегодня едва ли могут обойтись без системы маршрутизации и усиления звука, где, в свою очередь, щедро применяются автоматические алгоритмы обработки и управления. В данной статье мы рассмотрим принципы работы таких алгоритмов на примере конференц-зала, хотя, разумеется, это далеко не единственная область их применения.

Принципы работы систем для конференц-залов

Существуют разные типы конференц-залов: переговорные комнаты, залы заседаний, залы телеконференций, залы суда, аудитории и помещения для проведения семинаров и так далее. Но каким бы конкретным целям ни служил конференц-зал, его главное назначение — создание условий для общения между людьми. Для повышения эффективности коммуникации в конференц-залах используется система звукоусиления. В идеале звуковая система должна быть настроена так, чтобы участники переговоров в принципе не замечали ее присутствия и общались абсолютно естественно, как если бы каждый из них сидел прямо напротив другого. Иными словами, главным требованием к системе звукоусиления в конференц-зале является обеспечение комфортного, чистого и разборчивого звука. При проведении конференции каждый ее участник рассчитывает на то, что он в любой момент может что-то сказать в свой микрофон. И если высказаться захотят сразу несколько участников, то некоторое количество микрофонов окажется активным одновременно. Однако в этом случае возникает целый ряд проблем, которые приводят к снижению качества звука:

ухудшение соотношения сигнал-шум
снижение порога возникновения обратной связи
появление эффекта гребенчатого фильтра

Данные проблемы могут быть решены отключением неиспользуемых и ограничением числа одновременно включенных микрофонов. Это означает, что во время дискуссии кто-то (или что-то) должен следить за дискуссией и во-время включать или выключать соответствующие микрофоны. Причем нужно понимать, что в случае если эту задачу выполняет человек, то отдельные реплики, уточнения, пояснения участников, внезапно вступивших в обсуждение, могут быть потеряны.

Эффективно справиться с этой задачей способен только автоматический микшер (автомикшер) — устройство или алгоритм, формирующее микс только из нужных сигналов за счет автоматического отключения или ослабления сигналов неиспользуемых микрофонов. В современных цифровых аудиоплатформах, таких как Biamp AudiaFLEX или Biamp Tesira, автомикшер представлен в виде отдельного программного блока, все параметры которого удобно настраиваются в программном обеспечении. Рассмотрим подробнее, как действует автомикшер при решении вышеуказанных проблем.

Блок распределяющего автомикшера в программном обеспечении медиаплатформы Biamp Tesira

Соотношение сигнал/шум

Допустим, перед нами стоит задача озвучить конференцию, включающую 20 участников. Если все 20 микрофонов «открыты» и только в один из них говорит участник, то остальные 19 микрофонов включены, но улавливают лишь фоновый шум. Каждый следующий «открытый» микрофон увеличивает уровень улавливаемого шума, поэтому такой режим работы приводит к снижению качества звука.

Чтобы улучшить соотношение сигнал/шум в общем миксе, самым разумным решением было бы оставить открытыми лишь те микрофоны, которые в настоящий момент используются, а неиспользуемые — отключить. Проще всего предложить участникам самим нажимать кнопку включения/выключения на микрофоне. Но часть людей в пылу дискуссии рано или поздно забудет сделать это, и мы снова столкнемся с проблемой большого числа «открытых» микрофонов.

Возникает вопрос: а не можем ли мы автоматически выключать микрофон, если в него не поступает нужный сигнал? Для этого как раз и предназначено такое средство, как автомикшер. Это устройство (аппаратное или программное) отключает неиспользуемые микрофоны, а при появлении сигнала заданного уровня — моментально активирует. При этом автомикшер избавляет звуковой тракт от свиста, гула, реверберационных отражений и других посторонних звуков, характерных для одновременной работы нескольких микрофонов.

Обычный автомикшер (gating automixer) просто включает нужные микрофоны и выключает те из них, которые в настоящий момент не используются. Кроме того, он позволяет ограничить количество «открытых» микрофонов, что в настройках автомикшера обычно носит название NOM (Number of Open Microphones). Главной особенностью такого автомикшера является небольшая задержка в момент открытия микрофона, что приводит к потере начальных слогов во фразе говорящего («шум» превращается в «ум», а «что» — в «то»). Более интеллектуально эту задачу решает другой тип автомикшера, называемый распределяющим (gainsharing automixer). При его работе микрофоны всегда немного «приоткрыты», то есть получают небольшое усиление, точнее, определенная величина усиления равномерно распределена между всеми микрофонами. Усиление активного микрофона резко возрастает, что приводит к пропорциональному снижению усиления остальных. Это обеспечивает микс постоянного уровня при любом количестве включенных микрофонов. С другой стороны, особенностью работы распределяющего автомикшера является ограничение количества микрофонов, с которыми он может эффективно работать. Это связано с тем, что при большом количестве микрофонов разница между уровнем активных (усиленных) и неактивных микрофонов будет невелика ввиду пропорционального распределения усиления. Для обычного автомикшера большое количество микрофонов не является проблемой.

Равномерное распределение усиления неактивных микрофонов

Распределение усиления в пользу активного микрофона

Распределение постоянной величины усиления между всеми микрофонами в системе

Тем не менее, указанная особенность распределяющего автомикшера эффективно преодолевается в платформе Biamp Tesira — здесь разработчики ввели специальный коэффициент, позволяющий осуществить тонкую подстройку такого автомикшера в условиях работы с большим количеством микрофонов. При высоких значениях этого коэффициента распределяющий автомикшер фактически функционирует как обычный.

Если конференция проходит на самом высоком уровне, цена ошибки оператора особенно высока

Порог возникновения обратной связи

Проблема появления обратной связи в звуковой системе обычно возникает при превышении определенного порога громкости. При включении каждого следующего микрофона этот порог снижается, обратная связь возникает раньше, и мы вынуждены уменьшать уровень громкости всей системы. Понятно, что в этих условиях система все хуже выполняет свою основную задачу — усиливать звук. Решением этой проблемы будет снижение уровня усиления каждого канала при активации следующего микрофона. Принцип работы распределяющего автомикшера подразумевает, что это происходит автоматически. В обычном же автомикшере за приглушение микрофонов с роcтом их числа отвечает отдельная функция —аттенюатор (NOMA — Number of Open Microphones Attenuator). Таким образом, при использовании любого автомикшера происходит компенсация общего уровня усиления, что предотвращает возникновение обратной связи.

Гребенчатый фильтр

Гребенчатый фильтр является еще одной проблемой, с которой можно столкнуться, включая одновременно большое количество микрофонов. Данный эффект возникает из-за того, что голос говорящего попадает в разные микрофоны с разной задержкой. Объединение сигналов с этих микрофонов в миксе приводит к фазовым искажениям, крайне неприятным для слуха. Эффект гребенчатого фильтра закономерно снижается при ограничении количества открытых микрофонов, что как раз и является главной функцией автомикшера.

Дополнительные функции

Помимо перечисленных основных функций, в автомикшер могут быть встроены вспомогательные алгоритмы, поднимающие качество звука на еще более высокий уровень.

Как правило, перед автомикшером в системе рекомендуется использовать левелер для поддержания на постоянном уровне сигналов на входах автомикшера. В медиаплатформе Tesira для решения этой задачи служит алгоритм AGC (Automatic Gain Control, автоматическое управление усилением) с встроенной технологией SpeechSense. Основной функцией AGC является приведение микрофонных сигналов к заданному уровню перед поступлением их в автомикшер. Использование алгоритма AGC актуально ввиду того, что участники конференции ведут себя неодинаково: кто-то говорит тише, кто-то громче, кто-то предпочитает располагаться ближе к микрофону, а кто-то — откинуться на спинку стула, удаляясь от микрофона. Если не привести эти сигналы к единому уровню, то их присутствие в миксе будет неравномерным. Кроме того, может возникнуть ситуация, когда микрофоном пользуется спикер с манерой говорить тихо, и вместо того чтобы увеличить чувствительность микрофона, неквалифицированный оператор поднимет общий уровень усиления в системе, а затем забудет вернуть его к прежнему значению. В результате будет превышен порог возникновения обратной связи, и система выйдет из-под контроля. Эти особенности поведения участников могут быть компенсированы за счет алгоритма AGC.

Для определения целевого сигнала в платформе Tesira дополнительно используется уникальная технология SpeechSense. Данная технология распознает в сигнале человеческую речь (причем неважно, мужскую, женскую или детскую). Это позволяет обеспечить усиление только в случае, если сигнал действительно является речью. Многолетний опыт компании Biamp Systems в разработке подобных интеллектуальных алгоритмов обеспечивает безупречную работу технологии SpeechSense, окончательно сводя на нет необходимость участия звукорежиссера в процессе работы системы звукоусиления в конференц-зале.

Алгоритмы AGC и SpeechSense делают микрофоны более универсальными, позволяют не настраивать их раз и навсегда при сдаче системы в эксплуатацию, поскольку автоматически адаптируют их под каждого пользователя. Это особенно актуально для микрофона, расположенного на центральной трибуне, где разные участники выступают друг за другом. И снова здесь более не требуется работа звукорежиссера, который бы в реальном времени на слух подстраивал чувствительность микрофона.

Надо сказать, что использование AGC с технологией SpeechSense позволяет автомикшеру еще более эффективно справляться с перечисленными ранее проблемами использования большого количества «открытых» микрофонов. Определенные настройки AGC позволяют не усиливать голос удаленного спикера (см. иллюстрацию), даже если дополнительный микрофон расположен достаточно близко и алгоритм определяет присутствие человеческой речи в сигнале.

Еще одним способом улучшения качества звука является использование технологии микс-минус. Если кратко, это удаление сигнала, улавливаемого микрофоном, из микса, который транслируется громкоговорителем, расположенным возле этого микрофона. Это нужно для того, чтобы предотвратить возникновение обратной связи. Раньше микс-минус создавался путем смешения сигнала с микрофона в противофазе с общим миксом. Современные же цифровые аудиоплатформы позволяют сформировать индивидуальный микс для каждого громкоговорителя при помощи матричных микшеров.

Значение SNR (соотношение сигнал-шум) предотвращает реагирование AGC на речь удаленного участника, даже если уровень его речи превышает заданный порог

Немалое значение имеет и другой тип обработки звука — автоматический аттенюатор (в англоязычной терминологии — ducker). Этот модуль обработки позволяет автоматически приглушить менее приоритетный сигнал при появлении сигнала более приоритетного (приоритетность определяется входом блока, на который подается тот или иной сигнал). Как только алгоритм обработки определяет наличие сигнала на более приоритетном входе, сигналы с других входов автоматически приглушаются. В реальной ситуации приоритетным может считаться сигнал с микрофона председателя по отношению к сигналам с микрофонов других участников, или же сигнал с любого микрофона по отношению к фоновой музыке.

В рамках данной статьи мы рассказали лишь о некоторых наиболее часто применяемых алгоритмах автоматической обработки звука. Эти алгоритмы позволяют существенно облегчить работу с системой звукоусиления в конференц-зале, а также снижают или полностью сводят на нет необходимость участия звукорежиссера. Автоматические алгоритмы сегодня доступны в составе аудиаплатформ, таких как Biamp AudiaFLEX или Biamp Tesira. Некоторые новейшие алгоритмы представляют собой «черные ящики», внутри которых зашиты запатентованные разработки производителя, что облегчает инсталляторам настройку и упрощает работу с системой. И самое приятное, что эти и другие алгоритмы являются набором по умолчанию при покупке современных цифровых медиаплатформ. То есть все эти функции объединены в одном относительно небольшом, но мощном устройстве — процессоре цифровой обработки сигнала.

Медиаплатформа Biamp Tesira

Следует отметить, что в медиаплатформе Biamp Tesira доступен еще целый ряд интеллектуальных модулей обработки звука, применяемых в иных условиях, нежели обслуживание конференции. Например, алгоритм подавления акустического эха (AEC, Acoustic Echo Cancellation), который служит для улучшения качества звука при использовании систем удаленной конференц-связи, или алгоритм компенсации фонового шума (ANC, Ambient Noise Compensation). Все эти алгоритмы позволяют создать систему звукоусиления, которая будет автоматически подстраиваться под действия людей и изменяющиеся условия в помещении без участия звукорежиссера.

Таким образом, система больше не нуждается в жесткой настройке в момент сдачи в эксплуатацию. Теперь она способна самостоятельно управлять звуком. При этом пользователи могут забыть о том, что в помещении вообще есть система звукоусиления. Нет больше необходимости вникать, как именно система выполняет свои задачи и насколько инновационные идеи лежат в основе ее работы. Благодаря использованию современных алгоритмов обработки звука система звукоусиления становится интеллектуальной и при этом удивительно простой в эксплуатации.

Джемма Злыднева. ARIS

ООО "Арис" сохраняет за собой право изменять цены без предварительного уведомления.