Как определить, является ли звуковая дорожка микшированием Dolby Pro Logic II. в левый и правый канал

Рис. 7. Функциональная схема активного декодера Dolby Surround

Для примера возьмем случай, когда источник звука - единственный, и он расположен непосредственно у микрофона центрального канала С. Из рисунка видно, что пассивный декодер передаст сигнал центрального канала в выходной канал С, а также и в каналы R и L с ослаблением всего 3 дБ. Управляющая цепь активного декодера определяет, в каких каналах необходимо уменьшить усиление, чтобы подавить проникающие сигналы соседних каналов до необходимого уровня. В данном примере декодеру необходимо уменьшить усиление в каналах L и R, оставив слышимым сигнал канала С. Таким же образом можно развязать выход левого канала, уменьшив усиление в каналах С и S, когда на входе декодера присутствует только сигнал L t . Фактически, сигнал может приходить с любого направления.

Таким "прямым" методом проблема решается только для единственного звукового образа. Саундтрек содержит звуки нескольких независимых источников. Рассмотрим случай, когда речь звучит на фоне музыки. Музыка должна воспроизводиться акустическими системами левого и правого каналов, а речь - только системой центрального канала. Пассивный декодер с такой задачей не справится вообще. Речь будет воспроизводиться как системой центрального канала, так и системами левого и правого каналов. Стереофоническая музыка будет воспроизводиться системами L и R, кроме того, суммарный сигнал L+R будет прослушиваться через систему С, а разностный L-R - через систему S.

Активный декодер считает речь доминирующим звуковым образом (dominant sound), и уменьшает усиление каналов L и R, чтобы сфокусировать этот образ в направлении С. Но при этом теряется стереофоническая музыка, остается только монофонический звук суммы (L+R) в канале С и "фантомный" звук разности (L-R) в канале S. Если говорящие герои замолкают, декодер восстанавливает усиление каналов L и R, и музыка становится слышимой и наоборот, при возобновлении речи музыка пропадает. Такое явление "качания" (pumping) мощности не доминирующих звуковых образов в зависимости от мощности доминирующего хорошо ощутимо.

Другой способ избавиться от проникновения речевого сигнала в левый и правый каналы показан на рис. 8. Если взять сигнал правого канала, инвертировать его полярность и сложить с выходным сигналом левого канала - компоненты сигнала С в левом и правом каналах окажутся противофазными и взаимно компенсируются, таким образом, в канал L компоненты сигнала С не попадут.

Принцип взаимной компенсации (cancellation concept) - основной принцип активного декодирования и в том или ином виде используется во всех активных декодерах.

Рис. 8. Предотвращение проникновения речевого сигнала

в левый и правый канал

После исключения сигнала центрального мощность звука в левом канале не уменьшается, часть сигнала левого канала заменяется инвертированным сигналом правого канала. Кроме того, в центральном канале по-прежнему прослушивается суммарный сигнал L+R. В результате доминирующий звуковой образ (речь в канале С) фокусируется в направлении акустической системы С, а образы, соответствующие направлениям R и L, наоборот, "размазываются" в пространстве. Декодером используется один из принципов психоакустики, принцип маскирования (signal masking concept): воздействие доминирующего звукового образа временно снижает способность слушателя определять направления на другие звуковые образы. Так как мощность звуков, соответствующих этим образам, остается неизменной, "качание" (модуляция) этих звуков не наблюдается. В этом заключается другой принцип психоакустики - принцип постоянства мощности (constant-power concept). Выполняя принцип постоянства мощности в сочетании с активной взаимной компенсацией только в те моменты, когда требуется передача точного направления на звуковой образ, можно эффективно скрыть факт перераспределения мощности не доминирующих звуков.

Предполагается, что громкость речи намного выше громкости музыки, поэтому сигнал речи используется, как управляющий, сигнал музыки - как управляемый. В реальности разница уровней подобных сигналов может быть менее значительной. Если два разных звука близки по уровню, один из них становится маскирующим для компонентов другого, попавших не в "свои" каналы и наоборот, и требования к степени развязки снижаются. В таком случае требуется меньшая степень активной компенсации, и, соответственно, меньшая степень перераспределения не доминирующих сигналов по направлению.

Иногда желательно вообще исключить регулировку усиления, сделав декодер "пассивным". Например, звуки дождя или ветра воспринимаются слушателем на подсознательном уровне. Они не связываются с конкретным источником и могут воспроизводиться всеми громкоговорителями одновременно. В этом случае не требуется пространственной фокусировки звука, следовательно, и активного декодирования.

Крайний случай: два или более звуковых образа присутствуют одновременно на разных направлениях и имеют примерно одинаковую мощность. В этом случае способность слушателя к определению направления на образы притупляется, поэтому технику компенсации можно не использовать или использовать не в полной мере.

Чтобы обеспечить эффективное декодирование для обоих случаев, декодер Pro Logic автоматически выбирает один из режимов декодирования, "быстрый" или "медленный". "Быстрый" режим используется, если доминирующий звуковой образ намного мощнее других образов. Если такие образы возникают на разных направлениях последовательно во времени, декодер должен последовательно воспроизвести их на соответствующих направлениях. В "медленном" режиме декодер отслеживает изменения входных сигналов с большей задержкой. В таких условиях маскирование проявляется слабо, поэтому, если декодер продолжит работу в "быстром" режиме, модуляция мощности не доминирующих образов станет заметной.

По определению, в каждый момент времени может существовать только один доминирующий образ, и ему соответствует единственное направление. Декодеру необходимо в любой момент времени иметь информацию о точном направлении на доминирующий образ, независимо от того, как быстро меняется пространственная звуковая картинка. Анализируя две пары электрических сигналов, соответствующих ортогональным осям декодера (левый-правый каналы, центральный канал-surround) можно однозначно идентифицировать любое направление в пространстве.

Рис. 9. Активный декодер Dolby Surround Pro Logic

Основой декодера Pro Logic является адаптивная матрица Pro Logic. В адаптивной матрице существуют два параллельных канала: канал прохождения входных сигналов L t и R t к суммирующей цепи и сложный канал управления. Большая часть электронных компонентов декодера используются для анализа входных сигналов и генерации сигналов управления, и относительно небольшая их часть занята собственно в обработке сигнала.

Главная задача управляющей цепи - определить параметры вектора доминирующего звукового образа. Сначала входные сигналы декодера нормируются, чтобы исключить ошибки, связанные с различием характеристик каналов передачи. Полосовой фильтр отсекает низкочастотные составляющие, не несущие информацию о направлении, и высокочастотные составляющие, и фазы которых сильно зависят от фазовых характеристик физических каналов.

Декодер Dolby Surround Pro Logic - П .

Pro Logic II - активный декодер Dolby Surround следующего поколения. Он также использует пространственную фокусировку, но реализован принципиально другими методами. Новый декодер получился намного проще и при этом эффективнее.

Задача декодера - предотвратить проникновение сигналов L и R в канал S, независимо от того, где находится источник сигнала - точно между микрофонами L и R, смещен от центра в ту или иную сторону или вообще находится непосредственно рядом с микрофоном одного из каналов. Например, если герои ведут диалог между микрофонами каналов R и С (права от центра), то уровень сигнала в каналах С и R будет одинаковым. В этом случае часть сигнала неизбежно проникнет на выход S пассивного декодера, так как уровень в канале L ниже, чем в канале R, и при вычитании одного сигнала из другого результат не будет нулевым.

Чтобы полностью компенсировать сигналы L и К на входах декодера surround, необходимо перед подачей на сумматор выровнять их уровни. Для этого между входами L t и R t и входами сумматора устанавливаются два регулируемых усилителя (VCA). Усиление VCA двух каналов изменяется одним и тем же управляющим сигналом, но в разной полярности. Если увеличивается усиление одного VCA, усиление второго уменьшается. Если такую регулировку осуществлять достаточно точно и достаточно синхронно с изменениями самого сигнала, можно полностью подавить разностный сигнал каналов L t и R t в канале Surround.

Чтобы автоматически отследить изменения входных сигналов, используется специальная цепь отрицательной обратной связи (feedback servo circuit). Выходные сигналы обоих VCA поступают на амплитудные детекторы (Full-Wave Rectifier, FWR), которые выделяют огибающую звуковых сигналов. Сигналы постоянного тока, пропорциональные амплитудам сигналов L и R, сравниваются дифференциальным усилителем. Сигнал с выхода усилителя, пропорциональный разности амплитуд, используется для управления VCA. Ha рисунке 10 показана только одна ось декодера (ось "левый -правый"). Вторая пара VCA с такой же управляющей цепью выравнивает уровни сигналов суммы L+R (фронтальный) и разности L-R (тыловой) для подавления сигналов С и S в каналах R и L (ось "центр - surround"). Сигнал центрального канала С получается сложением (вместо вычитания) двух сигналов L t и R t , выровненных по уровню усилителями VCA. Благодаря использованию управляющих цепей с обратными связями, декодер Pro Logic II приобрел следующие преимущества:

Простыми и дешевыми аппаратными средствами достигается более эффективная компенсация противофазных сигналов в выходной матрице, и, как результат, высокая степень развязки между каналами разных осей.

В декодере Pro Logic обе оси контролируются единой переключающей цепью "быстро/медленно". Если хотя бы по одной оси существует значительное доминирование, переключающая цепь переводит обе оси в "быстрый" режим, принудительно изменяя постоянную времени управляющих цепей VCA. Только при условии, что в обеих осях амплитуды сигналов примерно одинаковы, обе они переходят в "медленный" режим. В декодере Pro Logic II две оси функционируют независимо друг от друга, поэтому их управляющие цепи сами "решают", насколько быстро необходимо изменять усиление VCA, анализируя только собственные сигналы. Кроме того, постоянная времени управляющей цепи в декодерах Pro Logic II изменяется непрерывно, тогда как в Pro Logic предусмотрено только два фиксированных значения.

Рис. 1 1 . Декодер Dolby Surround Pro Logic - П .

Декодер Pro Logic II может быть использован как универсальный декодер не только для фильмов, но и для других звуковых записей в Dolby Surround. Он идеально подходит для простой и недорогой бытовой аппаратуры. Именно поэтому в декодер Pro Logic II, кроме "штатного" режима Movie, был добавлен "пользовательский" режимы работы - Music.

Известно, что характеристики звука на саундтреках фильмов и на музыкальных записях отличаются. Главное отличие в том, что саундтрек пишется на калиброванной аппаратуре Dolby, поэтому при прослушивании через калиброванный декодер точность воспроизведения гарантируется. При записи музыки, как правило, не используется аппаратура Dolby Surround, поэтому невозможно предугадать, как конкретная запись будет воспроизводиться декодером. Поэтому режим Movie декодера Pro Logic II имеет фиксированные параметры, а режим Music, напротив, предполагает несколько настроек пользователя. Эти настройки могут быть использованы в любой аппаратуре с декодером Pro Logic II, но особенно они актуальны в автомобильной акустике, где положение акустических систем фиксировано, а положение "основного" слушателя может изменяться.

Регулировка глубины. Позволяет виртуально перемещать положение слушателя в направлении фронт-тыл. С помощью этой настройки можно добиться оптимального баланса между фронтальными каналами и surround для каждой музыкальной записи.

Регулировка положения центра и ширины стереобазы. С помощью этой настройки пользователь может сконфигурировать декодер таким образом, что звук, соответствующий центральному положению звукового образа, будет прослушиваться только в акустической системе центрального канала, только в системах левого и правого каналов (виртуальный центральный канал) или во всех трех системах с любой комбинацией уровней. Таким образом можно изменять баланс трех фронтальных каналов для оптимального прослушивания, например, водителем и пассажиром автомобиля. В домашней системе можно таким изменять ширину стереобазы - расстояния между акустическими системами фронтальных каналов, не перемещая сами системы.

Режим панорамы. В этом режиме создается впечатление "звучания со всех сторон сразу". Такой эффект достигается использованием естественного отражения акустической энергии систем surround от боковых стен помещения.

Dolby Digital АС-3

Dolby Digital АС-Зили как его еще называют Dolby Digital 5.1 появился в конце 80-х и был разработан для 35-мм пленки. С приходом этого стандарта нас ожидало несколько новшеств. Во-первых, был разработан шестиканальный стандарт, в котором появилась возможность использования сабвуфера, или как его еще называют LFE-channel (Low Frequency Effect). Во-вторых, S-канал перестал быть моно. То есть, в системе 5.1 мы имеем в наличии SL и SR- каналы (Surround Left и Surround Right). Громкоговорители всех каналов кроме LFE являются широкополосными. Впервые стандарт предложил возможности сжатия динамического диапазона. При этом стандарт АС-3 предусматривает компрессию данных. Сейчас скорость цифрового потока аудиоданных Dolby Digital составляет 320 кбит/сек и больше. Главная особенность Dolby Digital AC-3 - это его масштабируемость (рис.12).

Рис. 12. Масштабирование Dolby Surround 5.1.

Например, мы написали музыку в стандарте 5.1. При этом пользователь может ее прослушать без потерь в качестве в 5.1 (5.0), четырехканальном варианте Pro Logic, в обыкновенном стерео и даже в моно. И теперь представьте как это выгодно и пользователям и производителям. Компьютерные и видео-игры нового поколения само собой подразумевают наличие звука 5.1. При этом, пользователи, не имеющие расширенных вариантов акустических систем не будут чувствовать себя дискомфортно -система будет масштабироваться под параметры системы, имеющейся в наличии. Многие спутниковые телеканалы вещают в 5.1, но это ни как не отражается на большинстве зрителей, имеющих телевизоры с моно-звуком.

Используемая в Dolby Digital схема компрессии данных АСЗ обладает очень высокой эффективностью (коэффициент сжатия может быть более 12:1, поддерживаемая скорость передачи от 64 до 448 кбит/с) и при этом довольно высоким субъективным качеством звука. АСЗ, как и все современные схемы сжатия данных звуковых потоков (в частности, МРЗ), использует в своей работе особенности слухового восприятия человека, или психоакустическую модель. Например, в присутствии громкого сигнала некоторой частоты более тихие и имеющие немного более высокую или низкую частоту звуки маскируются громким сигналом, то есть не слышны или слышны очень плохо. Также маскируются сигналы, звучащие после и даже перед громким звуком. Это явление позволяет не кодировать или кодировать с меньшей разрядностью маскируемые звуки. Компрессия данных осуществляется также путем недеструктивного избавления от избыточной информации, примерно по тем же алгоритмам, которые применяются в архиваторах ZIP или RAR. Для реализации этих схем входящий поток аудиоданных разбивается во времени - на перекрывающиеся блоки (фреймы) по 512 сэмплов, при частоте дискретизации 48 кГц это составляет 10,66 мс, если же в сигнале присутствуют резкие перепады уровня, то размер блока уменьшается вдвое, чтобы качественно передать эти быстрые скачки; и по частоте - весь звуковой диапазон в 24000 Гц разбивается на 256 сегментов, что дает ширину каждой полосы в 93,75 Гц. Затем звуковая информация в каждой частотной полосе из блока данных переводится в формат числа с плавающей запятой, и по определенной психоакустической модели производится обработка входящих значений (какие-то частотные полосы вообще не несут значимой информации и не кодируются, какие-то нужно закодировать с большей разрядностью, какие-то с меньшей), результатом которой является существенное уменьшение потока данных. Интересно, что психоакустическая модель, используемая кодером, может меняться, так как параметры модели передаются в потоке АСЗ и затем могут использоваться декодером для восстановления исходного звучания. Еще одним способом уменьшения потока данных является объединение данных из разных каналов. В реальной многоканальной фонограмме в нескольких каналах звуковая информация зачастую пересекается, и ее можно закодировать один раз для всех, а не для каждого канала в отдельности. Эта техника применяется только для частот ниже 10 кГц, что позволяет сохранить локализацию источников звука, а при том, что в распоряжении кодера есть целых пять полноценных звуковых каналов и, соответственно, широкое поле для маневра, поток данных этим способ можно уменьшить довольно значительно.

Возможности Dolby Digital на этом не исчерпываются. Например, декодер предусматривает управляемую компрессию (сжатие динамического диапазона). Использование компрессии удобно, если слушателю по какой-либо причине необходимо ограничить общую громкость звука. Компрессор повышает уровень слабых звуков, чтобы они были отчетливо слышимы, и наоборот, ослабляет слишком сильные звуки. Пользователь может сконфигурировать цифровой декодер таким образом, чтобы низкочастотные составляющие присутствовали только в тех каналах, для которых предусмотрены subwoofer-ы или широкополосные акустические системы с отдельными низкочастотными громкоговорителями.

Dolby Digital EX и Dolby-E

Только для кинотеатров изначально была разработана расширенная система Dolby Digital EX - семиканальная, по схеме "6.1". В Dolby Digital EX предусмотрено не два, а три канала surround - пространственный левый L S , пространственный правый R S и пространственный центральный C S . Акустические системы канала CS размещаются вдоль задней стены кинозала, а системы каналов L S и R S - вдоль боковых стен.

Dolby Digital использует цифровую компрессию звука, обеспечивающую минимальную необходимую скорость цифрового потока - до 320 кбит/сек. Это позволяет наиболее эффективно использовать информационную емкость носителей или каналов связи - пространство на пленке, магнитной ленте, частотную полосу эфирного или спутникового канала и т. п. Платой за низкую скорость является то обстоятельство, что формат Dolby Digital рассчитан только на один цикл кодирования - декодирования. Кроме того, цифровой поток АС-3 не привязан по времени к кадровой структуре изображения, поэтому редактировать видеоматериалы со звуком Dolby Digital сложно.

Рис . 15. Dolby Digital EX и Dolby-E

В профессиональных приложениях зачастую возникает необходимость в многократном кодировании-декодировании. Например, станции-ретранслятору необходимо получить материал с цифровым звуком Surround по спутниковому каналу связи, сохранить его на цифровом носителе, отредактировать, смонтировать и затем ретранслировать в распределительную сеть (или тиражировать и распространить). Для таких задач Dolby Laboratories разработала профессиональный цифровой формат Dolby-E. Цифровой поток Dolby-E может содержать до восьми каналов звука с полной полосой частот. Кроме собственно сжатых данных звука, в поток вводятся метаданные (metadata) - "данные, описывающие данные". Это инструкции для декодера Dolby-E, которые носят необязательный, рекомендательный характер. Например, специальная инструкция может автоматически установить в декодере то или иное ограничение динамического диапазона выходных сигналов. В зависимости от оборудования, используемого для приема и обработки сигнала Dolby-E, метаданные могут использоваться полностью, частично или не использоваться вообще. Поток Dolby-E делится на два потока, которые могут быть переданы по двум физическим линиям стандарта AES-3 или записаны на цифровой магнитофон вместо двух каналов несжатого звука. Структура потока соответствует кадровой структуре видео, поэтому материал со звуком Dolby-E можно легко монтировать и редактировать, не нарушая синхронность аудио и видео. Формат допускает до 10 последовательных циклов кодирования - декодирования.

Что собой представляют новые перспективные разработки в области объемного звука?

Даешь новый звук к Рождеству

Давно канули в лету эпохи утверждения стандартов «на века». И если путь стерео в кино занял более полувека - прежде, чем господин Долби взялся за тотальный перевод театров на многоканальную схему, подобное стало лишь прощанием с медленным течением времени. Прогресс и ускорение ритма жизни, а также новые приемы по стимулированию рынка привели к поистине компьютерной гонке в сфере домашних кинотеатров, что вылилось в бурную (и почти ежегодную) смену звуковых форматов для домашнего пользования. Еще не отгремели страсти по доукомплектации хоум-синема двумя дополнительными тыловыми центральными каналами (Dolby Digital EX, DTS ES Discrete/Matrix), еще не вышло должного количества DVD с поддержкой этих звуковых систем, как прошлый год ознаменовался дальнейшим расширением «модельного» ряда - в серию пошли аппараты с DTS 96/24 и Dolby Pro Logic II. Ниже мы постараемся расставить точки над «i» в данном вопросе, подробно рассказав, кому и зачем они могут пригодиться (заметим, что данный обзор не претендует на сравнение двух разных по сути и назначению стандартов, а лишь расшифровывает их положительные и отрицательные стороны).

Пятая реинкарнация DTS

С кинотеатрального внедрения детища Стивена Спилберга, DTS-звука для кино, прошло десять лет, а коллекция домашних форматов уже составила: оригинальный DTS 5.1 (с варьируемыми битрейтами 768-1500 кбс), DTS Neo:6 (раскладывающий двухканальные схемы в многоканальные), DTS ES 5.1 Matrix (с подмешанным в тылы сигналом тылового центра) и DTS 6.1 Discrete (с выделенным тыловым центром). И хотя последний, при принятом битрейте даже в 768 кбс обеспечивал лучшее из доступного качество звука дома, студия пошла дальше, утвердив DTS 96/24 - шестиканальный стандарт с параметрами от DVD-audio дисков - выборка 96 кГц, разрядность 24 бит, что стоит куда выше традиционных 48 кГц и 20 бит во всех доступных для театра форматах.

Главными преимуществами DTS 96/24 фирма называет:

  • сохранение исходной разрядности студийного звука - 20-ти и 24-хбитные мастеры теперь доходят до зрителя без потери данных, как и в случае с DVD-audio;
  • превосходство перед обычным CD-звуком (линейный PCM с параметрами 16 бит 44,1 кГц) - данное утверждение спорно, поскольку DTS использует сжатие данных, а PCM управляет оригинальным потоком с битрейтом свыше 3,000 кбс на два канала: при сохранении таких характеристик, многоканальный звук не уместится даже на нескольких DVD-дисках;
  • превосходство перед всеми театральными стандартами (18-20 бит, 48 кГц);
  • равные с DVD-audio характеристики без требования покупки нового совместимого плеера - опять же, достаточно спорное утверждение, поскольку битрейт у DVD-audio выше;
  • полная совместимость с любым источником, имеющим старое DTS-лого;
  • простой цифровой выход через коаксиальный и/или оптический интерфейсы.

И, хотя требования по декодированию включают лого DTS 96/24, то есть возможность процессора распознать новый стандарт, конверсия до обычного DTS возможна на большинстве DTS-совместимых устройств, а те из них, которые имеют 96/24 цифро-аналоговые преобразователи во всех каналах, могут, в большинстве случаев, корректно воспроизвести новый звук. Эта возможность не афишируется, но легко проверяется на практике.

Прием формата в США был не самым радушным, но в последнее время вышло определенное количество наименований музыки разных жанров (много релизов появилось в апреле 2003 г.):

Queen: Greatest Video Hits 1
Queen: The Game
Queen: A Night at the Opera
Rythmedia Tribe
Gorsby/Nash: Another Stoney Evening
Sheila Nicholls: Wake
Megadeth: Peace Sells...But Who"s Buying?
Brazilian Jazz
Brazilian Bossa
The Fabulcus Thunderbirds: This Night in L.A.
Frank Zappa: Halloween

Большая часть из них - совмещенные DVD-A релизы, содержащие 5.1 MLP треки DVD-audio, DTS 96/24 для обычных кинотеатральных систем и 2.0 РСМ для поклонников обычного стерео.

До сих пор выпущен только один фильм в данном формате - это «Tomb Raider» второго региона, сделанный в Италии - звуковая дорожка в DTS 96/24 там только в итальянском дубляже.

Такой подход совершенно неоправдан для пользователя - проигрыватели DVD-A сегодня начинаются по цене от $200 - а звук даже 5.1 96/24 в DVD-A формате без вопросов лучше, чем сжатый DTS той же разрядности. Бедный же список выпущенных наименований и их музыкальная направленность делает DTS 96/24 уделом маньяков узкоспециализированного звука - преимущества такого подхода в театре могли бы серьезно озаботить поклонников «самого лучшего», но, вероятно, камнем преткновения стали возможности студий, ведь переделка оригинальных мастеров - дело трудоемкое и неблагодарное, поэтому звукорежиссеры обычно ограничиваются лишь «быстрой» адаптацией стандартных DTS/DD кино-вариантов для домашнего использования. Довольно «нетрадиционен» и подход DTS Entertainment, специализирующейся на таких релизах - зачастую, все внимание уделяется DTS-мастерингу музыки, а секция DVD-A намеренно ухудшается: разница между ними, в итоге, нивелируется, но стоит поставить качественно записанный диск DVD-A, и все становится на свои места (но об этом чуть ниже).

Последней приятной новостью о формате стала поддержка его на ряде цифровых радиостанций - их вещание в DTS 96/24 кажется весьма выигрышным ходом в продвижении на рынок.

Dolby Pro Logic II или свержение Logic 7 с пьедестала лидера

В отличие от очередного изобретения велосипеда в DTS, здоровый консерватизм Dolby не позволил городить новые дискретные стандарты - и в ход пошла тяжелая артиллерия в виде «апгрейда» Pro Logic до версии 2.0. Обещания были заманчивыми - полный перевод стереозвука в 5.1-схему с качеством (внимание!), сравнимым с Dolby Digital 5.1. При условии наличия массы старых записей на видеокассетах, LD (их одних было выпущено более 50,000 наименований), сотен DVD с DD2.0 звуком (аниме, классика, сериалы), а также страстного желания отдельных киноманов воспроизводить CD через все свои колонки, данное решение могло действительно потрясти рынок.

В начале были представлены две вариации - Dolby Pro Logic II Movie для кинопрограмм и Dolby Pro Logic II Music для музыки, затем появились Car-адаптации, а недавно была представлена Virtual Speaker-технология, позволяющая создавать объемное поле всего с двумя колонками. Dolby Headphone также базируется на этом принципе. Есть еще и по-умолчанию включаемая в процессоры Matrix-система, работающая на моно-материале. Заметим, что до выхода Pro Logic II (и DTS Neo: 6, который, впрочем, получился весьма посредственным) пальма первенства в собственных форматах разложения 2.0 в 5.1-схемы принадлежала Logic 7 от Harman, наиболее успешно внедренная в процессорах Lexicon. Однако высочайшая цена на подобные устройства, а также в общем-то не самый совершенный алгоритм не делали чести подобному - аппараты же с Pro Logic II сегодня доступны в продаже по цене от $300.

При работе на кинематографическом материале по особым алгоритмам Dolby 2.0 звук ракладывается в многоканальную 5.1-схему с полноценным задействованием всех колонок, и, как утверждается, достаточно близко стоящем по качеству в DD5.1. При выборе музыки можно нивелировать самый главный дефект прошлого Pro Logic’a - завышенный уровень центрального канала. С помощью параметра Center Width этот показатель калибруется до полного соответствия с фронтальными колонками. Еще две функции - Panorama (регулировка перспективы) и Dimension (баланс) позволяют довольно точно отстроить перевод стереомузыки в объемную сцену. В этом случае Pro Logic шагнул сильно вперед по сравнению с аналогичным по содержанию DTS Neo:6, в котором пагубное влияние центрального канала на музыке еще сильно чувствуется.

Довольно приятно, что никаких требований к источнику и записанному на нем звуку формат не выдвигает, но официальная поддержка флага Pro Logic II (например, на играх для Nintendo Game Cube) может означать оптимизацию и лучшее качество. На сегодня подавляющее большинство выпускаемых ресиверов и процессоров поддерживают Dolby Pro Logic II.

Послушаем…

Сравнение проводилось с использованием следующей системы: ресивер Denon A1SR, акустика B&W CDM, плеер - Pioneer 757Ai.

В качестве материала DTS 96/24 использовались записи Queen: The Game, Queen: A Night at the Opera, а Pro Logic II тестировался на различном CD-материале (от Stray Cats, Metallica до Вагнера и Бетховена) и 2.0 DVD-дисках («Человек, которого не было» R5, Escaflowne Series 1-4 R1 и т. п.).

Мы не могли протестировать DTS 96/24 в кино-варианте, так как даже при наличии нужной версии Tomb Raider, вряд ли можно считать дублированный трек за полноценное звучание - поэтому дождемся появления DVD R1 с кинематографическим материалом в этом формате. Из представленной же музыки DTS 96/24 продемонстрировал неплохие задатки по части объемности и детальности, резко превзойдя обычные DTS-музыкалки. Однако даже не слишком качественный мастер в DVD-A звучал на этих дисках чуть лучше, не говоря уже о новых DVD-A дисках. Треки Queen отличались слышимой компрессией звука - увы, преодолеть недостатки сжатия физически можно только радикальным увеличением битрейта. Но и в таком виде был явно заметен потенциал формата для домашнего кино - вот где была бы почва для построения нового «SuperBit’а 96» или подобных наименований - безукоризненная детальность и мертвая хватка локализации - именно то, чего не хватает слегка расслабленным современным форматам для дома в сравнении с театральным SDDS, например.

Что касается Dolby Pro Logic II, то в музыкальном режиме на обычных CD он показал богатые таланты по превращению стерео в многоканальную схему, тонко и детально выстраивая звуковую панораму - иногда чуть более осторожно, чем хотелось бы, но весьма натурально и впечатляюще: это именно то, чего хотели фанаты Logic 7, только в более грамотном исполнении. Естественно, данный вариант совсем не для пуристов, так как тембральные окраски звука смещаются, а стереопанорама иногда становится нестабильной, но это все равно значительный шаг вперед по сравнению с ранее предложенными алгоритмами иных студий. В своем подавляющем большинстве обладатели многоканальных систем предпочтут Pro Logic II для «надстойки» над обычным компактом. С кинотеатральной стороны, данный формат также впечатляет даже видавших виды, чуть не дотягивая до DD5.1, но здорово оформляя спэцффектную составляющую во всех каналах - единственным нареканием становится слегка гулковатый центральный канал: создавая нужный объем, он, зачастую, приглушает диалоги. Впрочем, это можно легко поправить настройкой баланса системы.

Плюсы и минусы

Формат Достоинства Недостатки
DTS 96/24 - высокий потенциал для кинозвука
- хорошее качество музыкального материала, сравнимое (но не равное) некоторым дискам DVD-A
- возможность воспроизведения на несертифицированном DTS-декодере
- малое количество наименований, практически полное отсутствие фильмов в формате
- музыкальный потенциал не дотягивает до лучших образцов дисков DVD-A
- поддержка не всеми современными ресиверами
Dolby Pro Logic II - идеальное поканальное разложение 2.0 звука в 5.1 - как на кино, так и на музыке
- возможность использования на любом 2.0 и 1.0 материале
- широчайшая поддержка производителями «железа»
- качественный DD/DTS 5.1 мастеринг, все равно, лучше
- гулкость центрального канала в театральном режиме

Резюме

Вряд ли DTS 96/24 светит радужное будущее, но свое место под солнцем в комплексах хай-енд, он, конечно, отвоюет. Другое дело Pro Logic II - покупая новый ресивер, вы обречены иметь такую возможность, а послушав старые кассеты с этой «фичей» обречены ее использовать и дальше - штука, действительно, ядерная. В очередной раз Dolby продемонстрировала свой массовый подход, а DTS - камерный. Что ж, каждому свое.

Pro Logic II - активный декодер Dolby Surround следующего поколения. Он также использует пространственную фокусировку, но реализован принципиально другими методами. Новый декодер получился намного проще и при этом эффективнее.

Вспомним: задача декодера - предотвратить проникновение сигналов L и R в канал S, независимо от того, где находится источник сигнала - точно между микрофонами L и R, смещен от центра в ту или иную сторону или вообще находится непосредственно рядом с микрофоном одного из каналов. Например, если герои ведут диалог между микрофонами каналов R и C (права от центра), то уровень сигнала в каналах C и R будет одинаковым. В этом случае часть сигнала неизбежно проникнет на выход S пассивного декодера, так как уровень в канале L ниже, чем в канале R, и при вычитании одного сигнала из другого результат не будет нулевым.

Чтобы полностью компенсировать сигналы L и R на входах декодера surround, необходимо перед подачей на сумматор выровнять их уровни. Для этого между входами Lt и Rt и входами сумматора устанавливаются два регулируемых усилителя (VCA). Усиление VCA двух каналов изменяется одним и тем же управляющим сигналом, но в разной полярности. Если увеличивается усиление одного VCA, усиление второго уменьшается. Если такую регулировку осуществлять достаточно точно и достаточно синхронно с изменениями самого сигнала, можно полностью подавить разностный сигнал каналов Lt и Rt в канале Surround.

Чтобы автоматически отследить изменения входных сигналов, используется специальная цепь отрицательной обратной связи (feedback servo circuit). Выходные сигналы обоих VCA поступают на амплитудные детекторы (Full-Wave Rectifier, FWR), которые выделяют огибающую звуковых сигналов. Сигналы постоянного тока, пропорциональные амплитудам сигналов L и R, сравниваются дифференциальным усилителем. Сигнал с выхода усилителя, пропорциональный разности амплитуд, используется для управления VCA.На рисунке 11 показана только одна ось декодера (ось "левый -правый"). Вторая пара VCA с такой же управляющей цепью выравнивает уровни сигналов суммы L+R (фронтальный) и разности L-R (тыловой) для подавления сигналов С и S в каналах R и L (ось "центр - surround"). Сигнал центрального канала С получается сложением (вместо вычитания) двух сигналов Lt и Rt, выровненных по уровню усилителями VCA. Благодаря использованию управляющих цепей с обратными связями, декодер Pro Logic II приобрел следующие преимущества:

Простыми и дешевыми аппаратными средствами достигается более эффективная компенсация противофазных сигналов в выходной матрице, и, как результат, высокая степень развязки между каналами разных осей.

В декодере Pro Logic обе оси контролируются единой переключающей цепью "быстро/медленно". Если хотя бы по одной оси существует значительное доминирование, переключающая цепь переводит обе оси в "быстрый" режим, принудительно изменяя постоянную времени управляющих цепей VCA. Только при условии, что в обеих осях амплитуды сигналов примерно одинаковы, обе они переходят в "медленный" режим. В декодере Pro Logic II две оси функционируют независимо друг от друга, поэтому их управляющие цепи сами "решают", насколько быстро необходимо изменять усиление VCA, анализируя только собственные сигналы. Кроме того, постоянная времени управляющей цепи в декодерах Pro Logic II изменяется непрерывно, тогда как в Pro Logic предусмотрено только два фиксированных значения.


Также известен, как:

Dolby Pro Logic - усовершенствованная схема декодирования, использованная в Dolby Surround . Она отличается тем, что обеспечивает получение центрального канала, лучшее разделение сигналов и более точное совпадение локализации звуков в соответствии с происходящим на экране. Обратите внимание на то, что наименование Dolby Surround относится к обеим системам декодирования: как к Dolby Surround , так и к Dolby Pro Logic. Хотя существуют два типа декодеров Dolby Surround , кодирующее устройство изготавливается только в одном варианте. Носители формата Dolby Surround работают с декодерами обоих типов. Декодеры Dolby Surround в значительной мере оказались вытесненными декодерами Pro Logic.

Помимо декодирования выходного двухканального звукового сигнала видеомагнитофона или проигрывателя лазерных дисков для получения звуковых сигналов левого, центрального, правого каналов и каналов окружения декодер Pro Logic обычно формирует шестой выходной сигнал, предназначенный для сабвуфера. Он представляет собой монофонический сигнал с полосой частот, ограниченной сверху 100 Гц, в котором объединена информация фронтальных каналов. Использовать этот сабвуферный сигнал не обязательно; многие системы домашнего кинотеатра для воспроизведения полного спектра звукового сигнала, включая и низкие частоты, применяют широкополосные громкоговорители левого и правого каналов.

Обратите внимание на то, что для передачи сабвуферного сигнала не используется специальный канал. Напротив, этот сигнал создается путем смешивания низкочастотных сигналов фронтальных каналов, благодаря чему левой и правой акустическим системам не нужно воспроизводить бас, и они могут иметь небольшие габариты.

Важно понимать, что Pro Logic обеспечивает работу четырех каналов звуковоспроизведения (левого, центрального, правого и монофонического тылового). Хотя используется два тыловых громкоговорителя, на них подается один и тот же монофонический сигнал.

Все декодеры Dolby Digital не зависимо от того являются ли они 5.1-соместимымми или двухканальными, имеют уникальную возможность downmixing`а для совместимости с любой системой воспроизведения. По вашему выбору декодер может в реальном времени создавать из Dolby Digital 5.1:


  • двухканальное Dolby Surround стерео для воспроизведения в системах домашнего кинотеатра формата Dolby Surround Pro Logic ;
  • двухканальное стерео для обычного стереооборудования и прослушивания в наушниках;
  • монофонический сигнал для вывода на телевизор.

Для лазерных дисков downmixing не используется так как они содержат отдельные звуковые дорожки:


  • PCM для воспроизведения на обычном стерео-оборудовании или Dolby Surround Pro Logic;
  • FM для воспроизведения моно; FM в формате 5.1

2 ответа

ТЛ: др; это возможно возможно; это может быть проще, если вы программист.

Поскольку закодированная информация представляет собой просто стереопарационную пару, нет гарантированного способа обнаружения сигнала Dolby Pro Logic II (DPL2), если вы специально не храните свои собственные метаданные, говорящие "это файл DPL2". Но вы, вероятно, можете сделать довольно хорошее предположение.

Все старые аналоговые форматы Dolby Surround, включая DPL2, сохраняют информацию объемного звучания в двух каналах, инвертируя фазу объемного звучания или окружающего звучания, а затем смешивая их с исходными левым и правым каналами. Декодеры Dolby Surround, включая DPL2, пытаются восстановить эту информацию, инвертируя фазу одного из двух каналов, а затем ищут сходства в этих парах сигналов. Это либо выполняется тривиально, как в Dolby Surround, либо эти сходства искусственно смещены, чтобы продвигаться намного дальше влево или вправо, или влево или вправо, как в DPL2.

Итак, трюк заключается в том, чтобы определить, хранятся ли важные данные в канале (каналах) объемного звучания. Я нарисую для вас метод, который может работать, и я попытаюсь выразить его без написания кода, но вам решать, как реализовать его и по своему вкусу.

  • Обрезать первые N секунд или около того содержимого программы в стереофайл, где N составляет от одного до тридцати. Вызов этого файла.
  • Смешайте входные стереоканалы с новым монофоническим файлом со скоростью -3 дБ на канал. Вызовите этот файл Center.
  • Разделить левый и правый каналы ввода в отдельные файлы. Назовите эти левые и правые.
  • Инвертировать правый канал. Вызовите этот файл RightInvert.
  • Смешайте каналы Left и RightInvert с новым монофоническим файлом со скоростью -3 дБ на канал. Вызовите этот файл Surround.
  • Определите RMS и пик дБ файла Surround.
  • Если RMS или пиковая БД файла Surround ниже "допуска", остановите; исходный файл либо монофонический, либо централизованный, и, следовательно, не содержит информации объемного звучания. Вам нужно поэкспериментировать с несколькими источниками DPL2 и без DPL2, чтобы узнать, что такое допуски, но после дюжины или около того файлов цифры должны стать ясными. Я предполагаю около -30 дБ или около того.
  • Инвертируйте файл Center в новый файл. Вызовите этот файл CenterInvert.
  • Смешайте файл CenterInvert в файл Surround с 0 дБ (как CenterInvert, так и Surround должны быть моно). Вызовите этот новый файл SurroundInvert.
  • Определите RMS и пик dB файла SurroundInvert.
  • Если RMS и/или пик dB SurroundInvert ниже "допуск", остановка; ваш исходный источник содержит загоранную левую или правую переднюю информацию, а не информацию об окружающем пространстве. Вам нужно будет поэкспериментировать с несколькими источниками DPL2 и не DPL2, чтобы узнать, что такое допуски, но после дюжины или около того файлов цифры должны стать ясными - я предполагаю около -35 дБ или около того.
  • Если вы дошли до этого, ваш исходный вход, вероятно, содержит информацию об окружающем пространстве и, следовательно, вероятно, является членом семейства кодировок Dolby Surround.

Я написал этот алгоритм таким образом, что вы можете выполнить каждый из этих шагов с помощью специальной команды в . Если вы хотите быть более любезным, вместо выполнения шага RMS/пикового значения в sox, вы можете запустить программу и проверить свои уровни в LUFS против допусков. Если вы хотите быть еще более привлекательным, создав файлы Surround и Center, вы можете отфильтровать все частоты выше 7 кГц и сделать акцент на них, как и реальный декодер DPL2.

Чтобы этот алгоритм был прост, я набросал его полностью в области амплитуды. Расчет файла SurroundLevel, вероятно, будет намного более точно выполненным в частотной области, если вы знаете, как вычислить величину и угол бит FFT, и вы используете окна от 30 до 100 мс. Но эта версия cheapo выше должна вас начать.

Последнее предостережение. AAC - это современный психоакустический кодек, что означает, что ему нравится играть в игры со стереофазированием и визуализацией для достижения сжатия. Поэтому я считаю вероятным, что простой акт инкапсуляции DPL2 в поток AAC, скорее всего, вложит некоторые из изображений, присутствующих в DPL2. Чтобы быть откровенным, ни DPL2, ни AAC не принадлежат нигде в этом конвейере. Если вы должны сохранить аналоговый поток, первоначально закодированный с помощью DPL2, сделайте это в формате без потерь, таком как WAV или FLAC, а не AAC.

На момент написания этой статьи операционные концепции Dolby Pro Logic (I) были . Эти базовые концепции по-прежнему применяются к DPL2; операционные концепции для DPL2 .

Если файл имеет более одного канала, вы можете с некоторой уверенностью предположить, что они используются для целей объемного звучания, хотя они могут быть просто несколькими дорожками. В этом случае он падает на игровую систему, чтобы делать с каналами, поскольку она "думает" лучше всего. (если заголовок файла не говорит, что делать)

Но ваш файл является стерео. Если вы хотите узнать, является ли это виртуальным файлом объемного звучания, вы можете посмотреть в заголовке поля кодера, чтобы узнать, какой кодер был использован. Это может несколько помочь, хотя и не очень. В основном поле кодера остается пустым, а во-вторых, что кодер не должен быть таким же, как рекодер, который смешивает данные объемного звучания. То есть рекодер сначала создаст необработанные данные PCM, а затем подаст его на некоторый кодер для создания сжатого файла. (AAC или что-то еще) Кроме того, существует множество приложений и версий, которые могут меняться, поэтому поле кодера может отслеживать все, что было бы неприятно.

Однако вы можете с уверенностью более чем на 60% вывести, что-то виртуальное окружение или нет, изучая данные. Это будет усовершенствованный DSP, и для скорости может быть задействовано даже машинное обучение. Вам нужно будет выяснить, содержат ли стереосигналы определенные функции HRTF (функция передачи, связанная с головкой). Это может быть достигнуто путем изучения различий интенсивности и задержек между тем же звуком, появляющимся во временной области и гармоническими характеристиками (характерные изменения частоты) в частотной области. Вам нужно будет сделать то и другое, потому что один без другого может просто сказать вам, что что-то очень хорошая стереозапись, а не виртуальное окружение. Я не знаю, есть ли какие-либо функции HRTF, которые уже были сопоставлены, или вам нужно будет сделать это самостоятельно.

Это очень сложное решение, требующее много времени, чтобы сделать правильно. Также производительность будет проблематичной.

С помощью этого метода вы также можете отключить стерео микширование до почти оригинальных каналов объемного звучания. Но для преобразования стерео в окружающее пространство используются другие методы, и они звучат хорошо.

Если вы настроены выполнить такое обнаружение, посвятите полгода или более тяжелой работы, если нет функций HRTF, несколько недель, если они есть, приготовьтесь к большому стрессу, и я желаю вам удачи. Я сделал что-то подобное. Это убийца.

Если вы хотите использовать готовое решение, тогда ответ на ваш вопрос не будет, если только заголовок не предоставит вам поле энкодера, а кодировщик отличается и, как известно, используется только для преобразования объемного звука в стерео. Я не думаю, что кто-то сделал это из фактических данных, как я описал, или если они это сделали, это часть коммерческого продукта. Выполнение того, что вам нужно, обычно не требуется, но это можно сделать.

Ow, BTW, попробуйте инверсию HRTF в googling, это может дать некоторую помощь.

 
Статьи по теме:
Что такое Проектор LED или светодиодный проектор?
DLP- и LCD-проекторы отличаются технологией создания изображения. В свет лампы с помощью призмы разбивается на лучи основных цветов: зеленый, синий и красный, а потом попадает на одну из трех маленьких жидкокристаллических матриц. ЖК-матрицы пропускают св
Как установить MiFlash и драйверы для смартфонов Xiaomi Сложные способы решения
Это подготовительная статья для инструкций по обновлению программного обеспечения смартфонов Xiaomi. Мы все прекрасно знаем, что театр начинается с вешалки, а работа с приложением — с инсталляции. Поскольку есть некоторые нюансы при установке приложения M
TrueCrypt шифрование важных файлов
TrueCrypt — это программная система для создания и использования шифруемого-на-лету тома (устройства хранения данных). Шифрование-на-лету означает, что данные автоматически шифруются или дешифруются прямо во время их считывания или записи, не отвлекая пол
Какую форму имеет канал гранде
Гранд-канал (Canal Grande) представляет собой основной транспортный канал Венеции, являющийся одновременно и так называемой «главной улицей» этого города на воде. Он пересекает в виде буквы S все пространство города, по его берегам располагаются самые кра