Стереосцена

1 месяц назад
341

Стереоизображение

Для большинства людей термины hi-fi и стерео являются синонимами, но все же очевидно, что до сих пор существует большое количество путаницы относительно того, что на самом деле означает слово “стерео”. Даже не существует консенсуса мнений среди продюсеров записей, дизайнеров hi-fi оборудования, аудиокритиков и любителей музыки относительно цели стерео. Учитывая, что споры не показывают признаков уменьшения интенсивности, полезно осознать, что 1981 год отмечает как 100-летие первых стереоэкспериментов Клемана Адера, так и 50-летие классического патента Алана Блюмлейна на стерео.

Адер разместил микрофоны телефона в двух группах, слева и справа, на сцене Парижской оперы, и подписчики слушали в наушниках двойной сигнал, который передавался по телефонным линиям. Работа Блюмлейна была все еще экспериментальной, но более теоретической, поскольку она исследовала, какую именно направленную информацию нужно сохранить в двухканальной системе, чтобы можно было воссоздать точное звуковое изображение с помощью двух динамиков.

Определение местоположения источника звука

Прежде чем углубляться в болото противоречивых мнений, стоит взглянуть на то, как человек воспринимает направление реальных источников звука. Хотя глаза, безусловно, играют важную роль в определении таких направлений, уши обеспечивают существенную и эволюционно желательную резервную систему. Любой пещерный человек, вышедший из своей пещеры в темную ночь и неспособный услышать, откуда исходит тихий шлепающий звук (который странно похож на звук, издаваемый голодным саблезубым тигром), не имел бы больших шансов передать свои гены будущим поколениям. И так саблезубый тигр, поощряющий существование человеческого слухового механизма для определения направления, мог счастливо вымереть, выполнив свою судьбу.

Когда волновой фронт, излучаемый источником звука, таким как наш вымерший тигр, достигает головы, очевидно, что если этот источник не лежит в плоскости, пересекающей голову под прямым углом к оси ушей, он достигнет одного уха раньше, чем другого. Чем дальше от медианной плоскости находится источник звука, тем больше межушное задерживание, пока оно не достигнет максимума около 0,7 мс, время, необходимое для прохождения звука через расстояние между ушами, когда источник находится с одной стороны вдоль оси ушей (рис.1).

Рис. 1.

Для сигналов типа переходных процессов мозг, вероятно, действует непосредственно на это временное задерживание, чтобы получить информацию о направлении, но для непрерывной волны с частотой ниже примерно 700 Гц, для которой расстояние между ушами представляет половину длины волны, мозг интерпретирует временное задерживание как фазовую разницу между сигналами, полученными двумя ушами (рис.2), и коррелирует эту фазовую разницу с направлением. Однако для более высоких частот можно видеть (рис.3), что есть более одного направления, которое, по-видимому, даст ту же межушную фазовую разницу, и таким образом обнаружение направления по фазовой корреляции становится неоднозначным.

Рис. 2.
Рис. 3.

Выше этой критической частоты, к счастью, начинает действовать другой механизм: голова все больше и больше создает акустическую “тень”, когда ее размер становится порядка или больше, чем длина волны звука. Наличие этой тени означает, что между звуками, воспринимаемыми ушами, вводится разница в амплитуде, что позволяет мозгу вывести направление источника звука из отношения двух амплитуд. Мочки ушей дополнительно изменяют эту разницу в амплитуде с частотой, что дает изменение спектра в зависимости от направления, которое “усиливает” механизм.

Перекрытие механизмов амплитуды и фазы

Очевидно, что механизмы амплитуды и фазы будут перекрываться в диапазоне частот, зависящем от размера головы, и усиливать друг друга до тех пор, пока частота не станет такой, что фазовая разница становится полностью неоднозначной, по-видимому, около 1,2 кГц для средней головы. Выше этой частоты приходится полагаться только на механизм амплитуды для стационарных звуков, который, как показано, менее точен.

Однако если в иначе непрерывной волне высокой частоты происходит переходный процесс, то это эквивалентно вставке аудио “маркера” для предоставления мозгу дополнительной информации о временной задержке. Тигр наступает на палку, и наш пещерный человек немедленно получает однозначную подсказку о направлении тигра и живет, чтобы передать соответствующий слуховой механизм своим потомкам. Без переходных процессов мозг должен как-то попытаться усилить слабые подсказки разницы в амплитуде, и на самом деле голова находится в постоянном небольшом движении, ее боковое сканирование позволяет мозгу наложить информацию о скорости изменения различий в амплитуде на эти же различия.

Положение источника звука

Когда источник звука лежит точно на медианной плоскости - вертикальной центральной плоскости между ушами - все упомянутые основные механизмы заставляют мозг прийти к одному и тому же выводу, то есть, что источник звука находится прямо по центру. Определить, находится ли он выше или ниже, спереди или сзади, немного сложнее, и мозг должен интерпретировать спектральную информацию от мочек ушей и вторичные подсказки, такие как реверберация, чтобы определить этот аспект.

Мозг относительно хорошо справляется с решениями “спереди или сзади?” (при условии, что источник не находится точно на медианной плоскости), но, по-видимому, не справляется с “сверху или снизу?” Это не особенно важно, так как обычно не нужно полагаться только на слух, глаза являются основным источником такой информации.

Амплитудное стерео

Гениальность Алана Блюмлейна заключалась в его признании того, что если межушные фазовые различия воспроизводятся как различия в амплитуде между сигналами, подаваемыми на два динамика, это в одиночку достаточно для полного определения направления, при условии, что слушатель находится на равном расстоянии от двух динамиков. Если слушатель не находится на равном расстоянии, то возникающая дополнительная временная задержка дает противоречивую информацию, что приводит к запутанным и неоднозначным результатам. Джон Крабб подробно рассмотрел тему прослушивания стерео вне центра в своей серии статей “Расширение стереоместа” (HFN/RR, июнь/июль/сентябрь 1979 года), и чтобы избежать ненужной сложности, использование слова “стерео” в этой статье будет исключительно подразумевать “центрального слушателя”.

Итак, чтобы сделать выжимку из Блюмлейна, для центрального слушателя воспринимаемое положение любого источника звука может быть представлено точным соотношением напряжений, подаваемых на два (идентичных) динамика. Если напряжения равны, то мы имеем дело с ситуацией “двойного моно”, где звук должен казаться исходящим из точки на полпути между двумя динамиками. Поскольку соотношение является безразмерной величиной, изображение, созданное любым таким соотношением напряжений, не должно занимать никакого пространства, но должно восприниматься как точечный источник, расположенный где-то на линии, соединяющей акустические центры двух динамиков.

В идеале, игнорируя эффекты помещения, не было бы никаких причин для изменения положения этой точки или ее отсутствия ширины с частотой. Пока программа записана таким образом, что позиции верно представлены соотношениями напряжений между каналами - и здесь кроется загвоздка - центральный слушатель будет воспринимать дискретные изображения, правильно расположенные по всей линии (на самом деле дуге, центрированной на слушателе), соединяющей динамики.

Перекрытие механизмов амплитуды и фазы

Очевидно, что небольшой процент людей не поддаются обману Блюмлейна с “амплитудой для различий фаз”, два информационных канала могут полностью определить боковую сцену, второе измерение - глубину изображения - обеспечивается записанной реверберацией, мозг автоматически интерпретирует наличие реверберации как свидетельство того, что источник звука находится дальше. Насколько убедительна эта глубина субъективно, полностью зависит от отношения между записанной реверберацией и основными боковыми изображениями. Только техника микрофона с выборкой волнового фронта сохранит это отношение точно, но об этом позже.

Обратите внимание на использование слова “полностью”. Для центрального слушателя есть абсолютная мера для оценки качества стереоизображения, без ссылки на музыкальные споры, “реальную вещь”, соотношения прямого/реверберационного звука, акустику концертного зала, субъективный опыт, эмоциональный коэффициент или любые другие философские красные сельди. Как только у нас есть два информационных канала, если между каналами нет перекрестной связи - которая изменит соотношения напряжений - и при условии, что динамики и их взаимодействие с помещением для прослушивания не вводят никакого “расширения” или “размытия” точечных изображений, то сумма всех этих точечных изображений образует континуум, который точно представляет записанное стереоизображение.

Пока узкое центральное изображение, созданное сигналом “двойного моно”, остается узким и центральным на всех частотах, система должна быть внутренне точной, насколько это касается стерео. Любые тогда услышанные недостатки могут быть связаны только с программой. Точно так же философские обсуждения тогда могут применяться только к способу, которым программа была сведена к двум информационным каналам, и отношению этой программы с оригинальным живым событием, а не к самим динамикам.

Точность изображения

Возьмем, например, аргумент, предложенный Джулианом Хиршем в октябрьском номере Stereo Review 1979 года. Соглашаясь с тем, что если звук исходит из определенного направления в пространстве, то идеальная стереозапись должна сохранить это направление, он пишет: “Я не испытываю этого рода определенной локализации звука, когда я посещаю концерт… Я обычно могу сказать, находится ли источник справа или слева от сцены, или, возможно, в центре… Даже когда я визуально заметил солиста, закрытие глаз размывает его физическую связь с остальным оркестром.”

Многие авторы комментировали эту проблему изображения в концертном зале, и хотя степень неопределенности варьируется в зависимости от слушателя, это тем не менее реальный атрибут живого звука. Но развивать из этого наблюдения аргумент, что способность динамика воспроизводить обсуждаемые ранее точечные изображения не нужна, - это ложное утверждение. Например, чтобы процитировать Хирша снова: “Часто, когда я получаю динамики для тестирования, производитель подчеркивает качества стереоизображения своего продукта… Я не могу комментировать эти качества - в большинстве случаев, потому что я не нахожу, что их наличие или отсутствие имеют много общего с тем, насколько ‘хорошим’ мне кажется звук динамика.

Очень легко слышать различия между динамиками, и многие из них, вероятно, можно было бы описать как качества ‘стереоизображения’. Не так легко решить, какое, если вообще какое-то, из этих качеств является наиболее точным или реалистичным” (мои курсивы). Хирш продолжает в другой статье (Stereo Review, апрель 1980 года) прийти к выводу, что звуковое изображение может быть только вопросом индивидуального предпочтения.

Философская несостоятельность

Эта позиция философски несостоятельна: вовлечение понятий “точности” и “реализма” должно быть ошибочным при обсуждении всего одного компонента в цепи воспроизведения, потому что тогда вы вводите еще одну переменную: качество программного материала. Если вы собираетесь оценивать свойства изображения пары динамиков, используя музыкальную программу с субъективной ссылкой на живой опыт, вы должны знать, насколько хорошо стереоаспект этого живого опыта был сохранен на ваших двух информационных каналах. Но у вас есть доступ к этой информации только прослушивая программу на динамиках с неизвестными свойствами изображения. У вас слишком много переменных - и круговой аргумент.

Это также несостоятельно на более практическом уровне. Давайте более внимательно рассмотрим проблему определения местоположения источника звука в концертном зале. Как регулярный посетитель концертов, я очень хорошо осознаю, что моя уверенность в аудиальном определении местоположения инструментальных изображений варьируется огромным образом. Это зависит от зала, от места сидения, наличия отражающих стен около инструменталистов, характера самих инструментов и так далее. Возьмем, например, Лондонский Фестивальный зал. Сидя в центре примерно на полпути назад, так что оркестр образует угол около 60°, можно точно определить местоположение большинства инструментов - за исключением валторн, которые направлены к задней стене.

Однако когда вы двигаетесь дальше назад, происходят две вещи. Во-первых, угол, образуемый каждым инструментом, становится меньше, тем самым увеличивая относительное влияние любого запутывающего элемента, и, во-вторых, увеличивается соотношение реверберационной и прямой звуковой интенсивности. В Фестивальном зале, когда вы двигаетесь назад под балкон, происходит заметное изменение, и становится гораздо сложнее с уверенностью определить местоположение отдельных инструментов. Прямой волновой фронт от гобоя, скажем, теперь представляет собой очень малую долю звукового поля на вашем месте прослушивания, и неудивительно, что вы не можете быть абсолютно уверены в положении этого гобоя.

Это ситуация, описанная Хиршем и многими другими. Но рассмотрите звуковое поле в этой точке более внимательно. Ваши уши все еще получают массу направленной информации, которая интерпретируется однозначно: хотя большая часть звука, попадающего в ваши уши, представляет собой реверберацию, ваш мозг действует на эти отраженные волновые фронты точно так же, как он действует на прямые волновые фронты. Вот как вы знаете, что вы сидите в Фестивальном зале, близко к задней части под балконом, с относительно узким оркестром, однозначно расположенным перед вами. Ваш аппарат определения направления так же точен, как всегда, но выбрав сидеть дальше назад, вы уменьшили долю используемой информации о местоположении отдельных инструментов; по сути, вы уменьшаете отношение сигнал/шум вашего мозга, когда рассматриваете только оркестр.

Но что это относительное отсутствие оркестровой направленной информации имеет отношение к динамикам? На недавнем заседании AES по техникам микрофонирования (см. HFN/RR, март 1981 г., стр. 37) Питер Баксандолл указал на суть всего дела, когда сказал, что он предпочитает сидеть так далеко назад, потому что, хотя точность позиционирования оркестра была нарушена, общий звук был лучше, будучи лучше интегрированным.

Выбор сидеть так далеко назад - это чисто вопрос личного вкуса. Динамик, который смешивает местоположение и ширину нашего бесконечно узкого центрального изображения “двойного моно”, и следовательно, местоположения всего бокового континуума узких изображений (точно так же, как если бы мы были удалены на несколько рядов сидений дальше назад в Фестивальном зале), является менее хорошим дизайном в терминах высокой верности, потому что он добавляет искажение в программу. Тот факт, что многие нашли бы эффект этого конкретного искажения более похожим на реализм, который они предпочитают, независимо от того, какая направленная информация была захвачена на записи, абсолютно ложен.

Узость и стабильность центрального изображения

Узость и стабильность центрального изображения на всех частотах, а также сохранение этой узости (в пределах установленных психоакустических ограничений) во всех позициях по стереосцене при изменении соотношения напряжения L/R, являются единственным определенным показателем, который мы можем иметь относительно абсолютных свойств изображения динамика. Тот факт, что многие записи будут звучать менее привлекательно для многих людей с таким динамиком, может быть только критикой качества программы.

Точность против музыкальности

Что приводит нас к разделению, которое становится все более и более очевидным среди энтузиастов и производителей. Если большинство записей звучат все менее и менее по вашему вкусу с каждым улучшением вашей системы, то зачем вообще заниматься всем этим делом? Пол Бенсон, бывший редактор «Hi-Fi Answers», подчеркнул эту конкретную точку в стимулирующей, если не спорной, статье прошлого сентября. “Цель стереосистемы - создать в доме музыкально удовлетворительное исполнение”, - написал он, и если более педантичный критик будет расстроен идеей того, что его hi-fi может быть творческим, а не воспроизводящим, то, безусловно, верно, что если нет мазохистских склонностей, то в основном вы хотите наслаждаться музыкой на своих записях.

Отсюда появление систем динамиков, которые в большей или меньшей степени жертвуют стереоаспектом исполнения, в зависимости от акустики помещения для прослушивания, чтобы оптимизировать другие аспекты. «Linn Isobarik», «Sara и Kan», «Heybrook HB3» и «ARC 101/202» - все это дизайны, которые предназначены для установки против стены для достижения предполагаемой нагрузки на басы. Однако отражения от этой стены следуют за начальным волновым фронтом через такой короткий интервал, около 2-3 мс, что ухо/мозг склонны рассматривать их как часть этого волнового фронта, и поскольку уровень таких отражений будет зависеть от частоты, общий эффект непредсказуем и приводит к “размытию” изображения. В худшем случае я слышал пару «Isobariks», производящих не более чем “толстый моно” звук - было поучительно отметить, что в этом случае комната для прослушивания имела места для сидения везде, кроме традиционной центральной позиции.

Звук в этой комнате был очень “музыкальным”, и мне понравилось слушать многие записи на этой системе, но это было облегчением вернуться перед парой «Quad ESL» и расслабиться в безопасности их крепкого стерео, даже если это означало, что на некоторых оркестровых записях скрипки, например, звучали, как будто их запихнули в телефонную будку в самом левом конце сцены, сбалансированные только виолончелями, запихнутыми в другую переполненную будку справа от сцены. Сторонники звука «B’rik» скажут, что это представляет собой “нереалистично хорошее изображение”, и я согласен, однако, я утверждаю, что это был сбой программы, который Quads, обладающие большей стереоразрешающей способностью, позволили мне сначала определить, а затем решить, приемлемо ли это или нет.

Невежество может быть блаженством, но однородность изображения - все сводится к этому “толстому моно” - в конечном итоге утомительна, и я могу только прийти к выводу, что это обще низкий стандарт и нереалистичное качество записанного стерео, с его утомительными аномалиями позиционирования, которые привели людей к тому, чтобы поставить способность представлять точное стерео далеко вниз по их списку желаемых качеств динамика. Возможно, доктор Амар Бозе был прав в конце концов - тот факт, что изображение скрипки представлено как шириной 20 футов, может быть прощаемым, когда результат в конечном итоге приятен, а не утомителен. И тем не менее, несмотря на все это, прослушивание через хорошие наушники широко признано очень удовлетворительным, потому что оно удивительно точно в своем представлении боковой стереоинформации!

Подведение итогов

Учитывая, что правильная пространственная информация присутствует в виде последовательности мгновенных соотношений напряжений в двух информационных каналах, все, что нужно сделать паре динамиков, - это воспроизвести эти соотношения напряжений в виде соотношений уровней звука, чтобы - игнорируя взаимодействие с помещением - создать убедительную звуковую сцену между и за динамиками. Конец вашей комнаты для прослушивания становится широким окном в акустику записанного концертного зала, где каждый инструмент имеет свой правильный размер и находится на своем правильном месте.

Правильное захватывание направленной информации

В первой части этой статьи я рассмотрел, какую информацию нужно записать всего на два информационных канала, чтобы можно было воспроизвести точное стереоизображение с помощью двух динамиков. Если мы согласны с тем, что при “точном стерео” сохраняются направления инструментов на оригинальном мероприятии, то каждое из этих направлений нужно представить только в виде соотношения напряжений между двумя каналами. Сумма этих двух соотношений, интегрированная по времени, представляет собой стереоизображение, и человеческий мозг оказывается замечательным инструментом, который может отсортировать и разделить соотношения из двух сигнальных форм волн и определить отдельные инструменты - с их соответствующими направлениями - в общей текстуре.

Это удивительное достижение, слуховой эквивалент противодействия 2-му закону термодинамики и разделения двух разноцветных жидкостей после того, как они были налиты в один контейнер. Лучшее, что может сделать машина, проиллюстрировано новым измерительным прибором от Trio (Kenwood за рубежом), их моделью «5920 Sound Image Meter». Этот прибор измеряет то, что Trio называет “коэффициентом межушного корреляции” - «IACC». Стереомикрофон “слушает” стереозвуковое поле, и прибор анализирует сигналы, воспринимаемые левым и правым “ушами”. По сути, он компенсирует временную задержку вокруг головы от уха к уху, а затем сравнивает полученные две формы волн. Если они идентичны, то оба канала передают идентичную информацию, и «IACC» равен +1, что соответствует монофоническому сигналу. Если сигналы идентичны, но сдвинуты на 180° по фазе, то «IACC» равен –1, отрицательная корреляция.

Использование этого прибора «Trio» очевидно: воспроизведите монофонический белый шум через ваши два любимых динамика в вашей комнате для прослушивания, поместите манекен-голову на “стерео-место”, и отклонение «IACC» от “+1” говорит вам о том, насколько точное (или скорее неточное) стереоизображение будут производить эти динамики. Например, можно немедленно оценить влияние на стерео близлежащих границ помещения (с типичными динамиками и типичной комнатой, Trio говорит, что «IACC» будет между 0.2 и 0.8 - чем ближе к 1, тем лучше).

Мульти-моно стереозапись

Но, чтобы вернуться к теме этой статьи, как можно получить эти соотношения напряжений? Самый простой способ - взять монофонический сигнал и присвоить ему соотношение напряжений, “панорамируя” его на позицию с помощью “панпота”. Это дает изображение с однозначным позиционированием, и это панпотированное мульти-моно изображение можно услышать на любой рок-записи. Хотя у него нет аномалий позиционирования, это не более чем немного более сложная версия печально известных записей “теперь здесь - теперь там” конца 50-х. Несмотря на такие эффекты, как искусственный ревербератор (также панпотированный на подходящее место на стереосцене) и антифазные устройства, такие как «Aphex», этот простой подход к стереозаписи не воссоздает изображение реального события, а дает монтаж моно звуковых источников. Возможно, уместно, учитывая культурное положение рок-музыки, это больше похоже на плакат, а не на фотографию, и любое сходство с оригинальным событием почти не нужно.

Бинауральная запись

Однако классическая музыка эволюционировала таким образом, что отдельные музыканты в любом ансамбле достигают удовлетворительного внутреннего баланса, и любой слушатель будет воспринимать реальное непрерывное изображение с шириной и глубиной. Следовательно, должен быть какой-то способ записи этого изображения с сохранением направлений инструментов, чтобы они были точно воспроизведены.

Очевидным способом было бы использование пары всенаправленных микрофонов там, где будут уши слушателя, перехватывая звуковую волну, входящую в каждое ухо, так что при воспроизведении через наушники эта звуковая волна воссоздается, надеемся, точно. Мозг затем обрабатывает ту же информацию, как если бы слушатель был на оригинальном мероприятии. Однако обязательное использование наушников для воспроизведения означало, что эта бинауральная техника, несмотря на ее удивительный успех в воссоздании звукового поля, так и не стала популярной.

Стерео Блюмлейна

Гениальность Блюмлейна заключалась в его разработке техники микрофонирования, которая автоматически кодировала направления как соотношения амплитуд между двумя каналами. Его основная идея заключалась в использовании двух микрофонов в форме восьмерки с осью под прямым углом (рис.4). Они должны быть совпадающими в пространстве, невозможное условие, которое можно устроить для бокового изображения - это все, что нас заботит - поместив один просто над другим. Ральф Уэст в своей статье “Стерео Блюмлейна” (HFN/RR, июнь 1979) описал графически и кратко принцип, заложенный в этом, но стоит повторить.

Рис. 4.

Отклик микрофона в форме восьмерки пропорционален косинусу Θ, где Θ - это угол, который источник звука образует с осью микрофона. Если перекрестная пара расположена так, что источники звука с крайней левой и правой стороны находятся на левой и правой оси микрофона (Ml, Mr) соответственно, поскольку оси микрофона находятся под углом 90°, источник на Ml будет производить максимальный уровень (cos Θ = cos 90° = 0) в правый микрофон. По мере перемещения источника по дуге слева направо, сигнал левого микрофона уменьшается до нуля, в то время как сигнал правого микрофона возрастает до максимума. В любой промежуточной позиции соотношение амплитуд между двумя микрофонами составляет cos Θ:cos (90°–Θ) или cos Θ:sin Θ, что является эффективно линейной зависимостью.

Если вы слушаете оригинальные экспериментальные записи Блюмлейна, сделанные с перекрестными восьмерками, по мере того как он идет от крайней левой стороны к правой, его изображение стабильно перемещается по стереосцене. По мере того как он отходит от микрофона, его изображение остается узким, но однозначно расположено дальше, поскольку правильно захвачено соотношение прямого/реверберационного звука. Это, на самом деле, большое преимущество любой совпадающей техники: помимо точного захвата направлений прямых источников звука, каждый отраженный волновой фронт, составляющий реверберационное поле, также правильно расположен. Атмосфера согласована, и воспроизводимая боковая стереосцена освежающе свободна от аномалий - инструменты убедительно расположены в помещении, в котором была сделана запись.

И все же многие слушатели могут быть расстроены этим. В вызывающей статье в январском номере «Studio Sound» 1977 года (“Эхо Дашона”) Питер Феллгетт прокомментировал это, говоря, что “некоторые профессионалы слышат как “нечеткое” или “размытое” любую запись, которая предоставляет определенное чувство акустического пространства, в котором проходило исполнение… они видят все, что вносит конкретную информацию о пространстве записи и его акустической атмосфере, как вторжение, которое они интерпретируют как смущающее.”

Такое чувство было настолько сильным среди создателей записей, что большинство классических записей, обладая своей долей реверберации, представляют стереосцену внутри аномальной аморфной атмосферы. Критики и потребители, привыкшие к этому звуку, теперь реагируют негативно на более естественную запись, усиливая тенденцию отхода от захвата согласованной амбиентной информации: Питер Феллгетт, снова - "Трансляции или записи, которые звучат действительно правильно, настолько редки, что рецензенты склонны избегать их, так как они не соответствуют их ожиданию от Hi-Fi.

Однако следует помнить, что продюсеры и инженеры записи - это умные люди, и этот постепенный отход от натуралистической записи не связан только с извращенностью. Взгляните снова на рис.4 выше: будет очевидно, что не только оркестр и его атмосфера перед микрофонами будут захвачены, но и вся атмосфера сзади и по бокам. Результатом будет то, что если инженер не опытен и не знает лучшего места для установки микрофонов в выбранном зале, будет захвачено слишком много реверберации, и запись, хотя и реалистичная, будет слишком “мокрой” - звук, который напоминает одному критику о сидении в пустом школьном зале и удивлении, почему аудитория не пришла.

И даже если инженеру удалось найти эту “сладкую точку” для его перекрестных восьмерок, с оптимальным соотношением прямого/реверберационного звука, они могут оказаться слишком близко к исполнителям, неприемлемо увеличивая ширину стереосцены. Есть также проблема в том, что до сих пор я обсуждал только “идеальные” микрофоны. Характеристики отклика реальных микрофонов в форме восьмерки имеют тенденцию сужаться на высоких частотах, поэтому центральные изображения будут склонны к небольшому снижению в верхней части: это приводит к заметной “дыре” в центре сцены (степень которой зависит от микрофона), которую многие слушатели считают неприемлемой.

Другие совпадающие техники

Альтернативный подход все еще будет использовать совпадающую пару, но применять микрофоны с подавленной задней реакцией, такие как кардиоиды (рис.5), чтобы резко уменьшить вклад от реверберационного поля. Если их оси находятся под углом 90° и имеют идеальную кардиоидную реакцию выхода, пропорциональную 1 + cos Θ, то источник звука на оси Ml будет производить максимальный уровень (1 + cos Θ = 1 + cos 0° = 2) в левый микрофон. Однако, в то время как перекрестные восьмерки дают нулевой - нулевой выход - в правый микрофон, источник звука на оси Ml все еще будет давать относительный выход (1 + cos Θ = 1 + cos 90° = 1) в правые кардиоиды. Таким образом, соотношение амплитуд составляет 2:1, разница всего 6 дБ!

Рис. 5.

Перекрестные кардиоиды под углом 90°, следовательно, дают врожденно узкую сцену, но на практике ситуация еще хуже. “Реальные”, в отличие от “идеальных”, кардиоидные микрофоны испытывают трудности в поддержании своего рисунка на низких частотах, становясь более «omni» в характере; басовые частоты, следовательно, эффективно записываются в моно 90° кардиоидами, и уже отмечалось ранее, что с такой установкой атмосфера НЧ кажется “сосредоточенной” в центре. Их рисунок также имеет тенденцию сужаться на высоких частотах, снова вызывая появление высокочастотной “дыры в середине”.

Раскрытие угла между осью кардиоидов дает увеличенную разницу амплитуд между двумя каналами для крайних левых источников звука: включенный угол 135°, например, даст разницу около 10 дБ, поэтому стереосцена будет значительно шире, чем та, которую производит пара под углом 90°. Размещение кардиоидов спиной к спине, т.е. под углом 180°, даст максимальное разделение каналов, но также даст максимальную чувствительность к крайней левой и правой стороне. Таким образом, реверберация будет подчеркнута в этой позиции, что приведет к “вытягиванию” атмосферы к сторонам. Центральные изображения будут находиться под углом 90° к обоим микрофонам, где высокочастотная реакция “реальных” кардиоидов не удерживается, что приводит к появлению высокочастотной дыры в середине. Инструменты, которые увеличивают высокие частоты, когда они играют громче, если они центральные, когда тихие, “всплеск” к сторонам с 180° кардиоидами.

Если используется перекрестная пара микрофонов под углом 90° с гиперкардиоидной характеристикой, это даст более широкую сцену из-за уменьшенной чувствительности к источникам звука вне оси. Многие профессионалы предпочитают использовать перекрестные гиперкардиоиды, потому что, помимо их более широкой сцены, тот факт, что их рисунок обладает небольшим задним лепестком антифазы, дает дополнительное “пространство” для записанной реверберации.

Есть другой способ расширения сцены от перекрестной пары направленных микрофонов, если использование более фундаментально правильных перекрестных двунаправленных микрофонов непрактично. Это использование известного эффекта Хааса или “приоритета”, наиболее известного по его влиянию на прослушивание вне центра пары динамиков. В этой ситуации, если один и тот же сигнал подается на два динамика, введение временной задержки в подачу к одному из динамиков сместит иначе центрально расположенное изображение для центрально расположенного слушателя в сторону другого динамика. Если эта задержка составляет примерно 2 мс или больше, то изображение будет смещено в сторону. Что, если мы возьмем наши совпадающие кардиоиды и введем временную задержку для источников вне центра, немного раздвинув их?

Дополнительная информация о временной задержке усилит информацию только об амплитуде с ее ограниченным разделением и, в зависимости от порядка максимальных временных задержек, может значительно расширить узкую стереосцену только по амплитуде до приемлемой степени. Многие звукорежиссеры, которые отказались от микрофонов в форме восьмерки, поэтому используют перекрестные кардиоиды или гиперкардиоиды, разделенные горизонтально на расстояние, которое, по их мнению, дает необходимую компенсацию. Например, ORTF, французская система вещания, предпочитает кардиоиды, разделенные на 17 см, с включенным углом 110° (рис.6).

Рис. 6.

Хотя этот подход отходит от точного, математически правильного подхода Блюмлейна, и менее элегантен, поскольку представляет собой расположение двух “неправильностей”, чтобы они отменили друг друга, он несомненно имеет практическую ценность. Однако разбавление мысли Блюмлейна привело к ситуации, когда сбитые с толку звукорежиссеры предполагают, что любая совпадающая пара микрофонов должна быть внутренне “правильной”, и к широкому принятию того, что почти кажется “произвольными расположениями полу-совпадающих, полу-разделенных массивов, использующих произвольные направленные шаблоны и углы между микрофонами”, как выразился Питер Феллгетт.

Разделенные Omni и занавес звука

Если направленная информация может быть представлена в виде временных задержек между каналами, то возможно ли отказаться от замены Блюмлейна “амплитуда для разности фаз”, описанной в прошлом месяце, и сосредоточиться на информации о временной задержке? Примерно в то время, когда Блюмлейн экспериментировал со своими перекрестными восьмерками в 1931 году, в «Bell Telephone Labs» в США на основе экспериментальной бинауральной работы был выведен концепт “занавеса звука” (рис.7).

Рис. 7.

Общий волновой фронт, исходящий от оркестра, отбирается в большом количестве сопланарных точек. Сигналы от этих микрофонов подаются на динамики в эквивалентных позициях, так что волновой фронт эффективно воссоздается. Очевидно, что при бесконечном количестве комбинаций микрофон/динамик воспроизведение должно быть идеальным, но работа «Bell Telephone Labs» показала, что может быть достаточно всего трех. В 1933 году был проведен знаменитый эксперимент, в котором Филадельфийский оркестр выступал в Филадельфии, три микрофона подавались на три специально скорректированные наземные линии, и Леопольд Стоковски сбалансировал три выходных канала в Конституционном зале, Вашингтон.

Однако, какая информация на самом деле записывается? Рассмотрим самую простую технику разделенного микрофона на рис.8: два всенаправленных микрофона располагаются перед оркестром. Центральный источник звука производит равный амплитудный сигнал в каждом микрофоне - у нас есть наше знакомое двойное моно центральное изображение. Волновой фронт от этого источника звука также достигает обоих микрофонов одновременно, поэтому не вводится никакой временной задержки.

Рис. 8.

Однако рассмотрим источник звука на крайней левой стороне. Он гораздо ближе к микрофону A, чем к микрофону В, поэтому будет разница в амплитуде между выходами двух микрофонов. К сожалению, поскольку соотношение амплитуд происходит из соотношения расстояний, закон обратного квадрата диктует, что не будет линейного соотношения между соотношением амплитуд и направлением между крайней левой/правой и центром «à la» Блюмлейн, а соотношение квадратного закона. Центральные источники воспроизводятся как центральное изображение, но источник звука, немного смещенный от центра, воспроизводится как изображение, значительно отстоящее от центра.

Но что насчет временной задержки, также введенной из-за различных расстояний между источником и двумя микрофонами? Эта задержка вводит эффект предшествования, благоприятствующий ближайшему микрофону, который еще больше увеличит изображение. Поскольку два микрофона обычно имеют большое расстояние по сравнению с половиной длины волны звука на большей части аудиодиапазона, многие авторы говорили, что временная задержка будет производить случайные фазовые различия между двумя каналами, поэтому два разнесенных Omni будут производить информацию только об амплитуде. Но это будет верно только для стационарных сигналов, где каждая частота будет иметь разное фазовое соотношение между каналами, что приводит к циклическому “размытию” позиции источника с частотой.

Для переходных процессов и начала нот эффект предшествования временной задержки работает так же, как и для динамиков, и еще больше увеличивает оттягивание изображений от центра. Если, например, используются два Omni для записи человека, идущего слева направо, его записанное изображение медленно отодвигается от левого динамика, при этом увеличивается количество реверберации, а затем очень быстро перемещается вправо, при этом реверберация уменьшается до своего исходного уровня.

Таким образом, при записи, сделанной только с двумя Omni микрофонами, будет сильная тенденция к “скоплению” изображений вокруг динамиков, связанная с общим нечетким качеством, при котором инструменты кажутся меняющимися позицию с частотой. В попытке укрепить центральное изображение сторонники этой техники почти всегда добавляют третий центральный микрофон (рис.9), как использовалось в том реле «Bell», и это довольно эффективно снижает аномалии изображения, так что записанные инструменты кажутся исходящими примерно из их исходных позиций. Однако каждая пара микрофонов - LR, LC, CR - будет производить изображение каждого источника звука в немного разных местах, единственное согласие будет на крайней L/R и в центре.

Рис. 9.

И даже тогда позиционирование будет сохраняться только тогда, когда ширина общего источника схожа с расстоянием между микрофонами. Некоторое время назад я слышал цифровую мастер-ленту трамвая, записанную с двумя «omni», разнесенными примерно на 15 футов, параллельно рельсам. Когда трамвай был очень далеко слева от сцены, поскольку это расстояние очень велико по сравнению с расстоянием между микрофонами, изображение было, на самом деле, центральным и далеким. По мере приближения трамвая слева, расстояние между микрофонами становилось значительным сначала на высоких частотах, а затем и в аудиодиапазоне. Изображение размывалось в сторону левого динамика, сначала высокие частоты, пока оно не было локализовано в левом динамике. Когда трамвай достиг, а затем прошел мимо левого микрофона, записанное изображение внезапно очень быстро сместилось вправо, а по мере его отступления, справа от сцены, сначала низкие частоты, а затем и высокие, размывались обратно в центр. Подобные записи, сделанные с перекрестными микрофонами в форме восьмерки, не показывают таких аномалий.

Однако помимо стерео, у разнесенной техники есть преимущества, благодаря которым она продолжает использоваться, особенно в США, где поколение инженеров по записи звука начинало свою аудиокарьеру на работе «Bell». Если использование микрофонов в форме восьмерки исключено, то перекрестные совпадающие техники означают использование кардиоидных или гиперкардиоидных микрофонов. Теперь основной отклик любого микрофона может быть только одним из двух типов: чувствительность к скорости (восьмерка) и чувствительность к давлению (Omniдирекционный). Определенный направленный шаблон, такой как кардиоид, должен быть получен из одного или обоих из этих двух, и, как оценят все, кто читал недавние обзоры микрофонов Ангуса Маккензи в HFN/RR (апрель/май 1981), вывод этого шаблона может внести значительную окраску и серьезно ухудшить общую частотную характеристику.

Профессиональные микрофоны естественно будут гораздо менее окрашены, чем их любительские аналоги, но они обычно все равно добавляют достаточно окраски к сигналу, чтобы ее можно было идентифицировать на слух. Гораздо проще спроектировать всенаправленный микрофон так, чтобы он имел внутренне плоский отклик в пределах частотных ограничений, установленных различными механическими параметрами, и записи, сделанные с разнесенными Omni, могут иметь освежающе чистый звук с прозрачными высокими частотами и гладким расширенным нижним концом.

Микрофон “Crown PZM” помещает Omni капсулу очень близко к поверхности, так что падающие и отраженные волны усиливаются в фазе, давая чрезвычайно хорошо поддерживаемый полусферический отклик, вплоть до частоты, определяемой размером смежной поверхности. Использование разнесенной пары PZM на полу, следовательно, дает относительно плоский неокрашенный звук с хорошо расширенным басом и, если можно принять аномальное стерео, имеет огромное преимущество, особенно для живой оперной записи, в том, что на виду нет неприглядных микрофонов или стоек для микрофонов.

Техника Mid-Side

Остается еще одна совпадающая техника, которая дает точное боковое изображение, это техника MS, полностью описанная Тони Фолкнером в HFN/RR (август 1980). Кратко, кардиоид или гиперкардиоид, направленный вперед (Middle), совпадает с микрофоном в форме восьмерки, направленным вбок (Side). Сумма и разность выходов двух микрофонов дают, соответственно, левый и правый каналы, и есть два основных преимущества: центральные источники точно на оси для микрофона M, поэтому центральные изображения сильные, и этот микрофон ближе всего к тому, чтобы дать свой самый плоский отклик, в то время как общую ширину сцены можно отрегулировать, изменив соотношение между выходами двух микрофонов.

Подведение итогов

На рис.10 диаграмматически показаны этапы, представленные рассмотренными до сих пор техниками. Захватывающая статья Брюса Бартлетта, инженера в «Shure», исследующего субъективные стереорезультаты различных “чистых” техник микрофонирования, появилась в декабрьском номере 1979 года американского журнала «Studio Magazine db»; она заслуживает внимательного прочтения.

Рис. 10.

До сих пор я обсуждал только техники, которые стремятся захватить стереоинформацию так, как она была воспринята на оригинальном мероприятии. Давайте вернемся на пару тысяч слов назад: “идеальное” изображение можно получить, распределив моносигналы на подходящие позиции по боковой сцене. Теперь каждая рассмотренная “чистая” техника имеет проблемы - либо теоретические, либо практические, и связанные с дефектами реальных микрофонов, которые не обязуют математика соответствовать на всех частотах с их идеальным шаблоном отклика.

В частности, использование совпадающей техники, с ее захватом акустики, в которой выступают музыканты, обязательно подразумевает, что акустика должна быть подходящей для данного вида музыки и привлекательной сама по себе. Это редко бывает так, и, хотя идеально записи должны делаться только в одном из, по-видимому, небольшого числа хороших мест, коммерческая реальность означает, что удобное расположение зала и его удобства часто перевешивают его полное отсутствие хорошей акустики. Например, часто используются зал городского совета Уолтемстоу и Всех Святых в Тутинге, но чрезмерное количество реверберации в таких местах - когда они пусты от аудитории - делает живой оркестровый звук действительно странным, и это не звук, который бы вы особенно хотели записывать вообще. У дирижера также есть проблема со слышимостью всего оркестра!

Питер Феллгетт провел довольно хорошую аналогию - если ипподром затоплен, то проведение гонки с лошадьми, имеющими поплавки на копытах, может быть возможным, но это не очень желательно! Это, конечно, не учитывает коммерческие аспекты, которые привели к тому, что запись произошла в первую очередь, поэтому инженерам часто действительно не остается выбора, кроме как сделать все возможное из плохой по звуку работы.

Если акустика не подходит, то ее нужно подавить: использование отдельного микрофона для каждой группы инструментов и перемещение микрофонов ближе к инструментам минимизирует захват реверберации, каждый выход микрофона затем панорамируется обычным для поп-музыки способом к его позиции на сцене. К сожалению, поскольку любой инструмент предназначен для производства своего лучшего тона на расстоянии до аудитории, его близкий звук обычно жесткий и слишком яркий, поэтому использование близких микрофонов означает, что необходимо использовать некоторое затухание высоких частот, особенно с инструментами, такими как скрипки, где это ухудшение серьезно.

Отсутствие реверберации означает, что необходимо ввести некоторую степень искусственной атмосферы, либо от эхо-пластины, либо от дальнего микрофона в зале. Опять же, эта атмосфера, которая, в отличие от той, что на “чистом” диске, несет нулевую информацию о позиции, должна быть панорамирована в подходящее место на сцене. Кроме того, поскольку многоканальное микширование полностью уничтожило правильный внутренний баланс, достигнутый оркестром, его необходимо восстановить, отрегулировав амплитуду выхода каждого микрофона с помощью микшера.

К сожалению, каждый микрофон, кроме того, чтобы подхватить свой желаемый инструмент, будет подхватывать окружающие инструменты, и значительные изменения в “сыром” балансе могут оказаться невозможными - например, увеличение уровня вторых скрипок может привести к тому, что уровень рогов поднимется до неприемлемой степени. Даже когда микрофонирование организовано для минимального перелива, когда один инструмент достигает кульминации, захват его звука удаленными микрофонами может стать беспокойным, поскольку его изображение тогда размажется и расширится. Это можно увидеть драматически на некоторых записях. По мере увеличения громкости центральных соло инструментов происходит переход от почти чистого поперечного рисунка к круговому рисунку, поскольку случайные фазовые вклады от других микрофонов становятся значительными.

Поскольку эти другие микрофоны также находятся на разных расстояниях, вклад от каждого будет приходить в разное время от главного сигнала. Было предположено (“Редакционная” HFN/RR февраль 1979), что это создаст рисунок “эха”, создавая несогласованную ложную атмосферу; но, возможно, более важно, что будут отмены на частотах, где расстояние между любой парой микрофонов равно нечетному числу полуволн. Окраска “гребенчатого фильтра”, которую это вводит, может быть сильной, но ее невозможно устранить с помощью эквалайзеров или регуляторов тембра.

С хорошей командой инженера/продюсера/дирижера и проверкой фазовых отношений между парами микрофонов звуковые результаты техники могут предвосхитить ваши ожидания. Вероятно, большинство записей, появляющихся в колонке “Quality Monitor” HFN/RR, создаются именно таким образом, и они могут быть очень удовлетворительными.

Однако если стереоизображение, созданное с помощью перекрестной пары идеальных микрофонов восьмеричной формы, является “истинным” двухмерным изображением, которое точно воспроизводит боковую и глубинную информацию, которую вы бы восприняли, если бы находились на записи, техника многомикрофонной записи может производить только монтаж индивидуальных моноизображений (рис.11). С появлением дешевых отечественных систем цифрового воспроизведения в ближайшем будущем, “соединения” в этом монтаже станут еще более заметными, и, наконец, потребитель сможет оказать реальное давление на звукозаписывающие компании. Слишком долго производственные команды могли сидеть в безопасности, зная, что их необходимые - по их мнению - компромиссы могут остаться незамеченными всеми, кроме самых критически настроенных энтузиастов.

Рис. 11.

Так же, как у нас есть две связанные, но разные формы искусства в театре и в кино, возможно, мы увидим появление двух отдельных типов записи, как предполагал продюсер классической музыки «Columbia/CBS» Пол Майерс («HFN/RR», август 1978 г.). Мы можем иметь либо “снимок” концерта, либо запись с полным использованием техник для создания, намеренно, нового произведения искусства, так как, по-видимому, записанная опера более успешна как звуковое событие, чем меньше она связана со сценической версией со своими ограниченными театральными эффектами. Можно использовать настоящие пушки и церковные колокола в “Тоске”, например, или гром в “Волшебной флейте”, или просто что-нибудь в “Кольце”. Одно можно сказать наверняка; будет интересно следить за страницами обзоров записей в HFN/RR в течение 1980-х годов.

Переведено с сайта https://www.stereophile.com

Ссылки на оригинал:

  • https://www.stereophile.com/content/stereo-image
  • https://www.stereophile.com/content/stereo-image-page-2
  • https://www.stereophile.com/content/stereo-image-page-3
  • https://www.stereophile.com/content/stereo-image-page-4

Дата публикации на Stereophile - 3 июля 2018 г.

Автор статьи - Джон Аткинсон

Впервые опубликовано: 1 мая 1981 г.

Автор демонстрирует техники стерео микрофонирования на английской аудиовыставке в 1981 году.