Основы обработки звука во встраиваемых системах. Часть 1


PDF версия

В статье рассматривается алгоритм цифровой обработки аудиосигналов в процессорах, которые используются во встраиваемых системах.

Операции аналого-цифрового и цифро-аналогового преобразования должны подчиняться теореме дискретизации Шэннона-Найквиста, которая гласит, что для последующего восстановления частота дискретизации аналогового сигнала должна быть, как минимум, в два раза выше его ширины полосы (частота Найквиста). При дискретизации с меньшей частотой возникают спектральные наложения.
В реальных системах частота дискретизации всегда берется выше удвоенной частоты Найквиста из-за неидеальности фильтров нижних частот (ФНЧ), используемых для предотвращения наложений. Например, для оцифровки сигнала в аудио CD используется частота, равная не 40, а 44,1 кГц. Во многих высококачественных системах для более точного воспроизведения звукового диапазона частот (0…20 кГц)  используется еще более высокая частота дискретизации — 48 кГц. Некоторые типовые значения частот дискретизации, используемые в широкораспространенных системах, приведены в таблице 1.

 

Таблица 1. Типовые значения частот дискретизации

Система

Частота дискретизации, Гц

Телефония

8000

Компакт-диск

44100

Профессиональная аудиосистема

48000

DVD аудио

96000 (для 6-канального аудиосигнала)

 

Импульсно-кодовая модуляция (ИКМ)

Наиболее распространенной формой цифрового представления аудиосигнала является импульсно-кодовая модуляция (ИКМ), при которой амплитуда аналогового сигнала кодируется на каждом интервале дискретизации определенным цифровым уровнем. Поскольку любой аналого-цифровой преобразователь (АЦП) имеет ограниченное разрешение, он вносит в систему шум квантования. Уменьшение разрешения приводит к ухудшению качества представления исходного сигнала.

Широтно-импульсная модуляция (ШИМ)

Другим популярным способом представления аудиосигнала является широтно-импульсная модуляция (ШИМ), когда амплитуда сигнала кодируется не уровнями напряжения, а длительностью импульсов в импульсной последовательности. Преимущество ШИМ заключается в том, что сигналы в таком формате могут подаваться на выходную схему напрямую без использования ЦАП. Для формирования ШИМ-сигналов могут использоваться выводы общего назначения или специализированные ШИМ-таймеры, которые имеются во многих процессорах.

 

Краткий обзор аудиопреобразователей

Существует множество способов реализации аналого-цифрового преобразования. В первых коммерчески успешных АЦП использовалась схема последовательного приближения на базе компаратора, сравнивающего входное аналоговое напряжение с набором дискретных уровней.
Большинство современных аудио-АЦП — это сигма-дельта (Σ-Δ)-преобразователи. В них для получения высокого разрешения используется 1-разрядный АЦП, единственный бит на выходе которого указывает, выше или ниже напряжение на текущем отсчете, чем напряжения на предыдущем отсчете. Для компенсации эффекта от уменьшения шагов квантования сигнал подвергается избыточной дискретизации с частотой, намного превышающей частоту Найквиста. Для перехода к более традиционному формату ИКМ полученный 1-битный поток преобразовывается во внутреннем блоке цифровой фильтрации в поток отсчетов, имеющих меньшую скорость и более высокое разрешение.
Применение в сигма-дельта-АЦП избыточной дискретизации позволяет смягчить требования к аналоговым ФНЧ, ограничивающим полосу входных сигналов. Кроме того, шум таких АЦП распределен в более широкой полосе по сравнению с другими преобразователями. Большинство современных аудио-ЦАП также представляют собой сигма-дельта-преобразователи. Такие ЦАП преобразовывают низкоскоростной поток данных, имеющих высокую разрядность, в 1-разрядный высокоскоростной поток, который выдается на 1-разрядный ЦАП для преобразования в аналоговый вид.
Во многих современных аудиосистемах используется комбинация сигма-дельта-АЦП и сигма-дельта-ЦАП, и преобразование между ИКМ-сигналами и 1-разрядными сигналами с избыточной дискретизацией делается дважды. Поэтому компании Sony и Philips в своем формате Super Audio CD (SACD) в качестве альтернативы ИКМ предложили представление, называемое DSD (Direct-Stream Digital), при котором данные передаются в виде 1-разрядного высокоскоростного (2,8224 МГц) потока. Недостатком такого представления является необходимость использования совершенно иного набора алгоритмов обработки.  

 

Интерфейс с аудиопреобразователями

Перейдем от теории к практике и рассмотрим подключение аудио-АЦП к процессору на примере недорогого 24-разрядного сигма-дельта-преобразователя с частотой дискретизации 96 кГц — AD1871 производства Analog Devices (см. рис. 1а). Стереоаудиосигнал поступает на вход микросхемы через левый (VINLx) и правый (VINRx) входные каналы, а поток оцифрованных данных последовательно выдается через порт данных, который обычно подключается к соответствующему последовательному порту процессора. Для взаимодействия АЦП AD1871 с процессором Blackfin, как показано на рисунке 1б, не требуется дополнительных компонентов (аналоговая часть показана схематически, поскольку в рамках темы интерес представляют только цифровые сигналы). Для подключения АЦП используется последовательный порт  (SPORT) процессора Blackfin, а также порт SPI, через который осуществляется программное конфигурирование различных параметров АЦП. Сигнал тактовой синхронизации, обеспечивающий избыточную дискретизацию, вырабатывается внешним кварцевым резонатором.

 

Рис. 1. Интерфейс процессора Blackfin с АЦП AD1871

Оцифрованный сигнал передается из AD1871 в процессор через SPORT, который настраивается в режим I2S.
I2S — это стандартный протокол, предложенный компанией Philips, который позволяет разработчикам аудиооборудования создавать совмес­тимые друг с другом компоненты. Он представляет собой трехпровод­ной последовательный интерфейс, используемый для передачи цифровых стереосигналов (см. рис. 2а) и включающий в себя сигнал тактовой синхронизации (посередине), сигнал данных (внизу) и сигнал синхронизации левого/правого каналов (вверху), указывающий, данные которого из каналов передаются в текущий момент.

 

Рис. 2. Интерфейсы I2S и SPI

Интерфейс SPI (см. рис. 2б) разработан компанией Motorola для связи хост-процессоров с различными цифровыми компонентами. Интерфейс между ведущим и ведомым устройствами SPI включает линию тактовой синхронизации (SCK), две линии данных (MOSI и MISO) и линию выбора ведомого устройства (SPISEL). Одной из линий данных (MOSI) управляет ведущее устройство, а другой (MISO) — ведомое. Наличие в кодеках отдельного управляющего SPI-порта позволяет хост-процессору менять настройки АЦП «на лету».
Подключение аудио-ЦАП к процессору выполняется аналогичным образом. В системах, содержащих и ЦАП, и АЦП, для их подключения может использоваться один последовательный порт, если он поддерживает двунаправленную передачу данных. Для обеспечения полнодуплексной передачи аудиоданных лучше использовать однокристальные аудиокодеки, которые реализуют и аналого-цифровое, и цифро-аналоговое преобразование.

 

Динамический диапазон и точность

Вероятно, многим уже встречались различные параметры в единицах дБ, указываемые в спецификациях на те или иные продукты. Что же представляют собой эти числа? Рассмотрим это на примере рисунка 3.

 

Рис. 3. Взаимосвязь между параметрами аудиосистемы

 

Динамический диапазон человеческого уха (отношение максимально громкого к максимально тихому уровню сигнала) составляет примерно 120 дБ. В системах, в которых присутствует шум, динамический диапазон представляет собой отношение максимального уровня сигнала к шумовому порогу:

 

Динамический диапазон (дБ) = пиковый уровень (дБ) – шумовой порог (дБ).

Шумовой порог аналоговой системы обусловлен электрическими свойствами самой системы. В цифровых системах источниками шума являются АЦП и ЦАП, а также ошибки квантования при дискретизации.
Другим важным параметром является отношение сигнал-шум (ОСШ). В аналоговой системе ОСШ равно отношению номинального уровня сигнала (линейного уровня) к шумовому порогу. В профессиональном оборудовании номинальный среднеквадратический уровень обычно равен 1,228 В. Разница между номинальным линейным уровнем и пиковым уровнем, при котором возникают искажения сигнала, называется запасом по уровню. Для цифровых систем ОСШ указывается несколько иным образом и принимается равным динамическому диапазону.
Взаимосвязь между динамическим диапазоном и разрядностью слова, используемой при представлении сигналов в цифровой форме, описывается выражением, которое известно как «правило 6 дБ»:

 

Динамический диапазон (дБ) = 6,02n + 1,76 ≈ 6n дБ,

 

где n — число битов в представлении сигнала.
«Правило 6 дБ» означает, что повышение разрядности на 1 бит приведет к увеличению динамического диапазона на 6 дБ. Следует отметить, что это правило не затрагивает аналоговые компоненты аудиосистемы, влияние которых должно учитываться отдельно. Таким образом, чем больше разрядность, тем выше качество аудиосигнала, которое мы получим. Однако на практике выбор разрядности слова сопряжен с реальными ограничениями. Большинство процессоров, подходящих для обработки звука во встраиваемых системах, имеют разрядность 16, 24 или 32 бита. В таблице 2 приведены значения динамического диапазона для этих трех типов процессоров.

 

Таблица 2. Значения динамического диапазона для 16-, 24-, 32-разрядных процессоров

Формат данных

Динамический диапазон
(на основании «правила 6 дБ»), дБ

16-разрядный с фиксированной точкой

96

24-разрядный с фиксированной точкой

144

32-разрядный с фиксированной точкой

192

 

Вспомним, что динамический диапазон человеческого уха равен 120 дБ. Очевидно, что 16-разрядное представление данных для высококачественных аудиосистем не подходит. По этой причине некоторые производители стали выпускать 24-разрядные процессоры. Недостаток таких процессоров заключается в том, что они являются нестандартными с точки зрения компиляторов языка С, поэтому во многих современных аудиосистемах применяется 32-разрядное представление данных.  
Выбором подходящего процессора история не заканчивается, поскольку полное качество системы определяется уровнем качества самого «слабого» компонента. Помимо процессора в состав системы будут входить аналоговые компоненты, такие, как микрофоны и динамики, а также цифро-аналоговые и аналого-цифровые преобразователи. Обсуждение аналоговой части системы выходит за рамки данной статьи, а ЦАП и АЦП имеют к цифровой части непосредственное отношение.
Предположим, что для дискретизации звукового сигнала используется преобразователь AD1871. Это 24-разрядный преобразователь, но из-за того, что он не является идеальным устройством, его динамический диапазон равен 105 дБ вместо теоретических 144. Если подключить AD1871 к 24-разрядному процессору, то ОСШ полной системы будет равно 105 дБ. Шумовой порог будет составлять: 144 – 105 = 39 дБ, как показано на рисунке 4.

 

Рис. 4. Влияние ОСШ наиболее «слабого» компонента на полное ОСШ системы

В цифровой аудиосистеме есть еще один компонент, который мы пока не обсуждали — это вычисления в ядре процессора. Вычислительные операции в процессоре могут являться причинами разнообразных ошибок. Одна из таких ошибок — ошибка квантования, которая появляется, если в результате выполнения ряда вычислений происходит усечение или округление слова данных.
Рассмотрим пример, иллюстрирующий влияние ошибок вычислений в реальной системе. ОСШ идеального 16-разрядного АЦП равно 96 дБ. Если бы ошибок квантования не было, то для обеспечения этого значения было бы достаточно 16-разрядных вычислений. Однако любые цифровые аудиосистемы вносят ошибки округления и усечения. Если принять эту ошибку равной, например, 18 дБ (3 разряда), то станет очевидно, что 16-разрядных вычислений для обеспечения ОСШ, равного 96 дБ, недостаточно, т.к. эффективный шумовой порог поднимется на 18 дБ и полное ОСШ уменьшится до 96 – 18 = 78 дБ. Решить проблему эффектов квантования поможет увеличение разрядности данных.

 

Окончание статьи будет опубликовано в ЭК 2008, №2.

Оставьте отзыв

Ваш емейл адрес не будет опубликован. Обязательные поля отмечены *