close

Вход

Забыли?

вход по аккаунту

?

164

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ISSN 0013-5771. «ЭЛЕКТРОСВЯЗЬ», № 7, 2010
49
УДК 681.84
Оценка влияния аналого-цифрового преобразования на искажения при перцепциальном кодировании аудиоданных
И. А. Оболонин, доцент каф. САПР СибГУТИ, к.т.н.
Н. А. Рыговская, аспирант СибГУТИ; n.rygovskaya@vgroup.ru
Ключевые слова: компрессия аудиоданных, искаже‑
ния сигнала, цифро-аналоговые преобразователи, аналогоцифровые преобразователи, групповое время запаздывания.
Введение. В настоящее время в радиовещании, профес­
сиональной и бытовой аудиотехнике широко используется
компрессия цифровых аудиоданных, неизбежно сопрово­
ждаемая искажениями качества стереофонического звуча­
ния. При этом качество аналого-цифрового преобразова­
ния (АЦП) подразумевается идеальным.
В работе рассматриваются три основных фактора АЦП,
которые, по мнению авторов, оказывают существенное вли­
яние на качество цифрового звука (с компрессией аудио­
данных), при высококачественном стереофоническом вос­
произведении.
В пси хоакустическ и х моделя х стандартов MPEG
не учтены механизмы временной маскировки сигналов;
пространственной демаскировки источников звука, состав­
ляющих стереопанораму как по фронту, так и по глубине;
особенности восприятия реверберационных составляющих
стереофонических сигналов.
Именно эти механизмы пространственного слуха игра­
ют наиболее важную роль при стереовоспроизведении.
Они определяют восприятие основных признаков качества
стереофонического звучания, таких как пространственное
восприятие, прозрачность звучания, естественность и бо­
гатство тембров инструментов и голосов, восприятие аку­
стической атмосферы первичного помещения. Это приво­
дит к снижению качества звучания, которое отчетливо за­
мечают слушатели.
Однако на качество звучания существенное влияние
оказывает и собственно АЦП исходного аудиосигнала.
В предлагаемой работе рассматриваются специфиче­
ский характер спектра ошибок квантования, фильтрация
сигналов при АЦП и цифро-аналоговых преобразованиях
(ЦАП) и защита АЦП от перегрузок, вызывающая нели­
нейные искажения аудиосигнала.
Влияние ошибок квантования. В технической литературе
[1] вопрос о спектре ошибок квантования обычно рассматри­
вается для одного частного случая широкополосного звуко­
вого сигнала, имеющего равномерное распределение по ча­
стоте и уровню. Спектральная плотность мощности шума
квантования для такого сигнала имеет равномерное распре­
деление от 0 Гц до частоты Найквиста. Фактически этот шум
является белым и, в отличие от искажений цифрового звука,
он воспринимается на слух без неприятных ощущений.
Очевидно, что музыкальный сигнал нельзя отождест­
влять с шумовым, так как он несет звуковую информацию
и отличается тем, что ошибки квантования в нем корре­
лированны с самим сигналом и поэтому на слух они часто
воспринимаются как призвуки.
Квантованию подвергается амплитудно-импульсный
модулированный сигнал (АИМ-сигнал) с широким дис­
кретным спектром. Ошибки квантования, возникающие
при этой операции, — ошибки квантования АИМ-сигнала.
Это следует учитывать, поскольку в литературе под ошиб­
кой квантования часто понимают ошибку, возникающую
при квантовании синусоидального сигнала, хотя спектры
этих двух ошибок не сопоставимы. Таким образом, циф­
ровой звуковой сигнал отличается от аналогового тем, что
он — продукт АИМ.
В [1] показано, что спектр ошибок квантования и их
звучание зависят от коэффициента кратности k, частоты
дискретизации fs и частоты сигнала F. Кроме того, спектр
ошибок квантования существенно отличается при четных
и нечетных значениях k, как на кратных, так и на субкрат­
ных частотах.
В [1] также исследовано звучание ошибок квантования
в зависимости от вида звуковых тестовых сигналов и коэф­
фициента кратности k. Главное отличие отклонений звуко­
вого сигнала от субкратных и кратных частот заключается
в том, что у этих сигналов принципиально разные спектры
ошибок квантования, и это оказывает влияние на звучание
ошибок квантования.
Установлено, что при синусоидальных сигналах неза­
висимо от частоты и уровня сигнала ошибки квантования
не воспринимаются как шум. Даже при небольших откло­
нениях сигнала от кратных и субкратных частот, когда ча­
стотный интервал между составляющими спектра ошибок
квантования во всем диапазоне меньше 1 Гц, их звучание
напоминает не шум, а рокот, который в музыкальных сиг­
налах создает впечатление «грязного» звучания.
Влияние фильтрации. На входе АЦП и на выходе ЦАП
находятся фильтры нижних частот (ФНЧ), ограничиваю­
щие спектр входных частот и устраняющие ВЧ составляю­
щие выходного сигнала.
Подавление сигнала ФНЧ на частоте, равной поло­
вине частоты дискретизации, должно быть не менее 60 дБ
[2]. При этом крутизна ската ФНЧ получается очень высо­
кой, а это требует использования фильтров высокого поряд­
ка. Кроме того, такие фильтры имеют недостатки, главный
из которых — нелинейная фазо-частотная характеристи­
ка, что приводит к заметным на слух искажениям аудио­
сигналов, проявляющихся в потере «прозрачности» звуча­
ния. Несмотря на то, что повышение разрядности и частоты
дискретизации АЦП улучшают качество звука, это не ока­
зывает большого влияния на его качественные показатели.
Очевидная причина этого — сложность высококачествен­
ной фильтрации. На входе АЦП необходимо применять
фильтр с очень высокой крутизной характеристики (для
подавления частоты, равной половине частоты выборки
или превышающей ее). Фильтры с частотой дискретизации
44,1 кГц (их иногда называют фильтрами типа “кирпичная
стена”) должны пропускать частоту 20 кГц и при этом от­
секать 22,05 кГц. Кроме того, при записи и воспроизведе­
нии неизменно добавляются шумы квантования.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
50
ISSN 0013-5771. «ЭЛЕКТРОСВЯЗЬ», № 7, 2010
Повышение эффективности звукового вещательного
сигнала связано с развитием техники АЦП. В частности,
появление однобитного цифрового формата (DSD) [3] в ка­
налах записи и передачи сигнала звукового вещания (ЗВ)
было обусловлено совершенствованием дельта-сигма пре­
образователей и увеличением пропускной способности
трактов хранения и передачи звуковых сигналов.
Известный метод оптимизации соотношения цена/каче­
ство (в понятие цены, кроме стоимости заложена аппарат­
ная сложность, габаритно-весовые показатели, сроки раз­
работки) — использование кодеров (декодеров), в которых
АЦП (ЦАП) работают на повышенной частоте, что позво­
ляет значительно снизить требования к крутизне ската ана­
логового ФНЧ. В этом случае основное затухание на гра­
ничной частоте полосы непропускания обеспечивается
цифровым фильтром. При выборе структуры цифрового
фильтра преимущества имеют нерекурсивные фильтры, по­
зволяющие получить линейную характеристику.
На рис. 1 показаны рассчитанные [4] зависимости груп­
пового времени запаздывания от нормированной частоты
(wв — верхняя граничная частота сигнала равна 1) для ФНЧ
Баттерворта 2‑го — t(w), 4‑го — t1(w), 6‑го — t2(w) и 8‑го —
t3(w) порядков, а на рис. 2 — для ФНЧ Чебышева 2‑го —
t1(w), 4‑го — t2(w), 6‑го — t3(w) и 8‑го — t4 (w) порядков. Для
фильтров Баттерворта неравномерность в полосе пропуска­
ния не превышает 3,2 мс (фильтр 8‑го порядка). При этом
обеспечивается рабочее затухание на граничной частоте
полосы непропускания Аpmin — 5 дБ (передача сигналов ЗВ)
и 13 дБ (цифровая звукозапись).
τ(ω)
τ(ω)
τ1(ω)
τ2(ω)
τ3(ω)
12
10
8
6
4
2
0
0,477 0,588
0,7
0,811 0,923 1,034 1,145 1,257 1,368
1,48
1,591 ω
Рис. 1
τ(ω)
τ(ω)
τ1(ω)
τ2(ω)
τ3(ω)
27
24
21
18
Влияние защиты АЦП от перегрузок. При компрессии
аудиоданных в психоакустических моделях стандартов
MPEG и Dolby АС-3 шаг квантования изменяется в соответ­
ствии с уровнем кодируемого сигнала в субполосе. Однако
кодирование ведется так, что уровень шумов не превышает
относительный порог слышимости. В этом случае следу­
ет учесть, что при первичном ИКМ-преобразовании уро­
вень аудиосигнала может превышать квазимаксимальный,
на основе которого выбирается порог перегрузки АЦП.
За счет ограничения уровня входного сигнала АЦП воз­
никают нелинейные искажения. В психоакустической мо­
дели осуществляется перераспределение количества бит,
отводимых на субполосу в фиксированный интервал време­
ни. При росте уровня сигнала количество бит уменьшается,
т. е. растет шаг квантования. Вместе с первичным сигналом
(с таким же шагом квантования) квантуются и высшие гар­
моники, возникшие при превышении квазимаксимального
уровня.
Перегрузк и А ЦП на входе цифровы х аудиотрак­
тов недопустимы, поскольку АЦП порождают собственные
побочные эффекты (артефакты) и возникающие искажения
значительно отличаются от нелинейных искажений в ана­
логовых трактах (с точки зрения слухового восприятия).
Вероятность превышения квазимаксимального уровня
для сигнала с гауссовским законом распределения состав­
ляет примерно 0,02, что соответствует появлению при вос­
произведении 6 щелчков в течение 5 мин (только за счет
перегрузки АЦП) [5]. Нормы допускают не более одного
заметного на слух щелчка в час, поэтому необходимы меры,
не допускающие перегрузку АЦП.
Простейшее решение этой задачи — применение на вхо­
де АЦП жесткого (безынерционного) ограничения на уров­
не, не превышающем порог перегрузки. Это приводит к по­
явлению нелинейных искажений и потере ВЧ составляю­
щих в области превышения порога ограничения.
Другое решение рассматриваемой задачи — компрес­
сия сигнала в верхней части его динамического диапазо­
на. В этом случае сохраняются ВЧ составляющие исходно­
го сигнала, однако нелинейные искажения неизбежны.
От выбора закона компрессии будет зависеть уровень нели­
нейных искажений при воспроизведении аудиосигналов.
Кроме того, следует учитывать вероятность появления того
или иного уровня сигнала. На рис. 3 приведена функция
распределения уровней N, полученная экспериментальным
путем [6] при исследовании записанных на магнитной лен­
те музыкальных и речевых отрывков сигналов ЗВ. Можно
считать, что такое распределение подчиняется гауссовско­
му закону с параметрами m = -24 дБ, s = 10 дБ.
15
P(N) 1
12
0,8
9
6
0,6
3
0,4
0
0,15
0,3
0,45
0,6
0,75
0,9
1,05
1,2
1,35
1,5 ω
0,2
Рис. 2
Для фильтра Чебышева используется фильтр не выше
6‑го порядка (неравномерность не превышает 11 мс), что
для слуха вполне допустимо. При этом ФНЧ обеспечивает
Apmin — 28 дБ (звукозапись) и 10 дБ (передача сигналов ЗВ).
Оценивая допустимую неравномерность группового вре­
мени запаздывания, авторы руководствовались нормами
ГОСТ Р 50757-95.
0
–60
–50
–40
–30
–20
–10
N, дБ
Рис. 3
Известны исследования зависимости заметности иска­
жений перегрузки АЦП от коэффициента перегрузки Кп [6]
Kп = 20log | Хmax |/Хп ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ISSN 0013-5771. «ЭЛЕКТРОСВЯЗЬ», № 7, 2010
51
где Хmax — максимальный по модулю отсчет; Хп — порог пе­
регрузки АЦП, полученные субъективно-статис­т и­че­ским
путем (рис. 4).
100
Заметность, %
80
2
1
60
ник была получена [7] сравнительная оценка нелинейных
искажений, возникающих при безынерционном ограни­
чении и компрессии верхней части динамического диа­
пазона звукового сигнала (по логарифмическому закону).
На рис. 6 представлены полученные зависимости коэффи­
циента гармоник для ограничителя KГ(N) (кривая 1) и ком­
прессора верхней частоты динамического диапазона KГK(N)
(кривая 2), от уровня сигнала N.
КГ, КГК
40
0,3
20
0,26
0
2
4
6
8
10
Кп, дБ
0,23
Рис. 4
1
0,19
Из рисунка 4 видно, что искажение перегрузки незамет­
ны при Кп ≈ 1 дБ, где кривая 1 — усредненное значение для
различных передач при радиотрансляции; кривая 2 — для
женского сольного пения (критический фрагмент). В аппа­
ратуре часто используют защитный интервал в 3 дБ (Кп =
3 дБ), что приводит к уменьшению отношения сигнал/ис­
кажения квантования. Кроме того, нет гарантии, что диа­
грамма уровней в канале стабильна.
На рис. 5 показана амплитудная характеристика пре­
образователя (на входе АЦП), осуществляющего компрес­
сию сигнала в верхней части его динамического диапазона,
по логарифмическому закону. Верхние 5 дБ используются
для создания области, где уровень преобразованного сиг­
нала представлен в логарифмическом соотношении. Это
позволяет представить в пределах всего лишь 5 дБ фронты
сигнала, уровень которых гораздо выше точки, где начи­
нается область перегрузки. Такой прием подобен эффекту
компрессии звука, появляющегося при высококачествен­
ной записи аудиосигналов на магнитную ленту в аналого­
вом виде (из-за нелинейности кривой намагничивания).
0,11
0,075
0,038
-5
Область
компрессии
-5
+16
2,5
5
7,5
10
N, дБ
Вероятность того, что коэффициент гармоник превы­
сит то или иное значение зависит от появления различных
уровней сигнала. Вероятность проявления сигнала уровня
N (для функции распределения уровней, представленных
на рис. 1):
0
0

( N − a )2  

N 

 1
 2s 2  
P1 ( N ) = 1 − 
e
,

 s 2p ∫
Nmin




где в соответствии с экспериментальными данными [8]
Nmin= -60 дБ, a = -24 дБ, s = 10 дБ.
Вероятность того, что KГ превысит то или иное значе­
ние, равна произведению KГ для заданного уровня сигнала
КГК на вероятность его превышения:
— для ограничителя
P( KГ > KГN ) = KГ ( N ) P1 ( N ),
Уровень перегрузки АЦП
-5
-2,5
Рис. 6
Nвых, дБ
0
2
0,15
Nвх, дБ
Рис. 5
Использование компрессии сигнала в верхней части по­
зволяет задействовать динамический диапазон, превышаю­
щий возможности самих АЦП и сохранить максимальное
количество информации об аналоговом сигнале, которая
затем кодируется с разрешающей способностью конкрет­
ного преобразователя. Кроме того, в этом случае можно со­
хранить высокочастотные составляющие сигнала.
Оценка нелинейных искажений. Для одночастотного
периодического сигнала методом коэффициентов гармо­
— для компрессора
P( KГK > KГKN ) = KГК ( N ) P1 ( N ).
Для рассматриваемого примера (музыкальные и рече­
вые отрывки сигналов ЗВ) были рассчитаны вероятности
превышения KГ некоторого уровня в диапазоне изменения
уровня сигнала от -5 до 10 дБ, не превышают 4 ∙ 10 -4.
Это позволяет сделать вывод о несущественном влия­
нии нелинейных искажений на качество звучания при за­
щите АЦП от перегрузок с помощью компрессии верхней
части динамического диапазона сигнала (для статистик
аудиосигналов приведенных в [5]). Однако нельзя гаран­
тировать, что статистики разнообразных аудиосигналов
с большой вероятностью будут близки к приведенным
в [5].
Известно [6], что отношение сигнал/шум квантования
для квазимаксимального аудиосигнала:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
52
ISSN 0013-5771. «ЭЛЕКТРОСВЯЗЬ», № 7, 2010
Pсквmax
= 6 m − 16, дБ,
Pшкв
где m — число бит на отсчет.
Отношение сигнал/шум для продуктов нелинейности
второго и третьего порядка можно получить из выражения:
2
Pсквmax
U квmax
/R
= 10 lg
=
PНИ
U 22 / R + U 32 / R
= 10 lg
2
U квmax
1
≈ 10 lg
, дБ,
K Г2
U 22 + U 32
где РНИ — мощность сигналов продуктов нелинейности вто­
рого и третьего порядков; U2 и U3 — напряжения второй
и третьей гармоник соответственно. Для примера можно
предположить, что сигнал превышает квазимаксимальный
на 4 дБ. Тогда отношение сигнал/шум квантования соста­
вит
Pс
= 6 ⋅ 6 − 16 = 20 дБ.
Pшкв
Если для приведенного примера КГ = 0,1 то отношение
Pс
1
= 10 lg
= 20 дБ.
Pшкв
K Г2
В этом случае уровень шумов квантования равен уров­
ню сигнала продуктов нелинейности.
Как известно, аудиосигнал — нестационарный случай­
ный процесс. Следовательно, нельзя исключать существен­
ного превышения порога перегрузки АЦП (пусть и кратков­
ременного). При этом уровень сигналов продуктов нели­
нейности становится больше уровня шумов квантования,
и их влияние на качество воспроизводимого сигнала уве­
личивается.
Заключение. Проведенный анализ позволяет сделать
вывод о том, что наибольшее влияние на качество воспро­
изводимого звука при его цифровой передаче или звуко­
записи (кроме собственно компрессора цифровых аудио­
данных) оказывают ошибки квантования, проявляющиеся
в виде звучаний, похожих на звон колокольчиков и рокот.
При построении АЦП авторы рекомендуют применять
компрессию входного сигнала в верхней части его дина­
мического диапазона. Это позволит устранить потери ВЧ
составляющих сигнала и уменьшить нелинейные искаже­
ния, по сравнению с методом ограничения уровня входного
сигнала АЦП. Нелинейные искажения зависят от выбора
вида компрессий, но ввиду малой вероятности появления
больших уровней сигнала решающим здесь является отсут­
ствие перегрузок АЦП, которые приводят к нежелательным
последствиям.
Для реализуемых в аналоговой схемотехнике филь­
тров предварительную фильтрацию предпочтительно
выполнять с помощью фильтров Чебышева, обеспечива­
ющих приемлемую (с точки зрения слухового восприя­
тия допустимых искажений) неравномерность группово­
го времени запаздывания и сравнительно большое зату­
хание на граничной частоте полосы непропускания. Для
получения линейной фазо-частотной характеристики
в АЦП и ЦАП с передискретизацией необходимо исполь­
зовать нерекурсивные цифровые фильтры.
Литература
1. Вологдин Э. Как возникают и звучат ошибки квантова­
ния//Звукорежисер. — 2007. — № 6, 7. — С. 28—41, 32—40.
2. Золотухин И. П., Изюмов А. А., Райзман М. М. Цифровые зву­
ковые магнитофоны. Томск: Радио и связь, Томский отдел,
1990. — 160 с.
3. Щитов Ю. Direct Stream Digital: однобитный цифровой фор­
мат записи//Звукорежиссер. — 1999. — № 2. — С. 23—28.
4. Оболонин И. А. Анализ искажений аудиосигналов при циф­
ровых методах передачи и звукозаписи.//Информатика
и проблемы телекоммуникаций: тезисы докл. Российской
НТК. — Новосибирск, 24—25 апреля 2008. — С. 233—234.
5. Ковалгин Ю. А. Радиовещание и электроакустика. — М.:
Радио и связь, 1999. — 792 с.
6. Выходец А. В., Гитлиц М. В. Радиовещание и электроакусти­
ка. — М.: Радио и связь, 1989. — 542 с.
7. Оболонин И. А., Портфиненко А. Н. Оценка
искажений
при компрессии аудиосигнала на входе цифровых трак­
тов.//Перспективы развития современных средств и си­
стем телекоммуникаций: тезисы докл. 11‑й международной
НТК. — Екатеринбург, 23—25 апреля 2005. — С. 117—120.
8. Дворецкий И.М, Дриацкий И. Н. Цифровая передача сигна­
лов звукового вещания.//М.: Радио и связь, 1987. — 191 с.
9. Hans M. and Schafer R. W. Lossless Compression of Digital
Audio/Client and Media Systems Laboratory, HP Laboratories
Palo Alto HPL. — Nov., 1999. — 144.
10. ISO/IEC 14496—3. Information technology — Coding of audiovisual objects. Part 3: Audio.
Получено после доработки 22.01.10
ИНФОРМАЦИЯ
Новая услуга от «Ростелекома»
«Ростелеком» ввел в опытно-ком­
мер­ч ескую эксплуатацию услугу «Ин­
тел­­лек т уальная аудиоконференц­
связь», которая позволяет пользователю организовать сеанс телефонной
связи одновременно между несколькими участниками с возможностью самостоятельно управлять подключениями
через Web-интерфейс.
В сеансе аудиоконференцсвязи могут
принимать участие до 128 человек, находящихся как на территории Российской
Федерации, так и за ее пределами.
В России пользователи начинают сеанс связи, набирая выделенный интеллектуальный номер в коде «8-800», а участни-
ки за рубежом — многоканальный номер
+7 (495) 727-45-89.
Заказчик может самостоятельно забронировать время для проведения сеанса аудиоконференцсвязи на сайте
«Ростелекома» (www.rt.ru). После ввода
даты, времени и продолжительности планируемого сеанса, а также количества
участников система автоматически резервирует необходимые ресурсы сети, а заказчик получает PIN-код для доступа участников к данному сеансу. Интеллектуальная
система авторизации гарантирует защиту
от несанкционированного доступа.
По словам директора Департамента
продуктов и маркетинга «Ростелекома»
Р. Левочки, «предоставленная заказчику
возможность самостоятельно управлять
параметрами аудиоконференцсвязи через Web-интерфейс на всех этапах оказания услуги — от бронирования до проведения самого сеанса связи — является уникальным преимуществом новой
услуги».
Цена новой ус луги формируетс я
из единовременной платы за выделение
интеллектуального номера, ежемесячной
абонентской платы и оплаты входящего
трафика, сгенерированного участниками
сеанса. Услугу оплачивает заказчик, для
остальных участников сеанса услуга бесплатна.
Документ
Категория
Без категории
Просмотров
2
Размер файла
815 Кб
Теги
164
1/--страниц
Пожаловаться на содержимое документа