Вход |  Регистрация
 
 
Время электроники Четверг, 23 ноября
 
 


Это интересно!

Ранее

Вопросы качественной передачи голоса по IP-сетям: сжатие, задержка и эхо

В статье рассматриваются вопросы качества передачи речи по IP-сетям. Обсуждаются такие проблемы, как обеспечение качества связи, причины задержки, потеря пакетов, подавление эха, комфортный шум, разговор между разноязыкими абонентами, а также использование беспроводной ЛВС в качестве канала передачи. Описаны также стандарты сжатия речи G.711, G.726, G.729A, G.723.1 и G.722.

Вопросы качественной передачи голоса по IP-сетям: сжатие, задержка и эхо. Часть 1

В статье рассматриваются вопросы качества передачи речи по IP-сетям. Обсуждаются такие проблемы, как обеспечение качества связи, причины задержки, потеря пакетов, подавление эха, комфортный шум, разговор между разноязыкими абонентами, а также использование беспроводной ЛВС в качестве канала передачи. Описаны также стандарты сжатия речи G.711, G.726, G.729A, G.723.1 и G.722.

Triple Play – тройные возможности или тройные проблемы?

Внедрение IPTV сопровождается дополнительными проблемами, связанными с реализацией полного пакета услуг, включающего передачу голоса и данных по IP-сетям. Компания Agilent Technologies предлагает тестовое оборудование для комплексного анализа действующих сетей передачи речи, видео и данных для всех этапов работ по развертыванию IP-сети. Статья опубликована в журнале «Электронные компоненты» №9/2008.

 

26 декабря

Вопросы качественной передачи голоса по IP-сетям: джиттер, задержка и эхо. Часть 2*

Во второй части статьи рассматриваются такие вопросы как джиттер, факторы задержки передачи голоса по телефонным IP-сетям, причины возникновения эха и методы его подавления. Большое внимание уделено вопросам субъективного и объективного тестирования качества передаваемой речи в соответствии с рекомендациями ITU. * Первая часть статьи была опубликована в «ЭК» №11, 2008.



Допуск на задержку

Существуют две проблемы временного характера, отрицательно сказывающиеся на качестве голосовых служб: задержка передачи данных и джиттер. Для пользователя задержка сигнала наиболее очевидна и представляет собой раздражающий фактор. Важно понять, что эти две проблемы неразрывно связаны друг с другом.

 

Допуск на задержку передачи: максимум 150 мс в одном направлении

Задержка передачи речевого сигнала оказывает психологическое воздействие на пользователей, которые удивительно точно чувствуют ритм разговора и, не услышав ответа собеседника в течение определенного времени, повторяют вопрос.
При телефонном разговоре не существует визуального контакта, который позволил бы одному из его участников увидеть, что задержка с ответом вызвана, например, тем, что другой абонент задумался. При общении по телефону абонент, задавший вопрос, полагается на внутреннее восприятие разговора и, не получив своевременного ответа, повторяет вопрос или уточняет, слышит ли его другая сторона.
Если канал передачи приводит к чрезмерной задержке сигнала, повторный или уточняющий вопрос одного из участников разговора совпадает с ответом другого абонента, и возникает путаница. Исследование показало, что задержка однонаправленного распространения сигнала в 150 мс затрудняет общение.
С появлением IP-телефонии ряд испытательных организаций попытался установить диапазон приемлемой для абонентов задержки сигнала. Было обнаружено, что если задержка однонаправленной передачи достигает 70…100 мс, ее не замечают. При большем времени лишь некоторые абоненты начинают жаловаться на качество связи, тогда как при задержке в 150 мс практически все пользователи отмечают плохую связь. Заметим, что при разговоре по мобильным телефонам этот показатель составляет около 140 мс. Несмотря на то, что пользователи сотовых телефонов готовы смириться с невысоким качеством связи ради ее мобильности, не следует полагаться на то, что тот же подход годится и в отношении проводных телефонных систем.

 

Джиттер и причины задержки сигнала

Таким образом, транзитная задержка и джиттер — два источника задержки сигнала в пакетной телефонии.
1. Задержка передачи. Это количество времени, требуемое для передачи сигнала по линии от одного абонента другому.
2. Джиттер. Изменение величины задержки в зависимости от передаваемого пакета.
Транзитная задержка представляет собой совокупное запаздывание голосового сигнала при его прохождении по сети от одного абонента к другому. Системы телефонной связи с коммутацией пакетов имеют незначительную задержку — менее 30 мс. В IP-сетях офисных АТС этот показатель при распространении сигнала между проводными станциями достигает значений 50...70 мс. Добавление БЛС увеличивает это значение. Задержки при распространении данных в IP-сети больших районов могут быть и больше. В зависимости от расстояния и числа используемых маршрутизаторов в глобальных системах задержка может превысить 100 мс.
Задержка при прохождении сигнала является комбинацией следующих нескольких факторов.
– Кодирование речи. Как уже отмечалось, каждая кодирующая система вносит некоторую задержку. При импульсно-кодовой модуляции (ИКМ) этот показатель меньше 1 мс. Системы сжатия речи могут привести к задержке в 70 мс.
– Генерирование пакетов. Система передачи пакетов речевых сигналов собирает некоторое количество речевой информации, которая затем включается в каждый пакет, в результате чего возникает некоторая задержка при транзите этих информационных блоков. Чтобы свести ее к минимуму, задается относительно небольшой размер речевой составляющей пакетов — обычно 20...40 мс, хотя мы рекомендуем ограничиться 20 мс. Недостаток коротких пакетов в том, что объем заголовка имеет постоянное значение, независимо от размера речевого блока, поэтому более короткие пакеты увеличивают соотношение между служебными данными и контентом.
– Задержка из-за конкуренции БЛС. Блоки речевых данных, направляемых по беспроводной ЛВС, должны соответствовать протоколу доступа БЛС (например, CSMA/CA). Это значит, что существует некоторый интервал ожидания перед отправкой кадра, и в случае конфликта или другой ошибки передачи этот кадр подлежит повторной отправке. Далее полный блок данных должен быть получен в точке доступа и проверен на ошибки, прежде чем он будет отправлен по проводной сети. Предназначение БЛС, например IEEE 802.11e, обеспечивающей требуемое качество обслуживания (QoS), состоит в минимизации задержки передачи речевых пакетов. Даже в таких сетях к полной задержке обычно добавляются 20...30 мс.
– Задержка при последовательной передаче данных. Это количество времени, требуемое для передачи пакета в последовательном (т.е. побитовом) канале передачи. Величина задержки зависит от размера пакета и скорости передачи канала.
– Задержка на распространение. Это количество времени, необходимое для передачи сигнала с помощью физических средств связи. В локальных сетях каналы относительно короткие, а задержка на распространение — минимальна. Так, например, в наихудшем случае задержка распространения на стометровом кабеле ЛВС категории EIA 5e равна 548 нс. Однако этот показатель становится гораздо больше при переходе на глобальные средства связи. Если же маршрут следования пакетов не изменился (например, в службе виртуальных каналов), этот показатель должен оставаться постоянным во время связи.
– Задержка на коммутацию/маршрутизацию. Обычно наиболее подвержена изменениям величина задержки в речевых IP-системах, возникающая в результате прохождения сигнала через коммутаторы и маршрутизаторы. Величина этой задержки обусловлена двумя элементами.
- Задержка при коммутации. Каждому коммутатору или маршрутизатору, через которые проходят пакеты, требуется некоторое время на их обработку: чтение адреса, обращение к таблице и определение оптимального пути, если в таблице указано несколько входов. Величина этого типа задержки обычно постоянная. Она влияет на скорость процессора и эффективность программного обеспечения.
- Задержка на буферизацию. Бу­фе­ризация — главная составляющая транзитной задержки. Марш­рутизаторы в каждый момент времени обрабатывают один пакет, и этот пакет ожидает в буфере своей очереди. Время ожидания определяется объемом трафика, с которым работает буфер каждого маршрутизатора при поступлении речевых пакетов. В QoS-сетях маршрутизатор поддерживает для каждого уровня приоритета отдельные буферы, поэтому на задержку влияет главным образом трафик того же класса приоритета. Однако очередям с наивысшим приоритетом, как правило, не предоставляется исключительный доступ к устройству до тех пор, пока буфер не очистится. В результате трафик в очередях с меньшим приоритетом также отражается на задержке на буферизацию.
– Устранение джиттера. Как только пакет достигает адресата, приемник, работающий по протоколу RTP, должен восстановить временную последовательность, по которой проходила передача пакета, т.е. устранить джиттер. Для этого сначала пакет помещается в буфер, а затем покидает его в соответствии с временной меткой RTP. Этот приемный буфер является последним элементом, вносящим свой вклад в общую задержку. 
– Протокол реального времени (RTP). Как уже было сказано в первой части этой статьи, в IP-сети протокол RTP является приложением, которое используется для передачи речи и видео в реальном времени. Основная задача этого протокола в том, чтобы поставить временную метку и порядковый номер в каждом пакете, прежде чем отправить его дальше. При передаче по сети происходит задержка пакетов; в сети без установления соединения они тоже могут передаваться не по порядку. Обработка сигнала на стороне приемника по протоколу RTP позволяет восстановить последовательность, поместить пакеты в буфер и отправить их в соответствии с временными метками. В действительности, RTP-обработка воссоздает изохронный характер данных.

 

Управление эффектом эха

Последним вопросом обеспечения качества пакетной телефонии является подавление эха. Это эффект, когда абонент слышит собственный голос как вернувшееся по сети эхо. Все телефонные разговоры сопровождаются эхом, но этот эффект не всегда заметен.
Эхо возникает в любом тракте передачи речевых данных. За его появление отвечает гибридный ретранслятор или преобразователь 2/4 провода. Большая часть тракта — четырехпроводная, т.е. для каждого направления передачи данных существует свой путь. С другой стороны, каждый телефонный аппарат работает с использованием двух проводов. На каждом конце четырехпроводного тракта имеется гибридная схема, подключаемая к двухпроводной нагрузке. При поступлении сигнала от говорящего абонента в одном направлении гибридная схема передает большую часть энергии речи на двухпроводную нагрузку. В случае если импеданс балансной схемы полностью не согласован с импедансом нагрузки, часть энергии возвращается и создает эхо.
В отношении эха важно то, насколько быстро оно возвращается. Телефонный аппарат направляет часть переданного сигнала на наушник, чтобы абонент слышал себя во время разговора и не считал, что соединение отсутствует. Отдаленное эхо создается гибридной цепью на дальнем конце линии, и если время распространения сигнала в прямом и обратном направлениях невелико, говорящий не отличает эхо от сигнала с собственного микрофона. При достаточно длинных линиях передачи эхо становится заметным и вызывает раздражение у абонентов.

 

Требования по управлению эффектом эха

Исследования показали, что когда задержка при однонаправленном распространении сигнала равна 35 мс (т.е. 70 мс в прямом и обратном направлениях), говорящий не отличает эха от сигнала с микрофона. При превышении значения в 35 мс эхо становится заметным, и его требуется подавить. Чем дольше задержка, тем заметнее эхо. Фактически у всех систем передачи пакетов речевых сигналов задержка в одном направлении превышает 35 мс, поэтому необходимо задействовать механизм по управлению эхом. Обычно им обеспечивается маршрутизатор, IP-шлюз или телефонная трубка IP/Ethernet.

 

Методы управления эхом

Для устранения эха при передаче сигнала на дальние расстояния разработаны два метода.
1. Подавление эха. Это аналоговый метод, эффективно снижающий громкость обратного сигнала во время разговора. Эхо присутствует, но энергия этого сигнала снижена до уровня, при котором говорящий не слышит эха.
2. Компенсация эха. Большинство систем передачи речевых пакетов использует цифровой метод компенсации эха. Цепь анализирует цифровой сигнал, передающийся в одном направлении, и удаляет ту же составляющую при ее появлении в обратном направлении.
Системы компенсации эха не всегда справляются со своей функцией из-за усложненности. Если в тракте задействовано определенное число устройств, эхокомпенсатор может ошибиться и не подавить эхо. Связь с помощью сотовых и радиотелефонов часто страдает от этого эффекта, устранение которого представляется довольно трудной задачей.

 

Измерение качества передачи речи

Почти во всех телефонных сетях общего пользования применялось 64-Кбит/с кодирование речи, и речевые сигналы по коммутируемым соединениям распространялись с минимальной задержкой, без джиттера и с относительно невысоким процентом ошибок. Телефонные компании предоставляли каналы для передачи речи лучшего качества, чем требовалось. С появлением телефонных IP-систем стало ясно, что качеством связи до определенной степени можно пожертвовать, и абоненты не заметят разницы — вопрос в том, до какой степени это позволительно.
Растущий интерес к IP-телефонии привел к появлению ряда методов по измерению качества передачи голоса, а именно качества звука, на которое влияет способ кодирования, потеря пакетов и качество разговора, на котором сказывается задержка. Существуют два главных метода измерения качества речи.
1. Субъективное тестирование. При­вле­каются слушатели, оценивающие способность разных кодирующих систем воспроизводить трудные фразы. В качестве примера можно привести методы ACR (Absolute Category Rating — показатель абсолютной категории) или MOS (Mean Opinion Score — средняя экспертная оценка).
2. Машинное тестирование. Элек­тронная система пропускает цифровой речевой файл через устройство кодирования/сжатия, после чего проводится математическое сравнение выходного сигнала с входным. В качестве примеров можно привести рекомендуемые ITU методы P.861: PSQM (Perceptual Speech Quality Measurement — измерение воспринимаемого качества передачи речи) и G.107 E Model, или R Factor (коэффициент R, объективная мера качества передачи в телефонных сетях на основе электронной модели).

 

Показатель абсолютной категории (ACR) и средняя экспертная оценка (MOS)

Наиболее распространенными методами измерения качества речи являются ACR и MOS — тесты с привлечением слушателей для определения качества кодирования голоса различными системами и выставление оценок по пятибалльной шкале. Например, оценка «5» является самой высокой, и ИКМ-модуляция со скоростью 64 Кбит/с получила 4,4 балла. Рекомендуемая минимальная оценка для бизнес-телефонии — 4,0 балла, причем 3,5 балла — минимально допустимая величина. Типичное значение для алгоритма сжатия звука G.729A — 4,0 балла, а минимально допустимая для него граница диапазона оценок достигается при потере 1% пакетов. Оценки рассчитываются в условиях прогнозирования качества только при слушании (listening quality, LQ) и при разговоре (conversational quality, CQ).
При оценке качества LQ для 16-ти или более слушателей воспроизводится набор фонетически сбалансированных фраз, например т.н. гарвардских предложений (см. http://umsis.miami.edu/~gliu.
Для измерения качества разговора CQ пары пользователей выполняют определенное задание, общаясь по телефону. Процесс определения этой оценки сложнее, т.к. необходимо установить качество слушания, эхо и задержку. Влияние задержки изменяется в зависимости от характера задачи (сравните, например, бизнес-переговоры и неформальное общение). 

 

Объективное тестирование качества на основе эталона: рекомендации ITU P.861, P.862 и P.563

Инженеры ITU (International Telecom­mu­nications Union — Международный союз по телекоммуникациям), неудовлетворенные субъективным характером метода оценки ACR, разработали метод количественного измерения характеристики речевой системы. В рекомендациях P.861 и P.862 описывается метод лабораторного тестирования различных речевых кодеков. Простой образец цифровой записи голоса проходит через кодек или систему передачи пакетов и сравнивается с искаженным вариантом того же файла с помощью коэффициентов преобразования Фурье для оценки PESQ (Perceptual Evaluation of Speech Quality — воспринимаемое качество передачи речи). Шкала оценок аналогична используемой в MOS. Поскольку оценка PESQ не учитывает качество разговора, она в большей степени схожа с оценкой LQ метода MOS. В 2004 г. инженеры ITU разработали стандарт измерения P.563, для использования которого требуется только полученная или искаженная версия эталонного файла.

 

Коэффициенты R модели Е: ETSI TS 101 325-5 и ITU G.107

Модель Е была разработана институтом ETSI (European Telecommunications Standards Institute — Европейский институт стандартизации электросвязи) для измерения качества на основе эталонного образца. Эта оценка требует меньшей обработки, чем метод PESQ. Модель Е также учитывает параметры разговора. Поначалу она рассматривалась как перспективное средство для систем передачи данных, но в настоящее время широко используется для оценки качества сетей VoIP. Она была принята союзом ITU в 1998 г. под названием G.107, и с тех пор ежегодно корректируется и дополняется. Модель Е определяет оценку качества передачи, или коэффициент R, в диапазоне значений 0...120. Этот показатель в случае ИКМ-модуляции равен 93, а значения выше 80 считаются приемлемыми для передачи речи в бизнес-переговорах (см. табл. 1).

 

Табл. 1. Типичные значения уровней качества передачи сигнала

Мнение пользователя Коэффициент R Оценка по методу MOS (шкала ITU)
Макс. значение шкалы 120 5,0
Достижимый максимум (G.711) 93 4,4
Бизнес-качество ≥80 ≥4,0
Предельно допустимое 70...80 3,6...4,0
Плохое 50...70 2,6...3,6
Нерекомендуемое ≤50 ≤2,5

 

Использование модели Е основано на предположении, что искажения носят аддитивный характер. Коэффициент R рассчитывается в соответствии с формулой

 

R = R0 – Is – Id – Ie + A,

 

где R0 — основной фактор, определяемый уровнями шума, громкости и т.д.; Is представляет искажения сигнала, которые одновременно ухудшают речь, в т.ч. громкость, искажение при кодировании (например, шум квантования) и неоптимальный уровень слышимости собственного микрофона; Id соответствует искажениям, возникающим в результате задержки речевого сигнала, в т.ч. эха; Ie — фактор искажения сигнала оборудованием, а также из-за эффектов передачи голоса по системам VoIP; A — фактор преимущества, отражающий ожидания пользователей от качества телефонного разговора. Например, пользователи высоко оценивают удобство мобильной связи, закрывая глаза на ее качество, как видно из табл. 1.

 

Другие факторы, влияющие на качество передачи голоса

В области разработки систем речевых вызовов накопилось больше опыта, чем в оценке качества принимаемого голосового сигнала. При оценке решения по передаче речевых пакетов следует учесть все следующие факторы телефонной связи, влияющие на ее качество:
– задержка при тональном вызове;
– время установления соединения (с момента окончания набора номера до начала звонка);
– время разъединения;
– время восстановления до следующего тонального вызова;
– процент потерянных вызовов (случай, когда все цепи заняты);
– период активации;
– интенсивность отказов и среднее время на ремонт;
– процент разъединенных звонков;
– процент неправильных вызовов (не связанных с ошибками при наборе номера);
– процент не полностью набранных вызовов.

Заключение

Пользователи ожидают от телефонной связи высокого качества, и многие из них могут сложить ошибочное мнение о системах передачи речевых сигналов. За десятки лет эксплуатации телефонных сетей общего пользования мы привыкли к хорошему качеству связи. Теперь мы знаем, что оно было лучше, чем требовалось. Возникает вопрос, насколько можно его понизить, чтобы пользователи этого не заметили? Надеюсь, нам удастся это сделать до того, как будут приняты необратимые решения.
Поскольку в оценке качества передачи голоса существует субъективный фактор восприятия, методы оценки MOS или коэффициента R не следует считать надежными. Мы установили, что пользователи сотовой связи ради ее мобильности готовы закрыть глаза на качество, а телефонная связь между разноязыкими собеседниками требует большего качества для обеспечения необходимой эффективности. Призывая прекратить пользоваться телефонными IP-сетями с плохим качеством передачи голоса, мы предлагаем взамен что-то лучшее — например, возможность поддержки мобильных речевых вызовов по беспроводной ЛВС.
Наконец, единственным достоверным тестом на приемлемое качество связи для бизнес-организаций станет небольшой предварительный тест системы в реальной среде. Этот тест следует проводить с участием наиболее требовательных пользователей, чтобы определить, будет ли разрабатываемое решение для них приемлемым.



Вы можете скачать эту статью в формате pdf здесь.
Оцените материал:

Автор: Михаил Финнеран (Michael F. Finneran), независимый консультант



Комментарии

0 / 0
0 / 0

Прокомментировать





 

Горячие темы

 
 




Rambler's Top100
Руководителям  |  Разработчикам  |  Производителям  |  Снабженцам
© 2007 - 2017 Издательский дом Электроника
Использование любых бесплатных материалов разрешено, при условии наличия ссылки на сайт «Время электроники».
Создание сайтаFractalla Design | Сделано на CMS DJEM ®
Контакты