Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Кодирование формы сигнала, ИКМ.




Простейшими кодерами речи, вообще не использующими информацию о том, как был сформирован сигнал, а просто старающимися максимально приблизить декодированный сигнал по форме к оригиналу, являются кодеры формы сигнала.

Самым простым и понятным способом кодирования формы сигнала является так называемая импульсно-кодовая модуляцияИКМ (или PCM – Pulse Code Modulation), при использовании которой производятся просто дискретизация и равномерное квантование входного сигнала, а далее - преобразование полученного результата в равномерный двоичный код. Процедура иллюстрируется рис. 1.

 

 

 

Рис. 1

Для речевых сигналов с полосой 0,3 – 3,5 кГц (полоса стандартного телефонного канала) используют частоту дискретизации Fдискр ³2 Fmax = 8 кГц или 8000 отсч/c, что является общепринятым стандартом в цифровой телефонии.

В процессе квантования каждый отсчет сигнала xi квантуется (округляется) в один из M уровней xiq и для двоичного представления каждого из этих уровней необходимо n = log2 M двоичных символов (бит). При этом скорость кода R бит/с составит

R = Fдискр * log2 M бит/с. (1.1)

Квантование сопровождается появлением ошибок – различий между точными xi и квантованными xiq значениями отсчетов сигнала. Уровень ошибок (шума) квантования описывают дисперсией ошибок квантования

Dq = < (xi - xiq)2 > = Δ2 /12 = 1/12 * 2 -2R (1.2)

или в децибелах

Dq db = 10*lg Δ2 /12 = 10*lg 1/12 * 2 -2R = - 6R – 10,8 дб (1.3)

Видно, что величина шума (ошибок) квантования уменьшается на 6 дб на каждый дополнительный бит кода.

Экспериментально показано, что для получения практически идеального качества речи нужно квантовать сигнал не менее чем на ± 2000 уровней, иными словами, для представления каждого отсчета понадобится 12 бит, а результирующая скорость кода будет составлять

R= 8000 отсчетов/с * 12 бит/отсчет = 96000 бит/с = 96 кбит/с.

Свойства человеческого слуха таковы, что искажения сигналов с малым уровнем оказываются значительно заметнее на слух, чем искажения сигналов с большим уровнем. К тому же речевой сигнал имеет сравнительно большой пикфактор, то есть пиковый уровень сигнала значительно превышает его среднеквадратическое значение, а значит, большие выбросы случаются редко. Это позволяет использовать нелинейное квантование, при котором шаг квантования для больших (по модулю) значений сигнала больше, чем для малых. Значит, в этом случае шум квантования может быть пропорциональным сигналу. Результатом является повышение общего отноше­ния сигнал/шум — уменьшение шума для доминирующих слабых сигналов за счет повышения шума для редко встречающихся сильных сигналов. Обычно эта нелинейная зависимость представляет собой кусочно-линейную аппроксимацию логарифмического закона. Для восстановления сигнала используется обратное преобразование, при котором кусочно-линейно аппроксимируется экспоненциальная функция.

Данный способ кодирования/декодирования применяется при импульсно-кодовой модуляции (ИКМ) в аппаратуре телефонных станций (Рекомендация ITU-T G.711).

Логарифмическое преобразование позволяет сжать динамический диапазон сигнала и уменьшить количество двоичных разрядов, необходимых для его представления. При использовании параметров кодирования, указанных в уже упоминавшейся Рекомендации ITU-T G.711, это позволяет уменьшить требуемую скорость передачи данных в полтора раза (12-разрядное двоичное число после логарифмического преобразования представляется восемью разрядами).

Амплитудная характеристика логарифмического компрессора описывается выражением

(1.4)

где |x| - амплитуда сигнала на входе, y - амплитуда на выходе, μ - параметр, который подбирается, чтобы получить требуемую характеристику компрессии. На рис. 2 приведены характеристики компрессии для некоторых значений μ. При μ = 0 компрессия отсутствует.

μ=1000   μ=10 μ=0  
|y| 1

 

0,8

 

0,6

 

0,4

 

0,2

 

0 0,2 0,4 0,6 0,8 1 |x|

Рис. 2

Величина μ = 255 принята в качестве стандарта в США и Канаде.

В Европе для описания характеристики устройства сжатия используется несколько иной закон:

(1.5)

Здесь A - положительная константа, а x и y определены так же, как и в формуле (1.4).

Естественно, что при восстановлении (декодировании) сигнала он должен подвергаться преобразованию, с характеристикой, обратной характеристике компресии (экспандированию).

В результате логарифмического квантования величина шумов квантования уменьшается примерно на 24 дб в сравнении с равномерным квантованием, таким образом появляется возможность уменьшить длину кода на четыре бита без потери качеств и результирующая скорость кода составит 64 кбит/с.

Поскольку логарифмическое сжатие является стандартом в телефонии, исходной для любого сравнения эффективности и качества кодирования речевых сигналов может служить скорость кода, равная 64 кбит/с.






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных