ТОР 5 статей: Методические подходы к анализу финансового состояния предприятия Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века Характеристика шлифовальных кругов и ее маркировка Служебные части речи. Предлог. Союз. Частицы КАТЕГОРИИ:
|
Кодирование формы сигнала, ИКМ.Простейшими кодерами речи, вообще не использующими информацию о том, как был сформирован сигнал, а просто старающимися максимально приблизить декодированный сигнал по форме к оригиналу, являются кодеры формы сигнала. Самым простым и понятным способом кодирования формы сигнала является так называемая импульсно-кодовая модуляция – ИКМ (или PCM – Pulse Code Modulation), при использовании которой производятся просто дискретизация и равномерное квантование входного сигнала, а далее - преобразование полученного результата в равномерный двоичный код. Процедура иллюстрируется рис. 1.
Рис. 1 Для речевых сигналов с полосой 0,3 – 3,5 кГц (полоса стандартного телефонного канала) используют частоту дискретизации Fдискр ³2 Fmax = 8 кГц или 8000 отсч/c, что является общепринятым стандартом в цифровой телефонии. В процессе квантования каждый отсчет сигнала xi квантуется (округляется) в один из M уровней xiq и для двоичного представления каждого из этих уровней необходимо n = log2 M двоичных символов (бит). При этом скорость кода R бит/с составит R = Fдискр * log2 M бит/с. (1.1) Квантование сопровождается появлением ошибок – различий между точными xi и квантованными xiq значениями отсчетов сигнала. Уровень ошибок (шума) квантования описывают дисперсией ошибок квантования Dq = < (xi - xiq)2 > = Δ2 /12 = 1/12 * 2 -2R (1.2) или в децибелах Dq db = 10*lg Δ2 /12 = 10*lg 1/12 * 2 -2R = - 6R – 10,8 дб (1.3) Видно, что величина шума (ошибок) квантования уменьшается на 6 дб на каждый дополнительный бит кода. Экспериментально показано, что для получения практически идеального качества речи нужно квантовать сигнал не менее чем на ± 2000 уровней, иными словами, для представления каждого отсчета понадобится 12 бит, а результирующая скорость кода будет составлять R= 8000 отсчетов/с * 12 бит/отсчет = 96000 бит/с = 96 кбит/с. Свойства человеческого слуха таковы, что искажения сигналов с малым уровнем оказываются значительно заметнее на слух, чем искажения сигналов с большим уровнем. К тому же речевой сигнал имеет сравнительно большой пикфактор, то есть пиковый уровень сигнала значительно превышает его среднеквадратическое значение, а значит, большие выбросы случаются редко. Это позволяет использовать нелинейное квантование, при котором шаг квантования для больших (по модулю) значений сигнала больше, чем для малых. Значит, в этом случае шум квантования может быть пропорциональным сигналу. Результатом является повышение общего отношения сигнал/шум — уменьшение шума для доминирующих слабых сигналов за счет повышения шума для редко встречающихся сильных сигналов. Обычно эта нелинейная зависимость представляет собой кусочно-линейную аппроксимацию логарифмического закона. Для восстановления сигнала используется обратное преобразование, при котором кусочно-линейно аппроксимируется экспоненциальная функция. Данный способ кодирования/декодирования применяется при импульсно-кодовой модуляции (ИКМ) в аппаратуре телефонных станций (Рекомендация ITU-T G.711). Логарифмическое преобразование позволяет сжать динамический диапазон сигнала и уменьшить количество двоичных разрядов, необходимых для его представления. При использовании параметров кодирования, указанных в уже упоминавшейся Рекомендации ITU-T G.711, это позволяет уменьшить требуемую скорость передачи данных в полтора раза (12-разрядное двоичное число после логарифмического преобразования представляется восемью разрядами). Амплитудная характеристика логарифмического компрессора описывается выражением (1.4) где |x| - амплитуда сигнала на входе, y - амплитуда на выходе, μ - параметр, который подбирается, чтобы получить требуемую характеристику компрессии. На рис. 2 приведены характеристики компрессии для некоторых значений μ. При μ = 0 компрессия отсутствует.
0,8
0,6
0,4
0,2
0 0,2 0,4 0,6 0,8 1 |x| Рис. 2 Величина μ = 255 принята в качестве стандарта в США и Канаде. В Европе для описания характеристики устройства сжатия используется несколько иной закон: (1.5) Здесь A - положительная константа, а x и y определены так же, как и в формуле (1.4). Естественно, что при восстановлении (декодировании) сигнала он должен подвергаться преобразованию, с характеристикой, обратной характеристике компресии (экспандированию). В результате логарифмического квантования величина шумов квантования уменьшается примерно на 24 дб в сравнении с равномерным квантованием, таким образом появляется возможность уменьшить длину кода на четыре бита без потери качеств и результирующая скорость кода составит 64 кбит/с. Поскольку логарифмическое сжатие является стандартом в телефонии, исходной для любого сравнения эффективности и качества кодирования речевых сигналов может служить скорость кода, равная 64 кбит/с. Не нашли, что искали? Воспользуйтесь поиском:
|