Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Двоично-десятичные коды




В некоторых случаях для представления чисел в памяти ЭВМ используется смешанная двоично-десятичная «система счисления», где для хранения каждого десятичного знака нужен полубайт (4 бита). Число, которое необходимо представить в двоично-десятичном коде, кодируется последовательно цифра за цифрой. Каждая из десятичных цифр от 0 до 9 представляет собой кодовую комбинацию, состоящую из четырех двоичных знаков – тетрад от 0000 до 1001. Например, число 1975, выраженное в двоично-десятичном коде, представляет собой последовательность тетрад 0001 1001 0111 0101. Упакованный десятичный формат, предназначенный для хранения целых чисел с 18 -ю значащими цифрами и занимающий в памяти 10 байт (старший из которых знаковый), использует именно этот вариант. Кодирование десятичных чисел тетрадами уступает по экономичности кодированию обычным двоичным кодом. Для десятичного числа, содержащего m цифр при двоично-десятичном кодировании требуется 4m двоичных знаков, а при обычном двоичном кодировании m*log210 ~ 3,3*m двоичных знаков.

Для однозначного декодирования равномерных кодов достаточно выполнение первого условия обратимости кодов. Их техническая реализация достаточно проста и поэтому они получили широкое распространение. Однако они не учитывают различие вероятности появления знаков в сообщениях и не обеспечивают максимальную эффективность кодирования.

Неравномерные коды

Одним из первых кодов учитывающих вероятность знаков в сообщении является код Морзе, разработанный в 1938 году задолго до исследований относительной частоты появления различных букв в текстах. В этом коде каждой букве и цифре сопоставлена оригинальная последовательность кратковременных импульсов – точек и тире, разделенных паузами. Буквам, используемым чаще, присвоены короткие кодовые комбинации, редко используемым буквам – длинные. Морзе оценил относительную частоту букв английского языка подсчетом литер в ячейках типографской наборной машины. Наиболее часто используемой букве «Е» он присвоил наиболее короткий код «точка». Следующей по количеству литер букве он присвоил код несколько большей длительности и так далее. При составлении кода Морзе для букв русского алфавита учет относительной частоты букв не производился, и это повысило его избыточность. Расчеты избыточности кода Морзе на основании проведенных исследований частоты появления букв показали, что для букв английского алфавита она составляет 19%, для букв русского алфавита 22%.

А. - Ж... - М - - Т - Ш - - - - Я. -. - 4.... -
Б -... З - -. Н -. У.. - Щ - -. -   5.....
В. - - И.. О - - - Ф.. -. Ъ,Ь -.. - 0 - - - - - 6 -....
Г - -. Й. - - - П. - - Х.... Ы -. - - 1. - - - - 7 - -...
Д -.. К -. - Р. -. Ц -. -. Э.. -.. 2.. - - - 8 - - -.
Е. Л. -.. С... Ч - - -. Ю.. - - 3... - - 9 - - - -.

 

При неравномерном кодировании длина кодов и, соответственно, продолжительность передачи кодовой комбинации могут значительно отличаться. В этом случае задача оптимального кодирования состоит в выборе такой системы кодирования, при которой минимальна суммарная длительность сообщения. Ввиду этого подход к выбору кода заключается в том, чтобы более вероятным значениям знаков в сообщении присвоить более короткие кодовые комбинации, чем менее вероятным.






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных