Двоично-десятичные коды

⇐ Предыдущая 14 15 16 17 181920 21 22 23 Следующая ⇒

В некоторых случаях для представления чисел в памяти ЭВМ используется смешанная двоично-десятичная «система счисления», где для хранения каждого десятичного знака нужен полубайт (4 бита). Число, которое необходимо представить в двоично-десятичном коде, кодируется последовательно цифра за цифрой. Каждая из десятичных цифр от 0 до 9 представляет собой кодовую комбинацию, состоящую из четырех двоичных знаков – тетрад от 0000 до 1001. Например, число 1975, выраженное в двоично-десятичном коде, представляет собой последовательность тетрад 0001 1001 0111 0101. Упакованный десятичный формат, предназначенный для хранения целых чисел с 18 -ю значащими цифрами и занимающий в памяти 10 байт (старший из которых знаковый), использует именно этот вариант. Кодирование десятичных чисел тетрадами уступает по экономичности кодированию обычным двоичным кодом. Для десятичного числа, содержащего m цифр при двоично-десятичном кодировании требуется 4m двоичных знаков, а при обычном двоичном кодировании m*log₂10 ~ 3,3*m двоичных знаков.

Для однозначного декодирования равномерных кодов достаточно выполнение первого условия обратимости кодов. Их техническая реализация достаточно проста и поэтому они получили широкое распространение. Однако они не учитывают различие вероятности появления знаков в сообщениях и не обеспечивают максимальную эффективность кодирования.

Неравномерные коды

Одним из первых кодов учитывающих вероятность знаков в сообщении является код Морзе, разработанный в 1938 году задолго до исследований относительной частоты появления различных букв в текстах. В этом коде каждой букве и цифре сопоставлена оригинальная последовательность кратковременных импульсов – точек и тире, разделенных паузами. Буквам, используемым чаще, присвоены короткие кодовые комбинации, редко используемым буквам – длинные. Морзе оценил относительную частоту букв английского языка подсчетом литер в ячейках типографской наборной машины. Наиболее часто используемой букве «Е» он присвоил наиболее короткий код «точка». Следующей по количеству литер букве он присвоил код несколько большей длительности и так далее. При составлении кода Морзе для букв русского алфавита учет относительной частоты букв не производился, и это повысило его избыточность. Расчеты избыточности кода Морзе на основании проведенных исследований частоты появления букв показали, что для букв английского алфавита она составляет 19%, для букв русского алфавита 22%.

А. -	Ж... -	М - -	Т -	Ш - - - -	Я. -. -	4.... -
Б -...	З - -.	Н -.	У.. -	Щ - -. -		5.....
В. - -	И..	О - - -	Ф.. -.	Ъ,Ь -.. -	0 - - - - -	6 -....
Г - -.	Й. - - -	П. - -	Х....	Ы -. - -	1. - - - -	7 - -...
Д -..	К -. -	Р. -.	Ц -. -.	Э.. -..	2.. - - -	8 - - -.
Е.	Л. -..	С...	Ч - - -.	Ю.. - -	3... - -	9 - - - -.

При неравномерном кодировании длина кодов и, соответственно, продолжительность передачи кодовой комбинации могут значительно отличаться. В этом случае задача оптимального кодирования состоит в выборе такой системы кодирования, при которой минимальна суммарная длительность сообщения. Ввиду этого подход к выбору кода заключается в том, чтобы более вероятным значениям знаков в сообщении присвоить более короткие кодовые комбинации, чем менее вероятным.

⇐ Предыдущая 14 15 16 17 181920 21 22 23 Следующая ⇒

Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2026 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных