2. Кодирование информации

2.1. Неравномерное кодирование с однозначным декодированием

Если источник не имеет памяти и избыточность обусловлена лишь неравновероятностью состояний источника, то она может быть уменьшена в результате кодирования более вероятных состояний более короткими кодовыми словами, а менее вероятных — более длинными. Идея кодирования неравномерными блоками впервые нашла применение в коде Морзе, где наиболее короткие комбинации использованы для часто встречающихся букв. В последующем были предложены оптимальные способы неравномерного кодирования, обеспечивающие практически полное устранение избыточности источников без памяти.

Рассматривается источник, выбирающий сообщения из ансамбля А. Предполагается, что вероятности появления определенных сообщений известны. Как уже принято, основной характеристикой кодирования источника с неравновероятными состояниями является количество кодовых символов, затрачиваемых на одно состояние. В случае равномерного кодирования это количество одинаково для любого состояния. При неравномерном кодировании количество символов, затрачиваемых при кодировании, зависит от состояний источника и поэтому представляет собой случайную величину. В этом случае разумной мерой качества кодирования является среднее количество символов на одно состояние. Если обозначить через длину слова, кодирующего i-е состояние, тогда

есть средняя длина кодовых слов. В общем случае неравномерный код используется для кодирования отрезков сообщений длины n, т.е. для кодирования ансамбля и . Тогда величина представляет собой среднюю скорость неравномерного кодированияm-ичным кодом при разбиении последовательности сообщений на блоки длиной п. Как и ранее, средняя скорость измеряется в двоичных символах на сообщение.

Пример 1. . Предположим, что n = 1 (побуквенное кодирование) и источник порождает в каждый момент времени одно из девяти сообщений a_i,...,a₉ с вероятностями, указанными в табл. 2.1.

Таблица 2.1

a_i	p(a_i)	Равномерный код	Неравномерный код	d_i
a₁	0.25	0000	00	2
a₂	0.125	0001	010	3
a₃	0.125	0010	011	3
a₄	0.125	0011	100	3
a₅	0.125	0100	101	3
a₆	0.0625	0101	1100	4
a₇	0.0625	0110	1101	4
a₈	0.0625	0111	1110	4
a₉	0.0625	1000	1111	4

1. Заметим, что H(A) здесь составляет 3 бит. Для равномерного кода длина слов одинакова и равна 4. Для неравномерного кода средняя длина равна 3 (обратим внимание, что совпадение со значением энтропии не случайно). Скорость кодирования в первом случае составляет 4 бита на сообщение, во втором — 3 бит/сообщение.

Следует иметь ввиду, что для обеспечения однозначности декодирования неравномерных кодов существуют ограничения. Следующий пример служит убедительной демонстрацией этого.

Пример 2. Источник выбирает сообщения из ансамбля, содержащего шесть элементов a_i, с вероятностями р(а₁) = 0,4; p(а₂) = 0,3; р(а₃) = 0,1; р(а₄) = 0,08; р(а₅) = 0,07; р(а₆) = 0,05. Энтропия ансамбля составляет . При равномерном двоичном кодировании на каждое сообщение необходимо затратить три символа. Ниже будет показано, что при неравномерном кодировании этого источника в среднем на каждое сообщение может быть затрачено 2,16 символа. Можно попытаться закодировать сообщения наиболее короткими блоками: a₁ = 0; а₂ = 1; а_з = 00; а₄ = 01; а₅ = 10; а₆ = 11. При этом среднее число символов на сообщение окажется равным 1,3, т.е. еще более эффективно, чем позволяет теорема равномерного кодирования. Однако принятый код не удовлетворяет условию однозначного декодирования. Действительно, принятую, например, последовательность символов 00110100011110... можно декодировать так: a₁a₁a₂a₂a₁a₂a₁a₁a₁a₁... или a₃a₆a₄a₃a₁a₆a₂a₅... и еще множеством иных последовательностей сообщений. Причиной неоднозначности является то, что кодовое слово 0 является началом слов 00 и 01, а кодовое слово 1 началом слов 10 и 11. Однозначное декодирование неравномерных кодов, в которых не создается специальное разделение слов, может быть обеспечено в случае, когда ни одно кодовое слово не является началом другого. Коды, обладающие тем свойством, что ни одно слово не является началом другого, называются префиксными. Именно эти коды используются при неравномерном кодировании.

Удобное описание префиксных кодов дают специальные графы (связные), называемые деревьями (или кодовыми деревьями); т-ичным деревом называется граф, т.е. такая система узлов и связывающих их ребер, в которой нет петель или замкнутых путей и в которой из каждого узла выходит не более т ребер и в каждый узел, кроме одного (корня дерева), входит точно одно ребро. Каждому из ребер, выходящих из узла, сопоставляется один символ кодового алфавита, содержащего т символов, причем различным ребрам, выходящим из одного узла, сопоставляются различные символы.

На рис. 2.1 представлено двоичное кодовое дерево. Дерево отображает неравномерный код, рассмотренный в примере 1. Можно убедиться, что код является префиксным, если кодовые слова соответствуют концевым узлам дерева.

Рис. 2.1. Двоичное кодовое дерево

Скоростью создания информации при неравномерном кодировании дискретного источника без памяти называют наименьшее число H такое, что для любогоR>H найдется п и неравномерный код со средней скоростью кодированияR, который допускает однозначное декодирование. Показано, что скорость создания информации при неравномерном кодировании совпадает со скоростью создания информации при равномерном кодировании и равна энтропии источника на сообщение

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 319 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
30.04.202274.44 Кб5Учебник 37.docx
#
30.04.20221.91 Mб26Учебник 370.docx
#
30.04.20221.93 Mб37Учебник 371.docx
#
30.04.20222.02 Mб27Учебник 372.docx
#
30.04.20222.03 Mб8Учебник 373.docx
#
30.04.20222.1 Mб14Учебник 374.docx
#
30.04.20222.12 Mб17Учебник 375.docx
#
30.04.20222.21 Mб73Учебник 376.docx
#
30.04.20222.21 Mб13Учебник 377.docx
#
30.04.20222.23 Mб13Учебник 378.doc
#
30.04.20222.25 Mб7Учебник 379.docx