Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Папернов А.А. Методы упорядочения информации в цифровых системах

.pdf
Скачиваний:
5
Добавлен:
25.10.2023
Размер:
13 Mб
Скачать

60 ГЛ. ?. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ УПОРЯДОЧЕНИЯ

ным для размещения объекта целиком. В частности, мо­ жет быть выделена всего одна ячейка памяти. При этом обмен должен организовываться специальной програм­ мой с перемещением информации об объектах по ча­ стям. Оценка трудоемкости обмена в этом случае долж­ на быть проведена непосредственно по выбранной про­

грамме обмена.

 

Процедурой упорядочения

будем называть такую

последовательность операций сравнения, пересылки и обмена, которая, используя только выделенное множе­ ство позиций, преобразует неупорядоченное множество объектов, расположенных в некоторой последовательно­ сти позиций с адресами a[i], iŒ{ 1, 2, 3,..., n ) , в упоря­ доченное по некоторому признаку тс множество объек­ тов, размещенное, возможно, в некоторой новой последо­ вательности позиций с адресами а>[/], { 1 , 2, 3,..., п\.

К процедурам упорядочения различные системы предъявляют различные требования. Наиболее часто предъявляются требования о минимизации числа исполь­ зуемых позиций и времени упорядочения при заданном числе объектов. В дальнейшем этим требованиям будет уделено основное внимание при рассмотрении и анализе различных процедур упорядочения.

Всю заданную совокупность объектов, расположен­ ных в некоторой последовательности позиций, будем в дальнейшем называть массивом объектов или просто массивом. Любое подмножество объектов, расположен­

ных в смежных по данному индексу позициях,

будем на­

зывать подмассивом,

в отличие от выделенной

последова­

тельности объектов,

которая

может располагаться на не­

смежных по данному индексу

позициях.

 

§2.2. Характеристики состояния информации

вмассиве

2.2.1. Информационная оценка состояния массива.

В массиве возможно любое распределение объектов по последовательности позиций. В упорядоченном массиве должно быть упорядоченное распределение объектов по позициям. Для массива, состоящего из п объектов, воз* можны п\ различных способов распределения объектов в последовательности из п позиций. Каждое такое рас-

§ 2.2. ХАРАКТЕРИСТИКИ СОСТОЯНИЯ МАССИВА

61

пределение будем называть состоянием массива. Распре­ деление объектов по позициям в упорядоченном массиве при наличии объектов с совпадающими значениями при­ знаков также неоднозначно, так как любые перестанов­ ки объектов с совпадающими значениями признаков не

нарушают упорядоченности

массива. Обозначим

nk чис­

ло объектов, у которых значение

признака равно

Тогда число различных способов распределения

объек­

тов в упорядоченном массиве (или

число

состояний

упорядоченного

массива)

составит

 

 

 

 

 

8 =

П(пА 1),

 

 

 

(2.12)

 

 

k

 

 

 

 

 

где произведения берутся

по всем

возможным

значени­

ям k. Если в упорядоченном

массиве нет объектов с по­

вторяющимися

значениями

признака,

то все nk

= 1 и

распределение

объектов по позициям

в таком

массиве

однозначно. Такие массивы в дальнейшем будем назы­ вать простыми массивами.

Начальное распределение объектов по позициям или начальное состояние массива неизвестно. Возможность того или иного состояния массива определяется соответ­ ствующим распределением вероятностей состояний.

Для массива, рассматриваемого в виде системы, спо­ собной находиться во многих состояниях, возможно ис­ пользование шенноновского понятия энтропии как меры

неопределенности его состояния. Энтропия Я

определяет­

ся соотношением

 

 

H = - 2P,log î P / ,

(2.13)

где 5 — число

возможных состояний системы, і — номер

состояния, РІ

— вероятность состояния с

номером і.

Наибольшей энтропией обладает система, у которой все

состояния равновозможны.

Неопределенность

состояния

такой системы максимальна.

 

 

 

Массив, обладающий

наибольшей

неопределенностью

своего состояния,

будем

называть

случайным

масси­

вом. Все его п\

состояний

равновозможны

и

имеют

62

ГЛ. 2. ОСНОВНЫЕ

понятия

ТЕОРИИ УПОРЯДОЧЕНИЯ

вероятность р ~ 1 / / г ! .

Энтропия

случайного

массива

 

Я с = І

0 & ( i ) = I o g 2 ( n ! ) -

( 2 Л 4 )

Следует заметить, что для любой системы с s равновозможными состояниями энтропия

tf = log2 s.

(2.15)

Энтропия упорядоченного массива при условии, что все допустимые для него состояния также равновозможны, определяется выражением

Ну = log2 (П (я,!)) = 2 log2 (пк\).

(2.16)

k k

Для простого упорядоченного массива, не имеющего объектов с повторяющимися значениями признака, все пк=\. Энтропия такого массива равна нулю.

В процессе упорядочения массива его энтропия долж­ на измениться на величину

А Я = Я с Ну

= log2

И

- 2 log2 (nk\),

(2.17)

 

 

 

k

 

или, учитывая, что n = ^ n k ,

получим

 

 

ß n k ) \

 

^H =

l o g t

^ 7

J r .

(2.18)

 

П (nk\)

 

 

 

k

 

 

Изменение энтропии простого массива при его упо­

рядочении

 

 

 

 

±H = logt(n\).

(2.19)

Как известно, изменение энтропии характеризует ко­ личество информации, получаемой при выполнении дан­ ного процесса. Изменение энтропии при упорядочении массива равно количеству информации о массиве, полу­ ченному в процессе упорядочения.

Процедура упорядочения, как правило, сводится к последовательности сравнений значений признаков неко­ торых пар объектов и перераспределению объектов по позициям в зависимости от результатов сравнения.

§ 2.2. ХАРАКТЕРИСТИКИ СОСТОЯНИЯ МАССИВА

63

После выполнения очередной операции сравнения признаков неопределенность информации о состоянии массива уменьшается, так как все множество возможных до этого способов распределения объектов по позициям разбивается на два подмножества возможных способов распределения — совместимых и не совместимых с ре­ зультатом сравнения. Дальнейшему анализу подвергает­ ся лишь множество способов распределения объектов, совместимых с результатом сравнения. Если до сравне­ ния число возможных состояний массива s , а число воз­ можных состояний массива, совместимых с результатом сравнения S i < s , то уменьшение энтропии в результате сравнения определяется как

A H = log2 s - log2 S l - log2 — .

(2.20)

Si

 

Это выражение определяет количество информации, по­ лучаемой при одном сравнении, в предположении равновозможности всех допустимых состояний массива.

В зависимости от исхода сравнения определяется то или иное допустимое подмножество состояний. В этих условиях разумно выразить информационную ценность результата сравнения в виде математического ожидания изменения энтропии. Пусть s — число возможных состоя­ ний массива до сравнения, s\ — число состояний масси­ ва, совместимых с положительным результатом сравне­ ния, S2 — число состояний массива, совместимых с отри­ цательным результатом сравнения, и у массива нет со­ стояний, совместимых и с положительным, и с отрица­ тельным результатом сравнения. При этом, учитывая равновозможность всех состояний, получим вероятность

положительного

результата сравнения

р\ sjs

и отри­

цательного р 2 =

S2/S. Математическое

ожидание

измене­

ния энтропии определится как

 

 

 

M Н] = log, s — pj log2 st — p2 log, s2 =

 

 

= — [s log2

s — s1 log2

Si s2

logs sj.

(2.21)

s

 

 

 

 

 

Легко показать,

что максимум

математического

ожида­

ния АН соответствует

условию Si = s 2 = s/2 и составляет

М[ДЯ]

s log, s—slog, s = 1,

(2.22)

64

Г Л . 1 О С Н О В Н Ы Е П О Н Я Т И Я Т Е О Р И И У П О Р Я Д О Ч Е Н И Я

т. е. среднее количество информации, получаемое при одном сравнении, может в лучшем случае достигать одной двоичной единицы (одного бита). При этом ве­ роятности положительного и отрицательного результа­ тов сравнения должны быть равны друг другу. Выра­ зим информационную ценность сравнения через вероят­ ность положительного результата сравнения.

Имеем

M Н] = (рх - f р2 ) log2 s — р х

log2 sx — р 2

log2 s2

=

 

 

 

 

 

 

 

 

 

= — A log, Pi— p2

log2 p2 ,

или, учитывая, что p\ + p2 =

1, получим

 

 

 

(2.23)

 

 

 

 

 

M

[A Я] = -

Pi log2

Pi -

 

( 1 -

Pi) log2 ( 1 -

Pi).

(2.24)

Зависимость M[AH]

от pi

(или p2 ) приведена на рис. 2.5.

 

 

 

 

 

 

 

При выполнении не­

 

 

 

 

 

 

 

которого

перераспреде­

 

 

 

 

 

 

 

ления

объектов

по по­

 

 

 

 

 

 

 

зициям, т. е. при пере­

 

 

 

 

 

 

 

мещении объектов с из­

 

 

 

 

 

 

 

вестными

 

значениями

 

 

 

 

 

 

 

признака

из одних

из­

 

 

 

 

 

 

 

вестных позиций в дру­

 

 

 

 

 

 

 

гие,

 

изменения

энтро­

 

 

 

 

 

 

 

пии

не происходит,

так

 

 

 

 

 

 

 

как такая

перестановка

 

 

 

 

 

 

 

объектов

никак

не

ог­

 

 

 

 

 

 

 

раничивает

число

воз­

 

 

 

 

 

 

 

можных

распределений

 

 

 

 

 

 

 

объектов

с

неизвестны­

 

 

 

 

 

 

 

ми

признаками.

 

 

Рис. 2.5. Математическое

ожидание

Энтропия и ее изме­

количества информации

от одного

нение

 

характеризуют

сравнения в зависимости от апри­

лишь

неопределенность

орной

вероятности

положительного

(или

отрицательного)

исхода

срав­

наших знаний о состоя­

 

нения.

 

 

 

 

нии

 

массива, а

также

 

 

 

 

 

 

 

количество

информации

о массиве, получаемое в процессе упорядочения, и непри­ годна поэтому для оценки массива с точки зрения его упорядоченности. Действительно, если в результате се-

§ 2.2. ХАРАКТЕРИСТИКИ СОСТОЯНИЯ МАССИВА

65

рии операций сравнения будет получена Полная инфор­ мация о массиве, т. е. полностью определено его состоя­ ние, то энтропия в этом случае уменьшится до нуля не­ зависимо от того, упорядочен массив или нет.

2.2.2. Матрица инверсий и ее свойства. Массив при­ ближается к упорядоченному состоянию только в ре­ зультате перераспределения объектов по позициям при выполнении операций пересылки и перестановки объек­ тов. Для количественной оценки степени приближения массива к упорядоченному состоянию целесообразно ввести специальную меру неупорядоченности массива и ее изменения в результате каждого перераспределения объектов по позициям. Эта мера должна оценивать бли­ зость состояния массива к некоторому заданному со­ стоянию (к состоянию упорядоченности в порядке воз­

растания либо в порядке убывания

значений признака).

В

связи с тем, что для выполнения отношения по­

рядка

или следования важны лишь

соотношения между

признаками различных объектов, а не конкретные зна­

чения признаков, рассмотрим двоичную,

т.

е. прини­

мающую лишь значения 0 или 1, функцию И[і,

у], опре­

деленную

на множестве

всевозможных

пар

позиций

массива

с

адресами а[і]

и а [ / ] , где і и усоответст­

вующие индексы позиций.

 

 

 

При упорядочении по возрастанию

 

 

 

[

0, если тс [і] =^тс[у] при і < у, илитс[/] ^=тс[/}

И [і, j] =

J

1 в противном

 

 

при i > у,

 

I

случае.

 

(2.25)

 

 

 

 

 

При упорядочении по убыванию

 

 

 

(

0, еслитс[і] ^=тс[у] при і ^ у, илитс[і] =^тс[у]

И [i, j] =

I

1 в противном

случае.

 

при і > у,

 

 

(2.26)

 

 

 

 

 

Очевидно, значение функции равно 0, если объекты, расположенные в рассматриваемой паре позиций, упо­ рядочены в данном отношении, и 1, если для данной пары позиций отношение порядка нарушено. Случай

3 А. А. Папернов, В. Я. Подымо»

66 ГЛ. 2. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ УПОРЯДОЧЕНИЯ

нарушения заданного порядка для любой пары позиций

будем называть инверсией

позиций,

а определенную вы­

ше функцию — функцией

инверсии.

 

Очевидны следующие

основные

свойства функции ин­

версии:

 

 

1. Значение функции инверсии не зависит от порядка

рассмотрения пары позиций, т. е.

 

И[І,І]

= ИЦ,І].

(2.27)

2. Значение функции инверсии при і = / всегда равно нулю (на основании свойства 1° (см. п. 2.1.1) отношения порядка или следования, требующего, чтобы любой объ­ ект находился в порядке по отношению к самому себе). Таким образом, И[і, і] = О, і Œ{ 1, 2,. •.., п\.

3. Для любых трех индексов i-</<С k из соотношения

И[і, j] = H[j, k] следует И[і, k] = И[і, j]. Это свойство функции инверсии является следствием свойства 3° от­

ношения порядка или следования

(свойства транзитив­

ности),

требующего

при отсутствии

(или

наличии)

ин­

версии

между

двумя

парами позиций

с индексами

i, j и

/, k

соответственно отсутствия

(или

наличия)

инверсии

и у пары позиций с индексами i, k.

 

 

 

 

 

 

Все возможные значения функции инверсии удобно

представить

в

виде

квадратной

матрицы

размерностью

пХп.

 

Строки

и столбцы матрицы пронумерованы в со­

ответствии

со

значениями

первого

и второго

 

индек­

сов-— аргументов функции

инверсии. Элементом

матри­

цы,

расположенным на і-й строке и /-м столбце,

являет­

ся значение

функции

инверсии

И[і,

/ ] . Такую

матрицу,

состоящую

из

нулей и единиц, будем называть

матри­

цей

инверсий.

На рис.

2.6

приведен

пример

матрицы

инверсий для

массива,

состоящего

из девяти элементов.

Покажем, что матрица инверсий дает полную инфор­ мацию о состоянии массива. Исходя только из матрицы инверсий, можно указать такую перестановку объектов по позициям, которая упорядочивает массив. Для этого необходимо по матрице инверсий для каждого значения индекса подсчитать число инверсий данной позиции с позициями, имеющими большее и меньшее значение

индекса. Обозначим

указанные суммы

инверсий Аі+ и

A t - соответственно.

Очевидно, значения

данных величин

§ 2.2. ХАРАКТЕРИСТИКИ СОСТОЯНИЯ МАССИВА

67

определяются выражениями

= 2 И Г'>k \ = ZVJ

я I M ,

 

(2,28)

z=i /=і

Позиция с данным индексом t разбивает все множе­ ство позиций массива на два подмножества — подмно­ жество позиций с меньшими индексами и подмножество

Л[і]\4 I 2 I 7 I 5 I 3 I 5 I / I 3 I £

NJ

/

I

J

4

5

6

7

8

9

Ai* AC

Ai

i'

1 0 1 0 0 1 0 1 0 0 3

0 + 3 4

2

1

0

0

0

0

0 1

0 0

1 1

0

2

3 0 0 0 I

1 0

1 0 1 4 0 + 4 7

4 0 0 1 0 1 0 1 0

0 2 I + ! 5

5 1 0 1 1 0 0

!

0 0 1 3 -2 3

6 0 0 0 0

0 0 1 t

i 3

0 + J 9

7 !

1 t

1 1 1 0 0

0 0

6 -6 1

S 0 0 0 0 0 1 0 0 !

1 1 0 8

a

0

0

1

0

0

1

0

1 0

0

3

'3

6

Рис. 2.6. Пример матрицы инверсий простого массива.

позиций с большими индексами. В упорядоченном мас­ сиве любая позиция не имеет инверсии ни с одной дру­ гой позицией. Поэтому в упорядоченном массиве все объекты, располагавшиеся в исходном массиве на по­ зициях, не образующих инверсии с данной, останутся в своем подмножестве позиций (в подмножестве с мень­ шими или с большими индексами соответственно), в то время как все объекты, расположенные на позициях, образующих инверсию с данной, должны перейти на

3*

68 ГЛ. 2. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ УПОРЯДОЧЕНИЯ

позиции из противоположного подмножества. Это потре­ бует перестановки объекта с рассматриваемой позиции і на позицию і' в упорядоченном массиве, причем зна­ чение і' определяется выражением

Ï = і + Д і+ — Д і~,

(2.29)

так как число позиций, предшествующих позиции дан­ ного объекта, из-за указанных перестановок должно уве­

личиться на Лі+ и уменьшиться

на At'- . Для

примера

на рис. 2.6 по

матрице

инверсий

рассчитаны

значения

Аі+ и Аі~ для

каждого значения

і и определены пози­

ции объектов в упорядоченном массиве.

 

Рассмотрим основные

свойства

матрицы инверсий:

1°. Все элементы на главной диагонали матрицы ин­

версий равны нулю, так как И[і,

і] = 0 ,

Î

E {

1, 2

« ) .

2°. Матрица

инверсий — симметрическая

матрица,

так как все ее

элементы, расположенные

симметрично

 

по отношению к главной диагонали, равны между собой:

 

# [ / , / ] = # [ / , / ] .

 

 

 

 

 

3°. Элементы матрицы инверсий не могут быть зада­

 

ны произвольно,

так как между

ними

должна выпол­

 

няться функциональная зависимость: для любых трех

индексов

t ' < 7 < ^

из

соотношения

 

 

 

 

/]

=

И[\,

k]

следует

 

 

 

 

И[і,

k]

=И[І,

j]

 

 

на основании свойства

транзитивности отношения по­

рядка или

следования.

 

 

 

 

 

4°. Все элементы матрицы инверсий упорядоченного

массива равны

нулю.

 

 

 

 

 

В дальнейшем будем рассматривать лишь треуголь­

ную часть

матрицы

инверсий,

расположенную

выше

главной диагонали,

так

как на

основании

указанных

выше свойств для полного описания состояния

массива

достаточно рассмотрения только этих элементов.

 

Рассмотрим

несколько частных случаев

состояния

массива и соответствующих этим состояниям

матриц

инверсий.

 

 

 

 

 

 

 

 

а) В массиве существует упорядоченный подмассив,

расположенный

на

позициях с индексами

от

/; до іг.

 

§ 2.2. ХАРАКТЕРИСТИКИ СОСТОЯНИЯ МАССИВА

69

В этом

случае

все

элементы матрицы с

индексами

г,

І2 и іі

< 7 < - t 2

равны нулю. Значения

остальных

элементов матрицы определяются инверсиями пар по­

зиций,

не вошедших в

упорядоченный

подмассив

(рис.

2.7).

 

 

б)

В массиве существует

упорядоченная

последова­

тельность объектов,

расположенных на позициях с ин­

дексами

 

 

 

 

 

/ = i0 +

kh

(k = 0, 1, 2,

N),

(2.30)

где h — шаг

последовательности

индексов

позиций.

В этом случае

в матрице

инверсий на пересечении строк

Рис. 2.7

Матрица инверсий мас­

Рис. 2.8. Матрица инверсий мас­

сива с

упорядоченным подмас-

сива

с упорядоченной последо­

 

сивом.

 

вательностью.

и столбцов, выделенных

данной

последовательностью

индексов, должны располагаться нули, так как члены последовательности между собой упорядочены, а значе­ ния остальных элементов матрицы определяются инвер­ сиями пар позиций, не вошедших в выделенную после­ довательность (рис. 2.8).

в) В массиве существуют две группы объектов, рас­ положенных на позициях с индексами от і\ до і2 и от із до ц, таких, что каждый объект первой группы упоря­ дочен с каждым объектом второй группы и, наоборот, каждый объект второй группы упорядочен с каждым объектом первой группы, но объекты внутри групп не

Соседние файлы в папке книги из ГПНТБ