Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математическая теория энтропии

..pdf
Скачиваний:
17
Добавлен:
12.11.2023
Размер:
19.07 Mб
Скачать

222

Гл. 4. Эргодическая теория

щыо некоторого пррцесса кодирования, что позволило ему осу­ ществить сформулированную выше программу.

Мы опишем сейчас этот способ, а затем приведем доказа­ тельство основной леммы Орнстейна. Для упрощения записи i-fi элемент конечного упорядоченного разбиения £ будет обозна­

чаться через | (/) вместо Nf1(/). Следующее понятие' уже вво­ дилось ранее (см. разд. 3.6).

Определение

4.29.

Пусть (Q,

Я, Т) — обратимая динами­

ческая

система.

Для

любых положительного

вещественного

 

--------------------------

 

 

о(п- j)

 

 

 

 

t

 

— — б(л-2)

 

б(п)

 

--------------------

 

 

--------------

 

*

;

 

 

 

 

 

 

 

t

 

е(1)

>

 

 

 

-------------------------------

 

 

 

 

 

 

t

 

в(0)

 

 

 

 

-------------------------------

 

 

 

 

 

 

 

 

 

Рис. 4.2.

 

 

 

числа

с и положительного

целого

п

разбиение

а называется

(с, п)-башней, если а состоит из п + 1

элементов, для которых

и

 

Т/о(0) =

о(/),

 

 

 

 

 

Р (п)) <

с.

 

 

 

 

 

 

 

Если а — некоторая (с, п)-башня, то пространство Q можно представлять себе состоящим из множества а(п) и набора (башни) из п множеств одной и той же меры, расположенных друг над другом. Преобразование Т переводит каждый этаж башни в следующий этаж, как показано на рис. 4.2. Каждый этаж башни индексируется точкой из множества Qa, причем Ра-меры точек 0, 1, 2, ... , л — 1 равны.

Приводимая ниже лемма является ключевой для дальней­ шего развития теории. Ее доказательство основано на при­ надлежащем Какутани остроумном геометрическом представ­ лении эргодической динамической системы, называемом пира­ мидой *). Перед тем как сформулировать и доказать лемму, дадим описание этого представления.

) В оригинале — skyscraper. — Прим. перев.

4.5. Кодирование и основная лемма Орнстейна

223

Пусть (Q, Ф, Р, Т) — обратимая эргодическая динамическая система, Л0 — измеримое подмножество Q положительной меры. Для каждого k > 0 положим

Ад == {(О G Ag". Т СО65 Ад, Т^й) ^ Ад,

0 ^

^ k }•

Если рассматривать Т*ю как положение

в

момент времени

k частицы, находившейся в начальный момент времени в точ­

ке <в, то Uft-i Л* ==(иГ-1Т"^ о ) О Л0 — это множество точек Ад, обладающих тем свойством, что частица, помещенная в началь­ ный момент времени в одну из этих точек, со временем вер­ нется в Ад. Мы будем называть это множество множеством возвращающихся точек А0. Множество Л£ состоит из тех точек,

которые впервые возвращаются в Д

в момент времени k.

Предположим,

что

 

 

я (л ° - 0

4 ) =

Р ( а >П 0

Т~* (Q - Л0)) > 0.

Множества Т_/ (Л0 f| fl”-i

(Q — Л0)) попарно не пересекаются

и имеют одну и ту же меру. Но отсюда следует, что Р(0) = оо. Следовательно, Р (Л0 — ЦГ-i ^о) = 0» так что = Л0 (mod 0) и почти все точки А0 возвращаются в Ад. (Это утверждение

называется теоремой Пуанкаре о возвращении.)

то

множества

Если k — любое положительное целое число,

{T ^ Q}/-O попарно не пересекаются, а поскольку

множества Л*

для k — \, 2, ... дизъюнктны,

то семейство {т^Л^: k = 1, 2, ...

....

состоит

из

попарно

непересекающихся

множеств.

 

 

 

 

 

 

Пусть O' = Ur_, I K T4 ‘ =

и Г -т Ч .

Тогда

T_1Q 'c Q '.

Кроме того,

множество Q' —Т_1£У имеет меру нуль, поскольку

в противном

случае множества Т~* (Q' — T-IQ')

образовывали

бы счетное семейство попарно непересекающихся множеств

одной и той же положительной

меры,

что

невозможно, так

как Р (Q') ^ Р (Q) =

1. Тем самым T_1Q' =

Q' (mod 0) и Р (Q') = 1

в силу эргодичности Т. Итак,

Q' =

Q(mod0).

 

Мы

только что

доказали,

что

семейство

множеств {тМ*:

Л = 0,

1, 2........ 1}

является

(modO) разбиением

пространства Q, причем некоторые элементы этого разбиения под действием Т переходят в другие его элементы. Если

представлять каждый элемент этого разбиения

отрезком, рас­

полагая

элементы {Т/Л*}/—о друг над другом,

как показано

на рис.

4.3, то полученная диаграмма и будет так называемой

224

Гл, 4. Эргодическая теория

пирамидой Какутани. Преобразование Т переводит любой отрезок пирамиды в отрезок, расположенный прямо над ним, а если такого отрезка нет, то в некоторое подмножество А0.

k - l

з

 

 

 

2

т гА \ :

\

 

 

 

 

ТА

t

 

 

 

 

 

t

t

t

 

 

—.... ~

Л8

 

2

,Al

 

А О

 

 

Рис. 4.3.

 

 

Теорема 4.30 (Какутани — Рохлин)*). Если

(й,

Р, Т) —

эргодическая обратимая динамическая система с непрерывным

пространством состояний,

то для любых с > 0 и положитель­

ного целого п существует (с, п)-башня в пространстве Q.

Доказательство. Пусть

А0— измеримое подмножество й,

для которого 0 < Р(А0) < сп~1. Рассмотрим пирамиду Какутани, построенную по множеству А0. Пусть

 

 

2 п - 1

З п - 1

 

 

 

 

F =

U

Лои U ( ^ и т Ч ) и ...

 

 

 

/-п

/-2п

 

 

 

( f e + l ) n - l

 

 

оо < f e + l ) n - l k-l

. . . U

и

U o U

. . . и т (* - 1)пл 0 = 0

U

UT lnA i

 

/ - f e n

 

 

fe-1

/ - f e n

/ - 0

!) Это утверждение играет основную роль в аппроксимационной теории. Ойо справедливо для любого апериодического автоморфизма, что доказы­ вается с привлечением счетной трансфинитной индукции или с помощью

разложения на эргодические компоненты. В приводимой форме оно

впервые

ойубликовано в [124] и, независимо, в работе

Халмоша (Halmos

[1944]).

ВI иностранной литературе его называют леммой

Рохлина или леммой Хал­

моша — Рохлина. С другой стороны,, Какутани [6] (см. также его совместную работу с Амброзом Ambrose, Kakutani [1942]) ввел понятия интегрального и производного автоморфизмов, что имеет прямое отношение к данной теореме. Поэтому теорему можно было бы назвать именем всех трех авто­ ров. — П р и м. ред .

4.5. Кодирование и основная лемма Орнстейна

225

Множество F отмечено на пирамиде Какутани, предста­ вленной на рис. 4.4. Используя эту пирамиду, можно убедиться

2п

 

 

 

 

 

 

УУ

УУ

2л-1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п

 

 

 

УУ

 

 

/ / г

7 1/ • • *

п - \

 

 

 

 

 

 

 

 

 

 

 

.

•••

\

 

 

 

 

 

 

 

 

О

А%

УУ

УУ

УУ

УУ

••• УУ

УУ

А \

AS

AS"

Л%*

лу*'

,

Aft

Лр*

 

 

 

 

Рис. 4.4.

 

 

 

 

в том,

что

множества

Т7, Т/7, . .. , Т

F попарно не

пересе­

каются

и

 

 

 

 

 

 

 

Q—\i т'р = UJ и Uo итЛд) и ... иК " 1и ... и тл-*Ло-1)] и

/- о

ит* U s+lи U?+2итл?+2)и ... и(4"-1 и ... итп24 п~')] и ...

 

 

.. . = и W U ^ Q V ^ ) .

 

 

 

 

k -О

\ / - 1 t - о

/

Поскольку Т — метрический

автоморфизм,

Р( Q -

"О* т'р) = Е

Z /Р Uo‘n+/) < пР(Л0) < с.

 

\

/—о

/

Л"*о /—1

 

Поэтому

если

положить or(0) = Р, <г(/) =

Т/Р для 0 < / а ^ я — 1

и <r(«) =

Q -f]/-o T 'P ,

то

разбиение о

будет являться (с, п)-

башней.

 

 

 

 

 

 

Пусть | — разбиение пространства состояний динамической системы (Q, Р, Т), а сг — некоторая (с, л)-башня этой системы. Каждый из этажей <т можно рассматривать как пространство

Лебега (or (Л, <т(/)П<Г, Р°(-1 /)), где через Рст (* | у) обозначена условная мера на <т(/). Если через ТР<1( • | /) обозначать меру

226

Гл. 4. Эргодическая теория

Р°( • |/) о Т \ то можно считать, что на /-м этаже башни о на­

ходится пространство (Тlla (0), Т{Р°( • 10)). Разбиение £ порож­ дает упорядоченные разбиения £/ каждого пространства Лебега

(Т^о (0), Т'Ра(• 10)), для которых

1/ = {Ш ЛТ/о(0): *<=Q5}

и

d %) = (т'/>° (I (I) 10 ): i е Ое) = (Р° (Т"'* (t) 10 ): i <= Qs).

Для каждого / = 0, 1,

п — 1 разбиение

является

разбиением пространства (сг(0), Ра( • 10)), поэтому разбиением этого пространства является также и V /-oT -,5/. Заметим, что

V/-o T_/i; = (V/-o Т~/|) П о (0). Усиливая теорему Какутани — Рохлина, можно получить следующий результат.

Теорема 4.31. Если (Q, ЗГ, Р, Т) — обратимая эргодическая динамическая система, а £ — конечное разбиение пространства то для любых вещественного с > 0 и положительного целого п су.

ществует (с, п)-башня о, такая, что если £= V/-o Т_/£, то для всех I е Qj

Р°(£(/)|0) = />(£(/)).

Иначе говоря,

d ( V/-d T~'SЛ а (0)) = d ( V/-o Т“'£).

Доказательство этой теоремы намечено у Шилдса [139, с. 22]. Пусть теперь башня о и разбиение £ пространства Q удо­

влетворяют заключению теоремы 4.31. Для каждого множества

{т<[Су1т~/?) (ол<1(о)]: /=о> 1.... "-1}

имеют одну и ту же меру, попарно не пересекаются и лежат

на разных этажах башни <т. Это семейство называется /-й колонной башни. Заметим, что каждая колонна состоит из п элементов.

С помощью отображения Mj, которое сопоставляет точкам пространства £2j упорядоченные наборы из п точек простран­

ства

Q| (напомним, что

£= V/-o Т-/£),

каждому элементу /-й

колонны

можно сопоставить метку из

следующим образом:

элементу

Т* [(V/=o Т- ,|) (/) Л о (0)] приписывается метка lt в том

и только

том

случае, когда lt является

i-й компонентой Mj(/)

(см.

рис.

4.5). Первая слева колонна башни, изображенной

на

рис.

4.5,

отвечает

элементу разбиения V /-oT -/£ Л о (0)

 

4.5. Кодирование и основная лемма Орнстейна

 

 

227

с

номером 2 и

(2) = 0010. (Отсчет

элементов

начинается

с

нуля.)

 

 

 

 

 

 

Сопоставив подмножеству (J*_0т< (£(0 П о (0» пространства Q

упорядоченный набор п целых чисел

(/) = (/„, ... ,

/„_,),

мы

тем самым закодировали точки из подмножества

=

Ц „ 0

(0

пространства £2 в виде последовательностей элементов факторпространства Q6. Если считать пространство (Q6, d (|)) алфавитом

О

 

 

 

 

 

'/ / / / / / / / / /

 

 

 

 

 

 

11=4

<5(2) *

 

 

 

 

 

ЛЛА /Ъ

 

 

 

°

'

I

6 (1)

T

1

0 |

/ / / / / / / / / •■

A, / / / / / / f

 

 

0

 

 

 

I / / / / / / / / p u

 

 

 

l

2

9

0

4

 

1

 

 

 

Рис. 4.5.

 

 

с распределением

d(Q,

то мы сопоставили точкам, заполняю­

щим большую часть пространства Q (если с мало), слова

длины п,

составленные из символов этого

алфавита.

Отображение М; устанавливает соответствие между точками пространства (Qj, Pj) и словами длины п в алфавите (Q£, d(t)),

и именно с помощью этого отображения точки Q кодировались

такими

словами.

Пусть

Ф — любое взаимно однозначное! ото­

бражение пространства

Q;

в множество слов длины п, соста­

вленных

из

символов

 

некоторого алфавита (5, р),

где 5=*

= {0, 1, ... ,

k — 1}, а

р — дискретное вероятностное

распреде­

ление на 5.

Используя отображение Ф точно так же, как мы

использовали

Mt, можно

сопоставить элементам I-й колонны

на всех

этажах

символы

алфавита (S, р) и тем самым сопо­

ставить

каждой

точке

множества Uf_0 Т' (£ (I) П о (0))

некоторое

слово (s0, slf .. . , srt_,) в алфавите S. С помощью этих слов можно определить теперь другое разбиение т) пространства Q, для которого Q„ = S. Для этого достаточно в качестве г-го элемента разбиения т) взять объединение всех сечений колонн этажами башни а, Ф-индекс которых равен г, т. е.

228

Гл. 4. Эргодическая

теория

 

гдё объединение берется по всем

парам

i, I, для которых

№ ) ) t = r.

 

 

 

Эта конструкция позволяет получить разбиение, для которого

фдкторпространство

совпадает с

S, но

нет никаких осно­

ваний предполагать, что распределение d(r\) при этом каким-то образом связано с распределением р. Это связано с различием между отображениями Ф и Mj. Дело в том, что переводит вероятностное пространство (Qj, d (£)) в вероятностное про­

странство ( X L 1 ^ 0 с сохранением меры, и поэтому вос­ становление разбиения | по отображению М; приводит в точ­ ности к пространству (Q6, d(£)), в то время как о связи Ф с [мерой Р нам ничего не известно. Если в качестве Ф взять

отображение из (Qc, ц) в (Х"_о

р").

где рп — продакт-мера,

построенная по распределению

р, а

р — ее прообраз на Qj

относительно отображения Ф, то полученное при этом факторпррстранство (Qn> р) изоморфно (S, р). Используя закон больших

чирел, теорему Шеннона — Макмиллана — Бреймана и теорему Какутани — Рохлина, Орнстейн смог определить отображение Ф

таким образом,

чтобы

не только распределение р было близко

к

распределению

d(ri),

но

и само разбиение

было близко

к

разбиению |

в

метрике

разбиений. Это в

конечном счете

позволило получить бернуллиевское разбиение с заданным распределением, являющееся также образующим.

| Мы приведем сейчас доказательство основной леммы Орнстейна, основанное на изложении Шилдса [139] и опирающееся

Л& ряд формулируемых ниже лемм.

использовали

разбиение

| В

предыдущем

разделе

мы часто

V / - 1

Т-/|,

обозначавшееся

через

%~п

На

протяжении остав­

шейся части этой главы вместо 1~п будет

использоваться раз­

биение T!-n = V/-o Т-/|, которое

мы

обозначим через 1| -п.

Лемма

4.32. Пусть 5 =

{0, 1........ k — 1}, а

р — дискретное

вероятностное распределение на S. Для

любых d >

0 и обра­

тимой эргодической динамической системы

 

(Q,

Р, Т), такой,

что Л (Т) ^

Н (р), существует разбиение т] е

 

3Ck (Q), для которого

 

 

 

\ d ^ ) - p \ < d

 

 

 

 

(4.17)

 

 

 

0 < H ( p ) - h ( T , i])< d.

 

 

(4.18)

Доказательство.

Зафиксируем

d >

0

и

выберем

dx < d/6.

Пс| следствию 4.24 существует разбиение

е 2£, (Q),' для

которого

2 d l < H ( p ) - h ( T , i , ) < 4 d , .

 

(4.19)

 

 

 

4.5. Кодирование, и основная лемма Орнстейна

229

Пусть d столь мало, что из соотношения |£ — £ '\< d сле­ дует неравенство |А(Т, £) — А(Т\ £ ')l< ^ i. a d столь мало, что из неравенства | d (£) — d (v )\< d следует неравенство Я (£) < d{ для любых разбиений £, £ 'е 5 > Л(£2). Положим

d2 — min {[Я (р) — A (Т, |,)]/2, Я/4, Я/4, Я/(4Л* + 1)}.

Обозначим через £о начальное разбиение сдвига Бернулли (2(S), цр, В), где |ip — продакт-мера, построенная по распре­

делению р. Напомним, что (2(S)$0, d (l0)) = (S, р).

Всилу свойства равномерной распределенности (след­

ствие 2.54)

существует

N ь для которого при всех

n ^ N {

выполнены

неравенства

 

 

ехр {— п [Я (р) +

d2] } < Up |V '*(N i5_n (s)^| <

 

 

< exp {— п [Я (р) — d2] }

(4.20)

для всех s s S ( S ) — В0(п), где В0(п) — некоторое % "-множество,

такое, что

рр (В0 (п)) < d2.

В силу

эргодической теоремы (теорема 1.24) и того обсто­

ятельства, что из сходимости п. в. следует почти равномерная

сходимость ’) существует целое число N2, для которого при всех

п > Я 2

п-1

 

 

 

 

 

Е

 

 

< d2

(4.21)

 

x Z

lbw W s) — pt

 

< e S

/- 0

 

 

 

 

для

всех s e 2 ( S ) —Е0(п),

где

Е0{п) — некоторое

'^"-множе­

ство,

такое, что рр (£0 (п)) < d2.

Положим

В0 («) =

В0 {п) 1J Е0(л).

Вновь используя свойство равномерной распределенности,

но на этот раз для

системы (Q, iF, Р, Т), получим целое Я3,

для которого при всех

выполнены неравенства

 

ехр { - п [А (Т, I,) +

d2] } < Р

И ) ) <

 

<

ехр {— n [А (Т, |,) — <f2] }

(4.22)

для всех о е й — В (п), где В (п) — некоторое такое ^ “"-множе­ ство, что Р (В (п)) < d2.

1) Здесь имеется в виду теорема Егорова, согласно которой сходимость последовательности измеримых функций п. в. равносильна существованию множества сколь угодно малой меры, на дополнении к которому сходимость этой последовательности равномерна. — Прим» перев.

230

Гл. 4. Эргодическая

теория

 

Поскольку d2 < Y (Р) — Л (Т, |,)], существует целое число Я4,

для которого при

всех t i ^ N 4

 

 

4 ехр { - л [Н (р) -

h (Т, 6,) -

2сУ} < 1-

2d2.

Пусть теперь л > тах{Л^ь N2, N3, Nit 2d-1}. Определим под­

множества G0(л)

и Gi(n)

пространств

2(S)u_rt и £2u_rt соответ-

ственно как

 

 

 

S,

*,

 

 

 

 

 

Go(») = {г: V

(г) с 2 (S) В0(л)},

 

G » 4 { / :

,6-*(/)c=Q — В(л)}.

 

По определению множеств В0(п) и В (л) выполнены неравенства

 

(G0 (л)) > 1 — 2е^ и Pi5_n (G, (л)) >

1 — d2. Кроме того,

 

 

>

(1 -

2d2) ехр {л [Я (р) - h (Т, I.) -

2d2] },

где

| • | обозначает

число

элементов

множества.

Поскольку

 

4’

 

 

I G0(л)| >

4 1G, (л) |,

 

(4.23)

т. е.

число

точек в

О0(л)

по

меньшей мере^в

 

четыре раза

больше числа точек в Gx(л).

 

э, и s2 — это точки

из множе­

Предположим

теперь, что

ства

'i^ n(r)

при

некотором

r s 2 ( S ) i5\ n. Тогда

N6#<>B/ ($1) =

==NSOOB/ (S2) д л я

всех / = 0,

1........ л — 1, и это общее значение

является /"-й

буквой

слова

М|,_п(г),

состоящего

из символов

 

 

 

 

 

 

п-1

 

 

алфавита S. Таким образом, функция

Х/-о l$o(o(B/s) постоянна

на каждом элементе 1^'"(г) разбиения 1^ 'п, и ее значение на каждом таком элементе равно количеству появлений буквы i e S в слове Mu_n(r). Тем самым, если через ft (л, г) обо-

значить количество букв i в слове

неравенство

(4.21)

примет вид

 

 

£ \ h ^ n>

d2

(4.24)

i s S

 

 

Теперь мы готовы к тому, чтобы построить башню, которая будет использоваться для кодирования, как это было описано выше. Из усиленной формы теоремы Рохлина (теорема 4.31) следует, что для динамической системы (£2, Р, Т) суще­ ствует (d2, л)-башня а', для которой

d (V " Л or'(0))==d(,i,- '*).

4.5. Кодирование и основная лемма Орнстейна

231

Заменим башню а'

на башню

а с этажами,

составленными

из элементов Т1[lIj'n(/) Г) о ' (0)], где / е б , (л) и / =

0,

1........« —1.

Для этого положим

 

 

 

 

 

 

 

сх(0) =

<х'(0)П

 

П

 

‘I Г“ (0.

 

 

 

 

/ S cTj (п)

 

 

 

<т(/) — Т^сг(0),

 

/ =

 

1, 2........ л — 1,

 

 

сг (л) =

Q — U <*Ц)-

 

 

 

 

 

/-о

 

 

 

 

 

Из неравенств

Pi^-n (G, («)) > 1 — d2 и Р (U/-o T V (0)) >

> 1 — d2 следует, что Р(сг(л)) < 2d2. Таким образом, о является

(2d2, л)-башней, а колонны этой башни,

отвечающие разби­

ению li, могут быть помечены словами из

множества Gi (л).

Поскольку множество О0(л) содержит больше точек, чем

множество б 1(л), существует взаимно однозначное отображе­

ние

ф, вкладывающее Gi(n) в G0(n). Оно порождает отображе­

ние

Ф из

совокупности

слов

в совокупность слов

^М^пСг)!,

где /< = б 1 (л),

rsG o(fl),

по формуле

 

 

ФМ, _„(/) =

М .-Л фО,

/е б ,( л ) .

 

 

«1

«о

 

Определим разбиение t), применяя описанный выше процесс кодирования к отображению Ф. А именно, для любого i е 5 положим

А1 = иТ, (ог(0)П,|Г п(0).

где объединение берется по всем / е { 0, 1, 2, ... , л — 1} и l^ G i(n ), для которых /-я буква слова ФМ^_„(/) есть i. Допол­

ним каждое множество Лг с помощью подмножеств о (л) так, чтобы полученные множества (будем их обозначать по-преж­ нему Af) образовывали разбиение (Л0. • • •» A*-i} пространства Q. Это и есть искомое разбиение TJ.

Покажем теперь, что т) удовлетворяет условиям (4.17) и (4.18). Рассмотрим сначала условие (4.17). Для каждого Z sG j(n)

обозначим через С(1) колонну с основанием в (0) f) '|Г П(/), т. е.

С (I)= U*Т1['6ГП(0 П о(0)],

о

и положим Qi = U,e0|(rt)C(/). Напомним, что Q — Q[ = а (л), и, следовательно, Р (Q — Q,) < 2d2.

Соседние файлы в папке книги