Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
8
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

уменьшается номере уменьшения модуля наклона /^экст­ ремальной характеристики. На рис. 8.2.3 показано по­ ведение среднего смещения к цели для квадратичного объекта вида (8.2.16) при различных значениях параметра зашумленности объекта к (8.2.19).

Теперь перейдем к другому алгоритму поиска.

Б. Поиск с совмещенными рабочими и пробными шагами. Работа этого алгоритма при отсутствии помех рассмотрена подробно в § 4.3. Алгоритм шага записы­ вается в виде

Axi = àxi-i sign !(?' (xi-1) — Q' (*<)!• (8.2.24)

Здесь модуль шага равен а, т. е. |Дж| = а.

Очевидно, что этот алгоритм отличается от предыду-

р

щего

только тем,

что

 

решение онаправлении

Xi*а

дальнейшего движения

принимается на основе

Рис. 8.2.2. Возможные переходы при

информации,

получае­

реализации рабочего шага в обста­

мой

в точках, отстоя­

новке помех.

щих друг от

друга не

 

па расстоянии 2g,

а на

расстоянии а. Это дает возможность сразу определить ве­

роятность

ошибки в этом случае.В формуле (8.2.15) вме­

сто 2g следует поставить а,

т. е.

|

ОШ

(8.2.25)

Дальнейший расчет сред­ него смещения происходит аналогично предыдущему и приводит к

Si+1 = аФ (4g -) . (8.2.26)

Рис. 8.2.3.

Среднее

смещение

к цели в обстановке

помех для

квадратичного

объекта

(х2> Х !).

Сопоставим быстродействие обоих алгоритмов. Для этого нужно сравнить их средние смещения с учетом затрат на эти смещения. Как обычно, затраты будем измерять временем, затрачиваемым на одно определение Q'(x).

Временные затраты одного шага для первого ал­ горитма равны 2Г, а для второго — Т, где Т — время

Рис. 8.2.4. Плоскость параметров алгоритмов. В заштрихованной области алгоритм с парными про­ бами имеет большее быстродей­ ствие, чем алгоритм с совме­ щенными пробными и рабочими
шагами.

определения одного значения показателя качества. Сле­ довательно, быстродействие (средняя скорость движения к экстремуму) первого алгоритма (с парными пробами) равно

у >= - г г ф (-т-).

<8-2-27>

а второго (с совмещенными пробными и рабочими шагами)

(8.2.28)

Теперь, приравнивая эти средние скорости, получим условие целесообразного применения обоих алгоритмов поиска:

'<^0, то лучше первый

алгоритм, если ф ( £ ) - 4 - Ф ( - т - ) = ^>0, то лучше второй

алгоритм.

(8.2.29)

Введем параметр зашумленности я (8.2.19). Тогда условие (8.2.29) запишется в виде

(8.2.30)

Рассмотрим плоскость па­ раметров я и gla. В каж­ дой точке этой плоскости определено быстродейст­ вие обоих алгоритмов, и, следовательно, по формуле (8.2.29) можно решить, какой из алгоритмов будет эффективнее по быстродей­ ствию.

На рис. 8.2.4 показана эта плоскость, на которой проведена граница, разде­

ляющая зоны целесообразного применения рассматривае­

мых алгоритмов. Уравнение

границы очевидно:

Ф

(8.2.31)

Из этого рисунка хорошо видно, что при малом уровне помех, т. е. при к < 1,03, всегда лучше второй алгоритм, (и = 1,03 —решение уравнения (8.2.31) при gla —»■оо.) Аналогично при а > g, т. е. при малых пробных шагах для первого алгоритма, второй алгоритм также всегда будет иметь большее быстродействие, независимо от уров­ ня помех. Такоепреимущество второго алгоритма естествен­ но, так как он более экономичен. Но это вовсе не означает, что первый алгоритм (с парными пробами) вовсе не пред­ ставляет интереса. Как видно из рис. 8.2.4, область его применения —высокий уровень помех и большие проб­ ные шаги.

§8.3. Статистические свойства случайных блужданий

впроцессе поиска

Впроцессе поиска в обстановке помех система поиска никогда не выходит на предельный цикл. Такого цикла

при помехах быть не может. В связи с этим затрудняется

иопределение потерь на рысканье.

Врезультате помех вместо предельного цикла система поиска случайно блуждает в районе цели. Это блуждание носит стационарный характер и определяет потери на рысканье экстремальной системы. Чем больше уровень помех, тем значительней «амплитуда» этих случайных блужданий и тем больше потери на рысканье.

Стационарный характер случайных блужданий по­ зволяет утверждать, что каждому состоянию х соответст­ вует число, определяющее частотные свойства попадания в это состояние в процессе блужданий.

Пусть р (х) — плотность вероятности пребывания в состоянии х в процессе установившихся случайных блуж­ даний. Тогда потери на рысканье определяются как сред­ нее значение превышения показателя качества над эк­ стремальным и записываются в виде

оо

R = ^ [Ç (ж) — Ç*]р (х) dx,

(8.3.1)

—оо

 

где, как обычпо, Q* — минимальное значение показателя качества.

[ Как видно, для определения потерь на рысканье необходимо знать плотность распределения положения системы в процессе установившихся случайных блужда­ ний вокруг цели.

Для простоты в дальнейшем будем рассматривать движение экстремальной системы при поиске с постоян­ ным шагом |Дя| = а. В этом случае система может нахо­ диться лишь в определенных равноотстоящих состояниях

Я?1,

Х[^1

 

 

xi+1 = Xi + а (г = 1,

., N —1). (8.3.2)

(Здесь для простоты предполагается, что число этих со­ стояний конечно, хотя возможно рассмотрение систем с бесконечным числом состояний, что однако не соответ­ ствует реальным условиям.)

Для этого случая плотность вероятности р (х) запи­ сывается через дельта-функцию в виде

N

 

Р(*) = 2 р£ (* — *i),

(8.3.3)

i=l

 

где pi —вероятность пребывания системы в состоянии xi. Эти вероятности удовлетворяют очевидному условию

N

 

2 а = 1,

(8.3.4)

i=i

 

которое выражает то, что в процессе случайных блужда­ ний система находится в одном из заданных состояний Xi (i = 1, . ., N), a &(х Xi) —дельта-функция с из­ вестными свойствами;

Ôх^

О

при

x=f=x„

(8.3.5)

оо

при

X = Xi,

 

 

§ ô Xi)dx = 1.

Подставляя выражение для плотности распределения (8.3.3) в (8.3.1), получаем, воспользовавшись вторым свойством дельта-функции,

N

 

я = 2 л и? (*<)-<?•]•

(8.3.6)

1=1

Таким образом, задача свелась к определению вероятно­ стей Pi (i = 1, . N) в процессе случайных блужданий вокруг цели.

Определим эти вероятности.

Прежде всего, отметим, что случайные блуждания оптимизируемой системы определяются ее локальным поведением. А локальное поведение описывается вероят­ ностями правильного и ошибочного решения (шага) Р и Рош. В предыдущих параграфах этой главы определены эти вероятности в зависимости от локальных свойств объекта —наклона его характеристики и уровня помех в этом состоянии для алгоритма поиска с парными проба­ ми. Анализируя локальное поведение системы в процессе поиска так, как это сделано в предыдущем параграфе, по­

лучаем вероятность перехода из состояния х в

состояние

х ± а:

 

p (* .± a M = -!-[l± ® (-l i ?2jL)],

(8.3.7)

где

 

и помеха, как обычно, предполагается нормально распреде­ ленной с дисперсией а2. Выражение р (х ± а/х) называет­ ся переходной вероятностью, таккак выражает вероятность

перехода из одного состояния в

другое (в

данном

случае из х в х ± а). Это выражение каждому состоянию

Xi ставит в соответствие

вероятность

перехода

в одно

из соседних состояний (Xi

+ а или xi

а).

состоя­

Теперь рассмотрим вероятность пребывания в

нии Xi вообще, независимо от предыстории.

В это состоя­

ние система может попасть из состояния xi

— а с вероят­

ностью р (xi/xi

— а) и из состояния х

а с вероятностью

р (xi/xi + а).

Но вероятность пребывания в каждом

из этих состояний по условию равно соответственно pi-x и pin. Поэтому можно написать следующее выражение:

Pi = Pi-iP {Xi/Xi —a) -\~Pi+xp (xi/xi + а), (8.3.8)

которое является естественным осреднением переходных вероятностей р (Xilx ± а). Это выражение и является исходной формулой для определения вероятностей pi,

которые обычно называют предельными. Выражение (8.3.8) имеет место для i = 2, 3, ., N — 1. В крайних точках xt и XN оно естественно записывается несколько иначе. Для рг получаем

 

Pi = PiP (V*i)

+Р2Р (xi/x2),

 

(8.3.9)

где

p (xx/xj) — вероятность

остаться

в

состоянии

хх.

 

Для рн аналогично имеем

 

 

 

 

 

P N = PN_x Р Ы х п — а) + P NP (XN/Xn),

(8.3.10),

где

p (XN/XN) — вероятность остаться

в

состоянии

х^.

Эти два уравнения замыкают систему из N уравнений

относительно предельных вероятностей P t { i = 1,

-,N).

Эта система уравнений линейна и поэтому легко решается стандартными методами.

Для иллюстрации рассмотрим следующий простой пример. Пусть кусочно-линейный объект Q (х) = к | х | (рис. 8.3.1, а) может пребывать в одном из четырех состоя­ ний (N = 4);

Хх = — у а; х2= — Y я; #з = у а; х4= у а. (8.3.11)

Движение системы в процессе поиска экстремума удобно изображать в виде стохастического графа (рис. 8.3.1, б), где каждая дуга —стрелка обозначает переход, а буква над ней —вероятность этого перехода:

Р = т [ 1 + Ф (-£)] • i = 1 - р.

(8-3.12)

Г Д в £ < - | - И р > ? .

Выпишем в соответствии с рассмотренным уравнения для определения предельных вероятностей:

Pi = Р1Я + /> 2g,

P2 — PiP +РэР,

Pa = РгР

+ P tP ,

(8.3.13)

P4 = PaQ

-\~PAQ>

 

PI Л-Рг -\-Pa + /Ч =

Матрица этой системы имеет вид

р

— g

0

0

р

— 1

р

0

0

р

— 1

(8.3.14)

g

0

0

— g

р

Разрешая эту систему, получаем

я

Pi Pi 2 *

(8.3.15)

Pi — Ря — ~2 •

График pi = р (x,) показан на рис. 8.3.1, в.

Рис. 8.3.1. Стационарное

блуждание в районе

экстремума.

а) показатель качества,

б) граф переходов;д в)

предельные

вероятности.

 

Отсюда видно, что pt < Рг, т. е. поиск способствует блуждапию системы в районе цели. И лишь при р = q = —1

что соответствует бесконечной дисперсии помехи (а

оо),

все состояния становятся равновероятными

 

= -^ J, что и

следовало ожидать.

 

 

 

Определим потери на рысканье

 

 

 

R = 2 Р& =

^

.

(8.3.16)

1=1

 

 

 

откуда получаем верхнюю и нижнюю границы

потерь;

■^min ~ ~2 ~> -^гпах = ко,.

(8.3.17)

Заметим, что в этих выражениях для потерь на рысканье не учтены пробные шаги, которые, строго говоря, изме­ няют исходную формулу. Однако для кусочно-линейного объекта точное выражение для потерь на рысканье сов­ падает с полученным (8.3.16).

§ 8.4. Поиск точного положения экстремума в обстановке помех (стохастическая аппроксимация)

Задача точного (или почти точного) определения поло­ жения экстремума в обстановке помех может решаться по-разному. Однако два фактора при этом нельзя не учи­ тывать. С одной стороны, следует Вводить фильтрацию как средство уменьшения уровня помех. С другой, — необхо­ димо уменьшать,длину рабочих шагов, так как.вначалельзя выити в заданную зону экстремума. Эти два обстоя­ тельства и лежат в основе метода стохастической аппрок­ симации.

Задачу отыскания экстремума функции Q (х) по заме­ рам с ошибкой

Q' (х) = Q(x) + 8

(8.4.1)

можно представить в виде минимизации математического ожидания:

М \Q‘(ж)] —э- min .

(8.4.2)

ОС

 

Трансформируем ее к задаче отыскания корня уравнения

где F (ж) в силу (8.4.1) определяется тоже с помехой. По­ этому следует искать корень уравнения

М [F' (ж).] = 0,

(8.4.4)

где М — знак математического ожидания, a F' (ж) — из­ меренное значение производной, которое изменяется от одного измерения к другому.

В связи с этим целесообразно рассмотреть сначала за­

дачу определения корня

(8.4.4),

а уж затем вернуться

 

 

к

экстремальной

задаче

 

 

(8.4.2).

 

корня в

 

 

А. Определение

 

 

обстановке помех (процедура

 

 

Роббинса — Монро). Пусть

 

 

F' (ж) = F (ж) + б (а), (8.4.5)

 

 

где

б (а) — центрированная

 

 

случайная помеха с диспер­

 

 

сией о2. Тогда

 

 

Рис. 8.4.1.

Взаимоотношения

М (F'{ж)) =

F (ж)

(8.4.6)

регулярной

и случайной со­

— регулярная

функция, ко­

ставляющих в процессе.

рень которой необходимо оп­ ределить. На рис. 8.4.1 показан пример взаимоотношения регулярной F (ж) и случайной е составляющих. Целью поиска является отыскание корня ж* регулярной состав­ ляющей

F (ж*) = 0.

(8.4.7)

Относительно регулярной составляющей F (ж) необходимо знать знак ее наклона в точке ж*, т. е.

а = sign

dF (х)

(8.4.8)

 

dx

х=х* 9

что обычно известно.

Идея стохастической аппроксимации проста и про­ зрачна. Она хорошо видна из рис. 8.4.1, где показан пере­ ход из жi в ж|+1:

ж*+1 = жI aa-iF' (ж,),

(8.4.9)

где ai 0 — некоторая последовательность положитель­ ных чирел, каждое из которых определяет наклон пря-

мой. Проанализируем это выражение. Определил! эффек­ тивность i-го шага отношепиел!

f t -

*i+i ~ **

(8.4.10)

l*i — **1 ’

 

модуль которого показывает скорость приближения к це­ ли х* на i-м шаге. Действительно, если | (3* | ]> 1, то про­ изошло удаление от ж*, если же | р* | «< 1, то точка ж1+1 приблизилась к х* по сравнению с ж*. Для упрощения выкладок, но не снижая общности изложения, можно пред­ положить, что а = 1 и Xi ]> ж*, т. е. рассматривается случай, показанный на рис. 8.4.1.

Подставляя (8.4.9) в (8.4.10) и воспользовавшись (8.4.5), получаем

f t - 1

aFfy)

 

е.

(8.4.11)

----- Ч----а -----

— 7

 

X. X*

X.

X*

 

 

г

%

 

 

Очевидно, что Р, является случайной величиной. Иссле

дуем ее вероятностные свойства.

 

 

 

Математическое

ожидание

 

 

 

 

=

 

 

(8.4.12)

характеризует работу регулярной составляющей. Для

сходимости

процесса

в

среднем необходимо,

чтобы

| Мъ(pi) | <

1, т. е.

 

 

 

 

 

1

 

(*i

< 1

(8.4.13)

 

1 X. X'

или

 

 

F (x0

 

 

 

O O i

< 2 .

(8.4.14)

Отсюда следует, что необходимым условием сходимости регулярной составляющей процесса является условие

*(»«)

(8.4.15)

X. —в* > 0 ,

I

 

что, очевидно, выполняется при а = 1

(это легко про­

верить).