Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
8
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

линией на рис. 4.4.2 изображены минимальные потери на рысканье.

Средние потери на рысканье в этом случае получаются путем осреднения по всем возможным значениям — а<Су —

— х х* ^ О (ô = 0), т. е.

о

 

 

Ли = - £ - $

<»)<>»■

(4.4.21)

- а

 

 

После интегрирования и преобразований получаем сле­ дующее выражение:

*i* = 2fc[-£- + - ^ V ] .

(4.4.22)

Из этого выражения хорошо видно, что потери на рысканье возрастают с ростом величин пробного (g) и рабочего (а) шагов, причем это возрастание пропорционально квадра­ ту указанных величин. Потери на рысканье уменьшаются с ростом времени выдержки Т%так как при этом умень­ шается влияние пробных шагов. При Î1 оо из (4.4.22) получаем

lim Я1а =

,

(4.4.23)

Т — оо

6

 

т. е. в пределе потери не зависят от величины пробных ша­ гов. Это объясняется тем, что при T ^ > tn2 удельное влия­ ние пробных шагов мало, так как система подавляющее время находится в состоянии выдержки.

Как видно, для эффективного уменьшения потерь на рысканье следует уменьшать величину рабочих шагов или увеличивать время выдержки.

Однако, как видно из (4.4.2), это требование находится в полном противоречии с требованиями, предъявляемыми к анализируемым алгоритмам с точки зрения потерь на

поиск.

Для минимизации потерь на

поиск, наоборот,

следует

выбирать возможно большое

значение величины

п и Т = 0.

 

На рис. 4.4.3 показаны зависимости потерь на поиск и на рысканье от величины рабочего шага а и от времени

выдержки Т.

Хорошо виден противоречивый харак­

тер поведения

указанных потерь с изменением парамет­

ров а и Т,

 

Таким образом, выбор величин a, g и Т должен произ­ водиться оптимальным образом в зависимости от особен­ ностей поведения объекта в процессе эксплуатации.

2. Рассмотрим теперь потери на рысканье алгоритма поиска с непарными пробами (§ 4.2) при работе на квад­ ратическом объекте.

Рис. 4.4.3.

Поведение похерь на поиск Кх и потерь на рысканье

в функции:

а) величины рабочего шага и б) времени выдержки.

Пусть для предельного цикла условие (4.2.6) выполня­ ется и поэтому рабочий шаг в цикле не делается. Предель­ ный цикл для этого случая состоит из двух переходов

н

- ^ -

н

 

"3

 

 

 

/

 

 

 

 

 

 

X+Œ

 

X K

j y

я+д " 2 * х \

 

у

х

 

Е

 

 

 

 

 

Ф

 

■4

б)

 

Рис. 4,4.4. Предельные циклы для алгоритма поиска с непарными пробами: а) цикл первого рода — без рабочего шага, б) цикл вто­ рого рода — с рабочими шагами.

и показан на рис. 4.4.4, а. Будем называть его циклом первого рода. Потери на рысканье такого цикла имеют вид

Яя = т * - 17 <*-*•)* +

g)*] =

Ц2

 

= k jfcc - хУ +

(2* _ 2х* + g)J, (4.4.24)

где £ц2 — время одного цикла поиска, которое при усло­ виях (4.4.11) равно

^Ц2 — ^П2

(4.4.25)

Как обычно, потери на рысканье зависят от значения я, которое в свою очередь зависит от начальных условий.

Иэ (4.4.24) можно получить верхнее и нижнее значения потерь на рысканье. Наименьшие потери получаются при

х

 

fn2&

 

 

 

х* — — ■— и равны

 

 

 

Ц2

 

 

 

 

 

rjinin

=

ktn ^

(4.4.26)

 

 

Ii2i

Ц2

 

 

 

 

 

Максимальное значение

потерь соответствует х х*

=

---- + g j,

т. е. левому концу промежутка (4.2.6).

 

 

Средние

потери

на

рысканье получаются путем

осреднения (4.4.24) по всем возможным значениям х

предельного

цикла, удовлетворяющим

неравенствам:

=

 

kg

т - е -

 

т ( т Н

 

 

/?21 = -J -

5

Я-!1 (У) dy-

(4.4.27)

 

1

/ 5

ч

 

 

- г ( т г « )

 

Если же в районе экстремума неравенство

(4.2.6) не вы­

полняется, то в процессе поиска устанавливается более сложный предельный цикл — цикл второго рода. Он по­ казан на рис. 4.4.4, б.

Потери на рысканье в этом случае равны

Дм = -èц2- { T I»* + + а)2) + [(У+ e f +

-1- + а + g f\} = к]уг + уа + -у- + (2у + а + g)j ,

где у = х х* < 0. Сравнивая это выражение с (4.4.24), можно утверждать, что

i?21 = i?22 при

i?21 i?22 при

Яп <С ^22 при

у —

V

1

V

1

*112

( т ■ + tЦ2■g )/ ,

( - f

+

*П2

g ) ,

(4.4.29)

t

 

 

Д2

J

 

( т

+

*П2

 

 

*Ц2

 

 

Как видно, в зависимости от положения предельного цик­ ла потери на рысканье для обоих видов предельных цик­ лов могут быть различными.

 

/

3

 

' .'г-т

и

хух+а X X

r / V

ух+2а х

2

4

2

а)

Ф

 

 

 

Рис. 4.4.5. Предельные циклы для алгоритма поиска с совмещен­ ными пробными и рабочими шагами для случаев: а) цикл пер­

вого рода: а <

цикл второго рода:

Средние потери для предельного цикла с рабочими ша­ гами определяются путем осреднения (4.4.28) по всем значениям положения предельного цикла, которые за­ висят от начальных условий и положения экстремума, т. е.

В» ~ Ш = 1

~ H è + ')

R„l),)dg. (4.4.30)

$

-+ * ( £ - « )

3.Потери па рысканье для алгоритма поиска с сов­ мещенными пробными и рабочими шагами также зависят от вида предельного цикла. В случае, когда выполняется условие (4.3.5), предельный цикл имеет два состояния (это цикл первого рода). Он показан на рис. 4.4.5, а и

имеет следующие потери на поиск для параболического

объекта:

«si =

- g - [(* — х*)2

+ ( х х * +

а )2] =

 

=

/с^(д: —х*)2+

а (я — Z*) +

- j - j .

(4.4.31)

Как обычно, потери зависят от положения цикла х. Ми­ нимальные потери соответствуют х х* — ^ и равны

i?£in = J | l .

 

(4.4.32)

Максимальные потери определяются из условия

п

и| X х'\ min = — 2 J ~ 2 и равны

 

 

+ “* ) = п Г +

<4.4.3»

Средние потери получаются, как обычно, путем осредне­ ния потерь (4.4.31) по всем возможным положениям пре­ дельного цикла:

 

2Ка ^

2

(4.4.34)

R 31 = 4 "

I

Л3i(y)dy,

 

Б

а

 

 

ка

2

 

где у = х — ж .

Если неравенство (4.3.5) не выполняется, то предель­ ный цикл (второго рода) может иметь вид «восьмерки». Он

показан на рис. 4.4.5, б.

 

 

 

 

вид

Потери на рысканье для этого случая принимают

 

Д -,( .У )

=

- f

[ У !

+

“Г2 ( у+

+ ( У +

2 « f ]

( 4 .

при

условии,

что

|

+

а

ô

и а ^>уf

j5 • 'F Здесь

время

предельного

цикла

равно 4Т,

а — ~ ( 1 —

) <

< у <

— i-af 1 +

j •

Минимальные потери имеют мест 0

при у ■=■х — ж* = — а

и равны

 

 

 

 

 

 

 

 

pmin

 

7.~9

 

 

 

 

 

 

 

-П32

 

 

 

 

 

Максимальные потери, как легко заметить, соответствуют

(4.4.37)

Средние потери

Лз2 "" а2А—I

(4.4.38)

 

Этот поиск имеет максимальное быстродействие, но за это он «расплачивается» высоким значением потерь на рыс­ канье (порядка а2). Оба предыдущие алгоритма на цикле первого рода имеют потери на рысканье порядка g2.

В заключение этого параграфа еще раз отметим, что потери на рысканье существенно зависят от величины проб­ ных и рабочих шагов поиска. Поэтому для снижения этих потерь следует уменьшать, прежде всего, размеры рабо­ чих шагов, что, как известно, находится в противоречии с требованием быстродействия. Для повышения быстродей­ ствия поиска величину рабочего шага нужно, наоборот, увеличивать. Выбор конкретных значений величин проб­ ных и рабочих шагов должен происходить с учетом осо­ бенностей поведения оптимизируемого объекта, т. е. ну­ жен компромисс между ними. Другим путем является адап­ тация.

§4.5. Адаптация поиска

Впредыдущем параграфе было показано, что выбор оптимальных значений параметров а и Т алгоритмов ос­

ложнен противоречивостью критериев потерь на поиск К и потерь на рысканье R. Так, с точки зрения потерь на поиск величина рабочего шага должна быть максималь­ ной, а выдержка Т — минимальной. Критерий потерь на рысканье требует обратного решения.

Это противоречие можно было бы попытаться прими­ рить, если ввести глобальный компромиссный критерий, учитывающий время пребывания системы в двух режимах: движение к экстремуму и работа в районе экстремума. Но полученные таким образом «оптимальные» значения а и Т были бы заведомо не оптимальны на каждом режиме

в отдельности и система поиска работала бы не наилуч­ шим образом.

Это обстоятельство заставляет обратиться к адаптации как к средству управления значениями параметров а и Т. Алгоритм адаптации должен, прежде всего, определять режим, в котором работает алгоритм. Для этого, как лег­ ко заметить, достаточно фиксировать значение знака про­ изведения двух следующих друг за другом рабочих шагов

IN = sign (AXN-IAXN)-

(4.5.1)

Если IN 0, то система находится в режиме движения к экстремуму (оба шага сделаны в одном направлении). Если же IN < 0, то это — работа в районе экстремума (рабочие шаги либо противоположно направлены, либо нулевые).

Теперь нетрудно построить алгоритм адаптации для

Т:

TN fi =

Т max»

если

IN ^ О,

Tmin»

если

(4.5.2)

 

IN ^>0.

Смысл этого алгоритма адаптации прост: в районе экстре­

мума^/

0) выдержка максимальна, а вдали от экстре­

мума" — минимальна (TN = r min или

TN = 0 ). Как

видно,

поиск, снабженный таким алгоритмом адаптации

будет

работать оптимально как вдали,

так и в районе

экстремума.

Алгоритм адаптации величины рабочего шага удобно

записать в рекуррентной форме:

 

ЯАГ+1

= & N

[1 + àlN],

(4.5.3)

где 0 <С Ô < 1 * Как

легко

видеть, вдали

от экстремума

рабочий шаг будет увеличиваться, а в зоне экстремума — уменьшаться или сохранять свое значение (при I = 0, что несущественно, так как в этом случае рабочих шагов не делается).

Таким образом, адаптация параметров алгоритмов поиска дает возможность поиску работать оптимально в каждом режиме.

Г Л А В А 5

МЕТОДЫ УЛУЧШЕНИЯ ШАГОВОГО ПОИСКА

В предыдущей главе рассмотрены и проанализированы алгоритмы шагового поиска, которые работают на объек­ тах, функция качества которых унимодальна. Таким об­ разом, унимодальность является единственным ограниче­ нием, накладываемым этими алгоритмами на объект. (За­ метим, что даже непрерывность рассмотренных моделей не была существенной для поиска.)

Однако очень часто об объекте известно нечто большее, чем его унимодальность. Например, бывает известно, что его функция качества является квадратичной параболой, или кусочно-линейна и т. п. Эта дополнительная информа­ ция об объекте никак не использовалась рассмотренными выше методами поиска. За счет этого указанные алгорит­ мы имеют универсальный характер. Но эта универсаль­ ность получена ценой снижения быстродействия, ко­ торого можно было бы достигнуть, если использовать некоторые предварительные сведения об объекте. Эти сведения очень часто имеются или их получение обхо­ дится не слишком дорого.

В этой главе рассмотрены алгоритмы поиска, которые созданы для эффективного управления объектами опре­ деленного класса, когда априорные представления об объекте более значительны, чем сведения об его унимодаль­ ности.

§ 5.1. Градиентный поиск

Градиентом функции одной переменной Q = Q (х) на­ зывают ее производную

grad<?(x) = - g - ,

(5.1.1)

которая определяет наклон экстремальной характеристи­ ки объекта Q (х).

Если объект является «черным ящиком», то градиент оценивается по двум замерам в близлежащих состояниях. Например:

grad Q (ж) æ ■ Q(g + g)2gQ(* '~ g) ,

(5.1.2)

где величина g предполагается достаточно малой. Очевид­ но, что при g 0 это выражение соответствует (5.1.1), т. е. им можно пользоваться]*вполне надежно для достаточно* глад­ ких функций Q (ж) и при малых

значениях g.

Идея использования понятия градиента для целей убыстрения поиска заключается в следующем. Для широкого класса объектов характеристика Q (ж) имеет такую особенность: чем дальше от экстре­ мума х*, тем круче наклон харак­ теристики (например, в случае квадратического ’объекта). Следо­ вательно, величина модуля гра­ диента может служить мерой уда­ ленности от экстремума, т. е.

Рис. 5.1.1. Блок-схема

ж — х<ч•* — a grad Q (ж), (5.1.3)

алгоритма градиентного

где

а — некоторая постоянная

поиска.

 

0). Это обстоятельство дает

основание для построения следующего алгоритма поиска, который называется градиентным.

Пусть длина рабочего шага берется не постоянной, а

в зависимости от величины градиента, т. е.

 

р Ажi — — a grad Q (ж),

(5.1.4)

где градиент оценивается по формуле (5.1.2). Формула для рабочего шага в этом случае записывается в виде

Ажi = — a [Q (ж +

g) — Q (ж — g)],

(5.1.5)

где

а

 

а =

(5.1.6)

 

2g

 

Применение такого алгоритма поиска для объектов параболического класса позволяет действовать довольно разумно, т. е. вдали от экстремума делать большой рабо­ чий шаг, а вблизи — малый.

На рис. 5.1.1 показана блок-схема алгоритма гради­ ентного поиска, которая очевидна и не нуждается в до­ полнительных пояснениях.

Рассмотрим аппаратурную реализацию этого алгорит­ ма. На рис. 5.1.2 изображена блок-схема экстремального

Рис. 5.1.2. Блок-схема экстремального регулятора, работающего методом градиентного поиска.

регулятора, реализующего градиентный поиск. Здесь генератор пробных шагов ГПШ вырабатывает пробные смещения управляемого параметра, реализуя операторы пробных шагов «ж + (см. рис. 5.1.1). Полученное в результате проб приращение AQ сообщается исполни­ тельному механизму ИМ , который и производит рабочее смещение — aAÇ. Работой экстремального регулятора управляет программное устройство ПУ, включающее по­ очередно ГПШ и ИМ и управляющее памятью П, где запоминается предыдущее значение показателя качества.

Теперь рассмотрим особенности поведения объекта в процессе градиентного поиска. Определим скорость при­ ближения к экстремуму в процессе оптимизации объекта параболического вида:

Q (ж) = к |ж — ж*|« +

<?*,

(5.1.7)

где показатель q

0.

простоты выражением

(5.1.4) и

Воспользуемся

для

определим смещение из состояния Жг

х* на одном этапе

поиска. (Случай

Xi <

х* может быть рассмотрен анало­

гично и приведет к тому же результату ввиду симметрии.)