Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
8
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

На рис. 4.2.3 показан пример работы алгоритма поиска.

Если бы неравенство (4.2.7) не выполнялось, то могло случиться, что система никогда не попала бы внутрь зоны нечувствительности (это зависит от выбора начальных условий) и совершала бы колебательные движения вокруг

Рис. 4.2.3. Пример процесса поиска по алгоритму с попарными про­ бами.

экстремума, что, естественно, приводит к излишним по­ терям.

Анализ работы этого алгоритма при наличии линей­ ного дрейфа проводится аналогично сказанному в § 4.1. Читателю рекомендуется произвести такой анализ в по­ рядке упраяшепия.

§ 4.3. Поиск с совмещенными пробными и рабочими шагами

Рассмотренные в двух предыдущих параграфах алго­ ритмы экстремального управления предполагают наличие специального этапа проб, в процессе которого получается необходимая информация об объекте, что, естественно, снижает быстродействие поиска. Однако уже во втором ал­ горитме, рассмотренном в предыдущем параграфе, этап одного из двух пробных замеров показателя качества сов­ мещается с этапом выдержки. А нельзя ли вообще отка­ заться от пробных шагов? Для этого нужно совместить пробные и рабочие шаги, т. е. информацию о поведении объекта получать только па рабочем шаге. Эту задачу ре­ шает поиск, который будет рассмотрен ниже.

Будем делать лишь рабочие шаги и при этом запоми­ нать полученное значение показателя качества на каждом шаге поиска с тем, чтобы использовать эту информацию для определения направления рабочего шага на следую­ щем такте поиска.

Смысл предлагаемого алгоритма заключается в сле­ дующем: при удаче действовать также, а при неудаче дей­ ствовать наоборот. Такая стратегия поведепия получила название линейной, а сам алгоритм часто называют спус­ ком. В дальнейшем нам часто придется обращаться к этой стратегии поиска при оптимизации сложных многопара­ метрических систем. Рассмотрим поведение простейшей экстремальной системы, управляемой таким линейным об­ разом.

Рабочее смещение управляемого параметра на i-м шаге поиска в этом случае записывается в виде следующей

рекуррентной формулы:

 

 

 

 

 

 

 

Дач = — Д^_! sign (AÇi-i +

ô),

 

(4.3.1)

где предполагается

 

 

 

 

 

 

 

AÇj-i =

Q (xj-j)

Q (342), IАж* ]

о,

(4.3.2)

 

+ 1

при z >

О,

 

 

 

 

— 1

при z <

О,

 

 

 

Ь — некоторый

положительный

порог

0).

Иначе

(4.3.1) можно записать в форме

 

 

 

 

 

 

A^i-u

если

AÇi_i <

— Ô,

(4.3.3)

 

— Дач-х, если AQi-X>

— ô.

 

 

Заметим, что в этом случае нельзя заменять функцию зна­ ка на релейную функцию F поляризованного реле с зоной нечувствительности (см. рис. 4.1.1, 6), так как необходи­ мо выполнить обязательное условие {Аж* | = а, что экви­ валентно требованию sign 0 0.

Блок-схема программы этого алгоритма показана на рис. 4.3.1. Здесь к известным уже операторам добавлены операторы «Аж» и «— Дж». Эти операторы обозначают ра­ бочий шаг такого же и соответственно обратного направ­ ления, что и предыдущий шаг, значение которого хранит­ ся в памяти, обозначенной на схеме кружком «память

Рис. 4.3.1. Блок-схема про­ граммы алгоритма с совме­ щенными рабочими и проб­ ными шагами.

Да;». Сделанный шаг тут же запоминается (это показано пунктирной стрелкой, входящей в кружок).

Другой блок запоминания «память работает следую­ щим образом. В нем запоминается полученное значение показателя качества оптимизируемого объекта, однако ето запоминание происходит не сразу, а после того как принято решение о направле­ нии следующего рабочего шага.

Работа рассматриваемого ал­ горитма поиска происходит в три этапа: 1) этап рабочего ша­ га, 2) этап выдержки, 3) этап принятия решения.

Эти этапы аналогичны этадам, рассмотренным в преды­ дущем параграфе. Как видно, здесь отсутствует этап пробного шага, что значительно сокра­ щает временные затраты. Дей­ ствительно, время одного цикла поиска равно

£ц = ^раО+ Т + Jpeni’ (4.3.4)

Рассмотрим процесс работы поиска на квадратичном объек­ те. В соответствии с алгорит­

мом поиска управляемый параметр будет изменяться в прежнем направлении, если AQ<L — Ô, и реверсировать­ ся, т. е. изменять направление на обратное предыдуще­

му при AQ

— Ô. Это означает, что

при попадании в

зону, где

 

— Ô, система поиска начнет циклическое

движение, из которого выйдет лишь при AQ <

— Ô. Та­

ким

образом,

поведение системы поиска в районе экстре­

мума

х =

х*

описывается именно

таким

циклом.

Определим условия существования подобного цикла, т. е. условия выполнения неравенства AQ — Ô при любых начальных значениях управляемого параметра.

Как нетрудно убедиться, для этого достаточно величи­ ну рабочего шага выбирать следующим образом:

На рис. 4.3.2 показап пример работы алгоритма в этом случае (зона, где AQ — ô, заштрихована).

Это условие может не выполняться, так как величина к объекта, вообще говоря, неизвестна. В этом случае цикл

Рис. 4.3.2. Пример работы поиска при а <У%

в районе экстремума может иметь более сложный харак­

тер, показанный на рис. 4.3.3.

начальных

условий

В этом случае

все зависит от

цикла. Если

 

 

 

 

ка 12 х*) -J- а | ^

ô,

(4.3.6)

то всегда возникает цикл

первого рода (рис. 4.3.2). Так,

при х х* = — |

всегда

будет иметь место такой цикл.

При нарушении условия (4.3.6) получаем цикл второго рода (см. рис. 4.3.3).

§ 4.4. Потери иа поиск. Предельный цикл. Потери на рысканье

Выше рассмотрены три алгоритма поиска, которые могут быть реализованы в экстремальном регуляторе. Однако, какой именно алгоритм нужно выбирать? Как оказать предпочтение одному из них? Для ответа на этот вопрос нужно уметь сопоставлять различные алгоритмы поиска по каким-то определенным критериям. Среди этих критериев особую роль играют два: потери на поиск и потери на рысканье. Рассмотрим их.

Потери на поиск определяют затраты поиска на еди­ ницу его успеха в процессе движения системы к цели. Пусть затраты поиска измеряются временем, а успех определяется величиной смещения к цели. Тогда поте­ ри на поиск выражаются следующей формулой:

К = 4 s- ,

(4.4.1)

ц

 

где £ц — время одного цикла, а 5Ц— смещение к цели за один цикл поиска.

Для рассмотренных выше

алгоритмов поиска Sn = а,

a величина tiXбыла различной. Подставляя сюда значения

£ц, получаем для различных

алгоритмов следующие вы­

ражения, характеризующие потери на поиск.

Для алгоритма с парными пробами (см. § 4.1)

 

[2 (£щ Ч~ £пг) Ч- ^пз4“ £раб Ч- ^реш 4“ У]>

(4.4.2)

для алгоритма с непарными пробами (см. § 4.2)

 

= -jp [£nl Ч~ £п2 4“ ^пз 4“ ^раб Ч- ^реш +Т],

(4.4.3)

для алгоритма с совмещенными пробными и рабочими ша­ гами (см. § 4.3)

K s =

[^раб Ч" Т Ч* ^пз 4“ ^реш]-

(4.4.4)

Из этих выражений видно, что

 

 

Кг > К2 > К 9,

(4.4.5)

т. е. потери на поиск для первого алгоритма максималь­ ны, а третий алгоритм имеет наименьшие потери на поиск.

Это означает, что последний алгоритм является предпоч­ тительным при сопоставлении алгоритмов по критерию потерь на поиск.

Из приведенных выражений для потерь на поиск хо­ рошо видно, что эти потери уменьшаются с ростом величи­ ны рабочего шага а и с уменьшением всех временных затрат. Поэтомудля уменьшения потерь на поиск необходимо время выдержки сделать минимальным: для первого алгоритма Т — О, для второго и третьего — T = tn%.

Однако потери на поиск характеризуют работу алго­ ритма поиска лишь на подходе к экстремуму. Алгоритм, имеющий наименьшие потери на поиск, наименьшей ценой выведет систему в район экстремума. Но на этом не за­ канчивается экстремальное управление. От алгоритмов поиска требуется надежная работа в районе экстремума, позволяющая отслеживать его блуждание или уплывание.

Эффективность работы поиска в районе экстремума характеризуют потери на рысканье. Эти потери образуют­ ся за счет недохода системы до экстремума, вызванного поисковыми движениями в районе экстремума. Вычис­ ляются потери на рысканье (для случая минимизации) путем осреднения разности Q (t) Q* за время движения в районе экстремума. Здесь Q (t) — текущее значение по­

казателя качества,

Q* — наименьшая величина показа­

теля качества, Q* = min Q (t). Эта разность

характери­

зует величину уклонения показателя качества

от экстре­

мального значения

Q*, которое, вообще говоря, может

также изменяться в процессе поиска.

следующей

Тогда потери на рысканье

выражаются

формулой:

 

т

 

 

 

 

R = [Q (О -

<?*] = П т 4 - [ IQ(0 ~ <Л

(4.4.6)

 

Г-М»

1 о

 

 

 

о

 

где черта сверху обозначает осреднение по времени, т. е. применение оператора осреднения:

. т

(4.4.7)

о

Вычисление по формуле (4.4.6) можно значительно об­ легчить, если процесс поиска циклически повторяется, т. е. разность Q (t) Q* имеет период Т*. Тогда форму­ ла потерь на рысканье записывается в следующем виде:

 

т*

 

я =

[<?М -< ?•]* •

(4.4.8)

 

0

 

Таким образом, прежде чем вычислять потери на рыс­ канье, нужно определить периодическое движение сис­ темы в районе экстремума, которое образует предельный цикл.

Рис. 4.4.1. Предельные циклы

для алгоритма поиска с парными

пробами: а) цикл первого

 

 

б

рода: \х — х* | < -щ р, б) цикл вто­

рого рода:

|

х

х* J> щ

Предельным циклом в процессе экстремального уп­ равления будем называть периодическое повторение си­ туации поиска. Рассмотрим предельные циклы и вычис­ лим потери на рысканье для алгоритмов, описанных в предыдущих трех параграфах, для случая, когда экстре­ мум не изменяет своего положения, т. е.

 

-Т7- = Т Г

= °-

(4Л.9)

1.

А л г о р и т м

с

п а р н ы м и

п р о б а м и

(§ 4.1).

Пусть выполняется условие (4.1.15),

при котором

рабочий шаг не делается. Тогда получаем цикл, показан­ ный на рис. 4.4.1, а, который будем называть циклом пер­ вого рода. Здесь система переходит последовательно в каждое из трех состояний: х, х g, х + g. Эти переходы обозначены стрелками и перенумерованы в порядке их

прохождения. Как видно, потери на рысканье в данном случае можно вычислить на базе одного цикла (Т* = £ц), разбивая интеграл (4.4.8) на три, так чтобы подынтеграль­ ные выражения были постоянными:

*П 2

Дц = у - [$ 1<?(* + *)-< П * +

цО

*П 2

Т

+

(* - е) - 04 * + J 1C(*) - <?'! <й] (4.4.Ю)

О

о

Здесь для простоты предполагается, что время запомина­ ния мало, система безынерционна и переход из одного со­ стояния в другое происходит мгновенно, т. е.

tal = ^пз = ^раб = £реш ~ 0.

(4.4.11),

В этом случае выражение для потерь на рысканье (4.4.10) для квадратичного объекта Q = к (х — я*)2 -f- Q* при­ нимает вид

Д„ = к Г(* - x -f + 2 -Î2. g»],

(4.4.12)

где <Ц1 = 2tni + Т. Здесь индексом 1 обозначен первый алгоритм поиска (с парными пробами). Как видно, потери на рысканье зависят от положения х предельного цикла, они минимальны при х = х*

оы

(4.4.13)

д тВг= _ ш ^ 2

и максимальны при | х х* \ — ^

(4 -4 - 1 4 >

Из (4.4.13) хорошо видно, что минимальные потери на рысканье пропорциональны квадрату величины пробного шага. Это означает, что для снижения потерь следует уменьшать величину пробного шага или увеличивать вре­ мя выдержки Т.

Так как значение х для предельного цикла, как пра­ вило, неизвестно, то естественно средние потери на рысканье получать из (4.4,12) путем осреднения по всем

возможным значениям х предельного цикла, т. е.

где пределы интегрирования взяты из условия (4.1.15). В результате получаем

 

 

 

=

2й: [

96fc2ga

+

(4.4.15)

Легко

заметить, что

всегда

имеют

место неравенства

n min

^

е

&ô2

,

Dmin

jjmax__

&ô2 , [>min

«Il

< . «11 =

4gA2g2

-+- « u

<.«11

— "îëÂV* -T « il •

 

 

 

 

 

 

 

 

 

(4.4.16)

Если неравенство (4.1.15) для квадратического объек­ та не выполняется, то предельный цикл включает в себя два рабочих шага и по времени соответствует двум рабо­ чим циклам. Этот предельный цикл показан на рис. 4.4.1, б, где стрелками изображена последовательность переходов в таком цикле. Будем называть его циклом второго рода. Длительность этого цикла равна 2f41, а потери на рыс­ канье после соответствующих преобразований принимают вид

Як =

(к* - **)* + ( * - * ’ + а)!] + 4 -ÎÏÏ- А , (4.4.17)

где х < . х*. Это выражение удобно привести к следу­ ющему:

# 1 2 = * [ ( * -

 

+

2

£2] + - у - [2 (х -

х*) +

а].

Теперь, сравнивая его с (4.4.12), получаем

 

 

# 1 2

— R u -)— 2~ [2 х*) -f- а\.

(4.4.18)

Определим условия, необходимые для # 12 <; Rn

при

х <; х*. Из (4.4.18) видно, что

 

 

 

=

# и

при х х* = ---- Y ,

 

 

# 1 2

> #

1 1

при

X — * • > ----

 

 

# 1 2

<1 # 1 1

при X — Ж* < ---- .

 

 

Это означает, что предельный цикл второго рода может в определенных условиях иметь потери на рысканье мень­ ше, чем предельный цикл первого рода в тех же условиях. Для этого достаточно, чтобы в исходном положении х цикла система была бы дальше от экстремума, чем в сме­ щенном х + а, т. е.

— J-.

(4.4.20)

Этот на первый взгляд парадоксальный результат легко объясняется, если учесть, что в процессе цикла второго

Рис. 4.4.2. Соотношение между потерями на рысканье циклов пер­ вого и второго рода алгоритма с парными пробами.

рода система в половине тактов приближается к экстре­ муму и тем самым снижает потери на рысканье. Если же неравенство (4.4.20) при æ < æ * не выполняется, то это означает, что система после рабочего шага удаляется от экстремума, что в половине тактов поиска увеличивает потери на рысканье. Это хорошо видно из рис. 4.4.2,

где приведены зависимости Дц и i?12 в функции х (i?12 — потери на рысканье цикла второго рода для х > ж*).

Таким образом, если в процессе циклического движе­ ния в районе цели рабочие шаги не совершаются, то это

выгодно лишь при |ж* — х\ <С В противном случае!

б.олее выгоден цикл с рабочими шагами. Переход на этот цикл возможен путем уменьшения параметра е* Жирной