Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
8
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

где klt fc2 О- Эта модель представляет co6oâ два разнонаклоненных отрезка прямых. Частным случаем этой модели являются равнонаклоненные отрезки

Q (х) = к \хх*\ Q*.

(3.1.11)

Здесь, как и выше, к, х* и Q* являются случайными ве­ личинами или функциями. Они и придают объекту ха­ рактер «черного ящика», т. е. системы с рядом неизвест­ ных свойств (например, неизвестных значений парамет­

ров

/с,

х* и (?*).

 

м о д е л ь

характери­

 

3.

К л ю в о о б р а з н а я

стики экстремального объекта показана на

рис. 3.1.4, в

и записывается аналитически

так:

 

 

 

 

Q (х) =

к \х x*\v +

Q*,

(3.1.12)

где

к^> 0, 0 << V < 1-

Эта модель

отличается характер­

ной формой в районе экстремума, напоминающей клюв птицы (отсюда и ее название). Наличие подобного «клю­ ва» требует определенных специальных усилий в процессе поиска экстремума. Отметим, что эта функция, будучи унимодальной (как и все предыдущие), не является вы­ пуклой.

4. П а р а б о л а q с т е п е н и

 

Q (х) = к \ х - х*|а -t- Q*.

(3.1.13)

Эта модель при q 0 обобщает предыдущие модели (см. рис. 3.1.4, г). Действительно, при q = 2 получаем квадра­ тичную модель (3.1.9), при q = 1 — кусочно-линейную модель (3.1.11), а при О <С q <. 1 — клювообразную. При О < q < 1 имеем не выпуклую функцию, а при q^> 1 — вогнутую. Величина q является мерой «тупизны» экстре­ мальной характеристики — чем больше g, тем более тупой экстремум имеет эта характеристика, и наоборот. Это хорошо видно из рис. 3.1.4, г.

Для моделирования изменчивости объекта необходи­ мо ввести модель дрейфа экстремальной характеристики. Вообще говоря, эта характеристика может изменяться лю­ бым образом Q = Q (х, t). Однако практика показывает, что наиболее важными с точки зрения поиска являются

дрейф двух параметров характеристики — экстремаль­ ного значения Q* и положения экстремума х*. Задание свойств изменения этих параметров во времени при сохра­ нении формы экстремальной характеристики и образует модель дрейфа:

Q *

(*) = h (*).

(3.1.14)

X*

(t) = /2 (t).

 

Функции fi (t) (i = 1,2) могут быть регулярными и слу­ чайными. Ниже будет рассматриваться лишь случай ли­ нейного дрейфа:

Q* (t) = Qa + bt,

(3.1.15)

х* (2) = х0 + et,

где скорости дрейфа б и с могут быть и положительными, и отрицательными. На рис. 3.1.5 показан пример линей­ ного дрейфа параболической характеристики.

Рис. 3.1.5. Пример линейного дрейфа экстремальной харак­ теристики.

Рассмотренные модели функций качества, разумеет­ ся, не исчерпывают всех возможных видов зависимости Q = Q (х). Однако они охватывают наиболее существен­ ные свойства этой функции с точки зрения поиска экстре­ мума, который будет рассмотрен ниже.

§3.2. Методы математического анализа

Вслучае, если функция качества Q = Q {х) является непрерывной выпуклой функцией с непрерывной произ­ водной, то для отыскания ее экстремума можно восполь­

зоваться известным в математическом анализе условием

4 г = °-

(З-2-1)

Заметим, что клювообразная функция не удовлетворяет условию непрерывности производной в экстремуме и, следовательно, экстремум объекта с клювообразной ха­ рактеристикой не может быть определен из этого условия. Таким образом, задача отыскания экстремума функции при умении вычислять ее производную сводится к опреде­ лению корня в общем случае трансцендентного уравне­ ния (3.2.1). Здесь следует различать два случая:

а) объект является очень сложным ящиком и, следо­ вательно, функция Q {х) задана в аналитическом виде; б) объект является «черным ящиком» и значения функ­ ции Q (а:) определяются лишь в результате измерения по­ казателя качества Q при заданном фиксированном зна­

чении параметра х.

Рассмотрим первый случай, когда функция Q (х) за­ дана аналитически. Тогда, дифференцируя Q (х), получаем

функцию

 

=

(3-2.2)

Приравнивая F (х) нулю, получаем уравнение, корень которого и определяет положение экстремума х*:

F (я*) = 0.

(3.2.3)

Это трансцендентноеуравнение можно решать различны­

ми способами.Среди

универсальных методов

решения

этой

задачи следует отметить методы касательных и

хорд [З.Ц.

 

 

 

 

 

 

Рассмотрим сначала метод касательных. Смысл этого

метода сводится к следующему.

 

В

исходной

точке

х0

определяется производная

dFlx)

I

т?>,

\

 

 

 

 

р (х0) и проводится касательная

 

 

JX—XQ

 

 

 

(*о) F (^о)*

(3.2.4)

 

 

Ух =

*о) F

которая аппроксимирует функцию F (х) в точке х0. При­ равнивая (3.2.4) нулю, получаем первое приближение для корня

х1 = х0 —

F (яо)

(3.2.5)

ТПхо)

В точке Хх определяется производная и аналогично полу­ чается второе приближение и т. д. (рис. 3.2.1). На г-мшаге этого процесса

/'

Xi* = X* i F (£{_])

(3.2.6)

Как легко видеть, для монотонной функции F (ж), для которой

ащп

F (дг) — F (zi)

 

 

ХйXI

 

= const при х1<^х2,

 

 

(3.2.7)

Рис. 3.2.1. К методу касательных.

процесс (3.2.6) сходится к решению задачи (3.2.3), т. е.

lim х\ = х*.

(3.2.8)

i-*o o

4

П р и м е р . Рассмотрим применение

метода каса­

тельных на параболическом объекте (3.1.9), для

которого

F (х) = 2к (х х*) и F' (я) =

2к.

На первом

же шаге

получаем из (3.2.5)

 

 

 

хх = xQ— 2k ( X Q

х * )

= X

 

2к

 

 

т. е. экстремум определяется за один шаг. Это легко объ­ яснить, так как производная квадратичной модели ли­ нейна и, следовательно, совпадает с касательной, что и обеспечивает Полученный эффект.

Можно сказать, что этот метод работает тем более эф­ фективно, чем ближе функция качества к квадратичной параболе.

Сформулируем условие сходимости метода. Это усло­ вие довольно естественно следует из чисто геометрическо­ го анализа (см. рис. 3.2.1). функция F (х) для сходимости должна быть строго возрастающей (или строго убываю­ щей) функцией и чтобы производная F' (х) нигде не была бы равной нулю — равенство нулю F' (х) исключает возможность пользования основной формулой (3.2.5). Теперь перенесем эти условия на функцию качества. Не­ трудно убедиться, что функция Q (х) должна быть строго

выпуклой, т. е. без линейных

участков, на

которых

F' (ж) =

0.

типа «черный

ящик»,

Если

оптимизируется объект

когда поиск опирается лишь на точечные замеры показа­ теля качества, метод касательных усложнится оценкой

производных

F {х) =

Q' (х)

и F’ (х) = Q" (х), которые

можно вычислять, например, следующим образом:

4§- «

F (*) =

+

g) Q (»—*>],

 

 

 

 

(3.2.9)

« > ’(*) = -5j r l Q { x +

2g) -

2<?(*) + Q ( x - 2 g%

где g — база оценки, т. е. расстояние между двумя заме­ рами функции качества. Здесь значком Д обозначена оцен­

ка, т. е. F есть «оценка F». Известно, что такого рода оцен­ ки очень чувствительны к ошибкам и неэффективны в об­ становке помех.

Резюмируем недостатки метода касательных, которые практически исключают его применение для систем эк­ стремального управления.

1. Метод работает лишь на строго выпуклых функциях качества (а это исключает его использование, например, для кусочно-линейных и клювообразных функций).

2. Для реализации метода необходимо оценивать вто­ рую производную (так как F' (я) = ^ j , что исключает

его применение в обстановке помех.

Более удобной модификацией метода касательных яв­ ляется метод хорд, для реализации которого не нужно оценивать вторую производную [3.1].

Выберем произвольно два состояния х01 и х02 и опреде­ лим F (х01) и F (х02) (рис. 3.2.2). Проведем через эти две

точки

прямую

 

 

 

 

 

F (г) =

[ f (хю) -

F (г01)] + F (*„),

(3.2.10)

которая пересекает ось

абсцисс в точке х1У для

которой

F (xj)

= 0. Решая это уравнение, получаем

 

 

Æl =

a?oi [/* (хра) —

F (arpi)]

(хог — х<н) F (xpi)

(3.2.11)

 

 

 

F (жоа) —

F (x0i)

 

Эта точка и является первым приближением корня урав­ нения (3.2.3):

х[ = х1.

(3.2.12)

Теперь, определяя значение F {х^) и проводя через точ­ ки 1 и 3 хорду, аналогично находим точку ее пересечения

Рис. 3.2.2. К методу хорд.

с осью абсцисс х2, которая является вторым приближением

х2 = х2. Далее, если F (х2) < 0,

то хорда проводится

через точки 2 и 4, а если F (х2) >

0 (именно этот случай

показан на рис. 3.2.2), то хорда стягивает точки 3 ж4. Пересечение этой хорды с осью абсцисс х3 дает третье при­

ближение х3 = х3 и т. д.

Интуитивно ясно (это можно доказать и строго), что такой процесс в определенных условиях приводит к точ­ ному значению корня, т. е. имеет место сходимость (3.2.8).

Метод хорд имеет уже более широкие возможности, чем метод касательных. Так, этот метод работает не

только для выпуклых функций. На рис. 3.2.3 показан пример работы метода хорд прп определении экстремума клювообразной функции качества. Однако при оптимиза­ ции невыпуклых функций необходимо соблюдать следующее

Рис. 3.2.3. Работа метода хорд на шновообразном объекте.

условие: ординаты пачальных точек должпы иметь раз­ личные знаки, т. е.

f ( % ) - f W < 0 .

(3.2.13)

В противном случае для невыпуклых функций метод не сходится.

При оптимизации объектов типа «черный ящик» оцен­ ку можно производить обычным образом (3.2.9).

Таким образом, метод хорд имеет ряд преимуществ перед методом касательных. Однако и он не может быть рекомендован как универсальный алгоритм экстремаль­ ного управления, так как он требует численной оценки производной показателя качества, что значительно сни­ жает работоспособность метода, особенно в обстановке помех.

Резюмируем недостатки рассмотренных методов.

1.Необходимость вычисления производных показате­ ля качества.

2.Неучет ограничений S: xŒ S.

3.Неучет дрейфа экстремума, т. е. случая, когда х* =

=/ (<), ради преодоления которого и создаются системы экстремального регулирования.

Именно эти обстоятельства заставляют обращаться к другим поисковым методам определения экстремума, ко­ торые рассмотрены ниже.

§3.3. Метод дихотомии

Этот метод отыскания экстремума применим уже для более широкого класса функций, а именно класса унимо­ дальных функций при отсутствии помех [3.2]. Идея мето­ да проста и прозрачна — делить зону, где расположен экстремум, пополам и отбрасывать часть, где экстремума заведомо быть не может. (Дихотомия — греческое слово, обозначающее последовательное деление целого на две части, затем каждой части снова на две части и т. д.)

Пусть отрезок AB = S (рис. 3.3.1) содержит внутри себя оптимальное значение параметра х* А < х * <С.В.

На первом шаге разделим этот промежуток пополам

« А -)- В „ „

точкой^ = — g— ’В Районе которой сделаем два измерения

показателя качества с целью выяснения, справа или сле­ ва от точки хх находится экстремум. Для этого достаточно

определить показатель качества в точках хх+ у , отстоя­

щих друг от друга на расстоянии е. Это расстояние дол­ жно быть возможно малым, но ровно настолько, чтобы знак разности

&Qi=

1 + -|-j — Q [Xi ----(3.3.1)

сохранял информацию о положении экстремума, т. е. в силу унимодальности функции Q (х)

х* < хг, если AÇj ]> О, х* > Хц если AQx < 0.

(При очень малом значении е знак AQ может измениться за счет неизбежных помех, возникающих при измерении показателя качества.)

Таким образом, в результате двух произведенных за­

меров промежуток,

где содержится экстремум, сократил­

1

 

ся вдвое

 

= 4 - * (3-3-3)

-=ггЩ>0

W T

в

 

з

г)

Рис. 3.3.1. К методу дихотомии.

Отброшенная часть отрез­ ка S на рис. 3.3.1, а за­ штрихована.

Следующая пара изме­ рений производится в райо­ не середины оставшегося

(

A

 

-f- xi \

отрезка I я2 =

^— 1, т.е.

в точках х = я21

I 8

Ь “2">ит. Д-

Аналогично производятся последующие шаги поиска до тех пор, пока на к-м шаге после 2к измерений показателя качества от­ резок, где находится экст­ ремум

s t =

(3.3.4)

не станет меньше или равен б , т . е. Sk ^ е. После этого дальнейшие измерения теряют смысл, так как внутри отрезка, где расположен экстремум, замеры функции ка­ чества отличаются лишь на величину помехи, возникаю­ щей в процессе измерений.

Как видно, метод дихотомии позволяет довольно быст­ ро попадать в район экстремума. Так, для определения

положения экстремума с точностью в 1 % от

исходного промежутка S нужно сделать всего 14 измере­ ний показателя качества (это 7 шагов дихотомии), так как

S

S

6 =

S

. Это во много

раз

лучше, чем

2*

-j2g" <

100

метод

перебора

 

'

v

101

измерение.

 

(§j 3.1),^

требующий

§ 3.4. Метод Кифера

/г.'Г? 11

С ■/ C f * J ) >

 

 

Рассмотренный выше метод дихотомии давал двукрат­ ное уменьшение зоны неопределенности, где расположен экстремум, на два замера показателя качества.

Естественно задать вопрос: а нельзя ли построить ал­ горитм более эффективный, чем дихотомия? Или самый эффективный?

Прежде чем сформулировать эту задачу формально, введем некоторые понятия [3.2].

Под интервалом (зоной) неопределенности будем под­ разумевать отрезок оси х , где расположен экстремум х* (внутри или на его краях).

П р и м е р 1. Пусть Æj, х2,. ., x h — точки, где изме­ рен показатель качества внутри исходного отрезка S = = АВ (А и В — по-прежнему граничные точки). Пусть наименьшее значение показателя качества из измеренных равно.

<?(*»)= min {<?(*,)}.

Тогда интервалом неопределенности lh будет отрезок

 

[Zi-1,z i+1] дйя

l < i < & ,

h

[А,х2]

для

i = l ,

[жк-!, В]

для

i = k.

 

Действительно, в силу унимодальности функции ее эк­ стремум не может выходить за указанные пределы.

П р и м е р 2. В методе дихотомии интервал неопре­ деленности уменьшался на каждые два измерения в два

раза, т. е. на одно измерение в YH раз, т. е. /к+1 = -j^=- ,

где к — число измерений показателя качества. Для ди­ хотомии физический смысл имеют лишь четные к.

Рассмотрим теперь задачу о максимальном уменьше­ нии интервала неопределенности на каждый замер пока­ зателя качества. Пусть на к-м шаге поиска интервал не­ определенности имел вид, показанный на рис. 3.4. 1, а.

Здесь х/с — положение минимума на к-м шаге поиска. Задача состоит в том, чтобы внутри этого промежутка

так расположить одно измерение (эксперимент), чтобы после осуществления этого измерения последующее новое