Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
8
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

значение интервала неопределенности 4+i было бы мини­ мальным, т. е.

h*i = min.

(3.4.1)

Однако, как легко заметить, величина минимума за­ висит не только от расположения будущего эксперимента на интервале неопределенности, но и от результата изме­ рения показателя качества. Действительно (см. рис. 3.4.1),

если Q (xk+1) < Q (xt) (рис. 3.4.1,

б),

где а*+1

— положе­

 

 

ние

к +

1-го эксперимента, то

 

 

новый

интервал

неопределен­

 

 

ности равен 1ц+1 = zh. В против­

 

 

ном

случае

(рис. 3.4.1, в)

 

 

h+i = hi vk‘ Таким образом,

 

 

результат

будет

различным в

 

 

зависимости от поведения функ­

 

 

ции

качества Q (х). Но ведь

 

 

Q (х)

неизвестна!

(Иначе поиск

 

 

не имел бы смысла.) Получен­

 

 

ное

противоречие

можно раз­

 

 

решить,

например, так: рассчи­

 

 

тывать

 

на

самый

худший

 

 

(в смысле

минимизации интер­

Рис. 3.4.1. Сокращение ин­

вала неопределенности) случай.

тервала

неопределенности

Будем

различать

два слу­

в зависимости от результа­

чая — два состояния природы.

тов

ПрИ V]i < Zfc.

В первом случае (Qj) результат

 

 

замера

превышает наименьшее

измеренное значение Q (х*) и,

наоборот, во втором слу­

чае (Q2)

Qi : Q (Æ/C+1)

Q (#K),

|

 

 

 

 

 

 

(3.4.2)

 

: Q (% i)<

Q (a£).

J

 

 

 

 

 

 

Теперь задачу (3.4.1) можно сформулировать вполне строго

h+i = h+i (vk, Q) —> min max,

(3.4.3)

v k

n

 

T . e. нужно найти такое расположение очередного экспе­ римента (vh), при котором даже при наихудшем состоянии

природы (max) интервал неопределенности был бы мини-

мален

 

п

 

 

 

 

 

 

 

 

 

 

 

(min).

 

 

 

 

 

 

 

 

 

 

 

 

 

этой задачи,

прежде

всего,

следует

Для решения

построить

функцию

4+i — 4+1

(v/i)

Для

двух

состоя­

ний

и Q2.

 

 

 

 

 

 

 

 

 

 

 

Такая постановка задачи называется минимаксной.

Она отличается пессимистичностью, так как

расчет ведет­

ся на самую скверную ситуацию,

 

 

 

 

 

 

 

хотя на практике такого ие быва­

 

 

 

 

 

 

 

ет, если, разумеется, выбор

ситуа­

 

— ■4

 

 

1хмн

 

ции не определяет Ваш против­

üA

 

л

 

 

 

ник,

как

в теории

антагонисти­ Н —

-----------ч

 

 

ческих игр. Одиако в данной книге

 

 

х?

 

 

 

рассматривается задача оптимиза­

 

 

 

 

 

ции неактивных систем и поэтому *

 

 

 

1

 

 

расчет на самое

плохое состояние

 

<j>

 

-4*-

 

природы ие очень оправдай. Одна­

 

 

 

 

 

ко действуя минимаксным

обра­

 

 

ü ____ ,ьАН

«

зом, мы всегда получаем гаран­

 

 

тированный результат.

 

 

L

Ч+/

 

Г

 

 

Определим функцию Zk+1 (vh, Q).

Рис. 3.4.2.

Сокращение

Здесь возможны два случая рас­

интервала

неопределен­

положения эксперимента;

Полу­

ности в зависимое!и

от

1. vh < izh (см/'рис. 3.4.1).

результатов при vk>

zк.

чаем, очевидно,

 

lk — vk при

Q == Qi,

 

 

 

 

 

 

 

h+i =

 

 

 

(3.4.4)

 

 

zk

при Q = ^ 2-

 

 

 

 

 

 

 

 

 

 

I

> Zh (рис. 3.4.2),

 

 

 

 

 

 

 

 

 

 

 

г

J

1

при Q = Qi,

 

 

 

(3.4.5)

 

 

 

 

 

 

 

 

 

 

 

h+i \

при Q = Q..

 

 

 

 

 

 

 

 

 

 

 

 

 

Графики этих зависимостей показаны иа рис. 3.4.3. Те­ перь нетрудно определить

m&xlk+1(vk,Q).

(3.4.6)

о

 

Эта зависимость показана иа рис. 3.4.4. Оиа соответствует наибольшим значениям функций (3.4.4) и (3.4.5).

Теперь можно решать поставленную задачу. Как вид­ но, очередной эксперимент следует располагать в пре­ делах

Z h < v h * ^ lh — zjt

(3.4.7).

(эта зона на рис. 3.4.4 заштрихована). При этом гаранти­ рованное значение интервала неопределенности будет равно

J/c+1 = h — Zft,

(3.4.8)

т. е. он равен большему отрезку.

Теперь, пользуясь свободой, предоставляемой неравен­ ством (3.4.7), можно сформулировать дополнительный

Рис. 3.4.3.

Зависимость нового

Рис. 3.4.4. Зависимость мак­

интервала

неопределенности от

симального интервала неопре­

расположения эксперимента и его

деленности от расположения

результатов.

эксперимента.

критерий выбора положения нового эксперимента. В ка­ честве такого критерия естественно предложить критерий максимальной удаленности экспериментов. В обоих слу­ чаях (см. рис. 3.4.1) новый эксперимент хк+1 должен быть

максимально удален от

хк. Это соображение заставляет

в промежутке (3.4.7) выбрать крайнюю правую точку

uh

= lh — zh.

(3.4.9)

Это и есть минимаксное правило (оптимальный алго­ ритм Кифера). Оно формулируется следующим образом: новый эксперимент на интервале неопределенности сле­ дует располагать симметрично (см. рис. 3.4.2) экстре-

мальному (zft). Это показано па рис. 3.4.5, где черной точ­

кой

изображено

положение иаилучшего

эксперимента

из

имеющихся,

а кружком — положение

следующего

эксперимента.

 

 

Следовательно, процесс поиска целиком зависит от выбора начального эксперимента, т. е. от значения zt. Как определить эту величину? Для этого нужно знать, как изменяется интервал неопре­

деленности от эксперимента к эк­

;

1

_

сперименту. Новый интервал неоп­

°А

À_____

ределенности, как сказано выше,

1

i

 

i

 

равен большему отрезку

старого,

—4 —

 

который получается делением его

Рис. 3.4.5. К

определе­

новым экспериментом. Отсюда по­

лучаем соотношение:

 

нию положения очеред­

 

ного эксперимента мето­

lh = h+i + h+2-

(3.4.10)

дом Кифера.

 

 

 

Воспользуемся этим выражением для определения поло­ жения первого эксперимента, которое необходимо для запуска процесса поиска. Начнем с конца. Пусть в нашем распоряжении всего имеется N экспериментов. Рассмот­ рим интервал неопределенно­ сти перед последним, N-м, экспериментом (рис. 3.4.6).

Очевидно, что этот экспери­ мент хн должен отстоять от

Рис. 3.4.6. К определению по­ ложения исходного экспери­ мента.

наилучшего предыдущего хN-\ на расстоянии не менее чем интервал нечувствительности в, т. е.

XN— Æw-i = 8. (3.4.11)

Одновременно в соответствии с алгоритмом поиска (3.4.8) должно выполняться условие

I N = V N - I = ^v-i — Ziv-i?

(3.4.12)

откуда с учетом предыдущего выражения (3.4.11) сразу получаем соотношение между интервалами неопределен­ ности на последнем и предпоследнем шаге

Теперь, располагая выражением (3.4.10), можно последо­ вательно «спускаться» вниз к первому эксперименту:

IN - 2 = IN - I + I N = v 8,

 

IN -s =

IN ~2 Ч- IN- i =

b lN — 2e,

(3.4.14)

IN—4=

^N-з Ч- ^N-2 =

— 3e.

 

Легко заметить, что каждое последующее выражение по­ лучается как сумма двух предыдущих и, следовательно, числовые коэффициенты при lN и в представляют собой

так называемые числа Фибоначчи Ft

(i = 0, 1,

.),

которые образуются следующим образом:

 

I

1

для i =

0,1,

 

Fi ~ I Л -1 + Fi- 2

Для i >

1,

 

т. е. каждое последующее число последовательности Фибо­ наччи равно сумме двух предыдущих чисел. Первые 15 чисел этой последовательности показаны в таблице 2 .

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

2

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

1

1

2

3

5

8

13

21

34

55

89

144

233

377

610

987

(в связи с этим метод Кифера иногда называют методом Фибоначчи). Теперь, воспользовавшись числами Фибо­ наччи на р-м шаге от конца, получаем

IN-р — F р+1IN Fp^e.

(3.4.16)

При р — N — 1 мы придем к исходному интервалу неопределенности 1г:

h = FNIN FN-28,

(3.4.17)

откуда легко найти окончательный интервал неопределен­ ности, который остается после п шагов поиска:

в. (3.4.18)

Теперь определим положение первого эксперимента zx =

— 12. Из (3.4.16) получаем при р = N — 2

l2 — FN-ilpf Fjv-3e.

(3.4.19)

Подставляя сюда значение lN из (3.4.18), получаем после необходимых преобразований

h __ F N - 2

!

( — l ) w

e

(3.4.20)

h ~

F N

+

F N

' h

при помощи которого

определяется

положение первого

эксперимента zx = 1%. Расчеты показывают, что метод Ки­ фера эффективнее дихотомии. Так, для интервала неопре­ деленности, равного 2е (это эквивалентно точности е),

и при

6

1

 

= -щ-метод Кифера требует N æ 10, а для ме­

тода дихотомии в этих же условиях необходимо N = 14. Обратим внимание па условия, в которых можно при­ менять этот метод. Для этого, прежде всего, необходимо отсутствие помех и дрейфа экстремума. Указанные усло­ вия крайне редко встречаются при оптимизации реальных объектов и поэтому метод Кифера довольно редко приме­ няется в практических задачах. Как всякий оптимальный метод он скорее служит идеалом, к которому следует стре­ миться и который, как всякий идеал, увы, недостижим.

§ 3.5. Метод золотого сечения

Поиск по методу Кифера, как видно, требует точного задания числа экспериментов, которым «располагает» алгоритм для отыскания экстремума. Однако часто заранее не известно, сколько экспериментов будет в его распоряжении, и остановка процесса связывается не с величиной зоны нечувствительности, а с другим кри­ терием. В этом случае воспользоваться методом Кифера нельзя, так как неизвестно расположение первого экспе­ римента (3.4.20), которое зависит от числа N. Именно для такой ситуации удобно применение метода золотого сечения, смысл которого состоит в следующем.

Будем каждый последующий эксперимент хк+х, так же как в предыдущем методе, располагать так, чтобы мини­ мизировать гарантированный интервал неопределеннос­ ти. В этом случае между интервалами неопределенности

на следующих друг за другом шагах существует уже из­ вестное соотношение (3.4.10)

hi-1 = lh

hi+1-

(3.5.1)

Так как неизвестно, на каком

этапе

закончится поиск,

то естественно потребовать, чтобы отношение интервалов неопределенностей на двух следующих друг за другом шагах поиска было постоянным, т. е.

h -л

х = const (/с = 1 ,2 ,3 ,.,.).

(3.5.2)

—j— =

h

Для определения х воспользуемся соотношением (3.5.1). Подставляя его в (3.5.2), получаем

1+

h+i = т.

(3.5.3)

h

 

Но из (3.5.2) -j-£—= т, следовательно, подставляя это вы- ч+1

ражение в (3.5.3), можно после элементарных преобразо­ ваний записать уравнение относительно т:

т2 — т - 1 = 0.

(3.5.4)

Положительный корень этого уравнения (отрицательный не имеет смысла) равен

т = i + VJ L ~ 1,618.

(3.5.5)

Таким образом, в соответствии с предлагаемым методом каждый последующий эксперимент x h+1, так же как при методе Кифера, располагается на интервале неопределен­

ности симметрично наилучшему из предыдущих а£. Однако место первого эксперимента определяется значи­ тельно проще:

Zl = Z2 = iL .

(3.5.6)

После /с экспериментов интервал неопределенности равен

h = гк-1

(3.5.7)

Как видно, этот интервал довольно быстро уменьшается. Так, для решения задачи с точностью не менее чем 1%

1ашГ?л+,
1л-,
■Л1-1

необходимо сделать число экспериментов, равное га = 11. Это больше, чем при поиске методом Кифера, но меньше, чем при дихотомии.

Теперь поясним, почему этот метод назван методом золотого сечения. В геометрии золотым сечением назы­ вается такое деление отрезка на две неравные части, при котором отношение всего отрезка к его большей части рав­ но отношению большей части к меньшей. На рис. 3.5.1 показан интервал неопределенно­ сти для рассматриваемого метода, где проставлены значения длин отрезков. Наглядно видно, что в этом случае отрезок разделен по золотому сечению, т. е.

-lk— ==

j k .

(3.5.8) Рис. 3.5.1. К методу зо-

llc

lk+1

лотого сечения.

Сопоставление рассмотренного метода поиска и метода Кифера показывает, что отношение интервалов не­ определенностей этих методов после одинакового числа экспериментов в пределе при к -*■ оо равно

1 Г = - й г ~ 1>17'

(3-5-9)

т. е. метод золотого сечения на 17% уступает методу Кифера.

Если для отыскания зоны экстремума имеется боль­ шое число экспериментов (например, не меньше пяти), то, как показывают расчеты, расположение первого эк­ сперимента zx для обоих методов весьма близко друг к другу. Это означает, что для определения zx при методе Кифера можно воспользоваться простым выражением (3.5.6), которое получено для метода золотого сечения.

В заключение отметим, что этот метод имеет те же недо­ статки, что и предыдущий.

В предыдущей главе рассмотрены эффективные мето­ ды определения положения экстремума функции одной переменной. Однако эти методы обладают тремя недостат­ ками: 1) они сложны для аппаратурной реализации; 2) не работают в обстановке помех; 3) не предполагают дрей­ фа экстремума, т. е. рассчитаны на однократное определе­ ние положения экстремума.

Перечисленные недостатки значительно сужают об­ ласть применения этих методов и не позволяют исполь­ зовать их в качестве алгоритмов экстремального управле­ ния, когда указанные факторы играют определяющую роль.

Именно для этого случая предложены алгоритмы ша­ гового поиска, которые и рассматриваются ниже. Они просты в аппаратурной реализации и способны нахо­ дить и отслеживать блуждающий экстремум функции качества.

§ 4 .1 . Алгоритм с парными пробами

Этот алгоритм отличается тем, что перед реализацией рабочего шага делаются пробные измерения показателя качества в двух соседних точках х + g, отстоящих друг от друга на расстоянии 2g, не меньшем, чем интервал не­ чувствительности е ^ 2g. Два измерения показателя ка­ чества дают возможность определить, с какой стороны рас­ положен экстремум и организовать движение к экстре­ муму. Для этого достаточно считать функцию качества унимодальной.

В случае минимизации алгоритм поиска с парными пробами может быть записан в следующей форме:

£i+i = Xi — a sign [<? (xt + g) + Q (xi — g)], (4.1.1)

где Xi — положение объекта на i-м этапе поиска, а — ве­ личина рабочего шага по управляемому параметру, g

величина пробного шага, sign — функция знака;

(

+ 1

при

у >

0,

 

signg = j

0

при

у =

0,

(4.1.2)

{

— 1

при

у < 0

 

(рис. 4.1.1, а).

Однако такую функциюпрактически реализовать аппаратурно нельзя (для этого, как легко заметить, понадобится создать усилитель с бесконечным коэффициентом усиления).

ЩЦ

 

 

т *

 

 

 

 

*/•

 

0

i

 

&

в

-1

 

 

 

 

 

i./

 

в)

 

 

 

 

Рис. 4.1.1. Функция

знака (а)

и функция поляризованного

 

 

реле (б).

 

В действительности аппаратурио реализуется релейная

функция вида

+

1

при у > б ,

 

 

 

Р ( У ) =

 

0

при | у | < ô,

(4.1.3)

 

— 1 при у < — Ô.

 

Эта функция описывает работу поляризованного реле с зоной нечувствительности (рис. 4.1.1, б). Как видно, в пределе при Ô 0, выражение (4.1.3) преобразуется к виду (4.1.2), т. е.

lim F (у) = sign у.

(4.1.4)

Б-Ч)

 

Работа рассматриваемого алгоритма происходит по схеме (программе), представленной на рис. 4.1.2. Здесь каждый прямоугольник обозначает определенный оператор, т. е. такую инструкцию, выполнение которой необходимо для функционирования алгоритма поиска. Так, операторами «х + g» обозначается изменение значения управляемого параметра с х на х + g. Операторы «Ç + g)» выражают