Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
8
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

Здесь же на рис. 6.1.10, б показан образующийся при этом предельный цикл. Определим основные параметры этого цикла.

Амплитуда предельного цикла ух в случае, если объект является параболой q-й степени, получается из решения следующего очевидного урав­

нения:

kyl = е.

Периодпредельного цикла

- ( - г Г (вл-21) Потери на рысканье

 

для этого алгоритма поиска

 

не зависят от скорости а.

 

Часто это бывает очень удоб­

 

но , так как дает

свободу в

Рис. 6.1.10. Работа системы

выборе параметра

без изме­

поиска с запоминанием экстре­

нения потерь на

рысканье.

мума (а) и предельный цикл (б) .

В заключение рассмотре­

ния этого цикла алгоритмов поиска следует отметить, что потери на поиск для них одинаковы и равны

К = 4 “

(6.1.23)

Г. Поиск с временной селекцией. Рассмотренные выше алгоритмы поиска были построены таким образом, чтобы определять момент прохождения экстремума, после чего от­ давать команду на реверс. Как было отмечено, все эти алго­ ритмы обладали плохими помехозащитными свойствами.

Схема управления с временной селекцией, которая будет рассмотрена в этом пункте, обладает высокой по­ мехоустойчивостью и может быть рекомендована при ра­ боте в обстановке помех.

Идея этого метода поиска сводится к следующему. Команда на реверс исполнительного механизма подается

независимо от положения экстремума. Момент реверса определяется так, что при уменьшении показателя ка­ чества, т. е. при движении системы к экстремуму, команда на реверс несколько задерживается. При увели­ чении же показателя качества, наоборот, команда реверса

Рис. 6.1.11. Блок-схема управляющего устройства поиска с времеенбй селекцией.

отдается несколько раньше. Таким образом создается преимущество для движения к экстремуму и система в среднем продвигается к цели.

Блок-схема управляющего устройства, реализующего этот алгоритм, показана на рис. 6.1.11. Здесь релейный элемент РЭ имеет гистерезис и описывается следующим выражением:

 

с

при

и <0,1

если

и)>0,

V{u) =

d

при

tt^>ô,j

с

при

и < 0,1

 

(6.1.24)

 

если

й < 0 ,

 

. — d

при

u]>0,J

где параметры с^>0,

d >

0 и Ô

0, причем Ô — гистере­

зис релейного элемента.

Выход этого релейного элемента интегрируется (1/р) и, вычитаясь из Q, поступает снова на его вход. Эта цепь описывается следующим дифференциальным уравнением:

*L = V(Ç _rù.

(6,1.25)

Рассмотрим сначала случай -^Я* = 0, т. a.

Q = const.

Как нетрудно заметить* решением этого уравнения будет

«пила», показанная на рис. 6.1.12, а. Период этой пилы будет равен

Т = ô l ±

l .

(6.1.26)

 

са

 

Пусть теперь Q = const =j=0. В этом случав получаем

d +

c

 

 

Ti = à (d+ Q)(C_Q)

(« = 1,2).

(6.1.27)

Здесь i = 1 соответствует

Ç >0,

a i= 2 — <?<0. При этом

для того, чтобы

необходимо выполнение усло­

вия c^>d.

 

 

 

На рис. 6.1.12, б показаны оба случая, где наглядно

видно, что период Т уменьшается при Q

0 и увеличива­

ется при Q 0, т. е. величина

Ti несет

информацию о

Рис. 6.1.12. Работа поиска с временной селекцией: a)~Q = 0,

б) Q Ф 0 (обратная связь разомкнута), в) поиск с временной селекцией.

производной Q. Воспользуемся этим для синтеза алгорит­ ма экстремального управления.

Прежде всего, определим условия, необходимые для

выполнения сказанного. При Q ]> 0, для того чтобы время Тх было положительным, как видно из (6.1.26) и (6.1.27),

необходимо иметь с Q. При Q <[ 0, для того чтобы Т2 было положительным, необходимо выполнение неравен­

ства d \Q\. Следовательно, для «нормального» функцио­ нирования этой системы следует выполнять условия:

Çmax С,

(?min — dm

Заметим, однако, что нарушение этих условии лишь усложняет анализ, но не нарушает работы поиска (см., например, рис 6.1.136).

Если теперь реверс исполнительного механизма про­ изводить в момент Q (t) = ii, то, как легко убедиться, объект будет в среднем оптимизироваться. Действитель­

но, при Q^> 0 время движения системы Тг будет меньше,

чем при Q < 0. А так как абсолютное значение скорости изменения управляемого параметра одинаково в обоих направлениях |£| = а, то за два цикла поиска система продвинется к цели х* на величину

Да: = (Т2— 7i) а

или

2 ô(c« — d»)Q

(6.1.29)

- (da- Q a)(c*-Ç*) *

Здесь предполагается, что за время Тх -+• Тг величина

|(?| = const, т. е. модуль скорости возрастания показате­ ля качества равен модулю скорости его уменьшения. На рис. 6.1.12, в для иллюстрации показан процесс оптими­

зации при |Ç| = const. Наглядно видно, что значение Q в процессе поиска в среднем уменьшается, что и обеспе­ чивает работоспособность рассматриваемого алгоритма.

Определим среднюю за два цикла скорость движения системы к экстремуму. Она равна

dx _

Дж _

d)Q

~dt~ ~

'1\+ Гг

c d - Q 2 '

Вводя у — х х*, получаем для квадратичного объек­ та Q = ky* Q* дифференциальное уравнение осредненного движения:

d y _

2к (с — d) ay

(6.1.31)

Tt

cd — 4A2e*y8

Интегрируя это уравнение, получаем выражение, опре­ деляющее среднее положение системы у в момент времени U

cdIn | j - 2к2а2 (у2- уа) - 2 (с - d) kat = 0,

(6.1.32)

где Уо — У (0) — начальное положение системы относитель­ но экстремума у = 0.

Рис. 6.1.14. Предельный цикл поиска с временной ' селекцией.

Из (6.1.31) хорошо видно, что при cd^> Q2 стационар­ ное решение при f —> оо устойчиво и равно

у (оо) = 0,

(6.1.33)

т. е. в результате работы такого поиска система в среднем в пределе найдет экстремум (у* = 0).

Рис. 6.1.13. Работа алгоритма поиска с временной селекцией на кусочно-линейном объекте.

Рассмотрим работу этого алгоритма при оптимизации кусочно-линейного объекта. На рис. 6.1.13 показаны два примера оптимизации при различных значениях па­ раметра d (скорости уменьшения величины т] (i)). Здесь пунктиром обозначена функция

Q (х) Ч" б.

Различный характер поведения поиска на этом рисунке связан, прежде всего, соотноше­ нием между парамет­ ром d поиска и парамет­ ромк объекта. При d<^k, как видно, поиск имеет рыскающий характёр.

Исследуем теперь предельный цикл для симметричной характеристики объекта. На рис. 6.1.14 показан предель­ ный цикл для параболического объекта.

Для простоты рассмотрим случай очень большого зна­ чения параметра с, т. е. с^> d. (Этот случай изображен на рис. 6.1.14.) Определим параметры предельного цикла.

Амплитуда его определяется из прямоугольного треу­ гольника АВС

(6.1.34)

Период предельного цикла

(6.1.35)

a d *

Как легко заметить, предельный цикл для этого алгорит­ ма поиска не зависит от характеристики объекта. Это важное обстоятельство позволяет применять рассмотрен­ ный алгоритм поиска для объектов с изменяющейся фор­ мой характеристики. Предельный цикл при этом будет неизменным.

§ 6.2. Синхронное детектирование

Рассмотренные в предыдушем параграфе алгоритмы поиска с реверсом (кроме последнего) отличались тем, что при их помощи организовывалось движение системы к экстремуму по принципу: если не так, то иначе (наоборот), т. е. если система не оптимизируется, то нужно реверси­ ровать исполнительный механизм. Такая стратегия поведения особенно удобна для случая одной перемен­ ной, когда реверс всегда приводит к желаемому результату.

Однако подобная стратегия поиска далеко не един­ ственно возможная. Можно попытаться оценить произ­ водную dQ/dx, знак которой несет информацию о положе­ нии экстремума. Действительно для случая минимума в точке х* имеет место для унимодальной дифференцируемой функции следующее очевидное соотношение:

(6.2.1)

которое позволяет организовать движение к экстремуму,

располагая оценкой производной экстремальной харак­ теристики объекта.

Таким образом, задача экстремального управления может быть сведена к задаче эффективной оценки произ­ водной dQ/dt. Одним из наиболее распространенных спо­ собов определения производной непрерывных объектов является синхронное детектирование, которое и будет рассмотрено ниже.

Идея синхронного детектора заключается в следующем. На вход объекта накладывается незначительное возму­ щение /(f), изменяющееся во времени. Это возмущение, пройдя через объект, уже несет информацию об объекте.

Рис. 6.2.1. Блок-схема применения синхронного детектирования (к оценке производной dQ/dx характеристики [объекта.

Если теперь вычислить произведение выхода объекта на это возмущение, то, как будет показано ниже, резуль­ тат в среднем будет пропорционален наклону характерис­ тики объекта, т. е. пропорционален dQldx, что и требу­ ется для организации поиска экстремума.

Блок-схема устройства для определения производной dQldx методом синхронного детектирования показана на рис. 6.2.1. Здесь на вход экстремального объекта пода­ ется сумма х + /(f). Выход объекта Q — Q [х + /(0 1 умножается на / (f) и осредняется фильтром Ф, который реализует операцию интегрирования на базе Т:

т

£ = - ^ 4 ( f ) e Z f .

(6.2.2)

О

 

В качестве модулирующего сигнала / (f) можно выб­ рать как регулярную, так и случайную функции времени.

Относительно этой функции будем предполагать лишь следующее: ___

а) ее среднее значение / (t) равно нулю (напомним, что черта сверху обозначает операцию осреднения), т. е.

 

т

 

Щ = П т

4 - ^ f(t) dt = 0;

(6.2.3)

б) средний квадрат

этой функции р (t) достаточно

Р (0 = lim

оо.

(6.2.4)

Т-*ов 1 J

Модулирующая функция / (t) может при этом иметь как регулярный (например, гармонический), так и слу­ чайный характер.

Рассмотрим отдельно оба случая.

А. Регулярная модуляция. Пусть / (t) является регу­ лярным периодическим процессом. Рассмотрим сначала простейший случай гармонического возбуждения [6.4]:

 

 

f (t) — g sin (Of,

(6.2.5)

где g >

0 достаточно мало. В этом случае оба условия

(6.2.3)

и (6.2.4) удовлетворяются. Рассмотрим прйзведе-

ние А (см. рис.

6.2.1)

 

 

А =

Q (æi + gsin <ùt) g sin<ùt.

(6.2.6)

Предполагая, что характеристика объекта Q (х) является

достаточно гладкой функцией, ее можно

разложить в

степенной ряд и ограничиться первыми членами разложе­ ния

Q + а) = Q(x) +

+ у

• • •

(6.2.7)

В данном случав модуляция

а = g sin Ш предполагает­

ся малой, и, следовательно, в выражении (6.2.7) можно пренебречь членом с а2. В результате получаем

Q (х + g sin ~ Q (х) + S sia cof ^ .

Теперь, подставляя это выражение в (6.2.6) и осредняя его по (6.2.2), приходим к следующему выражению,

характеризующему выход фильтра Ф (см. рис. 6.2.1),

В — gQ (х) sin (ùt -f g2 sin2 cat ^ ,

где

т

sin at = y - ^ sin (ùt dt,

 

о

 

T

sin2 (ùt =

^ sin2 (ùt dt.

 

о

Здесь —знак оценки на конечном интервале Т. Предполагая, что время осреднения Т достаточно ве­

лико, получаем

--£---

---£---

J

,

sin (ùt ж 0,

sin2 (of Ж у

что дает право записать

(6-2.8)

Это означает, что сигнал на выходе фильтра Ф пропор­ ционален наклону характеристики, что и требовалось доказать.

Нужно обратить внимание на то, что полученная оцен­ ка (6.2.8) не зависит от частоты возбуждения со. Следова­ тельно значение со может выбираться произвольно, но не слишком малым, чтобы за время осреднения Т в форму­ ле (6.2.2) прошло бы несколько периодов модуляции /(О , т. е.

Г > £ ,

(6.2.9)

что гарантирует точность. Это требование определяет пре­ делы выбираемых значений параметров возбуждения со и осреднения ^.Строгое равенство в (6.2.8) будет при саГ—>• оо.

Проиллюстрируем процесс определения производной геометрически. На рис. 6.2.2 показан процесс про­

хождения гармонического колебания возбуждения / (t) через экстремальный объект. Если x<jc*yчто соответствует кривой 1 на рис. 6.2.2, то выходное колебание

$ Ô.2]

 

 

 

 

Q (х + / (®)) находится в противофазе

с возбуждением

х (t). При этом произведение / (£)*(?

(£)], как видно

из рисунка, имеет всегда отрицательный знак. При х

х*

(з® ^

Фазы

колебаний/ (t) и Q [х + / (*)] совпадают

и,

следовательно,

их произведение имеет

положительный

Рис. 6.2.2. К

процессу

синхронного детектирования.

знак (см. кривые 2 на рисунке). Если же х = х* (кривая S),

т. е. объект находится в экстремуме, то выход

объекта

дает удвоенную

частоту,

произведение которой

на мо­

дулирующее воздействие / (£) в среднем дает нуль в силу ортогональности:

sin сùt cos 2<ùt = 0.

Таким образом, указанное подтверждает и иллюстрирует геометрический вывод о том, что выход синхронного детектора может служить мерой наклона характеристики объекта.