книги / Системы экстремального управления
..pdfЗдесь же на рис. 6.1.10, б показан образующийся при этом предельный цикл. Определим основные параметры этого цикла.
Амплитуда предельного цикла ух в случае, если объект является параболой q-й степени, получается из решения следующего очевидного урав
нения:
kyl = е.
Периодпредельного цикла
- ( - г Г (вл-21) Потери на рысканье
|
для этого алгоритма поиска |
|
|
не зависят от скорости а. |
|
|
Часто это бывает очень удоб |
|
|
но , так как дает |
свободу в |
Рис. 6.1.10. Работа системы |
выборе параметра |
без изме |
поиска с запоминанием экстре |
нения потерь на |
рысканье. |
мума (а) и предельный цикл (б) . |
В заключение рассмотре |
ния этого цикла алгоритмов поиска следует отметить, что потери на поиск для них одинаковы и равны
К = 4 “ |
(6.1.23) |
Г. Поиск с временной селекцией. Рассмотренные выше алгоритмы поиска были построены таким образом, чтобы определять момент прохождения экстремума, после чего от давать команду на реверс. Как было отмечено, все эти алго ритмы обладали плохими помехозащитными свойствами.
Схема управления с временной селекцией, которая будет рассмотрена в этом пункте, обладает высокой по мехоустойчивостью и может быть рекомендована при ра боте в обстановке помех.
Идея этого метода поиска сводится к следующему. Команда на реверс исполнительного механизма подается
независимо от положения экстремума. Момент реверса определяется так, что при уменьшении показателя ка чества, т. е. при движении системы к экстремуму, команда на реверс несколько задерживается. При увели чении же показателя качества, наоборот, команда реверса
Рис. 6.1.11. Блок-схема управляющего устройства поиска с времеенбй селекцией.
отдается несколько раньше. Таким образом создается преимущество для движения к экстремуму и система в среднем продвигается к цели.
Блок-схема управляющего устройства, реализующего этот алгоритм, показана на рис. 6.1.11. Здесь релейный элемент РЭ имеет гистерезис и описывается следующим выражением:
|
с |
при |
и <0,1 |
если |
и)>0, |
V{u) = |
— d |
при |
tt^>ô,j |
||
с |
при |
и < 0,1 |
|
(6.1.24) |
|
|
если |
й < 0 , |
|||
|
. — d |
при |
u]>0,J |
||
где параметры с^>0, |
d > |
0 и Ô |
0, причем Ô — гистере |
зис релейного элемента.
Выход этого релейного элемента интегрируется (1/р) и, вычитаясь из Q, поступает снова на его вход. Эта цепь описывается следующим дифференциальным уравнением:
*L = V(Ç _rù. |
(6,1.25) |
Рассмотрим сначала случай -^Я* = 0, т. a. |
Q = const. |
Как нетрудно заметить* решением этого уравнения будет
«пила», показанная на рис. 6.1.12, а. Период этой пилы будет равен
Т = ô l ± |
l . |
(6.1.26) |
|
|
са |
|
|
Пусть теперь Q = const =j=0. В этом случав получаем |
|||
d + |
c |
|
|
Ti = à (d+ Q)(C_Q) |
(« = 1,2). |
(6.1.27) |
|
Здесь i = 1 соответствует |
Ç >0, |
a i= 2 — <?<0. При этом |
|
для того, чтобы |
необходимо выполнение усло |
||
вия c^>d. |
|
|
|
На рис. 6.1.12, б показаны оба случая, где наглядно |
|||
видно, что период Т уменьшается при Q |
0 и увеличива |
||
ется при Q 0, т. е. величина |
Ti несет |
информацию о |
Рис. 6.1.12. Работа поиска с временной селекцией: a)~Q = 0,
б) Q Ф 0 (обратная связь разомкнута), в) поиск с временной селекцией.
производной Q. Воспользуемся этим для синтеза алгорит ма экстремального управления.
Прежде всего, определим условия, необходимые для
выполнения сказанного. При Q ]> 0, для того чтобы время Тх было положительным, как видно из (6.1.26) и (6.1.27),
необходимо иметь с Q. При Q <[ 0, для того чтобы Т2 было положительным, необходимо выполнение неравен
ства d \Q\. Следовательно, для «нормального» функцио нирования этой системы следует выполнять условия:
Çmax С,
(?min — dm
Заметим, однако, что нарушение этих условии лишь усложняет анализ, но не нарушает работы поиска (см., например, рис 6.1.136).
Если теперь реверс исполнительного механизма про изводить в момент Q (t) = ii, то, как легко убедиться, объект будет в среднем оптимизироваться. Действитель
но, при Q^> 0 время движения системы Тг будет меньше,
чем при Q < 0. А так как абсолютное значение скорости изменения управляемого параметра одинаково в обоих направлениях |£| = а, то за два цикла поиска система продвинется к цели х* на величину
Да: = (Т2— 7i) а
или
2 ô(c« — d»)Q
(6.1.29)
- (da- Q a)(c*-Ç*) *
Здесь предполагается, что за время Тх -+• Тг величина
|(?| = const, т. е. модуль скорости возрастания показате ля качества равен модулю скорости его уменьшения. На рис. 6.1.12, в для иллюстрации показан процесс оптими
зации при |Ç| = const. Наглядно видно, что значение Q в процессе поиска в среднем уменьшается, что и обеспе чивает работоспособность рассматриваемого алгоритма.
Определим среднюю за два цикла скорость движения системы к экстремуму. Она равна
dx _ |
Дж _ |
(с — d)Q |
~dt~ ~ |
'1\+ Гг |
c d - Q 2 ' |
Вводя у — х — х*, получаем для квадратичного объек та Q = ky* Q* дифференциальное уравнение осредненного движения:
d y _ |
2к (с — d) ay |
(6.1.31) |
Tt |
cd — 4A2e*y8 |
Интегрируя это уравнение, получаем выражение, опре деляющее среднее положение системы у в момент времени U
cdIn | j - 2к2а2 (у2- уа) - 2 (с - d) kat = 0, |
(6.1.32) |
где Уо — У (0) — начальное положение системы относитель но экстремума у = 0.
Из (6.1.31) хорошо видно, что при cd^> Q2 стационар ное решение при f —> оо устойчиво и равно
у (оо) = 0, |
(6.1.33) |
т. е. в результате работы такого поиска система в среднем в пределе найдет экстремум (у* = 0).
Рис. 6.1.13. Работа алгоритма поиска с временной селекцией на кусочно-линейном объекте.
Рассмотрим работу этого алгоритма при оптимизации кусочно-линейного объекта. На рис. 6.1.13 показаны два примера оптимизации при различных значениях па раметра d (скорости уменьшения величины т] (i)). Здесь пунктиром обозначена функция
Q (х) Ч" б.
Различный характер поведения поиска на этом рисунке связан, прежде всего, соотноше нием между парамет ром d поиска и парамет ромк объекта. При d<^k, как видно, поиск имеет рыскающий характёр.
Исследуем теперь предельный цикл для симметричной характеристики объекта. На рис. 6.1.14 показан предель ный цикл для параболического объекта.
Для простоты рассмотрим случай очень большого зна чения параметра с, т. е. с^> d. (Этот случай изображен на рис. 6.1.14.) Определим параметры предельного цикла.
Амплитуда его определяется из прямоугольного треу гольника АВС
(6.1.34)
Период предельного цикла
(6.1.35)
a d *
Как легко заметить, предельный цикл для этого алгорит ма поиска не зависит от характеристики объекта. Это важное обстоятельство позволяет применять рассмотрен ный алгоритм поиска для объектов с изменяющейся фор мой характеристики. Предельный цикл при этом будет неизменным.
§ 6.2. Синхронное детектирование
Рассмотренные в предыдушем параграфе алгоритмы поиска с реверсом (кроме последнего) отличались тем, что при их помощи организовывалось движение системы к экстремуму по принципу: если не так, то иначе (наоборот), т. е. если система не оптимизируется, то нужно реверси ровать исполнительный механизм. Такая стратегия поведения особенно удобна для случая одной перемен ной, когда реверс всегда приводит к желаемому результату.
Однако подобная стратегия поиска далеко не един ственно возможная. Можно попытаться оценить произ водную dQ/dx, знак которой несет информацию о положе нии экстремума. Действительно для случая минимума в точке х* имеет место для унимодальной дифференцируемой функции следующее очевидное соотношение:
(6.2.1)
которое позволяет организовать движение к экстремуму,
располагая оценкой производной экстремальной харак теристики объекта.
Таким образом, задача экстремального управления может быть сведена к задаче эффективной оценки произ водной dQ/dt. Одним из наиболее распространенных спо собов определения производной непрерывных объектов является синхронное детектирование, которое и будет рассмотрено ниже.
Идея синхронного детектора заключается в следующем. На вход объекта накладывается незначительное возму щение /(f), изменяющееся во времени. Это возмущение, пройдя через объект, уже несет информацию об объекте.
Рис. 6.2.1. Блок-схема применения синхронного детектирования (к оценке производной dQ/dx характеристики [объекта.
Если теперь вычислить произведение выхода объекта на это возмущение, то, как будет показано ниже, резуль тат в среднем будет пропорционален наклону характерис тики объекта, т. е. пропорционален dQldx, что и требу ется для организации поиска экстремума.
Блок-схема устройства для определения производной dQldx методом синхронного детектирования показана на рис. 6.2.1. Здесь на вход экстремального объекта пода ется сумма х + /(f). Выход объекта Q — Q [х + /(0 1 умножается на / (f) и осредняется фильтром Ф, который реализует операцию интегрирования на базе Т:
т
£ = - ^ 4 ( f ) e Z f . |
(6.2.2) |
О |
|
В качестве модулирующего сигнала / (f) можно выб рать как регулярную, так и случайную функции времени.
Относительно этой функции будем предполагать лишь следующее: ___
а) ее среднее значение / (t) равно нулю (напомним, что черта сверху обозначает операцию осреднения), т. е.
|
т |
|
Щ = П т |
4 - ^ f(t) dt = 0; |
(6.2.3) |
б) средний квадрат |
этой функции р (t) достаточно |
|
Р (0 = lim |
оо. |
(6.2.4) |
Т-*ов 1 J
Модулирующая функция / (t) может при этом иметь как регулярный (например, гармонический), так и слу чайный характер.
Рассмотрим отдельно оба случая.
А. Регулярная модуляция. Пусть / (t) является регу лярным периодическим процессом. Рассмотрим сначала простейший случай гармонического возбуждения [6.4]:
|
|
f (t) — g sin (Of, |
(6.2.5) |
где g > |
0 достаточно мало. В этом случае оба условия |
||
(6.2.3) |
и (6.2.4) удовлетворяются. Рассмотрим прйзведе- |
||
ние А (см. рис. |
6.2.1) |
|
|
|
А = |
Q (æi + gsin <ùt) g sin<ùt. |
(6.2.6) |
Предполагая, что характеристика объекта Q (х) является |
|||
достаточно гладкой функцией, ее можно |
разложить в |
степенной ряд и ограничиться первыми членами разложе ния
Q (я + а) = Q(x) + |
+ у |
• • • |
(6.2.7) |
В данном случав модуляция |
а = g sin Ш предполагает |
ся малой, и, следовательно, в выражении (6.2.7) можно пренебречь членом с а2. В результате получаем
Q (х + g sin ~ Q (х) + S sia cof ^ .
Теперь, подставляя это выражение в (6.2.6) и осредняя его по (6.2.2), приходим к следующему выражению,
характеризующему выход фильтра Ф (см. рис. 6.2.1),
В — gQ (х) sin (ùt -f g2 sin2 cat ^ ,
где
т
sin at = y - ^ sin (ùt dt,
|
о |
|
T |
sin2 (ùt = |
^ sin2 (ùt dt. |
|
о |
Здесь —знак оценки на конечном интервале Т. Предполагая, что время осреднения Т достаточно ве
лико, получаем
--£--- |
---£--- |
J |
, |
sin (ùt ж 0, |
sin2 (of Ж у |
что дает право записать
(6-2.8)
Это означает, что сигнал на выходе фильтра Ф пропор ционален наклону характеристики, что и требовалось доказать.
Нужно обратить внимание на то, что полученная оцен ка (6.2.8) не зависит от частоты возбуждения со. Следова тельно значение со может выбираться произвольно, но не слишком малым, чтобы за время осреднения Т в форму ле (6.2.2) прошло бы несколько периодов модуляции /(О , т. е.
Г > £ , |
(6.2.9) |
что гарантирует точность. Это требование определяет пре делы выбираемых значений параметров возбуждения со и осреднения ^.Строгое равенство в (6.2.8) будет при саГ—>• оо.
Проиллюстрируем процесс определения производной геометрически. На рис. 6.2.2 показан процесс про
хождения гармонического колебания возбуждения / (t) через экстремальный объект. Если x<jc*yчто соответствует кривой 1 на рис. 6.2.2, то выходное колебание
$ Ô.2] |
|
|
|
|
Q (х + / (®)) находится в противофазе |
с возбуждением |
|||
х (t). При этом произведение / (£)*(? |
(£)], как видно |
|||
из рисунка, имеет всегда отрицательный знак. При х |
х* |
|||
(з® ^ |
Фазы |
колебаний/ (t) и Q [х + / (*)] совпадают |
и, |
|
следовательно, |
их произведение имеет |
положительный |
Рис. 6.2.2. К |
процессу |
синхронного детектирования. |
|
знак (см. кривые 2 на рисунке). Если же х = х* (кривая S), |
|||
т. е. объект находится в экстремуме, то выход |
объекта |
||
дает удвоенную |
частоту, |
произведение которой |
на мо |
дулирующее воздействие / (£) в среднем дает нуль в силу ортогональности:
sin сùt cos 2<ùt = 0.
Таким образом, указанное подтверждает и иллюстрирует геометрический вывод о том, что выход синхронного детектора может служить мерой наклона характеристики объекта.