книги / Системы экстремального управления
..pdfБлок-схема устройства для решения этой задачи по казана на рис. 7.6.6. Здесь прямоугольниками обозна чены постоянные веса входов линейных преобразователей (сумматоров и интеграторов). Предполагается, что момен ты отсчетов tv tn постоянны и не изменяются от
Рис. 7.6.6. Блок-схема устройства для решения системы (7.6.24).
одного цикла решения к другому. Это дает возможность обойтись без нелинейных преобразователей. Схема рабо тает следующим образом.
На ее вход подаются по мере поступления и фиксиру ются значения приращения выхода объекта по сравнению с начальным значением Q0. Ввиду малой постоянной вре мени этой схемы переходные процессы в ней быстро затухают и к моменту tn -J- т, где т — время затухания переходных процессов, будет определено искомое значе ние Дq.
Заметим, что определение коэффициентов а 0, -, а п, обеспечивающих устойчивость этой схемы, проще всего может быть выполнено не аналитически, как предложено выше, а экспериментально, например путем простого перебора на реальной схеме.
Для этого достаточно придавать им лишь два значения:
И* = i t т (i = 0, 1, |
п), |
(7.6.26) |
т. е. необходимо один раз сделать не более 2Пэкспериментов. Параметры р,,-, обеспечивающие быстрейшее затухание пе реходных процессов, вводятся в схему в виде коэффи циентов веса перед интеграторами.
Отметим в заключение, что описанная схема эффек тивно работает только при отсутствии помех. Если же объект зашумлен, то следует искать другие средства определения Дg, способные фильтровать помеху.
§ 7.7. Адаптация частоты при синхронном детектировании инерционных объектов
Выше, в § 7.4, показано, что выбор фазы модулирую щего сигнала, подаваемого на синхронный детектор, зависит от динамических свойств объекта. Быстродействие и устойчивость работы экстремального регулятора суще ственно зависят от правильного согласования фаз сигнала на выходе объекта и модулирующего сигнала (в идеале они должны совпадать с точностью до 2я). Но изменение динамических свойств приводит к изменению фаговой характеристики. Это обстоятельство заставляет обращать ся к адаптации частоты модуляции. Идея такой адапта ции сводится к следующему.
Будем управлять частотой модулирующего сигнала так, чтобы фазовый сдвиг в объекте был постоянным и равным заданной величине ф. Очевидно, что выбор ф зависит от свойств объекта и дрейфа его динамических характеристик. Если <р (£) — случайный сдвиг фазы за счет дрейфа при постоянной частоте модуляции, то ф целесообразно выбирать в районе среднего значения
ф « М [ф (*)], |
(7.7.1) |
где М — знак математического ожидания. Очевидно, что процессом формирования частоты модулирующего сигнала
следует управлять в |
зависимости от знака |
разности |
Ф (г) — ф. Если эта |
разность положительна, |
то сдвиг |
фазы в объекте слишком велик и его нужно уменьшить путем снижения частоты модуляции а, т. е. уравнение
адаптации должно иметь вид
- ^ - = - v /(< p - t), |
(7.7.2) |
где V— постоянный положительный коэффициент, / — монотонно возрастающая функция с нулем в начале
Рис. 7.7.1. Блок-схема системы экстремального регулирования {инерционного объекта с адаптацией частоты модуляции.
координат, т. е. / (0)=0. В качестве такой функции удобно выбрать синус, т. е.
4£---vsta(<p-1>). |
(1.7.3) |
Величину sin (<р — ф) можно определять при помощи дополнительного синхронного детектора (см. рис. 7.7.1), на вход которого подаются сигнал с выхода объекта Q (£) =
= Q (х) В sin (a>t — ф) и |
сигнал |
генератора поиско |
вых сигналов, сдвинутый |
на ф + |
я/2: g sin (at — ф — |
— я/2). Тогда выход синхронного детектора после осред нения с точностью до коэффициента равен
sin (at — ф) sin (at — ф — я/2) = cos (ф— ф — я/2) = |
|
= эт(ф — ф). |
(7.7.4) |
Это обстоятельство и дает возможность довольно просто синтезировать контур адаптации.
Блок-схема экстремального регулятора с адап тацией частоты показана на рис. 7.7.1. Здесь Г — генера тор модулирующего сигнала, индексом «1» отмечены эле менты основного контура синхронного детектирования, а индексом «2» — элементы контура адаптации. Первое устройство фазового сдвига (УФСХ) производит сдвиг фазы исходного сигнала на постоянную величину ф.
Контур адаптации состоит |
из УФС2, сдвигающего фазу |
на постоянную величину ф |
я/2, двух блоков произве |
дения и исполнительного механизма (ИМ2) — интегратора, который изменяет частоту ш модулирующего сигнала (второй блок произведения понадобился для того, чтобы устранить влияние знака наклона характеристики на цепь адаптации).
Уравнения динамики такой адаптирующейся системы
экстремального |
управления записываются в виде |
doc |
g sin cof) sin (art — ф), |
-gj- = — \iQ (х + |
= — vQ2 (x + g sin art) sin (art — ф) sin (art — ф — я/2).
(7.7.5)
Пусть 1{(Ù) — амплитудно-частотная характеристика ди намической части объекта с передаточной функцией Wx (р) W2 (р). После осреднения получаем
т г |
= |
- |
4 ж |
,(ш')С081'|,(" ') - ’и * |
(7.7.6) |
|
Т Г |
= |
- |
т |
р(“ 7 sin 1<Р(“ 7 - Ч>1. |
||
|
где штрихом обозначены осредненные переменные. Из
этих уравнений хорошо видно, |
что |
адаптация приводит |
к тому, что <р (со)—и|). Но при |
= |
0 контур адаптации |
перестает работать. Однако это не страшно, так как в этом случае объект находится в экстремуме,
§8.1. Модели объектов экстремального управления с помехами
Рассмотренные выше, в предыдущих главах, процес сы экстремального управления являются не более нем абстракцией, так как в них не учтены случайные факторы. Эти случайные факторы неизбежно сопровождают все реальные объекты.
Причины возникновения случайных факторов в объек те управления могут быть различными. Вот некоторые из них.
1. Ошибки измерения. Так как всякое управление (в том числе и экстремальное) неизбежно связано с изме рениями, а измерение всегда происходит с погрешностью, характер которой определяется классом прибора, то управ ление происходит в обстановке случайных помех такого рода.
2.Ошибки округления. Всякое техническое восприни мающее и запоминающее устройство имеет свою точность, которая является одной из основных его характеристик. Эта точность и определяет ошибки «округления» запоми наемой величины. Эти ошибки неизбежно оказывают влияние на работу экстремального регулятора.
3.Помехи в канале связи. Если показатель качества
объекта достаточно удален от регулятора, то возможно появление помех в канале связи между объектом и ре гулятором. Эти помехи вносят элемент неопределенности
ислучайности в процесс управления.
4.Собственные шумы объекта. Многие реальные объ екты обладают значительным фоном собственных шумов. Таковы, например, технологические объекты, где внут ренний шум создается за счет влияния огромного числа неучтенных и изменяющихся факторов. Этот шум и яв ляется причиной случайного изменения показателя ка чества.
5..Изменение свойств объекта. Всякий реальный объект
впроцессе своей работы неизбежно изменяет свои свой ства. Эти изменения имеют блуждающий характер и сво дятся к «уплыванию» параметров объекта. Уплывание мо жет быть систематическим и случайным (типа броунов ского). Оно-то и вносит неопределенность и случайность
вповедение объекта
оптимизации. |
|
|
Возможны и другие |
|
|
источники |
случайных |
|
помех. |
рассмотрим |
|
Теперь |
|
|
некоторые |
модели эк |
Рис. 8.1.1. Модель взаимодействия |
стремальных объектов |
помех с объектом. |
спомехами. Пусть
объект без помех имеет экстремальную характеристику вида
Q = Q (х). |
(8.1.1) |
Тогда модель объекта с помехами ег и е2 может быть представлена, например, в следующем виде:
Q' = Q (х + ех) + е2, |
(8.1.2) |
где ех— случайная величина (или функция), моделирую щая блуждание цели х*, а е2 — случайная величина (или функция), моделирующая помеху измерения или округления показателя качества Q. Блок-схема модели такого объекта показана на рис. 8.1.1. Это наиболее рас пространенная форма взаимодействия помехи с объектом. Возможны и другие варианты комбинаций помех с пока зателем объекта. В общем виде
<?' = Q' (х, elt е2). |
(8.1.3) |
Однако в дальнейшем мы будем рассматривать только модель (8.1.2), предполагая, что реальные экстремальные объекты могут быть с достаточной точностью представ лены в такой форме. (Заметим, что в действительности зависимость (8.1.3) очень сложна и ее редко удается по лучить в аналитической форме.)
Относительно случайных помех % и е2 следует, прежде всего, сказать, что они могут иметь как дискретный, так и непрерывный характер. В первом случае это — слу чайные числа, а во втором —непрерывные случайные функции времени.
§ 8.2. Экстремальное управление в обстановке помех
Теперь рассмотрим поведение экстремальной системы, оптимизируемой обычными алгоритмами поиска, но в об становке помех, накладывающихся на показатель каче ства Q (ж).
А. Поиск с парными пробами. Рассмотрим поиск с парными пробами (§ 4.1), когда рабочий шаг определяется следующей формулой:
Дxi = — a sign [<?' (xt + g) — Q' (xt — g)I. (8.2.1)
Здесь штрихи означают наличие помех е, которые являют ся реализациейслучайногодискретного процесса спостоян ным математическим ожиданием и дисперсией а2:
М (е) = т = const, )
(8.2.2)
D (е) = б2 = const. J
Рассмотрим статистические свойства поиска в этой обста новке.
Пусть величина g достаточно мала, а экстремальная характеристика достаточно полога, чтобы считать
J S ^ L ~ ^ r [ Q<Xi + e)- Q {Xi- g )\. |
(8.2.3) |
|
Тогда (8.21.1) запишется в виде |
|
|
Дж4= — a sign [2g-—J?- + |
4° — 4l)] • |
(8-2.4) |
Здесь eil) и e2T) — помехи измерения |
показателя |
качества |
в точках Xi -\-g и Xi —g соответственно.
Очевидно, что помехи могут привести к тому, что знак производной будет определен неверно и шаг будет сде лан в неправильном направлении. Это произойдет тогда, когда
sign
dQ (ж{)
dx
Определим вероятность этого события, т. е. вероятность ошибки:
Рош — |
dQК) |
dQ Ц ) |
+ 4,,- 4 « ) ] . |
dx =h sign |
dx |
(8.2.6)
Здесь возможны |
два варианта: |
|
|
|||||
1) |
|
|
dQЦ) |
|
|
|
|
|
|
|
dx |
|
|
|
(8.2.7) |
||
И |
|
|
|
|
|
|
|
|
2) |
|
|
|
|
|
|
|
|
(случай |
_ |
п |
пока |
не |
рассматриваем). В |
первом |
||
da; |
“ |
и |
|
|
|
|
|
|
случае |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(8.2.8) |
Во втором случае |
|
|
|
|
|
|
||
Рот = |
Вер [2g |
|
+ |
81*1— 4l)> oj . |
(8.2.9) |
|||
Обозначим |
|
|
|
|
|
|
|
|
I dQ&i) | _ ь . |
t |
_ |
P(i) |
~(i) |
(8.2.10) |
|||
|
~dx~ |
~~ Kit |
S —6i |
— e2 . |
Здесь hi —модуль производной экстремальной характе ристики в точке хи а 1 — случайная величина с -нулевым математическим ожиданием
М (|) = М (ей - М (в§) = т - т = 0 (8.2.11)
и дисперсией 2о2 |
|
|
|
|
||
D ф = D (ef) |
-f £> (4i}) = |
a2 |
-fa 2 = 2а2. |
|||
Тогда |
вероятность |
ошибки равна |
|
|||
|
( |
— |
2gk{\ |
для |
dQ (ж.) |
|
|
I Вер [£< |
— |
= кь |
|||
Рот = |
I |
2gki\ |
для |
dQ (ж.) |
||
|
Вер [g> |
— —*- = — к*. |
(8.2.12)
(8.2.13)
Если считать, что случайная величина | симметрична, т. е. с равной вероятностью встречаются ее положительные
иотрицательные значения, то оба случая эквивалентны,
идостаточно рассмотреть один из них.
Обычнопредполагают,чтослучайная помеха еимеет нор мальный закон распределения. Тогда случайная величина
£ имеет также нормальный закон; |
|
||
? ® |
= т Й |
г Г 1 г - |
<8-2-14> |
Вероятность ошибки |
(8.2.13) |
равна |
|
_____ 4 - [ 1 - ф ( - ^ ) ] . |
(8.2.15) |
||
где Ф (•) —функция Лапласа 18.1]. Так как Ф |
0, то |
всегда Р ош <С у» т- в- ПРИ ^ ¥= 0 ошибочных шагов всегда
в среднем меньше, чем правильных, независимо от уровня помех.
Пусть объект имеет квадратичную характеристику вида
Q (х) = кх\ |
(8.2.16) |
Тогда вероятность ошибки будет зависеть от положения, так как в этом случае
к, = дО(#•) = 2кх{. |
(8.2.17) |
Подставляя это выражение в (8.2.15), получаем зависи мость
рт (*) = 4 - [l - Ф ( - ^ - ) ] , |
(8.2.18) |
которая показана на рис. 8.2.1 для различных значении соотношения ° . Здесь же показана экстремальная ха рактеристика объекта. Введем обозначение
и = |
. |
(8-2.19) |
которое показывает уровень зашумленности или, точнее, соотношение уровней помехи и полезного сигнала. Ве личина полезного сигнала равна приращению показа теля качества
AQt = Q (xt + g ) — Q (xi — g) ж 2gkt, (8.2.20)
T. e. пропорциональна знаменателю дроби (8.2.19). Здесь ki —наклон характеристики в точке х%.
Чем больше величина х, тем более «зашумленной» следует считать обстановку поиска. Однако это может происходить не только за счет уровня помехи е (это — свойство объекта), но и за счет малости пробного шага g (это — свойство алгоритма поиска). За величину уровня помехи е естественно принять ее среднеквадратическое отклонение а.
Как видно из рис. 8.2.1, вероятность ошибки зависит
от параметра зашумленности |
к и состояния х. Причем, |
||||||
чем выше |
уровень |
за- |
|
1 |
4 |
* |
|
шумленности, тем боль- |
|
||||||
ше вероятность ошибоч |
|
|
|
|
|||
ных шагов, что естест |
|
|
|
|
|||
венно. |
|
|
|
|
|
|
|
Рассмотрим быстро |
|
|
|
|
|||
действие |
поиска в |
об |
|
|
|
|
|
становке помех. Пусть |
|
|
|
|
|||
для конкретности экст |
|
|
|
|
|||
ремум |
х* |
расположен |
Рис. 8.2.1. Зависимость вероятиостп |
||||
справа |
от |
анализируе |
ошибки от расстояния до экстремума |
||||
мого состояния Xt, т. е. |
|
квадратичного объекта. |
|||||
Xi < х* (рис. 8.2.2). Из |
|
перейти |
либо |
в состояние |
|||
состояния |
х система может |
xt -\-а, либо в xi —а. В первом случае будет принято пра вильное решение, а во втором — ошибочное, вероят ность которого определена выше (8.2.15). Вероятность правильного решения равна P = 1 — Рош. Тогда среднее положение после г-го шага равно
2г+1 = Рош fai — а) + P(xi + а), |
(8.2.21) |
а среднее смещение к цели х* после естественных преоб разований имеет вид
S t+1 = îj+i — Xt = и (1 — 2-Рош)* |
(8.2.22) |
Подставляя сюда выражение для вероятности ошибки, получаем
Si+1 ~ яФ • (8.2.23)
Отсюда видно, что среднее смещение всегда положительно, т. е. система стремится к экстремуму независимоот уровня помех. Далее, скорость движения к экстремуму