книги / Управление колебаниями
..pdfСЛАБО УПРАВЛЯЕМЫЕ СИСТЕМЫ |
21 |
Введем матрицы размера п X п |
|
|
(1.2.8) |
при |
|
ж =ф (£, с), i, / = 1, . . п. |
|
Равенства (1.2.5), (1.2.6) задают преобразования, пе реводящие вектор с в ж п обратно. Матрицы (1.2.8), как матрицы Якоби для этих взаимпо обратных преобразова
нии, |
связаны |
соотношением Ф = G~l. Ранг |
матриц ра- |
веп |
/г. |
ж1 удовлетворяет линейной |
неоднородной |
Функция |
|||
системе (1.2.4). Соответствующая однородная система |
является системой в вариациях для уравнений нулевого приближения (1.2.3), которой удовлетворяет ж0. Как из вестно из теории обыкновенных дифференциальных урав нений [1031, матрица Ф из (1.2.8) представляет собой фундаментальную матрицу для системы в вариациях. Пользуясь этим, запишем при помощи метода вариации произвольных постоянных общее решение неоднородной
системы (1.2.4)
t
ж1 = Ф (t1с) b + Ф (i, с) J Ф 1 (т, с) f1(ж0 (т), т, и (т)) dx.
Определим вектор Ъ произвольных постоянных при помощи начального условия для ж1 из (1.2.4) и пользуясь
равенством Ф-1 = 6?, получим |
|
|
|
||
я ^ ) = |
ф(1, c)G (t0, с) аг + |
|
|
|
|
|
|
t |
|
|
|
|
+ |
Ф (*, с) J G(т, с) f1(ж° (т), т, и {%)) ф . |
(1.2.9) |
||
Выразим |
еще величину |
Г1 из |
третьего |
равенства |
|
(1.2.4) |
и затем подставим |
ее в |
четвертое |
равенство |
|
(1.2.4) |
|
|
|
|
|
|
|
|
|
= |
1, .. .. г. |
|
|
|
|
|
(1 .2 .10) |
22 |
МЕТОД МАЛОГО ПАРАМЕТРА |
[ГЛ. i |
Вектор р°, как следует из (1.2.3), удовлетворяет ли нейной однородной системе, которая является сопряжен ной по отношению к упоминавшейся выше системе в ва риациях. Поэтому (см. [103]) фундаментальная матрица для нее равна (Ф-1)' = G', где штрих означает транспо нированную матрицу. Следовательно, общее решение си стемы (1.2.3) для р° имеет вид (в векторной и скалярной запнсн соответственно)
р° = |
G' (if, с) Я, S — («!, |
. . ., |
|
„ |
dg. |
|
( 1. 2. 11) |
|
i=l * |
* = 1-- |
.. , п. |
|
|
|
Здесь s — вектор произвольных постоянных. Подстав ляя решепие (1.2.11) в условие (1.2.3) для р°(Г0) и учи тывая равенство ( £ г ') _1 = Ф', получим
e) U ° - ^ - + 2 |
-Ml |
при t — Т°. |
M дх дх |
|
|
|
|
(1 .2.12 ) |
Перейдем к определению управления в первом при ближении (в нулевом приближении система неуправляе ма). Подставим в функцию II нз (1.1.10) представления (1.2.1) и (1.2.2) и разложим эту функцию в ряд по в
Н = (/>, /) = (/Л /° (я0, *)) -|-е |
+ |
+ (р\ /° (я°, *)) + (р°, Z1 (*°, |
И))J + •■• |
Точками обозначены члены порядков выше первого. Из выписанпых слагаемых лишь последнее зависит от и. Поэтому определение максимума II по и в (1.1.11) сво дится в первом приближении к максимизации этого по следнего слагаемого
( / > ° ( * ) , / Ч * ° ( г) , * , » ( * ) ) ) =
= SUP (рО ^/Ч *0 (*),*, и)). (1.2.13)
иеи
Управление uit), определяемое соотношением (1.2.13), может и не быть близко к оптимальному в смысле метрики в
I 2’ |
СЛАБО УПРАВЛЯЕМЫЕ СИСТЕМЫ |
23 |
пространство |
С (т. с. по максимуму модуля |
разпости). |
Однако опо будет приближенно оптимальным в смысле минимизируемого функционала. В самом деле, из извест ных формул для первой вариации функционала [181] следует, что функционалы для двух различных управле ний отличаются па величину того же порядка, что и функции II для этих управлений. Но при соблюдении условия (1.2.13) фупкцпя Я для управления u(t) будет отличаться от максимума функции Я, достигаемого при выборе оптимального управления, на величину порядка отброптсппых членов, т. е. порядка е2. Такой же порядок малости <9(е2) будет иметь' п отличие по функционалу между приближенным и точным оптимальными управле ниями. Отметим, что отличие по функционалу между лю быми двумя допустимыми управлениями в слабо управ ляемой системе (1.1.1), (1.2.1) составляет величину по рядка е. Строгое обосповаппе алгоритма и оценка точ ности погрешности построеппого решения излагаются далее в § 3.
Отметим, что согласно (1.2.13) управление u{t) зави сит только от решений пулевого приближения x°(t) и p°(t). Подставляя решение (1.2.11), условие (1.2.13) мож но переписать в виде
~ |
(G's, f) = 2 |
Sifj(x°(t), t, u)^sup. (1.2.14) |
|
1 J |
иен |
2. Описание алгоритма. Полученные соотношения позволяют получить приближенное решение поставлен ной задачи оптимального управления. При этом траекто рия я(£), а также момент Т и функционал / определя ются в первом' приближении (с учетом двух членов раз ложений (1.2.2), т. е. с погрешностью порядка е2), а сопряженные переменные р(£) и постоянные X, — в пу левом приближении. Аналогично изложенному выше могут быть построены указанные величины в более вы соком приближении по степеням малого параметра 8.
Определение решения первого приближения сводится
кследующим этапам.
1.Находим общее решение системы нулевого приб лижения, т. е. функции (p, g из (1.2.5), (1.2.6), а также матрицы Ф, G из (1.2.8).
24 |
|
МЕТОД |
МАЛОГО ПАРАМЕТРА |
[ГЛ. 1 |
|
2. |
В нулевом приближении траектория я°(г) опреде |
||||
ляется |
равенствами |
(-1.2.7), момент Т° и |
функционал |
||
У0 — третьим и пятым |
равенствами (1.2.3). |
Четвертое |
|||
равенство (1.2.3) считаем выполненным по условию. |
|||||
3. |
Функция p°(f) определяется |
равенствами (1.2.11), |
|||
а вектор |
s — равенством (1.2.12), в |
которое |
следует под |
ставить Я° из (1.2.3). Правую часть равенства (1.2.3) для Я0 и (1.2.12) следует брать при х — х°(Т°), t = T°. Таким образом, равенства (1.2.3), (1.2.11), (1,2.42) определяют функцию p4t) с точностью до г произвольных постоян
ных Я®, которые будут найдены ниже.
4. Подставив z°U) и р°Ш в условие (1.2.13) или (1.2.14) и вычислив супремум по и, найдем управление
u(t) также с точностью до г неизвестных постояппых Я?.
5.Подставим х°Ш и u(t) в равенство (1.2.9) и найдем ххit) и, в частности, хх(Т°) с точностью до тех же по стоянных.
6.Подставим t = TQ, x = xQ(T°) и найденное значение хЧТ°) в соотношение (1.2.40). Получим в общем слу
чае г трансцендентных уравнений для определения посто янных Я®, которые входят в хЧТ°). Разрешая эти урав нения (предполагаем, что решение существует), найдем постоянные Я®. Теперь функции p°(t), u(t), xx(t) и по
стоянная Я°, найденные в этапах 3 — 5, полностью опре делены.
7. Поправку Т1 к моменту окончания процесса и J1 к функционалу найдем последовательно из третьего и пя того равенств (1.2.4), в которые нужно подставить уже известные значения х = х°(Т°), t = T° и хх(Т°).
3.Дополнительные замечания.
З а м е ч а н и е 1.2.1. Рассмотрим решение поставлен ной задачи еще в том важном случае, когда краевые ус ловия д = 0 в конце процесса отсутствуют (кроме усло вия h —0, служащего для определения момента оконча ния процесса). В этом случае размерность г вектора q из (1.1.3) равна нулю, и поэтому в равенствах §§ 1, 2 сле
дует опустить члены, содержащие q{, q\ и постоянные Я;,
Я®. Соотношения (4.2.40) также нужно опустить. Приб лиженное решение задачи в этом случае значительно упрощается, так как опускается одна из самых сложных его частей — решение системы уравнений (этап 6). При
СЛАБО УПРАВЛЯЕМЫЕ СИСТЕМЫ |
25 |
выполнении этапов 3 — 5 функции р°Ш, uCt), x4i) теперь |
определяются однозначно. В остальном схема решения остается той же.
З а м е ч а н и е |
1.2.2. Рассмотрим еще задачу о мини |
мизации интегрального функционала |
|
|
т |
|
/ = \ U (х, t,u)dt, |
|
*о |
/* (я, t, и) = |
/® (ж, tt и) + е/1 (х, t, и) + .. ., |
где /* — заданная функция. Уравнения, краевые условия
иограничения по-прежнему задаем в виде (1,1.1)—
(1.1.2), причем имеют место разложения |
(1.2.1). Если |
||
/® не зависит от и, то введем новую |
фазовую координа |
||
ту и функционал соотношениями |
|
|
|
i* = /* = /,° (*, *) + е/.1 (*, *,»)+■.., |
** (fo) = О, |
||
Если же |
/® зависит явно от и, то полагаем |
||
х* = |
е/* = е/I (ж, *, и) + . . . , |
х* (*0) = О, |
= е / = ж* (Г).
Увеличим на единицу размерность вектора х за счет добавления к нему новой компоненты ж*. Тогда исход ная задача, эквивалентная задаче минимизации функцио нала /*, полностью сведется к рассмотренному выше в § 2 случаю. По методике § 2 можно определить минимум функционала /* с погрешностью порядка е2. Для исход ного функционала J погрешность решения соста
вит |
величину поряда |
е2 в случае, когда /® |
не зави |
сит |
от и, и величину |
порядка е, когда /® явпо |
зависит |
от и.
Рассмотрению некоторых задач оптимального управ ления указанного типа для слабо управляемых систем с
интегральным функционалом посвящена |
работа [1061. |
В ней получены оценки погрешности |
приближенного |
решения для случая интегрального функционала, содер жащего положительно определенную квадратичную фор му от управления.
26 |
МЕТОД МАЛОГО ПАРАМЕТРА |
1ГЛ. 1 |
За м е ч а н и е 1.2.3. Изложенный подход можно при менять для построения приближенных аналитических решений задач оптимального управления в случае слабо управляемых систем. При этом значение параметра е мо жет фактически быть не очень малым. Следует отметить, что задачи управления механическими объектами часто относятся к рассмотренному выше типу слабо управля емых систем. Параметр е здесь характеризует отношение управляющих сил к неуправляемым силам.
За м е ч а н и е 1.2.4. Изложенным методом малого па раметра можно получать исходное (начальное) прибли жение для последующего решения задачи онтимальпого управления на ЭВМ различными численными методами.
Вчастности, метод малого параметра применяется в сочетании с численным методом последовательных приб
лижений, предложенным в работе [122] и развитым в [123], см. также [231]. Малый параметр при этом может вводиться в систему (-1.1.-1) искусственно, например, од ним из следующих способов:
|
x = f(x, |
t, ей), |
x = |
efixt t, |
и), |
|
||
так, чтобы она |
была |
слабо |
управляемой |
при е < 1. |
По |
|||
строив решение |
при малом е, затем постепенио (шагами) |
|||||||
увеличивают |
е |
до |
е = |
1, решая |
численно при каждом |
|||
значении е |
задачу |
оптимального |
управления. При |
этом |
в качестве начального приближения в расчетах исполь зуется полученное оптимальное управление для преды дущего значения е. Таким образом часто удается до биться сходимости численного метода в тех случаях, ког да его непосредственное применение при е = 1 не дает желаемого результата.
4. Локальная оптимальность. Так как первые интег ралы (1.2.6) системы нулевого приближения предпола гаются известными, то их можно взять в качестве новых искомых функций в системе (1.1Л). Другими словами, равенства (1.2.5), (1.2.6) можно рассматривать как пря мое и обратное преобразования от вектора переменных х к вектору новых переменных с, причем вектор с будет постоянным лишь в нулевом приближении. Такое преоб разование применяется в небесной механике, где пере менные типа с называются оскулирующими элементами.
Рассмотрим решение пп. 1, 2 § 2, считая, что в ка честве фазовых координат выбраны первые интегралы
§ 21 |
СЛАБО УПРАВЛЯЕМЫЕ СИСТЕМЫ |
27 |
системы нулевого приближения (т. е. оскулирующие пе ременные с пз (1.2.6)) и что эти переменные затем попрежнему обозначены через х. Ход решения п.п. 1, 2 § 2 останется неизменным, но появятся некоторые упро щения, связанные с выбором фазовых координат. Так как новые фазовые координаты тождественно постоянны в нулевом приближении, то в соотношениях п. п. 1, 2 § 2 оледует положить /° = 0. При этом, как легко видеть, функции ф, g из (1.2.5), (1.2.6) и матрицы (1.2.8) равны
|
|
ф(г, с) = |
с, |
g(x, t) = xi |
(1215) |
|
|
Ф(*, c) = G(t, с)= Е . |
|
||
Здесь |
единичная |
матрица. Соотношения (1.2.7), |
|||
(1.2.9), (1.2.11), |
(1.2.13) примут вид |
|
|||
х° (t) = |
а0, х1 (t) = |
|
t |
и (т)) dx, |
|
а1 + |
f Z1 (а0, т, |
||||
р° (t) = |
s, |
|
|
*° |
(1.2.16) |
(s, f1(а°, t, а))-►sup no |
u ^ U . |
Остальные равенства п. 1 § 2 также можно упростить, подставляя в них соотношения (1.2.15), (1.2.16).
Сделаем еще два предположения. Во-первых, будем считать, что краевые условия д = 0 в конце процесса от сутствуют. Это, как указано в замечании 1.2.1 из п. 3, дает возможность опустить в равенствах п. 1 § 2 все
члены, содержащие Я® и } !, и упростить ход решения. Во-вторых, считаем, что выполнено одно из двух усло вий: либо функция F0 не зависит явно от t, либо h° не зависит явно от х, т. е. справедливо равенство
Т Г Т Г - 0- |
<‘ -2-17) |
Условие (1.2.17) выполнено, например, |
если Их, t) = |
= t —2"*, где Г* — заданное число. Тогда момент Т окон чания процесса, определяемый первым условием (1.1.3), фиксирован и равен Т*, причем Т° — Т^, Т1= 0.
Учитывая сделанные предположения и |
равенства |
(1.2.15)— (1.2.17), пайдем № из соотношения |
(1.2.3) и за |
тем s из (1.2.12) |
|
|
(1.2.18) |
при х= х°(Т °), t = Т°.
28 |
МЕТОД МАЛОГО ПАРАМЕТРА |
[ГЛ. 1 |
Подставим равенство (1.2.18) для s в последнее уеловне (1.2.16)
( * . г <»'■ * . “ » |
= - ( С 11- |
* . “ >) = |
Т ( т г |
d F ° \ |
dt Г |
||||
|
|
|
|
(1.2.19) |
Здесь полная производная вычисляется в силу урав |
||||
нения >(1.1.1) с |
учетом членов |
первого |
порядка малости, |
|
т. е. при / = е / 1. Не уменьшая точности |
решения |
(с пог |
решностью в малых высшего порядка), эту производную можно заменить производной в силу точных уравнений
Приближенное оптимальное управление, согласно последнему условию (1.2.16), доставляет максимум лево му из выражений (1.2.19). Так как производная dF°/dt не зависит явно от и, то согласно равенствам (1.2.19), управление может определяться из условия минималь ности полной производной dFVdt.
Управление, которое в каждый момент времени мини мизирует скорость dF°/dt изменения минимизируемого функционала F0, часто называется локально оптималь ным. Таким образом, выше показано, что в слабо уп равляемой системе локально оптимальное управление при сформулированных выше предположениях является приближенно оптимальным управлением. Другими сло вами, значения функционала для точного оптимального и локально оптимального управления отличаются на ве личину порядка е2.
З а м е ч а н и е 1.2.5. Локально оптимальные управле ния находятся обычно весьма просто. Для этого доста точно записать полную производную dF°/dt как функцию оскулирующих переменных, управления и времени, а за тем найти ее минимум по u ^ U . Управление при этом получается в виде функции от оскулирующих фазовых координат и, возможно, времени, т. е. в форме синтеза. После этого траектория может определяться либо анали тически, либо численным интегрированием задачи Коши. Благодаря своей простоте локально оптимальные управ ления пеодпократпо использовались в задачах управляе мого движения космических аппаратов с малой тягой, см., например, [73, 130]. При этом роль нулевого приб лижения играет кеплерово движение, а роль первых ин
§ 3] |
ОЦЕНКА |
ТОЧНОСТИ МЕТОДА |
29 |
|
|
|
|
тегралов |
уравнений |
нулевого приближения — обычно |
оскулирующие элементы. Локально оптимальные управ ления применялись и в качестве начального приближе ния при численных расчетах оптимальных траекторий. Полученные выше результаты указывают, при каких ус ловиях и в каком смысле локально оптимальные управ ления действительно близки к оптимальным управлениям.
§ 3. Оценка точности метода малого параметра для слабо управляемых систем
1. Постановка задачи. Исследуем вопросы обоснова ния н оценки точности методики построения приближен ного решепия, развитой в § 2. Задача оптимального уп равления (1.1.1)—'(1.1.4), (1.2.1) рассматривается при упрощающем предположении, что краевые условия q = О
в (1.1.3) отсутствуют (см. замечание 1.2.1). |
|
|
Систему уравнений движения |
(1.1.1) представим в |
|
виде |
|
|
x = f°(x, t) + efl(x, t, и), |
xito) = a. |
(1.3.1) |
Здесь f — некоторая функция, содержащая все по следующие члены разложения (1.2.1). В общем случае функция f может непрерывно зависеть от малого пара метра е. Однако для обоснования первого приближения эта зависимость несущественна и далее не указывается. Аналогично, возможная зависимость от аргумента е ус ловия h = 0 в (1.4.3) и функционала (1.1.4) в явном ви де также не выписывается, т. е.
Их, i) = 0, J= F(x, t) при t — T. |
(1.3.2) |
Функция u(f) называется допустимым управлением, если она измерима и u(t) ^ U для всех t ^ fo, где U — замкнутое ограниченное фиксированное множество. Обоз
начим через Xu(t) соответствующее решение задачи Ко ши (1.3.1) при фиксированном допустимом управлении
u(t) и е ^ (0, еоЗ, а через Г® —первый момент времени,
когда траектория |
(t) достигнет поверхности |
Их, t) *■= |
= 0 из (1.3.2), т. е. |
Ти — наименьший корень уравнения |
|
к (4 ( * ) , « ) = 0, |
(1.3.3) |
30 |
МЕТОД МАЛОГО ПАРАМЕТРА |
[ГЛ. 1 |
Здесь ео > 0 — заданная постояппая. Сформулируем теперь в новых обозначениях вариационную задачу: для заданного е <= (0, sol найти функцию иеit)— оптимальное управление, реализующее минимум функционала (1.3.2)
yS = F (4 (r l),r J ), |
(1.3.4) |
на классе допустимых управлений.
Предположим, что для всех е е (0, ео! существует оптимальное в смысле (1.3.4) управление ifit). Обозна чим через яеШ, Те оптимальную траекторию и момент окончания оптимального процесса соответственно. Необ ходимые условия оптимальности в данном случае имеют следующий вид. Существует вектор-функция peit) такая, что удовлетворяется уравнение
V = - ^ Я (р '((), |
t, u'(«), в) |
(1.3.5) |
и условие трансверсальности
р‘ (т ‘) = |
ПР“ |
t = r - |
Здесь Я — функция |
Гамильтона, |
достигающая макси |
мума по аргументу и при фиксированных других аргу-
H (p B(t), xR{t), t, ие(t), e) - m ax tf(p e(t), x*(t), |
t, u, e), |
u<=U |
(1.3.7) |
|
|
Hip, x, t, u, e) = ip, f i x , t)) + e(p, fix , t, |
и)). |
В (1.3.6) F и h означают полные производные по t вдоль 1 траекторий системы (1.3.1), аналогично (1.1.5). Изложим кратко для задачи (1.3.1), (1.3.2) процедуру малого параметра § 2. Положим формально в (1.3.1)
8 = 0; получим задачу Коши: х = f i x , t), я(*0) = а. Обоз начим ее решение через aPit) и найдем момент времени Т° как первый корень уравнения hix°it), t) = 0. Далее положим 8 = 0 в правых частях (1.3.5), (1.3.6); получим задачу Коши
p = -A * it)p ,
p i^ ) |
Г F jx ° (t ) , |
t) d h jx °(t), t) |
dF jx° (t) |
(1.3.8) |
|
|
|
|
L * ( ^ W , |
- 1 |
• |