Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Управление колебаниями

..pdf
Скачиваний:
2
Добавлен:
12.11.2023
Размер:
15.93 Mб
Скачать

СЛАБО УПРАВЛЯЕМЫЕ СИСТЕМЫ

21

Введем матрицы размера п X п

 

 

(1.2.8)

при

 

ж =ф (£, с), i, / = 1, . . п.

 

Равенства (1.2.5), (1.2.6) задают преобразования, пе­ реводящие вектор с в ж п обратно. Матрицы (1.2.8), как матрицы Якоби для этих взаимпо обратных преобразова­

нии,

связаны

соотношением Ф = G~l. Ранг

матриц ра-

веп

/г.

ж1 удовлетворяет линейной

неоднородной

Функция

системе (1.2.4). Соответствующая однородная система

является системой в вариациях для уравнений нулевого приближения (1.2.3), которой удовлетворяет ж0. Как из­ вестно из теории обыкновенных дифференциальных урав­ нений [1031, матрица Ф из (1.2.8) представляет собой фундаментальную матрицу для системы в вариациях. Пользуясь этим, запишем при помощи метода вариации произвольных постоянных общее решение неоднородной

системы (1.2.4)

t

ж1 = Ф (t1с) b + Ф (i, с) J Ф 1 (т, с) f1(ж0 (т), т, и (т)) dx.

Определим вектор Ъ произвольных постоянных при помощи начального условия для ж1 из (1.2.4) и пользуясь

равенством Ф-1 = 6?, получим

 

 

 

я ^ ) =

ф(1, c)G (t0, с) аг +

 

 

 

 

 

t

 

 

 

 

+

Ф (*, с) J G(т, с) f1(ж° (т), т, и {%)) ф .

(1.2.9)

Выразим

еще величину

Г1 из

третьего

равенства

(1.2.4)

и затем подставим

ее в

четвертое

равенство

(1.2.4)

 

 

 

 

 

 

 

 

 

=

1, .. .. г.

 

 

 

 

 

(1 .2 .10)

22

МЕТОД МАЛОГО ПАРАМЕТРА

[ГЛ. i

Вектор р°, как следует из (1.2.3), удовлетворяет ли­ нейной однородной системе, которая является сопряжен­ ной по отношению к упоминавшейся выше системе в ва­ риациях. Поэтому (см. [103]) фундаментальная матрица для нее равна (Ф-1)' = G', где штрих означает транспо­ нированную матрицу. Следовательно, общее решение си­ стемы (1.2.3) для р° имеет вид (в векторной и скалярной запнсн соответственно)

р° =

G' (if, с) Я, S — («!,

. . .,

dg.

 

( 1. 2. 11)

 

i=l *

* = 1--

.. , п.

 

 

 

Здесь s — вектор произвольных постоянных. Подстав­ ляя решепие (1.2.11) в условие (1.2.3) для р°(Г0) и учи­ тывая равенство ( £ г ') _1 = Ф', получим

e) U ° - ^ - + 2

-Ml

при t Т°.

M дх дх

 

 

 

(1 .2.12 )

Перейдем к определению управления в первом при­ ближении (в нулевом приближении система неуправляе­ ма). Подставим в функцию II нз (1.1.10) представления (1.2.1) и (1.2.2) и разложим эту функцию в ряд по в

Н = (/>, /) = (/Л /° (я0, *)) -|-е

+

+ (р\ /° (я°, *)) + (р°, Z1 (*°,

И))J + •■•

Точками обозначены члены порядков выше первого. Из выписанпых слагаемых лишь последнее зависит от и. Поэтому определение максимума II по и в (1.1.11) сво­ дится в первом приближении к максимизации этого по­ следнего слагаемого

( / > ° ( * ) , / Ч * ° ( г) , * , » ( * ) ) ) =

= SUP (рО ^/Ч *0 (*),*, и)). (1.2.13)

иеи

Управление uit), определяемое соотношением (1.2.13), может и не быть близко к оптимальному в смысле метрики в

I 2’

СЛАБО УПРАВЛЯЕМЫЕ СИСТЕМЫ

23

пространство

С (т. с. по максимуму модуля

разпости).

Однако опо будет приближенно оптимальным в смысле минимизируемого функционала. В самом деле, из извест­ ных формул для первой вариации функционала [181] следует, что функционалы для двух различных управле­ ний отличаются па величину того же порядка, что и функции II для этих управлений. Но при соблюдении условия (1.2.13) фупкцпя Я для управления u(t) будет отличаться от максимума функции Я, достигаемого при выборе оптимального управления, на величину порядка отброптсппых членов, т. е. порядка е2. Такой же порядок малости <9(е2) будет иметь' п отличие по функционалу между приближенным и точным оптимальными управле­ ниями. Отметим, что отличие по функционалу между лю­ быми двумя допустимыми управлениями в слабо управ­ ляемой системе (1.1.1), (1.2.1) составляет величину по­ рядка е. Строгое обосповаппе алгоритма и оценка точ­ ности погрешности построеппого решения излагаются далее в § 3.

Отметим, что согласно (1.2.13) управление u{t) зави­ сит только от решений пулевого приближения x°(t) и p°(t). Подставляя решение (1.2.11), условие (1.2.13) мож­ но переписать в виде

~

(G's, f) = 2

Sifj(x°(t), t, u)^sup. (1.2.14)

 

1 J

иен

2. Описание алгоритма. Полученные соотношения позволяют получить приближенное решение поставлен­ ной задачи оптимального управления. При этом траекто­ рия я(£), а также момент Т и функционал / определя­ ются в первом' приближении (с учетом двух членов раз­ ложений (1.2.2), т. е. с погрешностью порядка е2), а сопряженные переменные р(£) и постоянные X, — в пу­ левом приближении. Аналогично изложенному выше могут быть построены указанные величины в более вы­ соком приближении по степеням малого параметра 8.

Определение решения первого приближения сводится

кследующим этапам.

1.Находим общее решение системы нулевого приб­ лижения, т. е. функции (p, g из (1.2.5), (1.2.6), а также матрицы Ф, G из (1.2.8).

24

 

МЕТОД

МАЛОГО ПАРАМЕТРА

[ГЛ. 1

2.

В нулевом приближении траектория я°(г) опреде­

ляется

равенствами

(-1.2.7), момент Т° и

функционал

У0 — третьим и пятым

равенствами (1.2.3).

Четвертое

равенство (1.2.3) считаем выполненным по условию.

3.

Функция p°(f) определяется

равенствами (1.2.11),

а вектор

s — равенством (1.2.12), в

которое

следует под­

ставить Я° из (1.2.3). Правую часть равенства (1.2.3) для Я0 и (1.2.12) следует брать при х — х°(Т°), t = T°. Таким образом, равенства (1.2.3), (1.2.11), (1,2.42) определяют функцию p4t) с точностью до г произвольных постоян­

ных Я®, которые будут найдены ниже.

4. Подставив z°U) и р°Ш в условие (1.2.13) или (1.2.14) и вычислив супремум по и, найдем управление

u(t) также с точностью до г неизвестных постояппых Я?.

5.Подставим х°Ш и u(t) в равенство (1.2.9) и найдем ххit) и, в частности, хх(Т°) с точностью до тех же по­ стоянных.

6.Подставим t = TQ, x = xQ(T°) и найденное значение хЧТ°) в соотношение (1.2.40). Получим в общем слу­

чае г трансцендентных уравнений для определения посто­ янных Я®, которые входят в хЧТ°). Разрешая эти урав­ нения (предполагаем, что решение существует), найдем постоянные Я®. Теперь функции p°(t), u(t), xx(t) и по­

стоянная Я°, найденные в этапах 3 — 5, полностью опре­ делены.

7. Поправку Т1 к моменту окончания процесса и J1 к функционалу найдем последовательно из третьего и пя­ того равенств (1.2.4), в которые нужно подставить уже известные значения х = х°(Т°), t = T° и хх(Т°).

3.Дополнительные замечания.

З а м е ч а н и е 1.2.1. Рассмотрим решение поставлен­ ной задачи еще в том важном случае, когда краевые ус­ ловия д = 0 в конце процесса отсутствуют (кроме усло­ вия h 0, служащего для определения момента оконча­ ния процесса). В этом случае размерность г вектора q из (1.1.3) равна нулю, и поэтому в равенствах §§ 1, 2 сле­

дует опустить члены, содержащие q{, q\ и постоянные Я;,

Я®. Соотношения (4.2.40) также нужно опустить. Приб­ лиженное решение задачи в этом случае значительно упрощается, так как опускается одна из самых сложных его частей — решение системы уравнений (этап 6). При

СЛАБО УПРАВЛЯЕМЫЕ СИСТЕМЫ

25

выполнении этапов 3 — 5 функции р°Ш, uCt), x4i) теперь

определяются однозначно. В остальном схема решения остается той же.

З а м е ч а н и е

1.2.2. Рассмотрим еще задачу о мини­

мизации интегрального функционала

 

т

 

/ = \ U (х, t,u)dt,

 

/* (я, t, и) =

/® (ж, tt и) + е/1 (х, t, и) + .. .,

где /* — заданная функция. Уравнения, краевые условия

иограничения по-прежнему задаем в виде (1,1.1)—

(1.1.2), причем имеют место разложения

(1.2.1). Если

/® не зависит от и, то введем новую

фазовую координа­

ту и функционал соотношениями

 

 

i* = /* = /,° (*, *) + е/.1 (*, *,»)+■..,

** (fo) = О,

Если же

/® зависит явно от и, то полагаем

х* =

е/* = е/I (ж, *, и) + . . . ,

х* (*0) = О,

= е / = ж* (Г).

Увеличим на единицу размерность вектора х за счет добавления к нему новой компоненты ж*. Тогда исход­ ная задача, эквивалентная задаче минимизации функцио­ нала /*, полностью сведется к рассмотренному выше в § 2 случаю. По методике § 2 можно определить минимум функционала /* с погрешностью порядка е2. Для исход­ ного функционала J погрешность решения соста­

вит

величину поряда

е2 в случае, когда /®

не зави­

сит

от и, и величину

порядка е, когда /® явпо

зависит

от и.

Рассмотрению некоторых задач оптимального управ­ ления указанного типа для слабо управляемых систем с

интегральным функционалом посвящена

работа [1061.

В ней получены оценки погрешности

приближенного

решения для случая интегрального функционала, содер­ жащего положительно определенную квадратичную фор­ му от управления.

26

МЕТОД МАЛОГО ПАРАМЕТРА

1ГЛ. 1

За м е ч а н и е 1.2.3. Изложенный подход можно при­ менять для построения приближенных аналитических решений задач оптимального управления в случае слабо управляемых систем. При этом значение параметра е мо­ жет фактически быть не очень малым. Следует отметить, что задачи управления механическими объектами часто относятся к рассмотренному выше типу слабо управля­ емых систем. Параметр е здесь характеризует отношение управляющих сил к неуправляемым силам.

За м е ч а н и е 1.2.4. Изложенным методом малого па­ раметра можно получать исходное (начальное) прибли­ жение для последующего решения задачи онтимальпого управления на ЭВМ различными численными методами.

Вчастности, метод малого параметра применяется в сочетании с численным методом последовательных приб­

лижений, предложенным в работе [122] и развитым в [123], см. также [231]. Малый параметр при этом может вводиться в систему (-1.1.-1) искусственно, например, од­ ним из следующих способов:

 

x = f(x,

t, ей),

x =

efixt t,

и),

 

так, чтобы она

была

слабо

управляемой

при е < 1.

По­

строив решение

при малом е, затем постепенио (шагами)

увеличивают

е

до

е =

1, решая

численно при каждом

значении е

задачу

оптимального

управления. При

этом

в качестве начального приближения в расчетах исполь­ зуется полученное оптимальное управление для преды­ дущего значения е. Таким образом часто удается до­ биться сходимости численного метода в тех случаях, ког­ да его непосредственное применение при е = 1 не дает желаемого результата.

4. Локальная оптимальность. Так как первые интег­ ралы (1.2.6) системы нулевого приближения предпола­ гаются известными, то их можно взять в качестве новых искомых функций в системе (1.1Л). Другими словами, равенства (1.2.5), (1.2.6) можно рассматривать как пря­ мое и обратное преобразования от вектора переменных х к вектору новых переменных с, причем вектор с будет постоянным лишь в нулевом приближении. Такое преоб­ разование применяется в небесной механике, где пере­ менные типа с называются оскулирующими элементами.

Рассмотрим решение пп. 1, 2 § 2, считая, что в ка­ честве фазовых координат выбраны первые интегралы

§ 21

СЛАБО УПРАВЛЯЕМЫЕ СИСТЕМЫ

27

системы нулевого приближения (т. е. оскулирующие пе­ ременные с пз (1.2.6)) и что эти переменные затем попрежнему обозначены через х. Ход решения п.п. 1, 2 § 2 останется неизменным, но появятся некоторые упро­ щения, связанные с выбором фазовых координат. Так как новые фазовые координаты тождественно постоянны в нулевом приближении, то в соотношениях п. п. 1, 2 § 2 оледует положить /° = 0. При этом, как легко видеть, функции ф, g из (1.2.5), (1.2.6) и матрицы (1.2.8) равны

 

 

ф(г, с) =

с,

g(x, t) = xi

(1215)

 

 

Ф(*, c) = G(t, с)= Е .

 

Здесь

единичная

матрица. Соотношения (1.2.7),

(1.2.9), (1.2.11),

(1.2.13) примут вид

 

х° (t) =

а0, х1 (t) =

 

t

и (т)) dx,

а1 +

f Z1 (а0, т,

р° (t) =

s,

 

 

(1.2.16)

(s, f1(а°, t, а))-►sup no

u ^ U .

Остальные равенства п. 1 § 2 также можно упростить, подставляя в них соотношения (1.2.15), (1.2.16).

Сделаем еще два предположения. Во-первых, будем считать, что краевые условия д = 0 в конце процесса от­ сутствуют. Это, как указано в замечании 1.2.1 из п. 3, дает возможность опустить в равенствах п. 1 § 2 все

члены, содержащие Я® и } !, и упростить ход решения. Во-вторых, считаем, что выполнено одно из двух усло­ вий: либо функция F0 не зависит явно от t, либо не зависит явно от х, т. е. справедливо равенство

Т Г Т Г - 0-

<‘ -2-17)

Условие (1.2.17) выполнено, например,

если Их, t) =

= t 2"*, где Г* — заданное число. Тогда момент Т окон­ чания процесса, определяемый первым условием (1.1.3), фиксирован и равен Т*, причем Т° — Т^, Т1= 0.

Учитывая сделанные предположения и

равенства

(1.2.15)— (1.2.17), пайдем из соотношения

(1.2.3) и за­

тем s из (1.2.12)

 

 

(1.2.18)

при х= х°(Т °), t = Т°.

28

МЕТОД МАЛОГО ПАРАМЕТРА

[ГЛ. 1

Подставим равенство (1.2.18) для s в последнее уеловне (1.2.16)

( * . г <»'■ * . “ »

= - ( С 11-

* . “ >) =

Т ( т г

d F ° \

dt Г

 

 

 

 

(1.2.19)

Здесь полная производная вычисляется в силу урав­

нения >(1.1.1) с

учетом членов

первого

порядка малости,

т. е. при / = е / 1. Не уменьшая точности

решения

(с пог­

решностью в малых высшего порядка), эту производную можно заменить производной в силу точных уравнений

Приближенное оптимальное управление, согласно последнему условию (1.2.16), доставляет максимум лево­ му из выражений (1.2.19). Так как производная dF°/dt не зависит явно от и, то согласно равенствам (1.2.19), управление может определяться из условия минималь­ ности полной производной dFVdt.

Управление, которое в каждый момент времени мини­ мизирует скорость dF°/dt изменения минимизируемого функционала F0, часто называется локально оптималь­ ным. Таким образом, выше показано, что в слабо уп­ равляемой системе локально оптимальное управление при сформулированных выше предположениях является приближенно оптимальным управлением. Другими сло­ вами, значения функционала для точного оптимального и локально оптимального управления отличаются на ве­ личину порядка е2.

З а м е ч а н и е 1.2.5. Локально оптимальные управле­ ния находятся обычно весьма просто. Для этого доста­ точно записать полную производную dF°/dt как функцию оскулирующих переменных, управления и времени, а за­ тем найти ее минимум по u ^ U . Управление при этом получается в виде функции от оскулирующих фазовых координат и, возможно, времени, т. е. в форме синтеза. После этого траектория может определяться либо анали­ тически, либо численным интегрированием задачи Коши. Благодаря своей простоте локально оптимальные управ­ ления пеодпократпо использовались в задачах управляе­ мого движения космических аппаратов с малой тягой, см., например, [73, 130]. При этом роль нулевого приб­ лижения играет кеплерово движение, а роль первых ин­

§ 3]

ОЦЕНКА

ТОЧНОСТИ МЕТОДА

29

 

 

 

тегралов

уравнений

нулевого приближения — обычно

оскулирующие элементы. Локально оптимальные управ­ ления применялись и в качестве начального приближе­ ния при численных расчетах оптимальных траекторий. Полученные выше результаты указывают, при каких ус­ ловиях и в каком смысле локально оптимальные управ­ ления действительно близки к оптимальным управлениям.

§ 3. Оценка точности метода малого параметра для слабо управляемых систем

1. Постановка задачи. Исследуем вопросы обоснова­ ния н оценки точности методики построения приближен­ ного решепия, развитой в § 2. Задача оптимального уп­ равления (1.1.1)—'(1.1.4), (1.2.1) рассматривается при упрощающем предположении, что краевые условия q = О

в (1.1.3) отсутствуют (см. замечание 1.2.1).

 

Систему уравнений движения

(1.1.1) представим в

виде

 

 

x = f°(x, t) + efl(x, t, и),

xito) = a.

(1.3.1)

Здесь f — некоторая функция, содержащая все по­ следующие члены разложения (1.2.1). В общем случае функция f может непрерывно зависеть от малого пара­ метра е. Однако для обоснования первого приближения эта зависимость несущественна и далее не указывается. Аналогично, возможная зависимость от аргумента е ус­ ловия h = 0 в (1.4.3) и функционала (1.1.4) в явном ви­ де также не выписывается, т. е.

Их, i) = 0, J= F(x, t) при t — T.

(1.3.2)

Функция u(f) называется допустимым управлением, если она измерима и u(t) ^ U для всех t ^ fo, где U — замкнутое ограниченное фиксированное множество. Обоз­

начим через Xu(t) соответствующее решение задачи Ко­ ши (1.3.1) при фиксированном допустимом управлении

u(t) и е ^ (0, еоЗ, а через Г® —первый момент времени,

когда траектория

(t) достигнет поверхности

Их, t) *■=

= 0 из (1.3.2), т. е.

Ти — наименьший корень уравнения

к (4 ( * ) , « ) = 0,

(1.3.3)

30

МЕТОД МАЛОГО ПАРАМЕТРА

[ГЛ. 1

Здесь ео > 0 — заданная постояппая. Сформулируем теперь в новых обозначениях вариационную задачу: для заданного е <= (0, sol найти функцию иеit)— оптимальное управление, реализующее минимум функционала (1.3.2)

yS = F (4 (r l),r J ),

(1.3.4)

на классе допустимых управлений.

Предположим, что для всех е е (0, ео! существует оптимальное в смысле (1.3.4) управление ifit). Обозна­ чим через яеШ, Те оптимальную траекторию и момент окончания оптимального процесса соответственно. Необ­ ходимые условия оптимальности в данном случае имеют следующий вид. Существует вектор-функция peit) такая, что удовлетворяется уравнение

V = - ^ Я (р '((),

t, u'(«), в)

(1.3.5)

и условие трансверсальности

р‘ (т ‘) =

ПР“

t = r -

Здесь Я — функция

Гамильтона,

достигающая макси­

мума по аргументу и при фиксированных других аргу-

H (p B(t), xR{t), t, ие(t), e) - m ax tf(p e(t), x*(t),

t, u, e),

u<=U

(1.3.7)

 

Hip, x, t, u, e) = ip, f i x , t)) + e(p, fix , t,

и)).

В (1.3.6) F и h означают полные производные по t вдоль 1 траекторий системы (1.3.1), аналогично (1.1.5). Изложим кратко для задачи (1.3.1), (1.3.2) процедуру малого параметра § 2. Положим формально в (1.3.1)

8 = 0; получим задачу Коши: х = f i x , t), я(*0) = а. Обоз­ начим ее решение через aPit) и найдем момент времени Т° как первый корень уравнения hix°it), t) = 0. Далее положим 8 = 0 в правых частях (1.3.5), (1.3.6); получим задачу Коши

p = -A * it)p ,

p i^ )

Г F jx ° (t ) ,

t) d h jx °(t), t)

dF jx° (t)

(1.3.8)

 

 

 

 

L * ( ^ W ,

- 1