книги / Управление колебаниями
..pdf
|
Г Л А В А 1 |
МЕТОД МАЛОГО |
ПАРАМЕТРА |
В ЗАДАЧАХ ОПТИМАЛЬНОГО |
УПРАВЛЕНИЯ |
В главе 1 рассмотрены некоторые способы прпменсния теории малого параметра к задачам оптимального управления. § 1 имеет вводный характер: здесь приво дятся постановка задачи оптимального управления и не обходимые условия принципа максимума, рассматрива ются различные способы выделения малого параметра. В § 2 рассмотрен класс слабо управляемых систем, раз вит алгоритм приближенного решения задачи по степе ням малого параметра, исследовано явление локальной оптимальности управлений. Оценка точности метода по функционалу, траектории и управлению содержится в § 3. В § 4 изложен пример приближенного решения за дачи оптимального управления для слабо управляемой системы. В § 5 метод малого параметра применяется для построения синтеза в одной задаче управления дви жением твердого тела вокруг центра масс. В § 6 приве дены некоторые общие замечания о применении метода возмущений в задачах оптимального управления. Резуль таты §§ 2, 4 были впервые опубликованы в работе [226], § 3 — в статье [138], § 5 — в статьях [17, 22].
§1. Постановка задачи
\.Задача оптимального управления. Исследуется управляемый процесс, описываемый системой дифферен циальных уравнений с начальными условиями
|
х = |
/U , |
f, и), |
x(to) = |
а. |
(1.1.1) |
Здесь |
x = (x i, ..., хп)— тг-мерный |
вектор |
фазовых |
|||
координат, точкой |
обозначено |
дифференцирование по |
||||
времени |
t, и = (ui, |
..., |
ит) — пг-мерный вектор |
управля |
||
ющих функций, f — (fu |
•••» /п)— заданная n-мерная век- |
тор-фупкцпя, t0— начальный момент времени, а — вектор начального фазового состояния.
12 |
МЕТОД МАЛОГО ПАРАМЕТРА |
[ГЛ. 1 |
|
|
На управление наложено ограничение |
|
|
|
uit)^U , |
t > t 0, |
(1.1.2) |
где |
U — заданное замкнутое |
множество |
в пг-мерпом |
пространстве. Функции uit) предполагаются кусочно не
прерывными. Граничные условия в конце |
процесса уп |
|||||||
равления заданы в виде |
|
|
|
|
||||
|
|
h(x(T), |
Т) = 0, qixiT), |
Я = 0 |
|
(1.1.3) |
||
и минимизируемый |
функционал (критерии |
качества) |
||||||
имеет |
вид |
|
J= FixiT), Т). |
|
|
|
(1.1.4) |
|
|
|
|
|
|
|
|
||
Здесь hix, t) и Fix, t)— заданные |
скалярные функ |
|||||||
ции, qix, |
t) = (gi, |
..., gr)— задапная |
r-мерпая |
вектор- |
||||
функция, |
причем |
О ^ г ^ /г — 1. Функции |
h, |
q предпола |
||||
гаем |
непрерывно |
|
дифференцируемыми |
по |
х, |
t, a F — |
дважды непрерывно дифференцируемой. Первое равенст во (1.1.3) служит условием, определяющим момент вре мени Т окончания процесса. Предполагается, что функ ция h такова, что при допустимых траекториях xit) она монотонно зависит от £ (в некотором интервале времени), и поэтому условие h —0 определяет для каждой допу стимой траектории единственный момент времени Т ^ t0. Второе (векторное) равенство (1.1.3) представляет собой дополнительные краевые условия в момент Т (если г = = 0, то эти условия отсутствуют). Все эти условия пред полагаются независимыми и непротиворечивыми.
Отметим, что разбиение граничных условий в (1.1.3) на условие окончания процесса h = 0 и дополнительные граничные условия q = 0 довольно условно и неединст венно; не всегда удается выделить условие окончания процесса, для которого имеет место монотонность h по £. Однако такое разбиение удобно для приближенного или
численного решения, и |
оно будет |
предполагаться вы |
|
полненным. В частности, |
для задачи с фиксированным |
||
временем окончания процесса Г* имеем h = t — T*. |
|||
Задача оптимального управления состоит в определе |
|||
нии управления uit) и |
соответствующей |
оптимальной |
|
траектории ж(£), которые |
при t o ^ t^ T |
удовлетворяют |
|
уравнениям и граничным |
условиям |
(I JI.1), (1.1.3), огра |
ничениям на управление (1.1.2) и доставляют минимум функционалу / из (1.1.4).
§ 11 |
ПОСТАНОВКА ЗАДАЧИ |
13 |
2.Принцип максимума. Применим к поставленной
задаче оптимального управления принцип максимума Л. С. Полтрягпна [176], представляющий собой необхо димые условия оптимальности.
Введем дополнительные фазовые |
координаты |
XQ ж |
хп+и определяемые уравнениями с |
начальными |
усло |
виями |
|
|
|
(1.1.5) |
Здесь и'далее д/дх — оператор градиента по фазовым координатам х, d/dt — полная производная вдоль траек торий системы С1.1.1), скобки означают скалярное про изведение векторов. Очевидно, что arn+i — t, и поэтому аргумент t у функций /, /о, h, q, F можно заменить на я„+1. Тогда система 01.4.1) будет автономной, а функцио нал (1.1.4) примет вид J= x<jLT).
Относительно гладкости правых частей системы (1.1.1) , (1.1.5) предполагается, что функции /, / 0 опреде лены и непрерывны по совокупности переменных х, #п+ь и и непрерывно дифференцируемы по гг, xn+i для всех х, xn+i, u^U .
Введем вектор сопряженных переменных ф(£) =
= (фь ..., фп), а также сопряженные переменные i|>n+i(J)
ифоШ, причем положим, как обычно, фо — —1. Функция Гамильтона Я ' и сопряженные уравнения для системы (1.1.1) , (1Л.5) примут вид
Я ' = (ф, /) -|- ф,1+1 — /о — ^ф---- f'j + фп+1----------- |
0^1 |
(1. 1. 6)
+
С учетом краевых условий (1.1.3) условия транс версальности запишутся в виде (момент окончания
14 |
МЕТОД МАЛОГО ПАРАМЕТРА |
ГГЛ. 1 |
процесса Т не фиксирован)
|
И ' = 0 при |
I - Т. |
Здесь Я, |
— неизвестные |
постоянные параметры. |
Подставим |
условия (1.1.7) в |
равенство (1.1.6) для //', |
которое затем разрешим относительно %
Полные производные по t здесь имеют тот же смысл, что и в равенстве (1.1.5). Введем видоизмененные сопря женные переменные и гамильтониан
P = * - t e > |
Р = (Рн •••.?»). |
|
Я = (/>,/) = Я ' |
|
|
Отметим, что выражение в |
квадратпых скобках |
|
(1.1.6) равно d(dF/dxh)/dt. Тогда |
уравнения (1.1.6) п ус |
ловия (1.1.7) можно с учетом .(1.1.9) записать в виде
( 1.1.10)
Согласно принципу максимума, задача оптимального управления свелась к краевой задаче для двух га-мерных вектор-функций x(t) и pit). Оптимальное управление u(t) определяется из условия супремума функции # ' по и,М', что*1iu эквивалентноолюпиа ю д условиюy^iu am u супремума функцииутхцаш. ллН поиз (1.1.10), т. е.
#(/> (*).*(*). *, w(f)) = s u p # (p (f), *(«), «, и). |
(1.1.11) |
8 i] |
ПОСТАНОВКА ЗАДАЧИ |
15 |
Система уравнений краевой задачи задается диффе ренциальными соотношениями (1.1.1), (1.1.10), а крае вые условия — равенствами (1.1.1), (1.1.3), (1Л.Ю). Не известная управляющая вектор-фунщия и исключается при помощи равенства (1.1.11). Параметр X определяется равенством (1.1.8), а момент времени Т и параметры Х\ неизвестны и определяются в процессе решения краевой задачи.
3. Задачи управления с малым параметром. Решение задач оптимального управления строится обычно при помощи принципа максимума Л. С. Понтрягипа, метода дипампческого программирования, классического вариа ционного исчисления или других методов теории опти мальных процессов. При этом точное решение задач оп тимального управления может быть построено сравни тельно редко, лишь для определенных классов задач. Большое развитие получили численные методы оптималь ного управления, см., например, книги и обзоры [43, 44, 56, 57, 73, 79, 101, 117, 118, 120, 143, 149, 150, 175, 179, 205, 209, 231—233, 2351 и другие. Однако даже при ис пользовании современных ЭВМ численное построение оптимальпых управлений для сложных динамических сис тем представляет значительные трудности, особенно в том случае, когда требуется найти управление в виде синтеза.
В то же время многие прикладные задачи оптималь ного управления в явном или неявном виде содержат малые параметры, характеризующие относительную ма лость тех или иных воздействий или факторов. Поэтому могут быть развиты эффективные приближенные или асимптотические методы построения оптимальных уп равлений, основанные на идее малого параметра. При этом могут быть использованы такие широко известные методы теории колебаний, как методы теории возмущепий, метод усреднения, асимптотические методы разде ления медленных и быстрых движений и т. д. (см., например, [29, 46, 58, 64, 121, 139, 148, 1541). С по мощью этих методов удается в ряде случаев получить приближенное оптимальное управление в форме програм мы или синтеза. Отметим, что полученные при помощи приближенных методов результаты можно также при менять при построении начального приближения для численных методов.
16 |
МЕТОД МАЛОГО ПАРАМЕТРА |
1ГЛ. 1 |
Введение малого параметра е оправдано в тех слу чаях, когда невозмущенная задача (при е = 0) может быть решена аналитически или численно значительно более просто, чем возмущенная. Например, это имеет место, когда система близка к линейной пли неуправ ляемой, или в ней выявляются медленные и быстрые переменные, допускающие разделение движений.
Рассмотрим некоторые способы вхождения малого па раметра е в задачу оптимального управления (1.1.1)— (1.1.4). Пусть функции /, h, q п F могут быть представ лены в виде разложешгй
■ / = fix, |
t, и) + е/1(х, t, |
и) -Ь в2 + .. |
h = h°ix, |
t) + eh]ix, /) + |
е2..., |
q — q°ix, t) + eq4x, i ) + |
e2..., |
|
F -F °(x, |
t) + &F'ix, i) + |
e2..., 8 e [0 , s j . □ *) (1.1.12) |
Точками обозначены высшие члены разложепнй. Со ответствующая невозмущенная задача оптимального уп
равления |
описывается соотношениями |
(1.1.1)— (1.1.4), |
(1.1.12), |
в которых полагается е = 0. |
Предполагается, |
что решение этой задачи существует, единственно и мо жет быть построено. Тогда возникает вопрос об оценке погрешности, вызванной отбрасыванием возмущающих членов порядка е в 01.1.12), а также проблема построе ния приближенного решения задачи оптимального управ ления с учетом малого параметра, т. е. вычисление по правок к невозмущенному решению.
Этот естественный прием исследования широко ис пользуется при линеаризации систем, когда функция f в (1.1.12) содержит линейные члены по х, и, а нелиней ности входят в виде возмущений. Подобные задачи рас сматривались, например, в работах [17, 22, 28, 99, 104, 105, 117, 201, 241, 247, 252].
Примеры подобного подхода для нелинейной порож дающей задачи оптимального синтеза будут изложены в § 5 данной главы.
Другой случай возникает тогда, когда в (1.1.12) функция f не зависит от управляющего воздействия и
*) Значок □ перед номером формулы означает, что данный
помер относится к группе формул, перед первой из которых стоит значок ■ .
§ 11 |
ПОСТАНОВКА ЗАДАЧИ |
1 7 |
|
[226]. |
Соответствующую систему |
естественно |
назвать |
слабоуправляемой: при € = 0 она |
превращается в неуп |
равляемую, а отличие между управляемым и неуправ
ляемым |
движениями, вообще говоря, будет |
порядка е. |
||
Таким системам посвящены §§ 2—4. |
|
|
||
Если интервал движения управляемой системы неог |
||||
раничен |
(асимптотически |
растет) при |
е |
0 (например, |
Т ~ е-1), |
то даже малые |
управляющие |
воздействия мо |
гут привести к существенному изменению фазовых перемепиых. Такая ситуация характерна для многих задач управления колебательными системами, когда малые управляющие силы вызывают большие изменения ампли туды или энергии колебаний или вращений в течение длительного времени (за много периодов колебаний). Для исследования таких систем можно эффективно ис пользовать асимптотические методы нелинейной механи ки (методы усреднения), изложенные в монографиях [46, 47, 64, 145, 148]. Применению асимптотических ме тодов типа усреднения к задачам оптимального управле
ния посвящено большое |
число |
работ, например, [1—3, |
||||||||||
9—13, |
15, |
16, |
20, |
21, |
23, |
24, |
69, |
81, |
130, |
148, |
155, |
156, |
172—174, 184, 229, 230, 245, |
262]. Проблемам |
управле |
||||||||||
ния колебательными |
системами |
с малым |
параметром, |
|||||||||
разработке |
асимптотических |
методов |
построения опти |
мального управления в таких системах посвящена зна чительная часть данной монографии (главы 2—5).
В последнее |
время получило развитие |
также иссле |
|||||||
дование сингулярно |
возмущенных задач |
оптимального |
|||||||
управления |
[35, |
71, |
80, |
253, |
257, |
258, |
261, |
263, |
265,267]. |
Управляемая система (1.1.1) называется сингулярно воз мущенной, если при е = 0 ее порядок уменьшается. Та кая ситуация возникает, если некоторые (например, первые s) из компонент вектора f могут быть представ лены в виде
fi = tTVr1 (*, |
и) + ft (я, t, и) + |
в . . ( 1 . 1 . 1 3 ) |
|
i = 1, .. . , s; |
1 ^ s<Zn. |
|
|
Формально полагая |
e = 0 в |
(1.1.4), (1.4.13), приходим |
|
к системе, содержащей 5 конечных уравнений |
|||
/Г 1 (я, tt и) = 0, |
i —1, . . . , |
s, |
п п — s дифференциальных уравнений. Для исследования
Z ф. Л. Черноусько, л . Д. Акуленко, В. Н. Соколов
18 |
МЕТОД МАЛОГО ПАРАМЕТРА |
1ГЛ. 1 |
подобйых задач оптимального управления обычно исполь зуют асимптотические методы типа пограничного слоя и теорию обыкновенных дифференциальных уравнений с малым параметром при старших производных [62, 154, 204]. Отметим, что множество U в (1.1.2) также может зависеть от переменных х, t и от малого параметра. В ряде случаев простым преобразованием в пространстве управлений его можно перевести в постоянное множест во. Например, пусть множество U(x, t, е) задано нера венствами
|гг,| cf(x, t, e), i = 1, ..., m,
где с,- — известные положительные фупкцип. При помощи
преобразования м4= с,1М £ = 1, — т, где щ — повыс уп равления, это множество переводится в постоянное мно
жество |и\|^ |
1. |
Ниже |
множество |
V предполагается |
по |
|
стоянным. |
и |
более |
сложные |
случаи вхождения |
ма |
|
Возможны |
||||||
лого параметра |
в задачу |
оптимальпого управления |
||||
(1.1.1) — (1.1.4), |
когда |
для |
решения требуется комбини |
|||
ровать различные методы малого параметра. |
|
§2. Слабо управляемые системы
1.Вывод уравнепнй движения и приближенное ре шение задачи. Будем рассматривать задачу управления
(1.1.1)— (1.1.4) |
в предположении, |
что функции /, h, q, F |
|||||||
и вектор а разлагаются в ряды по |
малому параметру е |
||||||||
|
■ |
/ = /°(z, t) + |
е /1(х, |
£, |
гг) + ..., |
||||
|
|
h = |
h°(x, |
t) + ehl(x, t) Н-..., |
|
||||
|
|
q = |
q°(x, |
t) + |
ед'(.т, |
£) + ..., |
|
||
|
F = F°(x, t)+ eF 4x, |
£) + ..., |
|
||||||
|
|
a = a° + zal + ...t |
e < 1. |
□ (1.2.1) |
|||||
Верхние |
индексы указывают помер члепов в разло |
||||||||
жениях, а |
нижние — помер |
компонент |
векторов. Так |
||||||
как функция / |
при е = 0 |
не |
зависит от |
гг, то система |
(1.1.1) при е = 0 будет неуправляемой. Ее общее решение будем считать известным. При е < 1 систему (1.1.1) ес тественно назвать слабо управляемой,
§ 2 ] |
СЛАБО УПРАВЛЯЕМЫЕ СИСТЕМЫ |
19 |
|
Если функция /° зависит от и, то при е = 0 система |
не вырождается в неуправляемую и для нее, вообще го воря, существует оптимальное управление нулевого приближения. Разложение но малому параметру позво лит уточнить это управлепие. Рассматриваемый далее случай интересен тем, что в нулевом приближении уп равление вообще нельзя определить в принципе. Отметпм, что возможеп также л промежуточный случай: функция /° зависит лишь от некоторых компонент вектора управляющих функций.
Переходим к построению приближенного решения поставленной задачи оптимального управления для слабо управляемой системы (1.1.1)—(1.1.4), (1.2.1). Иско мые величины х, р, Т, Я, Я4и / ищем в виде разложений
|
■ х = х° (t) + |
ея1 (1) -f- |
.. . , |
|
|
|
|
p = |
/;°(f) + |
ep1(t )+ |
Т = Т° |
гТ1+ |
.. . , |
||
Я = Я0 + еЯ1 + |
+ еЯ1 + .. |
|
|
||||
|
J = Р + еР + |
i = |
l, |
...,г . |
□ |
(1.2.2) |
|
Подставим |
равенства |
(1.2.1), |
(1.2.2) в |
уравнения |
|||
(1.1.1), (1.4.3), (1.1.4), (4.1.8), (1.1.10), разложим |
полу |
||||||
ченные |
соотношения в ряды по е и приравняем коэф |
фициенты при степенях е° = 1 и е. В нулевом приближе нии получим
. i° = m |
0 , |
* • (* „ ) - «л |
k° (х° (Т°), Т°) = 0, |
д° {х° (Г°), Г°) = 0, |
|
Р = |
F0 {х° (Т°), Г°), |
х [ ^ + ( ^ . / " ) Г " Р п , = Г - ''1-' = |
° |
23) |
2*
20 |
МЕТОД МАЛОГО ПАРАМЕТРА |
1ГЛ. 1 |
Для равенств (1.1.1), (1.1.3), (1.1.4) выпишем еще уравнения первого приближения с учетом соотношений (1.2.3)
|
•, |
( Q f l W . 0 |
|
=*) + / 1 (*"(*). *,«(*)). |
(*.)= «*, |
||||||
|
h |
|
дх |
’ |
|||||||
|
|
[ т г + 4( зг- / • ) ]Т1+ ( £ • *' ( п ) |
I- |
= о , |
|||||||
|
|
[ ^ |
+ |
( # |
|
. ' , ) ] 1Ч + ( |
^ |
Н |
|
+0-* , " |
|
^ |
“ |
[ т г |
+ |
( ■ £ |
• |
/”) ] г + |
( £11(•г |
> ) + |
^ |
|
|
|
|
|
|
|
i = 1.........г. |
|
|
|
□ |
(1.2.4) |
|
В |
последних трех |
равенствах |
(1.2.4) |
все функции от |
|||||||
х, г берутся при значениях ж = я°(Г°), t = |
T°. |
|
|
||||||||
Перейдем к |
анализу уравнений (1.2.3), |
(1.2.4). Общее |
решение системы нулевого приближения х = fix , t) пз (1.2.3) предполагается известным и заданным в явном виде
x = q>(t, с), |
ф = (фь |
..., ф„), |
c = (ci, ..., с„). (1.2.5) |
||
Здесь ф — вектор-функция, с — вектор |
произвольных |
||||
постоянных. |
Разрешая |
равенство (1.2.5) |
относительно |
||
постоянных с, получим |
|
|
|
|
|
|
g(x, t) = |
c, |
g = (g i, |
..., gn). |
(1.2.6) |
Функции gk являются независимыми первыми интег ралами системы нулевого приближения.
Для траектории x°(t) в нулевом приближении имеем, задачу Коши, задаваемую первыми двумя равенствами (1.2.3) . Ее решение выражается через функции ф, g, введенные равенствами (1.2.5), (1.2.6)
ж0Ш = ф(£, с), c = g(a°, to). |
(1.2.7) |
Момент Т° окончания процесса и функционал /° в этом приближении определяются третьим и пятым равен ствами (1.2.3). Будем считать, что четвертое равенство (1.2.3) , т. е. краевые условия g = 0 нулевого приближе ния выполняются автоматически. Это тождество можно рассматривать как дополнительное условие, наложенное на функцию д°(ж, t).