книги / Управление колебаниями
..pdf§ 5] ТОРМОШЕНИЕ ВРАЩЕНИЙ ТВЕРДОГО ТЕЛА 51
в которой оиухцеиы члены порядка eft+I в оптимальном управлении. Это приводит к погрешности того же поряд ка в определении оптимальной траектории. Поэтому фа новая точка 2 будет находиться в eh+l-окрестности нача ла координат 2 = 0 в момент времени T(z°, е), являю щийся временем оптимального быстродействия.
Переходим к определению приближенной оптималь
ной фазовой траектории с |
погрешностью 0(eft+1), т. е. |
|||
к решению системы |
(1.5.31) с |
указанной |
точностью. |
|
Для упрощения записи введем вектор-фупкции |
|
|||
Lw (z, |
е) = |
U(k)(z, |
е )+ /(*). |
(1.5.32) |
В силу (1.5.29) функция L(h) является многочленом степепп к —1 от е. Запишем уравнение для величины Ы = I, вытекающее из (1.5.31), (1.5.32)
Z= - 1 + |
8 (11, £ (ft)(z, в)), /(0) = 1°. |
(1.5.33) |
Из ограниченности |
Ьт и равенства 1т)1 = |
1 вытекает, |
что при достаточно малом е величина I монотонно убыва ет и обращается в нуль. Таким образом, приближения к оптимальному управлению обеспечивают приведение си стемы в начало координат (торможение твердого тела). Время торможения для приближений (1.5.28), (1.5.29) отличается от оптимального времени T(z°, е) на величи ны порядка е',+1 и может быть с указанной точностью определено из (1.5.26).
Решение системы (1.5.31) будем искать в виде z = lx\ (см. п. 2). С учетом (1.5.33) для вектора ц получим ана логично (1.5.9) систему
■ iii + Dlr\nJh = |
8'IJiW(Л Л, е), |
гц (0) — Л?» |
|
Л2 — |
Лз = |
еФ2л) (Л» h 8)> |
Л2 (°) = Л®, |
Лз = |
8Ф(з0 (Л, 8)» Лз (0) = Л®1 |
Ф(,° (т], Z, е) = Г |
1 [ L w |
(I Y\, е) — i] ( T J , L lk) (lt\, е ))]. □ (1. 5 .34) |
Функции Z, 11 могут быть построены (с заданной сте |
||
пенью точности |
по |
е) разложениями по е, аналогично |
§ 2, или последовательными приближениями.
Изложим рекуррентную схему последовательных при ближений. Пусть известно решение системы (1.5.33),
4+
52 |
МЕТОД МАЛОГО ПАРАМЕТРА |
[ГЛ. 1 |
|
|
|
(1 .5 .3 4 ) в (/ — 1 )-м приближении, т. е. функции |
е), |
r|(j-i)(£, е). Тогда /-е приближение для I и Т]3 находится квадратурами, вытекающими из (1.5.33), (1.5.34)
hi) С*»6) = |
f |
= 1° - |
t + е f (ло‘—D(т, Ю, ^(A) (*(i-D (T>e) X |
|
Xil(j-i)(T ,e), e))dx, (1.5.35) |
t
Ih(j) (t, e) = 11? + S J Ф з° (Ли- D ( * , e) . *0 -1 ) (T >e)> e) f c -
о
Для определения функций rji, r)2 в j - u приближепии в левые части уравнений (1.5.34) для TJI, цг подставляются величины (1.5.35). В правые части этих уравнений, со держащие множитель е, подставим (/ — 1 )-е приближения для I, T J. Получаем
rli(j) + D h i ) е) Лзо') (^>е) ЛгО)=r £®i(j-ft) (^?е)»
ЛгО) — Dl(j) {tyе) т|зо) (tyе) тщ л = еФ5й_1} ( е), (1 .5 .3 6 )
ЛШ)(0) = Л?» ЛгШ (0) = 'Пг-
Через Ф(1 (}-1 ), Фа(}_!) здесь обозначены компоненты вектор-фупкции Ф(к) из (1.5.34), в которую вместо TJ, I подставлены (; —1 )-е приближения е), Z(j-h(f, е).
Решение соответствующей (1.5.36) однородной систе мы имеет вид, аналогичный (1.5.11)
ЛгО) = С1i C0S *j — c2j Sin Sjy 1l2(j) = Clj Sin Sj -|- Coj COS Sj,
(1.5.37)
i
sj («, e) = D j lU) (т, e) лЫ}) (т, г) dx.
о
Применяя метод вариации постоянных С\}, Сг,-, получим на осповапии (1.5.37) искомые решения неоднородной си стемы (1.5.36) в виде квадратур
■ Лкj) ft*е) = Л? cos Sj — r|2 sin Sj + t
-Ь f |Ф?о-1 ) (т, е) cos [.?; (t, е) — s} (т, е)] —
— Фги-д) (*. е) sin [sj (i, в) - Sj (т, е)] 1 <2т,
§5] |
ТОРМОШЕНИЕ |
ВРАЩЕНИЙ ТВЕРДОГО ТЕЛА |
53 |
||||
ЛзО) (г>е) = |
"*1 ? sin Sj -I- |
cos s} -|- |
|
|
|
||
|
|
t |
|
|
|
|
|
|
+ |
j |
[Фiu -1 ) (T, 6) Sin [Sj (f, e) - |
Sj (T, &)] + |
|
||
|
|
о |
|
|
|
|
|
+ |
Ф а о -п |
(T , B ) C O S |
[Sj ( f, s) — Sj (T , e)]} dx. |
□ |
(1. 5 .38) |
||
Схема последовательных приближений (1.5.35)— |
|||||||
(1.5.38) позволяет построить функции |
Z0 )(t, |
е), |
ц^(t, е) |
со сколь угодно высоким |
значением индекса / = 1 , 2 , ... |
В качестве нулевого приближения берутся функции I и |
|
т), определенные в (1.5.8), |
(1.5.10), (1.5.11). |
Так как в системе (1.5.31) уже отброшены члены по рядка e,t+1 п выше, то в процессе итераций во всех вычис лениях члены таких порядков также следует опустить.
По этой |
же причине процесс итераций следует оборвать на |
(к — 1 )-м |
шаге, взяв в качестве к-то приближения для оп |
тимальной траектории функцию z(k)(i, е )= i(k)U, e)r|(ft)(f, е). Обоснование схемы последовательных приближений и оценка погрешности метода по степеням малого парамет ра е получаются известным способом па основе теории об операторе сжатия (см., например, [100, 224]). Подста новка функций z(k)U, е) в (1.5.27)— (1.5.30) дает прибли женное выражение оптимального управления в форме программы (как функции от t, е) с погрешностью 0(ьк+1). Таким образом, приближенное решение задачи оптималь ного быстродействия для системы (1.5.3) с заданной сте пенью точности по е полностью построено. Простым рас четом при помощи соотношений (1.5.4) получается иско мое решение задачи оптимального по быстродействию торможения вращений твердого тела в исходных пере
метших 0 1 , 0 2 , 0 3 -
5.Пример. Рассмотрим конкретную механическую
модель момента возмущающих сил N{, £ = 1, 2, 3, в систе ме (1.5.1). Пусть твердое тело близко к динамически сим метричному, а коэффициенты М, Ь2 в (1.5.1) также близ ки друг к другу. Другими словами, имеем
h = /(1 + e6L), b { = Ml + ePi), e < 1,
(1.5.39)
/ 2 = / ( 1 + еб2), &2 = Ml + ep2).
ЗдесЬ I и h — главные центральные моменты инерции тела вокруг осей, соответствующих индексам 1 , 2 ; через
54 |
|
МЕТОД МАЛОГО ПАРАМЕТРА |
1ГЛ. 1 |
I обозначено некоторое среднее или певозмущенное зна |
|||
чение |
момента |
инерции, например / = V2 ( / 1 |
+ / 2.); вели |
чина |
Ъ имеег |
аналогичный смысл, а б], 62, |
Pi, (J2-- без |
размерные величины порядка единицы. Кроме того, пред положим, что на твердое тело действует малый тормозя щий момент сил вязкого трения с компонентами
з |
i = 1,2,3 |
|
v'i = — е 2 AijCOj, |
(1.5.40) |
|
i=i |
|
|
по главным осям инерции. Здесь Лц— неотрицательно определенная матрица постоянных коэффициентов.
Уравнения управляемого движения твердого тела (ди намические уравнения Эйлера) п рассматриваемом случае имеют вид (см. (1.5.1))
/i©i + (/3 — / 2)©2©з = |
+ V|, |
|
|||||
/2©2 + (/1 — /3)© 1(1)3 = |
&2ц2 + |
v 2, |
( 1. 5.4 1 ) |
||||
/3©3+ (/2~ /l)© l© 2= |
b3U3 + V3. |
|
|||||
Приведем уравнения (1.5.41) к виду |
(1.5.1). Получим |
||||||
и /©! + (/3 — I ) |
©2©з = |
|
|
|
|
|
|
= |
b[ их + |
^ |
vj + |
^ / 3 — I — f * ^ - |
2 1 j о).,(о3, |
||
/ © 2 + (/ — / 3) ©iWg = |
|
|
|
|
|
|
|
= |
ъ'ги2+ |
T2V* + |
( 7 |
~~ 7 3 - |
- 1 |
3 7 ) |
|
7 з*>з = |
Ь3и 3 + |
v 3 + (1 Х— / 2) ©л©2, |
|
||||
ь[ = bJlT\ |
&; = b j l z 1. |
□ |
(1.5.42) |
||||
Воспользуемся |
формулами |
(1.5.39) и |
(1.5.40), относя |
к возмущениям Nt гироскопические и диссипативные мо менты из правой части системы (1.5.42)
N1 = |
v i + е [ ( / 3 — 7) 6i + |
/ 6 2] © 2 © з + |
0 ( е 2), |
N 2 = |
V 2 + е [(/ - / 3)б2 - |
/ 6 ,] © ,« з + |
0 (e2), (1.5.43) |
N3 = v3 + e /(6 |— 62)©i©2 + 0 (e2). |
|
§ 5) |
ТОРМОШЕНИЕ ВРАЩЕНИЙ ТВЕРДОГО ТЕЛА |
55 |
Выполнял преобразования (1.5.4), приведем систему (1.5.42), (1.5.43) к виду (1.5.3). При этом будем иметь в обозначениях (1.5.3), (1.5.4)
|
|
з |
|
|
|
/х = |
a iz‘iz 3 — 2 |
^1 jZ5» |
|
|
|
5=1 |
|
|
|
|
з |
|
|
|
/>> == rt.,ZjZg —■ |
|
(1.5.44) |
|
|
|
5=1 |
|
|
|
|
з |
|
|
|
/3 = |
a3ZlZ2 — 2 |
^3jZj* |
|
|
|
5=1 |
|
|
Здесь постоянные ait Хц с точностью до малых вели |
||||
чин порядка е равны |
|
|
|
|
«1 “ [ < Л - / ) в 1 + /б а] ( / Л Г Ч , |
|
|||
«S = |
[(/ - h ) |
б2 - /бх] (//зГ 1 b ,, |
(1.5.45) |
|
Поставим |
задачу |
вычислить |
функцию |
Веллмана |
7'(z, е) с погрешностью О(г2), т. е. определить коэффици ент Тi(z) разложения (1.5.26). Согласно (1.5.44), функ цию F\ = (ро, /), определенную в (1.5.18), (1.5.19), можно разбить на два слагаемых, обусловленных гироскопиче скими и дпссипативпыми возмущениями
Fх (z) = |
Flv (z) + Flv (z), |
|
|
Fly (z ) = |
(«X + |
«2 + О,) ^ - 3, |
(1.5.46) |
|
|
3 |
|
& IV (Z) = |
f |
^ijZiZj. |
|
Аналогично разбиению |
(1.5.46) |
функция |
^ (z ) из |
|
(1.5.23) представляется |
в |
виде |
T\(z) = |
+ Г ьЫ . |
Для функции Г 1т(г) на основе |
(1.5.21)— (1.5.23) и (1.5.46) |
56 |
МЕТОД МАЛОГО ПАРАМЕТРА |
1ГЛ. 1 |
|
получается выражение в виде квадратуры [2 2 ] |
|
||
■ Tlv(z) = |
— 1/г (% + аг 4" аз) |
3 1[(za — zi) cos |
|- |
|
I |
|
|
|
+ 2zxz%sin 6j J у2 sin (02y2) dy + |
|
|
|
о |
|
|
+ |
[ 2 zxz2cos 0Х— (z\— zf) sin 0j f у2 cos (0 .,7/2) dpj, |
||
|
02 = Dz3l~\ |
l=\z\. □ |
(1.5.47) |
Второе слагаемое в T\— фупкция ГьЫ — вычисляет ся подобно (1.5.47) п выражается в элементарных функ циях. Имеем
|
г » ( * ) = |
- 2 |
h m iii.v*), i = l*|- (1.5.48) |
|
|
|
г,j= l |
|
|
Здесь коэффициенты a,j равны [17] |
||||
„ |
ч г + ч ? |
7 2 . |
ч;в- ч р |
sin 2сг — Т>1^ 2 ■(1 — cos 2 о ), |
« п = |
-------7--------1 |
i ------------------- |
||
|
|
|
4D43* |
|
“ “ = |
“ « = J!k |
r (1- |
- |
cos 2а) - |
i |
$ sin 2 а > |
||||
а 1з = |
a 3i = |
4 i0 ” l sina — |
|
(1 — cos а), |
|
|||||
|
|
|
+ |
|
|
|
2 а + |
^ |
( 1 -cos 2 а), |
|
а 2з = |
а зз = |
— |
|
— cos а) — ц * /)-1 sin а, |
|
|||||
аз з = 1 /2т1з^ 1 |
o = |
D4 %l2t |
|
l=\z\. |
|
п (1.5.49) |
||||
Компоненты |
единичного вектора ц* = |
(г)*, t]*f ц*) вы_ |
||||||||
ражаются |
через |
компоненты |
фазового |
вектора |
z = h\ |
|||||
формулами |
|
|
|
|
|
|
|
|
|
|
Л* = Лхcos s — Лз sin s» |
Лг = |
— Л-2 c°s s — ii, sin s, |
(1.5.50) |
|||||||
|
|
|
* |
Лз> |
s = |
V8D*3Z. |
|
|
||
|
|
|
Лз = |
|
|
|
||||
На основе п. 3 функция |
T = 1 + г(Тп + T\v), |
где ко |
||||||||
эффициенты Т{Л, |
ТХч |
определяются согласно (1.5.47)— |
||||||||
(1.5.50), является |
с погрешностью 0 (е2) |
функцией Бел- |
§ el |
з а м е ч а н и я о м е т о д е в о з м у щ е н и й |
67 |
лмана задачи оптимальпого по быстродействию торможе ния вращений системы (1.5.41) в предположениях (1.5.39), (1.5.40). Оптимальный закон торможения и первом при ближении как функция фазовых координат может быть получек на основе (1.5.30) при помощи вектора произ водных [>\ = d'i\/dz. Дальнейшее исследование движения управляемой системы (1.5.41) в первом приближении по е, т. о. вычисление фазовой траектории z(i,(£, е) может быть осуществлено при помощи методики п. 4.
Отметим одпо качественное свойство полученного ре шения. Так как А;,-— неотрицательно определенная мат рица, то таким же свойством обладает и матрица Я,-,- (см.! (1.5.45)). Следовательно, квадратичная форма (1.5.46) для /'ь неположительна, и поэтому соответствующая поправ ка еТiv к времени быстродействия также неположитель на. Таким образом, наличие моментов диссипативных сил может лишь уменьшить время торможения твердого тела.
§ 6 . Замечания о методе возмущении для вариационных задач1
1. Метод возмущений для классической вариацпоииой задачи. Выше изложены некоторые варианты метода воз мущений для задач оптимального управления. Рассмот рим применение обычного метода возмущений в такой задаче оптимального управления, в которой ограничения па управление несущественны и которая по существу эквивалентна некоторой задаче классического вариацион ного исчисления. Пусть уравнения движения управляе мой системы имеют вид
х = fix, £, и, е), |
(1 .6 .1 ) |
где х — л-мерыый вектор фазовых координат, и — тл-мер- ный вектор управляющих функций, е — параметр, f — за данная n-мерная функция своих аргументов, to и Т — заданные моменты начала и окончания процесса. В эти моменты должны выполняться краевые условия
giixito), е) = 0 , |
i= |
1 , ..., |
г; 0 < г < |
л, |
|
hjixi'D, е) = 0 , |
; = |
1 , ..., |
а; 0 ^ а < |
п, |
1-6 ,2 |
где g{, hs— заданные функции. Числа г, s удовлетворяют ограничениям (1.6.2), а в остальном произвольны. Тре-
58 |
МЕТОД МАЛОГО ПАРАМЕТРА |
[ГЛ. I |
буется выбрать управляющую функцию uit) на интерва ле Uo, Г] так, чтобы удовлетворить условиям (1 .6 .2 ) и доставить минимум интегральному функционалу
|
т |
|
|
/ = |
j‘ G{x{t), t, u{t), &)dt-+ min. |
(1.0.3) |
|
'o |
|
|
|
Заданные скалярная функция G |
и функции |
/, gt, ht |
|
в (1.6.1)—(1.6.3) |
считаем достаточно |
гладкими и |
такими, |
что задача оптимального управления (1.6.1)— (1.6.3) без ограничений на управление допускает единственное ре шение в некотором интервале [0 , бо! изменения пара метра Б.
Приведем необходимые условия оптимальпостн. Обо значим через pit) re-мерный вектор сопряженных леременпых, удовлетворяющий системе уравпепий
иусловиям трансверсальности
иV . 5М ж('о)’ е)
Р(*сW — oi i
(1-0.5)
v дкЛх{Г),г)
Р ('П =
j=i
Здесь Xi, p.j — неопределенные множители Лагранжа. Функция Гамильтона Н задачи (1.6.1)— (1.6.3) имеет вид
Hip, х, t, и, б) = ip, fix, t, и, б)) — Gix, t, и, б). (1.6.6)
Условие ее максимальности по и при отсутствии огра ничений на управление приводит к соотношениям
dJL=( |
( |
i = 1 , |
(1.6.7) |
dUj |
d u j dui |
|
|
служащим для исключения и из системы (1 .6 .1 ), (1 .6 .4 ). Представим зависящие от г функции f, G, gt, h} в
виде разложений
■ / ix, t, и, в) = |
/° (х, t, и) + б/ 1 (х, t,u) + .. . |
G(х, t, и, е) = |
G0(х, t, и) -j- eG1 (х, t, м) + ... |
§ 0] ЗАМЕЧАНИЯ О МЕТОДЕ ВОЗМУЩЕНИЙ 59
#i(x, е) = |
g°(x) 4 - eg\ (х) + .. . , |
i = |
1 , .. . , г, |
hj (х, е) = |
Щ(ж) + еЛ] ( « ) + . . . , |
/ = |
□ |
|
|
|
( 1 .6.8) |
Будем искать решение краевой задачи (1.6.1), (1.6.2),
(1.6.4)— (1.6.7) согласно методу возмущений в виде |
|
||
х (t, |
е) = x°(t) + ex1(t) + ... |
|
|
&(£, |
е) = |
u°(t) + eu4t) + . . . |
(1.6.9) |
pit, е) = |
p°(t) + &pl(t) + . . . |
|
Верхние индексы в (1.6.8), (1.6.9) указывают помер коэффициентов разложений. Подставим разложения (1.6.8), (1.6.9) в соотношения (1.6.1), (1.6.2), (1.6.4)— (1.6.7) и приравняем коэффициенты при одинаковых сте пенях е. В нулевом приближении получим
■.т° - /° (ж0, г, и»),
/,« = |
«ем»" |
“ |
|
|
* ?(* ” (*о)) = |
М (* °(П ) |
“ 0 (1 = 1 ......... |
г; = 1 ......... |
»). |
где |
— некоторые постоянные коэффициенты. |
|
Из соотношений первого приближения запишем лишь |
равенства, получаемые из уравнений (1 .6 .1 ) и краевых условий (1.6.2). Имеем уравнения в вариациях и условия на концах для вектора х1
(1 . 6. 1 1 )
МЕТОД МАЛОГО ПАРАМЕТРА |
[ГЛ. i |
Здесь др/дх, др/ди — матрицы соответствующих част ных производных. Используя условия трапсверсальпости пз (1 .6 .1 0 ) п краевые условия (1 .6 .1 1 ), устапавливаем справедливость равенств
(_ , L(,_ ! |
J |
1 = 1 |
(У ) |
|
(1. 6.12) |
||||
|
|
|
||
Аналогично имеем |
|
|
|
|
(Р°(Г ), * '(? '))= --- 5 1 |
|
г ). |
(1.6.13) |
|
? = 1 |
|
|
|
Всилу (1.6.12), (1.6.13) имеем равенство
тг
i = |
|
Г d( А а |
dt = |
(р°, х1) |
|
|
|
|
|
|
dt |
|
|
|
|
|
|
|
|
|
= |
2 |
( / ( « ) - 2 ^ h }(x am ). (1.6.14). |
|||
|
|
|
|
1 = 1 |
j=l |
|
|
|
|
С другой стороны, используя уравнения (1.6.10) для |
|||||||
р° и |
(1.6.11) |
для х\ интеграл (1.6.14) |
представим |
в виде |
||||
- |
( |
- Т |
1 |
- * ' ) + |
( л& * ) + ( л t |
u I) + |
O ’ * . |
/ *>dt■] |
|
|
|
|
|
|
|
(1.6.15) |
|
из |
Используя |
последнее соотношение |
(1.6.10), |
получим |
||||
(1.6.15) |
|
|
|
|
|
|
1=I {{€ •*‘)+(С- uj + (л «]dt•<1А16>
*9