книги / Управление колебаниями
..pdf§41 ПРИМЕР СЛАБО УПРАВЛЯЕМОЙ СИСТЕМЫ 41
найдем, что |
tg 2 a > 0 . Принимая во внимание второе со |
||||||||
отношение |
(1.4.22), |
убедимся |
в том, |
что |
0 < 2 а < я /2 . |
||||
Угол а и величина S примут вид |
|
|
|
||||||
/а |
= |
1 |
, |
(тгь о |
C O S 2 |
+ |
t sin 0О \ |
||
“ (() |
у |
arctg |
|
|
|
(1.4.23) |
|||
S = S\ при а < ао, S = S2 |
при а > |
||||||||
осо. |
|||||||||
Таким образом, управляющие функции полностью оп |
|||||||||
ределены. Угол |
ait) |
согласно |
(1.4.22) |
монотонно возра |
стает от а(0) до я/4. Отметим, что углу атаки а = л/4 от вечает согласно (1.4.21) максимальное значение коэффи циента подъемной силы Cv. Кусочно постоянная функция
Sit) имеет, очевидно, |
пс |
более одного |
переключения. |
||
В копцо процесса, так как а(Т°) = я/4 > ос0, величина S при |
|||||
нимает свое наибольшее значение S2 . Если а(0) > ао, то |
|||||
точка нереь-лючепия |
вообще отсутствует |
и S = S2 всюду, |
|||
а если а(0 ) < а0, то |
па |
начальном |
участке |
траектории |
|
S — Si. Чем больше качество К, тем |
раньше |
наступает |
переключение п тем большие значения принимает угол а в один и тот же момент времени.
Приведенные результаты хорошо согласуются с резуль татами работы [122]. В работе [122] получено численное решепис поставленной задачи для случая постоянной ат мосферы и в широком диапазоне (от 0 , 1 до 3) изменения
параметров е, 1C Сравнение оптимального |
закона |
управ |
|||
ления |
ait) из работы |
[1 2 2 ] при ао = |
9о = |
1 0 ° с |
законом |
(1.4.23) |
показывает, |
что при е = 0,1 |
эти |
законы практи |
чески совпадают, и даже при е = 0,5 отличие между ними составляет примерно 1 0 % во всем диапазоне изменения К. Момент переключения, определяемый условием (1.4.23), также хорошо согласуется с результатами расчетов (при мерно с той же точностью).
Приближенное аналитическое решение (1.4.22) полу чено при произвольной зависимости плотности атмосферы от высоты. Задавая эту зависимость, при помощи квадра туры (1.2.9) нетрудно найти и поправку к траектории, обусловленную действием аэродинамических сил. Отметим, что траектория и функционал при этом будут определены с погрешностью порядка е2, т. е. на порядок в точнее, чем управление.
42 |
МЕТОД МАЛОГО ПАРАМЕТРА |
[ГЛ. 1 |
§ 5. Приблнжепный спптез управления вращепиями твердого тела
1. Постановка задачи оптимального торможения. В ка честве примера применения метода малого параметра (теории возмущений) для приближенного построения син теза рассмотрим управляемые вращения твердого тела, близкого к динамически симметричному. Динамические уравпеппя Эйлера имеют вид
/© i -f- ( / 3 — I) ©2®з “ |
biui Ч- 1 » |
(0 ) = |
® и |
/со2 + '( / — / 3) © !© 3 = |
Ъ2иг + N2J |
© 2 (0) = |
«а, (1.5.1^ |
/ 3©3= |
Ъ3и3+ |
©3(0 ) = |
о)". |
Здесь постоянные /, /з — главные центральные момен ты инерции твердого тела при отсутствии возмущений (0< 1з,<21), — проекции вектора угловой скорости па главные центральные оси инерции, 6 <и{ — управляющие моменты, bi = const > 0 , и,- — управляющие функции, под чиненные ограничению
и* + *4 + |
1* |
(1.5.2) |
Проекции момента возмущающих сил ДО{= МД©i, ©2, ©з) есть достаточно гладкие функции переменных ю{ в некоторой окрестности начала координат, включающей шар
G>1 + + ©з < ©о, ©о = ( « ? + ©22 -Ь ©з2) 1/2.
В частности, если тело близко к динамически симмет ричному, т. е.
/, = Д 1 + 6 i), h = Я 1 + б2), 6 i>2«: 1 ,
то функции Nt содержат гироскопические возмущения ви да 7(6i — бг)©1 ©2. Конкретные модели возмущающих мо ментов N{ (i = 1, 2, 3) рассматривается ниже. Далее пред полагается, что величина возмущений мала по сравнению с моментом сил управления. Это предположение можно
формализовать введением малого числового параметра е, полагая N{= eb{fu i= 1 , 2 , 3 .
Для возмущенной управляемой системы (1.5.1), (1.5.2) поставим задачу оптимального по быстродействию тормо-
§ 51 ТОРМОЖЕНИЕ ВРАЩЕНИЙ ТВЕРДОГО ТЕЛА 43
жештя вращений. Требуется перевести фазовую точку системы из начального состояния (1.5.1) в пачало коорди нат ыДУ') - 0, i “ l, 2 , 3, за' минимальное время Т. Для итого необходимо найти закон управления в виде синтеза щ = о)2, оз3), оптимальную фазовую траекторию
как функцию времени t н начальных данных со?,а.также минимальное значение времени торможения как функцию
начальных данных: Т = Т (со?, со?, ю?).
Отметим, что исследованию управляемых движений твердого тела относительно центра масс посвящено значи тельное число работ (см. главу 5). Приведенная постанов ка задачи оптимального торможения представляет самосто ятельный интерес, но может рассматриваться и как со ставная часть более общей задачи управления, например, переориентации твердого тела в абсолютном пространст во. Выбранное ограничение па управление (1.5.2) соответ ствует двигателям ограниченной суммарной мощности [73] или верньерным двигателям ограниченной тяги [34].
Линейным преобразованием переменных система (1.5.1) приводится к удобному для дальнейших исследований
виду |
|
|
|
|
|
|
zi ■+■ D1z2z3 = |
uL-(- efL(г^, z2, z3), |
Zj (0 ) = z?, |
|
|||
z2 = A ¥ j = |
tt.2 + |
e/2 (z1 ,z 2,z !)), |
z 2 (0) = |
z2, |
(1.5.3) |
|
2з = |
из+ |
e/з (zlt Z2, z3), |
z3(0) = |
z3. |
|
|
Здесь переменные z., функции /, и параметры D\, |
||||||
определяются соотношениями |
|
|
|
|
||
Z1 — I&ibi |
Z2= |
/( 0 2&2 *, |
Zj = |
/ 3(i)3&3 |
, |
CJ ^ |
N i-eb J i |
(i = 1 ,2 ,3 ), /) li2 = i L = i - | M b 3. |
|
||||
|
|
|
|
|
°i,a |
|
Поставленная задача синтеёа содержит малый пара метр е, и для ее решения нужно сначала найти порожда ющее решение, соответствующёе е = 0. В общем случае для произвольных D\, D2 явно решить задачу синтеза для системы (1.5.3) при е = 0 не удается. В случае же равенст ва D\—D% — D певозмущепная система (1.5.3) при « — 0 становится управляемой системой с инвариантной нормой,
44 |
МЕТОД МАЛОГО ПАРАМЕТРА |
[ГЛ. 1 |
допускающей при щ = 0 первый интеграл
z\ -1- z\-f- z\= const.
Синтез оптимального управления при 6 = 0 в этом слу чае может быть найден явно [34], что дает возможность построить приближенное решение для е < 1 методом воз мущений. Отметим, что согласпо (1.5.4) рассматриваемый случай D \=D i=i) реализуется либо при b{ = b2, либо при равенстве момептов инерции / = / 3 (тогда имеем
D\=D2 = 0).
2.Синтез оптимального торможения для нсвозмущен-
ной системы. Исследуем систему (1.5.2), (1.5.3) при |
&= 0 |
|
в предположении, что DI = D 2 = D, т. е. рассмотрим зада |
||
чу управления вида |
|
|
Z\ Л-DZ2Z$= Hi, z2— Dz\Zz = u2, |
z3 = щ, |
|
2 (0 ) - г ° , 2 (Г) = 0 , Г -*■ min, |
lul < 1 . |
(1'Э'о) |
Через z и и обозначены векторы с компонентами (zi, z2, Z3) и (7/ 1, из) соответственно, символ М означает мо дуль вектора.
Решение задачи (1.5.5) получается прп помощи просто го прпема. Умножим каждое нз уравнений (1.5.5) па z,Z_1, где Z=|z|, п сложим все уравнения. Получим скаляриое уравнение
1=(и, г]), 1] =zl~\ Z(0) = |
|z°| = Z°. |
(1.5.G) |
Из (1.5.G) с учетом соотношений |
М < 1 , |
|ц1 = 1 сле |
дует |
|
|
- u U i . |
|
|
В левом из иолучеппых неравенств знак равенства до |
||
стигается при управлении |
|
|
|Н| = |
1, |
(1.5.7) |
которое, очевидно, н является оптимальным по быстро действию.
Подстановка функции (1.5.7) в уравпеппс (1 .5 .6 ) при
водит к равенству I —— 1 , откуда следует |
|
г = г°(1 —(2Т 1), г 0 = г°. |
(1.5.8) |
$5] |
ТОРМОЖЕНИЕ ВРАЩЕНИЙ ТВЕРДОГО ТЕЛА |
45 |
Здесь Го — время оптимального быстродействия. Под
ставим теперь функцию Щ (1.5.7) в уравнения (1.5.5), Получим систему с заданными начальными условиями, для которой известен один из интегралов (1.5.8). Ее решение ищем в виде z = ZT], где г](£) — неизвестная вектор-функ ция, удовлетворяющая условию |,г)(<)| = 1 . Подставляя z{= /(£)% в уравнения (1.5.5) и учитывая (1.5.8), для не известных функций rji получим уравнения
% + Dh\2v\3= 0 , |
щ — Dlrtf)3 = 0 , -Пз = 0 , |
г). (0) = |
Т1?, i = 1 ,2 ,3 . |
Введем в системе (1.5.9) новую независимую перемен ную а
cr = B » | t ( l - 1/ I« 7 1) |
(1.5.10) |
и воспользуемся выражением (1.5.8) для Z. Тогда с уче том цз = const система (1.5.9) для тц, т)2 сведется к ли нейной системе с постоянными коэффициентами. Интегри руя, найдем
11i = |
Й. (*0)- 1 |
cos (а + |
сг0), |
cos <J0 = z\ (Z®)-1 , |
т]2 = |
Zj}. (Z0)- 1 |
sin (<т + |
<J ), |
sin <r0 = z\(Zj.)-1 , (1.5.11) |
Т Ь -* 8 (*°)Л |
l.± = |
(z\ + |
zlY'\ |
|
Отмстим, что скорость изменения фазы о колебаний |
||||
вектора (r)j, т]г) обращается в |
нуль при t = T0 вместе с |
величиной Z модуля вектора z. Таким образом, решение задачи оптимального быстродействия для невозмущенной системы (1.5.2), (1.5.5) полностью построено в виде (1.5.7), (1.5.8), (1.5.10), (1.5.11). Простым пересчетом по формулам (1.5.4) получается решение в исходных пере
менных ом, 0)2, о)э. Зависимость |
фазовой переменной zi, |
|||
а также величин Z, 1± и о + оо от времени t качественно |
||||
представлена на рис. 1 .1 . |
|
оптимального |
синтеза. |
|
3. |
Приближенное построение |
|||
Подставим управление и0из (1.5.7) в |
возмущенную |
си |
||
стему |
(1.5.3). Для величины Z=lz| |
получим уравнение |
||
|
г------1 —e(T|, /), |
Z(0) = |
Z°. |
|
Так как Кц, /)1 < 1/1, то вследствие ограниченности функции / = ( / ь /2, /з) в окрестности начала координат
46 |
м е т о д М а л о г о п а р а м е т р а |
1ГЛ. i |
величина I достигнет нуля за некоторое время Т, отличпое от Го = 1° на величину порядка е. Следовательно, син тез управления (1.5.7) обеспечивает торможение тола за время Г, близкое к Г0.
Еис. 1.1.
Построение синтеза оптимального управления с уче том возмущающих моментов с некоторой заданной степепыо точности по малому параметру е можно осущест вить при помощи метода динамического программирова ния. Для этого построим приближенное решение задачи Коши для уравнения Гамильтона — Якоби — Веллмана [43, 53]:
|
G = (В*Л . - 1*л , 0), |
Т (0, е) = о. ( 1 -5Л2) |
|||
Здесь |
Г = T(z, е) — функция |
Веллмана — минималь |
|||
ное значение функционала |
(времени торможения) |
для |
|||
процесса, |
начинающегося в |
фазовой точке |
ъ; G — вектор |
||
гироскопических моментов, |
дТ!дъ — вектор |
частных |
про |
изводных функции Г по z. Таким образом, в левой части уравненпя (1.5.12) стоит скалярное выражение, минимп-
§5J |
ТОРМОШЕНИЕ ВРАЩЕНИЙ ТВЕРДОГО ТЕЛА |
47 |
зация по и которого приводит к оптимальному управле нию вида
и*
Подставляя (1.5.13) в соотношение (1.5.12), получим задачу Коши для нелинейного уравнения в частных про изводных
Ipl -I- (р, G) + ъ(р, /) = 1, Г(0, е) = 0. (1.5.14)
Решение задачи (1.5.14) в предположении, что фупкция / достаточное число раз дифференцируема в ^-окрест ности начала координат z = 0 , строится разложениями по степепям параметра е
П*, е) - В Д + вГ,(*) + ... + 8"ДЫ +
Гл(0)==0, к = 0, 1, 2, ...
В соответствии с методикой теории возмущений пред ставление (1.5.15) подставляется в (1.5.14). Приравнива ние коэффициентов при одинаковых степенях е позволя ет получить последовательность уравнений в частных производных с нулевыми условиями. В дальнейшем бу дем использовать обозначение
дТ |
(1.5.16) |
Pk = -g±, fc = 0 ,1 ,2 ,... |
При к = 0, что соответствует певозмущенной системе (1.5.5), получим нелинейную задачу Коши вида
1ро1 + (ро, 0 = 1, Го(0) = 0. |
(1.5.17) |
Решение задачи (1.5.17) доставляет функция
а д - 1 * 1 - г, PO= TI = ^ - I |
а.5.18) |
из (1.5.8), для которой lpol = l, (ро, 0 = 0 (см. формулу (1.5.12) для G). Фупкцпя (1.5.18) всюду пенрерывпа и непрерывно дифференцируема в каждой точке, кроме точки z = 0, где производные не определены. Однако урав нение (1.5.17) формально удовлетворяется п в точке z —0. Таким образом, выражение (1.5.18) ость функция Веллмана невозмущепной задачи оптимального управле ния (1.5.5), а ро = г). Из (1.5.13), (1.5.15), (1.5.18) полу
МЕТОД МАЛОГО ПАРАМЕТРА |
1ГЛ. 1 |
чим пулевое приближение для управления, совпадающее
с (1 .5 .7 ): и* (z, 0 ) = и* (z) = |
— Ц. |
|
|
|
|
Отметим, что так как Ipol = li т0 проведепное в урав |
|||||
нении (1.5.14) разложение |
вблизи |
Т = 7o(z) |
справедливо |
||
при достаточно малых е. |
определяющее функцию T\(z) |
||||
Следующее уравнение, |
|||||
в (1.5.15), является линейным |
с |
известной |
неоднород |
||
ностью |
|
|
|
|
|
(ри Ро) + (ри G )= F U F\{Z) = |
(Ро, /(z)), |
Г ,(0 )= 0 . |
|||
|
|
|
|
|
(1.5.19) |
Здесь вектор G дан формулой |
(1.5.12), |
а ро — форму |
|||
лой (1.5.18). Решение задачи Коши (1.5.19) |
можно по |
строить методом характеристик [170]. Семейство харак теристик строится однозначно, так как сумма квадратов коэффициентов при частных производных здесь отлична от нуля:
|
(Ро “Ь &)2 = 1 + -D2 ( z 1 |
+ z|) Zg ^ |
1. |
|
|
||||||
Уравнения |
характеристик |
задаются |
соотношениями |
||||||||
|
|
|
|
|
|
|
|
« |
|
|
,, 5 20. |
|
ч ,+ |
л « А |
ч , - DV , |
~ |
ч , “ - |
F l (,)• |
|
|
|||
Общий интеграл первых двух уравнений (1.5.20) удоб |
|||||||||||
но представить в форме, аналогичной (1 .5 .1 1 ) |
|
|
|||||||||
|
Zi = |
adcos OfaDfrl2+ x) = |
ф| (Z, ar p, |
T), |
|
|
|||||
|
z2 = |
-a Z sin (V2Z)pZ2 + x) =q)2(Z, |
a, |
p, |
x), |
(1.5.21') |
|||||
|
z3 = |
pZ = |
фз(£, a, p, x), |
|
|
|
|
|
|
||
|
|
|
a, |
p, т = |
const, |
a2 + p2 == 1 . |
|
|
|
||
Из |
соотношений (1.5.21) |
постоянные |
a, |
p, |
т могут |
||||||
быть |
выражены |
как |
функции |
вектора |
z |
следующим |
|||||
образом: |
|
|
|
|
|
|
|
|
|
|
|
а = 1 |
х Г 1, |
Р = ZjZ_1, C O ST = { z y coss — z2 sin s) (Z±)_1, |
|||||||||
|
sinx = |
— (z^in s -f z2cos s) (Zx)“ \ |
|
|
(1.5.22) |
= (*I + 2г)1/2>s= 1UDzil.
Теперь на основании последнего соотношения (1.5.20) и выражений (1.5.21) искомое решение Т\ задачи Коши
§51 ТОРМОЖЕНИЕ ВРАЩЕНИЙ ТВЕРДОГО ТЕЛА
(1.5.19) записывается в виде квадратуры i
T i (z) = - .f F i (<P{У, a. P, *)) dy, |
(1.5.23) |
о |
|
в которую должны быть подставлены компоненты <pi, фг, фз вектор-фупкцни ф из (1.5.21) и выражения (1.5.22)
ДЛЯ а, |
Р, т. |
последующих |
коэффициентов Tk(z) |
|
Уравпепия для |
||||
(к > 2 ) |
разложепия |
(1.5.15) имеют вид, |
аналогичный |
|
(1.5.19): |
|
|
|
|
|
(.Рп, po + G )= F h(z), |
З Д » = 0. |
(1.5.24) |
Функции Fh(z) в правой части (1.5.24) на каждом шаге известим в результате вычислений функций Ti(z) ,...
..., Th~i(z) на предыдущих шагах. Они выражаются че рез производные /;о, рi, ..., Ph-u & в конечном птоге при помощи квадратур от функций /Дг) (i = l, 2 , 3) и их производных. Аналогично (1.5.23) записывается решение задачи Коши (1.5.24)
{ |
|
Тк(z) = - j Fh(ф (у, a, Р, т)) dy, |
(1.5.25) |
о |
|
где величины а, (J, т имеют вид (1.5.22). Если векторфункция /Ы непрерывно дифференцируема по z в £°-окрестностн начала координат к раз, то первые к + 1 членов представления (1.5.15) дают искомое выражение для функции Беллмаиа T(z, е) задачи (1.5.14) с по грешностью порядка eft+1, т. е.
Г ( 1 , е ) = | * | + i e jr j (2) + 0 ( 6'“+1). |
(1 .5.26) |
3= 1 |
|
Переходим к построению вектор-функции оптималь ного управлеппя u*(z, е). Подставляя (1.5.26) в (1.5.13), получим
р |
__ |
Ц -|- |
ept + |
. ••+ |
eftf /t + |
О (&h'H) |
__ |
it* (z, e) == - |
~~ |
I 4 + |
+ |
•••+ |
&hPh + |
0 (e,,+1) | |
|
iP l |
|
= - T|+ eB; ( * ) + . . . + *4*(z) + о (e''+1). (1.5.27)
Здесь использовано равенство ро = т| (см. (1.5.18)) и обозначение (1.5.16). В качестве /с-го приближения к
4 ф. л. Черноусым», Л. Д. Акулспко, Б. Н. Соколов
50 МЕТОД МАЛОГО ПАРАМЕТРА [ГЛ. I
оптимальному управлению будем рассматривать выра жение
И+ врд + |
•. ■+ &hPh |
(1.5.28) |
|
Щк) (z, е) = — |
еРд + |
•- •+ &hPk| |
|
I1! + |
|
||
получающееся в результате |
подстановки первых к + 1 |
членов ряда (1.5.26) в формулу (1.5.13). Выражение (1.5.28) удовлетворяет ограничению |м(Л)1 ^ 1 из (1.5.2). Однако разложение функции u(h) в степенной ряд по е содержит члены высших порядков по е. Если же разло
жить (1.5.28) в ряд по е (см. |
(1.5.27)) |
п |
органпчпться |
||
первымп к + 1 |
членами, то получим другую |
аппроксима |
|||
цию управления |
|
|
|
|
|
иш (г, е) = — I) -I- (z) + . . . + |
sV |
(») = |
|
|
|
|
= - t ] + |
e£/lw(z,e). (1.5.29) |
|||
Выражение |
(1.5.29), вообще |
говоря, |
пе |
удовлетворя |
ет ограничению (1.5.2), однако погрешность удовлетво рения этому ограничению составляет, очевидно, величи ну 0 (eh+1). При построении приближений к оптимальпой фазовой траектории удобнее использовать аппроксима цию (1.5.29) вместо (1.5.28), что не уменьшит порядка точности вычислений.
В первом приближении из формул (1.5.27), (1.5.29)
получим |
*1 -I- ep1 H- Q (a2) |
и* (z, е) = — |
|
|
IЛ -I- epa + О(e2) | |
= |
- Ч + е [Pi — *1 (Л, Pt)] + 0 (в*) = |
|
, _ Т1 + Ы7 (1>(*) + 0(е*). (1.5.30) |
4. Приближённое вычисление оптимальной траекто рии. Подстановка аппроксимации для оптимального управлепия uw iz, е) из (1.5.29) в уравнения (1.5.3) при водит к задаче Коши (/с + 1)-го приближения
zi + Dhh = — Л1 + |
(z, е) + |
e/j (z), |
zx(0 ) = z°u |
h — Dhh — — “Лй 4 " |
(ZJв) + |
e/ 2 (z), |
z2 (0 ) = z2, |
z3 ~ — Лз |
eC/(3ft) (z, e) + |
e/ 3 (z), |
z3 (0 ) = z3, |
(1.5.31)