Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Управление колебаниями

..pdf
Скачиваний:
2
Добавлен:
12.11.2023
Размер:
15.93 Mб
Скачать

 

Г Л А В А 1

МЕТОД МАЛОГО

ПАРАМЕТРА

В ЗАДАЧАХ ОПТИМАЛЬНОГО

УПРАВЛЕНИЯ

В главе 1 рассмотрены некоторые способы прпменсния теории малого параметра к задачам оптимального управления. § 1 имеет вводный характер: здесь приво­ дятся постановка задачи оптимального управления и не­ обходимые условия принципа максимума, рассматрива­ ются различные способы выделения малого параметра. В § 2 рассмотрен класс слабо управляемых систем, раз­ вит алгоритм приближенного решения задачи по степе­ ням малого параметра, исследовано явление локальной оптимальности управлений. Оценка точности метода по функционалу, траектории и управлению содержится в § 3. В § 4 изложен пример приближенного решения за­ дачи оптимального управления для слабо управляемой системы. В § 5 метод малого параметра применяется для построения синтеза в одной задаче управления дви­ жением твердого тела вокруг центра масс. В § 6 приве­ дены некоторые общие замечания о применении метода возмущений в задачах оптимального управления. Резуль­ таты §§ 2, 4 были впервые опубликованы в работе [226], § 3 — в статье [138], § 5 — в статьях [17, 22].

§1. Постановка задачи

\.Задача оптимального управления. Исследуется управляемый процесс, описываемый системой дифферен­ циальных уравнений с начальными условиями

 

х =

/U ,

f, и),

x(to) =

а.

(1.1.1)

Здесь

x = (x i, ..., хп)— тг-мерный

вектор

фазовых

координат, точкой

обозначено

дифференцирование по

времени

t, и = (ui,

...,

ит) — пг-мерный вектор

управля­

ющих функций, f — (fu

•••» /п)— заданная n-мерная век-

тор-фупкцпя, t0— начальный момент времени, а — вектор начального фазового состояния.

12

МЕТОД МАЛОГО ПАРАМЕТРА

[ГЛ. 1

 

На управление наложено ограничение

 

 

uit)^U ,

t > t 0,

(1.1.2)

где

U — заданное замкнутое

множество

в пг-мерпом

пространстве. Функции uit) предполагаются кусочно не­

прерывными. Граничные условия в конце

процесса уп­

равления заданы в виде

 

 

 

 

 

 

h(x(T),

Т) = 0, qixiT),

Я = 0

 

(1.1.3)

и минимизируемый

функционал (критерии

качества)

имеет

вид

 

J= FixiT), Т).

 

 

 

(1.1.4)

 

 

 

 

 

 

 

Здесь hix, t) и Fix, t)— заданные

скалярные функ­

ции, qix,

t) = (gi,

..., gr)— задапная

r-мерпая

вектор-

функция,

причем

О ^ г ^ /г — 1. Функции

h,

q предпола­

гаем

непрерывно

 

дифференцируемыми

по

х,

t, a F —

дважды непрерывно дифференцируемой. Первое равенст­ во (1.1.3) служит условием, определяющим момент вре­ мени Т окончания процесса. Предполагается, что функ­ ция h такова, что при допустимых траекториях xit) она монотонно зависит от £ (в некотором интервале времени), и поэтому условие h 0 определяет для каждой допу­ стимой траектории единственный момент времени Т ^ t0. Второе (векторное) равенство (1.1.3) представляет собой дополнительные краевые условия в момент Т (если г = = 0, то эти условия отсутствуют). Все эти условия пред­ полагаются независимыми и непротиворечивыми.

Отметим, что разбиение граничных условий в (1.1.3) на условие окончания процесса h = 0 и дополнительные граничные условия q = 0 довольно условно и неединст­ венно; не всегда удается выделить условие окончания процесса, для которого имеет место монотонность h по £. Однако такое разбиение удобно для приближенного или

численного решения, и

оно будет

предполагаться вы­

полненным. В частности,

для задачи с фиксированным

временем окончания процесса Г* имеем h = t — T*.

Задача оптимального управления состоит в определе­

нии управления uit) и

соответствующей

оптимальной

траектории ж(£), которые

при t o ^ t^ T

удовлетворяют

уравнениям и граничным

условиям

(I JI.1), (1.1.3), огра­

ничениям на управление (1.1.2) и доставляют минимум функционалу / из (1.1.4).

§ 11

ПОСТАНОВКА ЗАДАЧИ

13

2.Принцип максимума. Применим к поставленной

задаче оптимального управления принцип максимума Л. С. Полтрягпна [176], представляющий собой необхо­ димые условия оптимальности.

Введем дополнительные фазовые

координаты

XQ ж

хп+и определяемые уравнениями с

начальными

усло­

виями

 

 

 

(1.1.5)

Здесь и'далее д/дх — оператор градиента по фазовым координатам х, d/dt — полная производная вдоль траек­ торий системы С1.1.1), скобки означают скалярное про­ изведение векторов. Очевидно, что arn+i — t, и поэтому аргумент t у функций /, /о, h, q, F можно заменить на я„+1. Тогда система 01.4.1) будет автономной, а функцио­ нал (1.1.4) примет вид J= x<jLT).

Относительно гладкости правых частей системы (1.1.1) , (1.1.5) предполагается, что функции /, / 0 опреде­ лены и непрерывны по совокупности переменных х, #п+ь и и непрерывно дифференцируемы по гг, xn+i для всех х, xn+i, u^U .

Введем вектор сопряженных переменных ф(£) =

= (фь ..., фп), а также сопряженные переменные i|>n+i(J)

ифоШ, причем положим, как обычно, фо — —1. Функция Гамильтона Я ' и сопряженные уравнения для системы (1.1.1) , (1Л.5) примут вид

Я ' = (ф, /) -|- ф,1+1 — /о — ^ф---- f'j + фп+1-----------

0^1

(1. 1. 6)

+

С учетом краевых условий (1.1.3) условия транс­ версальности запишутся в виде (момент окончания

14

МЕТОД МАЛОГО ПАРАМЕТРА

ГГЛ. 1

процесса Т не фиксирован)

 

И ' = 0 при

I - Т.

Здесь Я,

— неизвестные

постоянные параметры.

Подставим

условия (1.1.7) в

равенство (1.1.6) для //',

которое затем разрешим относительно %

Полные производные по t здесь имеют тот же смысл, что и в равенстве (1.1.5). Введем видоизмененные сопря­ женные переменные и гамильтониан

P = * - t e >

Р = (Рн •••.?»).

Я = (/>,/) = Я '

 

Отметим, что выражение в

квадратпых скобках

(1.1.6) равно d(dF/dxh)/dt. Тогда

уравнения (1.1.6) п ус­

ловия (1.1.7) можно с учетом .(1.1.9) записать в виде

( 1.1.10)

Согласно принципу максимума, задача оптимального управления свелась к краевой задаче для двух га-мерных вектор-функций x(t) и pit). Оптимальное управление u(t) определяется из условия супремума функции # ' по и,М', что*1iu эквивалентноолюпиа ю д условиюy^iu am u супремума функцииутхцаш. ллН поиз (1.1.10), т. е.

#(/> (*).*(*). *, w(f)) = s u p # (p (f), *(«), «, и).

(1.1.11)

8 i]

ПОСТАНОВКА ЗАДАЧИ

15

Система уравнений краевой задачи задается диффе­ ренциальными соотношениями (1.1.1), (1.1.10), а крае­ вые условия — равенствами (1.1.1), (1.1.3), (1Л.Ю). Не­ известная управляющая вектор-фунщия и исключается при помощи равенства (1.1.11). Параметр X определяется равенством (1.1.8), а момент времени Т и параметры Х\ неизвестны и определяются в процессе решения краевой задачи.

3. Задачи управления с малым параметром. Решение задач оптимального управления строится обычно при помощи принципа максимума Л. С. Понтрягипа, метода дипампческого программирования, классического вариа­ ционного исчисления или других методов теории опти­ мальных процессов. При этом точное решение задач оп­ тимального управления может быть построено сравни­ тельно редко, лишь для определенных классов задач. Большое развитие получили численные методы оптималь­ ного управления, см., например, книги и обзоры [43, 44, 56, 57, 73, 79, 101, 117, 118, 120, 143, 149, 150, 175, 179, 205, 209, 231—233, 2351 и другие. Однако даже при ис­ пользовании современных ЭВМ численное построение оптимальпых управлений для сложных динамических сис­ тем представляет значительные трудности, особенно в том случае, когда требуется найти управление в виде синтеза.

В то же время многие прикладные задачи оптималь­ ного управления в явном или неявном виде содержат малые параметры, характеризующие относительную ма­ лость тех или иных воздействий или факторов. Поэтому могут быть развиты эффективные приближенные или асимптотические методы построения оптимальных уп­ равлений, основанные на идее малого параметра. При этом могут быть использованы такие широко известные методы теории колебаний, как методы теории возмущепий, метод усреднения, асимптотические методы разде­ ления медленных и быстрых движений и т. д. (см., например, [29, 46, 58, 64, 121, 139, 148, 1541). С по­ мощью этих методов удается в ряде случаев получить приближенное оптимальное управление в форме програм­ мы или синтеза. Отметим, что полученные при помощи приближенных методов результаты можно также при­ менять при построении начального приближения для численных методов.

16

МЕТОД МАЛОГО ПАРАМЕТРА

1ГЛ. 1

Введение малого параметра е оправдано в тех слу­ чаях, когда невозмущенная задача (при е = 0) может быть решена аналитически или численно значительно более просто, чем возмущенная. Например, это имеет место, когда система близка к линейной пли неуправ­ ляемой, или в ней выявляются медленные и быстрые переменные, допускающие разделение движений.

Рассмотрим некоторые способы вхождения малого па­ раметра е в задачу оптимального управления (1.1.1)— (1.1.4). Пусть функции /, h, q п F могут быть представ­ лены в виде разложешгй

■ / = fix,

t, и) + е/1(х, t,

и) -Ь в2 + ..

h = h°ix,

t) + eh]ix, /) +

е2...,

q — q°ix, t) + eq4x, i ) +

e2...,

F -F °(x,

t) + &F'ix, i) +

e2..., 8 e [0 , s j . □ *) (1.1.12)

Точками обозначены высшие члены разложепнй. Со­ ответствующая невозмущенная задача оптимального уп­

равления

описывается соотношениями

(1.1.1)— (1.1.4),

(1.1.12),

в которых полагается е = 0.

Предполагается,

что решение этой задачи существует, единственно и мо­ жет быть построено. Тогда возникает вопрос об оценке погрешности, вызванной отбрасыванием возмущающих членов порядка е в 01.1.12), а также проблема построе­ ния приближенного решения задачи оптимального управ­ ления с учетом малого параметра, т. е. вычисление по­ правок к невозмущенному решению.

Этот естественный прием исследования широко ис­ пользуется при линеаризации систем, когда функция f в (1.1.12) содержит линейные члены по х, и, а нелиней­ ности входят в виде возмущений. Подобные задачи рас­ сматривались, например, в работах [17, 22, 28, 99, 104, 105, 117, 201, 241, 247, 252].

Примеры подобного подхода для нелинейной порож­ дающей задачи оптимального синтеза будут изложены в § 5 данной главы.

Другой случай возникает тогда, когда в (1.1.12) функция f не зависит от управляющего воздействия и

*) Значок □ перед номером формулы означает, что данный

помер относится к группе формул, перед первой из которых стоит значок ■ .

§ 11

ПОСТАНОВКА ЗАДАЧИ

1 7

[226].

Соответствующую систему

естественно

назвать

слабоуправляемой: при € = 0 она

превращается в неуп­

равляемую, а отличие между управляемым и неуправ­

ляемым

движениями, вообще говоря, будет

порядка е.

Таким системам посвящены §§ 2—4.

 

 

Если интервал движения управляемой системы неог­

раничен

(асимптотически

растет) при

е

0 (например,

Т ~ е-1),

то даже малые

управляющие

воздействия мо­

гут привести к существенному изменению фазовых перемепиых. Такая ситуация характерна для многих задач управления колебательными системами, когда малые управляющие силы вызывают большие изменения ампли­ туды или энергии колебаний или вращений в течение длительного времени (за много периодов колебаний). Для исследования таких систем можно эффективно ис­ пользовать асимптотические методы нелинейной механи­ ки (методы усреднения), изложенные в монографиях [46, 47, 64, 145, 148]. Применению асимптотических ме­ тодов типа усреднения к задачам оптимального управле­

ния посвящено большое

число

работ, например, [1—3,

9—13,

15,

16,

20,

21,

23,

24,

69,

81,

130,

148,

155,

156,

172—174, 184, 229, 230, 245,

262]. Проблемам

управле­

ния колебательными

системами

с малым

параметром,

разработке

асимптотических

методов

построения опти­

мального управления в таких системах посвящена зна­ чительная часть данной монографии (главы 2—5).

В последнее

время получило развитие

также иссле­

дование сингулярно

возмущенных задач

оптимального

управления

[35,

71,

80,

253,

257,

258,

261,

263,

265,267].

Управляемая система (1.1.1) называется сингулярно воз­ мущенной, если при е = 0 ее порядок уменьшается. Та­ кая ситуация возникает, если некоторые (например, первые s) из компонент вектора f могут быть представ­ лены в виде

fi = tTVr1 (*,

и) + ft (я, t, и) +

в . . ( 1 . 1 . 1 3 )

i = 1, .. . , s;

1 ^ s<Zn.

 

Формально полагая

e = 0 в

(1.1.4), (1.4.13), приходим

к системе, содержащей 5 конечных уравнений

/Г 1 (я, tt и) = 0,

i 1, . . . ,

s,

п п s дифференциальных уравнений. Для исследования

Z ф. Л. Черноусько, л . Д. Акуленко, В. Н. Соколов

18

МЕТОД МАЛОГО ПАРАМЕТРА

1ГЛ. 1

подобйых задач оптимального управления обычно исполь­ зуют асимптотические методы типа пограничного слоя и теорию обыкновенных дифференциальных уравнений с малым параметром при старших производных [62, 154, 204]. Отметим, что множество U в (1.1.2) также может зависеть от переменных х, t и от малого параметра. В ряде случаев простым преобразованием в пространстве управлений его можно перевести в постоянное множест­ во. Например, пусть множество U(x, t, е) задано нера­ венствами

|гг,| cf(x, t, e), i = 1, ..., m,

где с,- — известные положительные фупкцип. При помощи

преобразования м4= с,1М £ = 1, — т, где щ — повыс уп­ равления, это множество переводится в постоянное мно­

жество |и\|^

1.

Ниже

множество

V предполагается

по­

стоянным.

и

более

сложные

случаи вхождения

ма­

Возможны

лого параметра

в задачу

оптимальпого управления

(1.1.1) — (1.1.4),

когда

для

решения требуется комбини­

ровать различные методы малого параметра.

 

§2. Слабо управляемые системы

1.Вывод уравнепнй движения и приближенное ре­ шение задачи. Будем рассматривать задачу управления

(1.1.1)— (1.1.4)

в предположении,

что функции /, h, q, F

и вектор а разлагаются в ряды по

малому параметру е

 

/ = /°(z, t) +

е /1(х,

£,

гг) + ...,

 

 

h =

h°(x,

t) + ehl(x, t) Н-...,

 

 

 

q =

q°(x,

t) +

ед'(.т,

£) + ...,

 

 

F = F°(x, t)+ eF 4x,

£) + ...,

 

 

 

a = a° + zal + ...t

e < 1.

□ (1.2.1)

Верхние

индексы указывают помер члепов в разло­

жениях, а

нижние — помер

компонент

векторов. Так

как функция /

при е = 0

не

зависит от

гг, то система

(1.1.1) при е = 0 будет неуправляемой. Ее общее решение будем считать известным. При е < 1 систему (1.1.1) ес­ тественно назвать слабо управляемой,

§ 2 ]

СЛАБО УПРАВЛЯЕМЫЕ СИСТЕМЫ

19

 

Если функция /° зависит от и, то при е = 0 система

не вырождается в неуправляемую и для нее, вообще го­ воря, существует оптимальное управление нулевого приближения. Разложение но малому параметру позво­ лит уточнить это управлепие. Рассматриваемый далее случай интересен тем, что в нулевом приближении уп­ равление вообще нельзя определить в принципе. Отметпм, что возможеп также л промежуточный случай: функция /° зависит лишь от некоторых компонент вектора управляющих функций.

Переходим к построению приближенного решения поставленной задачи оптимального управления для слабо управляемой системы (1.1.1)—(1.1.4), (1.2.1). Иско­ мые величины х, р, Т, Я, Я4и / ищем в виде разложений

 

х = х° (t) +

ея1 (1) -f-

.. . ,

 

 

 

p =

/;°(f) +

ep1(t )+

Т = Т°

гТ1+

.. . ,

Я = Я0 + еЯ1 +

+ еЯ1 + ..

 

 

 

J = Р + еР +

i =

l,

...,г .

(1.2.2)

Подставим

равенства

(1.2.1),

(1.2.2) в

уравнения

(1.1.1), (1.4.3), (1.1.4), (4.1.8), (1.1.10), разложим

полу­

ченные

соотношения в ряды по е и приравняем коэф­

фициенты при степенях е° = 1 и е. В нулевом приближе­ нии получим

. i° = m

0 ,

* • (* „ ) - «л

k° (х° (Т°), Т°) = 0,

д° {х° (Г°), Г°) = 0,

Р =

F0 {х° (Т°), Г°),

х [ ^ + ( ^ . / " ) Г " Р п , = Г - ''1-' =

°

23)

2*

20

МЕТОД МАЛОГО ПАРАМЕТРА

1ГЛ. 1

Для равенств (1.1.1), (1.1.3), (1.1.4) выпишем еще уравнения первого приближения с учетом соотношений (1.2.3)

 

•,

( Q f l W . 0

 

=*) + / 1 (*"(*). *,«(*)).

(*.)= «*,

 

h

 

дх

 

 

[ т г + 4( зг- / • ) ]Т1+ ( £ • *' ( п )

I-

= о ,

 

 

[ ^

+

( #

 

. ' , ) ] 1Ч + (

^

Н

 

+0-* , "

^

[ т г

+

( ■ £

/”) ] г +

( £11(•г

> ) +

^

 

 

 

 

 

 

i = 1.........г.

 

 

 

(1.2.4)

В

последних трех

равенствах

(1.2.4)

все функции от

х, г берутся при значениях ж = я°(Г°), t =

T°.

 

 

Перейдем к

анализу уравнений (1.2.3),

(1.2.4). Общее

решение системы нулевого приближения х = fix , t) пз (1.2.3) предполагается известным и заданным в явном виде

x = q>(t, с),

ф = (фь

..., ф„),

c = (ci, ..., с„). (1.2.5)

Здесь ф — вектор-функция, с — вектор

произвольных

постоянных.

Разрешая

равенство (1.2.5)

относительно

постоянных с, получим

 

 

 

 

 

g(x, t) =

c,

g = (g i,

..., gn).

(1.2.6)

Функции gk являются независимыми первыми интег­ ралами системы нулевого приближения.

Для траектории x°(t) в нулевом приближении имеем, задачу Коши, задаваемую первыми двумя равенствами (1.2.3) . Ее решение выражается через функции ф, g, введенные равенствами (1.2.5), (1.2.6)

ж0Ш = ф(£, с), c = g(a°, to).

(1.2.7)

Момент Т° окончания процесса и функционал /° в этом приближении определяются третьим и пятым равен­ ствами (1.2.3). Будем считать, что четвертое равенство (1.2.3) , т. е. краевые условия g = 0 нулевого приближе­ ния выполняются автоматически. Это тождество можно рассматривать как дополнительное условие, наложенное на функцию д°(ж, t).