Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы в системах поддержки принятия решений

..pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
16.41 Mб
Скачать

3. Формирование фазовых состояний согласно последнему уравне­ нию; пусть при этом N = 4, тогда

х(1) = -х^О) + Дти(О), х(0) = Хо,

х(2) = -x ^ l) + Дти(1) (или = -(х 2(0) + Дти(О))2 + Дти(1)),

х(3) = - х 2(2) + Дти(2) (или = —(—(х2(0) + Дти(0))2 + Дти(1))2 + Дти(2)),

х(4) = -х^З) + Дти(З)

(или = —(—(—(х2(0) + Дти(0))2 + Дти(1))2 + Дти(2))2 + Дти(З)),

х(4) = х т.

4. Формирование выражения для критерия

т

min min min min— {и2(0)+ и 2(1)+ и 2(2)+ и 2(3)} = « (0> 1/(1) 1/(2) «(3) 2 *4

= £{min{«2 (0)+ тЫи2(1)+ тт{и2(2 )+ тт{и2 (3)}}}}.

8 «(0)

//(I)

#(2)

**(3)

Видно, что структура критерия представляется функцией с последо­ вательным включением управлений м(0), к(1 ), и(2), и(3).

Оптимизация критерия должна быть выполнена при учете ограни­ чений на управления и(0), и(1 ), и(2), и(3) е У и н а фазовые переменные в виде уравнений оп. 3 и заданных граничных условий х(0) = х0,

х(4) = хг. Для этого следует воспользоваться методом динамического программирования, выполняя вычисления справа налево.

6.8.2.Непрямые методы итерационного решения:

простые варианты

Метод Ньютона. Этим методом реализуются необходимые условия принципа максимума Понтрягина, т.е. задача отыскания оптимального управления

т

u'(t) = argmin f F(t,x(t),u(t))dt,

U e Rm, x& R", m < n,

ueU J

 

U)

 

при условии x(t) = Д / , x(t)9« ( / ) ) , t0< t< I

, x(t0) = x09 x(T) = X j9 сводится к

решению краевой задачи вида

 

14*

211

*(0 = /(*>*(0 ,“(0 )> x(t0) = x 0,

дс(Г) = хг ,

 

¥(0=«WO. y (t),u (t),t)M T ), s()=

(*)

H = H(t,x(t),y(t),u(t)),

 

 

 

для которой вектор управления u(t), t0< t £ T

определяется из максиму­

ма функции Гамильтона

 

 

 

и"(',*>¥) = arg max Н (t, x(t)M t)M 0)-

Решение задачи (*) состоит в определении такого У(*о). чтобы в ре­ зультате интегрирования системы уравнений (*) при условиях x(t0), у(/0) выполнялось конечное условие х(Т) на момент t= Т, т.е. чтобы раз­

ность между вычисленным и заданным х(7) была близка к нулю. Очевидно, что при известном начальном состоянии x(t0) и найденном

приближении ¥(/(,), j = 0, 1 , систему дифференциальных уравнений

можно численно проинтегрировать и получить следующее решение:

xj(t) = £(x(f0), y J(t0), t), y '(0 = r\(x(t0), v y(r0), /).

Затем, взяв линейную часть разложения функции x J(T) в ряд Тейлора в

окрестности у у(/0) можно построить ньютоновскую итерационную про­ цедуру отыскания требуемого \у'(Г0):

¥ y+1 (/o) = ¥ y(^o)-ayf r 3 — 1 (x J( T ) - x T),

где а' — параметр, значение которого выбирается в процессе исследова­ ния сходимости алгоритма.

Эта процедура выполняется до тех пор, пока не будет достигнуто ус­ ловие x J( Т) —х т<£, £ > 0 ; при этом может иметь место неединствен­

ность решения.

А л г о р и т м 1. Найти выражение для «*(/) из решения задачи

и (1,х(< )М 0) = arg max tf (f,x(/),w(f), Y(f))- ueU

2.Задать начальное приближение )P(tQ.

3.Проинтегрировать уравнения

x(t) = f(t,x (t),u \t,x (t)M t))), x(tQ) = x Qi

V°(ro)-

212

4.

Вычислить *'('). y'W , *у(7), «*(',

У(0),У” 0 , 1,2,.... выполнить оп. 9.

5.

Задать конечные приращения Ду'(*0Х v = 1, п и сформировал, векторы вида

 

AW('O)= (o,o,...,<uWA...,o f .

6. Вычислить приближения

 

м»'(/0)± jA W (0 - ^ v /(/o ).-.< .,(< o ).W ('e )± jAv»y. v y+,(/0) v i w j .

7. Перейти к on. 3, проинтегрировать уравнения для приближений y J(t0) ± ^ A y Jv(t0)

и вычислить матрицы

8. Вычислить приближение

Vy+1('o )= V y( 'o ) - f — т — ] (x J( T ) ~ x T)

Uv'('o)J

иперейти к оп. 3.

9.Проверить условие останова алгоритма

||ж>(Г) — < е, е > О, при невыполнении — перейти к on. 5.

Метод линеаризации Шатровского. Сущность метода выбора опти­

мального управления и’ = argmin/(w), например, в задаче с критериаль-

ueU

ным функционалом Майера

J(u) = Ф(Т,х(Т))

и связью между и(0 и x(f), описываемой нелинейным дифференциаль­

ным уравнением

x(t) =Д /, х(0, «(0), x(t0) = х 0, х е R", и е U c K ”, т й п , t0£ t £ T ,

заключается в сведении исходной задачи к следующей л и н е й н о й задач е: найти управление

Ф = aigmin 5J

213

при условии

y(f) = Mt)y(t) + B(t)b(t), y(t0) = ya, b e Rm, у e R",

где b — малая добавка к начальному приближению управления и0, та­ кая, что и0 + b e U и обусловливает новую траекторию х°(0 + y(t) с ма­ лой добавкой у(();

а.X = х0 + у, и = и0 + ■

матрицы /1(0, B(t) вычисляются в точке (х°(0, и°(0) при линеаризации

исходного дифференциального уравнения в окрестности точки (х°, и0), 8/ = (grad^x0), у) = (с, у) — главная линейная часть приращения

функционала /(и), в которой величина с известна, поскольку известны значения и0 и х°.

При отыскании решения линеаризованной задачи используется со­ пряженное уравнение

V(0 = - ^ r(0 v (0 , v(7) = - с = —grad0 (x°).

При этом очевидно, что

8J = ~(У(Т),У(Т)) = -|(у(0,5(0,д(0)Л

0

и в качестве добавки Ф можно брать вектор b(t) = kBT(t)\y(t), где & > 0

число, подбираемое так, чтобы

и(0 = и°(0 + = «°(0 + kBT(t)\\f(t) U.

Ал г о р и т м

1.Выбрать начальное управление

и°е U.

2. Проинтегрировать дифференциальное уравнение

*(0 =Ж*(0, и°(0)

методом Рунге—Кутга, т.е. вычислить дс°(/).

3.Вычислить матрицы А(1), 5(0 и

с= (grad0 ) в точке (*°, и0).

4.Проинтегрировать в обратном времени от Т до /0 уравнение

4*0 = --4г(/)у(0, у(7) = -с .

214

5. Задать к > О так, чтобы

«,(/) = ifi(t) + M r(')V<0 6 и.

6. Проинтегрировать уравнение

 

 

 

т

=жомо+ т ш y(t0) =о, $<0 =квт(т о .

 

7. Вычислить JC|(/) - JC°(0 + у(0-

оно выполняется,

то проверить

условие

8. Проверить условие J(u{) < Л«°). Если

/(#!></ доп, где / доп

— заданное значение

функционала. При

выполнении

условия

/(w,) £ /ц 0П найденное и{ является оптимальным управлением, в противном случае вычис­ ляется очередное приближение u2(t) = ux(t) + д(/) и выполняются операции 28.

Если условие J(ux) < J(u°) не выполняется, то положить и{ = и0 + ад, где 0 < а < 1, и пе­ рейти к выполнению оп. 28.

Метод последовательных приближений. Сущность метода заключает­ ся в сведении исходной задачи выбора оптимального управления

т

u'(t) = argmin/(w(/)), J(u(t))= \ / 0(1,х(()М*Ы +Ф(Т,х(Т))

 

ue(J

J

 

 

 

 

*0

 

 

при ограничениях

 

 

 

X(t) ~

x(/), ^(/)),

^0 —^

^0»

*0 ^ ^ 9

 

U= {u

*(0, «(0) < о, / =

1, Л},

где т й п , <P(T,x(T)),Mt,x(t), u{t))>j{t, x(t), u(t)) -

непрерывные и глад­

кие функции, к задаче вида: найти u(t) е

U из условия обеспечения ра-

венства

 

 

 

 

 

+ minj dF'fcxg)) f ( Xiu j )+ / #(t, x(t),«(/))} = 0

Эt

[

дt

 

J

при ограничениях gff, x(t), u(t)) £ 0, i = 1. k, V(T, x(7)) = Ф(Т, x(T)).

Ал г о р и т м

1.Задать допустимое начальное приближение

ц,(/) е U.

2.Проинтегрировать уравнение

m =fit, «,(/», хШ =%. ib ±tzT ,

выписать решение x(t, x0) = x, а затем выразить из него х0 f\x , t).

3.Определить функцию

V(tt JC(/, XQ)) = Vx(t, х) = Ф(Т’х(Т’ W* '*)))+

215

т

+ |/ о ( х , * ( х , / '( д : , х ) ) , и ( х ) ) Л .

Здесь VAt, х) обладает свойством [94] Vx(t, х) = J(u, х).

4.Найти очередное приближение для функции управления u2(t) из условия

Э*\( — + mi"{-4 (',X)/(a ,«)+ /о(/Л«)} = 0.

dt

ueU L

djc

J

5. Перейти к выполнению операции 2 с u2(t, х),

затем построить функцию V2(t, х),

найти д3(/) и т.д.

 

 

 

6. Выписать последовательности:

 

 

управлений !/,(/, *,(/)), u2(t, x2(t)),

 

решений *,(/), x2(t),

 

функций

Vx(/, *(/)),

к2(/, *(/)),....

 

7. Проверить выполнение условий останова алгоритма

V,(t, m = /(«,) < / доп,

/ = 1, 2...... V,{T,x(T)) = Ф(Т, х(7)).

Если эти условия на шаге / выполнены, то щ = и

 

Метод Нойштадга. Метод разработан для решения задач оптималь­ ного управления на быстродействие и относится к методам последова­ тельных приближений.

Пусть требуется перевести систему из начального состояния х(/0) в

конечное х(7) = 0 за минимальное время, т.е. за время Т - * min, при u(l)eU

условии, что движение системы в фазовом пространстве описывается уравнением вида

x(t) = A(t)x(t) + B(t)u(t), х € Е*, и е Ucz Е а, т й п ,

где x(t) — п-мерный вектор состояния управляемой системы; u(t) — m-мерный вектор управления, т < п\

A(t) — п х /t-непрерывная матрица системы; B(t) — п х m-непрерывная матрица управления;

U — замкнутое множество кусочно-непрерывных функций;

Т — время перевода системы из начального х0 в конечное х тсосто­

яние.

Для отыскания оптимальной траектории х°(/), t0 < t < Tmi„ и времени движения 7е = Tmia из х(70) в х(7°) = О составим функцию Гамильтона:

Я(х(/), u(t), у (0 ) = ч тШ

Ш Ъ + B(t)u(t))~ 1 ,

где \\f(t) удовлетворяет сопряженной

системе ф(0 = - A T(t)y(t). Опти­

мальное управление определяется согласно принципу максимума Понтрягина из требования

тах#(х(7),и(0,\К0)

216

и имеет вид и\ t ) = sign[5r(/)\|/(0]«o. где щ — граничные значения (отсю­

да следует невозможность применения метода Ньютона для поиска ре­ шения рассматриваемой задачи). Общее решение исходного уравнения x(t) = A(t)x(t) + B(t)u(t), записываем с использованием фундаментальной

матрицы в виде

i

x(t) = <P(t,0) ,J0{O,s)B(s)u(s)ds

а решение сопряженной системы — в виде

V(') = Фт(0. OVo,

где Ф(7, t0) — матрица перехода или это фундаментальная матрица, об­ ладающая свойством Ф(7, t0) Ф(/0 t) = I, I — единичная матрица.

При А(0 =Л = const матрица Ф((, t0) сводится к виду

<P(t - 10) = еА(,''о).

Теперь для вычисления оптимального решения - управления необ­ ходимо вычислить \|f(f). Очевидно, что для этого с учетом, что х(Т) = 0,

имеется только одно выражение

г

*('о ) = - J ^ 0 ,r ) 5 ( /) [ s ig n [ f i7' (О Ф г (0 ,О у 0Ли0Л,

'0

ИЛИ

/

z(t,\|f) = - |ф ( 0,л)Я(*)^п[Яг ($)Фг(0,5) у 0Ли0&.

*0

Отсюда вытекает сущность м е т о д а Н о й ш т а д т а : для вычисления

\|/0 следует воспользоваться

итерационной процедурой

 

у<>+,) - у

< л ч - р ^ к ^ , ^ ) - * , ]

(*)

при условии 7^> > 7®, где pw длина шага в направлении (z(TU) ,УоЛ)■“■*(,).

Эта процедура обеспечивает сходимость к оптимальным хиТ = f ! и

7 ^ = ^ [26].

Заметим, что (г(7’<л,у{|у>) - х 0) есть вектор ошибки между вычис­ ляемым и заданным фазовыми состояниями системы на начальный мо­ мент времени; ошибку необходимо минимизировать по \у0.

217

Ал г о р и т м

1.Задать \у* ) = у (0) _ сопряженный л-мерный вектор.

2.Вычислить 7« из выражения / ( Г (у),¥ <у)) = 0,

/(Г<Л,¥ (Л) =(у(У))Г|-г(Г(Л5Ч<Л)_ ;(о]>

где j = 0, 1, 2, ...,j — номер итерации вычислительного процесса,

7*(/)

Z ( T U ) , 4 0J( )) = - J Ф (0,(;)й ((;)(<;,у (Л )</<;,

О

) = [sign(Br (l)0 7'(o,l)v (^ )]u0, 0 £ ? S 7«>,

/в* •= £ + ~ ~ ~ 4 Е — единичная матрица,

Ф(г0, /) = Ф-'(', h).

3. Проверить условие П ^ ^ » , V<») - x0||S е, гае е - заданная (малая) величина. Если

это условие выполняется, то проверить условие монотонности 7^+0 > Т^) к — \ 2 ... и при выполнении этих условий завершить процесс поиска оптимального решения

Г<У) = r opt = m in7’-> Uopiit)>

Если ||г(7’^ ),у^/))-дс0||>£, то перейти к оп. 4.

4. Вычислить V<'+‘>= *<л + « (yt0 [ 2(r< ^,y O -))_ JCoJ ) где p(/+i) _ ш кна шага>

р(У+0 =

[р(Л ,

если

у*(У+0 >

у (У )

 

 

 

 

о(У)

если

Т’СУ+О ^

у (У)

 

 

2

5.Перейти к оп. 2.

Вследующих задачах проиллюстрируем применение алгоритма.

Задача 1. Найти оптимальное управление и экстремаль движения системы за мини­

мальное время из исходной точки (х,(0), х2(0)) в конечную точку (х,(7),х2(7)) = 0. Уравнение движения имеет вид

*(') ** Лх(0 + Ви«), O S / 2 Г, ( Г - var),

критериальный функционал Г -> mm, где U = { u /u f + « f s c , с > 0 , K |S « 10, |и2| S

Р е ш е н и е . 1. Пусть

218

причем Х|(0), х2(0), ОS /< Г, Т - var; тогда * |(0 = «[(/), OSf S Г, x2(t) = u2{t\ т - var>

Т -» min . (i/l,w2)et/

2.Вычислим Ф(г, 0), Ф(0, Г), Z{T\ у 0):

-£*тг"-(; ?)♦ {• о)-(о 2}

Обоснованность записи предпоследних выражений-интегралов в полученной цепоч­ ке равенств непосредственно следует и из условий достижения максимального значения функцией Гамильтона на множестве U. Действительно,

#(*!(<)> *2(0. «i(0> «2(0. у,(/), у 2(/), о = -1 + «i(0Vi(0 + «2(0V2(0

и max Н достигается, если

1) «,(/) > 0, У|(0

> 0

И «2(0

> о, у 2(0 > 0

или

2) « |( 0 < О, У,(0

< 0

и «2(0

< о,

у 2(0 < 0

или

3 ) «,(0> 0, у , ( 0

> 0

и «2(0 < 0,

у 2(/)

< оили

4) «,(0 < 0, у ,(0

<

0

и «2(г) > о,

y 2(f)

> о,

т. е. когда векторы и(0 и у(г) коллениарны и совпадают по направлению (их скалярное

произведение максимально). Именно эти условия и реализованы при записи предпослед­ них выражений-интегралов.

3. Вычислим /( 7 ’.V*) = y f ( Z ( r ,y 0 ) - x 0].

/(^Vo) =(Vi«,¥2o) =[ ^ ^ - 2 ' n ) - % у ¥1о(й1о(Г_ 2,л)

+ VХ .Ш Т - 2/п) -*20).

219

Теперь из Д Г, щ ) = 0 найдем точное значение

Т° = min Г:

 

 

и * и

 

 

для этого напишем равенство

 

 

р _ 2*п(«10 + «2п)+Р*20 + *10

 

где р- V20 ^

«10 + Р«20

Vio ’

и воспользуемся условием dT(p) e 0;

 

 

dp

 

 

имеем

 

 

d m _ Х20(Ц10 + Р«2о) ~~ Р^п(«10 + «20)«20 + Р*20 + *1о)«20 _ р

dp

(«ю + Р«2о)2

или

*20«10 + *2<>Р«20 “ 2/п(«10 + «2о)«20 - Р*20 - *10«20 = 0 .

*20«10 “ *10«20 “ 2^п(«10 + «2о)«20 “

из последнего уравнения получаем момент времени переключения (fn)

/- * 20«ю “- * 10«20

П2 (Д|0 + «20 )«20

Подставим теперь /п в выражение для Т и получим

Г ° = М

(либо Т °= ?Щ .

«20

«10

Из выражения числителя для tn видно, что Гп = 0. Действительно, рассматривается линейная задача, в которой траектория движения системы из начальной точки (*10, *20) 6 конечную (Х|(7), х2(Т)) есть отрезок прямой. Но тогда начальное приближение

\|/*0) = — и будет оптимальным. Из коллениарности и сонаправленности векторов у(/)

Н*о11

и u(t) следует, что

|||»||=|^ + и|*с,

IMI Н«|Г

и значит,

«10*20 - «20*10 = I*oll(-«IOV20 + «20Vl0) = #*ol IIVoJ IMKV®0«20 ~ V20«,°0) = 0.

Оптимальное управление не претерпевает изменений на отрезке времени [Гп, 7] и оно ста­ новится равным нулю в момент Т°.

Итак, искомое оптимальное управление вычисляется по выражению

«,°(0 = . / = 1, 2, OSfSr0

220

Соседние файлы в папке книги