Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Радиолокационные измерители дальности и скорости. [Т.1]

.pdf
Скачиваний:
13
Добавлен:
12.11.2023
Размер:
21.62 Mб
Скачать

Существование функции S [X (T),T] Веллмана указывает на на­ личие управления, минимизирующего функционал (1.9.27). Необ­ ходимо отметить, что функция x(t), являющаяся решением систе­ мы (1.9.26) на интервале [T,tJ определяется ее начальным состоя­ нием х(т) и управлением u(t) при xctetfc. Кроме того, поскольку в правой части выражения (1.9.28) предполагается, что выполнена оптимизация по и, т.е. выбрано оптимальное управление, то функция Веллмана не зависит от вектора управления и, а зависит только от аргументов х(т) и т. Из (1.9.28) следует, что при 1 = ^ функция Веллмана принимает значение:

8[ХЫ Л] =Ф к^кМ У Л ]-

(1.9.29)

Представим интеграл в (1.9.28) в виде суммы двух слагаемых:

{ф.К ‘Н

‘ И <)‘+

 

[т’Ч

■>

 

tk

(1.9.30)

+ I ф т[х М> и(4 t]dt+Фк[фк)>u(tk),tk]j>

т+Д

J

 

В соответствии с принципом оптимальности управление на каж­ дом последующем участке должно быть оптимальным независимо от состояния системы на предыдущих интервалах. Следовательно, при оптимальном управлении функционал качества должен быть минимальным и на участке [т+А, t j . Тогда

+ ®k[x(tk),u(tk),tk

j O x[x(t), u(t), tjdt 4S[X|T + A), T +

(1.9.31)

Полагая u(t) непрерывной функцией времени, а интервал A достаточно малым, получаем:

т+А

}<£T[x(t),u(t),t]dt* <I>T[x(t),u(t),t]A;

(1.9.32)

S[X(T + Д), t + Д] * S[x(t).т] + [х(1 + Д ) - х(т)]т

+

+

W

X]+^ ™

+ № 1

A , (1.9.33)

где xSt<x+A, а x(x + д) - x(x) » х(х)Д.

 

Подставив (1.9.32) и (1.9.33) в (1.9.31), имеем

 

S[X(TH *

щ

{ф*№* uW’*1А+s[xW *]+

 

 

[т,т+Д]

 

 

 

 

, .3S[X (T),T1

ав[х(т),т]

 

 

 

9х (т)

дт

 

Поскольку функции S[X(T),T] и 98[х(т),х]/5с не зависят от пере­ менной u(t), их можно вынести за знак операции минимума. В ре зультате получим соотношение

- ^ И д * m m - Ф т[х (г),и (^ г]л + x(T) £ 5 l ^ l Z l д .

[х,т+Д]

Разделив обе части на Д и заменив х на текущее время t, при Д-»0, получим уравнение для функции Веллмана:

at

(u(t)} Tl v^ v

. (1.9.34)

В процессе решения (1.9.34) при граничном условии (1.9.29) и определяется управление, минимизирующее функционал (1.9.27). Из (1.9.34) и (1.9.29) следует, что решение уравнения Веллмана зависит от вида минимизируемого функционала (1.9.27) и модели ООУ (1.9.26). Необходимо подчеркнуть, что, хотя при выводе не использовались никакие ограничения на вид модели (1.9.26) и по­ дынтегральной части функционала (1.9.27), аналитическое реше­ ние уравнения (1.9.34) при условии (1.9.29) в общем виде воз­ можно лишь для линейных моделей и квадратичных функциона­ лов.

1.10. АЛГОРИТМ УПРАВЛЕНИЯ ОПТИМАЛЬНЫЙ В

ПОСТАНОВКЕ ЛЁТОВА-КАЛМАНА

Задача синтеза управления формулируется следующим обра­ зом. Для системы управления (СУ), состояние которой задано мо­ делью (1.9.8), при наличии измерений (1.9.11), необходимо найти вектор и сигналов управления, оптимальный по минимуму функ­ ционала качества Лётова-Калмана (1.9.9). Заметим, что I(u) дейст­ вительно является функционалом, так как каждой функции u(t), определенной на интервале [0 ,tk], ставит в соответствие число I.

В результате минимизации функционала (1.9.9) формируется оптимальное на интервале [0,tk] управление u(t). Поэтому в лите­ ратуре критерий Лётова-Калмана часто называют интегральным (в отличие от локального критерия, который будет рассмотрен в сле­

дующем параграфе).

 

Поскольку исходные модели линейные, возмущения

и £и,

гауссовские, а функционал качества квадратичный (ЛКГ задача), то на основании выводов теоремы разделения, оптимальный регу­ лятор можно синтезировать в детерминированной постановке за­ дачи. В связи с этим на первом этапе синтеза будем полагать, что все возмущения отсутствуют (£х=0 , £и=0),и все фазовые координа­ ты xj в (1.9.11) измеряются точно.

Процедура отыскания сигналов управления в сформулирован­ ной постановке основана на решении уравнения Веллмана (1.9.34). Сравнивая (1.9.9) с (1.9.27), можно заключить, что

Фт[x(t),u(t),t] = xT(t)L1x(t) + uT(t)Ku(t);

(1.10.1)

(1.10.2)

В дальнейшем для упрощения будет опущена зависимость от времени векторов и матриц, не имеющая принципиального значе­ ния при решении уравнения Веллмана. Подставив (1.9.8), (1.10.1), (1.10.2) в (1.9.34) и (1.9.29), получим

dS[x(t),t]

= г

dt

(1.10.3)

(1.10.4)

Вынесем за знак операции минимума члены, не зависящие от и:

P(t) = -Lx - FTP(t) - P(t)F + P(t)BK_1BTP(t).

(1.10.12)

В процессе вывода (1.10.12) было учтено, что матрица Р - симметричная. Граничные условия для (1.10.12) находятся путем сравнения (1.10.4) и (1.10.8) при t=tk:

xT(tk)Qi*(tk) = xT(tk)P(tk)x(tk),

откуда следует, что

P(tk) = Qi*

(1.Ю.13)

Поскольку рассматривалась ЛКГ задача, то на основании тео­ ремы статистической эквивалентности можно утверждать, что де­ терминированный закон управления (1 .1 0 .1 1 ) будет адекватен ста­ тистическому при условии замены в нем фазовых координат х их оптимальными оценками х, т.е.

u(t) = -K’VpftJxft).

(1.10.14)

Соотношения (1.10.12)—(1.10.14) и определяют алгоритм управления динамической системой, оптимальный в постановке Лётова-Калмана. Оптимальная оценка х определяется уравнения­ ми (1.4.3)-(1.4.5) фильтра Калмана для процесса (1.9.8) при из­ вестном и.

Формируемый сигнал управления (1.10.14) зависит от состоя­ ния системы х, штрафов К за сигналы управления, способности системы воспринимать сигналы управления, которая определяется матрицей В, и весовой матрицы Р. Чем больше штраф за управле­ ние, тем меньше сигналы и и тем экономичней система, но тем менее она точна. Последнее предопределяется тем, что малые зна­ чения и вызывают в (1.9.8) малые значения х, а соответственно и малые целенаправленные изменения х. Если система (1.9.8) хоро­ шо воспринимает сигналы управления и (матрица В имеет боль­ шие коэффициенты), то имеет смысл делать их большими, так как в такой ситуации будут иметь место большие значения х и систе­ ма будет быстро изменять свое состояние х. Если же коэффициен­ ты матрицы В малы, то не следует использовать большие сигналы управления, поскольку это приведет к неоправданно большим рас­ ходам энергии при очень малом выигрыше в точности.

Коэффициенты матрицы Р совокупным образом учитывают в (1 .10 .1 2 ) штрафы за текущую точность и экономичность, опреде­ ляемые матрицами Lj и К, детерминированные связи и эффектив­ ность сигналов управления, обусловленные матрицами F и В.

85

усложнение вызвано необходимостью решения в обратном времени еще и уравнения (1.10.18).

В дискретном времени уравнения состояния и наблюдений имеют вид (1.9.13), (1.9.14), а критерий Лётова-Калмана описыва­ ется соотношением (1.9.15). Для задач дискретного управления также справедлива теорема разделения и синтез стохастической систему управления распадается на синтез оптимального детерми­ нированного управления и синтез системы фильтрации (формиро­ вания оценок вектора состояния). Аналогично тому, как это сде­ лано выше, используя дискретные уравнения Веллмана [59] мож­ но получить алгоритм оптимального дискретного управления

u(k-1) = -R(k- l)x3(k-1),

(1.10.20)

где

R(k—l) =[К+BT(k-l)P(k)B(k-1)]'1BT(k-l)P(k)<P(k k-1); (1.10.21)

x3(k) = Ф(к,к- l)x(k-1) + B(k- l)u(k-1);

(1.10.22)

i(k) - оптимальная оценка, определяемая уравнениями (1.4.19)-

(1.4.23); P(k) - матрица, удовлетворяющая уравнению

P(k-1)= Ф(к,к- 1)Р(к)Ф(к,к -1)-

-LT(k- 1)[К+ Вт(к- 1)Р(к)В(к- 1)]ьг(к -1), (1.10.23)

сграничным условием

P(kr)=Qb

(1.10.24)

Для соотношений (1.10.20)—(1.10.24) имеют смысл все выво­ ды, полученные в процессе анализа уравнений (1.10.12Н1.10.14).

1.11. АЛГОРИТМЫ УПРАВЛЕНИЯ, ОПТИМАЛЬНЫЕ ПО

ЛОКАЛЬНОМУ КРИТЕРИЮ

В предыдущем параграфе была рассмотрена задача синтеза управления, оптимального по интегральному критерию ЛётоваКалмана, и показано, что в процессе оптимизации искалась опти­ мальная на интервале [0,tjJ функция u(t). Использование локаль­ ного критерия предполагает отыскание оптимального управления для каждого текущего момента времени t^ t, которое минимизи-

простой функцией от u(k-l) (а не функционалом, как это было в критерии Лётова-Калмана). Поскольку в (1.11.5) текущий штраф за точность учитывается как матрицей Q1? так и Llf то в даль­ нейшем без потери общности можно полагать LjH). В такой си­ туации решение задачи минимизации тривиально и находится пу­ тем приравнивания нулю производной от I по u(k-l), что приводит к следующему алгоритму оптимального управления

(1.11.6)

K(k-1) =[K+BT(k-l)Q1B(k-l)]-,BT(k-l)Q,®(k,k-l). (1.11.7)

Так как в соответствии с принципом оптимальности Веллмана, предыдущее оптимальное управление не зависит от последующего, то проделав такие же рассуждения для предыдущего интервала [к-2 , к-1 ] получим, что оптимальное управление и(к-2 ) определяет­ ся такими же формулами (1.11.6), (1.11.7) с заменой к-1 на к-2.

Сопоставляя алгоритм оптимального по локальному критерию управления (1-11.6)—(1.11.7) с аналогичным алгоритмом (1.10.20)- (1.10.24), оптимальным по интегральному критерию Лётова-Кал­ мана, можно увидеть, что они сходны по структуре. Различие лишь в том, что вместо матрицы Р(к) для оптимального алгоритма с интегральным критерием, которая определяется уравнением (1.10.23) с граничным условием (1.10.24), в алгоритме с локаль­ ным критерием используется фиксированная матрица Q*, фигури­ рующая в показателе качества (1.11.3). Таким образом, при ис­ пользовании локального критерия получаем существенно более простой алгоритм оптимального управления. Однако это упроще­ ние, во многих случаях, приобретается за счет ухудшения показа­ теля точности формирования управляемой траектории.

В соответствии с выводами теоремы разделения для статисти­ ческого варианта необходимо в (1 .1 1 .6) заменить фазовые коорди­ наты их оптимальными оценками. Тогда

(1.11.8)

Задача локальной оптимизации непрерывных систем может быть сформулирована следующим образом: для системы (1.9.8) при наличии измерений (1.9.11) необходимо найти вектор сигна­ лов управления, оптимальный по минимуму функционала

о J

(1.11.9)