книги / Радиолокационные измерители дальности и скорости. [Т.1]
.pdfСуществование функции S [X (T),T] Веллмана указывает на на личие управления, минимизирующего функционал (1.9.27). Необ ходимо отметить, что функция x(t), являющаяся решением систе мы (1.9.26) на интервале [T,tJ определяется ее начальным состоя нием х(т) и управлением u(t) при xctetfc. Кроме того, поскольку в правой части выражения (1.9.28) предполагается, что выполнена оптимизация по и, т.е. выбрано оптимальное управление, то функция Веллмана не зависит от вектора управления и, а зависит только от аргументов х(т) и т. Из (1.9.28) следует, что при 1 = ^ функция Веллмана принимает значение:
8[ХЫ Л] =Ф к^кМ У Л ]- |
(1.9.29) |
Представим интеграл в (1.9.28) в виде суммы двух слагаемых:
{ф.К ‘Н |
‘ И <)‘+ |
|
[т’Ч |
■> |
|
tk |
(1.9.30) |
|
+ I ф т[х М> и(4 t]dt+Фк[фк)>u(tk),tk]j> |
||
т+Д |
J |
|
В соответствии с принципом оптимальности управление на каж дом последующем участке должно быть оптимальным независимо от состояния системы на предыдущих интервалах. Следовательно, при оптимальном управлении функционал качества должен быть минимальным и на участке [т+А, t j . Тогда
+ ®k[x(tk),u(tk),tk |
j O x[x(t), u(t), tjdt 4S[X|T + A), T + |
(1.9.31)
Полагая u(t) непрерывной функцией времени, а интервал A достаточно малым, получаем:
т+А
}<£T[x(t),u(t),t]dt* <I>T[x(t),u(t),t]A; |
(1.9.32) |
S[X(T + Д), t + Д] * S[x(t).т] + [х(1 + Д ) - х(т)]т |
+ |
|||
+ |
W |
X]+^ ™ |
+ № 1 |
A , (1.9.33) |
где xSt<x+A, а x(x + д) - x(x) » х(х)Д. |
|
|||
Подставив (1.9.32) и (1.9.33) в (1.9.31), имеем |
|
|||
S[X(TH * |
щ |
{ф*№* uW’*1А+s[xW *]+ |
|
|
|
[т,т+Д] |
|
|
|
|
, .3S[X (T),T1 |
ав[х(т),т] |
|
|
|
|
9х (т) |
дт |
|
Поскольку функции S[X(T),T] и 98[х(т),х]/5с не зависят от пере менной u(t), их можно вынести за знак операции минимума. В ре зультате получим соотношение
- ^ И д * m m - Ф т[х (г),и (^ г]л + x(T) £ 5 l ^ l Z l д .
[х,т+Д]
Разделив обе части на Д и заменив х на текущее время t, при Д-»0, получим уравнение для функции Веллмана:
at |
(u(t)} Tl v^ v |
. (1.9.34) |
В процессе решения (1.9.34) при граничном условии (1.9.29) и определяется управление, минимизирующее функционал (1.9.27). Из (1.9.34) и (1.9.29) следует, что решение уравнения Веллмана зависит от вида минимизируемого функционала (1.9.27) и модели ООУ (1.9.26). Необходимо подчеркнуть, что, хотя при выводе не использовались никакие ограничения на вид модели (1.9.26) и по дынтегральной части функционала (1.9.27), аналитическое реше ние уравнения (1.9.34) при условии (1.9.29) в общем виде воз можно лишь для линейных моделей и квадратичных функциона лов.
1.10. АЛГОРИТМ УПРАВЛЕНИЯ ОПТИМАЛЬНЫЙ В
ПОСТАНОВКЕ ЛЁТОВА-КАЛМАНА
Задача синтеза управления формулируется следующим обра зом. Для системы управления (СУ), состояние которой задано мо делью (1.9.8), при наличии измерений (1.9.11), необходимо найти вектор и сигналов управления, оптимальный по минимуму функ ционала качества Лётова-Калмана (1.9.9). Заметим, что I(u) дейст вительно является функционалом, так как каждой функции u(t), определенной на интервале [0 ,tk], ставит в соответствие число I.
В результате минимизации функционала (1.9.9) формируется оптимальное на интервале [0,tk] управление u(t). Поэтому в лите ратуре критерий Лётова-Калмана часто называют интегральным (в отличие от локального критерия, который будет рассмотрен в сле
дующем параграфе). |
|
Поскольку исходные модели линейные, возмущения |
и £и, |
гауссовские, а функционал качества квадратичный (ЛКГ задача), то на основании выводов теоремы разделения, оптимальный регу лятор можно синтезировать в детерминированной постановке за дачи. В связи с этим на первом этапе синтеза будем полагать, что все возмущения отсутствуют (£х=0 , £и=0),и все фазовые координа ты xj в (1.9.11) измеряются точно.
Процедура отыскания сигналов управления в сформулирован ной постановке основана на решении уравнения Веллмана (1.9.34). Сравнивая (1.9.9) с (1.9.27), можно заключить, что
Фт[x(t),u(t),t] = xT(t)L1x(t) + uT(t)Ku(t); |
(1.10.1) |
(1.10.2)
В дальнейшем для упрощения будет опущена зависимость от времени векторов и матриц, не имеющая принципиального значе ния при решении уравнения Веллмана. Подставив (1.9.8), (1.10.1), (1.10.2) в (1.9.34) и (1.9.29), получим
dS[x(t),t]
= г
dt
(1.10.3)
(1.10.4)
Вынесем за знак операции минимума члены, не зависящие от и:
P(t) = -Lx - FTP(t) - P(t)F + P(t)BK_1BTP(t). |
(1.10.12) |
В процессе вывода (1.10.12) было учтено, что матрица Р - симметричная. Граничные условия для (1.10.12) находятся путем сравнения (1.10.4) и (1.10.8) при t=tk:
xT(tk)Qi*(tk) = xT(tk)P(tk)x(tk),
откуда следует, что
P(tk) = Qi* |
(1.Ю.13) |
Поскольку рассматривалась ЛКГ задача, то на основании тео ремы статистической эквивалентности можно утверждать, что де терминированный закон управления (1 .1 0 .1 1 ) будет адекватен ста тистическому при условии замены в нем фазовых координат х их оптимальными оценками х, т.е.
u(t) = -K’VpftJxft). |
(1.10.14) |
Соотношения (1.10.12)—(1.10.14) и определяют алгоритм управления динамической системой, оптимальный в постановке Лётова-Калмана. Оптимальная оценка х определяется уравнения ми (1.4.3)-(1.4.5) фильтра Калмана для процесса (1.9.8) при из вестном и.
Формируемый сигнал управления (1.10.14) зависит от состоя ния системы х, штрафов К за сигналы управления, способности системы воспринимать сигналы управления, которая определяется матрицей В, и весовой матрицы Р. Чем больше штраф за управле ние, тем меньше сигналы и и тем экономичней система, но тем менее она точна. Последнее предопределяется тем, что малые зна чения и вызывают в (1.9.8) малые значения х, а соответственно и малые целенаправленные изменения х. Если система (1.9.8) хоро шо воспринимает сигналы управления и (матрица В имеет боль шие коэффициенты), то имеет смысл делать их большими, так как в такой ситуации будут иметь место большие значения х и систе ма будет быстро изменять свое состояние х. Если же коэффициен ты матрицы В малы, то не следует использовать большие сигналы управления, поскольку это приведет к неоправданно большим рас ходам энергии при очень малом выигрыше в точности.
Коэффициенты матрицы Р совокупным образом учитывают в (1 .10 .1 2 ) штрафы за текущую точность и экономичность, опреде ляемые матрицами Lj и К, детерминированные связи и эффектив ность сигналов управления, обусловленные матрицами F и В.
85
усложнение вызвано необходимостью решения в обратном времени еще и уравнения (1.10.18).
В дискретном времени уравнения состояния и наблюдений имеют вид (1.9.13), (1.9.14), а критерий Лётова-Калмана описыва ется соотношением (1.9.15). Для задач дискретного управления также справедлива теорема разделения и синтез стохастической систему управления распадается на синтез оптимального детерми нированного управления и синтез системы фильтрации (формиро вания оценок вектора состояния). Аналогично тому, как это сде лано выше, используя дискретные уравнения Веллмана [59] мож но получить алгоритм оптимального дискретного управления
u(k-1) = -R(k- l)x3(k-1), |
(1.10.20) |
где
R(k—l) =[К+BT(k-l)P(k)B(k-1)]'1BT(k-l)P(k)<P(k k-1); (1.10.21)
x3(k) = Ф(к,к- l)x(k-1) + B(k- l)u(k-1); |
(1.10.22) |
i(k) - оптимальная оценка, определяемая уравнениями (1.4.19)-
(1.4.23); P(k) - матрица, удовлетворяющая уравнению
P(k-1)= Ф(к,к- 1)Р(к)Ф(к,к -1)-
-LT(k- 1)[К+ Вт(к- 1)Р(к)В(к- 1)]ьг(к -1), (1.10.23)
сграничным условием
P(kr)=Qb |
(1.10.24) |
Для соотношений (1.10.20)—(1.10.24) имеют смысл все выво ды, полученные в процессе анализа уравнений (1.10.12Н1.10.14).
1.11. АЛГОРИТМЫ УПРАВЛЕНИЯ, ОПТИМАЛЬНЫЕ ПО
ЛОКАЛЬНОМУ КРИТЕРИЮ
В предыдущем параграфе была рассмотрена задача синтеза управления, оптимального по интегральному критерию ЛётоваКалмана, и показано, что в процессе оптимизации искалась опти мальная на интервале [0,tjJ функция u(t). Использование локаль ного критерия предполагает отыскание оптимального управления для каждого текущего момента времени t^ t, которое минимизи-
простой функцией от u(k-l) (а не функционалом, как это было в критерии Лётова-Калмана). Поскольку в (1.11.5) текущий штраф за точность учитывается как матрицей Q1? так и Llf то в даль нейшем без потери общности можно полагать LjH). В такой си туации решение задачи минимизации тривиально и находится пу тем приравнивания нулю производной от I по u(k-l), что приводит к следующему алгоритму оптимального управления
(1.11.6)
K(k-1) =[K+BT(k-l)Q1B(k-l)]-,BT(k-l)Q,®(k,k-l). (1.11.7)
Так как в соответствии с принципом оптимальности Веллмана, предыдущее оптимальное управление не зависит от последующего, то проделав такие же рассуждения для предыдущего интервала [к-2 , к-1 ] получим, что оптимальное управление и(к-2 ) определяет ся такими же формулами (1.11.6), (1.11.7) с заменой к-1 на к-2.
Сопоставляя алгоритм оптимального по локальному критерию управления (1-11.6)—(1.11.7) с аналогичным алгоритмом (1.10.20)- (1.10.24), оптимальным по интегральному критерию Лётова-Кал мана, можно увидеть, что они сходны по структуре. Различие лишь в том, что вместо матрицы Р(к) для оптимального алгоритма с интегральным критерием, которая определяется уравнением (1.10.23) с граничным условием (1.10.24), в алгоритме с локаль ным критерием используется фиксированная матрица Q*, фигури рующая в показателе качества (1.11.3). Таким образом, при ис пользовании локального критерия получаем существенно более простой алгоритм оптимального управления. Однако это упроще ние, во многих случаях, приобретается за счет ухудшения показа теля точности формирования управляемой траектории.
В соответствии с выводами теоремы разделения для статисти ческого варианта необходимо в (1 .1 1 .6) заменить фазовые коорди наты их оптимальными оценками. Тогда
(1.11.8)
Задача локальной оптимизации непрерывных систем может быть сформулирована следующим образом: для системы (1.9.8) при наличии измерений (1.9.11) необходимо найти вектор сигна лов управления, оптимальный по минимуму функционала
о J
(1.11.9)