Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Радиолокационные измерители дальности и скорости. [Т.1]

.pdf
Скачиваний:
13
Добавлен:
12.11.2023
Размер:
21.62 Mб
Скачать

ГЛАВА 1. МЕТОДЫ СИНТЕЗА ДИНАМИЧЕСКИХ СИСТЕМ

1.1.ОБЩИЕ ПОДХОДЫ К СИНТЕЗУ ДИНАМИЧЕСКИХ СИСТЕМ

ВПРОСТРАНСТВЕ СОСТОЯНИЙ

Задачей синтеза является получение алгоритмов функциони­ рования динамических систем (ДС), наилучших (оптимальных) в том или ином смысле. В общем случае, наилучшими являются ал­ горитмы, обеспечивающие высокую точность и устойчивость ДС, а также их низкую чувствительность к изменению условий функ­ ционирования. Синтез ДС проводится на основе априорных сведе­ ний о состоянии системы, наблюдаемых полезных и мешающих сигналах, их статистических характеристиках при отсутствии и наличии дополнительных (структурных, вычислительных и энер­ гетических) ограничений.

Структурные ограничения обусловлены наличием заданной части системы или ее связей с внешними устройствами. Вычисли­ тельные ограничения предопределяются недостаточным быстро­ действием и объемом памяти цифровых вычислительных машин (ЦВМ), реализующих алгоритмы обработки. Несмотря на постоян­ ное улучшение этих показателей, в обозримом будущем возможно­ сти вычислителей будут ограничивать степень совершенства ДС. Энергетические ограничения проявляются в двух аспектах: в за­ тратах энергии на функционирование ДС в целом и в затратах энергии управляющих сигналов. Причем в последнем случае иг­ рают роль как ограничения на величину энергии управляющих сигналов за весь интервал управления, так и ограничения на мгновенные значения сигнала.

В практике разработки ДС выделяют три группы методов синтеза: эмпирические, основанные на опыте и интуиции проектировщиков; классические, оперирующие с преобразования­ ми Лапласа и Z-преобразованиями, передаточными функциями, структурными схемами и частотными характеристиками [26, 50, 61], и современные, использующие описание процессов и систем в пространстве состояний [34, 67, 77].

Описание процессов и систем в пространстве состояний осно­ вано на представлении их эволюций в виде элементов х множества X возможных состояний. При таком представлении каждый эле­ мент множества хеХ должен однозначно и по возможности полнее характеризовать мгновенное состояние рассматриваемой системы

или процесса. Процесс, протекающий во времени, отображается как движение элемента х в пространстве X. Обычно элементы х представляют набор х1? х2, ... хп упорядоченной совокупности чи­ сел, который удобно отображать вектором x=|xi х2 хп|т, назы­ ваемым вектором состояния. При рассмотрении эволюций процес­ сов или систем в пространстве состояний этот вектор, в общем случае является функцией непрерывного или дискретного време­ ни:

II

X

см X

1г-

;(k) = [Xl(k) x2(k)

х»МГ>

Хп(к)Г>

(1.1.1)

(1.1.2)

где t - текущее время; к=1,2... - номер дискрета времени. В тео­ рии систем управления пространство состояний иногда называют

фазовым, компоненты i = 1, п вектора х - фазовыми координа­

тами, а эволюцию самого вектора х - фазовой траекторией.

В пользу описания процессов и систем в пространстве состоя­ ний можно привести следующие соображения. Фазовые траекто­ рии непрерывных (1.1.1) и дискретных (1.1.2) процессов и систем представляются в виде дифференциальных и разностных уравне­ ний, в отличие от изображений по Лапласу и Z-преобразований в классических методах. Это позволяет получить естественные, фи­ зически наглядные модели в форме, удобной для применения в ЭВМ. Модели (1.1.1) и (1.1.2) дают возможность на основе вектор­ но-матричных представлений унифицировать описание одномер­ ных, многомерных, линейных, стационарных, нестационарных и широкого круга нелинейных процессов и систем. Кроме того, та­ кие модели пригодны для описания как замкнутых (автономных) систем и процессов, не взаимодействующих с другими системами и процессами, так и систем, в которых указанные взаимодействия имеют место.

Динамику изменения вектора состояния (1.1.1) в общем слу­

чае описывают дифференциальным уравнением

 

x(t) = f[x(t),u(t),5x(t),t],

(1.1.3)

в котором f - нелинейная вектор-функция; ueU (u=[u! u2 ... ur]T) - вектор сигналов управления, описывающий воздействие на ДС внешних систем; £х“ [4х1 £х2 £хр]т - вектор возмущений состоя­ ния.

Некоторые из фазовых координат процесса х могут быть дос­ тупны наблюдению. Этот факт отображается уравнением наблюде­ ния (измерения)

(1.1.4)

в котором z=[zi zg ... ZnJ1, - вектор наблюдений; h - в общем слу­ чае нелинейная вектор-функция; £я=Ки1 £и2 ••• £ит]т - вектор воз­ мущающих (мешающих) сигналов.

В случае описания процессов и систем в дискретном времени соответствующие уравнения имеют вид

(1.1.5)

(1. 1. 6)

Для решения задачи синтеза в пространстве состояний, как правило, необходимо выполнить следующие процедуры:

1.Обосновать объём и конкретный вид априорной инфор­ мации в виде: исходных моделей интересующих процессов и опти­ мизируемых систем; используемых первичных измерителей; зако­ нов распределения и статистических характеристик всех видов возмущений; заданного поля условий применения и всех ограни­ чений, накладываемых на проектируемую систему.

2.Выбрать тот или иной критерий оптимальности.

3.Сформировать алгоритмы функционирования ДС, опти­ мальные по выбранному критерию с учетом всех накладываемых на неё ограничений.

Объем априорной информации во многом определяет как ис­ пользуемые методы синтеза, так и получаемые результаты. Наиболее простым является случай полной априорной информа­ ции и отсутствия каких либо ограничений. Описание процессов и систем представляют в форме уравнений (1.1.3), (1.1.4) или (1.1.5) , (1.1.6) с известными параметрами и статистическими характеристиками случайных процессов £х и £и. Для синтеза оптимальных ДС в этом случае используют хорошо разработанную теорию оптимального оценивания [67, 77], в которой можно выде­ лить несколько направлений. В зависимости от типа обрабаты­ ваемых процессов: аналоговых (1.1.3), (1.1.4) или дискретных (1.1.5) , (1.1.6) - различают соответственно аналоговые или диск­

ретные алгоритмы оценивания. При смешанном (непрерывном и дискретном) описании процессов и систем используют комбиниро­ ванные (непрерывно-дискретные) алгоритмы. Если оцениваемые и

измеряемые процессы представляются линейными уравнениями, то говорят о линейном оценивании. Если хотя бы один из этих процессов описывается нелинейными уравнениями, то имеет место нелинейное оценивание. Процедуру, когда оптимальная оценка динамического процесса (1.1.3) формируется непосредственно на момент получения текущего измерения (1.1.4) называют фильтра­ цией. При формировании оценок на моменты времени, опережа­ ющие время поступления наблюдений, говорят об экстраполяции. Если оценки формируются на моменты времени, которые отстают от времени получения измерений, то имеет место интерполяция (сглаживание).

Более сложной является задача синтеза при полной априорной информации и наличии ограничений на проектируемую систему. Методы синтеза в этом случае базируются на статисти­ ческой теории оптимального управления (СТОУ). Основным из них является метод динамического программирования, базирующийся на сформулированном Веллманом принципе оптимальности [34, 43, 56, 59, 67, 77]. При решении детерминированных задач опти­ мального управления широко используется принцип максимума Понтрягина [56, 59]. Статистический синтез оптимального управ­ ления приводит к необходимости формирования оптимальных оце­ нок информационных процессов методами теории оптимальной фильтрации. Также как и в теории оптимальной фильтрации СТОУ допускает различные варианты построения линейных и нелинейных систем в непрерывном, дискретном и непрерывно­ дискретном времени. Наличие дополнительных ограничений при синтезе приводит к усложнению синтезируемой системы (она становится многоконтурной) и ухудшению потенциальных показа­ телей качества по сравнению со случаем отсутствия ограничений [46, 67, 69].

Случай полной априорной информации является удобной тео­ ретической моделью, однако не соответствует многим практичес­ ким задачам. Прежде всего описание реальных процессов и систем уравнениями (1.1.3Н1.1.6) является приближенным. Статистичес­ кие характеристики исследуемых физических процессов также из­ вестны с той или иной точностью. Использование в условиях не­ полной априорной информации систем, синтезированных для случая полной априорной информации, приводит к ухудшению их реальных показателей качества, а в ряде случаев и к их полной неработоспособности. Поэтому в последнее время интенсивно развиваются методы синтеза в условиях неполной априорной ин­ формации [51].

Существуют различные подходы к построению динамических систем при априорной неопределенности условий их работы. Один из них (минимаксный) состоит в том, чтобы оптимизировать структуру и параметры системы для наиболее трудных условий функционирования. При таком подходе достигаются наилучшие показатели качества для наихудших условий работы. Построенные на таком подходе динамические системы при более благоприятных условиях работы оказываются неоптимальными. Минимаксный подход прост, он позволяет использовать ДС с неперестралваемыми параметрами и ограничивать величину максимальных ошибок. Поэтому он получил определенное распространение на практике. Однако с учётом растущих требований к точности работы он может оказаться неприемлемым, так как не обеспечивает миними­ зацию ошибок для всех условий работы.

Еще один способ преодоления априорной неопределенности состоит в построении систем, инвариантных к неизвестным статис­ тическим характеристикам полезных и мешающих сигналов. В инвариантных системах показатели качества их работы не зависят от характеристик сигналов и помех. Однако платой за такую инва­ риантность является худшая эффективность функционирования.

В наиболее эффективных - адаптивных ДС, априорная неопределённость статистических характеристик полезных и мешаю­ щих процессов преодолевается оцениванием неизвестных парамет­ ров систем и процессов в процессе работы и использованием полученной информации для оптимизации системы. Во многих практических задачах априорная неопределенность носит парамет­ рический характер и сводится к неопределенности некоторых па­ раметров статистических распределений процессов, что эквива­ лентно неопределенности соответствующих параметров моделей (1.1.3Н1-1.6). В этих условиях соответствующие модели можно представить в виде

x(t) = f[x(t),u(t),oc,£x(t),t], z(t) = h[x(t),a,£„(t),t],

(1.1.7)

x(k +l)=f[x(k),u(k)>a,5x(k),k], z(k) = h[x(k),a,£H(k),k],

(1.1.8)

где a - вектор неизвестных параметров, который может быть пос­ тоянным или меняющимся во времени. В процессе адаптации про­ водится оценка указанных параметров.

Адаптация может также осуществляться непосредственной подстройкой параметров синтезированной динамической системы,

минуя прямую оценку неизвестных параметров информационных процессов (1.1.7), (1.1.8).

Достоинство адаптивных систем в том, что при успешной адаптации априорная неопределенность преодолевается полностью и показатели качества системы в всем диапазоне условий работы оказываются наилучшими.

Также как и в случае полной априорной информации, в ус­ ловиях параметрической априорной неопределенности более про­ сто решаются задачи при отсутствии ограничений на структуру системы и энергетические затраты. Для решения таких задач ис­ пользуется теория адаптивной фильтрации [51].

1.2. КРИТЕРИИ И ПОКАЗАТЕЛИ ЭФФЕКТИВНОСТИ РАДИОЭЛЕКТРОННЫХ СИСТЕМ

Под эффективностью радиоэлектронной системы (устройст­ ва) понимают степень ее соответствия своему назначению [42, 76]. Оценивается эффективность с помощью показателей и критериев. При этом показатели представляют количественную оценку эф­ фективности, а критерии - правило, по которому определяется степень соответствия системы своему назначению.

Синтез любой динамической системы предполагает задание критерия эффективности ее функционирования. Математической основой выбора наилучшего (оптимального) решения являются теория игр и статистических решений [54] и теория динамическо­ го программирования. Приведем основные положения указанных теорий, которые понадобятся для решения задачи синтеза радио­ локационных измерителей.

Пусть информационный процесс в пространстве состояний представляется вектором x(t) (1.1.3). Наблюдаемый процесс z(t) описывается уравнением (1.1.4). При этом X - множество возможных решений (оценок), а х е X - его элементы. Совокупность различных преобразований q>(z(t)) наблюдаемых данных z(t) в оценки x(t) образуют множество возможных решающих правил -

алгоритмов обработки данных наблюдения z(t). Каждый алгоритм обработки cp(z(t)) приводит к соответствующей оценке x(t). Для

сравнения различных оценок вводится количественная мера g(x,x), получившая название «функции потерь» («функции штра­ фов»). Эта функция представляет собой априорную оценку послед­

ствий принятия решения x(t), в то время как реальный процесс

отображается вектором x(t). В большинстве практических задач потери зависят не от абсолютных значений х и х, а от их разно­ сти, т.е. g(x,i) = g(x - х). Наиболее часто используемые функции

потерь: квадратичная

g(x-x) = (x -x )TQ(x-x),

(1.2.1)

где Q - весовая неотрицательно определенная матрица, и простая

g(x- х) = |х- х|.

(1.2.2)

Так как информационный процесс х и его оценка х описы­ ваются случайными функциями времени (в уравнения (1.1.3) и (1.1.4) входят случайные процессы и £и), то функция потерь g(x - х) также является случайной. В связи с этим в теории стати­

стических решений вводится понятие “риска” R, характеризующе­ го потери в среднем, т.е.

R = M[g(x ~ х)],

(1.2.3)

где М[*] - операция математического усреднения. В зависимости от полноты усреднения в (1.2.3) вводят несколько различных рис­ ков, которым соответствуют разные принципы выбора оптималь­ ного решения.

Прежде всего рассмотрим случай полной априорной инфор­ мации о статистических характеристиках всех процессов и отсут­ ствия ограничений на синтезируемую систему. Выберем в качестве вероятностной меры при усреднении в (1.2.3) совместную плот­ ность распределения вероятностей W(x,z). Тогда имеем

= |

J g ( x - x ) w ( x , z)dxdz.

(1.2.4)

- 0 0

- 0 0

 

Риск, определяемый соотношением (1.2.4), называется сред­ ним. Используя формулу Байеса для плотности W(x,z), выражение (1.2.4) представим в виде

Щ = | } g(x-x)w(x|z)w(z)dxdz = J R^fxjzjV^zjdz, (1.2.5)

где Rpa(xjz) = | g(x - x)w(x|z)dx - апостериорный риск (т.е. после

- 0 0

проведения наблюдений z(t)), a W(x|z) - апостериорная плотность вероятности.

Располагая функцией риска R (x) можно очевидным образом сформулировать задачу нахождения оптимальной оценки: опти­ мальной называется оценка х0, минимизирующая средний риск.

Такая оптимальная оценка называется байесовской.

Используя методы вариационного исчисления легко пока­ зать, что оптимальной байесовской оценкой при квадратичной функции потерь (1.2.1) является условное математическое ожида­ ние

(1.2.6)

а при простой функции потерь (1.2.2) - оценка хтах, доставляю­

щая максимум апостериорной плотности W(x|z). В дальнейшем в книге используются в основном оценки условного среднего (1.2.6), при записи которых будет опускаться индекс «О». Показатель ка­ чества (1.2.5) с функциями потерь (1.2.1), (1.2.2) широко исполь­ зуется в теории оптимальной фильтрации при полной априорной информации о статистических характеристиках исследуемых про­ цессов.

В условиях неполной априорной информации, когда неопре­ деленность носит параметрический характер и описывается векто­ ром а неизвестных параметров, средний риск (1.2.5) также стано­ вится функцией этих параметров Щ х,а). В этом случае, следуя общей методологии, введем усреднение по а

^а шах оо оо

Ё(х) =

J \ \ g(x(a)-x)W(x,z,a)dxdzda =

 

a min -со -оо

a шах

Jg(x(a)- x)w(x|z,a)dx w(z|a)dz W(a)da. (1.2.7)

= I

Критерий минимума риска Ё(х) используется в теории адап­

тивной фильтрации для нахождения оптимальных оценок в усло­ виях параметрической априорной неопределенности. Более под­ робно процедура минимизации Й(х) будет рассмотрена в соответ­

ствующих разделах книги.

18

Вернемся к задаче с полной априорной информацией, но при наличии дополнительных ограничений. Конкретизируем вид огра­ ничений применительно к задачам синтеза радиолокационных из­ мерителей. Это прежде всего ограничения на структуру системы, что может быть обусловлено заданной инерционной частью систе­ мы, цепями управления и т.д. Будем полагать, что заданная часть системы в пространстве состояний описывается Z-мерным вектором ху, удовлетворяющим уравнениям:

ху = fy(xy,u,Sy(t))

(1.2.8)

в непрерывном и

 

 

x y(k+ Х) = fy(xy(k> u(k). М к))

(1.2.9)

- в дискретном времени, в которых £y=Kyi £У2 ••• byilT

- возмуще­

ния, U -

ur]T - управляющие сигналы.

 

В общем случае наблюдения (1.1.4), (1.1.6) также зависят от

вектора ху:

 

 

z(t) = h(x(t),xy(t),£„(t)),

(1.2.10)

z(k) = h(x(k),xy(k),£и(к)).

(1.2.11)

Второй тип возможных ограничений это ограничения на об­

ласть возможных управлений:

 

и , < и доп1,

 

(1.2.12)

где Ufl0Ili - допустимая величина i-ro сигнала управления.

Третий вид ограничений - это ограничения в затратах энер­ гии управляющих сигналов. Точнее сказать это не ограничения, а желание проектировщика минимизировать энергию управляющих сигналов. Поэтому соответствующий (как правило квадратичный uTKu) член вводится в функцию потерь. По аналогии с (1.2.3) вве­

дем обобщенный риск:

 

Ry = M[g(x, ху,и,t)],

(1.2.18)

где g(x,xy,u,t) - обобщенная функция потерь.

В теории статистического оптимального управления [34, 77] выбор функции потерь более тесно связан с существом решаемой задачи, чем в статистической теории оценивания. Однако этому

факту не всегда уделяется достаточно внимания. Прежде всего в СТОУ различают два варианта задания времени управления.

В первом варианте используется фиксированный интервал времени TK=[0,t,J, на котором формируется оптимальное управле­ ние, а соответствующая функция потерь представляется как инте­ гральная функция

g1(x,xy,u,tk)= Jg(x,xy,u,t)dt.

(1.2.14,а)

о

Во втором - время полагается текущим, а функцией потерь явля­ ется

g2(x,Xy, u,t) = g(x, ху, u, t).

(1.2.14,6)

В первом случае критерий называется интегральным, так как управление должно быть выбрано из условия экстремума функ­ ционала, заданного на интервале времени TK=[0,t,J. При этом gl(x,xy,u, tK) является функционалом от u(t), te[0,tIC]. Во втором случае критерий называется текущим (локальным), так как требу­ ется обеспечить экстремум показателя качества в каждый теку­ щий момент времени. При локальном критерии, строго говоря, вариационная задача, понимаемая как задача минимизации функционала, вырождается, так как показатель g(x,xy,u,t) явля­

ется скалярной функцией времени, а его минимум необходимо обеспечить в любой текущий момент времени за счет выбора те­ кущего значения u(t) вектора управления. При синтезе оптималь­ ных ДС возможно использование как интегрального, так и ло­ кального критериев.

В СТОУ, входящую в (1.2.14) функцию потерь g(x,xy,u,t)

часто задают в виде

g(x, Ху, u, t) = g(x, ху,t) + uTKu,

(1.2.15)

где К - положительно определенная матрица, задающая вес мощ­ ности управляющих сигналов в общем показателе качества; g(x,xy, t ) - функция потерь, аналогичная (1.2.1).

В случае интегрального критерия в показателе качества чаете выделяют компоненту, соответствующую конечному времени tK т.е. записывают его в виде