Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Модели непрерывных каналов связи на основе стохастических дифференциальных уравнений

..pdf
Скачиваний:
16
Добавлен:
12.11.2023
Размер:
21.48 Mб
Скачать

Рассмотрим систему СДУ типа уравнений Навье—Стокса [64],

описывающих векторное поле y{t,

/*) = [#!(/, /•),

yn(t, г ) ] т:

 

и

Jjfk

ЬУь(‘ - r)+ J ] a,

&»k

k=z\, 2,

 

dt

' 2 j У 1'

drj

drjdt= $(*./•),

n\

 

 

 

/=i

 

 

(4.3.17)

 

 

 

 

 

 

где

Д = -^ —+ . . . + —— —оператор

Лапласа.

 

 

 

dr2,

 

dr21

 

 

 

Здесь уже потребуется использовать преобразование Фурье по

/+ 1

переменным

t, Г\, ...» п. Применяя его к СДУ (4.3.17)

анало­

гично тому, как это было сделано выше в двумерном случае, по­ лучаем для спектральных амплитуд поля уравнение

i » +

S(О V/)! +

a, (i a,) (i v,)] 1 У, (к) +

 

 

/=1

 

 

 

)

 

 

S iv / J

Yi (rri)Yq( k - m ) d m =

Eq{k),

(4.3.18)

/ = 1

— 00

 

 

 

 

 

 

где к=(со, vi, ..., Vi),

q = 1, 2,

...,

я.

Для

характеристического

функционала

 

 

00

 

 

 

 

 

 

I

п

 

 

 

Ф [у (k)] =

1S

 

 

 

М exp < i

—00 <?=1М

к) У<?

 

 

 

 

 

 

 

получаем систему уравнений, аналогичную (4.3.14). Решая ее, на­ ходим Ф [у (к)] и по нему— моментные функции спектральных ам­ плитуд поля. Если моментные функции высших порядков можно считать близкими к нулю, то для корреляционной функции спек­ тральных амплитуд получается простое выражение

_________ S (k ,-k a)

 

(4.3.19)

В { К к .)= = 4 '

I

Т »

 

(Ь ,)Ч

io',

v/»)

 

 

/=|

 

 

где v = (v n , V21, .... v/i). В противном

случае

необходимо учиты­

вать взаимную зависимость моментных функций, которая сильно усложняет их определение.

Корреляционная функция самого поля y(t, г) определяется по £ (к ь кг) так же, как это было сделано выше. Синтез квазилиней­ ных моделей осуществляется аналогично линейным.

4.4. ИССЛЕДОВАНИЕ МОДЕЛЕЙ РАЗРЫВНЫХ СЛУЧАЙНЫХ ПОЛЕЙ

Для случайных полей в каналах связи, как и для случайных процессов (сМ. гл. 3), не всегда приемлемы непрерывные модели. Импульсные помехи, распределенные в пространстве, и некоторые виды ПВ сигналов в каналах связи следует рассматривать как разрывные случайные поля. Моделями таких полей могут служить

9*

131

СДУ в частных производных тех же видов, что рассмотрены в §4.2 и 4.3, с тем лишь отличием, что вместо белого шума £(/, г) в ка­ честве возбуждающего воздействия рассматривается пуассоновская последовательность распределенных в пространстве дельта-им­ пульсов

■q(t, r) = E i4 ft8 ( f - f A)8(r — rk)

Я

с векторами «амплитуд» А *, имеющими плотность вероятности р(Аъ). Эта последовательность характеризуется некоторой интен­ сивностью (средним числом импульсов в заданной ПВ области) \л, а действительно появляющееся число импульсов представляет собой случайную величину, распределенную по закону Пуассона [106, 127]. Будем в дальнейшем называть поле такого вида пуас­ соновским.

В общем случае СДУ с воздействием в виде пуассоновского поля порождает некоторое разрывное поле x(t, г). Рассмотрим мо­ дели разрывных полей в форме СДУ первого и высших порядков.

4.4.1. СДУ первого порядка

Рассмотрим СДУ

■ ^ ^ = f ( x ) S ^

f L lL + , ( x ) + ii( / ' г)'

(4 А 1 )

/=1

;

 

аналогичное по виду (4.2.1), с оператором (4.2.2). Здесь т](^, г) — пуассоновское поле.

Разрывное случайное поле, определяемое (4.4.1), является мар­ ковским по времени (см. § 1.4), и его плотность вероятности удов­ летворяет некоторому уравнению, обобщающему уравнение Колмо­ горова— Феллера. При F(x)={30I это уравнение можно записать в виде

i

 

 

dw(x, t,

г) _

^

dw(х , t, г) _

 

 

 

 

 

dt

 

^

дг,

 

 

 

 

 

 

 

/=1

'

 

 

П

 

 

 

 

00

 

 

 

[fft(x)uy(x,

t,

T)]-{-vA J

p (A )w (x — \, t, T)dk — vAw{x,t,T).

k=l

*

 

 

 

—oo

 

 

(4.4.2)

 

 

 

 

 

 

 

 

 

Краевые условия

для

(4.4.1)

аналогичны

тем,

что задаются

для уравнения

(4.2.3).

 

 

 

 

 

 

Если

F(x)

является скалярной

функцией

вида

F(x) = p ix -j-p 0»

то вместо (4.4.2) справедливо уравнение

 

 

 

d w (x ,t,r ) __Q

dw(x,t,r)

■£rlf (x)w(x,

t, r)] +

 

dt

" Р

0

dr

 

 

 

 

 

 

132

^ “ ■ £ ■ [ ^ 1

^ .(М> г)

 

j

p(A)w(x — A, t, r)dA

L

—oo

J

—oo

 

 

 

vAw (x ,

t,

r),

(4.4.3)

аналогичное

(4.2.4).

(4.3.1)

можно

записать статистически

Как и для

(4.2.1), для

эквивалентное ему в рамках описания одномерными распределе­ ниями и корреляционными функциями СДУ типа (4.2.5), в кото­ рое вместо |(/, г) входит т](/, г).

Решение уравнения (4.4.3) в стационарном и однородном ре­ жимах аналогично решению УКФ, рассмотренному в гл. 3. Одно­ родное (но не обязательно стационарное) решение Wo(xy t) также находится методами теории разрывных марковских процессов, опи­ санными в гл. 3. Стационарное решение wcт(х, г) уравнения (4.4.3), как и в разд. 4.2.1, может быть найдено двумя способами: в эксцессном приближении и путем сведения его к дифференци­ альному уравнению для функционала от wcт(х, г).

Первым способом решение получается та^ ж е, как в разд.

4.2.1, с тем лишь отличием, что теперь К = уаА2, а £>4= —\аАа/4а. Второй способ рассмотрим подробнее. Учитывая, что ищется стационарное решение, т. е. dw (х, /, r ) f d t = 0 и полагая f { x ) = —ах,

вводим функцию

00 00

s(v, и) = ~

Г Г wc(x, r)eHm+''n dxdr.

—00 —00 Из (4.4.3) получаем для этой функции уравнение

— i wp0s (v, и) = —

“I +

 

+ « , r * ^ f i + i l b J l j + V j(S (0i и)[вл(0) _ 1].

(4.4.4)

где 0л (я)— характеристическая функция распределения р(А). Решение уравнения (4.4.4) имеет вид

s(v, и) = С ехр

а~ *л1ед(р) ~ П —ittPo

aV

Подставляя в полученную формулу то или иное конкретное вы­ ражение 0л (и) и выполняя обратное преобразование Фурье по v и и, можно найти плотность вероятности адСт(*, г).

Синтез СДУ (4.4.1) при Т7 (л:) =pijc-f-p0 по заданной плотности вероятности wc.0(x) и корреляционной функции /С*(т, р) или спек­ тру £/х(й), v) может быть осуществлен методами, аналогичными

рассмотренным в гл.

3.

Пусть, например,

р (Л )= £ (Л —Л0). Тогда функция /(.*) в СДУ

отыскивается по (3.2.26), а Ао может быть найдено с использова-

133

нием соотношения

оо

- 1/2

 

/* (■*) wn (x)dx

Если vx^>l, то поле близко к непрерывному и справедливы все соотношения разд. 4.2.2.

4.4.2. СДУ высших порядков

 

 

Рассмотрим СДУ

 

 

Р'игУУ, г )= т !(/, г),

(4.4.5)

аналогичное по виду (4.3.1), где

т](£, г)— пуассоновское

поле.

Если оператор ST\,г имеет вид

(4.3.2), то, поступая так же, как

в разд. 4.3.1,,получаем для характеристического функционала спек­ тральных амплитуд поля уравнение

fW^ - 1 я.им- ^ - "У.1,- в| +

+ |]<-О1V. Ф[.(к)) [ у1~ V

(4.4.6)

/=2

 

являющееся аналогом УКФ. Из него, так же как и в случае не­ прерывного поля, находим выражение корреляционной функции спектральных амплитуд:

в { К к ,)= -

v ,4 2

(4.4.7)

5 (к ,— кг).

 

2 I F(к,)

 

которое отличается от (4.3.8) только постоянным множителем. Та­ кое совпадение объясняется тем, что в обеих моделях (непрерыв­ ной и дискретной) заданы дельта-коррелированные воздействия.

Соображения относительно факторизации корреляционной функции, изложенные в разд. 4.3.1, остаются справедливыми и здесь.

Что же касается квазилинейных и нелинейных СДУ, то для описываемых ими полей также можно получить уравнения харак­ теристических функционалов в вариационных производных, одна­ ко решение их в аналитическом виде затруднено. В гауссовском приближении корреляционную функцию можно определять по фор­ муле вида (4.3.16).

Если предположить, что не только воздействие, но само поле

y(t,

г) является пуассоновским, т. е. V X= V A , т о при

анализе моде­

лей

разрывных полей в форме СДУ (относящихся

к классу ли­

нейных) для определения корреляционной функции можно вос­ пользоваться и другим подходом: предварительно получить на ос­ нове СДУ модель поля в интегральной форме (1.2.1), т. е. найти импульсную переходную характеристику формирующего фильтра

134

Н(т, р) (функцию Грина). Через нее корреляционная функция по­ ля аналогично тому, как это было сделано в § 4.3, выражается весьма просто:

К у (т , Р) —

J J Н(/, r)HT(i+ x, r+ p)drdt. (4.4.8)

-oofe

Выражения функций Грина известны для многих видов уравне­ ний в частных производных [18, 52, 139].

Глава 5

и д ен ти ф и к ац и я , оцени вание и

ОБНАРУЖЕНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ И ПОЛЕЙ В КАНАЛАХ СВЯЗИ С ИСПОЛЬЗОВАНИЕМ МАРКОВСКИХ МОДЕЛЕЙ

5.1. ЗАДАЧИ И МЕТОДЫ ИДЕНТИФИКАЦИИ МОДЕЛЕЙ СЛУЧАЙНЫХ ПРОЦЕССОВ И ПОЛЕЙ

5.1.1. Содержание задач идентификации и оценивания

При построении моделей случайных процессов и полей в кана­ лах связи наряду с синтезом по известным вероятностным харак­ теристикам, рассмотренным в гл. 2—4, возможен и другой подход, основанный на методах идентификации динамических систем и предполагающий определение параметров модели путем непосред­

ственной

обработки наблюдаемых реализаций

сигналов и помех

в канале.

О взаимосвязи этих двух подходов,

их преимуществах

и недостатках говорилось в § 1.6. По сравнению с синтезом иден­ тификация в меньшей степени связана с какими-либо априорными допущениями о характеристиках моделируемого процесса или по­ ля, позволяет более гибко приспосабливать модель к их измене­ ниям и вести на ее основе обработку сигналов в реальном масшта­ бе времени, что очень важно, когда речь идет о каналах связи. Вместе с тем знание результатов синтеза может существенно об­ легчить и упростить процедуру идентификаций.

К настоящему времени разработаны многочисленные методы идентификации динамических систем различной физической при­ роды, в том числе и с распределенными параметрами [34, 45, 109, 115, 121, 161]. В общем случае идентификация осуществляется в условиях априорной неопределенности относительно не только параметров модели, но и самой ее структуры. Однако на практике для большинства объектов те или иные физические соображения позволяют ограничиться поиском модели в рамках структур опре­ деленного типа или даже одной структуры, предполагая неизвест­ ными только некоторые ее параметры. Как отмечалось ранее, та-

135

кой структурно-детерминированный подход может быть принят и при описании каналов связи.

Применительно к каналам связи задача идентификации на практике чаще всего ставится как задача измерения их импульс­ ных переходных характеристик или передаточных функций по ре­ зультатам наблюдения выходных сигналов при известных или ча­ стично известных сигналах на входе в условиях аддитивных помех. В первом случае измерения осуществляются по откликам на спе­ циальные зондирующие сигналы, во втором— по информационным сигналам (при передаче дискретных сообщений форма элементов сигнала на входе обычно известна, но их последовательность слу­ чайна). Подобные методы идентификации, в том числе и для ПВ каналов, подробно описаны в [56, 57, 156].

Иначе обстоит дело с задачами идентификации феноменологи­ ческих моделей, которые, как отмечалось выше, являются основ­ ными при описании аддитивных помех и случайных системных ха­ рактеристик каналов. Особенность их в том, что они описывают некий гипотетический механизм формирования случайного процес­ са или поля, не обязательно соответствующий реальному физиче­ скому механизму, поэтому входные сигналы таких моделей также являются «виртуальными» и принципиально недоступны наблюде­ нию. С точки зрения возможности наблюдения такие модели вооб­ ще не имеют входов, и их возбуждающие воздействия (обычно это белый шум) следует рассматривать как внутренние сигналы.

Конечно, существует немало реальных объектов, входы кото­ рых недоступны наблюдениям по чисто техническим причинам. Поэтому разработаны и такие методы идентификации, которые не требуют наблюдения входных сигналов и, следовательно, могут быть применены и к феноменологическим моделям случайных сиг­ налов и помех. Однако арсенал их значительно беднее по сравне­ нию с идентификацией «по входу и выходу», а возможности более скромные.

В указанных выше условиях, т. е. при наличии априорной ин­ формации о структуре модели и недоступности для наблюдения ее входных воздействий, задача идентификации сводится к оцени­

ванию параметров 0 модели случайного процесса или

поля у (t,

г; 0)по наблюдениям его реализаций в смеси с шумом

 

z (t , г)—у (t, г, 0 )+ п (*, г).

(5.1.1)

Под оценкой параметров 0 понимают такой вектор их значений

0, который минимизирует некоторый показатель, характеризующий отклонение оценок от истинных значений параметров и определяе­ мый в общем случае с учетом различной роли разных ошибок и априорного распределения параметров.

При оценке случайных параметров наиболее общим из таких показателей является так называемый средний байесовский риск или соответствующий ему «апостериорный риск» [22, 80, 84, 86,

136

121,

122,

126]:

 

 

 

 

 

Я =

00

z)fifO,

(5.1.2)

 

 

j C{Q, 0)ш(0 I

 

 

—00

 

 

где до(0|г) — апостериорная плотность

вероятности параметров,

связанная с априорной

плотностью

ш(0)

формулой Байеса;

с(0, 0 )—цена ошибок или функция потерь.

Чаще всего рассматривается так называемая простая функция потерь

с(0, 0) — с0 — 8(0 — 0), где с0> 0 —константа, и квадратичная

c{Q, 0) = (0 - 0)r S(0 — 0),

где S—некоторая неотрицательно определенная матрица.

В случае простой функции потерь минимум (5.1.2) достигается при

0'=argmaxtiy(O | г),

(5.1.3)

0

 

т. е. при таких значениях параметров, которые доставляют макси­ мум соответствующей апостериорной плотности вероятности. При. квадратичной функции потерь оптимальной оценкой является, условное среднее по упомянутой апостериорной плотности

00

0 = J Ош (0 ! Z) AO. —’ЭС

Для равномерного априорного распределения ш(0) (5.1.3) рав­ ноценно требованию максимума функции правдоподобия ш(г|0). Последняя, однако, существует лишь для дискретной выборки, а при переходе к непрерывной теряет смысл. Поэтому в общем слу­ чае рассматривают отношение правдоподобия (ОП)

1(0) = w(г |0)

(5.1.4)

т{г |0О)

где 0о—вектор некоторых фиксированных значений параметров. В случае непрерывной выборки также часто используют выра­

жение (5.1.4), но при этом его уже следует понимать как услов­ ную запись предела отношения соответствующих плотностей веро­ ятностей при бесконечном «сгущении» точек наблюдения. Матема­ тически строго ОП определяется как производная одной вероятно­ стной меры по другой—так называемая производная Радона — Никодима [86]

Л(0) __ dP(г 16) dp{z\ е0)‘

Для того чтобы она существовала и указанная предельная про­ цедура имела смысл, соответствующие вероятностные меры долж­ ны удовлетворять условию взаимной абсолютной непрерывности

137

(регулярности). Случаи, когда оно нарушается, будут оговорены ниже особо.

Оценки

0 = argm axA(0)

(5.1.5)

называют оценками по правилу максимального правдоподобия (оценками МП). Наряду с задачами, в которых априорное рас­ пределение параметров можно полагать равномерным, оценки МП широко используются в тех случаях, когда искомые параметры во­ обще нельзя считать случайными величинами с известным'и рас­ пределениями вероятностей и, следовательно, байесовский подход неприменим.

Во многих практических задачах оценки, оптимальные по одно­ му критерию, сохраняют оптимальность (или близки к оптималь­ ным) н по другим критериям.

Задачи оценивания параметров сигналов возникают не только при идентификации их моделей, но и при решении многих прак­ тических вопросов обработки сигналов в радиолокации, связи, из­ мерительной технике и других областях. Так, задача приема дис­ кретных сообщений сводится к различению сигналов с разными •значениями информационного параметра 0 из некоторого дискрет­ ного множества, а задача приема (демодуляции) непрерывных соЬбщений— к оцениванию непрерывного информационного парамет­ ра 0 (/), изменяющегося во времени, а иногда и в пространстве. В частном случае в качестве такого параметра может выступать сам сигнал (поле) у(/, г)=0(£ , г). При этом оценивание его обес­ печивает фильтрацию, сглаживание или предсказание сигнала. Оп­ тимальные оценки ожидаемых сигналов используются при постро­ ении алгоритмов оптимального приема дискретных сообщений в стохастических каналах.

Применительно к сигналам, зависящим только от времени, пе­ речисленные задачи достаточно подробно исследованы и освещены в [22, 80, 126 и др.)]. Для ПВ сигналов (полей) они изучены пока гораздо слабее. Кроме того, в большинстве случаев в этих задачах для сигнала у (t, г, 0) либо принимается простейшая модель в виде явного аналитического выражения, в которое при необходимости вводят помимо оцениваемых параметров 0 некоторые сопровожда­ ющие параметры (примером могут служить задачи .оптимальной демодуляции), либо рассматривается произвольный нормально флуктуирующий сигнал (что характерно для задач радиолокации) [22, 57, 60, 80, 126].

В рассматриваемой здесь задаче идентификации для наблюдае­ мого поля y (tt г, 0) задаются более сложные, в общем случае не­ гауссовские модели в форме СДУ одного из видов, приведенных в § 1.4. Одно из отличий задач идентификации таких моделей от задач их синтеза, рассмотренных в гл. 2 и 3, заключается в том, что априорная информация о моделируемом процессе ограничива­ ется указанием типа порождающего его СДУ. Разумеется^ полнота

138

ее может быть разной: порядок ОДУ (т. е. размерность вектора состояний) п обычно целесообразно задавать априори или опреде­ лять с использованием процедур, описанных в гл. 2—4, но иногда он может предполагаться произвольным и определяться в процес­ се идентификации [53, 110]; для нелинейных функций, входящих в СДУ, могут быть заданы определенные аналитические выраже­ ния, содержащие неизвестные параметры, или же оставлена сво­ бода их выбора в процессе идентификации и т. п.

Математические основы теории оценивания негауссовских слу­ чайных процессов, представленных стохастическими дифференци­ альными уравнениями, заложены в [49, 130, 133, 135 и др.]; позд­ нее предложены некоторые обобщения этих результатов на слу­ чайные поля [4, 188— 192, 197, 198]. Методы оценивания парамет­ ров таких моделей по сравнению с оцениванием состояний развиты слабее [53, 110, 11, 121]. Особенно это касается параметров СДУ в частных производных, описывающих случайные поля. По­ этому в данной главе основное внимание уделяется именно таким моделям. Алгоритмы идентификации моделей случайных процес­ сов могут быть получены как частные случаи рассмотренных ниже алгоритмов идентификации полей, если в них не учитывать про­ странственные координаты г.

5.1.2. Математическая постановка задачи идентификации СДУ

Рассмотрим задачу идентификации моделей случайных процес­ сов и полей в форме СДУ, придерживаясь структурно-детермини­ рованного подхода, о целесообразности которого уже говорилось выше, т. е. будем считать, что заданы СДУ определенного вида, содержащие некоторые неизвестные параметры 0:

^?,гУ(^ г) = К*> г)>

(5-1.6)

где tft.r — некоторый дифференциальный, в общем случае матрич­

ный оператор по временной и пространственным координатам, за­ висящий от 0; |(/, г) —гауссовское поле с известными моментными функциями

Mi(f. г) = 0, М \(t. r)lT(z. р) = К%(t, X, г, р).

(5.1.7)

Предполагается, что структура оператора^:® г , включая сведе-

ния о наивысшем порядке производных, установлена на основе тех или иных физических соображений либо с использованием мето­ дов, изложенных в гл. 2—4. Разумеется, считается известным так­ же число скалярных компонент т моделируемого поля у(/, г).

Здесь и в дальнейшем будем полагать, что параметры модели 0 являются неизвестными, но не случайными, т. е. при всех реали­ зациях поля у (t, г) одинаковы. Стохастические дифференциальные уравнения со случайными коэффициентами образуют особый, го­ раздо более сложный класс стохастических моделей [45], иссле­ дование которого выходит за рамки рассматриваемых здесь задач.

139

При оценивании таких параметров, как следует из разд. 5.1.1, наи­ более подходящим является правило МП. Его и будем использо­ вать в дальнейшем, если не оговорено иное.

Наблюдениям доступны реализации

поля у (t, г)

в области

пространства Q на интервале времени [О, Т] в аддитивной смеси

z(t, r ) = y Q(t, r )+ n (f,

г)'

(5.1.8);

с шумом п(£, г), который будем считать векторным полем с нуле­

вым средним, М п(/, г )= 0

и известной корреляционной матрицей

M n (t,

r)nT(x, р) = Кn(t, х, г, р).

(5.1.9)

Указанные реализации в силу (5.1.6) зависят от параметров модели 0, что подчеркивается обозначением уе(£, г) в (5.1.8).

Таким образом, задача идентификации модели случайного по­ ля в форме СДУ (5.1.6) состоит в следующем: по наблюдениям его реализаций в смеси с шумом (5.1.8) в области [О, Г ]Х Й необ­

ходимо определить значения 0 параметров 0, доставляющие ма­ ксимум ОП (5.1.4).

5.1.3. Методы идентификации

Для практического осуществления идентификации модели поля Уе(/, г) необходимо синтезировать алгоритм, в соответствии с ко­ торым должны обрабатываться наблюдаемые его реализации при

получении оценки 0. Обычно такой синтез включает в себя два этапа: вывод аналитического выражения ОП и его максимизацию по 0. Представлять искомую оценку в виде явного аналитического выражения при этом не всегда возможно и целесообразно, неред­ ко достаточно построить сходящийся к ней итерационный процесс.

Выбора метода идентификации зависит от типа СДУ и степени влияния шума наблюдений. Если заданы уравнения состояния, на­ пример вида (1.4.30), а все компоненты вектора состояния доступ­ ны наблюдению и шумом наблюдений можно пренебречь, то уда­ ется найти и их производные. Это позволяет рассматривать реа­ лизации левой части уравнений состояния как косвенно наблюдае­ мые. Тогда, если шум модели |{t, г) гауссовский, нетрудно запи­ сать соответствующее отношение правдоподобия, из которого сле­ дует, что задача идентификации по правилу МП сводится к наи­ лучшему среднеквадратическому приближению производной век­ тора состояния правой частью уравнения состояния, содержащей искомые параметры 0.

Этот подход, получивший название метода дифференциальной аппроксимации и применительно к моделям случайных процессов освещенный многими авторами, например [121], может быть обоб­ щен, как показано в разд. 5.2.1, и на случайные поля, описываемые СДУ общего вида (1.4.30) в частных производных.

Получение оценок МП параметров СДУ при наличии аддитив­ ного шума наблюдений осуществляется просто только в случае ли-

140

Соседние файлы в папке книги