Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Основы теории оценивания с приложениями к задачам обработки навигационной информации. Ч. 1 Введение в теорию оценивания

.pdf
Скачиваний:
36
Добавлен:
19.11.2023
Размер:
26.49 Mб
Скачать

J x T/(.Y / v)ctc = X T(JO J / (* / jOfifr.

Принимая во внимание условие нормировки, получаем, что оценка, минимизирующая (1.4.33), определяется в виде (1.4.34). Таким образом, решением задачи регрессии является условное ма­ тематическое ожидание.

При решении задачи регрессии нередко ограничивают класс функций, для которых осуществляется минимизация функционала (1.4.33). Наиболее распространенной является линейная регрес­ сия, т.е. такая, у которой при минимизации функционала исполь­ зуется линейная относительно вектора у функция

x(y) = d + Ky

Можно показать (см. раздел 2.4), что при известных значениях математических ожиданий х , у , матрицы ковариаций Ру и мат­

рицы взаимной корреляции Рху при невырожденной Ру решение этой задачи задается соотношениями:

К = Р ХУ' (Р УУ 1;

d = х + Р лу (Р у )-1 у = х + Ку

Отсюда следует, что для решения задачи линейной регрессии достаточно знать только х , у , Ру и Рлу

Любопытно также отметить, что при гауссовском характере случайных векторов решение задачи линейной регрессии является и решением задачи нелинейной регрессии, т.е. без введения ог­ раничений на класс функций, минимизирующих критерий (1.4.33).

Ясно, что по аналогии с тем, как были сформулированы задачи регрессии х по у , могут быть сформулированы и задачи регрес­ сии у по х.

Задачи к разделу

З а д а ч а 1.4.1. Задан вектор у = Ях + v ,в котором совмест­ ная плотность / Х)У(х, у) определена в виде (1.4.20). Найдите ус­ ловную плотность распределения вероятности f ( y / х ) .

Р е ш е н ы е. Для получения решения удобно, используя свой­ ство симметричности для ф.п.р.в., совместную плотность (1.4.20) представить как:

Г М

. Нх + v

1 х , у ( х ’У ) =/у,хО;>*) =N

X

 

3

I W

 

НРУу£± HA+FLÆ A FL iF LtKF l

PXH T + B

j P x

Поскольку искомая условная плотность гауссовская, т.е.

/ / х ) = М(у\ у(х) , Р У/ v ),

то, применяя правила вычисления параметров условной гауссов­ ской плотности, можем записать:

у(х) = Нх + V + (Вт+ НРх)(Рху 1(х - х) ;

Ру,х = НРХН 1 +НВ + BrH r + Pv - (Вт+ НРХ)(РХ)~ХРХН Г + В) .

Раскрывая скобки в этих выражениях, получаем:

у(х) = Fix+ v + В Т(РХУ' + Н ) ( х - х) ;

Ру,х =PV- В Т(РХУ 1В

В частном случае, когда векторы х и v независимы и v = 0 ,

у(х) = Н х ,

Px / x = p v

 

 

т.е. / ! х) = vv(x; Нх, Pv).

 

 

 

Отсюда следует, что при

независимых

х и

v

f ( y / x ) = f v(y - H x) .

 

 

 

З а д а ч а 1.4.2. Пусть вектор у связан с х и v соотношени­

ем у = s(x) + v , причем совместная плотность / х v(х, v) - гауссов­

ская с параметрами, заданными в виде (1.3.25), (1.3.26).

Найдите условную плотность распределения вероятностей /С у /*)•

Р е ш е и и е. Располагая / (х, v ), нетрудно найти / ( v / x ) = W(v; « ( * ) ,/• " " ) ,

где

v(x) = v + BT(Pxy '( x - x ) - ,

Pv,x =PV- B T(PX)~]B

Используя теперь правило нахождения ф.п.р.в. (1.3.6), которое справедливо и для условных ф.п.р.в. для преобразованных случай­ ных векторов, можем записать

f ( y / х) = f v/x (у - six)) = Щу - s(x);v + 5 Т (5 х) _1 (x - x)),Pv/x) .

Вчастности, при 5 = 0, т.е. при независимых х и v

Лу / х) = U (у - six)) = N(y - six); v,Pv).

З а д а ч а 1.4.3. В условиях задачи 1.4.2 при независимых х и

vзапишите выражение для совместной ф.п.р.в. fix, у) и услов­

ной ф.п.р.в. f i x /у).

Р е ш е н и е . Учитывая, что условная плотность ф.п.р.в.

f i y l х) =f viysix)) =Niy - six);v,Pv), используя (1.4.1), полу­

чаем / х у(х, у) = / х ix)fiy / .v) = Nix; х, Рх)Щу - six); v,P v).

Заметим, что выражение для jiylx) полностью совпадает с соот­ ветствующим выражением из задачи 1.4.1 при 5 = 0.

Для f i x ! у) запишем

Л О О Л Д * )

Nix;x,Px)Niy-sjx);v,Pv)

Д * /у ) = у f xix)fiy/x)dx

J Nix; x, Px)Niy - six); v, Pv )dx

З а д а ч а 1.4.4. Задана ф.п.р.в. fix, y! z) Найдите ф.п.р.в. для

f i x / z ) .

Р е ш е н и е .

/(x /z ) = J

fix,y/z)dy.

З а д а ч а

1.4.5. Заданы две ф.п.р.в. fix/y,z) и f i y / z ) . Най­

дите ф.п.р.в. для f i x / z ) .

 

Р е ш е н и е .

/(x /z ) = J

/ ( х / y,z)fiy / z)dy .

1.Поясните, что такое условная (апостериорная) ф.п.р.в. Что необходимо знать о двух случайных векторах, для того чтобы найти условную ф.п.р.в. одного вектора относительно друго­ го? Как это сделать?

2.При каких условиях априорная и апостериорная ф.п.р.в сов­ падают между собой?

3.Когда для определения апостериорной ф.п.р.в. достаточно знать условное математическое ожидание и условную матри­ цу ковариаций?

4.Запишите выражение для ф.п.р.в. с.в. при фиксированном значении другой с.в., совместная ф.п.р.в. которых гауссовская с известными параметрами. Поясните, как получено это вы­ ражение. К чему стремится эта функция при стремлении нор­ мированного коэффициента корреляции к единице?

5.Поясните два основных этапа решения задачи нахождения ф.п.р.в. вектора х при фиксированном известном значении вектора у = Нх + v при условии, когда совместная ф.п.р.в для

векторов х и v - гауссовская. Запишите выражения для па­ раметров условной плотности для случая, когда векторы х и v независимы между собой.

6 . Поясните смысл задачи регрессии. В чем особенность задачи линейной регрессии?

1.5.Моделирование случайных величин и векторов

ивычисление их выборочных характеристик

Вприкладных задачах, связанных со статистическими метода­ ми обработки информации, весьма важным является, с одной сто­ роны, умение получать (моделировать) реализации с.в., распреде­

ленных по тому или иному закону, а с другой - умение определять свойства с.в. по их реализациям. Этим вопросам и посвящен на­ стоящий раздел. Здесь обсуждается проблема получения реализа­ ций с.в. и векторов с помощью датчиков случайных чисел, изла­ гаются основные положения метода Монте-Карло (метода стати­ стических испытаний), широко используемого как вычислительная процедура в теории оценивания, рассматривается задача определе­ ния с помощью метода Монте-Карло выборочных характеристик при наличии данных в виде независимых реализаций с.в. с одина­ ковой ф.п.р.в, а также правило построения гистограмм. Приводит­ ся описание /«-функций Matlab, обеспечивающих получение реа­ лизаций случайных величин с заданными свойствами и процедуры определения выборочных характеристик и построения гистограмм.

1.5.1.Псевдослучайные последовательности, датчики случайных чисел

Для получения с.в. используются различные алгоритмы, кото­ рые, как правило, имеют рекуррентную форму. Так, например, для формирования равномерно распределенных с.в. в соответствии с алгоритмом Д. Лемера, который называется также методом выче­ тов, привлекается следующее соотношение [73]:

У/+1 =Я(ЯУ/).*‘ = 0-1-2...,Уо =И В,

где g - большое число; D - функция выделения дробной части, а значения В и / представляют собой взаимно простые целые числа.

Понятно, что, фиксируя начальные условия, каждый раз будет формироваться одна и та же последовательность. Это и объясняет термин, используемый для таких последовательностей, псевдо­ случайная последовательность. Компьютерные программы, обеспечивающие формирование псевдослучайных последователь­ ностей, обычно называют датчиками случайных чисел. Эти дат­ чики вырабатывают реализации независимых между собой одина­ ково распределенных с.в. с заданными ф.п.р.в.

95

Для получения с.в. с той или иной ф.п.р.в. обычно получают сначала с.в. с достаточно простой ф.п.р.в., например равномерной, а затем подвергают ее такому преобразованию, которое обеспечи­ вает получение заданной ф.п.р.в. В частности, в подразделе 1.3.1 было показано, как с.в. с экспоненциальным законом распределе­ ния может быть получена из равномерной распределенной с.в. Обычно моделировать приходится гауссовские с.в. Как правило, датчик генерирует стандартизованные гауссовские с.в., т.е. цен­ трированные с.в. с единичной дисперсией. Для получения с.в. с заданной дисперсией выходное значение датчика умножают на величину СКО.

1.5.2. Метод Монте-Карло

При решении прикладных задач оценивания нередко приходит­ ся вычислять многократные интегралы, представляющие собой математическое ожидание некоторых функций g(x) [73]. Для этих целей широкое применение получила вычислительная процедура, основанная на методе М онте-Карло, который нередко называется также методом статистических испытаний. Рассмотрим основ­ ные положения этого метода. Итак, предположим, что требуется найти интеграл

J = j S(x)f(x)dx = M x{g(x)},

(1.5.1)

где / х (д) - плотность распределения вектора х . В соответствии с

этим методом вычисленное значение интеграла записывается в виде

Ê = у Х ^ ( А'0 ))

0-5.2)

где х (у)- реализации случайных векторов,

 

распределенных в со­

ответствии с плотностью / х (х) и полученных с помощью датчика случайных чисел. Существенно, что x(j^ моделируются как неза­ висимые случайные векторы. Поскольку х ^ случаен, то случайна и оценка g , причем M x{g \ = g Точность вычислений в методе Монте-Карло характеризуется дисперсией оценки, определяемой как

Dt = K ( g - i ) - м ,

L J=' J \L J=i J

= M X\

Z \g(*U)) - g

 

 

U =1

 

Поскольку x ^ при разных j независимы, то и одинаково рас­

пределенные центрированные случайные величины

( g ( x ^ ) - g )

также между собой независимы, и таким образом

 

Dt = [ м А Ы

х ) - т = \ ° 1

(1-5.3)

где Gg =Mx{[g(x)-g] } -

дисперсия случайной величины g(x).

Из этого соотношения следует, что метод Монте-Карло при увели­ чении L может обеспечить любую задаваемую точность.

Как правило, значение

ст^. заранее неизвестно, и для определе­

ния величины Dg целесообразно использовать

следующее при­

ближенное соотношение:

 

 

 

 

1

 

 

S ‘

(1.5.4)

 

L,т- y = I

' 7

bP

^ j = l

 

которое легко получается при замене

Мх {[g(.v) - g ] 2 в (1.5.3) на

его значение, вычисленное согласно методу Монте-Карло.

Из представленных соотношений следует, что точность метода Монте-Карло может быть определена в ходе вычислений, что яв­ ляется одним из очень важных достоинств метода Монте-Карло. Количество реализаций L, обеспечивающее необходимую точ­ ность, в значительной степени зависит от изменчивости функции g-(x) в области, где / х(х) существенно отлична от нуля.

1.5.3. Выборочные статистические характеристики

При проверке свойств с.в. по их реализациям наиболее часто вычисляют так называемые выборочные математическое ожи­ дание и дисперсию. Очевидно, что для их вычисления удобно ис-

97

пользовать метод Монте-Карло. Так, для вычисления выборочного математического ожидания с.в. х может быть использовано выра­ жение

 

х = j

^ x u) & х ,

(1.5.5)

 

L

j =1

 

где

- независимые между собой реализации с.в. с одинаковой

ф.п.р.в.

/ Х(х). Это выражение есть частный случай (1.5.1), когда

g ( x ) = X .

Пусть задана дисперсия а х с.в. х , тогда погрешность прибли­ жения (1.5.5) может быть оценена с помощью дисперсии ошибки

£ = х —х , для которой с учетом (1.5.3) имеем

D. = — а]

(1.5.6)

•V L А

Аналогичная (1.5.5) формула для оценки дисперсии случайной величины с известным математическим ожиданием х будет иметь вид

 

L J=I

(1-5.7)

 

 

Убеждаемся, что и в этом случае

 

M xâ; = -J-М х£ [x(j) - x f = а \ ,

(1.5.8)

L

М

 

т.е. математическое ожидание для оценки дисперсии совпадает с ее действительным значением. Если математическое ожидание неизвестно, то для обеспечения условия (1.5.8) необходимо ис­ пользовать следующее соотношение:

^ 1

(1.5.9)

Действительно, подставляя (1.5.5) в силу независимости реали­ заций x J , j = \ . L , запишем следующую цепочку равенств:

М-с\ = —-—Мх\ у

1 L

^

| = —!—А/ у х и) - X + . г - - £

х и)

i-1

М

L »

J

L - \

1 у-1

т ~ м хi L

(fl - j )2- h x w - ï ) i ( . t u>

LZj=i

- i ) 2U

L ~ l M

1

y=l

J

1

£ f 2 2 2 , 1

7] , 1

£

< ■

 

 

 

1 - 7

Выборочные характеристики для случайных векторов вычис­

ляются по формулам, аналогичным (1

.5 .5 ), ( 1 .5 .9 ), т.е.

 

1 L

JJ)

 

1

(л'(у1 - л*\ x ( j 1 -

л- )т (1.5.10)

 

 

 

^

ь j = 1

 

^

- П/= 1

 

 

Величину

ô v =

|—-— V

(х(7) - х \ и матрицу

Рх называют

 

 

\ L ~ l M

 

 

 

выборочным СКО и выборочной матрицей ковариаций.

1.5.4. Гистограмма

Располагая набором независимых между собой реализаций, можно не только вычислить выборочные харак­ теристики, но и оценить саму ф.п.р.в., которая в наиболее полном объеме характеризует свойства с.в. В качестве такой оценки вы­ ступает так называемая гистограмма. Поясним ее смысл.

Пусть последовательность псевдослучайных величин располо­

жена в порядке возрастания ..... х(Л/^ Тогда х (|* и определят минимальное и максимальное значения. Разобьем ин­

хш ) _ хт

тервал д,-бЮ _ д*С) на г подынтервалов длиной Д =

Определим выборочную вероятность попадания в / -й интервал

(/ = 1 .г ) как отношение числа попавших в него величин М) к их

общему числу, . Если построить функцию таким образом,

М

что в пределах от А 1! + (/ - 1)Д, х ^ + /Д она принимает постоян-

ное значение, равное

(так, чтобы площадь прямоугольника

п

М: ч

MA

 

равнялась

- — - ), то в результате и получаем гистограмму. Эта

М

функция при увеличении числа интервалов может стремиться к некоторой функции / х(х ), удовлетворяющей свойствам ф.п.р.в.

Рг[х (1) + (/' - 1)Д < х < х ^ + г'Д

л-(1) + (/-1 )Д Д. (1.5.11)

г Д ] ~ / х

 

Таким образом, если формируемой псевдослучайной величине соответствует гистограмма

М ;

- = Рг *<» + (г -1 )Д < х < 1 ® +/Д

(1.5.12)

М

то моделируется и с.в. с ф.п.р.в. / х(а) .

Для проверки гипотез о законе распределения с.в. применяют теорему К. Пирсона, которая в сущности устанавливает статисти­ ческие свойства для гистограммы [73, с.31]. На основе теоремы

Пирсона вводится так называемый критерий согласия х" »который используется при проверке гипотезы о законе распределения той или иной с.в.

Для построения гистограмм в Matlab предусмотрена /н-функция hist(y, /г), позволяющая строить ее для заданного числа интервалов.

В табл. 1.5.1 приведены гистограммы, построенные с использо­ ванием 20000 реализаций случайных величин А,<р, распределен­

ных по закону Рэлея и равномерно в пределах от [-л, я] и промо­

делированных с помощью процедуры random. Здесь же приведены гистограммы для случайных величин, полученных путем преобра­ зования исходных величин с помощью соотношений sin ср и

A sincp.

Из рисунка, представленного в табл. 1.5.1, видно, что гисто­ грамма для реализаций с.в. A sincp соответствует гауссовскому закону распределения, что вполне согласуется с результатами раз­ дела 1.3.1.

Весьма полезной в Matlab является m-функция randtool, анало­ гичная disttool. С помощью этой функции удобно строить различ­ ные гистограммы. Функция randtool вызывает специальное окно со

Соседние файлы в папке книги