книги / Основы теории оценивания с приложениями к задачам обработки навигационной информации. Ч. 1 Введение в теорию оценивания
.pdfJ x T/(.Y / v)ctc = X T(JO J / (* / jOfifr.
Принимая во внимание условие нормировки, получаем, что оценка, минимизирующая (1.4.33), определяется в виде (1.4.34). Таким образом, решением задачи регрессии является условное ма тематическое ожидание.
При решении задачи регрессии нередко ограничивают класс функций, для которых осуществляется минимизация функционала (1.4.33). Наиболее распространенной является линейная регрес сия, т.е. такая, у которой при минимизации функционала исполь зуется линейная относительно вектора у функция
x(y) = d + Ky
Можно показать (см. раздел 2.4), что при известных значениях математических ожиданий х , у , матрицы ковариаций Ру и мат
рицы взаимной корреляции Рху при невырожденной Ру решение этой задачи задается соотношениями:
К = Р ХУ' (Р УУ 1;
d = х + Р лу (Р у )-1 у = х + Ку
Отсюда следует, что для решения задачи линейной регрессии достаточно знать только х , у , Ру и Рлу
Любопытно также отметить, что при гауссовском характере случайных векторов решение задачи линейной регрессии является и решением задачи нелинейной регрессии, т.е. без введения ог раничений на класс функций, минимизирующих критерий (1.4.33).
Ясно, что по аналогии с тем, как были сформулированы задачи регрессии х по у , могут быть сформулированы и задачи регрес сии у по х.
Задачи к разделу
З а д а ч а 1.4.1. Задан вектор у = Ях + v ,в котором совмест ная плотность / Х)У(х, у) определена в виде (1.4.20). Найдите ус ловную плотность распределения вероятности f ( y / х ) .
Р е ш е н ы е. Для получения решения удобно, используя свой ство симметричности для ф.п.р.в., совместную плотность (1.4.20) представить как:
Г М |
. Нх + v |
1 х , у ( х ’У ) =/у,хО;>*) =N |
X |
|
3 |
I W |
|
НРУу£± HA+FLÆ A FL iF LtKF l
PXH T + B |
j P x |
Поскольку искомая условная плотность гауссовская, т.е.
/ (У / х ) = М(у\ у(х) , Р У/ v ),
то, применяя правила вычисления параметров условной гауссов ской плотности, можем записать:
у(х) = Нх + V + (Вт+ НРх)(Рху 1(х - х) ;
Ру,х = НРХН 1 +НВ + BrH r + Pv - (Вт+ НРХ)(РХ)~ХРХН Г + В) .
Раскрывая скобки в этих выражениях, получаем:
у(х) = Fix+ v + В Т(РХУ' + Н ) ( х - х) ;
Ру,х =PV- В Т(РХУ 1В
В частном случае, когда векторы х и v независимы и v = 0 ,
у(х) = Н х , |
Px / x = p v |
|
|
т.е. / (у ! х) = vv(x; Нх, Pv). |
|
|
|
Отсюда следует, что при |
независимых |
х и |
v |
f ( y / x ) = f v(y - H x) . |
|
|
|
З а д а ч а 1.4.2. Пусть вектор у связан с х и v соотношени
ем у = s(x) + v , причем совместная плотность / х v(х, v) - гауссов
ская с параметрами, заданными в виде (1.3.25), (1.3.26).
Найдите условную плотность распределения вероятностей /С у /*)•
Р е ш е и и е. Располагая / (х, v ), нетрудно найти / ( v / x ) = W(v; « ( * ) ,/• " " ) ,
где
v(x) = v + BT(Pxy '( x - x ) - ,
Pv,x =PV- B T(PX)~]B
Используя теперь правило нахождения ф.п.р.в. (1.3.6), которое справедливо и для условных ф.п.р.в. для преобразованных случай ных векторов, можем записать
f ( y / х) = f v/x (у - six)) = Щу - s(x);v + 5 Т (5 х) _1 (x - x)),Pv/x) .
Вчастности, при 5 = 0, т.е. при независимых х и v
Лу / х) = U (у - six)) = N(y - six); v,Pv).
З а д а ч а 1.4.3. В условиях задачи 1.4.2 при независимых х и
vзапишите выражение для совместной ф.п.р.в. fix, у) и услов
ной ф.п.р.в. f i x /у).
Р е ш е н и е . Учитывая, что условная плотность ф.п.р.в.
f i y l х) =f viysix)) =Niy - six);v,Pv), используя (1.4.1), полу
чаем / х у(х, у) = / х ix)fiy / .v) = Nix; х, Рх)Щу - six); v,P v).
Заметим, что выражение для jiylx) полностью совпадает с соот ветствующим выражением из задачи 1.4.1 при 5 = 0.
Для f i x ! у) запишем
Л О О Л Д * ) |
Nix;x,Px)Niy-sjx);v,Pv) |
Д * /у ) = у f xix)fiy/x)dx |
J Nix; x, Px)Niy - six); v, Pv )dx |
З а д а ч а 1.4.4. Задана ф.п.р.в. fix, y! z) Найдите ф.п.р.в. для
f i x / z ) .
Р е ш е н и е . |
/(x /z ) = J |
fix,y/z)dy. |
З а д а ч а |
1.4.5. Заданы две ф.п.р.в. fix/y,z) и f i y / z ) . Най |
|
дите ф.п.р.в. для f i x / z ) . |
|
|
Р е ш е н и е . |
/(x /z ) = J |
/ ( х / y,z)fiy / z)dy . |
1.Поясните, что такое условная (апостериорная) ф.п.р.в. Что необходимо знать о двух случайных векторах, для того чтобы найти условную ф.п.р.в. одного вектора относительно друго го? Как это сделать?
2.При каких условиях априорная и апостериорная ф.п.р.в сов падают между собой?
3.Когда для определения апостериорной ф.п.р.в. достаточно знать условное математическое ожидание и условную матри цу ковариаций?
4.Запишите выражение для ф.п.р.в. с.в. при фиксированном значении другой с.в., совместная ф.п.р.в. которых гауссовская с известными параметрами. Поясните, как получено это вы ражение. К чему стремится эта функция при стремлении нор мированного коэффициента корреляции к единице?
5.Поясните два основных этапа решения задачи нахождения ф.п.р.в. вектора х при фиксированном известном значении вектора у = Нх + v при условии, когда совместная ф.п.р.в для
векторов х и v - гауссовская. Запишите выражения для па раметров условной плотности для случая, когда векторы х и v независимы между собой.
6 . Поясните смысл задачи регрессии. В чем особенность задачи линейной регрессии?
1.5.Моделирование случайных величин и векторов
ивычисление их выборочных характеристик
Вприкладных задачах, связанных со статистическими метода ми обработки информации, весьма важным является, с одной сто роны, умение получать (моделировать) реализации с.в., распреде
ленных по тому или иному закону, а с другой - умение определять свойства с.в. по их реализациям. Этим вопросам и посвящен на стоящий раздел. Здесь обсуждается проблема получения реализа ций с.в. и векторов с помощью датчиков случайных чисел, изла гаются основные положения метода Монте-Карло (метода стати стических испытаний), широко используемого как вычислительная процедура в теории оценивания, рассматривается задача определе ния с помощью метода Монте-Карло выборочных характеристик при наличии данных в виде независимых реализаций с.в. с одина ковой ф.п.р.в, а также правило построения гистограмм. Приводит ся описание /«-функций Matlab, обеспечивающих получение реа лизаций случайных величин с заданными свойствами и процедуры определения выборочных характеристик и построения гистограмм.
1.5.1.Псевдослучайные последовательности, датчики случайных чисел
Для получения с.в. используются различные алгоритмы, кото рые, как правило, имеют рекуррентную форму. Так, например, для формирования равномерно распределенных с.в. в соответствии с алгоритмом Д. Лемера, который называется также методом выче тов, привлекается следующее соотношение [73]:
У/+1 =Я(ЯУ/).*‘ = 0-1-2...,Уо =И В,
где g - большое число; D - функция выделения дробной части, а значения В и / представляют собой взаимно простые целые числа.
Понятно, что, фиксируя начальные условия, каждый раз будет формироваться одна и та же последовательность. Это и объясняет термин, используемый для таких последовательностей, псевдо случайная последовательность. Компьютерные программы, обеспечивающие формирование псевдослучайных последователь ностей, обычно называют датчиками случайных чисел. Эти дат чики вырабатывают реализации независимых между собой одина ково распределенных с.в. с заданными ф.п.р.в.
95
Для получения с.в. с той или иной ф.п.р.в. обычно получают сначала с.в. с достаточно простой ф.п.р.в., например равномерной, а затем подвергают ее такому преобразованию, которое обеспечи вает получение заданной ф.п.р.в. В частности, в подразделе 1.3.1 было показано, как с.в. с экспоненциальным законом распределе ния может быть получена из равномерной распределенной с.в. Обычно моделировать приходится гауссовские с.в. Как правило, датчик генерирует стандартизованные гауссовские с.в., т.е. цен трированные с.в. с единичной дисперсией. Для получения с.в. с заданной дисперсией выходное значение датчика умножают на величину СКО.
1.5.2. Метод Монте-Карло
При решении прикладных задач оценивания нередко приходит ся вычислять многократные интегралы, представляющие собой математическое ожидание некоторых функций g(x) [73]. Для этих целей широкое применение получила вычислительная процедура, основанная на методе М онте-Карло, который нередко называется также методом статистических испытаний. Рассмотрим основ ные положения этого метода. Итак, предположим, что требуется найти интеграл
J = j S(x)f(x)dx = M x{g(x)}, |
(1.5.1) |
где / х (д) - плотность распределения вектора х . В соответствии с
этим методом вычисленное значение интеграла записывается в виде
Ê = у Х ^ ( А'0 )) |
’ |
0-5.2) |
где х (у)- реализации случайных векторов, |
|
распределенных в со |
ответствии с плотностью / х (х) и полученных с помощью датчика случайных чисел. Существенно, что x(j^ моделируются как неза висимые случайные векторы. Поскольку х ^ случаен, то случайна и оценка g , причем M x{g \ = g Точность вычислений в методе Монте-Карло характеризуется дисперсией оценки, определяемой как
Dt = K ( g - i ) - м ,
L J=' J \L J=i J
= M X\ |
Z \g(*U)) - g |
|
|
U =1 |
|
Поскольку x ^ при разных j независимы, то и одинаково рас |
||
пределенные центрированные случайные величины |
( g ( x ^ ) - g ) |
|
также между собой независимы, и таким образом |
|
|
Dt = [ м А Ы |
х ) - т = \ ° 1 |
(1-5.3) |
где Gg =Mx{[g(x)-g] } - |
дисперсия случайной величины g(x). |
Из этого соотношения следует, что метод Монте-Карло при увели чении L может обеспечить любую задаваемую точность.
Как правило, значение |
ст^. заранее неизвестно, и для определе |
|||
ния величины Dg целесообразно использовать |
следующее при |
|||
ближенное соотношение: |
|
|
|
|
1 |
|
|
S ‘ |
(1.5.4) |
|
L,т- y = I |
' 7 |
bP |
|
^ j = l |
|
|||
которое легко получается при замене |
Мх {[g(.v) - g ] 2 в (1.5.3) на |
его значение, вычисленное согласно методу Монте-Карло.
Из представленных соотношений следует, что точность метода Монте-Карло может быть определена в ходе вычислений, что яв ляется одним из очень важных достоинств метода Монте-Карло. Количество реализаций L, обеспечивающее необходимую точ ность, в значительной степени зависит от изменчивости функции g-(x) в области, где / х(х) существенно отлична от нуля.
1.5.3. Выборочные статистические характеристики
При проверке свойств с.в. по их реализациям наиболее часто вычисляют так называемые выборочные математическое ожи дание и дисперсию. Очевидно, что для их вычисления удобно ис-
97
пользовать метод Монте-Карло. Так, для вычисления выборочного математического ожидания с.в. х может быть использовано выра жение
|
х = j |
^ x u) & х , |
(1.5.5) |
|
L |
j =1 |
|
где |
- независимые между собой реализации с.в. с одинаковой |
||
ф.п.р.в. |
/ Х(х). Это выражение есть частный случай (1.5.1), когда |
g ( x ) = X .
"Г
Пусть задана дисперсия а х с.в. х , тогда погрешность прибли жения (1.5.5) может быть оценена с помощью дисперсии ошибки
£ = х —х , для которой с учетом (1.5.3) имеем
D. = — а] |
(1.5.6) |
•V L А
Аналогичная (1.5.5) формула для оценки дисперсии случайной величины с известным математическим ожиданием х будет иметь вид
|
L J=I |
(1-5.7) |
|
|
|
Убеждаемся, что и в этом случае |
|
|
M xâ; = -J-М х£ [x(j) - x f = а \ , |
(1.5.8) |
|
L |
М |
|
т.е. математическое ожидание для оценки дисперсии совпадает с ее действительным значением. Если математическое ожидание неизвестно, то для обеспечения условия (1.5.8) необходимо ис пользовать следующее соотношение:
^ 1
(1.5.9)
Действительно, подставляя (1.5.5) в силу независимости реали заций x J , j = \ . L , запишем следующую цепочку равенств:
М-с\ = —-—Мх\ у |
1 L |
^ |
| = —!—А/ у х и) - X + . г - - £ |
х и) |
i-1 |
М |
L » |
J |
L - \ |
1 у-1 |
т ~ м хi L |
(fl - j )2- h x w - ï ) i ( . t u> |
LZj=i |
- i ) 2U |
|
L ~ l M |
1 |
y=l |
J |
|
1 |
£ f 2 2 2 , 1 |
7] , 1 |
£ |
< ■ |
|
|
|
1 - 7 |
Выборочные характеристики для случайных векторов вычис
ляются по формулам, аналогичным (1 |
.5 .5 ), ( 1 .5 .9 ), т.е. |
|
|||
1 L |
JJ) |
|
1 |
(л'(у1 - л*\ x ( j 1 - |
л- )т (1.5.10) |
|
|
|
^ |
||
ь j = 1 |
|
^ |
- П/= 1 |
|
|
Величину |
ô v = |
|—-— V |
(х(7) - х \ и матрицу |
Рх называют |
|
|
|
\ L ~ l M |
|
|
|
выборочным СКО и выборочной матрицей ковариаций.
1.5.4. Гистограмма
Располагая набором независимых между собой реализаций, можно не только вычислить выборочные харак теристики, но и оценить саму ф.п.р.в., которая в наиболее полном объеме характеризует свойства с.в. В качестве такой оценки вы ступает так называемая гистограмма. Поясним ее смысл.
Пусть последовательность псевдослучайных величин располо
жена в порядке возрастания ..... х(Л/^ Тогда х (|* и определят минимальное и максимальное значения. Разобьем ин
хш ) _ хт
тервал д,-бЮ _ д*С) на г подынтервалов длиной Д =
Определим выборочную вероятность попадания в / -й интервал
(/ = 1 .г ) как отношение числа попавших в него величин М) к их
общему числу, . Если построить функцию таким образом,
М
что в пределах от А 1! + (/ - 1)Д, х ^ + /Д она принимает постоян-
ное значение, равное |
(так, чтобы площадь прямоугольника |
|
п |
М: ч |
MA |
|
||
равнялась |
- — - ), то в результате и получаем гистограмму. Эта |
М
функция при увеличении числа интервалов может стремиться к некоторой функции / х(х ), удовлетворяющей свойствам ф.п.р.в.
Рг[х (1) + (/' - 1)Д < х < х ^ + г'Д |
л-(1) + (/-1 )Д Д. (1.5.11) |
г Д ] ~ / х |
|
Таким образом, если формируемой псевдослучайной величине соответствует гистограмма
М ;
- = Рг *<» + (г -1 )Д < х < 1 ® +/Д |
(1.5.12) |
М
то моделируется и с.в. с ф.п.р.в. / х(а) .
Для проверки гипотез о законе распределения с.в. применяют теорему К. Пирсона, которая в сущности устанавливает статисти ческие свойства для гистограммы [73, с.31]. На основе теоремы
Пирсона вводится так называемый критерий согласия х" »который используется при проверке гипотезы о законе распределения той или иной с.в.
Для построения гистограмм в Matlab предусмотрена /н-функция hist(y, /г), позволяющая строить ее для заданного числа интервалов.
В табл. 1.5.1 приведены гистограммы, построенные с использо ванием 20000 реализаций случайных величин А,<р, распределен
ных по закону Рэлея и равномерно в пределах от [-л, я] и промо
делированных с помощью процедуры random. Здесь же приведены гистограммы для случайных величин, полученных путем преобра зования исходных величин с помощью соотношений sin ср и
A sincp.
Из рисунка, представленного в табл. 1.5.1, видно, что гисто грамма для реализаций с.в. A sincp соответствует гауссовскому закону распределения, что вполне согласуется с результатами раз дела 1.3.1.
Весьма полезной в Matlab является m-функция randtool, анало гичная disttool. С помощью этой функции удобно строить различ ные гистограммы. Функция randtool вызывает специальное окно со