Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Непараметрическая статистика

..pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
13.36 Mб
Скачать

Соотношение (7.6.3) подсказывает, что, взяв достаточно ма­ лый интервал h при достаточно большом N, можно надеять­ ся на получение достаточно хорошей оценки плотности

PN (x ) =

FN(x+h) —FN(x—h) _

(7.6.4)

 

2h

если же N-^~oo, то h можно устремить к нулю с некоторой скоростью, h(N)-*-0 (так, чтобы число выборочных зна­ чений в (х—/г, х-\-К) неограниченно возрастало), тем самым сколь угодно приближаясь к (7.6.3).

Необходимо конкретизировать зависимость h(N), обеспе­ чивающую ожидаемую сходимость. Для удобства анализа придадим (7.6.4) несколько иную форму. Воспользовавшись

явной записью FN(x)

(7.2.1), имеем

 

Лу(•* )= —

I"U

с ( x + h - x j

с (■*-* - *i)

2Nh

L/=-i

 

 

i=i

 

1 f лг-ЬА

 

 

Jf—А

 

 

 

 

 

 

 

 

k k

d F M ’

 

 

7

 

 

 

(7.6.5)

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

Я(УН

у .

|y |< V

(7.6.6)

 

 

О, Ы>1.

 

 

 

 

 

 

Так мы приходим к оценке вида

 

 

 

pN(x)-.

1

N

(x —x t

(7.6.7)

 

У. К

l ~ T ~

 

 

 

N h t x

 

Теперь обобщение напрашивается само собой: можно рас­ сматривать не только К (у) вида (7.6.6), но и любую функцию К(у) из некоторого класса функций. Если (7.6.6) обеспечи­ вает вычисление относительной частоты попадания X в за­ данный интервал, то другие функции К (у) дадут как бы «взвешенную относительную частоту», что и оправдывает введение названий «весовая функция» для К(у) и «оценка разложением по весовым функциям» для ДдД*) (7.6.7).

Некоторые ограничения на функции К (у) можно нало­ жить сразу, по очевидному соображению, что К{у) должна обладать всеми свойствами плотности вероятностей:

К ( У ) > О,

(7.6.8)

 

155

K ( y ) d y = l .

 

(7 6 9)

Другие ограничения на К (у) будут

вытекать

из требований

определенной сходимости р^(х) к р{х). (При

этом нам при­

дется наложить также некоторые ограничения и на класс оцениваемых функций р(х)).

Потребуем сначала, чтобы оценка была асимптотически

несмещенной:

lim EpN(x)=p(x).

(7.6.10)

 

 

N-*-со

 

 

 

Так как мы считаем, что все Xt одинаково распределены,

 

1

Л I

 

 

EpN(x)

F I,IИИпт)]}£

 

 

 

 

 

 

 

■Е

1

К ( х ~~Х '

 

 

 

т

к

[ ~ г

 

00

1

 

K i ^ ' \ p { t ) d l .

(7.6.11)

- ЛI

 

h(N)

 

\h(N)

 

Условия, при которых (7.6.11) подчиняется требованию

(7.6.10) , даются следующей теоремой:

Если К(у)

Т е о р е м а 7.6.1

(Бохнер

[1], Парзен [1]).

удовлетворяет условиям

(7.6.8) и (7.6.9), а также

 

 

 

sup

К(у)<.со,

(7.6.12)

 

—оо <у <00

 

 

 

НшуК(у)=0;

(7.6.13)

 

1у Н ° °

 

 

 

если h (N) — последовательность положительных величин та­

кая, что

 

lim h ( N ) = 0,

(7.6.14)

N-+«>

 

то в любой точке непрерывности функции р(х)

имеет место

(7.6.10) .

Д о к а з а т е л ь с т в о . Введем обозначение EpN{x) —gN{x).

Разность gN(x) —р(х) может

быть представлена

в виде:

gN(x )~P(x ) = J [/** —0

- / 4 * ) ] ^ *

(7.6.15)

Пусть б > 0 ;

разобьем область интегрирования на две облас­

ти, | / | ^ б и

|^|>б. Тогда имеем:

 

li>G

Так как

—/>(■*) < max р(д:—t)—р{х)\-\----- sup

+

 

11 Л(А)

 

~ \~ Р ( Х ) |

K ( z ) d z -

 

Правая часть последнего неравенства стремится к нулю при N-*oo и б-»»0, что и доказывает теорему об а с и м п т о т и ч е ­ ской н е с м е щ е н н о с т и оценки рх (х) во всех точках не­ прерывности функции р{х).

Если р(х) имеет производные в точке х, то суждения о характере смещения оценки pN{x) при конечных N можно продвинуть дальше. Соотношение (7.6.15) может быть прос­ той заменой переменных приведено к виду

gN(x)—p (x )= J \p(x—h{N) у)— /<■*)] K(y) dy,

что при достаточно малых h может быть представлено ря­ дом:

gN(x)~P(x)=hP'(x)■ 5уКЬ) dy+

+ ± . h 2 P"(X) j y2 я(у) dy-\-0(h*).

(7.6.16)

Из (7.6.16) следуют дополнительные желательные свойства функций К (у)' плотность К (у) должна иметь все моменты; желательно также, чтобы$К(у)-ydy=0, т. е. чтобы К(у) бы­ ло симметричной относительно нуля функцией.

Рассмотрим теперь поведение дисперсии оценки рх (х)

= — г" к 2( —

) р ( У ) * У ~ т г и Г K 4t ) p ( x - h t ) d t .

Nh2_» \

}

NhJ*

157

Следовательно, при достаточно малых h,

V

a

r

i

f

K4t)dt-

l7-6-1?)

 

 

 

Nh(N)

Joo

 

Появляется еще одно желательное свойство К(у)

f K 4 y ) d y< oo :

Кроме того, требование стремления дисперсии оценки к нулю при N—уоо приводит к новому ограничению на последователь­ ность h(N), кроме (7.6.14) должно иметь место:

UmNh(N) = oo.

(7.6.18)

_х .\

при N-*-oo устремляется

~h(N)j

 

к 6-функции, но не слишком быстро, так, чтобы число выбо­

рочных

значений, «взвешиваемых»

каждой функцией

К

x —xt

неограниченно возрастало. При

этом рм(х) в каж­

h

 

 

 

дой точке х оказывается суммой неограниченно возрастаю­

щего

числа

случайных

величин

Vl [ l l h( N) ]X

ХК[ { х Xi )/h(N)], и, следовательно (см.

гл VI), при оп­

ределенных условиях последовательность pN(x) может подчи­ няться центральной предельной теореме, т. е. оценка р#{х) может быть асимптотически нормальной:

pN( x ) - E p N(x)

<

е Tdy=Q>(c) (7.6.19)

ИгаР

- 5 = J

N-+oo

у <6^ - о

 

для любого вещественного с. Парзен [1] показал, что доста­ точным для этого условием является существование при неко­ тором 6 > 0 предела

E\VN~ E V n\*+*

п

(7.6.20)

—- -------—--------

"О при N -yоо

Высокие качества оценок с помощью разложения по ве­ совым функциям привлекли к ним внимание многих авто­ ров. Можно выделить три направления исследований: 1) ос­ лабление ограничений на условия сходимости р (х) к р(х); 2) оптимизация разложения (7.6.7); 3) вопросы применения данного класса оценок в различных статистических про­ цедурах.

Э. Надарая [1] показал, что для того, чтобы с вероятно­ стью единица при N- уоо имело место

158

sup \pN{ x ) - p { x ) 1 -0 ,

 

—во <ЛГ<оо

 

 

 

необходимо

и достаточно,

чтобы

К(х) была функцией с

ог­

раниченным

изменением,

р ( х) — равномерно непрерывной

функцией и ряд 2 ех р [—■ykh2(k)]

сходился при любом у

(по­

следнее имеет место при h ( N ) =

0О < 0 < ; ^). К. Чанда

[1]

установил, что если потребовать только асимптотической не­ смещенности pN(x) и не налагать на К(х) условия обяза­ тельной неотрицательности, то среднеквадратическая ошибка

оценки может

быть уменьшена по сравнению с

(7.6.17).

В. Мэрфи [1]

показал, что сходимость pN(x) к р(х)

во всех

точках непрерывности последней сохраняется и в том слу­ чае, когда F (х) имеет счетное число разрывов.

Оптимизация разложения (7.6.7) ведется за счет выбора наилучшей формы функции К{х) и конкретизации зависи­ мости h(N). Конечно, все определяется выбором критерия и условий оптимизации. Например, если минимизировать сред­

неквадратичную разность

между Рн(х)

и р{х),

усредняя ее

по р(х), то оптимальное

К(х)

будет

разным

для

разных

р(х) (см. Уотсон и Лидбеттер

[1]). Другой подход,

являю­

щийся непараметрическим, состоит в том, чтобы минимизи­ ровать дисперсию оценки (7.6.17) за счет минимизации ин­ теграла J K2(t)dt при некоторых дополнительных ограниче­ ниях на K(t). При ограниченности интервала 2h, в котором K(i):ФО, и задании моментов для K(t) оптимальная фор-

ма K(t), очевидно,

 

 

(см. К. Чан-

имеет вид Ka(t) =hXN (s) -Р

да [1]); при задании только

■s=О

К(у) получаем

дисперсии для

(см. Епонечников

[1]) Ko(t)

Щ / ^

'

прИ ^

и K0(t) —0 при |/|> У 5 . Оптимальный же коэффициент h(N)

получается в виде C- N~~.

Вопросы использования оценок типа (7.6.7) в конкрет­ ных статистических процедурах будут рассмотрены в некото­ рых из последующих глав; здесь же отметим только, что, как показали Надарая [1] и Бхаттачарья [1], производные

ряда (7.6.7) с вероятностью единица сходятся к

производ­

ным неизвестного распределения р (х):

 

sup \p{rN](x)—р{г\х)\-^0 при JV—>-оо.

(7.6.21)

—«5 <Jf<eO

 

В заключение необходимо отметить весьма важное обоб­ щение теории оценок плотности разложениями по весовым

159

функциям, сделанное М. Розенблатом [2]. Оказывается, что даже если выборочные значения Х\...... xN не являются неза­

висимыми, то при определенных ограничениях на характер зависимости асимптотическое поведение опенки pN(x) (7.6.7)

остается тем же, что и при независимых наблюдениях. Тре­ бования к типу зависимости носят несколько специфический характер, но, по существу, сводятся к достаточно быстрому ослаблению зависимости при увеличении |t—k\, где i и k ~ номера выборочных значений; таким требованиям удовлет­ воряет, например, гауссов стационарный марковский про­ цесс и некоторые другие типы марковских процессов.

§7.7. ОЦЕНИВАНИЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ

ИПЛОТНОСТИ ВЕРОЯТНОСТЕЙ РЯДАМИ ФУРЬЕ

Один из напрашивающихся подходов к оценке неизвест­ ного распределения состоит в том, чтобы представить его в виде ряда по системе ортогональных функций; при этом оце­ нивание F(x) или р(х) сводится к оцениванию по выборке хь . , xN коэффициентов соответствующего ряда. В зависи­ мости от того, какая априорная информация используется для построения оценки коэффициентов, данный подход мо­ жет носить как параметрический, так и непараметрический характер; нас, естественно, будет интересовать последний случай.

Непараметрическое оценивание функции распределения или плотности состоит в том, чтобы использовать для оценки коэффициентов некоторый непараметрический факт. В дан­ ном параграфе мы еще раз убедимся, что различное упот­ ребление одного и того же факта может дать оценки, обла­ дающие различными свойствами. Мы рассмотрим вариант оценки коэффициентов ряда Фурье, опирающийся на исполь­

зование

эмпирической

функции

распределения

(Кронмал ч

Тартер

[1]).

 

 

 

Пусть {фА(х )} — семейство функций, взаимно ортогональ­

ных с весом w(x),

 

 

 

 

\ b k{x)'\{x)w(x)dx=bkl,

(7.7 1)

где 6W

— символ Кронекера

функции распределения F (х)

Определим оценку

FNm (х)

как конечный ряд

m

 

 

 

 

 

(7.7.2)

 

 

 

 

k=0

в качестве коэффициентов {Ак} этого ряда будем использо­ вать коэффициенты Фурье эмпирической функции распреде­ ления J N(x) (7.2.1):

160

Л*= I />(-*) '!»*(■*) «'(•*) d x -

 

1

N

[C (x—xl)^k{x)w{x)dx.

 

(7.7.3)

 

=

V

 

 

N

 

 

 

 

 

 

Обсудим

свойства

введенной

таким

образом

оценки

FNm (х). Поскольку

эмпирическая

функция

распределения

является кусочно-гладкой, то почти

везде

(за

исключением

точек разрыва)

Нш FNm{x)=FN(x),

 

 

(7.7.4)

 

 

 

 

 

 

т -+°о

 

 

 

 

если { ^ (я )}

является

полной ортонормированной

системой

функций (см. Г. П. Толстов [1]).

Далее,

если .неизвестная

функция F(x)

является непрерывной, то

 

 

 

 

Е (Нш FUm(x))=E(FN{x))=F(x).

 

(7.7.5)

Кроме того,

 

 

 

 

 

 

 

 

 

 

£(Л*)=Л*.

 

 

 

(7-7.6)

где Ак — коэффициенты Фурье для

F(x). В самом деле,

Е (Ак)

 

Ц J С (X~ x i) Ф*(*) M*)dx

 

=Е{ J С(х—Х{) фА(л:) w(x) dx\ — ( 'h(x ) М.х) dx dF(y)--

— | /^ (у) ^ <ik(x)w(x)dx] + $F(y)tyk(y)w(y)dy.

—00 —x

Последняя строка получена путем интегрирования по частям.

Так как F (—о о ) = 0 и

J

wdx=0,

a

J Fipkw d x = A k ,

то

(7.7,6) доказано.

 

 

 

 

 

 

Определим

взвешенную

среднеквадратическую

ошибку

оценки Кд,от (я)

как

 

 

 

 

 

 

•/ (7?ivm )=£l

И

*

)

~

(7.7.

7)

Применив к (7.7.7) формулу Парсеваля, легко получить, что

•/ (7r/vm)= I ^ ( * ) w (x)dx-

m

{Ак~-Уаг A„).

(7.7.8)

23

 

*=o

 

 

 

Если {фй(*)} — полная система функций, то J F2w dx=

А\,

и мы имеем

 

 

 

о

 

 

 

 

т

 

со

г,

 

A ^ J = 2 Var^ +

 

1J

A t

(7.7.9)

161

Учитывая (7.7.5) и (7.7.9), можно показать, что разница между взвешенными среднеквадрагическими ошибками

FNm (х) и Fw (х) равна

H F Nm ) - n F N) =

2 ( 4 - У а г Л * ) .

(7.7.10)

k = m - r l

 

Интересно, что можно выбрать

число т членов ряда

(7.7.2)

так, что (7.7.10) будет отрицательным, т. е. взвешенная сред­ неквадратическая ошибка FNm будет меньшей, чем у эмпи­ рической функции распределения FN.

Перейдем теперь к вопросам оценивания плотности р(х). С одной стороны, мы можем предложить в качестве оценки р(х) конечный ряд такого же типа, что и ряд для F(x): .

т

 

Рхт(Х)= 2 M ft W .

(7.7.11)

k=0

 

и рассматривать ее как самостоятельную оценку. Свойства этой оценки определяются выбором оценок для {<^}. Напри­ мер, если потребовать, чтобы

Е(йк) = а к,

(7.7.12)

где {ah} — коэффициенты Фурье для истинной

(оценивае­

мой) функции р(х), то оценка (7.7.11) окажется смещенной, так как

Е ( р ( х ) - р Мт(х))= 2

<!>*(*),

(7.7.13)

k=m

 

 

что равно нулю лишь при ak= 0 для всех k > m . Правда, есть основания полагать, что смещенность является свойством, об­ щим для почти всех оценок плотности (см. Розенблатт [1]). Как и для FNm , можно вычислить взвешенную среднеквадра­ тическую ошибку pNm , которая оказывается равной

J(PNm)=E s IP (X ) - P JVJ X )]2 W ( X ) dx =

т

= \ p2(x ) w ( x ) d x — 2

(a*—Var ak) —

 

m

oo

ai

 

= 2 Var(«*) +

2

|-1

<7-7-14)

k=0

k~m

 

 

С другой стороны, можно рассматривать не только само­ стоятельную оценку (7.7.11), но и оценку p*Nm (х), являю­ щуюся производной от FNm (я):

d

т

d

(7-7-15)

/*«(■ *)= - Г

(*) = 2

И -

U X

^ = Q

и х

 

162

Было бы желательно, чтобы (7.7.15) тоже было рядом по ортогональным функциям. Это накладывает определенные ограничения на {ф^}, которые, однако, в ряде случаев можно \довлетворить. Например, этим ограничениям подчиняются такие системы ортогональных функций, как {cos four}, {sin far*}, {cosfotx, sin&nx}.

ж

При практическом построении оценок FNm (х) и pNm (х) возникает ряд дополнительных вопросов. Исследования пока­ зывают, например, что для неограниченного убывания взве­ шенной среднеквадратичной ошибки pNm (х) достаточно, что­ бы число членов в (7.7.11) было порядка УN. Особую про­ блему создает возможность отрицательных значений сумм (7.7.2) и (7.7.11). Можно выбрать специальную систему не­ отрицательных функций {фА}, однако это приводит к серь­ езным практическим усложнениям, а с другой стороны, это оказывается ненужным, так как при объемах выборки уже порядка нескольких десятков появление отрицательных зна­ чений у pNm (х) практически маловероятно (см. Кронмал и Тартер [1]). Далее отметим практическую трудность, типич­ ную для всех аппроксимаций функций конечными рядами:

качество оценок FNm и р

зависит от четырех связанных

в

163

ff Ю,000

между собой факторов: выбора системы функций {-фй(л:)}, выбора числа членов ряда т, характера истинной оценивае­ мой функции F (или р) и относительной величины интервала, в котором осуществляется оценивание. Некоторое представ­ ление о связи этих факторов дают два графика из работы Кронмала и Тартёра [1]: на них приведены области, соот­ ветствующие оптимальному числу т членов ряда для pNm (х) при заданных объеме выборки N и величине интервала а), измеряемого в единицах В = ( х 0,75* 0 ,2 5 ) , где хр

квантиль уровня р. График 7.7.1 относится к оцениванию плотности нормального распределения, график 7.7.2 — рас­ пределения Коши; в обоих случаях разложение производится по синусам и косинусам периода (Ъa) IB.

§7.8. ОБ ОЦЕНИВАНИИ МНОГОМЕРНЫХ ПЛОТНОСТЕЙ

ИФУНКЦИЙ РАСПРЕДЕЛЕНИЯ

Во многих практически важных случаях необходимо про­ изводить оценивание многомерных распределений вероятно­ стей. Учитывая направленность данной книги, мы полностью опустим рассмотрение параметрической постановки этой за­

164