книги / Непараметрическая статистика
..pdfСоотношение (7.6.3) подсказывает, что, взяв достаточно ма лый интервал h при достаточно большом N, можно надеять ся на получение достаточно хорошей оценки плотности
PN (x ) = |
FN(x+h) —FN(x—h) _ |
(7.6.4) |
|
|
2h |
если же N-^~oo, то h можно устремить к нулю с некоторой скоростью, h(N)-*-0 (так, чтобы число выборочных зна чений в (х—/г, х-\-К) неограниченно возрастало), тем самым сколь угодно приближаясь к (7.6.3).
Необходимо конкретизировать зависимость h(N), обеспе чивающую ожидаемую сходимость. Для удобства анализа придадим (7.6.4) несколько иную форму. Воспользовавшись
явной записью FN(x) |
(7.2.1), имеем |
|
||||
Лу(•* )= — |
I"U |
с ( x + h - x j |
с (■*-* - *i) |
|||
2Nh |
L/=-i |
|
|
i=i |
|
|
1 f лг-ЬА |
|
|
Jf—А |
|
|
|
|
|
|
|
|
k k |
d F M ’ |
|
|
7 |
|
|
|
(7.6.5) |
|
|
|
|
|
|
|
где |
|
|
|
|
|
|
|
|
Я(УН |
у . |
|y |< V |
(7.6.6) |
|
|
|
О, Ы>1. |
|
|||
|
|
|
|
|
||
Так мы приходим к оценке вида |
|
|
||||
|
pN(x)-. |
1 |
N |
(x —x t |
(7.6.7) |
|
|
— |
У. К |
l ~ T ~ |
|||
|
|
|
N h t x |
|
Теперь обобщение напрашивается само собой: можно рас сматривать не только К (у) вида (7.6.6), но и любую функцию К(у) из некоторого класса функций. Если (7.6.6) обеспечи вает вычисление относительной частоты попадания X в за данный интервал, то другие функции К (у) дадут как бы «взвешенную относительную частоту», что и оправдывает введение названий «весовая функция» для К(у) и «оценка разложением по весовым функциям» для ДдД*) (7.6.7).
Некоторые ограничения на функции К (у) можно нало жить сразу, по очевидному соображению, что К{у) должна обладать всеми свойствами плотности вероятностей:
К ( У ) > О, |
(7.6.8) |
|
155
K ( y ) d y = l . |
|
(7 6 9) |
Другие ограничения на К (у) будут |
вытекать |
из требований |
определенной сходимости р^(х) к р{х). (При |
этом нам при |
дется наложить также некоторые ограничения и на класс оцениваемых функций р(х)).
Потребуем сначала, чтобы оценка была асимптотически
несмещенной: |
lim EpN(x)=p(x). |
(7.6.10) |
|||
|
|||||
|
N-*-со |
|
|
|
|
Так как мы считаем, что все Xt одинаково распределены, |
|||||
|
1 |
Л I |
|
|
|
EpN(x) |
F I,IИИпт)]}£ |
|
|||
|
|
|
|
|
|
|
■Е |
1 |
К ( х ~~Х ' |
|
|
|
|
т |
к |
[ ~ г |
|
00 |
1 |
|
K i ^ ' \ p { t ) d l . |
(7.6.11) |
|
- ЛI |
|
||||
h(N) |
|
\h(N) |
|
||
Условия, при которых (7.6.11) подчиняется требованию |
|||||
(7.6.10) , даются следующей теоремой: |
Если К(у) |
||||
Т е о р е м а 7.6.1 |
(Бохнер |
[1], Парзен [1]). |
|||
удовлетворяет условиям |
(7.6.8) и (7.6.9), а также |
|
|||
|
|
sup |
К(у)<.со, |
(7.6.12) |
|
|
—оо <у <00 |
|
|
||
|
НшуК(у)=0; |
(7.6.13) |
|||
|
1у Н ° ° |
|
|
|
если h (N) — последовательность положительных величин та
кая, что |
|
lim h ( N ) = 0, |
(7.6.14) |
N-+«> |
|
то в любой точке непрерывности функции р(х) |
имеет место |
(7.6.10) .
Д о к а з а т е л ь с т в о . Введем обозначение EpN{x) —gN{x).
Разность gN(x) —р(х) может |
быть представлена |
в виде: |
|
gN(x )~P(x ) = J [/** —0 |
- / 4 * ) ] ^ * |
(7.6.15) |
|
Пусть б > 0 ; |
разобьем область интегрирования на две облас |
||
ти, | / | ^ б и |
|^|>б. Тогда имеем: |
|
li>G
Так как
—/>(■*) < max р(д:—t)—р{х)\-\----- sup |
+ |
|
|
11 Л(А) |
|
~ \~ Р ( Х ) | |
K ( z ) d z - |
|
Правая часть последнего неравенства стремится к нулю при N-*oo и б-»»0, что и доказывает теорему об а с и м п т о т и ч е ской н е с м е щ е н н о с т и оценки рх (х) во всех точках не прерывности функции р{х).
Если р(х) имеет производные в точке х, то суждения о характере смещения оценки pN{x) при конечных N можно продвинуть дальше. Соотношение (7.6.15) может быть прос той заменой переменных приведено к виду
gN(x)—p (x )= J \p(x—h{N) у)— /<■*)] K(y) dy,
что при достаточно малых h может быть представлено ря дом:
gN(x)~P(x)=hP'(x)■ 5уКЬ) dy+
+ ± . h 2 P"(X) j y2 я(у) dy-\-0(h*). |
(7.6.16) |
Из (7.6.16) следуют дополнительные желательные свойства функций К (у)' плотность К (у) должна иметь все моменты; желательно также, чтобы$К(у)-ydy=0, т. е. чтобы К(у) бы ло симметричной относительно нуля функцией.
Рассмотрим теперь поведение дисперсии оценки рх (х)
= — г" к 2( — |
) р ( У ) * У ~ т г и Г K 4t ) p ( x - h t ) d t . |
|
Nh2_» \ |
} |
NhJ* |
157
Следовательно, при достаточно малых h,
V |
a |
r |
i |
f |
K4t)dt- |
l7-6-1?) |
|
|
|
Nh(N) |
Joo |
|
Появляется еще одно желательное свойство К(у) —
f K 4 y ) d y< oo :
Кроме того, требование стремления дисперсии оценки к нулю при N—уоо приводит к новому ограничению на последователь ность h(N), кроме (7.6.14) должно иметь место:
UmNh(N) = oo. |
(7.6.18) |
|
_х .\ |
при N-*-oo устремляется |
|
~h(N)j |
||
|
к 6-функции, но не слишком быстро, так, чтобы число выбо
рочных |
значений, «взвешиваемых» |
каждой функцией |
||
К |
x —xt |
неограниченно возрастало. При |
этом рм(х) в каж |
|
h |
||||
|
|
|
дой точке х оказывается суммой неограниченно возрастаю
щего |
числа |
случайных |
величин |
Vl — [ l l h( N) ]X |
ХК[ { х — Xi )/h(N)], и, следовательно (см. |
гл VI), при оп |
ределенных условиях последовательность pN(x) может подчи няться центральной предельной теореме, т. е. оценка р#{х) может быть асимптотически нормальной:
pN( x ) - E p N(x) |
< |
е Tdy=Q>(c) (7.6.19) |
ИгаР |
- 5 = J |
|
N-+oo |
у <6^ - о |
|
для любого вещественного с. Парзен [1] показал, что доста точным для этого условием является существование при неко тором 6 > 0 предела
E\VN~ E V n\*+* |
п |
(7.6.20) |
—■—- -------—-------- |
"О при N -yоо |
Высокие качества оценок с помощью разложения по ве совым функциям привлекли к ним внимание многих авто ров. Можно выделить три направления исследований: 1) ос лабление ограничений на условия сходимости р (х) к р(х); 2) оптимизация разложения (7.6.7); 3) вопросы применения данного класса оценок в различных статистических про цедурах.
Э. Надарая [1] показал, что для того, чтобы с вероятно стью единица при N- уоо имело место
158
sup \pN{ x ) - p { x ) 1 -0 ,
|
—во <ЛГ<оо |
|
|
|
необходимо |
и достаточно, |
чтобы |
К(х) была функцией с |
ог |
раниченным |
изменением, |
р ( х) — равномерно непрерывной |
||
функцией и ряд 2 ех р [—■ykh2(k)] |
сходился при любом у |
(по |
||
следнее имеет место при h ( N ) = |
0О < 0 < ; ^). К. Чанда |
[1] |
установил, что если потребовать только асимптотической не смещенности pN(x) и не налагать на К(х) условия обяза тельной неотрицательности, то среднеквадратическая ошибка
оценки может |
быть уменьшена по сравнению с |
(7.6.17). |
В. Мэрфи [1] |
показал, что сходимость pN(x) к р(х) |
во всех |
точках непрерывности последней сохраняется и в том слу чае, когда F (х) имеет счетное число разрывов.
Оптимизация разложения (7.6.7) ведется за счет выбора наилучшей формы функции К{х) и конкретизации зависи мости h(N). Конечно, все определяется выбором критерия и условий оптимизации. Например, если минимизировать сред
неквадратичную разность |
между Рн(х) |
и р{х), |
усредняя ее |
||
по р(х), то оптимальное |
К(х) |
будет |
разным |
для |
разных |
р(х) (см. Уотсон и Лидбеттер |
[1]). Другой подход, |
являю |
щийся непараметрическим, состоит в том, чтобы минимизи ровать дисперсию оценки (7.6.17) за счет минимизации ин теграла J K2(t)dt при некоторых дополнительных ограниче ниях на K(t). При ограниченности интервала 2h, в котором K(i):ФО, и задании 2т моментов для K(t) оптимальная фор-
ма K(t), очевидно, |
|
2т |
|
(см. К. Чан- |
имеет вид Ka(t) =hXN (s) -Р |
||||
да [1]); при задании только |
■s=О |
К(у) получаем |
||
дисперсии для |
||||
(см. Епонечников |
[1]) Ko(t) |
Щ / ^ |
' |
прИ ^ |
и K0(t) —0 при |/|> У 5 . Оптимальный же коэффициент h(N)
получается в виде C- N~~.
Вопросы использования оценок типа (7.6.7) в конкрет ных статистических процедурах будут рассмотрены в некото рых из последующих глав; здесь же отметим только, что, как показали Надарая [1] и Бхаттачарья [1], производные
ряда (7.6.7) с вероятностью единица сходятся к |
производ |
ным неизвестного распределения р (х): |
|
sup \p{rN](x)—р{г\х)\-^0 при JV—>-оо. |
(7.6.21) |
—«5 <Jf<eO |
|
В заключение необходимо отметить весьма важное обоб щение теории оценок плотности разложениями по весовым
159
функциям, сделанное М. Розенблатом [2]. Оказывается, что даже если выборочные значения Х\...... xN не являются неза
висимыми, то при определенных ограничениях на характер зависимости асимптотическое поведение опенки pN(x) (7.6.7)
остается тем же, что и при независимых наблюдениях. Тре бования к типу зависимости носят несколько специфический характер, но, по существу, сводятся к достаточно быстрому ослаблению зависимости при увеличении |t—k\, где i и k ~ номера выборочных значений; таким требованиям удовлет воряет, например, гауссов стационарный марковский про цесс и некоторые другие типы марковских процессов.
§7.7. ОЦЕНИВАНИЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ
ИПЛОТНОСТИ ВЕРОЯТНОСТЕЙ РЯДАМИ ФУРЬЕ
Один из напрашивающихся подходов к оценке неизвест ного распределения состоит в том, чтобы представить его в виде ряда по системе ортогональных функций; при этом оце нивание F(x) или р(х) сводится к оцениванию по выборке хь . , xN коэффициентов соответствующего ряда. В зависи мости от того, какая априорная информация используется для построения оценки коэффициентов, данный подход мо жет носить как параметрический, так и непараметрический характер; нас, естественно, будет интересовать последний случай.
Непараметрическое оценивание функции распределения или плотности состоит в том, чтобы использовать для оценки коэффициентов некоторый непараметрический факт. В дан ном параграфе мы еще раз убедимся, что различное упот ребление одного и того же факта может дать оценки, обла дающие различными свойствами. Мы рассмотрим вариант оценки коэффициентов ряда Фурье, опирающийся на исполь
зование |
эмпирической |
функции |
распределения |
(Кронмал ч |
Тартер |
[1]). |
|
|
|
Пусть {фА(х )} — семейство функций, взаимно ортогональ |
||||
ных с весом w(x), |
|
|
|
|
|
\ b k{x)'\{x)w(x)dx=bkl, |
(7.7 1) |
||
где 6W |
— символ Кронекера |
функции распределения F (х) |
||
Определим оценку |
FNm (х) |
|||
как конечный ряд |
m |
|
|
|
|
|
|
(7.7.2) |
|
|
|
|
|
k=0
в качестве коэффициентов {Ак} этого ряда будем использо вать коэффициенты Фурье эмпирической функции распреде ления J N(x) (7.2.1):
160
Л*= I />(-*) '!»*(■*) «'(•*) d x -
|
1 |
N |
[C (x—xl)^k{x)w{x)dx. |
|
(7.7.3) |
||
|
= — |
V |
|
||||
|
N |
|
|
|
|
|
|
Обсудим |
свойства |
введенной |
таким |
образом |
оценки |
||
FNm (х). Поскольку |
эмпирическая |
функция |
распределения |
||||
является кусочно-гладкой, то почти |
везде |
(за |
исключением |
||||
точек разрыва) |
Нш FNm{x)=FN(x), |
|
|
(7.7.4) |
|||
|
|
|
|
||||
|
|
т -+°о |
|
|
|
|
|
если { ^ (я )} |
является |
полной ортонормированной |
системой |
||||
функций (см. Г. П. Толстов [1]). |
Далее, |
если .неизвестная |
|||||
функция F(x) |
является непрерывной, то |
|
|
|
|||
|
Е (Нш FUm(x))=E(FN{x))=F(x). |
|
(7.7.5) |
||||
Кроме того, |
|
|
|
|
|
|
|
|
|
|
£(Л*)=Л*. |
|
|
|
(7-7.6) |
где Ак — коэффициенты Фурье для |
F(x). В самом деле, |
||||||
Е (Ак) |
|
Ц J С (X~ x i) Ф*(*) M*)dx |
|
=Е{ J С(х—Х{) фА(л:) w(x) dx\ — ( 'h(x ) М.х) dx dF(y)--
— | /^ (у) ^ <ik(x)w(x)dx] + $F(y)tyk(y)w(y)dy.
—00 —x
Последняя строка получена путем интегрирования по частям.
Так как F (—о о ) = 0 и |
J $к |
wdx=0, |
a |
J Fipkw d x = A k , |
то |
||
(7.7,6) доказано. |
|
|
|
|
|
|
|
Определим |
взвешенную |
среднеквадратическую |
ошибку |
||||
оценки Кд,от (я) |
как |
|
|
|
|
|
|
•/ (7?ivm )=£l |
И |
* |
) |
~ |
(7.7. |
7) |
Применив к (7.7.7) формулу Парсеваля, легко получить, что
•/ (7r/vm)= I ^ ( * ) w (x)dx- |
m |
{Ак~-Уаг A„). |
(7.7.8) |
|
23 |
||||
|
*=o |
|
|
|
Если {фй(*)} — полная система функций, то J F2w dx= |
А\, |
|||
и мы имеем |
|
|
|
о |
|
|
|
|
|
т |
|
со |
г, |
|
A ^ J = 2 Var^ + |
|
1J |
A t |
(7.7.9) |
161
Учитывая (7.7.5) и (7.7.9), можно показать, что разница между взвешенными среднеквадрагическими ошибками
FNm (х) и Fw (х) равна
H F Nm ) - n F N) = |
2 ( 4 - У а г Л * ) . |
(7.7.10) |
k = m - r l |
|
|
Интересно, что можно выбрать |
число т членов ряда |
(7.7.2) |
так, что (7.7.10) будет отрицательным, т. е. взвешенная сред неквадратическая ошибка FNm будет меньшей, чем у эмпи рической функции распределения FN.
Перейдем теперь к вопросам оценивания плотности р(х). С одной стороны, мы можем предложить в качестве оценки р(х) конечный ряд такого же типа, что и ряд для F(x): .
т |
|
Рхт(Х)= 2 M ft W . |
(7.7.11) |
k=0 |
|
и рассматривать ее как самостоятельную оценку. Свойства этой оценки определяются выбором оценок для {<^}. Напри мер, если потребовать, чтобы
Е(йк) = а к, |
(7.7.12) |
где {ah} — коэффициенты Фурье для истинной |
(оценивае |
мой) функции р(х), то оценка (7.7.11) окажется смещенной, так как
Е ( р ( х ) - р Мт(х))= 2 |
<!>*(*), |
(7.7.13) |
k=m-И |
|
|
что равно нулю лишь при ak= 0 для всех k > m . Правда, есть основания полагать, что смещенность является свойством, об щим для почти всех оценок плотности (см. Розенблатт [1]). Как и для FNm , можно вычислить взвешенную среднеквадра тическую ошибку pNm , которая оказывается равной
J(PNm)=E s IP (X ) - P JVJ X )]2 W ( X ) dx =
т
= \ p2(x ) w ( x ) d x — 2 |
(a*—Var ak) — |
|
||
m |
oo |
ai |
|
|
= 2 Var(«*) + |
2 |
|-1 |
<7-7-14) |
|
k=0 |
k~m |
|
|
С другой стороны, можно рассматривать не только само стоятельную оценку (7.7.11), но и оценку p*Nm (х), являю щуюся производной от FNm (я):
d |
т |
d |
(7-7-15) |
/*«(■ *)= - Г |
(*) = 2 |
И - |
|
U X |
^ = Q |
и х |
|
162
Было бы желательно, чтобы (7.7.15) тоже было рядом по ортогональным функциям. Это накладывает определенные ограничения на {ф^}, которые, однако, в ряде случаев можно \довлетворить. Например, этим ограничениям подчиняются такие системы ортогональных функций, как {cos four}, {sin far*}, {cosfotx, sin&nx}.
ж
При практическом построении оценок FNm (х) и pNm (х) возникает ряд дополнительных вопросов. Исследования пока зывают, например, что для неограниченного убывания взве шенной среднеквадратичной ошибки pNm (х) достаточно, что бы число членов в (7.7.11) было порядка УN. Особую про блему создает возможность отрицательных значений сумм (7.7.2) и (7.7.11). Можно выбрать специальную систему не отрицательных функций {фА}, однако это приводит к серь езным практическим усложнениям, а с другой стороны, это оказывается ненужным, так как при объемах выборки уже порядка нескольких десятков появление отрицательных зна чений у pNm (х) практически маловероятно (см. Кронмал и Тартер [1]). Далее отметим практическую трудность, типич ную для всех аппроксимаций функций конечными рядами:
качество оценок FNm и р |
зависит от четырех связанных |
в |
163 |
ff Ю,000
между собой факторов: выбора системы функций {-фй(л:)}, выбора числа членов ряда т, характера истинной оценивае мой функции F (или р) и относительной величины интервала, в котором осуществляется оценивание. Некоторое представ ление о связи этих факторов дают два графика из работы Кронмала и Тартёра [1]: на них приведены области, соот ветствующие оптимальному числу т членов ряда для pNm (х) при заданных объеме выборки N и величине интервала (Ь—а), измеряемого в единицах В = ( х 0,75—* 0 ,2 5 ) , где хр —
квантиль уровня р. График 7.7.1 относится к оцениванию плотности нормального распределения, график 7.7.2 — рас пределения Коши; в обоих случаях разложение производится по синусам и косинусам периода (Ъ—a) IB.
§7.8. ОБ ОЦЕНИВАНИИ МНОГОМЕРНЫХ ПЛОТНОСТЕЙ
ИФУНКЦИЙ РАСПРЕДЕЛЕНИЯ
Во многих практически важных случаях необходимо про изводить оценивание многомерных распределений вероятно стей. Учитывая направленность данной книги, мы полностью опустим рассмотрение параметрической постановки этой за
164