Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Непараметрическая статистика

..pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
13.36 Mб
Скачать

ку некоторому преобразованию и исследовать статистические свойства преобразованной выборки. Во всех изученных до сих пор случаях оказывалось, что среди свойств преобразо­ ванной выборки всегда находились такие, которые сохраня­

лись независимо от вида

истинного распределения

G(x 1 , .... хN) исходной выборки.

Приведем (табл. 1.6.1) крат­

кий перечень известных преобразований выборки и непара­ метрических свойств преобразованной выборки. (Заметим при этом что, по-видимому, нет ограничений на рассмотрение дру­ гих преобразований и возможное установление новых непа­ раметрических фактов).

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

161

 

Тип преобразовании

Непараметрические свойства

 

 

1

Перестановка

элемен­

Равновероятность

перестановок

при

симмет­

 

тов выборки

 

 

ричности G(X1, .. , Хдг).

 

 

 

 

 

2

Поэлементное

приве­

Равномерность

 

распределения

приведенной

 

дение

выборки в ин­

выборки в интервале [0,1] при

 

 

 

 

тервал

[0,1]

с

по­

F(x) = G(x)

 

 

 

 

 

 

 

 

 

 

 

мощью функции

F(x )

Сходимость

R-й

порядковой

статистики

по

3

Упорядочивание

эле­

 

ментов

выборки

по

вероятности к квантилю уровня

R / ( N + 1):

.

их величине

 

 

 

* (Л)- * б - Ч Я Л Л 4 -1 )).

 

 

 

 

 

4

Отображение

на

про­

Марковость

и

 

асимптотическая

пуассоно-

 

странство выборочных

вость последовательности порядковых

ста­

 

блоков

 

 

 

 

тистик.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Статистическая

 

эквивалентность

выбороч­

 

 

 

 

 

 

ных блоков.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Асимптотическая

 

непараметричность

функ­

 

 

 

 

 

 

ции мощности в классе распределений с

 

 

 

 

 

 

сдинаковой энтропией

 

 

 

 

 

5

Отображение

на

про­

Равновероятность

ранговых

векторов

при

 

странство

ранговых

симметрии

G(x\,

.,

х ^ )

 

 

 

 

 

 

векторов

 

 

 

Статистическая

связь

рангов

 

с

соответст­

 

 

 

 

 

 

 

6.

Отображение

на

про­

вующими им

выборочными

значениями

 

Чувствительность

 

распределения

ранговых

 

странство

ранговых

интервалов

к

 

независимости

и

случайно­

 

интервалов

 

 

 

сти элементов выборки*

 

 

 

 

 

Установив тот или иной непараметрический факт, мы мо­ жем указать класс задач, которые могут быть решены с его

* Пусть читатель не смущается тем, что в таблице могут встретиться незнакомые ему понятия или утверждения: все они будут разъяснены поз­ же в соответствующих разделах книги.

32

помощью Например, свойства преобразований

2

и 4 могут

использоваться для построения критериев согласия;

3 и 4 —

для оценивания неизвестных распределений; 1,

5

и

6 — для

проверки случайности или независимости выборки и т. д. Как именно использовать их, как строить конкретные процедуры— это вопрос, который мы рассмотрим впоследствии в главах третьей части книги.

Итак, методика построения процедур для решения непара­ метрических задач предстает теперь как последовательность выполнения следующих этапов.

1. Предлагается некоторое преобразование исходной вы­ борки, результатом которого является новая выборка. Иног­ да это преобразование можно предложить, исходя из осо­ бенностей задачи, подобно тому, как это делается при ис­ пользовании принципа инвариантности. Но можно делать это и эвристически, не привязываясь заранее ни к какой кон­ кретной задаче, в расчете на то, что у преобразованной вы­ борки удастся найти впоследствии какие-то непараметриче-

-ские свойства. Пока неясно, существуют ли ограничения на класс возможных преобразований.'

2.Изучаются статистические свойства преобразованной выборки в предположении, что распределение исходной вы­ борки известно. Затем отыскиваются условия, при которых в окончательных формулах знание распределения несуществен­ но, т. е. устанавливаются непараметрические факты. По-ви­ димому, общим правилом является существование непарамет­ рических фактов для любых разумных преобразований вы­ борки; по крайней мере, до сих пор не найдено обратного при­ мера.

3.Найденные непараметрические факты анализируются с

целью нахождения адекватных им типов непараметрических задач. Например, статистическая эквивалентность выбороч­ ных блоков может использоваться для оценки неизвестного распределения, для построения критериев согласия, для про­ цедур распознавания образов и, возможно, в каких-то других случаях. (Иногда даже если преобразование выборки пред­ ложено с учетом конкретной задачи, может оказаться, что непараметрические факты, связанные с этим преобразовани­ ем, имеют более широкое применение).

4. Предыдущие этапы выполняются, естественно, лишь те­ ми, кто непосредственно занят развитием самой непарамет­ рической статистики. Тот, перед кем стоит конкретная при­ кладная непараметрическая задача и кто нуждается в кон­ кретной статистической процедуре для ее решения, имеет пе­ ред собой две возможности.

Первая состоит в выборе из числа известных процедур той, которая его по тем или иным причинам больше всего

2 Заказ 7394

33

устраивает Следует, однако, иметь в виду, что в ряде слу­ чаев мало что известно об относительных достоинствах раз­ ных процедур, предназначенных для решения одной и той же задачи (типичным является положение с многочисленными критериями согласия); поэтому здесь требуется известная ос­ торожность и критичность В третьей части книги мы сдела­ ем попытку собрать разбросанные по многочисленным стать­ ям результаты по этим вопросам.

Вторая возможность заключается в применении разрабо­ танных к настоящему моменту методов синтеза непарамет­ рических процедур к данной конкретной задаче. Надо ска­ зать, что для ряда непараметрических процедур пока нет ал­ горитмических методов их синтеза, при их создании большую роль играют интуиция и эвристические методы. Однако во многих случаях найдены и алгоритмические методы. Это в особенности относится к синтезу тестов для проверки гипо­

тез. В

дальнейшем этот

вопрос будет рассмотрен детально,

а пока

вкратце изложим

общую методику синтеза непара­

метрических тестов.

Прежде всего, нулевая гипотеза должна быть представ­ лена как простая. В некоторых задачах (например, в задачах согласия) нулевая гипотеза является простой в самой их по­ становке; если же нулевая гипотеза непараметрична, то она с помощью подходящего непараметрического факта проек­ тируется на простую гипотезу. В итоге в любом случае мы имеем нулевую гипотезу, представленную единственным и из­ вестным распределением.

К сожалению, непараметрическая альтернатива остается непараметрйческой и после сведения нулевой гипотезы к про­ стой. Поэтому обычно поступают следующим образом. Бе­ рется любое и з в е с т н о е распределение, удовлетворяющее условиям альтернативы; известными из классической статис­ тики методами синтезируется тест для проверки простой ги­ потезы против этой конкретной простой альтернативы; а за­ тем этот тест используется для проверки гипотезы против любого из распределений альтернативы. Конечно, историче­ ски многие тесты были предложены чисто эвристически: ино­ гда по интуиции можно предложить конкретную статистику и предсказать, что она будет удовлетворять определенным тре­ бованиям к различению гипотезы от альтернативы Однако впоследствии почти всегда оказывалось, что каждый такой тест можно получить и указанным выше способом

Построенный таким образом тест обладает следующими свойствами. Во-первых, он будет непараметрическим в том смысле, что его уровень значимости не зависит от конкретно­ го распределения даже в том случае, если нулевая гипотеза непараметрична. Причина этого лежит в представлении нуле-

34

вой гипотезы в виде простой. Во-вторых, хотя тест рассчитан на различение м е ж д у нулевой гипотезой и д а н н ы м «представителем» альтернативной гипотезы, он пригоден для проверки и против других распределений альтернативы Правда, при этом мощность теста будет зависеть от того, ка­ кое именно из распределений управляет выборкой; и, соглас­ но фундаментальной лемме Неймана-Пирсона, мощность тес­ та при этом может только уменьшаться Однако тест остается несмещенным; интересно, что в некоторых случаях сущест­ вует целый подкласс распределений альтернативы, для ко­ торых мощность теста сохраняется постоянной (см. гл. 9).

Читатель, по-видимому, уже понял это, но мы все же под­ черкнем еще раз, что в синтезе новых непараметрических про­ цедур по данному методу пока еще большая роль отводится интуиции и изобретательности.

§ 1.7. МЕТОД ФУНКЦИОНАЛОВ В НЕПАРАМЕТРИЧЕСКОИ СТАТИСТИКЕ

До сих пор мы рассматривали методы решения статисти­ ческих задач, основанные на интерпретации статистик как функций выборочных значений. Этапы синтеза и анализа статистической процедуры при этом подходе выглядят сле­ дующим образом. Во-первых, основываясь на знаниях, опыте, интуиции, для каждой задачи можно построить или выбрать из известных такую функцию выборочных значений, которая будет чувствительной к различиям распределений, описанным в условиях задачи. Во-вторых, качество процедуры, основан­ ной на предложенной статистике, можно определить, посколь­ ку, зная функцию случайных величин и их распределения, в принципе всегда можно найти распределение самой функции, а по нему — все интересующие нас характеристики процеду­ ры.

Практически всеми результатами современной статистики мы обязаны именно такому подходу. Однако по мере выдви­ жения практикой все более сложных задач и соответствующе­ го развития теории стали проявляться трудности и недостат­ ки, связанные с обоими этапами этого подхода. Первый этап — выбор подходящей статистики — носит эвристический характер, и в малоисследованных задачах статистику прихо­ дится буквально изобретать. В непараметрическом случае это приводит к типичной для изобретательства ситуации: всегда остается открытым вопрос, а нельзя ли придумать еще чтонибудь получше, все ли подходящие статистики мы перебра­ ли. Второй этап — нахождение распределения статистики — в принципе преодолимый, поскольку вид статистики задан,

2*

35

часто оказывается практически не приводящим к успеху из-за невозможности в сложных задачах довести до конца анали­ тические выкладки. Именно поэтому так велики трудности исследования мощностных свойств многих тестов, так мало известно о свойствах статистик при зависимых выборках и т. п. Статистическое моделирование на ЭВМ может пролить свет на свойства конкретной процедуры в конкретных усло­ виях; это в ряде случаев устраивает практиков, но не может удовлетворить _теоретиков из-за частности получаемых ре­ зультатов.

Указанные трудности в значительной степени связаны с основной идеей подхода, согласно которой статистики рас­ сматриваются как измеримые функции случайных величин. Р. Мизес [1] предложил принципиально иной подход, кото­ рый позволяет преодолеть или обойти многие трудности ис­ следования статистик. Его идея состоит в том, чтобы рас­ сматривать статистику как функционал от эмпирической функции распределения. Эту мысль развивали В. И. Смир­ нов [6] и в особенности А. А. Филиппова [1], Чернов и Сэ­ видж [1], а также другие авторы. Ограниченное распростра­ нение, которое эта идея получила в статистике, объясняется

прежде всего тем, что далеко не

все статистики являются

функционалами

от

эмпирической

функции

распределения

(примерами, и

не

единственными,

являются

статистики на

выборочных интервалах и крайних порядковых статистиках). Весьма существенное развитие идея Мизеса получила в ис­ следованиях Хёфдинга [2], который рассматривал линейные интегральные функционалы от несмещенной оценки произ­ ведения маргинальных функций распределения. Класс по­ лучающихся при этом статистик назван им U -статистиками. Однако и этот класс еще не охватывает всех возможных ста­ тистик.

Тем не менее, уже на этом, пока еще частном, этапе раз­ вития данный подход явно демонстрирует свои преимущества как при синтезе статистических процедур, так и при их ана­ лизе. Действительно, вместо конструирования статистики те­ перь необходимо строить функционал, выражающий апри­ орную информацию о задаче; статистика же получается ав­ томатически, путем подстановки в функционал оценки функ­ ции распределения. Анализ же свойств статистики упроща­ ется благодаря тому, что эти свойства могут теперь быть выражены через свойства оценки функции распределения.

Эти преимущества делают актуальным такое обобщение и развитие этого подхода, которое позволило бы охватить возможно более широкий класс статистик. Для этого нужно прежде всего обобщить интерпретацию статистики как оцен­ ки функционала.

36

Всякая задача проверки гипотез или оценивания пара­ метра может рассматриваться как задача отбора (на основе результатов наблюдений) одного из подклассов некоторого класса распределений. Задачи проверки гипотез соответст­ вуют дискретному (и обычно конечному) множеству под­ классов; задачи оценки параметра — континуальному (в не­ параметрической задаче данному значению параметра всегда соответствует подкласс распределений, а в параметриче­ ской— либо подкласс, либо одно распределение, в зависи­ мости от соотношения числа параметров семейства и числа оцениваемых параметров). Другими словами, в таких зада­ чах необходимо на основе выборки провести различение под­ классов Это достигается путемвведения количественной ха­ рактеристики различий между подклассами в виде функ­ ционала.

В непараметрической постановке задачи различие между распределениями обычно задается в настолько общем виде, что допускает неоднозначное толкование при формулировке количественной меры различия, что и приводит к возмож­ ности построения нескольких функционалов для одной и той же задачи. Проиллюстрируем это на простейшей задаче раз­ личения распределений по параметру расположения. Пусть требуется оценить параметр а, если задано только то, что он входит в неизвестное распределение Fa (x) следующим об­ разом: Fa ( x ) = F ( ха). Как видим, указанное различие но­ сит характер сдвига, но сам сдвиг еще не определен. Мы мо­ жем доопределить его как математическое ожидание (ct{=

= $xdFa(x),

как

медиану (а2— {x:Fa (х—а) —ту}),

как мо­

д у — при одномодовости

распределений

(а3— {х:™ах dFa (х)1

dx}),

как

полусумму

симметричных

квантилей

(а4=

= -g- (Хр+х-ь-р),

{xq : Fa (х) = q } ) и т. д. Таким образом, за­

данное различие

(в данном случае сдвиг) может быть выра­

жено несколькими функционалами, каждый из которых мо­ жет быть оценен по выборке.

Итак, сформулированное в постановке задачи различие между распределениями конкретизируется с помощью зада­ ния некоторого функционала. При этом функционал не обя­ зательно должен быть явно определен только на функциях распределения; в него могут входить плотности, производ­ ные плотности, обратные функции распределения, характеристич ;ские функции и другие представления распределений.

Конкретизировав заданное различие, то есть выбрав не­ который функционал, определенный на тех или иных пред­ ставлениях распределений, участвующих в задаче, мы можем

37

перейти к синтезу статистики. Это достигается путем подста­ новки в функционал вместо входящих в него представлений

распределений — оценок (в

нашем случае — непараметриче­

ских) этих

представлений. Так, если функционал

имеет вид

] = j\q>(F,

f,

..., f{n)dF,

то статистика есть / л'=) <f>(Fu , } N>

f u ) d F N,

где <р — некоторая

функция; F,

f.......f(r) — функция

распределения,

плотность,

..., г-я производная

плотности;

FN, f/v, .... f[P

— их

(непараметрические)

оценки,

соответст­

венно, по выборке объема N.

 

 

 

Многообразие статистик,

подходящих

для решения дан­

ной задачи, объясняется не только тем, что заданное разли­ чие может быть выражено обычно не единственным функцио­ налом, но и тем, что одно и то же представление распреде­ ления может быть оценено, как правило, несколькими спо­ собами. Например, плотность в непараметрическом случае может быть оценена гистограммой, оценкой РозенблаттаПарзена, полиграммой любого порядка, рядами по ортого­ нальным функциям и т. д. Использование каждой из таких оценок для оценивания функционала будет давать новую статистику, со своими особенностями в свойствах*.

Итак, логически продолжая подход Р. Мизеса, можно дать следующее определение: с т а т и с т и к а е с т ь о ц е н ­ ка н е к о т о р о г о ф у н к ц и о н а л а , в к о т о р ы й в м е с ­ то в х о д я щ и х в н е г о п р е д с т а в л е н и й р а с п р е ­ д е л е н и й , у ч а с т в у ю щ и х в з а д а ч е , п о д с т а в л е ­ ны с т а т и с т и ч е с к и е о ц е н к и э т и х п р е д с т а в ­ л е н и й .

Предыдущие рассуждения позволяют надеяться на то, что это определение охватывает практически все известные ста­ тистики и может служить основой для синтеза новых ста­

тистик. Задача анализа теперь разбивается

на два этапа:

1) изучение свойств оценок представлений

распределений;

2) выражение свойств оценок функционала через свойства оценок фигурирующих в нем представлений. Декомпозиция сложной проблемы является мощным средством упрощения ее решения, и в данном случае тоже есть основания надеять­ ся на проявление этого эффекта. Продемонстрируем это на простейшем примере.

Пусть нам необходимо оценивать линейный интегральный

функционал/ =

J ф (|ь

..., %k) dFЦь .... 1к).

Его оценка

вы­

разится

как/л/=1

ср(gi, ..., | ft) dFN (Ii ..., | ft).

Выберем

в

ка­

честве

FN(1i,

...,

4k)

оценку, среднее

которой

равно

* В частности, поэтому не всегда сразу можно определить, какому функционалу соответствует данная статистика, построенная эвристически; иногда анализ такой «трудной» статистики может подсказать новую, ранее не исследованную оценку того или иного представления распределения.

38

E f N(lu ..., £л) и ковариация которой равна covjTwdi,

Ы>

F, (т,ь

ц*)] Тогда (при определенных условиях регуляр­

ности, которые мы молчаливо будем предполагать, но пока не станем конкретизировать),

E J N = 1

Ф

\ k) d E F N { l ......БЛ),

DJn = я ф (ii,--.,

1к)ч > Ь и -, ~Пк)а{2) <^ov[FN {i), /ууЙ ] .

Таким образом, если мы изучим свойства среднего и кова­ риации оценки /> , мы можем получить суждения о среднем и дисперсии нашей оценки (при условии, что они сущест­ вуют) . Во многих случаях этой информации достаточно для практического использования предлагаемой оценки.

В данной книге мы ограничимся лишь формулировкой этой программы; лишь иногда (например, в гл. VIII) будут отражены некоторые ее аспекты. Ее реализация для одного класса интегральных (линейных и нелинейных) функциона­ лов изложена в монографии под общей редакцией Ф. П. Та­ расенко [8].

Г Л А В А П

ХАРАКТЕРИСТИКИ КАЧЕСТВА СТАТИСТИЧЕСКИХ ПРОЦЕДУР

§2.1. ВВЕДЕНИЕ

Для решения любой статистической задачи можно пред­ ложить несколько различных процедур. Выбор конкретной процедуры основывается на ряде соображений. Иногда боль­ шое значение придается простоте вычислений, требующихся для выполнения процедуры; в других случаях использование электронных вычислительных машин ослабляет это требова­ ние. При «ручных» вычислениях решающим может оказаться наличие достаточно подробных таблиц, связанных с той или иной процедурой. Однако при любых обстоятельствах нас прежде всего интересует к а ч е с т в о решений, которые мы будем получать с помощью данной процедуры, т. е. их точ­ ность, надежность и т. д.

Для оценки качеств статистических процедур в математи­ ческой статистике введены специальные понятия, разрабо­ таны различные методы сравнения процедур между собой. В данной главе мы дадим краткий обзор этих понятий и ме-

39

тодов. Наиболее детально рассмотрено сравнение тестов (§ 2.4 и далее), так как в последние годы в этом направле­ нии получен ряд новых результатов.

§ 2.2. СВОЙСТВА ТОЧЕЧНЫХ ОЦЕНОК ПАРАМЕТРОВ (СТАТИСТИК)

Точечная

оценка

параметра — это некоторая

статистика

л

...,

XN), которая используется

вместо неизвестного

0 = S ( x b

истинного

значения

параметра 0. Ясно,

что чем

Л

ближе 0 к

 

 

 

 

л

 

0, тем точечная оценка лучше. Но так как 0 является функ­ цией выборочных значений, она оказывается случайной вели­ чиной, и, следовательно, как бы ни вводилось конкретное

Л

расстояние между 0 и 0, оно тоже будет случайным. Поэтому

л

необходимо определить смысл «близости» между 0 и 0 как меру соответствия между множествами их возможных зна­ чений. Такие меры могут быть различными, поскольку раз­ ные критерии близости могут уделять внимание различным качествам оценки.

Так как при неограниченном увеличении объема выборки мы обычно ожидаем неограниченного возрастания «близости»

Л

0д к 0, то необходимо прежде всего определить точно, что мы будем понимать под сходимостью последовательности случай-

ных величин

л

 

к 0 при N-^-oо.

 

 

А

сходится

Говорят, что последовательность 0« (Л/ = 1, 2, . )

к 0 по в е р о я т н о с т и , если для любого е > 0

 

 

Иш Рг (| 0 ^ - 0 1>е)-Ю .

(2.2.1)

 

ЛГ-*»

 

Для краткости утверждение о сходимости такого типа запи-

ЛЛ р

сывают в виде р Jim 0^=6 или 6,v-^0.

Далее, говорят, что 0д сходится к 0 в

с р е д н е м , если

Иш Е (0ДГ—6)2= 0 .

(2.2.2)

А,

и E(QN) и £ (0 2) ограничены (символ Е(Х) означает мате­

матическое ожидание случайной величины X). Краткой фор-

л

мой записи этого определения является l.i.m. 0v = 0.

40

Из сходимости в среднем следует сходимость по вероят­ ности. Действительно, согласно неравенству Чебышева

 

 

я г ( |е ,у - е |> £ ) <

E(Qi у - 6)2

 

 

(2.2.3)

и из (2.2.2)

следует (2.2.1).

 

 

 

л

 

 

Если оценка вм сходится по вероятности к 0, то она на­

зывается

с о с т о я т е л ь н о й оценкой.

Если

 

Л

оценка

Л

£ (0 w /0 )= 0 , то

0jv называется несмещенной

в среднем,

чаще просто

н е с м е щ е н н о й . (Однако следует

иметь в виду, что можно определить несмещенность и в дру­ гом смысле. Например, если условная функция распределения

А

 

равна

Л

£(0^/0)

’/г при 0дт=0, оценка называется н е с м е щ е н ­

ной

по

м е д и а н е ) .

Смещенная

оценка может быть состоятельной, если при

N-*■ 00

смещение bN (0)-vO, т. е. если оценка является асимп­

тотически несмещенной (смещение определяется как йЛ'(0) =

= £ 0 —0.

Кроме величины смещения оценки ее качество определя­ ется степенью разброса, рассеяния около среднего значения. Наиболее употребительной (но не универсальной) мерой рас­ сеяния является дисперсия. Ее величину можно использовать

как критерий качества оценки; так возникает понятие эффек-

л

тивной оценки. Если QN— несмещенная оценка и имеет ко­

нечную дисперсию и для 0 не существует другой оценки с

л

меньшей дисперсией, то QN называется э ф ф е к т и в н о й оценкой параметра 0.

Естественно желание иметь количественную оценку наи­

меньшей дисперсии 0л'. Такую возможность предоставляет из­ вестное неравенство Рао-Крамера (Г. Крамер [1]):

. • Я , » < 1 + ^ 2 1 2 .

с м ,

где / — количество информации по Фишеру,

/ —£ д In р(х 0) 21

Если эффективная оценка существует, то в (2.2.4) дости­ гается знак равенства (6^(0) = 0 ) , и дисперсия эффективной оценки обратно пропорциональна фишеровской информации.

41