Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Непараметрическая статистика

..pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
13.36 Mб
Скачать

а для альтернативы сдвига

Нш I / F И / Т / ^ ) ] - ' } - и л / ^ ' и м н о ,

ЛА-*-®

равномерно поЛ для всех f e [ 0 ,l] .

Применим эти результаты и теорему 9.6 1 для вычисления мощностей конкретных тестов. Например, для ДЛг-теста при масштабной альтернативе имеем:

Пт РяЛ( F t ) = l —P {|г(0-5(^ , 8)|< C.(DN)},

N-*оэ

где

S ( t , 6 ) = - 6 F - ' ( t ) - f [ F - ' ( t ) ] .

Аналогично, для Dt- при той же альтернативе получаем

Нш рд+ ( F t ) = l - P { z ( t X s ( t t 8)+Ся (£>£)}, O C t< \.

Лг-»-со Л

Для семейства симметричных относительно нуля распре­ делений и масштабных альтернатив Гельцер и Пайк [1] предложили тест, основанный на абсолютных значениях наб­ людений. Тестовая статистика записывается в виде

 

Од. =sup {у аП /ууЫ - р ч ®)])»

 

0<г><со

 

 

где V = \ X \ и F*(x) = 2 F (v ) — 1. Для этого теста

limp

* (F e)^ = l-P {z(0 ^ s* (F 8)+ C a(D)v)!,

м-,»

л

 

 

где

 

 

 

s * ( t , b ) = - b F '

4t)

f* [F*-l(t)] =

 

/ + 1

■2f

F

 

-8 0 -

i l t )

Вычисление мощностей в случае, когда функции s(t, б) или s*(t, б) являются линейными, производится сравнительно просто; Я- Гаек и 3. Шидак [1] приводят многочисленные примеры такого рода. Некоторые результаты можно получить, если нелинейные функции s и s* ограничить кусочно линей­ ными функциями (смотри, например, Квайд [1], Гельцер [1]), хотя уже и в этом случае возникают большие трудности Если нас интересует лишь качественное сравнение мощностей, то можно воспользоваться тем фактом, что для неравенства Pi>Рг достаточным условием является неравенство S \(f, б) < >5г(Г б). Например, для двойного экспоненциального рас­ пределения и масштабной альтернативы s* (t, б) ^ s ( t , б) для

8*

235

всех / и б. Следовательно £>дг -тест в этом случае обладает

большей мощностью, чем D %-тест.

 

a(t), невыполнение

К сожалению, нелинейность границ

неравенств между ними (в случае

их

пересечения), а иног­

да — невозможность получения a(t)

в явном виде, существен­

но ограничивают возможности данного метода.

Таким образом, рассмотрев известные аналитические под­ ходы к сравнению тестов по их мощности, мы приходим к об­ щему утверждению, что эти подходы позволяют сравнивать не любые тесты и не при любых альтернативах.

§ 9.7. О Б О Д Н О М Э В Р И С Т И Ч Е С К О М М Е Т О Д Е С Р А В Н Е Н И Я М О Щ Н О С Т Е Й Т Е С Т О В С О Г Л А С И Я С 1 Р У К 1 У Р Ы

Можно сформулировать несколько типичных задач, в ко­ торых возникает необходимость сравнения тестов по их мощ­ ности.

1. Если задано несколько альтернатив Gb ..., Gk , то как упорядочатся мощности РЛЕ, Gi), ..., ,(F, Gk) теста согла­ сия с F, основанного на заданном расстоянии р (заданной статистике 5)?

2. Если задана конкретная альтернатива G и некоторый класс тестов на однотипных расстояниях*, то такой тест из этого класса будет наиболее мощным при данной альтерна­ тиве?

3. Если задан набор альтернатив Gu ..., Gk и набор тестов 5 Ь ..., S t , основанных на разнотипных расстояниях, то какие пары «тест— альтернатива» предпочтительны в смысле мощ­ ности?

4. Если задана альтернатива G и два разнотипных теста, то какой из них предпочтителен?

Если бы у нас были методы аналитического вычисления мощностей любых тестов при любых альтернативах, ответить на эти вопросы было бы просто. Однако сложность (а иногда невозможность) вычисления мощностей вынуждают нас ис­ кать других путей. На то, что такие пути должны существо­ вать, указывает сам характер перечисленных задач: нам не требуется знать ни точного значения мощностей, ни даже только их разности; мы вполне удовлетворились бы знаком разности. Таким образом, мы приходим к следующей задаче: для каких тестов {5} и при каких альтернативах {т(и)} мож­

но сделать суждения типа

(тг) или (3*, (т )^ р ^

(т)

без вычисления мощностей

(или распределений статистики)?

* Например, расстояния d4

(§ 9.2) при разных 'F однотипны, a

d2 и

d4— разнотипны.

 

 

236

По отношению к тестам согласия структуры d в ряде случаев на этот вопрос можно ответить, опираясь на некоторые общие свойства классов тестов, рассматриваемых альтернатив и тес­ товых статистик. Перейдем к обсуждению этих свойств*.

Согласно теореме Чэпмена (см. § 9.6) о мощности моно­ тонного теста структуры d при альтернативах, подчиняющих­

ся неравенству, можно сделать суждение сразу: для

таких

тестов, если ti («) ^ т 2(ы), «<=[0,1], р (TI) ^ P (т2). В

этом

случае сравнение мощностей сводится к сравнению альтер­ натив.

Для удобства будем рассматривать альтернативы в кано­

нической форме, т. е. т (u)=GF~1 (и), 0 < и ^ 1 .

В таком

представлении любая гипотеза F соответствует равномерному

в [0,1] распределению то= « ;

в силу монотонности F сдвиго­

вые альтернативы сохранят

односторонность

(т. е. либо

т^то, либо т^то). При фиксации медианы и квантиля уров­ ня, отличного от 0,5 (например, 0,95), все симметричные рас­

пределения

упорядочатся по

свойству,

которое

Гаек [1]

предложил

назвать «степенью

затянутости

хвостов»

(напри­

мер, некоторые стандартные

распределения располагаются

следующим образом в порядке возрастания степени затяну­ тости хвостов: нормальное, логистическое, двойное экспонен­

циальное (распределение Лапласа),

распределение Коши).

П р и м ер 9.7.1. Оказывается, что

степень затянутости

хвостов влияет на различие между гипотезой и альтернати­ вой в канонической форме: на рис. Д.5.1 приведены графики альтернатив правостороннего сдвига при одинаковом (0= 0,4) сдвиге; нумерация кривых соответствует номеру распределения в вышеприведенном ряду. Опираясь на час­ тичную упорядоченность тестов структуры d и характер ука­

занных альтернатив сдвига

(рис. Д.5.1), можно сразу

сде­

лать В Ы В О Д , ЧТО П О С К О Л Ь К У

Д Л Я

B C e X U Т ^ Т г ^ Т з , P (ti)^

(т2)

(тз). Суждения о

^ (Т4) сделать нельзя,

по­

скольку

неравенство T^

TI

выполняется не для всех и.

 

Рассмотренный пример ставит два вопроса: 1) существу­

ют ли другие ситуации

(а не только гипотеза сдвига), в ко­

торых можно делать столь же однозначные выводы о срав­ нении мощностей? 2) какие заключения можно сделать в тех случаях, когда неравенство между альтернативами выполня­ ется не для всех «?

Ответ на первый вопрос можно получить, лишь обобщив понятие частичной упорядоченности, введенное только дляод-

■* Отметим,

что попытка

построения метода сравнения мощностей без

их вычисления

изложена в

работе Тарасенко и Шуленина [2]. Однако

Д. М. Чибисов [3] указал на недостаточную строгость обоснования метода. В данном параграфе метод изложен с учетом этой критики.

237

носторонних альтернатив. Такое обобщение становится оче­ видным, как только мы объединим воедино условия упоря­ доченности для правосторонней (TI^ T2) и для левосторонней альтернатив (T2^ TI): если для любых « с [0 ,1 ] выполняется условие

| Ti (ы) —То(м) I < |т2(«)—■То (и) |,

(9.7.1)

то

 

Р* ( t i X P i Ы -

 

В такой форме понятие частичной упорядоченности

тестов

структуры становится применимым и к масштабным альтер­ нативам. (Аналогично обобщается понятие монотонности)

П р и м ер 9.7.2. Затянутость хвостов влияет на степень удаленности альтернативы от гипотезы не только при сдви­ ге, но и при изменении масштаба. На рис. Д.5.2 приведены графики альтернатив масштаба (для о= 1,25; а0= 1 ) . номера кривых соответствуют нумерации примера 9.7.1. Легко ви­ деть, что условие частичной упорядоченности выполняется для всех приведенных масштабных альтернатив, и мы можем

в этом

случае

сделать

вывод, что

для монотонных

тестов

структуры d

p5 ( t i) > P i Ы З гр *

(т4).

которой

Для

альтернативы,

каноническое

представление

т* имеет сложную форму, суждение о мощностных свойствах частично упорядоченного теста можно сделать, если можно подобрать такую альтернативу т(и, а ), которая, с одной сто­ роны, позволяла бы достаточно просто вычислить мощность, а с другой — характеризовалась бы некоторым парамет­ ром сс, меняя который, мы могли бы заключить т* в полосу: г (и, cii)—т о |^ |т * (и ) —т о |^ |т (« , сс2) —то|. Тогда снова 1Дт(м, ai)) (т * )> р (т(«, а2)).

Обратимся теперь ко второму вопросу. Суждения, получа­ емые подобно тому, как это сделано в примерах 9.7.1 и 9.7.2, справедливы при любых объемах выборки, но эта общность достигается ценой строгого выполнения неравенств (9.7.1) для всех и. Именно поэтому мы ничего не могли сказать о мощности при т4 в примере 9.7.1. Если теперь учесть некото­ рые свойства тестовых статистик, то можно продвинуться дальше. Вспомним, что статистика есть оценка некоторого «расстояния» р (F, G), и что, как правило, эта оценка являет­ ся состоятельной. В силу этого для тестов, основанных на та­

ких

статистиках, можно утверждать,

что если р (ть то) >

> р

(т2, То), то найдется такое No (объем выборки), что при

N > N 0

(TI) > р Р (т2) .

 

П р и м ер 9.7.3. В условиях примера

9.7.1 при достаточно

большом N мощность теста Смирнова при т4 превысит мощ­ ности при остальных трех альтернативах.

238

Недостатком суждений, подобных только что приведенно­ му, является неопределенность величины JV0, однако это не лишает их полезности.

Ясно, что мощность теста неоднозначно определяется ве­ личиной «расстояния», однако ясно также, что верхняя грань мощности монотонно возрастает с ростом р. Это позво­

ляет делать некоторые суждения о мощностных

свойствах

тестов путем сравнения «расстояний».

тестов,

порождаемых

П р и м е р

9.7.4. Рассмотрим

класс

расстоянием

вида p=Jqp(77, G)

\р (F)

dF, где

ф—заданная

непрерывная

функция

аргументов, а

ф — весовая

функция.

Пусть F и G заданы.

Спрашивается,

при каком ф(К) верх­

няя грань мощности теста будет наибольшей? Ответ сводится к нахождению ф(К), обеспечивающего супремум р при задан­

ных F, G и ф. Выразим р через

канонически

приведенные

F и G: р— (ф(«, т (и)) ф

(и)

du. Супремум

р достигается

при ф ( и ) = Еk8 ик ), где

{uk} — значения и,

при которых

ф(ы, т) имеет максимумы. Таким образом, тест из рассматри­ ваемого класса, имеющий максимальную огибающую мощ­

ности, есть тест, порождаемый расстоянием р— 2ф (ик, k

т (и,;)). Это позволяет утверждать, например, что для масш­ табных альтернатив, %(и) которых один раз пересекает т о ( н ) ,

I'Ov-TeCT Купера ( VN—D^ -f DN) будет более мощным, чем

-^дг-тест Колмогорова.

П р и м е р 9.7.5. Покажем, что при любых симметричных распределениях в случае масштабной альтернативы G(x) —

—F(ax) тест Смирнова на абсолютных величинах выбороч­ ных значений будет иметь всегда значительно большую верх­ нюю грань мощности, чем тесты Смирнова и Колмогорова на исходных выборочных значениях, и близкую (возможно, равную) мощность с тестом Купера. Для этого сравним со­ ответствующие «расстояния» pt= su p (тг(й)—и), i = 1, 2, где

т( — приведенная альтернатива для исходной выборки, а тг —

приведенная альтернатива для абсолютных

значений. При

симметричности F и G имеем:

 

Ti (w) = -F (aF ~1 («)), тг(й) = 2 F (aF~l

(9-7-2)

Нахождение максимумов функций р,-=тг(н)—и, (= 1 , 2 при­ водит к следующим уравнениям для значений ит1, соответ­

ствующих положениям этих максимумов:

^ f[oF~Hunl) ] = / ( F ^ ( u ml)),

oF~l( Um?_±

gg?±jA

(9.7.3)

239

9 . 7 . 1 ) .

Um2

1

Легко видеть, что и т1~ —

= «0- Отсюда

P 2 = 2 F [ a F _ 1 ( « о) ] — 2 « O = 2 { F [ CTF —1 (WO) ] — WO} = 2 p i

( 9 7 4 )

Столь большое увеличение расстояния типа Колмогорова — Смирнова между гипотезой и альтернативой при переходе от выборочных значений к их абсолютным величинам и явля­ ется основанием для утверждений, сделанных в первом пред­ ложении данного примера. Суждение о тесте Купера следует из того, что п (и) —и имеет два экстремума, каждый из кото­ рых равен p i (см. рис.

Как видим, предлагаемая методика позволяет делать вы­ воды о мощностях тестов без их вычисления Следующий па­ раграф содержит экспериментальные данные, подтверждаю­ щие эти выводы.

§ 9.8 ОБ ЭКСПЕРИМЕНТАЛЬНОМ СРАВНЕНИИ КРИТЕРИЕВ

СОГЛАСИЯ СТРУКТУРЫ d

Из предыдущих параграфов становится ясным, что теоре­ тическое исследование мощностных свойств тестов и эвристи­ ческие способы не всегда могут в полной мере удовлетворить потребность в указании предпочтительных критериев согла­ сия при некоторых заданных условиях. Современная вычис­ лительная техника предоставляет выход из этого положения, которым, судя по литературе, все чаще начинают пользовать­ ся исследователи. Этот выход состоит в экспериментальном сравнении тестов.

Техника статистического эксперимента в принципе доста­ точно проста. Сначала генерируется выборка из любого ин­

240

тересующего нас конкретного распределения Затем по этой выборке вычисляются сравниваемые тестовые статистики По­ лученные значения сравниваются с критическими значениями для соответствующих статистик (при одинаковых уровнях значимости). Проводя такой эксперимент многократно на различных выборках одинакового объема, можно вычислить относительные частоты принятия альтернативы различными тестами. Эти частоты и являются оценками соответствующих мощностей, и их сравнение позволит сделать суждения о предпочтительности того или иного теста в данной ситуации.

Некоторая трудность может возникнуть из-за того, что точные или асимптотические распределения тестовых ста­ тистик при нулевой гипотезе известны не для всех статистик В таких случаях естественно воспользоваться статистически­ ми оценками критических значений, в качестве которых мо­ гут служить соответствующие порядковые статистики реали­ зовавшихся значений тестовых статистик.

Ценность таких статистических экспериментов в значи­ тельной мере зависит от того, насколько общие выводы мож­ но сделать на их основе, т. е. от того, в какой мере результа­ ты экспериментирования с фиксированными альтернативами останутся справедливыми для некоторого множества других альтернатив Поэтому весьма важным было бы установление некоторых классов альтернатив, обладающих определенными общими свойствами по отношению к данному классу тестов. Здесь может быть полезной классификация распределений по симметричности, одновершинности и затянутости хвостов,

а также стандартизованное (каноническое)

представление пар

конкурирующих гипотез

(см. Добавление

к Части

I)

Ста­

тистический эксперимент,

который мы

опишем ниже,

был

приведен для

ряда критериев согласия

и указанных альтер-

 

 

 

 

 

 

 

Т а б л и ц а

9 8 1

 

 

Нормальная альтернативная сдвига

 

 

а

TN

71А'

 

i0N

о2

 

 

1■<

 

 

а/

 

 

 

0,90

0,01

0,02

 

0,00

0,00

 

0,03

0,05

0,10

0,13(0,17)

0,16(0,11)

0,08(0,11)

0,09(0,10)

0,14(0,18)

0,10(0,15)

0,20

0,45(0,46)

0,40(0,40)

0,33(0,29)

0,36(0,29)

0,39(0,39)

0,34(0,32)

0,25

0,53

0,48

 

0,40

0,40

 

0,51

0,42

0,30

0,70

0,65

 

0,54

0,57

 

0,60

0,57

0,40

0,88(0,91)

0,82(0,77)

0,80(84)

0,83(0,86)

0,80(0,82)

0,73(0,74)

0,50

0,99

0,95

 

0,94

0,95

 

0,96

0,86

0,60

1,00

1,00

 

0,99

1,00

 

0,99

0,92

Здесь в скобках приведены некоторые результаты повторного экспери­ мента при других выборках.

241

 

 

 

 

 

 

Т а б л и ц а

9.82

 

 

 

Альтернатива сдвига Коши

 

 

 

а

 

 

2

4

 

M -J .O

M

l - 1)

Ч

 

<°N

D N

0,05

0,19

0,10

0,12

0,14

0,19

0,10

0,20

 

0,10

0,49

0,25

0,32

0,38

0,50

0,20

0,55

 

0,15

0,72

0,48

0,62

0,67

0,76

0,35

0,82

 

0,20

0,89

0,69

0,83

0,85

0,91

0,55

0,93

 

0,25

0,99

0,86

0,95

0,96

0,99

0,75

0,99

 

0,30

1,00

0,99

1,00

1,00

1,00

0,91

1,00

 

наТив сдвига и масштаба (Жирова, Тарасенко, Шуленин [1]) при JV = 50, а = 0 ,0 5 — табл. 9.8.1—9.8.5.

Зависимости мощности критерия Реньи от параметра b при­ ведены на рис. 9.8.1 для нормального распределения и на рис. 9.8.2 для распределения Коши.

*

 

 

 

 

 

Т а б л и ц а 9 8 3

 

Логистическая масштабная альтернатива

 

 

8

D N

M

i - 1 )

4

4

v A ~~DM +DN

1,00

0,02

 

0,03

0,05

0,04

 

0,02

1,30

0,05

 

0,03

0,06

0,05

 

0,16

1,50

0,10

 

0,06

0,11

0,15

 

0,63

1,60

0,23

 

0,03

0,17

0,27

 

0,70

1,80

0,40

 

0,10

0,41

0,59

 

0,92

2,00

0,60

 

0,22

0,78

0,88

 

0,98

2,20

0,83

 

0,33

0,93

0,96

 

1,00

2,40

0,90

 

0,46

0,97

0,99

 

1,00

 

 

 

 

 

 

Т а б л и ц а 9 8 4

 

Лапласовская масштабная альтернатива

 

 

8

 

М

4 - 1)

4

Q2

VN=D++DJJ

 

 

“ Л'

 

 

1,00

0,03

0,02

0,03

0,03

 

0,04

1,30

0,02

0,04

0,04

0,03

 

0,05

1,50

0,10

0,05

0,07

0,06

 

0,42

1,60

0,12

0,06

0,05

0,09

 

0,51

1,80

0,26

0,18

0,30

0,43

 

0,88

2,00

0,44

0,17

0,58

0,70

 

0,91

2,20

0,57

0,27

0,75

0,86

 

0,97

2,40

0,73

0,32

0,88

0,93

 

1,00

2,60

0,84

0,43

0,95

0,98

1,00

242

 

 

 

 

 

Т а б л и ц а 9 8.5

 

 

Масштабная альтернатива Коши

 

 

в

 

M i* 1)

2

Q 2

 

D N

 

и N

 

1,00

0,04

0,05

0,03

0,03

0,02

1,30

0,07

0,09

0,08

0,08

0,16

1,50

0,06

0,07

0,04

0,05

0,26

1,60

0,12

0,09

0,09

0,07

0,40

1,80

0,16

0,07

0,12

0,11

0,60

2,00

0,35

0,17

0,25

0,27

0,75

2,20

0,36

0,23

0,40

0,47

0,82

2,40

0,49

0,25

0,57

0,63

0,91

2,60

0,61

0,31

0,69

0,74

0,94

На основании экспериментальных данных можно сделать следующие выводы.

243

р

ко

6 ( 0 , S )

0 , 9

ж

S

 

о,а

1 /

0,7

~7 2

0,6

Н л /

4

 

 

^ 6 ( 0 , 2 5 )

0,5

0,4

0,3

02

О,'

0,03 О,/О О,Г5

0,20

0,23 0,30

<*■

Рис 98 2

1. Мощности рассмотренных критериев согласия для аль­ тернатив сдвига примера 9.7.1 возрастают при переходе к рас­ пределениям с более затянутыми хвостами. Этот факт под­ тверждает эвристические выводы § 9. 7.

2.

Предпочтительность Т Jj -теста Мозеса

при логиче­

ской альтернативе сдвига полностью согласуется с результа­

тами

работы Белла и Доксума [1], в которой

показана ло­

кальная оптимальность TN -теста при этой альтернативе

3 Мощность

R~N

(6, 1)-теста Реньи существенно зависит

от параметра 6.

Для

рассмотренных альтернатив сдвига она

максимальна при 6 = 0,5

4DN -тест Смирнова предпочтительней RN (6, 1)-теста Реньи для альтернатив сдвига с быстро спадающими хвоста­ ми; для распределений с сильно затянутыми хвостами (рас­ пределение Коши) картина обратная.

5Для альтернатив сдвига с быстро спадающими хвоста­

ми со^-Тест Крамера-Мизеса-Смирнова предпочтительнее

24Л