Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

10049

.pdf
Скачиваний:
8
Добавлен:
25.11.2023
Размер:
3.78 Mб
Скачать

Учитывая сказанное, при построении критерия проверки статистической гипотезы необходимо сначала задаться допустимым уровнем риска на совершение ошибки I рода, как наиболее значимой, а затем минимизировать ошибки II рода.

3. Построение критерия проверки гипотезы

Пусть необходимо проверить простую гипотезу Н0 {X fX (x, )}, состоящую в предположении о виде функции плотности распределения случайной величины Х с вполне определенными параметрами . Построим критерий, однозначно принимающий или отвергающий проверяемую гипотезу по полученной в наблюдении за случайной

величиной

Х

выборке

хВ {x1,x2 ,...xn} объема n. Помимо основной

гипотезы

Н0

(“нулевой”) рассмотрим еще одну или несколько

альтернативных гипотез

Н1,H2 ,H3,...,Hm каждая из которых противоречит

основной. Альтернативные гипотезы необходимы при построении критерия проверки основной гипотезы для ее сравнения с имеющимися альтернативами (все познается в сравнении с чем-то).

Критерий проверки гипотезы состоит из двух составляющих: Во-первых, в качестве критерия принимается некоторая случайная

величина

К , с известным распределением

при условии справедливости

основной

fK (k / H0 )

и хотя бы частично известным для альтернативных

гипотез fK (k / H j )

j=1, ..m. Кроме того значения критерия должны быть

вычисляемы по наблюдаемой выборке хВ , т.е.

knab k(xi ) .

Во-вторых, строится решающее правило для критерия проверки, согласно которому гипотеза будет приниматься или отвергаться. Для этого,

назовем критической областью критерия

те значения величины К , при

которых гипотеза отвергается. Критическую

область будем обозначать Кkr .

Тогда решающее правило критерия проверки будет следующим:

knab Кkr

Н0

отвергается

(по наблюдаемой выборке),

knab Кkr

Н0

принимается

(нет оснований отвергать гипотезу).

Точки значения критерия К , где критическая область критерия проверки

Кkr отделяется от области принятия гипотезы, называются критическими точками критерия kkr . Как построить критическую область критерия или, что равносильно, как найти критические точки критерия? Ниже рассмотрим ответ на этот вопрос.

Зададимся вероятностью ошибки I-го рода, как наиболее значимой. Исключить такую ошибку при проверке гипотезы невозможно ( 0), но в вероятностных задачах это не является трагедией. На практике обычно эту

80

вероятность задают достаточно малой величиной 0,05; 0,025;0,005 и называют уровнем значимости критерия.

Если из условия

P(k Kkr ) fK (k / H0 )dx

Kkr

можно определить критические точки kkr однозначно, то задача построения критической области критерия решена. В противном случае, когда еще остается свобода выбора критических точек, рассмотрим влияние альтернативных гипотез. Поскольку величина:

f K(k / H j )dx 1 j

Kkr

 

есть вероятность правильного отбрасывания

H0 при условии

справедливости H j , то ее называют мощностью критерия по отношению к альтернативной гипотезе H j . Поэтому при заданном уровне значимости ,

критическую область критерия нужно строить так, чтобы мощность критерия была максимальной, а именно:

(1 j ) max , для наиболее мощного критерия (НМК) относительно гипотезы H j , максимизация проводится по параметрам сложной гипотезы; min (1 j ) max, для равномерно наиболее мощного критерия

(РНМК), в случае наличия нескольких сложных гипотез.

Величина j - есть вероятность принять неверную гипотезу H0 при условии справедливости альтернативной гипотезы H j .

Рис. 13.1. Двухсторонняя критическая область критерия

Кkr {k k2,k k1} при наличии двух альтернативных гипотез H1,Н2 .

81

На рис. 13.1 приведена графическая интерпретация алгоритма построения критической области одномерного критерия. Видим, что структура критической области, зависит от наличия альтернативных гипотез и их “расположения” относительно основной.

Лекция № 14

Примеры построения критериев проверки гипотез

1. Проверка гипотез о значении параметров распределения

Пусть случайная величина Х распределена нормально по закону

N(a, )

с неизвестными

 

параметрами a,

и наблюдается в выборке

хВ {xi

,n} {x1,x2 ,...xn}

 

объема n. Нормальный закон распределения

N(a, )

задается

следующей функцией

плотности распределения

вероятности:

 

 

 

 

 

 

 

 

 

 

 

 

fX (x,a, )

 

1

 

exp(

(х а)2

),

M[X] a,

D[X] 2 .

 

 

 

 

 

2

 

 

 

2

 

 

 

 

 

 

2

 

 

 

По данным выборки могут быть получены выборочное среднее хВ и выборочный стандарт S :

 

х

 

 

1

n

S =

1

n

 

 

В

=

xj ,

(Xср xj )2 .

 

 

 

 

 

 

 

 

 

n j 1

 

n 1 j 1

 

Эти величины являются случайными и по ним могут быть построены

оценки математического

 

ожидания

а М[x] и дисперсии

D[x]

наблюдаемой в выборке случайной величины Х.

Ниже проверим ряд простых статистических гипотез об истинных значениях параметров нормальной случайной величины Х .

1.1. H0 {a a0}. Проверим сначала гипотезу о равенстве значения истинного (гипотетического) математического ожидания а некоторой

величине a0 .

Основная

гипотеза

тем

самым

будет следующей

H0 {a a0}.

В качестве

критерия

K

возьмем

случайную величину

имеющую, при справедливости основной гипотезы, распределение Стьюдента с n-1 степенями свободы:

K

 

x

B

a0

tn 1

 

 

 

 

 

 

 

 

 

 

 

 

S / n

H0 ,

Задаваясь уровнем значимости для проверяемой гипотезы

будем строить критическую область Kkr в зависимости от

вида

единственной конкурирующей (альтернативной) гипотезы H1 в следующих случаях:

82

Случай А: H1 {a a0}. В этом случае, при справедливости

конкурирующей гипотезы ожидаем сдвиг вероятных значений критерия K в большую сторону (рис.14.1), поэтому критическая область критерия будет

правосторонней

Kkr

{k kkr }.

Критическая точка

kkr

однозначно

определяется из условия равенства вероятности ошибки I-рода

заданному

уровню значимости

P(k kkr ) .

Решение

этого

уравнения

kkr tkr ( ;n 1)

представляет

собой

правостороннюю

квантиль

распределения случайной величины Стьюдента и приводится

таблицей в

приложении 3.

 

 

 

 

 

 

 

 

Рис. 14.1 Критические области гипотезы H0 {a a0}.

 

 

Случай Б:

H1 {a a0}. В этом случае, критическая область критерия

будет левосторонней

Kkr

{k kkr }, а значения критерия отрицательными

(рис.14.1). Критическая

точка

kkr

определяется

из

уравнения

P(k kkr ) ,

решение

которого, в

силу

симметрии

распределения

Стьюдента, будет следующим kkr tkr ( ;n 1).

 

 

 

 

Случай В:

H1 {a a0}. В этом случае критическая область критерия

будет двухсторонней

Kkr

{k kkr1;k kkr2}.

Однако, здесь критические

точки

kkr1,kkr2

не

определяются

однозначно

из

уравнения

P(k kkr1) P(k kkr2 ) .

Доказано

[9],

что

при

условии

P(k kkr1) /2 и

P(k kkr2 ) /2

мощность

критерия

(1 ) по

83

отношению к конкурирующей гипотезе Н1 будет максимальной. Тогда из этих уравнений критические точки находятся однозначно и представляют собой двухстороннюю квантиль распределения случайной величины Стьюдента:

kkr1 tkr ( /2;n 1), kkr2 tkr ( /2;n 1) .

Рассмотрим числовой пример: Пусть по выборке объема n=16 получена оценка математического ожидания наблюдаемой нормальной

случайной величины хВ 10,2 и оценка среднеквадратического отклонения

S 6,5. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том, что истинное

математическое

ожидание наблюдаемой величины равна 15 т.е.

H0 {a 15}.

Зададимся уровнем значимости гипотезы 0,05и

альтернативной гипотезой H1 {a 15}. Наблюдаемое в выборке значение критерия knab 10,2 15 4/6,5 2,954. Критическая область Kkr двухсторонняя, а критические точки будут:

kkr1 tkr (0,025;15) 2,13; kkr2 tkr (0,025;15) 2,13.

Видим, что knab принадлежит критической области и значит, гипотеза отвергается, т.е. отличие наблюдаемого значения математического ожидания от гипотетического значительны.

1.2. H0 { 2 02} Проверим теперь гипотезу о том, что истинная

(гипотетическая) дисперсия случайной величины равна 02 . Проверяемая гипотеза H0 { 2 02} В качестве критерия возьмем одномерную случайную

величину K , имеющую распределение «хи-квадрат» с n-1 степенями свободы:

 

 

 

K

S2

(n 1) n2 1 .

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

0

 

 

 

 

Здесь S2 оценка

02 ,

полученная по выборке хВ {xi ,i 1,n}.

 

Задаваясь уровнем значимости

для проверяемой гипотезы H0 ,

будем

строить критическую

область

Kkr

в зависимости от вида единственной

конкурирующей

(альтернативной)

гипотезы

H1 в

следующих

случаях

(рис.14.2):

 

{ 2 02}.

 

 

 

 

 

Случай А:

H1

В этом

случае,

при справедливости

конкурирующей гипотезы ожидаем сдвиг наиболее вероятных значений критерия K в большую сторону, поэтому критическая область будет правосторонней.

84

Рис. 14.2 Критические области гипотезы H0 { 2 20}.

Критическая точка kkr здесь однозначно определяется согласно общему подходу к построению критических областей критерия из условия равенства вероятности ошибки I-рода заданному уровню значимости :

P(k kkr ) 2 (k;n 1)dk .

kkr

 

Решение этого уравнения kkr kr2

( ;n 1) находятся однозначно, и

представляет собой правостороннюю квантиль «хи-квадрат» распределения случайной величины и приводится в приложении 4.

Случай Б: H1 { 2 02}. В этом случае критическая область критерия будет левосторонней, а критическая точка однозначно определяется из уравнения :

kkr

P(k kkr ) 2 (k;n 1)dk

0

Левосторонняя критическая точка может быть легко выражена через функцию для правосторонней критической точки. Действительно, т.к. P(k kkr ) P(k kkr ) 1, то P(k kkr ) 1 и тогда решение для левосторонней точки будет следующим kkr 2kr (1 ;n 1).

Случай В: H1 { 2 20}. В этом случае, объединяющем два предыдущих случая, критическая область критерия будет

85

двухсторонней Kkr {k kkr1;k kkr2}. Однако, здесь критические точки

kkr1, kkr2

не определяется однозначно из уравнения

 

 

 

kkr2

 

 

P(k kkr1) P(k kkr2) 1 2 (k,n 1)dk .

 

 

kkr1

 

Доказано

[9], что

при условиях P(k kkr1) /2,

P(k kkr2 ) /2

мощность критерия

(1 )по отношению к конкурирующей гипотезе H1

будет максимальной, тогда из этих двух условий критические точки находятся однозначно:

kkr1 2kr (1 /2;n 1); kkr2 2kr ( /2;n 1).

Рассмотрим числовой пример: Пусть по выборке объема n=15 получена оценка дисперсии наблюдаемой нормальной случайной величины S2 40,25 или оценка среднеквадратического отклоненияS 6,5. Поскольку,

каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том, что истинная дисперсия

наблюдаемой величины равна 36, т.е.

H0

{ 2 36}. Зададимся уровнем

значимости гипотезы H0 0,05и альтернативной гипотезой H1 { 2 36}.

Наблюдаемое

значение критерия

knab (15 1)40,25/36 15,653.

Критическая область

Kkr {k k1kr ;k k2kr }

двухсторонняя, а критические

точки будут:

 

 

 

kkr1 kr2

(1 0,025;14) 5,63;

kkr2

kr2 (0,025;14) 26,1.

Видим, что knab 15,653 не принадлежит критической области и значит, гипотеза принимается, т.е. отличия наблюдаемого значения дисперсии от гипотетического незначительны. Если бы, такая оценка дисперсии была получена по выборке меньшего объема n=7, то

kkr1 kr2 (1 0,025;6) 14,4;

kkr2 kr2 (0,025;6) 1,24.

 

 

тогда наблюдаемое значение критерия knab

15,653 попадает в критическую

область и тогда проверяемая гипотеза отвергается.

 

 

Отметим, что при проверке гипотез H0 {a

х

В} и H0

{ 2

S2}

при уровне значимости будут построены двухсторонние критические

области такими, что область принятия гипотез Kkr совпадет с доверительными интервалами, построенными с надежностью 1 .

86

2. Критерий согласия Пирсона

Критериями согласия называются критерии проверки статистических гипотез о виде распределения случайной величины. Проверяемая гипотеза имеет вид:

H0 {X ~ fХ (x, 1, 2,... r ),

где 1, 2,... r - принятые в гипотезе параметры распределения. Пирсон предложил и обосновал следующий критерий проверки гипотезы H0 по отношению к единственной альтернативной противоположной гипотезе

H1 H0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть

по

полученной выборке

хВ {xi ,i 1,n} {x1,x2 ,...xn}

построена

гистограмма

наблюдаемых

частот

HXn {hj,nj; j 1,m}.

Построим, так же теоретические частоты nTj

для интервалов hj при

условии

справедливости

проверяемой

гипотезы H0 . Теоретические

частоты

вычисляются через вероятность Pj

 

нахождения случайной

величины X в интервале hj (xj,xj 1)

по формуле:

 

 

nТ

 

 

 

 

 

xj 1

 

 

 

 

 

 

j

Рj F(xj 1) F(xj )

 

fХ (x, s )dx hf (xj 0.5 , s ),

 

 

n

 

 

 

 

 

 

 

 

xj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где F(xj)

- функция распределения для случайной величины X ,

h – шаг

интервалов гистограммы,

xj 0.5

0,5 (xj

xj 1 )

центры интервалов hj

гистограммы.

Таким образом,

получим

теоретические

частоты

nTj n Pj .

Показано [9], что величина :

 

 

 

 

 

 

 

 

 

m

T

 

2

 

 

 

 

 

 

 

 

 

 

nj

)

 

 

 

 

 

 

 

 

 

 

 

 

(nj

 

 

m2 r 1 ,

 

 

 

 

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

j 1

nj

 

 

 

 

 

 

 

 

при достаточно большом объеме выборки имеет «хи-квадрат» распределение с m r 1 степенями свободы и может быть использована в качестве критерия для проверки гипотезы H0 . Задаваясь уровнем значимости можем однозначно определить правостороннюю критическую область критерия из уравнения

P( 2 2kr )

Его решение представляет собой правостороннюю квантиль «хи-

квадрат» распределения

kr2

kr2

( ,m r 1)

и приведено

в

приложении 4.

 

 

 

 

 

87

Рис. 14.3. Критическая область критерия Пирсона.

Определив, таким

образом, критическую точку kr2 , сравним ее с

наблюдаемым значением

nab2 получим правило проверки гипотезы:

-

если nab2

kr2 ,

то гипотеза принимается

(отклонения теоретических и наблюдаемых частот незначительны),

-

если же nab2

kr2 , то гипотезу необходимо отвергнуть

(отклонения частот значительны).

Числовой пример: Проверим гипотезу о нормальном распределении полуденных температур месяца мая для выборки,

приведенной в лекции 10, при уровне значимости гипотезы

0,05.

Вычислив выборочные характеристики

х

В 14,6 и

S 7,5,

примем

их за оценки параметров нормального распределения. Таким образам проверяемая гипотеза такова:

H0 {X N(a, );а хВ; S}.

Учитывая, что для нормальной случайной величины Х функция

распределения имеет вид F(x)

1

Ф(

 

х а

), где Ф(x) - функция Лапласа

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(приложение 2), то для теоретических частот получим формулу:

Т

 

xj 1

x

B

 

 

 

xj

 

x

B

nj

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[Ф

S

 

 

Ф

S

 

 

],

 

 

 

 

 

 

 

 

 

 

где xj , xj 1 – соответственно левая и правая границы каждого из

интервалов hj разбиения данных в гистограмме. Все результаты приведем в таблице 8 и на рис.14.4.

88

Таблица 8.

hj

0-5

5-10

10-15

15-20

20-25

25-30

 

nj

3

6

8

7

3

4

31

 

 

 

 

 

 

 

 

nТj

2,31

5,26

7,79

7,53

4,74

1,95

29,6

 

 

 

 

 

 

 

 

nab2

0,205

0,105

0.006

0,037

0,639

2,171

3,162

 

 

 

 

 

 

 

 

Рис. 14.4. Гистограмма наблюдаемых частот и кривая теоретических частот.

По заданному уровню значимости проверяемой гипотезы H0 определим критическую точку распределения «хи-квадрат» используя

приложение 4. Получим, что kr2

kr2 (0,05;6 2 1) 7,8.

Поскольку nab2

3,162 kr2

7,8, то гипотеза H0 принимается

(нет оснований ее отвергнуть), т.к. отклонения частот незначительны. Примеры заданий для проверки различных статистических гипотез

для самостоятельной работы студентов приводятся в [12].

89

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]