10049
.pdfУчитывая сказанное, при построении критерия проверки статистической гипотезы необходимо сначала задаться допустимым уровнем риска на совершение ошибки I рода, как наиболее значимой, а затем минимизировать ошибки II рода.
3. Построение критерия проверки гипотезы
Пусть необходимо проверить простую гипотезу Н0 {X fX (x, )}, состоящую в предположении о виде функции плотности распределения случайной величины Х с вполне определенными параметрами . Построим критерий, однозначно принимающий или отвергающий проверяемую гипотезу по полученной в наблюдении за случайной
величиной |
Х |
выборке |
хВ {x1,x2 ,...xn} объема n. Помимо основной |
гипотезы |
Н0 |
(“нулевой”) рассмотрим еще одну или несколько |
|
альтернативных гипотез |
Н1,H2 ,H3,...,Hm каждая из которых противоречит |
основной. Альтернативные гипотезы необходимы при построении критерия проверки основной гипотезы для ее сравнения с имеющимися альтернативами (все познается в сравнении с чем-то).
Критерий проверки гипотезы состоит из двух составляющих: Во-первых, в качестве критерия принимается некоторая случайная
величина |
К , с известным распределением |
при условии справедливости |
|
основной |
fK (k / H0 ) |
и хотя бы частично известным для альтернативных |
|
гипотез fK (k / H j ) |
j=1, ..m. Кроме того значения критерия должны быть |
||
вычисляемы по наблюдаемой выборке хВ , т.е. |
knab k(xi ) . |
Во-вторых, строится решающее правило для критерия проверки, согласно которому гипотеза будет приниматься или отвергаться. Для этого,
назовем критической областью критерия |
те значения величины К , при |
|||
которых гипотеза отвергается. Критическую |
область будем обозначать Кkr . |
|||
Тогда решающее правило критерия проверки будет следующим: |
||||
knab Кkr |
Н0 |
отвергается |
(по наблюдаемой выборке), |
|
knab Кkr |
Н0 |
принимается |
(нет оснований отвергать гипотезу). |
Точки значения критерия К , где критическая область критерия проверки
Кkr отделяется от области принятия гипотезы, называются критическими точками критерия kkr . Как построить критическую область критерия или, что равносильно, как найти критические точки критерия? Ниже рассмотрим ответ на этот вопрос.
Зададимся вероятностью ошибки I-го рода, как наиболее значимой. Исключить такую ошибку при проверке гипотезы невозможно ( 0), но в вероятностных задачах это не является трагедией. На практике обычно эту
80
вероятность задают достаточно малой величиной 0,05; 0,025;0,005 и называют уровнем значимости критерия.
Если из условия
P(k Kkr ) fK (k / H0 )dx
Kkr
можно определить критические точки kkr однозначно, то задача построения критической области критерия решена. В противном случае, когда еще остается свобода выбора критических точек, рассмотрим влияние альтернативных гипотез. Поскольку величина:
f K(k / H j )dx 1 j
Kkr |
|
есть вероятность правильного отбрасывания |
H0 при условии |
справедливости H j , то ее называют мощностью критерия по отношению к альтернативной гипотезе H j . Поэтому при заданном уровне значимости ,
критическую область критерия нужно строить так, чтобы мощность критерия была максимальной, а именно:
(1 j ) max , для наиболее мощного критерия (НМК) относительно гипотезы H j , максимизация проводится по параметрам сложной гипотезы; min (1 j ) max, для равномерно наиболее мощного критерия
(РНМК), в случае наличия нескольких сложных гипотез.
Величина j - есть вероятность принять неверную гипотезу H0 при условии справедливости альтернативной гипотезы H j .
Рис. 13.1. Двухсторонняя критическая область критерия
Кkr {k k2,k k1} при наличии двух альтернативных гипотез H1,Н2 .
81
На рис. 13.1 приведена графическая интерпретация алгоритма построения критической области одномерного критерия. Видим, что структура критической области, зависит от наличия альтернативных гипотез и их “расположения” относительно основной.
Лекция № 14
Примеры построения критериев проверки гипотез
1. Проверка гипотез о значении параметров распределения
Пусть случайная величина Х распределена нормально по закону
N(a, ) |
с неизвестными |
|
параметрами a, |
и наблюдается в выборке |
||||||||
хВ {xi |
,n} {x1,x2 ,...xn} |
|
объема n. Нормальный закон распределения |
|||||||||
N(a, ) |
задается |
следующей функцией |
плотности распределения |
|||||||||
вероятности: |
|
|
|
|
|
|
|
|
|
|
|
|
|
fX (x,a, ) |
|
1 |
|
exp( |
(х а)2 |
), |
M[X] a, |
D[X] 2 . |
|||
|
|
|
|
|
2 |
|||||||
|
|
|
2 |
|||||||||
|
|
|
|
|
|
2 |
|
|
|
По данным выборки могут быть получены выборочное среднее хВ и выборочный стандарт S :
|
х |
|
|
1 |
n |
S = |
1 |
n |
|
|
В |
= |
xj , |
(Xср xj )2 . |
|
||||
|
|
|
|
||||||
|
|
|
|
n j 1 |
|
n 1 j 1 |
|
||
Эти величины являются случайными и по ним могут быть построены |
|||||||||
оценки математического |
|
ожидания |
а М[x] и дисперсии |
D[x] |
наблюдаемой в выборке случайной величины Х.
Ниже проверим ряд простых статистических гипотез об истинных значениях параметров нормальной случайной величины Х .
1.1. H0 {a a0}. Проверим сначала гипотезу о равенстве значения истинного (гипотетического) математического ожидания а некоторой
величине a0 . |
Основная |
гипотеза |
тем |
самым |
будет следующей |
H0 {a a0}. |
В качестве |
критерия |
K |
возьмем |
случайную величину |
имеющую, при справедливости основной гипотезы, распределение Стьюдента с n-1 степенями свободы:
K |
|
x |
B |
a0 |
tn 1 |
|
|
|
|
|
|
|
|
||
|
|
|
|||||
|
|
S / n |
H0 , |
||||
Задаваясь уровнем значимости для проверяемой гипотезы |
|||||||
будем строить критическую область Kkr в зависимости от |
вида |
единственной конкурирующей (альтернативной) гипотезы H1 в следующих случаях:
82
Случай А: H1 {a a0}. В этом случае, при справедливости
конкурирующей гипотезы ожидаем сдвиг вероятных значений критерия K в большую сторону (рис.14.1), поэтому критическая область критерия будет
правосторонней |
Kkr |
{k kkr }. |
Критическая точка |
kkr |
однозначно |
|
определяется из условия равенства вероятности ошибки I-рода |
заданному |
|||||
уровню значимости |
P(k kkr ) . |
Решение |
этого |
уравнения |
||
kkr tkr ( ;n 1) |
представляет |
собой |
правостороннюю |
квантиль |
||
распределения случайной величины Стьюдента и приводится |
таблицей в |
|||||
приложении 3. |
|
|
|
|
|
|
|
|
Рис. 14.1 Критические области гипотезы H0 {a a0}. |
|
|||||||
|
Случай Б: |
H1 {a a0}. В этом случае, критическая область критерия |
||||||||
будет левосторонней |
Kkr |
{k kkr }, а значения критерия отрицательными |
||||||||
(рис.14.1). Критическая |
точка |
kkr |
определяется |
из |
уравнения |
|||||
P(k kkr ) , |
решение |
которого, в |
силу |
симметрии |
распределения |
|||||
Стьюдента, будет следующим kkr tkr ( ;n 1). |
|
|
|
|||||||
|
Случай В: |
H1 {a a0}. В этом случае критическая область критерия |
||||||||
будет двухсторонней |
Kkr |
{k kkr1;k kkr2}. |
Однако, здесь критические |
|||||||
точки |
kkr1,kkr2 |
не |
определяются |
однозначно |
из |
уравнения |
||||
P(k kkr1) P(k kkr2 ) . |
Доказано |
[9], |
что |
при |
условии |
|||||
P(k kkr1) /2 и |
P(k kkr2 ) /2 |
мощность |
критерия |
(1 ) по |
83
отношению к конкурирующей гипотезе Н1 будет максимальной. Тогда из этих уравнений критические точки находятся однозначно и представляют собой двухстороннюю квантиль распределения случайной величины Стьюдента:
kkr1 tkr ( /2;n 1), kkr2 tkr ( /2;n 1) .
Рассмотрим числовой пример: Пусть по выборке объема n=16 получена оценка математического ожидания наблюдаемой нормальной
случайной величины хВ 10,2 и оценка среднеквадратического отклонения
S 6,5. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том, что истинное
математическое |
ожидание наблюдаемой величины равна 15 т.е. |
H0 {a 15}. |
Зададимся уровнем значимости гипотезы 0,05и |
альтернативной гипотезой H1 {a 15}. Наблюдаемое в выборке значение критерия knab 10,2 15 4/6,5 2,954. Критическая область Kkr двухсторонняя, а критические точки будут:
kkr1 tkr (0,025;15) 2,13; kkr2 tkr (0,025;15) 2,13.
Видим, что knab принадлежит критической области и значит, гипотеза отвергается, т.е. отличие наблюдаемого значения математического ожидания от гипотетического значительны.
1.2. H0 { 2 02} Проверим теперь гипотезу о том, что истинная
(гипотетическая) дисперсия случайной величины равна 02 . Проверяемая гипотеза H0 { 2 02} В качестве критерия возьмем одномерную случайную
величину K , имеющую распределение «хи-квадрат» с n-1 степенями свободы:
|
|
|
K |
S2 |
(n 1) n2 1 . |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
2 |
|
|
|
|
|
|
|
|
0 |
|
|
|
|
Здесь S2 оценка |
02 , |
полученная по выборке хВ {xi ,i 1,n}. |
|
|||||
Задаваясь уровнем значимости |
для проверяемой гипотезы H0 , |
будем |
||||||
строить критическую |
область |
Kkr |
в зависимости от вида единственной |
|||||
конкурирующей |
(альтернативной) |
гипотезы |
H1 в |
следующих |
случаях |
|||
(рис.14.2): |
|
{ 2 02}. |
|
|
|
|
|
|
Случай А: |
H1 |
В этом |
случае, |
при справедливости |
конкурирующей гипотезы ожидаем сдвиг наиболее вероятных значений критерия K в большую сторону, поэтому критическая область будет правосторонней.
84
Рис. 14.2 Критические области гипотезы H0 { 2 20}.
Критическая точка kkr здесь однозначно определяется согласно общему подходу к построению критических областей критерия из условия равенства вероятности ошибки I-рода заданному уровню значимости :
P(k kkr ) 2 (k;n 1)dk .
kkr |
|
Решение этого уравнения kkr kr2 |
( ;n 1) находятся однозначно, и |
представляет собой правостороннюю квантиль «хи-квадрат» распределения случайной величины и приводится в приложении 4.
Случай Б: H1 { 2 02}. В этом случае критическая область критерия будет левосторонней, а критическая точка однозначно определяется из уравнения :
kkr
P(k kkr ) 2 (k;n 1)dk
0
Левосторонняя критическая точка может быть легко выражена через функцию для правосторонней критической точки. Действительно, т.к. P(k kkr ) P(k kkr ) 1, то P(k kkr ) 1 и тогда решение для левосторонней точки будет следующим kkr 2kr (1 ;n 1).
Случай В: H1 { 2 20}. В этом случае, объединяющем два предыдущих случая, критическая область критерия будет
85
двухсторонней Kkr {k kkr1;k kkr2}. Однако, здесь критические точки
kkr1, kkr2 |
не определяется однозначно из уравнения |
|
|
|
|
kkr2 |
|
|
P(k kkr1) P(k kkr2) 1 2 (k,n 1)dk . |
||
|
|
kkr1 |
|
Доказано |
[9], что |
при условиях P(k kkr1) /2, |
P(k kkr2 ) /2 |
мощность критерия |
(1 )по отношению к конкурирующей гипотезе H1 |
будет максимальной, тогда из этих двух условий критические точки находятся однозначно:
kkr1 2kr (1 /2;n 1); kkr2 2kr ( /2;n 1).
Рассмотрим числовой пример: Пусть по выборке объема n=15 получена оценка дисперсии наблюдаемой нормальной случайной величины S2 40,25 или оценка среднеквадратического отклоненияS 6,5. Поскольку,
каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том, что истинная дисперсия
наблюдаемой величины равна 36, т.е. |
H0 |
{ 2 36}. Зададимся уровнем |
|
значимости гипотезы H0 0,05и альтернативной гипотезой H1 { 2 36}. |
|||
Наблюдаемое |
значение критерия |
knab (15 1)40,25/36 15,653. |
|
Критическая область |
Kkr {k k1kr ;k k2kr } |
двухсторонняя, а критические |
|
точки будут: |
|
|
|
kkr1 kr2 |
(1 0,025;14) 5,63; |
kkr2 |
kr2 (0,025;14) 26,1. |
Видим, что knab 15,653 не принадлежит критической области и значит, гипотеза принимается, т.е. отличия наблюдаемого значения дисперсии от гипотетического незначительны. Если бы, такая оценка дисперсии была получена по выборке меньшего объема n=7, то
kkr1 kr2 (1 0,025;6) 14,4; |
kkr2 kr2 (0,025;6) 1,24. |
|
|
||
тогда наблюдаемое значение критерия knab |
15,653 попадает в критическую |
||||
область и тогда проверяемая гипотеза отвергается. |
|
|
|||
Отметим, что при проверке гипотез H0 {a |
х |
В} и H0 |
{ 2 |
S2} |
при уровне значимости будут построены двухсторонние критические
области такими, что область принятия гипотез Kkr совпадет с доверительными интервалами, построенными с надежностью 1 .
86
2. Критерий согласия Пирсона
Критериями согласия называются критерии проверки статистических гипотез о виде распределения случайной величины. Проверяемая гипотеза имеет вид:
H0 {X ~ fХ (x, 1, 2,... r ),
где 1, 2,... r - принятые в гипотезе параметры распределения. Пирсон предложил и обосновал следующий критерий проверки гипотезы H0 по отношению к единственной альтернативной противоположной гипотезе
H1 H0 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Пусть |
по |
полученной выборке |
хВ {xi ,i 1,n} {x1,x2 ,...xn} |
|||||||||||
построена |
гистограмма |
наблюдаемых |
частот |
HXn {hj,nj; j 1,m}. |
||||||||||
Построим, так же теоретические частоты nTj |
для интервалов hj при |
|||||||||||||
условии |
справедливости |
проверяемой |
гипотезы H0 . Теоретические |
|||||||||||
частоты |
вычисляются через вероятность Pj |
|
нахождения случайной |
|||||||||||
величины X в интервале hj (xj,xj 1) |
по формуле: |
|
||||||||||||
|
nТ |
|
|
|
|
|
xj 1 |
|
|
|
|
|
||
|
j |
Рj F(xj 1) F(xj ) |
|
fХ (x, s )dx hf (xj 0.5 , s ), |
|
|||||||||
|
n |
|
|
|||||||||||
|
|
|
|
|
|
xj |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|||
где F(xj) |
- функция распределения для случайной величины X , |
h – шаг |
||||||||||||
интервалов гистограммы, |
xj 0.5 |
0,5 (xj |
xj 1 ) |
центры интервалов hj |
||||||||||
гистограммы. |
Таким образом, |
получим |
теоретические |
частоты |
||||||||||
nTj n Pj . |
Показано [9], что величина : |
|
|
|
|
|
||||||||
|
|
|
|
m |
T |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
nj |
) |
|
|
|
|
|
|
|
||
|
|
|
|
|
(nj |
|
|
m2 r 1 , |
|
|
|
|||
|
|
|
|
|
T |
|
|
|
|
|
|
|||
|
|
|
|
j 1 |
nj |
|
|
|
|
|
|
|
|
при достаточно большом объеме выборки имеет «хи-квадрат» распределение с m r 1 степенями свободы и может быть использована в качестве критерия для проверки гипотезы H0 . Задаваясь уровнем значимости можем однозначно определить правостороннюю критическую область критерия из уравнения
P( 2 2kr )
Его решение представляет собой правостороннюю квантиль «хи-
квадрат» распределения |
kr2 |
kr2 |
( ,m r 1) |
и приведено |
в |
приложении 4. |
|
|
|
|
|
87
Рис. 14.3. Критическая область критерия Пирсона.
Определив, таким |
образом, критическую точку kr2 , сравним ее с |
|||
наблюдаемым значением |
nab2 получим правило проверки гипотезы: |
|||
- |
если nab2 |
kr2 , |
то гипотеза принимается |
|
(отклонения теоретических и наблюдаемых частот незначительны), |
||||
- |
если же nab2 |
kr2 , то гипотезу необходимо отвергнуть |
(отклонения частот значительны).
Числовой пример: Проверим гипотезу о нормальном распределении полуденных температур месяца мая для выборки,
приведенной в лекции 10, при уровне значимости гипотезы |
0,05. |
|||
Вычислив выборочные характеристики |
х |
В 14,6 и |
S 7,5, |
примем |
их за оценки параметров нормального распределения. Таким образам проверяемая гипотеза такова:
H0 {X N(a, );а хВ; S}.
Учитывая, что для нормальной случайной величины Х функция
распределения имеет вид F(x) |
1 |
Ф( |
|
х а |
), где Ф(x) - функция Лапласа |
|||||||||||
2 |
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
(приложение 2), то для теоретических частот получим формулу: |
||||||||||||||||
Т |
|
xj 1 |
x |
B |
|
|
|
xj |
|
x |
B |
|||||
nj |
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
[Ф |
S |
|
|
Ф |
S |
|
|
], |
||||||||
|
|
|
|
|
|
|
|
|
|
где xj , xj 1 – соответственно левая и правая границы каждого из
интервалов hj разбиения данных в гистограмме. Все результаты приведем в таблице 8 и на рис.14.4.
88
Таблица 8.
hj |
0-5 |
5-10 |
10-15 |
15-20 |
20-25 |
25-30 |
|
nj |
3 |
6 |
8 |
7 |
3 |
4 |
31 |
|
|
|
|
|
|
|
|
nТj |
2,31 |
5,26 |
7,79 |
7,53 |
4,74 |
1,95 |
29,6 |
|
|
|
|
|
|
|
|
nab2 |
0,205 |
0,105 |
0.006 |
0,037 |
0,639 |
2,171 |
3,162 |
|
|
|
|
|
|
|
|
Рис. 14.4. Гистограмма наблюдаемых частот и кривая теоретических частот.
По заданному уровню значимости проверяемой гипотезы H0 определим критическую точку распределения «хи-квадрат» используя
приложение 4. Получим, что kr2 |
kr2 (0,05;6 2 1) 7,8. |
|
Поскольку nab2 |
3,162 kr2 |
7,8, то гипотеза H0 принимается |
(нет оснований ее отвергнуть), т.к. отклонения частот незначительны. Примеры заданий для проверки различных статистических гипотез
для самостоятельной работы студентов приводятся в [12].
89