Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Прикладная статистика

..pdf
Скачиваний:
7
Добавлен:
12.11.2023
Размер:
9.53 Mб
Скачать

качается буквой а. Тогда вероятность попадания в область при­ нятия гипотезы # 0 равна (I - а).

3. По выборке, извлеченной из генеральной совокупности, вычисляется экспериментальное значение случайной величи­ ны К — число К . Если это число принадлежит критической области, то гипотеза Нс отвергается, как противоречащая опыт­ ным данным. Справедливой считается альтернативная гипотеза Ня. Если число Кип принадлежит области принятия гипотезы эта гипотеза считается согласующейся с опытными данными.

Случайная величина К называется статистическим критери­ ем или тестом.

В зависимости оту славил эксперимента критическую область можно выбпать двусторонней, депосторонней и правосторонней. На рис. 8.1-8,3 проиллюстрированы поеденные определения. На каждом из этих рису икон показан график функции плотности вероятности случайной величины К при условии справедливос­ ти гипотезы Л0, обозначена эта функция /{ К / Н0).

8.1.3. Ошибки, допускаемые при проверке статистических гипотез

Всякое заключение об истинности или ложности статисти­ ческой гипотезы достаточно условно. Выборка конечного объ­ ема нс может отражать всю генеральную совокупность. Если экспериментальное значение

Л/Зд,)

 

 

 

 

 

 

Кршнчсскал

Область

\

 

Кр1гтцчнекая

область

/

\

 

область

Площадь

/

принятия Но

 

/

Площадь

и

 

 

 

равна о/2

Плошпль равна

 

\

1

равна оУ2

 

 

1-а

 

 

 

 

 

*»ч>

Рис. 8.1

 

 

Кь?

 

 

 

 

 

 

 

161

Рис. ^.3

статистического критерия, вычисленное но этой выборке, лопало в область принятия гипотезы # 0, это еще не означает, «гго //в обя­ зательно верна. Если число Кпа1 попало в критическую область, это не гарантия справедливости альтернативной гипотезы.

Таким образом, применяя процедуру проверки некоторой ста­ тистической гипотезы, можно совершить одну из двух ошибок.

Ошибкой первого рода называется ошибка отклонения вер­ ной гипотезы Н0. Вероятность этой ошибки равна вероятности попадания случайной величины К в критическую область, т.с. равна числу а. Ошибкой второго рола называется ошибка при­ нятия ложной гипотезы Чтобы найти вероятность ошибки второго рода, нужно знать закон распределения случайной вели­

162

чины К в предположении справедливости альтернативной гипо­ тезы Нш.Тогда искомая вероятность равна вероятности попада­ ния случайной величины К в область принятия гипотезы //0. ^го число обозначается буквой /У. Мощностью критерия К называет­ ся вероятность (I-/?) несовершения ошибки второго рода.

Хороший статистический критерий тот, для которого ми­ нимальны вероятности совершения ошибок как первого, ток и второго рода. Но мы не будем рассматривать теорию постро­ ения критериев максимальной мощности, ограничимся только обсуждением так называемых критериев значимости, применяя которые заранее фиксируют вероятность совершения ошибки первого рода (уровень значимости а).

Во многих случаях экспериментатору достаточно быть уве­ ренным в том, что выдвинутая им нулевая гипотеза нс противо­ речит опытным данным.

8 .2 .

П Р О В Е Р К А П А Р А М Е Т Р И Ч Е С К И Х

ГИ П О Т Е З П О К Р И Т Е Р И Я М З Н А Ч И М О С Т И

Вдальнейшем ограничимся только случаем нормально рас­ пределенной генеральной совокупности плн нескольких нор­

мально распределенных генеральных совокупностей.

8.2.1. П роверка гипотезы о значении математического ожидания

А2.1ш1ш Случаи, когда дисперсии о2ген еральной

совокупност и извест на

Задача ставится следующим образом. Из нормально распре­ деленной генеральной совокупности с неизвестным математи­ ческим ожиданием а и известной дисперсией а2 извлечена вы­ борка объема п. Выдвигается нулевая гипотеза, что значение математического ожидания равно числу а^. Требуется подтвер­ дить или опровергнуть эту гипотезу. Для проверки гипотезы ис­ пользуется случайная величина:

163

а

где:?— выборочное среднее.

Если нулевая гипотеза верна, случайная величина и имеет нормальное распределение с математическим ожиданием, рав­ ным нулю, и дисперсией, равной единице (так называемое стан­ дартное нормальное распределение). Альтернативная гипотеза, область принятия нулевой гипотезы к критическая область вы­ бираются, исходя из условий эксперимента,

Та же случайная величина используется и тогда, когда дисперсия а2неизвестна, но объем выборки н достаточно велик, п > 30. Вместо числа в формулу для и подставляется зЕгачсЕшс выборочного сред­ него квадратического отклонения 5, найденного по выборке.

Пример. На станке-автомате должны изготовляться детали с номинальным контролируемым размером аа= 12 мм. Известно, что распределение контролируемого размера является нормаль­ ным. Были измерены размеры 36 случайно отобранных деталей. Среднее значение контролируемого размера оказалось равным х = 11,7 мм, выборочное среднее квадратическое отклонение оказалось равным 0,5 мм. Можно ли считать, что станок-автомат изготавливает детали уменьшенного размера и, следовательно, требует наладки?

Решение. Проверяется нулевая гипотеза Н0: а = 12. Диспер­ сию генеральной совокупности будем считать равной 0,5. Если верна гипотеза Н0%значения выборочного среднего х не должны сильно отличаться от 12, соответственно значения случайной величины:

0,5/л/л

не должны сильно отличаться от нуля. Если же верна гипотеза Нл>то значения х следует ожидать меньше 12, соответственно значения и должны быть существенно меньше нуля. Критичес­ кая область — левосторонняя (рис. 8.4).

Положим уровень значимости а равным 0,05. Теперь можно найти и , т.с, придать точный смысл высказыванию «значения и должны быть существенно меньше нуля».

164

По определению критической области Р(и< и^} - а = 0,05. С другой стороны, если гипотеза //0 справедлива, то

Р(и < О = Ф (и^ ~ Ф (-*>) = Ф («,р) + 0,5, тогда Ф (гЛ) = -0,45, Найдем и .

 

- й ы ^ 1 ) = .

 

 

г = -3,6 < -1 ,6 5 .

 

 

0,5/6

Экспериментальное значение критерия и попало в критичес­

кую область;

п<

Нулевую гипотезу следует отклонить в

пользу альтернативной, станок нуждается в наладке.

8 .2 .1 .2 . П р о в е р к а г ш т т е ч ы о з н а ч е н и и в е р о я т н о с т и « у с п е х и »

Произведено а испытаний по схеме Бернулли, «успех» про­ изошел к раз. Требуется проверить нулевую гипотезу, что вероят­ ность появления «успеха» в каждом испытании равна числу р 0.

Если число испытании п > 50, для: проверки нулевой гипоте­ зы используют случайную величину:

(? - А>)

^ М г . е О ’

165

где х - к / п — выборочное среднее. Если верна нулевая гипоте­ за, то случайную величину и можно считать распределенной по стандартному нормальному закону.

Пример. Игральную кость подбросили <300 раз, шестерка по­ явилась 125 раз. Можно ли утверждать, что кость правильная? Принять а = 0,05,

Решение. Требуется проверить нулевую гипотезу # 0: р = 1/6. Если кость правильная, то математическое ожидание числа выпа­ дений шестерки в шестистах бросаниях равно 1/6 * 600 - 100.

Так как 125 > 100, в качестве альтернативной гипотезы при­ мем гипотезу На : р> 1/6. Критическая область — правосторон­ няя (рис. 8.5),

Число и находится из условия Р (г/ > н^) = а = 0,05. С дру­ гой стороны, Р(г1 > = Ф (« ) - Ф (и р = 0,5 - Ф (и^).

Отсюда Ф( а^ = 0,45 -* нкр= 1,65. Найдем число м1К(|.

166

Экспериментальное значение критерия больше критическо­ го, нулевая гипотеза отвергается в пользу альтернативной.

8.2, 1.3. П роверка гипот езы о значении мат емат ического

ожидания, когда дисперсия генеральной совокупности неизвестна

Когда объем выборки мал (и < 30), а дисперсия 1-снсральной со­ вокупности неизвестна, дня проверки нулевой гипотезы : я = а0 используют статистику:

5 Я

где* — выборочное среднее; Я — выборочное среднее квадра­ тическое отклонение; $ — исправленное выборочное среднее квадратическое отклонение.

Если нулевая гипотеза верна, случайная величина Г распре­ делена ло закону Стыодента с п - 1 степенями свободы.

Пример. По паспортным данным автомобильного двигателя расход топлива на 100 км пробега составляет 10 л. В результате изменения конструкции двигателя ожидается, что расход топ­ лива уменьшится. Для проверки были испытаны 25 случайно отобранных автомобилей с модернизированным двигателем. Средний расход топлива на 100 км пробега оказался равным

.V= 9,6 л. Исправленное выборочное среднее квадратическое от­ клонение расхода топлива равно 2 л. Можно ли утверждать, что изменение конструкции двигателя не повлияло на расход топ­ лива? Положить а = 0,05. Считать, что выборка произведена из нормальной генеральной совокупности.

Решение. Проверяется нулевая гипотеза а = 10 против альтернативной гипотезы Н%: а < 10. Если нулевая гипотеза вер­ на, то случайная величина;

5

имеет распределение Стьюдента с числом степенен свободы

п= 24. По таблице распределения Стьюдента, полагая а = 0,05

иг = 24, находим, что критическое значение в случае правосто­

16?

ронней критической области = 1,71. Так как график функции плотности всроятиости распределения Стьюдента симметричен

относительно нуля, для левосторонней критической области

Т = -1,71. Вычислим Т .

кр

л

эпл

 

гЭМЧ1

9,6 -1 0

 

725 = -1 .

 

 

2

Тжл> поэтому ист оснований считать, что новая конс­ трукция двигателя позволила уменьшить расход топлива.

Пример. В условиях предыдущего примера определить такое максимальное значение выборочного среднего, что при а - 0,05 нулевая гипотеза будет отверг нута,

Решение. Значение .г определяется из условия:

1.7'.

Отсюда Г <9,316.

Пример. Пусть теперь критическая область задастся ус­ ловием х < 9,47. Какова вероятность ошибки первого рода, если нулевая гипотеза Н0справедлива? (Полагаем, что 5 = 2).

Решение. Вероятность ошибки первого рода — это вероят­ ность того, что случайная величина:

т= 1 ^ 7 2 5 .

2

имеющая распределение Стьюдента с числом степеней свободы

г- 24, примет значение меньше, чем (9,47 - 10) * 2,5 = -1,32. По таблице распределения Стьюдента находим, что а = 0,1.

Это означает, что принятый критерий примерно 10% автомоби­ лей, имеющих расход топлива 10 л на 100 км пробега, отнесет к автомобилям, имеющим меньший расход топлива.

Пример. Группе школьников младших классов был дан стандартный тест на проверку скорости чтения. Затем со школь­ никами был проведен специальный курс занятий, после чего де­ тям был предложен второй тест. Скорость чтения оценивалась в баллах, результаты представлены в таблице:

168

Школьник

1

2

3

А

5

6

7

8

9

10

Результаты первого тестирования

7

5

6

&

3

8

7

8

2

4

Результаты второго тестирования

6

7

9

8

6

7

7

9

4

7

Можно ли сказать, что занятия по увеличению скорости чте­ ния эффективны? Предполагается, что оба теста эквивалентны по трудности, а оценки, полученные школьниками, можно счи­ тать нормально распределенными.

Решение. Рассмотрим выборку, варианты которой — разно­ сти баллов, получеЕшых каждым школьником до и после занятиП. Эта выборка такова:

Школьник

1

2

3

4

5

6

7

8

9

10

Рашости

-1

2

3

0

3

-1

0

1

2

3

Предположим, что упражнения нс влияют на скорость чте­ ния (нулевая гипотеза). Тогда полученную выборку следует считать выборкой из нормально распределенной генеральной совокупности со средним значением а = 0. Если же упражнения увеличивают скорость чтения (альтернативная гипотеза), то матсмалшеское ожидание а должно быть больше нуля. Значит, для проверки нулевой гипотезы нужно использовать статистику:

т= — ■&

•У которая, если верна нулевая гипотеза (а - 0), имеет распределе­

ние Стьюдента с числом степеней свободы г = 9. Найдем значе­ ния * к 5.

5 = (-1 + 2 + 3 + 0 + 3 - 1 + 0 - 1 + 2 + 3 )/1 0 = 1,2; + 4 + 9 + 9 + 1 + 1 + 4 + 9 ) /1 0 -1 ,2 2 = 3 ,8 -1 ,4 4 = 2,36;

$ = лД Зб"=1,54. 7 ^ = ^

= -^ -> < 3*2,34,

5

1,54

169

Положим а

= 0,05, тогда Г - 1,83.

Так как

следует признать, что средняя скорость

чтения у детей увеличилась.

8,2.2. П роверка гипотезы о равенстве математических ожиданий двух генеральных совокупно стой

Задача ставится так. Имеются две нормально распределен­ ные генеральные совокупности с параметрами аг и гг,2, а2 и о* соответственно. Из первой генеральной совокупности извлечена выборка объема пх>из второй — объема пг Требуется проверить нулевую лшотезу //„: аг = а2о равенстве средних значений этих генеральных совокупностей.

8.2.2.1. Случай, когдадисперсии а / п гг/ считаются известными

В этом случае для проверки нулевой гипотезы лрнмсЕнгют случайную величину: _ _

где х; и х}— выборочные средние.

Если верна нулевая гипотеза, статистика л имеет нормальное распределение со средним, равным нулю, и дисперсией, равной единице. Дисперсии считаются известными, когда п , н2 >30, тогда

Эту же статистику используют, проверяя гипотезу о равенс­ тве вероятностей «успеха». Объемы выборок и,, п2должны быть достаточно велики, чтобы биномиальное распределение можно было приближенно считать нормальным.

Пример. Двое рабочих на одинаковых станках изготовляют одинаковые детали. Есть ли значимая разница между долями выпускаемого ими брака? Была собрана следующая нн-

Алпиаико* п = 9ПП ^ = 19* « = ЭПП = IЯ П^ппжии п = 0.(15.

170