Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория вероятностей и математическая статистика. Прикладная статистика с использованием MS EXCEL

.pdf
Скачиваний:
8
Добавлен:
12.11.2023
Размер:
3.04 Mб
Скачать

3.Гипотезы об общем виде модели, описывающей статистическую зависимость между признаками.

4.Гипотезы о принадлежности некоторого признака к тому или иному классу.

Гипотеза называется параметрической, если предположения касаются значений параметров распределения, и непараметрической, если содержит предположение о виде закона распределения. Проверяемая гипотеза называется нулевой и обозна-

чается H0 . Нулевые гипотезы обычно утверждают, что разли-

чие между сравниваемыми величинами (параметрами или функциями распределения) отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями выборки.

Наряду с гипотезой H0 рассматривают одну из альтернативных гипотез Hi (i 1), конкурирующих с H0 в том смысле,

что если нулевая гипотеза отклоняется, то принимается альтернативная. Например, если проверяется гипотеза о равенстве параметра θ некоторому значению θ0 , то есть H0 : θ= θ0,

то в качестве альтернативной гипотезы можно рассмотреть одну из следующих:

H1 : θ ≠ θ0; H2 : θ> θ0; H3 : θ< θ0 ; H4 : θ= θ1 (θ1 ≠ θ0 ).

Выбор альтернативной гипотезы определяется конкретным содержанием задачи.

Простой называют гипотезу, содержащую только одно предположение, сложной – гипотезу, состоящую из конечного или бесконечного числа простых гипотез.

Пример. Для показательного распределения гипотеза Н0: λ = 2 – простая, Н0: λ > 2 – сложная, состоящая из бесконечного числа простых (вида λ = с, где с – любое число, большее 2).

Задача статистической проверки гипотезы состоит в том, чтобы сформулировать такое правило, которое позволяло бы по результатам наблюдений принять или отклонить эту гипотезу с доверительной вероятностью (надежностью)

81

Pд ≡β =1−α. Здесь α – вероятность противоположного события (гипотеза H0 верна, но ошибочно отклонена), ее называют

уровнем значимости, и она является мерой риска при отклонении основной гипотезы.

Решение принимается на основе выборки, поэтому необходимо выбрать подходящую выборочную статистику критерия K, являющуюся функцией наблюдаемых значений, точное

или приближенное распределение fH0 (k) которой известно.

Чаще всего в качестве критерия K используют случайные величины, имеющие рассмотренные в подразд. 1.2 распределения, которые полностью определяются объемами рассматриваемых выборок.

Введем основные определения, используемые при проверке статистических гипотез.

Статистическимкритерием(илипростокритерием) называют случайнуювеличину K, котораяслужитдляпроверкигипотезы.

Наблюдаемым (эмпирическим) значением или статисти-

кой критерия называют значение критерия Kнабл, которое

вычислено по выборке.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отклоняют.

Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых нулевую гипотезу принимают.

Критическими точками (границами) называют точки, отде-

ляющиекритическую областьотобласти принятиягипотезы. Для отыскания критической области задаются уровнем

значимости α и ищут критические точки (через квантили случайной величины K), зависящие от принятого значения α и вида критической области:

Левосторонней (рис. 3.1, а) называют критическую область, определяемуюнеравенством K < kкрлев, α, следующимизопределения

kα

P{K < kα = kкрлев, α} = fH0 (k) d k = α.

−∞

82

Правосторонней (рис. 3.1, б) называют критическую область, определяемую неравенством K > kкрправ, α , следующим из

определения

 

 

P{K > k1−α = kкрправ, α} =

fH0 (k)d k = α.

 

k1−α

 

Двусторонней (рис. 3.2) называют критическую область,

определяемую неравенствами

kкрлев, α/ 2 > K > kкрправ, α/ 2 , где крити-

ческие точки определяются выражениями:

P{K < kα/ 2 = kкрлев, α/ 2} = kα/2

fH0 (k)d k = α/ 2;

 

−∞

 

 

 

P{K > k1−α/ 2 = kкрправ, α} =

fH0 (k)d k = α/ 2.

 

k1−α/2

 

В частности, если критические точки симметричны отно-

сительно нуля kкрлев, α/ 2 = kкрправ, α/ 2

(например, случайная величина

K распределена по стандартному нормальному закону или по закону Стьюдента), то двусторонняя критическая область оп-

ределяется неравенством

 

K

 

> kкрправ, α/ 2 (в предположении, что

 

 

k

 

= kправ > 0).

1−α/ 2

 

кр, α

 

 

Положение критической области на множестве значений

статистики K зависит от формулировки альтернативной гипоте-

зы

H1.

Например, если проверяется гипотеза H0 : θ= θ0 , а аль-

тернативная гипотеза формулируется как H1 : θ > θ0 , то критическая область располагается справа от математического ожидания k0 статистики K и называется правосторонней (см. рис. 3.1, б). В этом случае критерий K также называется правосторонним. Для H1 : θ < θ0 имеем соответственно левостороннюю критическую область и левосторонний критерий (см. рис. 3.1, а).

Если

альтернативная гипотеза формулируется как

H1 : θ ≠ θ0 ,

то критическая область размещается по обе сторо-

83

ны от k0 и называется двусторонней (рис. 3.2). Соответствен-

но, и критерий K в этом случае называют двусторонним.

Основной принцип проверки статистических гипотез:

если наблюдаемое значение критерия Kнабл принадлежит кри-

тической области, то нулевую гипотезу отклоняют; если наблюдаемое значение критерия принадлежит области принятия гипотезы, то гипотезу принимают.

Критическая область – область отклонения гипотезы

fH0(k)

0 kα

Площадь = α

Область

 

 

 

 

 

 

 

принятия

 

Область

 

 

Критическая

гипотезы

 

принятия

 

 

 

 

 

область –

 

 

гипотезы

 

 

 

 

 

 

область

 

 

 

 

 

 

 

fH0 (k)

 

 

отклонения

 

 

 

 

гипотезы

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

k0

 

 

 

k

0

 

k1α

k0

 

 

 

Площадь = α

 

 

 

 

 

 

 

 

а б

Рис. 3.1. Определение области принятия гипотезы для левосторонней (а) и правосторонней критических областей (б)

Критическая

Область

Критическая

область –

принятия

область –

область

гипотезы

область

отклонения

 

отклонения

fH0 (k)

k

0

k

k

0

kk

/ 2

Площадь = α/2

kαα/2/ 2

 

11–αα/2

 

 

 

Площадь = α/2

Рис. 3.2. Определение области принятия гипотезы для двусторонней критической области

84

3.1. Правильные решения и ошибки, допускаемые при проверке статистических гипотез

При проверке статистических гипотез существует возможность принятия двух правильных решений:

1. Гипотеза H0 верна, и она принимается. Вероятность принять это решение равна вероятности β попадания статистики критерия Kнабл в область принятия гипотезы.

2. Гипотеза H0 неверна, и принимается альтернативная гипотеза H1.

Несмотря на их правильность, эти решения отличаются по смыслу и цене. Так, применительно к радиолокации в противовоздушной обороне ( H0 :{обнаружена цель}) в первом

случае при обнаружении цели объявляется тревога и принимаются меры по уничтожению цели, во втором случае не поднимается ложная тревога; применительно к производству ( H0 :{партия изделий удовлетворяет стандарту}) в пер-

вом случае принимается доброкачественная продукция, во втором – продукция не удовлетворяет стандарту и забракована; применительно к судебной системе ( H0 :{виноват преступ-

ник}) в первом случае будет осужден виновный, а во втором – отпущен на свободу невиновный подозреваемый.

Но при проверке гипотез всегда существует риск принятия двух ложных решений. Пусть выборочное значение статистики попадет в критическую область и в соответствии с критерием гипотеза H0 отклоняется. Если, тем не менее, эта гипо-

теза верна, то принимаемое решение ошибочно.

Ошибка, совершаемая при отклонении правильной нулевой гипотезы Н0, называется ошибкой первого рода. Очевид-

но, вероятность допустить ошибку первого рода равна вероятности попадания статистики критерия в критическую область, то есть равна уровню значимости α.

85

Ошибка второго рода происходит в том случае, если гипотеза H0 принимается, но она неверна, а верна в действи-

тельности альтернативная гипотеза Н1. Вероятность совер-

шения ошибки второго рода обозначим γ, ее можно вычислить

по формуле

γ = P{K < kα} = fH1 (k)d k,

kα

если критерий K левосторонний.

Вероятность противоположного события (правильного решения 2-го рода)

kα

P{K > kα} = fH1 (k)d k =1− γ

−∞

называется мощность критерия.

Предположим, что если верна гипотеза H0, то статистика K имеет распределение с плотностью fH 0 (k), а если верна ги-

потеза H1 , то fH1 (k). Тогда можно дать геометрическую интер-

претацию ошибок первого и второго рода (для левосторонней критической области она приведена на рис. 3.3). Из рисунка видно, что, уменьшая вероятность совершения одной ошибки, мы тем самым увеличиваем вероятность другой ошибки.

f H i ( k )

f H 1 (k )

fH 0 (k )

 

Площадь = α

Площадь = γ

 

 

0

 

K

 

 

Рис. 3.3. Вероятности ошибок первого и второго рода

86

Единственным способом одновременного уменьшения вероятностей ошибок первого и второго рода является увеличение объема выборки. Поэтому обычно при заданном уровне значимости α отыскивается критерий с наибольшей мощностью, чтобыуменьшитьвероятностьошибкивторогорода.

Схемы возможных вариантов по принятию решений удобно представить в виде табл. 3.1.

 

 

Таблица 3.1

 

 

 

Гипо-

Принятое решение, его вероятность

теза

Принята

Отклонена

H0

 

 

 

Верноерешениепервогорода,

Ошибка первого рода,

Верна

вероятность равна надежно-

вероятность равна уровню зна-

 

сти β: P{H0 | H0} =β =1−α

чимости α : P{H1 | H0} = α

Не-

Ошибка второго рода,

Верное решение второго рода,

вероятность γ:

вероятность равна мощности

верна

P{H0 | H1} = γ

критерия 1–γ: P{H1 | H1} =1− γ

 

 

 

Как же следует выбирать уровень значимости α статистических критериев?

Ответ на этот вопрос зависит от рисков и потерь, вызываемых ошибками первого и второго рода. В одних случаях считается возможным пренебречь событиями, вероятность которых меньше 0,05 ( α = 0,05 означает, что в среднем в 5 случаях из 100 испытаний верная гипотеза будет отвергнута), в других случаях, когда речь идет, например, о разрушении сооружений, гибели судна и т.п., нельзя пренебречь обстоятельствами, которые могут появиться с вероятностью, равной 0,001.

Последствия ошибок первого, второго рода могут быть совершенно различными: в одних случаях нужно минимизировать α, в другом – γ. Так, применительно к радиолокации го-

ворят, что α – вероятность пропуска сигнала, γ – вероятность ложной тревоги; применительно к производству мож-

87

но сказать, что α – риск поставщика – забраковка по выборке всей партии изделий, удовлетворяющих стандарту, γ – риск

потребителя – прием по выборке всей партии изделий, не удовлетворяющей стандарту; применительно к судебной системе ошибка первого рода приведет к оправданию виновного, ошибка второго рода – осуждению невиновного.

При этом необходимо также учитывать, что чем меньше уровень значимости α, тем труднее отклонить нулевую гипотезу. Поэтому не следует стремиться выбирать уровень значимости слишком малым и нельзя выбирать α = 0, т.к. будут приниматься все нулевые гипотезы, в том числе и неправильные, то есть с практической достоверностью будут допускаться ошибки второго рода.

Выбор уровня значимости α до некоторой степени произволен. Стало обычным выбирать в качестве α одно из стандартных значений: 0,005; 0,01; 0,05; 0,10. Это, однако, не означает, что нельзя выбирать, например, α = 0,02. Принятая стандартизация позволяла сократить объем таблиц критических значений (квантилей) статистических критериев, для существующих вычислительных средств этот фактор является несущественным.

Рассматриваемые здесь критерии значимости – это односторонне действующие критерии, т.к. с их помощью принимается (с заранее фиксированным риском) только одно решение: «Отклонить проверяемую нулевую гипотезу». Если же нет оснований отклонить нулевую гипотезу данным критерием, то утверждается, что данные выборки не противоречат выдвинутой гипотезе (согласуются с ней). Статистические критерии значимости не позволяют принять решение «нулевая гипотеза H0 является правильной», т.к. при применении указанных

критериев вероятность принятия ложной нулевой гипотезы остается неизвестной.

88

Практик-экспериментатор, как правило, хочет проверить, дают ли результаты эксперимента право отклонить нулевую гипотезу, с тем, чтобы принять вместо нее альтернативную, которую он отстаивает (новая технология производства, усовершенствование некоторого узла и т.д.). Доказательство истинности нулевой гипотезы (например, подтверждения эффективности старой технологии) его не интересует. Поэтому в большинстве случаев для практических приложений достаточно статистических критериев значимости, позволяющих только отклонять выдвинутую нулевую гипотезу с фиксированной малой вероятностью α совершения ошибки первого рода.

3.2. Проверка параметрических статистических гипотез

В соответствии с изложенным выше проверка параметрической статистической гипотезы при помощи критерия значимости (критерия, основанного на использовании заранее заданного уровня значимости) может быть разбита на следующие этапы:

1. Формулировка проверяемой ( H0 ) и альтернативной ( H1 ) гипотез;

2.Назначение уровня значимости α;

3.Выборстатистикикритерия K дляпроверкигипотезы H0;

4.Определение закона распределения fH0 (k) статистики

при условии справедливости гипотезы H0 ;

5. Определение вида критической области (левосторонняя, правосторонняя или двусторонняя);

6. Нахождение квантилей kα и k1−α или kα/ 2 и k1−α/ 2

в зависимости от вида критической области и определение критических точексконкретным указанием критической области;

7. Вычисление статистики критерия Kнабл по данным выборки;

89

8. Принятие решения о согласии опытных данных с нулевой гипотезой H0 (принятие ее, если Kнабл не лежит в критической области) или об отклонении выдвинутой гипотезы (если Kнабл лежит в критической области).

Критерии значимости для проверки гипотез о средних и дисперсиях нормально распределенной генеральной совокупности приведены в табл. 3.2–3.3. Необходимые для их использования числовые характеристики выборок, наблюдаемые значения критерия и квантили, определяющие границы критических областей, могут вычисляться в MS Excel с использованием техники вычислений, подробно рассмотренных в подразд. 1.2, 2.2.

Рассмотрим типичные примеры их использования. Пример 3.1. Техническая норма предусматривает в сред-

нем 40 с на выполнение определенной технической операции на автомобильном конвейере. От рабочих, занятых на этой операции, поступили сигналы, что они в действительности затрачивают на эту операцию больше времени. Для проверки произведены измерения времени выполнения этой технической операции у 16 рабочих и получены следующие результаты:

т = 42 с (среднее время выполнения операции);

 

1

n

s = σиспр =

(xi x)2 = 3,5 с.

 

 

n 1 i=1

Можно ли по имеющимся хронометрическим данным на уровне значимости α = 0,01 отклонить гипотезу о том, что действительное среднее время исполнения этой технической операции соответствует норме?

Решение. Из условия примера следует, что надо проверить нулевую гипотезу H0 : m = m0 = 40 с (техническая норма установлена верно) против альтернативной гипотезы H1 : m > 40 с (техническая норма установлена неверно). Для

проверки данной нулевой гипотезы применим t-критерий значимости с правосторонней критической областью (дисперсия неизвестна, см. второй критерий табл. 3.2).

90