Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория вероятностей и математическая статистика. Прикладная статистика с использованием MS EXCEL

.pdf
Скачиваний:
8
Добавлен:
12.11.2023
Размер:
3.04 Mб
Скачать

= 2 * МИН(ZTEСT(массив; m0 ; сигма), 1 – ZTEСT (мас-

сив; m0 ; сигма)).

Задаваемые аргументы:

массив – массив или интервал данных, с которыми сравнивается m0;

m0 – проверяемое значение;

сигма – известное стандартное отклонение генеральной совокупности. Если этот параметр опущен, то используется стандартное отклонение выборки.

Рис. 3.4. Меню функции ZТЕСТ

Если параметр сигма не опущен, функция ZТЕСТ вычисляется следующим образом:

ZTECT(массив; m ; сигма) =1− НОРМСТРАСП x m0 ,

0 σ / n

а если параметр сигма опущен, то

ZTECT(массив; m0 ) = 1

− НОРМСТРАСП

x m0

 

,

 

 

s / n

 

 

где σ = сигма; s = СТАНДОТКЛОН (массив) – выборочное среднеквадратичное отклонение; n = СЧЕТ (массив) – число наблюдений.

101

Пример 3.6. По паспортным данным автомобильного двигателя расход топлива на 100 км пробега составляет 10 л. В результате изменения конструкции двигателя ожидается, что расход топлива уменьшится. Для проверки проведены испытания 25 случайно отобранных эксплуатирующихся автомобилей с модернизированным двигателем, получены следующие результаты:

10,9

8,3

8,4

8,6

10,2

8,5

10,1

8,5

8,3

9,1

8,2

10,4

11,0

10,2

9,6

8,4

9,3

9,5

8,5

10,5

10,1

10,8

8,8

8,3

10,5

 

 

 

 

 

Предполагая, что выборка получена из нормально распределенной генеральной совокупности, проверить гипотезу о том, что изменение конструкции двигателя не повлияло

на расход

топлива.

Уровень значимости принять рав-

ным 0,05.

 

 

Решение. Согласно условию, нужно проверить нулевую

гипотезуH0 : m = m0,

m0 =10 л/100 км при альтернативной ги-

потезе H1 : m < m0. Вычислим числовые характеристики выбор-

ки с помощью

инструмента «Описательная

статистика»

(см. примеры 2.3,

2.10): в ячейку А1 таблицы

MS Excel

(см. рис. 3.5) вводим название случайной величины «Расход»;

вдиапазон А2:А26 – полученные экспериментальные данные;

вменю «Сервис» → «Анализ данных» → «Описательная статистика» задаем соответствующую информацию и получаем результаты, представленные на рис. 3.5 в ячейках С2:D17.

Выборочное среднее расхода топлива по результатам испытаний составило x = 9,4 л/100 км. В ячейке С20 вычисля-

ем

(см. рис. 3.4)

значение функции ZТЕСТ(A2:A26;10) =

= 0,998885468, которое равно вероятности события P{ x

< m0 } =

=

P{Н1}, то есть

соответствует альтернативной

гипотезе

H1 : m < m0. Вероятность противоположного события P{ x m0 } = = 1 – 0,998885468 = 0,001114532 < α = 0,05, следовательно, ос-

новная гипотеза отклоняется в пользу альтернативной, то есть

102

изменение конструкции двигателя повлияло на расход топлива в сторону его уменьшения. Естественно, что в рассмотренном случае ZТЕСТ(A2:A26;9.4) = 0,5.

Рис. 3.5. Результаты вычисления числовых характеристик и функции ZТЕСТ

103

Если в качестве альтернативной гипотезы принятьH2 : m m0, то имеем двустороннюю критическую область и вероятность выполнения основной гипотезы H0 : m = m0,

равную P{H0} = P{x =10} = 2 * МИН(ZTEСT(А2:А26; 10), 1 – ZTEСT(А2:А26; 10)) = 0,002229065 < α = 0,05. Следовате-

льно, основная гипотеза также отклоняется в пользу альтерна-

тивной. В этом случае возможным

вариантом является

не только интересующее нас событие x

< m0, но и вариант воз-

можного ухудшения экономичности двигателя x > m0.

Контрольная проверка по 2-му критерию табл. 3.2 также дает отклонение основной гипотезы при обеих вариантах альтернативных гипотез, т.к. имеем:

tα; n1 = t0,05; 24 = –1,71; t1−α/ 2; n1

= t0,975; 24 = 2,064;

T

=

m

m

=

9,4 10

≈ −3,058;

 

0

 

 

 

 

 

 

 

 

 

 

набл

 

s /

n

 

 

0,9811/

25

 

 

 

 

 

 

Tнабл

< −1,71;

 

Tнабл

 

> 2,064.

 

 

 

 

ТТЕСТ (массив1; массив2; хвосты; тип) – возвращает вероятность, соответствующую критерию Стьюдента. Функция ТТЕСТ используется, чтобы определить, насколько вероятно, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же среднее.

Задаваемые аргументы:

массив1 – первое множество данных; массив2 – второе множество данных;

хвосты – число учитываемых «хвостов» распределения. Если хвосты = 1, то функция ТТЕСТ использует одностороннюю критическую область. Если хвосты = 2, то функция ТТЕСТ использует двустороннюю критическую область;

тип – вид исполняемого t-теста:

104

Тип

Выполняемый тест

1Парный (массив1 и массив2 имеют одинаковое число точек данных)

2Двухвыборочный с одинаковыми дисперсиями (гомоскедастический)

3Двухвыборочный с различными дисперсиями (гетероскедастический)

Парный двухвыборочный t-тест Стьюдента используется для проверки гипотезы о различии средних для двух выборок данных. В нем не предполагается равенство дисперсий генеральных совокупностей, из которых выбраны данные. Парный тест используется, когда имеется естественная парность наблюдений в выборках, например, когда генеральная совокупность тестируется дважды – до и после эксперимента.

Например, формула = ТТЕСТ(A2:A10;B2:B10;2;1) возвращает вероятность, соответствующую парному критерию Стьюдента сдвухсторонней критической областью для двух выборок с объемами9, представленныхвдиапазонахA2:A10, B2:B10.

Двухвыборочные тесты с одинаковыми и различными дисперсиями в основном соответствуют определениям критериев 3, 4 табл. 3.2.

Все указанные типы для статистической функции ТТЕСТ имеют свои отличающиеся по представлению результатов аналоги среди инструментов меню «Сервис» → «Анализ данных».

Пример 3.7. Имеется два одинаково настроенных станкаавтомата (дисперсии размеров одинаковы). Из продукции каж-

дого станка

извлечены

малые

выборки с объемами

n1 =10, n2 =12

со следующими результатами измерения кон-

тролируемого размера, в мм:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1i

103,4

 

103,5

 

103,7

103,9

 

 

n1i

2

 

3

 

4

1

 

 

x2i

103,2

 

103,4

 

103,6

 

 

 

n2i

2

 

2

 

8

 

 

 

 

 

 

 

 

 

105

Предполагая, что случайные величины Х1 и Х2 распределены по нормальному закону, проверить гипотезу о равенстве средних H0 : m1 = m2 при альтернативной гипотезе H1 : m1 m2 для уровня значимости α = 0,025.

Решение. В ячейку А1 таблицы MS Excel вводим название Х1; в ячейку В1 – Х2; в диапазон А2:А11 – значения x1i , по-

вторяя копированием каждое значение n1i раз; аналогично в В2:В13 – значения x2i .

Входим в меню «Сервис» → «Анализ данных» → «Двухвыборочный t-тест с одинаковыми дисперсиями» и задаем данные в его меню (рис. 3.6):

Рис. 3.6. Двухвыборочный t-тест с одинаковыми дисперсиями

Результат выполнения этого теста представлен на рис. 3.7,

где

Объединенная дисперсия =

(n

1

1)s2

+ (n

2

1)s2

 

 

 

 

1

 

2

 

106

 

 

 

 

 

 

 

 

(n1 + n2 ), несколько отличается от осредненной дисперсии σ2

для 4-го критерия табл. 3.2, df – число степеней свободы, t-статистика – наблюдаемое значения критерия Tнабл , P(T<=t)

одностороннее – вероятность события {Tнабл < kкрправ, α = t кри-

тическое одностороннее}, P(T<=t) двухстороннее – вероятность события {Tнабл < kкрправ, α = t критическое двухстороннее}.

Рис. 3.7. Результаты выполнения двухвыборочного t-теста с одинаковыми дисперсиями

Событие {

 

T

 

= 1,448 < kправ

= t критическое двухсто-

 

 

 

 

набл

 

кр, α

 

роннее = 2,423} осуществляется с вероятностью 0,163, большей, чем уровень значимости α = 0,025, основная гипотеза H0 : m1 = m2 принимается, то есть средние значения выборок не различаются.

107

Эта гипотеза принимается и при альтернативной гипотезе H2 : m1 > m2, т.к. с вероятностью 0,0815 > 0,025 осуществляется

событие {Tнабл = 1,448 < kкрправ, α = t критическое одностороннее =

= 2,086}.

При использовании вызова функций ТТЕСТ (рис. 3.8) имеем изрезультатоврис. 3.7 толькосоответствующиевероятности:

ТТЕСТ(A2:A11;B2:B13;1;2) = 0,081499; ТТЕСТ(A2:A11;B2:B13;2;2) = 0,162999.

Поэтому использование статистических инструментов MS Excel для проверки гипотез чаще всего предпочтительнее по сравнению с использованием соответствующих статистических функций.

Рис. 3.8. Задание аргументов функции ТТЕСТ для двухвыборочного t-теста с одинаковыми дисперсиями

ФТЕСТ (массив1; массив2) – возвращает одностороннюю вероятность того, что дисперсии аргументов массив1 и массив2 различаются несущественно. Эта функция используется для того, чтобы определить, имеют ли две выборки различные дисперсии (различные уровни разнородности).

108

Задаваемые аргументы (выборочная дисперсия первого массива должна быть больше выборочной дисперсии второго массива,

s12 > s22 ):

массив1 – это первый массив, или интервал данных; массив2 – это второй массив, или интервал данных. Пример 3.8. Для выборок примера 3.7 проверить гипотезу

о равенстве дисперсий H0 : σ12 = σ22 при альтернативной гипотезе H1 : σ12 > σ22 для уровня значимости α = 0,05, предполагая,

что случайные величины Х1 и Х2 распределены по нормальному закону.

Решение 1. В ячейку D2 таблицы MS Excel при заданных значениях переменных Х1 и Х2 (см. рис. 3.8) вводим формулу ФТЕСТ (А2:А11; В2:В13) = 0,925989445.

Решение 2. Входим в меню «Сервис» → «Анализ данных» → → «Двухвыборочный F-тест для дисперсии» и задаем данные в его меню (аналогично рис. 3.5, но в качестве первой выборки нужно указывать выборку с максимальной дисперсией).

Результат выполнения этого теста представлен на рис. 3.9, где F – наблюдаемое значения критерия Fнабл, P(F<=f) одностороннее

вероятностьсобытия{Fнабл < F}. Таккак Fнабл = 1,047 < kкрправ, α = F

Рис. 3.9. Результаты вычисления функции ФТЕСТ и двухвыборочного F-теста для дисперсии

109

критическое одностороннее = 2,896 (или α = 0,05 < P(F<=f)

одностороннее = 0,463) гипотеза H0 : σ12 = σ22 принимается с уровнем значимости α = 0,05.

Сравнение результатов вызова функции ФТЕСТ (А2:А11; В2:В13) и инструмента «Двухвыборочный F-тест для дисперсии» показывает, что полученное значение функции равно удвоенному значению P(F<=f) одностороннее и затруднительно для интерпретации – еще один аргумент в предпочтительности использования инструментов, а не функций (вероятна ошибка программного русифицированного продукта MS Excel в вычислении или в описании функции ФТЕСТ).

3.4. Проверка непараметрических статистических гипотез

При обработке результатов эксперимента над случайной величиной экспериментатор по выборке подбирает теоретиковероятностную модель (нормальную, показательную, биномиальную и т.д.).

Предположим, что по виду гистограммы или полигона частот или из каких-либо других соображений выдвинута гипотеза относительно общего вида функции распределения наблюдаемой случайной величины, то есть гипотеза вида H0 : F (x) = F0 (x) или H0 : F (x) Ω где Ω – класс функций распределения определенного вида (нормальных, показательных, биномиальных и т.д.).

Такую гипотезу называют нулевой непараметрической гипотезой. Гипотетическая функция распределения может быть определена полностью либо с точностью до параметров. В последнем случае по данным выборки может быть произведена точечная оценка неизвестных параметров. Но как бы хорошо ни была подобрана теоретическая кривая распределения,

110