Макарова Н.В. Статистика в Excel-1
.pdfфункция ZTECT
См. также НОРМРАСП, ДОВЕРИТ.
Синтаксис:
ZTECT (массив; х; сигма)
Результат:
Рассчитывает для определенного выборочного массива дан ных двустороннее Р-значение z-ntecma.
Аргументы:
•массив: массив данных, с которыми сравнивается х;
•X проверяемое значение;
•сигма: известное стандартное отклонение генеральной сово купности. Если этот аргумент опущен, то используется оценка ге нерального стандартного отклонения по выборке.
Замечания:
• если массив пуст, то функция ZTECT помещает в ячейку зна чение ошибки #Н/Д.
МатематикО'Статистическая интерпретация:
См. описание функций НОРМРАСП, ДОВЕРИТ
Функция ZTECT служит для проверки гипотезы о числовом значении средней (математического ожидания) нормального рас пределения при известной дисперсии.
Примечание. Если числовое значение стандартного отклонения гене ральной совокупности не известно, то в функции используется оценка стан дартного отклонения по представленной выборке {см. описание функции СТАНДОТКЛОН в подразд, 4.3).
Рассматривается случайная величина Jr = 7V(^, ^)ь причем чис ловое значение математического ожидания а не известно, а чис ловое значение дисперсии а^ известно.
Выдвигается гипотеза Щ о том, что среднее (математическое ожидание) равно числу ^о^ т. е. Яо : д = «о- ^ этом случае альтерна тивная гипотеза будет иметь вид Ну :а^а^.
В качестве критерия проверки гипотезы берется величина
которая при выполнении гипотезы подчиняется нормальному закону распределения с нулевым математическим ожиданием и единичной дисперсией, т. е.
200
г =х-г/л/^-а 1 -= ЛГ(0,1).
Пример 7.2. Результаты девяти выборочных замеров времени изготовления детали (мин) приведены в табл. 7.3, сформирован ной на рабочем листе Microsoft Excel.
|
|
Таблица 7.3 |
|
|
F |
|
|
23 |
Номер замера |
Время изготовления, |
|
мин |
|||
|
|
||
24 |
|
44 |
|
25 |
|
48 |
|
26 |
|
50 |
|
27 |
|
46 |
|
2S |
|
50 |
|
29 |
|
46 |
|
30 |
|
47 |
|
31 |
|
51 |
|
32 |
|
50 |
Предполагается, что время изготовления — нормально распре деленная случайная величина. На уровне значимости а - 0,05 тре буется решить:
1)можно ли принять 50 мин в качестве нормативного времени (математического ожидания) изготовления детали?
2)можно ли принять за норматив 49 мин?
Для варианта 1 проверяется статистическая гипотеза Щ:а^ — = 50 мин, а для варианта 2 - гипотеза Щ'.а^^ 49 мин.
Расчетные показатели для проверки выдвинутых гипотез при ведены в табл. 7.4.
201
Таблица 7.4
23
24
25
26
27
28
29
30
31
32
33
34
35
itiiiiiiiMuiii iiYmimw|-|i)-irt.<ifiWtt»ft<*ftfi1''ii'ini[iiri»i
Номер замера |
Время изготовления, |
|
мин |
||
|
||
|
44 |
|
|
48 |
|
|
50 |
|
|
46 |
|
|
50 |
|
|
46 |
|
|
47 |
|
|
51 |
|
|
50 |
|
Среднее |
|
|
Оценка стандартного |
2,40 |
|
отклонения |
||
|
Зй |
Z критические дву |
-1,96 |
|
сторонние |
|||
|
|
•liili |
Z расчетное {а^ = 50) |
-2,50 |
|
||
т. |
Z расчетное (А^ = 49) |
-1,25 |
|
|
|
39 |
|
|
|
Z расчетное (а^^ = 50) с |
|
40 г ! |
помощью функции |
-2,50 |
|
ZYECT |
|
|
Z расчетное (а^ = 49) с |
-1,25 |
41 |
I помощью функции |
|
|
ZTECT |
|
202
Содержимое ячеек в табл. 7.4:
•массив G24:G32 содержит исходные данные задачи;
iячейка G33 содержит формулу =CP3HA4(G24:G32) - рас считывается среднее значение выборки;
•ячейка G34 содержит формулу =CTAfiaOTKJIOH(G24:G32) - оценивается стандартное отклонение по выборке;
•ячейка G36 содержит формулу =НОРМСТОБР(0,05/2) - вы числяются критические точки и тем самым задается критическая область (-оо; -1,96) и (1,96; Н-оо);
•ячейки G37 и G38 содержат соответственно формулы =(G33— -~50)/G34*3 и =(G33-49)/G34*3, которые вычисляют рас четные значения ^-критерия для гипотез Щ \ ах — 50 мин и
HQIUX- 49 мин (здесь 3 = Vn = V9, w=9 - объем выборки);
• ячейки G40 и G41 содержат соответственно форму лы =HOPMCTOBP(1-ZTECT(G24:G32;50)) и -НОРМСТОБР (1—ZTECT(G24:G32;50)), которые вычисляют расчетные значе ния ^-критерия с использованием функции ZTECT, рассчитываю щей вероятностные значения z-теста.
Примечание, В постановке задачи не приведена информация о значении генерального стандартного отклонения, поэтому при решении использова лась оценка генерального стандартного отклонения по представленной вы борке.
При проверке гипотезы HQ: ах- 50 мин расчетное значение критерия Zp = -2,50 попадает в критический интервал (—оо; -1,96), поэтому данная гипотеза отвергается, а принимается аль тернативная гипотеза Ну: ах- 48 мин (среднее значение, вычис ленное по представленной выборке). Или, иначе говоря, 50 мин нельзя считать нормативным временем изготовления детали и за норматив берем 48 мин.
При проверке гипотезы Щ: ах~ 49 мин расчетное значение критерия Zp = -1,25 не попадает в критическую область (—оо; -1,96) U (1,96; Н-оо), поэтому данная гипотеза не отвергается, т.е. за норматив времени изготовления детали берем 49 мин.
Заметим, что функция ZTECT аналогична функции НОРМРАСП при условии, что в качестве аргумента а используется ар гумент ц, выражающий стандартное отклонение выборочной средней от генеральной средней и получивший название средней
203
ошибки выборки {см. описание функции ДОВЕРИТ в подразд. 6.3.1).
Зная, что а
можно вывести формулу
Т\ЪС\{массив, х) = НОРМРАСП
=НОРМРАСП гyjri{x-x)
Пример 7.3. В массив НЗ:Н12 введены следующие значения случайной величины Х{4; 3; 5; 8; 12; 8; 6; 10; 3; 5}. Тогда функция =ZTECT(H3:H12;7) рассчитает значение 0,735. Это же значение вычислит и функция =НОРМРАСП(7;Н14;Н15/Н16;1), если:
• ячейка Н14 содержит формулу =СРЗНАЧ(НЗ:Н12), которая определяет значение выборочной средней;
•ячейка Н15 содержит формулу =СТАНДОТКЛОН(НЗ:Н12), которая оценивает значение генерального стандартного отклоне ния по представленной выборке;
•ячейка Н16 содержит формулу =КОРЕНЬ(10), которая рас считывает значение квадратного корня из размера выборочной совокупности, т.е. Vw.
ГЛАВА8
Двухвыборочный f-тест
с одинаковыми и различными дисперсиями
8.1.
Краткие сведения из теории статистики
В главе 7 была рассмотрена процедура проверки гипотезы о равенстве средних (математических ожиданий) двух нормальных распределений с известными дисперсиями.
204
Настоящая глава посвящена процедурам проверки гипотез о равенстве средних (математических ожиданий) двух нормальных распределений с неизвестными тсперсиями. Причем относитель но параметров aj- и ау^ можно вьщвинуть следующие два предпо ложения:
1) обе дисперсии неизвестны, но предполагается, что они рав ны между собой (аJ = а^);
2) обе дисперсии неизвестны, их равенство не предполагается
В случае когда обе дисперсии неизвестны, но предполагаются равными между собой, имеем дело с двумя оценками 8^-= s^ одной и той же величины дисперсии с\ = ау^. В связи с этим разумно перейти к объединенной оценке а^:
В математической статистике доказывается, что если гипотеза Щ\ах- лJ.выполняется, то величина
V/z т
имеет распределение Стьюдента с k-n-^m-l степенями сво боды, X е.
^ ^ =/(Jk = /z + m-2).
4 1
+ —
т
Величину i и используют в качестве критерия при проверке ги потезы Щ: ах~с1у
Кота дисперсии неизвестны и их равенство не предполага ется (a|^9t оу), используется аналога-статистики {см, подразд. 7.2) с заменой неизвестных дисперсий их оценками
205
Ил
т
В этой ситуации указать точное распределение введенной ста тистики затруднительно. Известно, однако, что это распределе ние близко к распределению Стьюдента с числом степеней свобо ды, равным
л-1 m-1
Последний статистический критерий (при сх' ^ сгу^) называ ют также критерием Фишера^-Беренса. Данный критерий не часто применяют на практике, потому что, даже когда неизвестные дисперсии a j и ajr существенно различны, предположение, что они на самом деле равны, дает результаты, довольно близкие к получаемым по этому критерию, но при гораздо меньшем объеме вычислений.
Примечание. Строго говоря, описанные выше критерии применимы только к выборкам, извлеченным из нормальной генеральной совокупности. Вместе с тем специальные исследования показали, что /-критерий является (особенно при больших объемах выборок л) весьма устойчивым по отношению к отклонениям исследуемых генеральных совокупностей от нормаль ных. А это значит, что он может применяться и к выборкам из негауссовских генеральных совокупностей с той лишь оговоркой, что истинные значения уровня значимости и мощности критерия в этом случае будут незначительно отличаться от заданных.
8.2.
Справочная информация по технологии работы
Режимы работы «Двухвыборочный /-тест с одинаковыми дис персиями» {гомоскедастический тест) и «Двухвыборочный /-тест
с различными дисперсиями» {гетероскедастический тест) служат
206
для проверки гипотез о различии между средними (математичес кими ожиданиями) двух нормальных распределений соответст венно с неизвестными, но равными дисперсиями {ах=<У'у) и с не известными дисперсиями, равенство которых не предполагается
В диалоговых окнах данных режимов (рис. 8.1 и 8,2) задаются параметры, аналогичные параметрам, задаваемым в диалоговом окне Двухвыборочный z-тест для средних {см, рис. 7.1), только от сутствуют поля Дисперсия переменной 1 {известная) ц Дисперсия « ременной 2 {известная).
Двухвыборочный t-тесг с одинаковыми дисперсиймм
^|^ЩнШ4ЭМ№
Ошотетнческая средняя радость:
Гае;тки
i й/ьфа; 0,05
1 :Г' Вшпдной интервал;:
1 • <• , Новый рабочж т:г1 \ С Новая рабочая книга
Рис. 8л
Пример 8.1. Выборочные данные о расходе сырья при произ водстве продукции по старой и новой технологиям приведены в табл. 8Л, сформированной на рабочем листе Microsoft Excel [5].
При уровне значимости а = 0,05 требуется проверить гипоте зу Щ: ах— ау, предположив, что соответствующие генеральные совокупности Xvi Fимеют нормальные распределения:
1)с одинаковыми дисперсиями ох и а\\
2)с различными дисперсиями а^ и с\.
207
Дв«)хвы6орочный t-TecT с различными дисперсиями
: :6:шдные ^i^i^bie' |
:•-. - - |
|
?;iM;UeM^v:'fe/..-M| |
:^^-^^;<ж1:й>>га |
||
^ Интервал п^^еннои 1: |
|
|
|
|||
Интервал переменяй 2: |
|
|
|
Отмена!Д |
||
С^ютетическая средняя размскгтьг |
|
|
QTpawcaJ |
|||
|
|
|
||||
Г' |
йетки" •' |
|
|
|
|
|
гnapawerpfci 1й>юода -—— |
|
|
|
|
||
I ^ |
^№дной жтервая; |
|
|
|
|
|
I ^ ^ |
Иоеый рабочий лист; |
|
|
|
|
|
! ^Ноеая рабочая igiHra |
|
|
|
|
||
|
|
|
Рис. |
8.2 |
|
|
|
|
|
:-:Ь^':\:.":^Д:;[-.Т-'"''^ |
Табл;<ца 8.1 |
||
|
'••'";;::" с;"-:-:;-:.-^- |
Щл^^1^,"лЩ |
||||
|
|
|
|
|
||
|
Номер изделия |
Старая |
|
Новая |
||
|
технология |
технология |
||||
|
|
|
||||
|
|
1 |
|
308 |
|
308 |
|
|
2 |
|
308 |
|
304 |
|
|
3 |
|
307 |
|
306 |
|
|
4 |
|
308 |
|
306 |
|
|
5 |
|
304 |
|
306 |
|
|
6 |
|
307 |
|
304 |
|
|
7 |
|
307 |
|
304 |
|
|
8 |
|
308 |
|
304 |
|
|
9 |
|
307 |
|
306 |
|
|
10 |
|
|
|
304 |
|
|
II |
|
|
|
303 |
|
|
12 |
|
|
|
304 |
|
'^^Ш^& |
13 |
|
|
|
303 |
208
Для проверки предположения 1 используем режим работы «Двухвыборочный /-тест с одинаковыми дисперсиями», а для про верки предположения 2 - «Двухвыборочный /-тест с различными дисперсиями». Значения параметров, установленных в одноимен ных диалоговых окнах, представлены на рис. 8.3 и 8.4, а рассчитан ные в этих режимах показатели — в табл. 8.2 и 8,3 соответственно.
Двчхвыборочный t'TGcr с одинакобыми дисперсиями
i Интереал пщ>ененнт 2; |
|$Е$17:$Е$30 |
: г-Пара^петры вывода
Новый рабочий лкх;
Щ^ Новая рабо'чая KHi^a
Рис. 8.3
Таблица 8.2
^Ш^Я
Двухвыборочный t-тест с одинаковыми дисперсиями
|
Старая |
Новая |
|
технология |
технология |
Среднее |
307,11 |
304,77 |
Дисперсия |
1,61 |
2,19 |
Наблюдения |
|
13 |
Объединенная дисперсия |
,96 |
|
209