Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теория вероятностей и математическая статистика методические указа

..pdf
Скачиваний:
15
Добавлен:
15.11.2022
Размер:
902.61 Кб
Скачать

2.2. Проверка статистических гипотез

Важнейшим разделом математической статистики является проверка статистических гипотез.

Статистической называют гипотезу о виде неизвестного закона распределения, или о параметрах известных распределений случайной величины. Например, статистическими будут гипотезы: а) долговечность рассматриваемых деталей подчиняется нормальному закону распределения; б) дисперсии температур, полученные при одинаковых условиях в двух различных термостатах, равны между собой.

Выдвинутая гипотеза называется нулевой (основной). Выдвинутая гипотеза может быть правильной или неправильной, и поэтому возникает необходимость ее статистической проверки. Для проверки статистической гипотезы используют специально подобранную случайную величину K (критерий согласия), распределенную по некоторому закону. Из опытных данных находят наблюдаемое значение Kн. Из специальных таблиц находят критическое значение Kкр. Если Kн < Kкр, то выдвинутая гипотеза (например, гипотеза о нормальном законе распределения) принимается; если Kн > Kкр, выдвинутая гипотеза отвергается.

Следует заметить, что условие Kн < Kкр совсем не означает, что выдвинутая гипотеза доказана и является единственно верной; это означает лишь то, что гипотеза не противоречит опытным данным.

Критерии проверки гипотезы о предполагаемом законе распределения называются критериями согласия. Имеется несколько критериев согласия: Пирсона, Колмогорова, Смирнова и др. Наиболее часто используется критерий Пирсона.

Критерий согласия Пирсона χ2 (хи квадрат)

Критерий согласия χ2 имеет наибольшее применение при

проверке согласования теоретического и эмпирического законов распределения случайной величины. Наблюдаемое значение критерия вычисляется по формуле

61

2

r

(ni ni)2

,

(2.1)

χн

=

ni

 

i=1

 

 

где r – число интервалов, на которые разбиты исходные опытные данные;

ni – число опытных данных, попавших в i-й интервал;

ni– теоретическое число, попавшее в i-й интервал, находится по формуле

xi+1

ni′ = n P(xi < x < xi+1 ) = n f (x)dx,

xi

где n – объем выборки.

В случае нормального закона

n′ = n

Ф

xi+1 x

 

Ф

xi x

 

,

 

 

 

i

 

 

S

 

 

 

 

 

S

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ф(x) =

 

1

 

x

t2

 

 

 

 

 

 

e

2 dt.

 

 

 

 

2π

 

 

 

 

 

 

 

 

0

 

 

 

 

 

В случае показательного закона

xi+1

ni′ = n λe−λxdx = n(e−λxi e−λxi+1 ).

xi

(2.2)

(2.3)

В случае равномерного закона распределения

xi+1

dx

 

x

i+1

x

i

 

ni′ = n

 

= n

 

 

.

b a

 

b a

 

x

 

 

 

 

i

 

 

 

 

 

 

 

При практическом использовании критерия согласия χ2 необходимо учесть следующие замечания:

1. Число опытных данных при использовании критерия χ2

должно быть достаточно большим: n 100 (критерий справедлив при n → ∞ ).

62

2.Рекомендуется иметь в каждом интервале не менее 5–10 на-

блюдений ni. Если ni в отдельных интервалах очень малы, следует объединить интервалы в один, суммируя частоты. В соответствии

сэтим число исходных интервалов должно быть уменьшено.

3.Уровень значимости α – вероятность ошибки первого рода, т.е. вероятность ошибки отвергнуть выдвинутую гипотезу, когда в действительности она верна. Чаще всего берут α = 0,05, но встречаются и другие уровни значимости.

4.χ2-распределение зависит от числа степеней свободы, это число находится по формуле

k = r 1l,

где r – число интервалов, на которыеразбиты статистические данные; l – число параметров предполагаемого теоретического закона, использованных для вычисления теоретических частот и оцени-

ваемых по выборке.

Если предполагаемое распределение нормальное, то по выборке оценивают два параметра (a, σ), поэтому число степеней

свободы k = r 3. Таким же будет число степеней свободы в случае равномерного законараспределения(оцениваемыепараметры– а иb). В случае показательного закона распределения по выборке оценивают один параметр, следовательно, в этом случае k = r 2.

5.По заданному уровню значимости α и числу степеней свободы k из таблицыраспределения χ2 (прил. 5) находятзначение χкр2 .

6.Если χн2 < χкр2 , то гипотеза о виде закона не отвергается.

63

2.3.Методические указания к выполнению расчетной работы

2.3.1.Проверка гипотезы о нормальном распределении генеральной совокупности

1.По данной выборке построить эмпирическое распределение

ввиде последовательности равноотстоящих вариант и соответствующих им частот, для чего:

а) упорядочить выборку по возрастанию, найти xmin и xmax;

б) весь интервал, в который попали опытные данные, разбить

на r частичных интервалов (xi; xi+1) одинаковой длины. Для определения длин частичных интервалов рекомендуется формула

x = xmax xmin .

1+ 3,3lgn

За длину частичного интервала принимается некоторое удобное число, ближайшее к полученному значению x. Границы интервалов выбираются так, чтобы результаты измерений не совпали с границами интервалов. Начало первого интервала сдвинуть влево от значения xmin (например, взять xmin – 0,5);

в) для каждого частичного интервала (xi; xi+1) найти ni – сумму частот вариант и считать, что ni сосредоточено в середине i-го ин-

тервала, т.е. взять xicp = xi +2xi+1 .

2.Построить гистограмму частот.

3.Найти выборочную среднюю x и выборочное среднее

квадратическое отклонение S по формулам

x = 1 r xiср ni ,

n i=1

(2.4)

 

1

 

r

.

S =

 

xi2ср ni n x 2

 

 

n 1 i 1

 

 

 

 

=

 

4. Найти теоретические частоты ni, попавшие в i-й интервал, по формуле (2.2).

64

5. Вычислить наблюдаемое значение критерия χн2 по фор-

муле (2.1).

6. По таблице χ2-распределения при уровне значимости α = = 0,05 и числе степеней свободы k найти критическое значение χкр2

(см. прил. 5).

7. Сравнить два значения χн2 и χкр2 . Если χн2 ≤ χкр2 , то нулевая

гипотеза не отвергается, т.е. в этом случае отклонения от предполагаемого теоретического закона считаются незначительными. Если

χн2 > χкр2 , то нулевая гипотеза отвергается.

Задача 2.1. Контролировался диаметр у 150 цапф передней оси, изготовленных на токарном станке. В результате были получены следующие значения положительных отклонений в микронах (мк) от номинального размера 20 мк:

48

39

43

36

39

34

32

48

46

37

25

31

34

36

35

37

45

49

49

44

43

46

34

48

43

36

41

34

42

35

38

40

46

34

39

41

38

39

36

42

30

43

41

39

37

33

35

42

45

43

37

42

38

40

34

39

32

40

39

37

43

30

44

45

37

34

49

41

51

32

37

30

50

32

32

35

45

42

41

48

43

45

44

46

42

39

41

38

31

32

40

52

45

47

35

45

33

38

36

40

44

52

44

34

44

44

43

43

40

30

32

42

49

39

42

43

48

41

43

42

40

48

35

42

44

44

34

33

48

51

44

50

47

34

33

33

40

46

50

43

44

50

40

40

35

35

41

42

42

47

Проверить соответствие нормального закона распределения с опытными данными по критерию Пирсона при уровне значимо-

сти α = 0,05 .

65

Решение:

1. Случайную величину (отклонения от номинального разме-

ра) обозначим как Х.

 

примера находим xmin = 25 мк,

Из выборки

приведенного

xmax = 52 мк .

 

 

 

Вычисляем:

x =

52 25

= 3,3 мк.

1+ 3,3lg150

Возьмем длину частичного интервала 3,0 мк. Левый конец первого интервала возьмем 24,5 мк. Из данной выборки найдем число опытных данных, попавших в каждый частичный интервал.

Полученные данные сведем в табл. 2.1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

xi xi+1

 

ni

 

Номер

 

 

xi xi+1

 

 

 

 

 

ni

1

 

 

24,5–27,5

 

1

 

6

 

39,5–42,5

 

 

 

 

30

 

2

 

 

27,5–30,5

 

4

 

7

 

42,5–45,5

 

 

 

 

29

 

3

 

 

30,5–33,5

 

13

 

8

 

45,5–48,5

 

 

 

 

16

 

4

 

 

33,5–36,5

 

23

 

9

 

48,5–51,5

 

 

 

 

10

 

5

 

 

36,5–39,5

 

22

 

10

 

51,5–54,5

 

 

 

 

 

 

2

 

 

2. Для каждого частичного интервала найдем

x :

x

i

 

 

=

xi + xi+1

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

cp

 

 

cp

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычислим значения

x и S по формулам (2.4);

расчеты поместим

в табл. 2.2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

x x

xi

 

n

 

x2

 

 

xi ni

 

 

 

 

 

x2

n

 

 

 

i i+1

 

ср

 

i

 

iср

 

 

ср

 

 

 

 

 

iср

i

1

 

 

24,5–27,5

26

 

1

 

676

 

 

26

 

 

 

676

 

2

 

 

27,5–30,5

29

 

4

 

841

 

 

116

 

 

 

3364

 

3

 

 

30,5–33,5

32

 

13

 

1024

 

 

416

 

 

 

13 312

 

4

 

 

33,5–36,5

35

 

23

 

1225

 

 

805

 

 

 

28 175

 

5

 

 

36,5–39,5

38

 

22

 

1444

 

 

836

 

 

 

31 768

 

6

 

 

39,5–42,5

41

 

30

 

1681

 

 

1230

 

 

 

50 430

 

66

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Окончание табл. 2.2

i

x x

xi

n

x2

xi

ni

x2

n

 

i

i+1

ср

i

iср

 

ср

iср

i

7

42,5–45,5

44

29

1936

1276

56 144

8

45,5–48,5

47

16

2209

752

35 344

9

48,5–51,5

50

10

2500

500

25 000

10

51,5–54,5

53

2

2809

106

5618

 

150

6063

249 831

Находим:

x = 6063150 = 40,4 мк; S 2 = 1491 (249 831150 (40,4)2 ) = 33,6; S = 5,8. 3. Построим гистограмму эмпирических частот (рис. 2.4).

Рис. 2.4. Гистограмма эмпирических частот (к задаче 2.1)

По виду гистограммы (см. рис. 2.4) можно предположить, что исследуемый признак подчиняется нормальному закону распределения.

4. Найдем теоретические частоты niпо формуле (2.2) при n = 150, x = 40,4, S = 5,8:

n′ = 150

Ф

xi+1

40,4

Ф

xi 40,4

.

 

 

 

 

i

 

 

5,8

 

5,8

 

 

 

 

 

 

67

В первом интервале левый конец изменим на −∞, а в последнем интервале – правый конец на +∞. Таким образом, первый интервал будет (−∞;27,5), а последний (51,5;+ ∞). Значения функции

Φ(x) находятся из таблицы (см. прил. 7). При этом нужно учесть, что Φ(x)= −Φ(x) и для х > 5 значение Φ(x) = 0,5.

Приведем пример расчета значения ni:

n

= 150

 

Ф

27,5 40,4

 

Ф

−∞

 

= 150

(

Ф

2,22

)

+ Ф

))

=

1

 

 

 

5,8

 

(

 

)

 

(

 

(

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 150

(

 

 

 

 

 

 

)

= 2,0;

 

 

 

 

 

 

 

 

 

 

 

 

0,4868 + 0,5

 

 

 

 

 

 

 

n

= 150

 

Ф 30,5 40,4

Ф

27,5 40,4

=

 

 

 

 

 

2

 

 

 

 

 

 

 

5,8

 

 

 

 

 

 

 

5,8

 

 

 

 

 

 

(

 

(

 

 

 

(

 

 

))

 

 

 

(

 

 

 

)

 

 

= 150

Ф

 

)

Ф

2,22

= 150

 

 

 

 

 

= 4,6

 

 

 

1,71

 

 

 

0,4546 + 0,4868

 

и т.д.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Расчеты для нахождения критерия χн2 приведены в табл. 2.3.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

(xi ;xi+1)

 

 

 

 

 

 

ni

 

 

 

 

 

 

ni

 

 

 

(ni ni)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

1

−∞

 

 

 

27,5

 

 

 

 

 

1,0

 

 

 

 

 

 

2,0

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

5,0

 

 

 

 

 

 

 

 

 

 

0,39

27,5

 

 

 

30,5

 

 

 

 

 

 

 

 

 

 

 

6,6

 

 

 

 

 

 

 

 

 

 

 

 

 

4,0

 

 

 

 

 

 

4,6

 

 

 

 

 

3

30,5

 

 

 

33,5

 

 

 

 

 

13,0

 

 

 

 

 

11,0

 

 

 

 

0,36

4

33,5

 

 

 

36,5

 

 

 

 

 

23,0

 

 

 

 

 

20,2

 

 

 

 

0,39

5

36,5

 

 

 

39,5

 

 

 

 

 

22,0

 

 

 

 

 

27,8

 

 

 

 

2,8

6

39,5

 

 

 

42,5

 

 

 

 

 

30,0

 

 

 

 

 

30,6

 

 

 

 

1,21

7

42,5

 

 

 

45,5

 

 

 

 

 

29,0

 

 

 

 

 

24,4

 

 

 

 

2,45

8

45,5

 

 

 

48,5

 

 

 

 

 

16,0

 

 

 

 

 

15,4

 

 

 

 

1,49

9

48,5

 

 

 

51,5

 

 

 

 

10,0

 

 

 

 

 

 

7,9

 

 

 

 

 

0,00

 

 

 

 

 

 

 

 

 

 

 

 

12,0

 

 

 

 

 

 

 

 

 

 

10

51,5

 

 

 

+∞

 

 

 

 

 

 

 

 

 

 

 

12,1

 

 

 

 

 

 

 

 

 

 

 

 

2,0

 

 

 

 

 

 

4,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

150,0

 

 

 

 

150,0

 

 

 

 

χн2 = 3,26

68

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5. Число интервалов r с учетом объединения частот равно 8. Проверку гипотезы о нормальном распределении проводим при уровне значимости α = 0,05 и числе степеней свободы, равном

k = r 3 = 8 3 = 5. Из таблицы (см. прил. 5) находим χк2p = 11,1.

В нашем примере χн2 = 3,26, т.е. χн2 < χкр2 .

Следовательно, опытные данные согласуются с нормальным законом распределения. На гистограмму наложим теоретическую кривую, полученную в соответствии с нормальным законом распределения.

6. Для построения нормальной кривой по опытным данным

находим ординаты yi (выравнивающие частоты) по формуле

 

yi = hi ϕ(ui ), где

 

hi =

n(xi+1 xi )

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

ui =

xi x

; ϕ(u)

=

1

 

 

e

u

, гдеn объем выборки.

 

 

 

2

 

 

 

2π

 

 

 

s

 

 

 

 

(

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

находим в таблице (см. прил. 6).

 

Значения функции ϕ u

 

 

 

Вычислим выравнивающие частоты для нашего примера.

Имеем

 

 

 

 

 

150

 

 

 

 

 

 

xi 40,4

 

 

 

 

 

 

 

s = 5,8;

 

hi =

3 = 77,6; ui =

 

yi =77,6ϕ(ui ).

x

= 40,4;

 

 

 

 

 

 

;

5,8

5,8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Результаты вычислений поместим в табл. 2.4.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

xi

 

 

ni

 

 

 

 

 

ui

 

ϕ(ui )

 

 

yi

 

1

 

 

26

 

1

 

 

 

 

 

–2,48

 

0,02

 

 

1,6

 

2

 

 

29

 

4

 

 

 

 

 

–1,96

 

0,05

 

 

3,9

 

3

 

 

32

 

13

 

 

 

 

 

–1,45

 

0,14

 

 

10,8

 

4

 

 

35

 

23

 

 

 

 

 

–0,94

 

0,26

 

 

20,2

 

5

 

 

38

 

22

 

 

 

 

 

–0,41

 

0,37

 

 

28,7

 

6

 

 

41

 

30

 

 

 

 

0,10

 

0,39

 

 

30,3

 

7

 

 

44

 

29

 

 

 

 

0,62

 

0,33

 

 

25,6

 

8

 

 

47

 

16

 

 

 

 

1,14

 

0,21

 

 

16,3

 

9

 

 

50

 

10

 

 

 

 

1,66

 

0,09

 

 

7,0

10

 

 

53

 

2

 

 

 

 

2,17

 

0,04

 

 

3,1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

69

В прямоугольной системе координат строим точки (xi , yi )

и соединяем их плавной кривой (рис. 2.5). Близость выравнивающих частот к наблюдаемым подтверждает правильность допущения о том, что исследуемый признак распределен нормально.

Рис. 2.5. Гистограмма теоретических частот (к задаче 2.1)

Задача 2.2. Эмпирическое распределение выборки объемом n = 100 приведено в табл. 2.5.

Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупностиХc эмпирическим распределением выборки.

 

 

 

 

 

Таблица 2.5

 

 

 

 

 

 

 

i

xi xi+1

ni

i

xi xi+1

 

ni

1

3–8

6

5

23–28

 

16

2

8–13

8

6

28–33

 

8

3

13–18

15

7

33–38

 

7

4

18–23

40

 

Решение:

1. Построим гистограмму эмпирических частот (рис. 2.6).

70