Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математическая статистика в технологии машиностроения

..pdf
Скачиваний:
24
Добавлен:
15.11.2022
Размер:
8.19 Mб
Скачать

Интервалы

f

_

значений

г

(от — до)

 

 

Р/ ~

1

 

2

3

гнб t' = P i~ P о

г = p i + р0

Ф(П

Ф (Г)

F (Р)

Г

Г

Оо

 

 

 

 

п

 

4

5

6

7

8

9

10

0 — 0,004

23

0,54

— 0,56

1,64

— 0,212

0,449

0 ,2 3 7

0,24

24

0 ,0 0 4 — 0,008

25

1,08

— 0,02

2 ,18

— 0,0 08

0,485

0,477

0 ,24

24

0 ,0 0 8 — 0,012

25

1,60

0,50

2 ,7

0,192

0,496

0,688

0,21

21

0 ,0 1 2 — 0,016

14

2 ,15

1,05

3,25

0,353

0,499

0,892

0 ,1 6

16

0 ,0 1 6 — 0,020

10

2,70

1,60

3,8 0

0,445

0,499

0,944

0 ,09

9

0 ,0 2 0 — 0,024

1

3,20

2,10

4,3 0

0,482

0,499

0,981

0 ,04

4

0 ,0 2 4 — 0,028

1

3,75

2,65

4 ,85

0,496

0,499

0,995

0,01

1

0 ,0 2 8 — 0,032

1

4 ,2 5

3,15

5,35

0,499

0,500

0,999

0,004

1

100

100

Дальнейшие вычисления р/, t * , i \ Ф (/'), Ф (/*), F (р),

fn

и /' приведены

в табл. 16 (графы 3—10).

На рис. 27 приведены теоретическая и эмпирическая кривые распределения.

Глава IV

СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ

1. ЗАДАЧИ СТАТИСТИЧЕСКОЙ ПРОВЕРКИ ГИПОТЕЗ

Статистическая проверка гипотез, т. е. предположений, от­ носящихся к эмпирическим распределениям изучаемых случай­ ных величин, играет важную роль в статистических исследованиях.

Если эмпирическая кривая распределения большой выборки по своему внешнему виду приближается к какому-либо теоретиче­ скому закону распределения, то возникает вопрос, можно ли дан­ ную выборку рассматривать как выборку из генеральной со­ вокупности, имеющей распределение именно по этому закону. Решение этого вопроса имеет важное значение для исследователя, так как знание закона распределения изучаемой величины по­ зволяет извлечь из экспериментов дополнительную информацию. Если производится две серии испытаний с фактором А и без него и в результате получаются разные значения средних и диспер­ сий изучаемой переменной величины, то возникает вопрос, яв­ ляется ли это различие в средних и дисперсиях влиянием фактора А или оно носит чисто случайный характер.

Решение перечисленных и им подобных задач в математиче­ ской статистике производится путем постановки и проверки так называемой «нулевой гипотезы». При этом под «нулевой ги­ потезой» подразумевается допущение об отсутствии интересую­ щего нас различия между выборками или их статистическими характеристиками. Например, нас интересует, можно ли по полу­ ченному распределению в большой выборке из генеральной сово­ купности считать, что последняя имеет нормальное распределе­ ние. Для того чтобы прийти к вполне определенному заключению, хотя бы и вероятностного характера, мы делаем гипотетическое допущение, что распределение выборки несущественно отличается от нормального и, следовательно, на основании закона больших чисел можно считать, что и генеральная совокупность имеет нор­ мальное распределение. Другими словами, мы выдвигаем «нуле­ вую гипотезу» об отсутствии различия между эмпирическим рас­ пределением и теоретическим нормальным или гипотезу о том, что данная выборка взята из нормальной совокупности. Теперь надо проверить эту гипотезу и в результате проверки либо от­ бросить ее, либо принять.

Для проверки гипотез в математической статистике пользуются рядом критериев, которые называют в этомслучае критериями со­ гласия.Для того чтобыпринять илизабраковать гипотезу при помощи этих критериев, установлены уровни значимости их. Уровень значи­ мости представляет собой достаточно малое значение вероятности, отвечающее событиям, которые в данной обстановке исследования можно считать практически невозможными. Обычно принимают пятидвухили однопроцентный уровень значимости. В технике чаще всего принимают пятипроцентный уровень значимости.

Уровень значимости называют также доверительным уровнем вероятности, который соответственно может быть принят равным Р = 0,05; 0,02 или 0,01; иногда принимают Р = 0,001. Эти уровни доверительной вероятности соответствуют классификации явле­ ний на редкие (Р = 0,05), очень редкие = 0,01) и чрезвычайно редкие = 0,001). Выбирая тот или иной уровень значимости критерия или уровень доверительной вероятности Р, мы тем са­ мым устанавливаем и область допустимых его значений, кото­ рая выражается вероятностью а = 1 — Р.

С уменьшением уровня значимости расширяется область до­ пустимых значений критерия и ’вместе с тем теряется его чув­ ствительность, так как повышается вероятность принять гипотезу даже в тех случаях, когда эта гипотеза неверна. Но вместе с тем выбор достаточно малого уровня значимости гарантирует от возможности неправильно забраковать верную гипотезу.

Статистические приемы проверки гипотез не обладают полной определенностью. Если используемый критерий попадает в область допустимых значений, то нельзя еще сделать вывода о правиль­ ности гипотезы, а можно лишь заключить, что наблюденное зна­ чение критерия не противоречит этой гипотезе, что можно признать допустимость гипотезы до тех пор, пока более обстоятельные ис­ следования, с помощью более точных критериев или при увеличен­ ном числе наблюдений не подтвердят это или не приведут к проти­ воположному заключению. Поэтому статистическими методами нельзя пользоваться формально, а необходимо их сочетать с ана­ лизом физической сущности изучаемого явления. Когда гипотеза, основанная на теоретическом анализе физической сущности яв­ ления, подтверждается также статистическими приемами, то до­ стоверность ее можно считать достаточно надежной.

В последующих параграфах будут рассмотрены статистиче­ ские методы проверки некоторых гипотез, имеющих наиболее важное практическое значение.

2. ПРОВЕРКА ГИПОТЕЗЫ 0 ЗАКОНЕ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ

Для установления закона распределения генеральной совокуп­ ности по большой выборке из нее пользуются рядом критериев, из которых наибольшее практическое применение имеют критерий К А. Н. Колмогорова и критерий %2 Пирсона.

Критерий А.дает достаточно точные результаты даже при объе­ ме выборок, состоящих из нескольких десятков членов и прост для вычислений. Не вдаваясь в теоретические обоснования этого критерия, приведем лишь порядок его использования.

Для вычисления величины X необходимо предварительно оп­ ределить эмпирические Fn (х) и теоретические F {х) функции предполагаемого закона распределения для каждого наблюден­ ного значения случайной величины х. Затем по максимальной разности этих функций определяется X при помощи следующей формулы:

X = \F (x ) - F n(*)ЦХV~n =

D ]/~n.

(107)

Так как F (х) =

и Fn =

, где Nx и Nx — накопленные

теоретические и эмпирические

частоты,

а п — объем

выборки,

то вместо формулы (107) можно пользоваться также следующей формулой:

X = У п. (108)

Накопленной частотой любого m-то значения Х[ называется сумма частот всех предшествующих значений xh включая и частоту самого xt, т. е.

 

m

 

(109)

 

/ = 1

 

 

 

 

где m — число значений

 

 

f i — частота

i - го значения х.

 

 

Академик А. Н. Колмогоров доказал, что для непрерывных

случайных величин

 

 

 

P { D V b ^ X ) = K{X),

 

 

-f-oo

 

 

 

где К (Х)= S

(—l)v e_2vJ-’ Для больших п и любом X >

0

V = — оо

 

 

 

 

Р (X) = 1 — К (X).

Ч!

} Й

Функция К (X) табулирована Н. В. Смирновым и при помощи таблицы значений К (X) составлена таблица значений Р (X), ко­ торая приведена в приложении 12.

По вычисленному значению X по формуле (107) или (108) и при­ ложению 12 определяют Р (X). Если вероятность Р (X) окажется очень малой, практически, когда Р (А,) 0,05, то расхождение между F (х) и Fn (х) считается существенным, а не случайным и гипотеза о предполагаемом законе распределения величины х бракуется. Если же вероятность Р (А.) будет достаточно большой (практически, когда Р (А,) > 0,05), то гипотеза принимается,

Необходимо заметить, что использование критерия к предпо­ лагает непрерывность F (х) и, кроме того, предполагается, что эм­ пирическая функция Fn (х) построена по не сгруппированным в интервалы значениям случайной величины х. Однако, когда интервалы группировки достаточно малы, критерий %дает, хотя и приближенную, но вполне приемлемую для практических це­ лей оценку близости эмпирического распределения к теоретиче­ скому.

Для удобства вычисления критерия X следует составить вспо­ могательную таблицу 17.

 

 

 

 

 

Таблица

17

 

Данные для вычисления критерия К

 

 

 

 

 

X

л

 

F ( х )

|

-

 

|

 

f

Р п ( Х )

F ( х )

 

 

 

F n ( х )

 

 

от

До

п

 

 

 

 

 

 

 

 

 

 

 

 

 

Fn (х) и F (х) вычисляются в зависимости от закона распреде­ ления х по методике, изложенной в части первой, гл. III, п. 8.

Критерий х2 применим для любых сгруппированных совокуп­ ностей, но при достаточно большом их объеме. Для вычисления х2- необходимо предварительно вычислить теоретические частоты для наблюденных значений эмпирического распределения, т. е. про­ извести сопоставление этого распределения с предполагаемым теоретическим. Приэтом необходимо, чтобы частоты интервалов значений х были бы не менее пяти. Если в каком-либо интервале значений х частота будет менее пяти, то такой интервал следует

объединить с соседним.

 

 

по следующей

формуле:

Критерий

х2 вычисляется

 

 

 

 

 

 

т

 

 

где т — число

сравниваемых

частот;

значений х;

fi

— эмпирическая

частота

t'-ro интервала

f'i

— теоретическая

частота

i-ro интервала значений х.

Для удобства вычисления х 2 рекомендуется составить вспо­

могательную

табл.

18.

Далее

необходимо вычислять число сте­

пеней

свободы

k

по формуле

 

 

 

 

 

 

 

k

т р — 1,

 

где т — число

сравниваемых

частот (разрядов);

р — число

параметров теоретического распределения.

Интервалы

 

 

 

( n - h ) 2

X

п

 

 

и

\ h - h \

i h - й ?

(от—до)

 

 

 

 

 

h

£ = х2

Для величины k найден закон распределения, по которому вычислены вероятности Р (%2) для различных значений %2 и k. Значения Р (х2) приведены в приложении 13.

Если Р (%*) ^ 0,05, то наша гипотеза о законе распределения должна быть забракована. Если Р (%2) £> 0,05, то гипотеза при­ нимается.

При отсутствии таблиц значений Р (х2) или для быстрой ориентировки при помощи критерия ха можно воспользоваться следующим правилом [101. Определяется величина А:

А =

lx2 - щ

( 1 1 1)

 

V~2k

 

Если А ^ 3, то нулевая гипотеза о законе распределения бра­ куется, если А < 3, то она принимается.

3. ПРОВЕРКА ГИПОТЕЗЫ НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ

Для проверки гипотезы нормальности распределения генераль­ ной совокупности по большой выборке из нее можно использо­ вать как критерий Я, так и критерий х2-

В первом случае необходимо предварительно вычислить эмпи­ рические и теоретические функции распределения Fn (х) и Р (х)

Мх N '

Или ~п~ и ~п~ для кажД°Г0 интервала значений х в таблице рас­

пределения, а во втором случае необходимо для этих же интерва­ лов х вычислить теоретические и эмпирические частоты /' и /.

N '

Методика вычислений F (х),

и /' для закона нормального

распределения была изложена в части первой, гл. III п. 8. По­ этому здесь покажем на примерах только методику вычисления критериев Я и х2-

Пример 25. По данным примеров 20 и 21 вычислить критерии Я и х2 и про­ верить гипотезу нормальности. Для вычисления Я по формуле (108) составим табл. 19 на основании данных табл. 12.

Вычисление Nx и N'x производится путем прибавления к каждому значе-

нию ii или суммы предшествующих значений f l—1 или

76

н

'

ft

h

 

Nx

К - *41

—0,13

 

3

3,4

ЗЖ

3,4

0,4

0,11

 

16

11,5

19

14,9

4,1

—0,09

 

22

23,5

41

38,4

2,6

—0,07

 

25

28,55

66

66,95

0,95

—0,05

 

19

21,15

85

88,10

3,1

—0,03

 

13

9,30

98

97,40

0,6

0,01

 

2

2,60

100

100

0

Е

 

100

100

 

 

 

По формуле (108) имеем

 

%= 1^* ~~п

у - = 100 ^Гоо = 0,41.

По таблице приложения 12 этому значению X соответствует Р (X) = 0,9972Эта вероятность близка к единице. Поэтому можно нашу нулевую гипотезу счи­

тать верной.

 

 

(107) составим табл. 20 на основании данных

Для вычисления по формуле

табл. 13.

 

 

 

 

 

 

 

Таблица для вычисления X по формуле (107)

Таблица 20

 

 

*

 

п

2L

f « w

F (х)

\Fn (x) -

 

 

от

до

 

п

 

 

- F (дс)|

 

 

 

 

 

—0,14

0,12

3

0,03

0,03

0,043

0,013

0,12

0,10

16

0,16

0,19

0,159

0,031

0,10

—0,08

22

0,22

0,41

0,386

0,024

—0,08

—0,06

25

0,25

0,65

0,666

0,003

—0,06

—0,04

19

0,19

0,85

0,873

0,023

—0,04

0,02

13

0,13

0,98

0,96

0,012

0,02

0,00

2

0,02

1,00

0,995

0,005

 

 

100

1,00

 

 

 

По формуле (107) имеем

X = \Fn (х) F (д;)|т ах У п = 0,031

= 0,31 •

По таблице приложения 12 для этого значения X Р (X) = 0,9981. Вычисление критерия х2 производим с помощью табл. 21, составленной по данным табл. 19. Так как частоты 1 и 7-го интервалов менее 5, то они объединены с соседними ин­ тервалами.

от

до

h

и

 

(n-t'd

(ti-t'd*

 

X

 

 

 

 

 

 

 

 

 

 

 

и

— 0,14

— 0,12

■1}19

 

2

25

1,78

— 0,12

— 0,10

 

 

 

 

— 0,10

- 0 , 0 8

22

23

1

1

0,043

— 0,08

— 0,06

25

29

4

16

0,550

— 0,06

— 0,04

19

22

3

9

0,410

— 0,04

— 0,02

■!}“

5}«

3

9

0,750

— 0,02

- 0 , 0 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X2 = 3,53

По табл. 21 имеем %2 = 3,53. Число степеней k =

т р 1 =

5—2—1 = 2,

где т =

5 — число разрядов, р = 2 — число параметров закона распределения.

По таблице приложения 13 Р (%2) = 0,18. Эта вероятность больше доверительной вероятности q = 0,05, следовательно, и по критерию %2 нашу нулевую гипотезу можно считать верной.

Процедура вычисления критерия й f для проверки гипо­ тезы близости эмпирического распределения любому теоретиче­ скому закону распределения остается аналогичной рассмотрен­ ной в данном примере. Отличие будет заключатьсяя лишь в вы­

числении теоретических частот f't или теоретических функций распределения F (.х), методика вычисления которых для раз­ личных законов распределения изложена в части первой, гл. III, п. 8.

4. ПРОВЕРКА ГИПОТЕЗЫ СЛУЧАЙНОСТИ ВЫБОРКИ

Для описания и изучения свойств генеральной совокупности по выборке из нее необходимо, чтобы выборка была представи­ тельной, т. е. была бы репрезентативной. Репрезентативной может быть только случайная выборка.

Для проверки гипотезы случайности выборки может быть ис­ пользовано два способа: способ последовательных разностей и способ числа и длины серий. Если можно допустить, что в течение наблюдений центр распределения величины х постепенно меняется, но дисперсия остается постоянной, то для проверки гипотезы «случайности» выборки является удобным и вполне приемлемым способ последовательных разностей. Такой случай часто имеет место при наблюдениях за размерами обрабатываемых деталей на настроенном станке, когда вследствие износа инструмента, на­ гревания станка, циклических погрешностей многопозиционных станков и т. п. центр рассеивания постепенно смещается и, таким

78

образом, происходит медленное и достаточно плавное изменение средней при неизменном стандарте а, характеризующем рассеи­ вание размеров.

Способ

последовательных разностей заключается

в

следую­

щем: по

наблюденным

значениям xt

выборки,

расположенным

в последовательности

их наблюдения:

x lt х 2,

х3,

.,

хп, об­

разуем п—1 разностей между соседними членами:

 

 

Й1 = *2 x L\

Q 2 = Х 3 Х 3 \

an-i хп хп_\.

Можно доказать, что если выборка взята из генеральной со­

вокупности с параметрами X и а2, то математическое ожидание величины а2 будет равно:

Ма2 = 2а2.

(112)

Так как состоятельной и несмещенной оценкой математиче­ ского ожидания является средняя арифметическая, то взяв сред­

нюю арифметическую из величин aj и разделив ее на два, мы по­ лучим несмещенную оценку а2 по данным выборки, которую обоз­ начим с2:

с2 = ^ г = т т й ^

(1 1 3 )

С другой стороны, для обычной несмещенной оценки о2 имеем

1=1

Таким образом, мы имеем две несмещенные оценки а2 : с2 и

s2. Когда центр распределения (X) изменяется достаточно медленно и плавно при неизменном о2, это мало скажется на последователь­ ных разностях, а следовательно, и на величине с2, но зато это из­ менение значительно отразится на величине s2, так как в формулу

вычисления последней входит непосредственно величина X.

В связи с указанным для оценки «случайности» выборки при наличии возможности смещения центра рассеивания (при неиз­

менном о) целесообразно использовать

критерий т:

* =

(П4)

При этом малые значения т следует считать указывающими на неверность гипотезы «случайности» выборки.

При п > 20 критерий т будет иметь нормальное распределение, если выборки будут действительно случайны. Поэтому критическая

79

область для т, отвечающая q % уровню значимости при п > 20, будет определяться неравенством

т < V

где

 

т ,= 1

tq

Vn + \ '

 

Значение tq определяется из соотношения

Ш =

®

откуда

Зная Ф (tq), по таблице приложения 1 можно определить tq. Например, п = 24 при q — 5%, Ф (tq) = 0 ,5 ---- щ = 0,45. По таблице приложения 1 этому значению функции соответст­

вует tq = 1,65, следовательно, т9 = 1

= .0,67. Если

1/25

вычисленное по данным 24 наблюдений т будет меньше 0,67, то это укажет на неверность нашей гипотезы о «случайности». Если же т окажется больше 0,67, то гипотеза «случайности» будет верна с вероятностью а = 1 — 0,05 = 0,95.

Для п < 2 0 можно использовать табл. 22 допустимых нижних пределов %q для уровней значимости 1 и 5%.

 

 

Нижние пределы значений критерия xq

Таблица 22

 

 

 

 

&

Уровни

§

Уровни

й

Уровни

У Ю’Я

значимости q

 

значимости q

О О с*

значимости q

 

 

§ 1 с

 

 

Ухо

 

 

5? а я

1%

5%

 

1%

5%

* a s

1%

б%

 

“ ях

4

0,256

0,390

10

0,376

0,531

16

0,475

0,614

5

0,269

0,410

11

0,397

0,548

17

0,487

0,624

6

0,281

0,445

12

0,414

0,564

18

0,499

0,633

7

0,307

0,468

13

0,431

0,578

19

0,510

0,642

8

0,331

0,491

14

0,447

0,591

20

0,520

0,650

9

0,354

0,514

15

0,461

0,603

 

 

 

Пример 26. п = 20, s2 = 0,133 мм2, с2 = 0,127.

т0,1270,133 = 0,95.

По табл. 22 при п = 20 нижняя граница для критерия т при 5%-ном уровне значимости равна т? = 0,65:

т > rq.

Следовательно, гипотеза «случайности» верна.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]