Математическая статистика в технологии машиностроения
..pdfгде в отличие от формулы (11) в знаменателе берется (п — 1), для того чтобы компенсировать систематическую ошибку, возникаю щую при оценке о 0 по s при малом числе п.
Эта задача сводится к определению вероятности а приближен
ного равенства о 0 s, точность которого равна |
е: |
Р (s — е < а 0 < s + е) = а. |
(85) |
Если известно, что случайная величина х в генеральной сово купности подчинена нормальному закону распределения, то ве личина
2 _ |
(« — О s'2 _ fof |
|
г ~ |
„2 |
— „2 |
имеет распределение, которое носит название ^-распределения. Дифференциальная функция этого распределения или плотность вероятности величины х 2 имеет выражение
к
Ф(Х*) = — |
к при х > 0. |
При помощи этой функции х2-распределения можно вычислить и вероятность а:
а = Р (s — е < а 0 < s -+- е).
Для этой цели, полагая, что s — е > 0, преобразуем находя щееся в скобках неравенство следующим образом:
Умножим полученное неравенство на положительное число s Y k :
Обозначив -|- = gs и е = sqs, получим
l + <7s^x ^ l - g s
или
(1 -<ь)2
Но левая часть этого уравнения есть преобразованное выраже ние вероятности
Р (s — е < а 0 < s + е) = а. |
|
Следовательно, можно написать |
|
Р (s — е < o Q< s + е) = L (qs, k) |
(87) |
или |
|
P{s — q$s < o 0< s + q ss) = L(qs, k). |
(88) |
Значения интеграла L (qsk) приведены в таблице приложения 3.
Таким образом, по таблице приложения 3 можно определить вероятность а, т. е. вероятность того, что отклонения а 0 от s не превосходят е = qss.
Необходимо заметить, что если s < е, то исходное неравенство для а 0
s — e ^ a 0< ; s + e
надо заменить неравенством
0 < t f o < $ + е,
так как величина а 0 должна быть положительной. В этом случае неравенство для % примет вид
|
VI < 1 <оо |
|
l + < 7 s |
и вероятность его будет определяться интегралом |
|
L (<7s. *) = |
00J Ф (X2) <*х2 (?S = 7 > *) • |
(l + 9s)2
Значения этого интеграла также приведены в приложении 3.
При помощи таблицы значений вероятностей L (qs, k) (см. приложение 3)
можно решать задачи трех типов: |
|
|
|
вероят |
|
1) по заданной точности е = qs s и объеме выборки п определить |
|||||
ность а приближенного равенства |
а0 ^ |
s; |
s и |
объеме |
|
2) по заданной вероятности а |
приближенного равенства а0 |
||||
выборки п определить точность в = |
qss |
этого равенства; |
|
|
|
3) по заданной точности 8 и вероятности а приближенного равенства a 0 ^ |
s |
||||
определить необходимый объем п выборки. |
|
|
|
||
Пример 13. По выборке объема п = |
15 вычислено среднее квадратическое |
||||
отклонение s = 0,6. Определить вероятность а приближенного равенства a 0 ^ |
s |
||||
при точности е = 0,12. По таблице приложения 3 для |
|
|
|
и
Яв |
|
0,12 |
= |
0,2 |
|
s |
0,6 |
||||
|
|
|
находим
а = 0,701; Р (0,6—0,12 < а 0 < 0,6 + 0,12) = 0,701;
Р (0,48 < а0 < 0,72) = 0,701.
Пример 14. Определить точность е приближенного равенства о0 & s с ве роятностью а = 0,96, если п = 15 и s = 0,12. По таблице приложения 3 находим для k = 15—1 = 14 и а = 0,96 qs = 0,5.
Следовательно,
е = qss = 0,5- 0,12= 0,06;
а 0 = |
s ± |
е = 0,12± 0,06 |
|
|
или |
|
|
|
|
0,06 < ( т 0 < 0 ,1 8 . |
|
|
||
Пример 15. Определить п, при котором s будет отличаться от а0 |
на |
±0,2 |
||
с вероятностью а = 0,96: |
|
|
|
|
|
е = |
qss = 0,2s; |
|
|
|
q5 = 0,2. |
|
|
|
По таблице приложения 3 при |
qs = |
0,2 и а = 0,96 находим k = 60. |
Но |
k = |
— п — 1, следовательно, |
|
|
|
|
п = k + 1 = 6 0 + 1 = 61.
Рассмотренный метод оценки приближенного равенства а 0 « ^ s, пригоден для любого объема выборки п. Однако при выбор
ках объемом п > 20 методика оценки может |
быть упрощена. |
|||
Если п > 20, то |
величина t = ^°° ~ s ^ , где |
crs = |
— |
s_ |
|
°В |
5 |
V2n |
\f2n |
подчиняется нормальному распределению и, следовательно |
|
|||
|
р ( - t a < t <ta) = 2 0 ( t a). |
|
|
(89) |
Но левую часть этого равенства можно представить так: |
|
|||
Р (— ta < t |
< t a) = Р (s — ta(Js < cr0 < |
S + |
taGs). |
|
Полагая taos = |
e, получим |
|
|
|
P (s — e <<т0 < s + e) = a . |
|
|
(90) |
|
Следовательно, |
|
|
|
|
a = 2Ф (ta).
Так как |
|
|
II |
?||<5 |
CO II |
|
'a -*2 |
|
П = |
2e2 |
* |
(91)
(92)
Полагая |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
S, |
получим |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
п = |
2?s |
|
(93) |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
Пример |
16. Определить число п, если задано а = 0,95 и qs = 0,2. По таблице |
|||||||||||
приложения 1для а = |
0,95 находим t = |
1,96 и по формуле (93) определяем п: |
||||||||||
|
|
|
|
|
|
|
__ |
1,962 |
48. |
|||
|
|
|
|
|
|
|
П~ |
2-0,2а |
||||
|
|
|
|
|
|
|
|
|
||||
Пример |
17. Определить точность е приближенного равенства сг0 «=* s с вероят |
|||||||||||
ностью а = |
0,95, если п = 50, s = |
0,1. По таблице приложения 1 для а = 0,95 |
||||||||||
находим |
t = |
1,96 и по формуле (92) определяем |
||||||||||
|
|
|
|
|
|
|
1,96-0,1 |
|
0,02. |
|||
|
|
|
|
|
|
|
|
/2^50 |
|
|||
|
|
|
|
|
|
|
|
|
|
|||
Следовательно, |
сг0 = 0,1 ±0,02; |
0,08 < |
сг0 < 0,12. |
|||||||||
если |
Пример |
18. |
Определить |
вероятность а |
приближенного равенства а 0 ^ s, |
|||||||
п = 50 и е = |
0,1. Так |
как |
|
|
tas |
|
|
|||||
|
|
|
|
|
|
|
е |
|
|
|
||
|
|
|
|
|
|
|
Уto ’ |
|
||||
то |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= |
e j / j п = |
° 'ls |
|
= |
0>1 |
у |
2п = 0,1 V 2-50 = 1. |
|
|
|
|
|
|
5 |
|
S |
|
|
|
|
|
|
По таблице |
приложения 1 для |
ta = |
1 |
находим |
|||||||
|
|
|
|
|
|
а = |
2Ф (t) = |
2Ф (1) = 0,6827. |
||||
/а = |
Если принять п = |
100, то /а = |
1,42 и а = |
0,844; при п = 200 соответственно |
||||||||
2, а = |
0,954, |
т. е. с увеличением п вероятность а приближенного равен |
||||||||||
ства а 0 ^ |
s |
при заданной точности е возрастает. |
||||||||||
|
Рассмотренная |
методика оценки |
приближенного равенства а 0 ^ s действи |
тельна для того случая, когда случайная величина х распределена в генеральной совокупности по нормальному закону. Если же распределение х в генеральной совокупности отличается от нормального, то определение неизвестного среднего квадратического отклонения его возможно более или менее точно в большинстве случаев только при большом числе наблюдений. Именно в этом случае можно
с большой вероятностью полагать, что среднее квадратическое отклонение гене35
ральной совокупности о0 отличается от выборочного SHe более чем на ± -■ —
У2п *
6.ОЦЕНКА ПАРАМЕТРОВ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
СПОМОЩЬЮ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ
Всякая статистическая оценка параметра, вычисленная по дан ным выборки, может быть только приближенной. Поэтому она может иметь определенный смысл лишь в том случае, когда ука-
54
зываются границы возможной погрешности оценки или, другими словами, указывается интервал, внутри которого с заданной ве роятностью будет лежать истинное значение параметра. Этот интервал носит название доверительного, а границы его — до верительных границ.
Доверительные границы для среднего значения Х 0, диспер
сии (Jo и среднего квадратического отклонения а0 в случае нор мальной генеральной совокупности определяются следующим образом.
Доверительные интервалы для оценки генеральной средней. Если генеральная совокупность имеет нормальное распределение,
то как было указано ранее, величина t = —= —- Для боль-
ших выборок также распределена нормально со средним значением
1 = 0 и дисперсией Dt = 1. Поэтому для любого уровня значи мости Р легко построить доверительные границы для неизвест
ного значения Х 0, воспользовавшись неравенством:
Р (X — to- <С Х 0 X -f- /а-) = а.
подставляя о- = — |
, получим |
|
х |
1/ и |
|
Величина t определяется по таблице приложения 1 по задан ной вероятности а = 2Ф (t). Например, для п = 100 при надеж ности а = 0,95 t = 1,96, следовательно, доверительный интер
интервала будет находиться неизвестное среднее значение Х 0 с вероятностью 0,95.
Значения X ± 0,196s являются доверительными грани цами для среднего значения генеральной совокупности при 5 %- ном уровне значимости. Уровень значимости равен q = 1 — а =
=1 — 0,95 = 0,05.
Если выборка имеет объем п ^ 25, то величина t имеет распре
деление Стюдента. Поэтому в-этом случае значение t определяется по таблице приложения 2 по заданному значению а и k = п — 1 . Например, п = 10, а = 0,95. По таблице приложения 2 t = 2,26.
Поэтому доверительные границы для Х 0 будут равны
X ± 2 , 2 6К- ^ю= Х ± 0,72s.
Доверительные интервалы для оценки ol и а. Если генераль ная совокупность имеет нормальное распределение, то величи
на -^4- имеет ^-распределение с числом степеней свободы k — °о
=п — 1. Здесь п — объем выборки и s2 — дисперсия выборки. Задавшись вероятностью а при определении доверительных
границ для о2 и определив доверительный уровень значимости q = 1 — а, можно вычислить по %2-распределению величины
два значения %2: одно для вероятности |
Рх — 1 ---- 1- , обозначим |
|||
2 |
|
Q |
|
2 |
его %\ и другое для вероятности Р2 = |
4 -, обозначим его Х2- Тогда |
|||
|
tlS^ |
|
|
о |
вероятность того, что величина —5- окажется |
в границах от Xi |
|||
до Х2, будет равна а: |
°о |
|
|
|
|
|
|
|
|
г> |
2 ^ П5“ . |
2\ |
= а |
(94) |
р |
Х1<—2 - < % Л |
или с той же вероятностью можно ожидать выполнение следующих неравенств:
|
|
ns2 |
. 2 ^ ns2 |
|
(95) |
|
|
— |
<О 0< — . |
|
|
|
/252 |
Ха |
Xi |
|
|
|
^^2 |
|
|
границы |
|
Для числа —п—и —п— определяют доверительные |
|||||
2 |
%2 |
Xi |
|
|
|
2 |
для различных Р приведены в |
приложении 9. |
|||
для а0. Значения х |
|||||
Например, при вероятности а = 0,96 и q = 1 — а |
= 1 |
— 0,96 = |
= 0,04 для выборки п = 20 по таблице приложения 9 имеем:
|
для k = |
п — 1 = 20 — 1 = 19 |
и Р1 = 1 — |
= 1 — 0,02 = |
|||||
= |
0,98 |
х? = |
8,6 ; для |
Р2 = \ |
= |
= п0,02ло ~2х! = 33,7; |
следо- |
||
вательно, доверительные границы |
для а0 будут равны |
|
|||||||
|
|
|
|
|
20-s |
|
20 -s2 |
|
|
|
|
|
|
|
33, |
|
|
|
|
или |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,84s2 < |
о2 < |
2,34s2. |
|
|
|
Оценка для |
параметра о2 с помощью доверительного |
интер- |
||||||
вала [ —2~~у |
ns* |
в то же время доверительный интервал |
|||||||
—2~ | Дает |
|||||||||
|
|
Xi |
Х2 |
|
|
|
|
|
|
\ |
s 1Гп |
s If п |
для оценки параметра а 0 с той же |
доверительной |
|||||
Xi |
Х2 |
|
|
|
|
|
|
|
|
вероятностью а, |
|
|
|
|
|
т
Обозначим |
— zi и |
= |
г». |
|
|
|
|
Тогда |
Хг |
|
Xi |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
Р |
(zxs < а о < z as) = |
а. |
|
|
||
Значения |
г х и z2 |
для |
доверительной вероятности а = 0,95 |
||||
приведены в таблице приложения 10. |
неравенство (90), |
||||||
Для больших выборок можно использовать |
|||||||
которое после замены е = |
t-s |
пРимет ВИД |
|
|
|||
|
|
|
|||||
Р |
1 — |
|
|
|
t |
= а. |
(97) |
|
|
|
У~2п S |
||||
Задавшись |
а = 2Ф (t), |
по |
таблице |
приложения |
1 опреде |
ляем t и по полученному t вычисляем доверительные границы о0-
Например, п = 100, а = |
0,95. По таблице |
приложения |
1 : t — |
||
ч |
1,96, |
следовательно, |
1 QR |
|
1 + |
= |
1 ------—’-----= 1 — 0,14 = 0,86; |
||||
I |
1,96 |
, 1у< |
/ 2-100 |
с вероятностью а = |
|
|
|||||
+ |
-у - ^ =- = 1,14 и доверительные границы |
= 0,95 составляют
0,86s < а 0< 1,14s.
7.ОБРАБОТКА СТАТИСТИЧЕСКИХ ДАННЫХ И ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ
При обработке статистических данных с помощью выборочного метода, т. е. при установлении закона распределения изучаемой случайной величины х и параметров этого распределения, необ ходимо прежде всего составить таблицу распределения наблю денных значений х в выборке, вычислить статистические характе ристики эмпирического распределения, затем построить эмпири ческую кривую распределения, по ее внешнему виду определить, к какому теоретическому распределению она приближается, и оценить близость эмпирического распределения к предполагае мому теоретическому.
Для установления закона распределения случайной величины х выборка должна быть достаточно велика. С целью удобства об работки статистических данных большой выборки наблюденные значения х разбивают на интервалы (разряды). Число таких интервалов должно быть не менее 6—7 при п = 50—100 и не ме нее 9—15 при п > 100. Величина разряда должна быть больше величины деления шкалы измерительного инструмента, которым производился обмер величины х в выборке, для того чтобы можно было этим компенсировать погрешности измерения.
При измерении размеров деталей необходимо, чтобы цена де ления шкалы измерительного инструмента была бы равна
("б” 5”То) |
где 26 —допуск на размер детали. После установле |
|
ния величины и числа разрядов производится подсчет |
частот по |
|
каждому разряду, составляется таблица распределения, |
вычерчи |
вается практическая кривая распределения и затем производится определение статистических характеристик распределения, т. е.
X u s .
Методику обработки статистических данных покажем на следую щем примере.
Пример |
19. |
Из текущей продукции автомата, обрабатывающего ролики |
D = 20_0i2 |
м м , |
была взята выборка объемом n = 100 шт. Ролики были измерены |
по диаметру микрометром с ценой деления 0,01 мм. Ниже приведены отклонения от номинального размера диаметра роликов в мм:
—0,07 |
—0,03 |
—0,04 |
—0,08 |
—0,03 |
—0,08 |
—0,09 |
—0,10 |
—0,10 |
—0,10 |
—0,13 |
—0,08 |
—0,06 |
—0,04 |
—0,04 |
—0,03 |
—0,04 |
—0,07 |
—0,11 |
—0,12 |
—0,03 |
—0,07 |
—0,08 |
—0,11 |
—0,05 |
—0,05 |
—0,07 |
—0,03 |
—0,09 |
—0,10 |
—0,11 |
—0,14 —0,13 —0,08 —0,12 —0,07 —0,09 —0,10 —0,11 |
-0 ,0 8 |
|||||||
—0,05 |
—0,12 |
—0,07 |
—0,06 |
—0,08 |
—0,11 |
—0,10 |
—0,12 |
—0,03 |
—0,10 |
—0,08 |
—0,05 |
—0,11 |
—0,07 |
—0,05 |
—0,08 |
—0,09 |
—0,09 |
—0,09 |
—0,02 |
—0,06 |
—0,12 |
—0,05 |
—0,07 |
—0,11 |
—0,05 |
—0,08 |
—0,03 |
—0,11 |
—0,09 |
—0,11 |
—0,06 |
—0,07 |
—0,06 |
—0,06 |
—0,12 |
—0,10 |
—0,08 |
—0,09 |
—0,01 |
—0,05 |
—0,07 |
—0,06 |
—0,05 |
—0,08 |
—0,09 |
—0,04 |
-0 ,0 9 |
—0,08 |
—0,09 |
—0,07 |
—0,06 —0,06 —0,12 —0,05 —0,03 —0,10 —0,09 |
-0 ,09 |
—0,08 |
Согласно приведенным данным, наибольшее наблюденное значение xmax = = —0,01, наименьшее xmUl = —0,14. Размах варьирования или широта распре
f |
деления |
|
составляет хт ах — *min = —0,01 — |
||||||
— (—0,14) = |
0,13 мм. |
|
|
|
|
||||
|
Задаваясь числом разрядов, равным 7, |
||||||||
|
определим цену разряда |
|
|
|
|
||||
|
0 13 |
^ |
0,02. Полученная величина раз |
||||||
|
с = — |
|
|||||||
|
ряда в два раза больше цены деления шкалы |
||||||||
|
измерительного |
инструмента, |
что |
вполне |
|||||
|
приемлемо. Подсчет частот по каждому раз |
||||||||
|
ряду удобно производить |
следующим |
спосо |
||||||
|
бом. Слева выписываются разряды от хт\п до |
||||||||
|
*min + |
с\ от хт[п + с до хт\п + |
2с и |
т. |
Д. |
||||
|
В каждый разряд включаются размеры, ле |
||||||||
Рис. 22. Эмпирическая кривая |
жащие в пределах |
от наименьшего значения |
|||||||
разряда |
включительно до |
наибольшего зна |
|||||||
распределения |
чения разряда, исключая |
его. |
Справа |
при |
|||||
|
помощи |
|
черточек |
делают подсчет |
числа |
наблюденных размеров по разрядам, как это указано в табл. 5.
Составим табл. 6. распределения наблюденных значений и вычертим эмпири ческую кривую распределения (рис. 22). __
Для вычисления статистических характеристик распределения, т. е. X и s, служат формулы:
fixi |
1 f |
fi(xi — X)2 |
------ |
H S = | / |
- i ------- |
Однако для больших выборок вычисления X и s по этим формулам требуют больших затрат времени. Для облегчения подсчетов можно составить вспомога тельную табл. 7.
Таблица 6
Эмпирическое распределение х
|
Разряды х |
Середина |
Частота f |
от |
До |
разряда |
|
|
|
||
—0,14 |
—0,12 |
—0,13 |
3 |
—0,12 |
—0,10 |
—0,11 |
16 |
—0,10 |
—0,08 |
—0,09 |
22 |
—0,08 |
—0,06 |
-0,07 |
25 |
—0,06 |
—0,04 |
—0,05 |
19 |
—0,04 |
—0,02 |
—0,03 |
13 |
—0,02 |
—0,00 |
—0,01 |
2 |
|
|
|
оо II |
Частость тх
0,03
0,16
0,22
0,25
0,19
0,13
0,02
2 = >
Таблица 7
Вспомогательная таблица для вычисления X и s выборки
Интервалы х |
Середина |
Частота |
|
|
|
|
|
|
интер |
* = '‘-с а |
bit |
b'ft |
|
от |
До |
вала |
и |
|||
xi |
|
|
|
|
||
|
1 |
2 |
3 |
4 |
5 |
6 |
а *
Вычисление статистических характеристик распределения
Разряды х
|
|
|
|
|
|
/ |
ь = х ‘~ а |
|
|
|
ДО |
|
|
|
С |
|
|
|
|
|
|
|
|
— |
0,14 |
— |
0,12 |
- |
0,13 |
3 |
—3 |
— |
0,12 |
— |
0,10 |
— |
0,11 |
16 |
—2 |
— |
0,10 |
— |
0,08 |
— |
0,09 |
22 |
—1 |
— |
0,08 |
— |
0,06 |
— |
0,07 |
25 |
0 |
— |
0,06 |
— |
0,04 |
— |
0,05 |
19 |
1 |
— |
0,04 |
— |
0,02 |
— |
0,03 |
13 |
2 |
— |
0,02 |
— |
0,00 |
- |
0,01 |
2 |
3 |
|
|
|
|
|
|
и й |
о |
|
|
|
|
|
|
|
о |
bf **•/
—9 |
27 |
—32 |
64 |
—22 |
22 |
0 |
0 |
19 |
19 |
26 |
52 |
618
=- 12 2 62/ = 202
Примечание, а = —0,07; с = 0,02.
Для заполнения графы 4 необходимо установить значения а и с. В качестве величины а — начала отсчетов — можно принимать любое численное значение, но лучше всего принимать а равным х/, имеющим наибольшую частоту. Величина с есть величина разряда. Графа 5 представляет собой произведение данных графы 4 на данные графы 3; графа 6 — произведение данных графы 5 и данных графы 4. Далее необходимо подсчитать суммы по графам 3, 5 и 6.
Искомые значения X и s определяются по следующим формулам:
Определим по указанному способу X и s рассматриваемого в примере рас пределения. Составим для этого табл. 8. На основании табл. 8 вычислим X и s-
X = -0,07 + 0,02 i = j j 3 = -0,072 мм;
Определение характеристик распределений при помощи мо ментов. Определение статистических характеристик эмпириче ских распределений целесообразнее производить при помощи мо ментов. Для вычисления моментов составляют вспомогательную
таблицу, структуру которой и схему вычисления моментов с ее помощью покажем на примере табл. 9 .
Табл. 9 составлена для данных примера 19. Она отличается от табл. 8 дополнительными графами 6 , 7, 8, 9, заполнение которых
60