книги / Статистическое управление качеством технологических процессов
..pdf1.2.1. Параметры положения Медиана, среднее и математическое ожидание характеризуют поло
жение центра рассеяния.
Медиана определяется как точка генеральной совокупности, лежа щая в центре: 50 % измеренных значений находятся ниже ее и 50 % - вы ше. Аналитическая оценка этой величины не дается. При четном числе из меренных значений для определения медианы берут два ближайших к цен тру упорядоченного ряда значения, складывают их и результат делят по полам. Таким образом для определения медианы необходимо первона чально упорядочить исходные данные. Медиану предпочтительно исполь зовать при малом числе измеренных значений.
Среднее используют на практике для определения центра рассеяния при наличии конечного числа дискретных данных. Пусть имеются числен ные данные х \у*2, ... хп. Если все они равнозначны, то среднее вычисляет ся по формуле
* с р = - (* 1 + * 2 + - + * л ) = - 1 > 1- |
(1-6) |
|
П |
Я/=1 |
|
Если «весомость» данных разная, то среднее вычисляется с учетом |
||
их веса: |
п |
|
|
|
|
*ср = <*1*1 + <*2*2 + - |
+ <*л*п = ! > ;* ,• , |
(1 .7 ) |
|
1=1 |
|
где а, - весовые коэффициенты, соотношение которых отражает различ ную весомость значений xif причем
СЦ + а 2 + ... + а„ =1.
Если при этом известны только пропорции весовых коэффициентов Л,-, сумма которых не равна единице, то следует провести нормирование ко эффициентов:
щ =-£*—, / = 1,2.... и. |
( 1.8) |
1 4 i=i
Если есть факторы >4, 5, С, каждый из которых определяет свою пропорцию вхождения исходных данных в общий результат:
то нормирование весовых коэффициентов производят по формуле
a |
/ = 1,2,..„я. |
(1.9) |
I ( 4 4 Q )
/ = 1
Наиболее точной характеристикой центра распределения является математическое ожидание р случайной величины х (генеральное среднее значение). Оно определяет истинное среднее и при наличии всех значений и знании вероятностей их появления или дифференциальной функции распределения случайной величины определяется выражением
п+°0
ц= £*,■ |
P(xi)= \х- f(x)dx, |
(1.10) |
/=0 |
—00 |
|
где P(xt) - вероятность появления значения *,■; Дх) - дифференциальная функция (плотность) распределения случайной величины.
На практике истинное распределение fix) не известно, поэтому вме сто истинного распределения используют какую-либо модель этого рас пределения.
С математической точки зрения для определения математического ожидания случайной величины используют теорему о среднем значении определенного интеграла и формулу отыскания центра тяжести фигуры, ограниченной кривой плотности распределения. Эти выражения часто ис пользуют в прикладных задачах для усреднения по распределению той или иной физической величины (например, стоимости, затрат изготовления и т.п.).
1.2.2. Параметры разброса
Все реальные процессы дают разброс (рассеяние) показателя качест ва на выходе. Существует несколько методов оценки величины разброса: размах, дисперсия, стандартное отклонение.
Размах R есть разница между самым большим и самым малым зна чением в выборке:
^ = *max “ *mi |
0 • ^ 1) |
Размах легко подсчитать. При вычислении используются только два значения выборки, а возможные ошибки при определении этих двух зна чений и ложные значения можно легко обнаружить. Он часто используется для ручной обработки контрольных карт.
Более точными оценками разброса являются дисперсия и стандарт ное отклонение, показывающие расстояние, на которое в среднем случай ная величина х отклоняется от центра ц.
При определении дисперсии сначала возводят в квадрат отклонение от среднего, а затем вычисляют среднее отклонение. При возведении в квадрат все отрицательные числа превращаются в положительные и боль шие отклонения выражаются большими величинами. Вычисление средне го отклонения ведется также на основе распределения по формуле
_ |
*max |
(1.12) |
a 2 = D = |
J ( * - ц)2/ ( х)с1х. |
•*min
Дисперсия оценивает разброс измеренных значений относительно среднего, выраженных в квадратных единицах. Для возвращения к исход ным измеряемым единицам берут квадратный корень из дисперсии:
G = 4 D . |
( и з ) |
Получаемая величина называется стандартным или среднеквадратическим отклонением.
Точные значения параметров D и а могут быть вычислены только при точном знании Дх). На практике для их определения используют вы борочные данные. Сначала по выборке делают оценку выборочного сред-
Л
него р: |
|
Ц = * = - £ * , , 1 = 1,2,...,я. |
(114) |
л ;=1 |
|
Затем вычисляют выборочную дисперсию как среднеарифметическое от квадратов отклонений случайной величины от выборочного среднего:
Л |
о 1 п |
л 0 |
(1.15) |
Д = я 2 = - £ ( * , - - Ю 2 |
П /=1
Однако из опыта известно, что получаемые оценки выборочной дис персии оказываются заниженными по сравнению с истинным значением Д т.е. оценка является смещенной. Для определения более точного значения (несмещенной) оценки на практике используют выражение
D = S 2 = - i - 1 ( х,- - ц)2 |
(1.16) |
я —1 /=1 |
|
Извлекая квадратный корень, получаем выборочное среднеквад ратическое отклонение или выборочное стандартное отклонение
Л |
Гл I 1 |
п |
л Т |
(1.17) |
a = S = i D = \ — |
Y ( X i - \ i ) 2, |
V« -1 ,=1
которое характеризует среднюю величину отклонений случайной величи ны от своего «центра».
1.2.3. Типы распределений случайной величины
При статистическом управлении процессами используют следую щие распределения:
- гипергеометрическое; f- биномиальное;
- распределение Пуассона; u - нормальное распределение.
Знание типа распределения позволяет определить вероятность Р по явления того или иного события, данных определенной величины, доли брака и т.п. Для этого необходимо знать выражение для кривой распреде ления генеральной совокупности. Для указанных выше типов распределе ний такие выражения известны.
\Jj4nepгеометрическое распределение. Если имеется генеральная со вокупность объемом N и известна доля брака в ней р, то вероятность обна ружения х дефектных изделий в выборке объемом п из этой совокупности будет определяться гипергеометрическим распределением и может быть вычислена по выражению
|
Р(х) = |
|
|
|
|
(1.18) |
где |
|
|
|
|
|
|
|
т 1 |
т\ |
|
|
|
|
|
|
г\ (т - |
/*)! |
|
|
|
|
Графическая интерпретация |
гипергеометрического |
распределения |
|||
показана на рис. 1.4. |
|
|
|
|
|
|
|
Характеристики гипергеометрического |
распределения являются |
||||
Р - |
пр - математическое ожидание, и a |
2 |
|
N - n |
дисперсия, где |
|
|
=npg------- - |
|||||
<7 = 0 |
-Р). |
|
|
|
N -1 |
|
|
|
|
|
|
Рис. 1.4. График плотности гипергеометрического распределения
Биномиальное распределение. В большинстве практических случаев объем генеральной совокупности неизвестен или чрезвычайно велик по сравнению с объемом выборки. В этом случае гипергеометрическое рас пределение может быть приближенно представлено членами разложения бинома:
(Я + Р)" = я" +... + Р" (1.19)
Тогда вероятность обнаружения х дефектных деталей в выборке объемом п при известной дефектности партии р определится выражением
п\ |
|
л-х X |
( 1.20) |
Р(х) = |
Я |
||
(л-*)!*! |
Р |
|
Для многих комбинаций членов разложения бинома составлены таб лицы, поэтому это распределение широко используется на практике. В ча стности, биномиальное распределение используют для определения сред неквадратического отклонения числа дефектных изделий пр, для опреде ления среднеквадратического отклонения доли дефектных изделий /?, а также при входном, приемочном, контроле. Достоинством этого распре деления является то, что параметры его могут быть определены по резуль татам наблюдений серии выборок.
Графическая интерпретация биномиального распределения пред ставлена на рис. 1.5.
Характеристиками биномиального распределения при определении числа дефектных изделий пр являются \inp = пр - математическое ожида ние числа дефектных изделий, и Snp = Jnpq = л]пр(1 - р) - стандартное (среднеквадратическое) отклонение числа дефектных изделий; при опреде-
Рис. 1.5. График плотности биномиального распределения
лении доли р дефектных изделий - [ip = р - математическое ожидание до ли дефектных изделий, и Sp = ^Jp(l - p)ln - стандартное (среднеквадрати
ческое) отклонение доли дефектных изделий.
Распределение Пуассона. Названо по имени ученого Симеона Дени са Пуассона (1781-1840). Распределение Пуассона - подходящая стохас тическая модель для многих случайных событий, его часто применяют при приемочном контроле для аппроксимации более сложных дискретных рас пределений. При определенных предпосылках оно является распределени ем дискретного качественного признака. В обеспечении качества его на значение - аппроксимация биномиального и гипергеометрического рас пределения.
При увеличении объема выборки п и одновременном уменьшении доли дефектности р при условии, что величина пр будет оставаться посто янной, вероятность обнаружения х дефектных изделий в выборке прибли женно можно определить распределением Пуассона по выражению
P(JC) = — |
при x = 0,1,2,... |
(1.21) |
х\ |
|
|
где Х = п р . |
|
|
Графическая интерпретация распределения Пуассона показана на |
||
рис. 1.6. |
|
|
Характеристиками распределения Пуассона являются ц = А, - |
мате |
матическое ожидание, и ст2 = X - дисперсия.
Нормальное распределение. Является одним из самых важных в статистике и играет существенную роль в обеспечении качества. Это обу словлено тем, что случайная переменная даже при очень общих предпо сылках достаточно близко описывается этим распределением. Оно широко
используется в статистическом анализе для совокупности данных, выра женных числовыми признаками.
Нормальное распределение впервые было открыто в 1733 году Аб рахамом де Муавром (1667-1754) как предельный случай биномиального распределения и позднее вновь было, открыто Карлом Фридрихом Гауссом (1777-1855) как распределение погрешностей измерения.
Кривая плотности нормального распределения имеет легко узнавае
мую куполообразную форму (рис. 1.7) и описывается выражением |
|
|
|
(*-ц)2 |
|
Р(х) = |
2о2 |
( 1.22) |
Рис. 1.7. График плотности нормального распределения
Нормальное распределение может быть получено из биномиального распределения с увеличением объема выборки п при условии сохранения неизменной доли брака р. В этом случае вероятность обнаружить в выбор ке х дефектных деталей можно определить на основе нормального распре деления
|
(х-пр)2 |
|
Р(х) = . 1 |
е 2прч |
(1.23) |
Лj2nnpq |
|
|
Характеристиками нормального распределения являются ц - |
мате |
матическое ожидание, ст2 - дисперсия.
1.3. Основы теории статистического вывода
Теория статистического вывода позволяет оценивать генеральную совокупность по выборке на основе гипотез. При этом математическая ста тистика четко и последовательно различает совокупность и выборку. Все имеющиеся данные на практике представляют собой выборки. На основе статистических оценок, вычисленных по выборке, оценивается все явление целиком, т.е. конкретные значения совокупности и ее распределение.
Для оценивания используют два способа: точечное и интервальное оценивание. Точечное оценивание связано с прямым расчетом самих зна чений параметров: среднего, дисперсии. Интервальное оценивание связано с оценкой показателя достоверности параметров при тех или иных интер валах.
13.1. Методы получения точечных оценок
Желаемые точечные оценки должны обладать:
- состоятельностью - при увеличении объема выборки оценки па раметров должны сходиться к истинным значениям;
-эффективностью - среди нескольких состоятельных оценок эф фективней та, которая имеет наименьшую дисперсию;
-достаточностью - условное распределение вероятностей стати стической оценки не зависит от значения параметров;
-несмещенностью - с ростом выборки п получаются значения, асимптотически сходящиеся к фактическим значениям параметров.
Поэтому для определения параметров распределения генеральной совокупности по выборке используют следующие выражения:
для оценки математического ожидания случайной величины - среднеарифметическое значений выборки
л |
1 |
п |
I = 1,2,...,/!; |
(1.24) |
|
|i = x = -5 > ,-, |
|||||
|
я/=1 |
|
|
|
|
для оценки дисперсии генеральной совокупности - |
выборочную |
||||
дисперсию |
|
1 |
п |
|
|
А |
~ |
А 0 |
(1.25) |
||
Я = (5)2 = - Ц - 1 ( х,- - ц)2- |
« -1 ,=г
для оценки стандартного отклонения генеральной совокупности - выборочное стандартное отклонение
А/ А
а = т |
(1.26) |
1.3.2. Интервальные оценки
При использовании интервальных оценок вместо значения параметра выбирают длину интервала (а, Ь) так, чтобы он накрывал значение пара метра (р) с достоверностью 100-а %, т.е.
Р(а <х<Ь) = а. |
(1.27) |
Интервал (а, Ь) называют доверительным интервалом с уровнем до верия а (доверительной вероятностью 100-а %).
Оценивание генерального среднего на основе интервальной оцен ки. Если генеральная дисперсия а 2 известна, то интервал оценивания вы бирают исходя из зависимости
х± 1 ,9 6 -i. |
(1.28) |
Ып |
|
Это означает, что точное значение математического ожидания для гене ральной совокупности находится в интервале
1,96-5=; |
*+1,96-^= . |
(1.29) |
■yjn |
V/I |
|
Если генеральная дисперсия а 2 не известна, то интервал выбирают исходя из того, что выборочные средние подчиняются распределению Стьюдента (^-распределению) с числом степеней свободы (п - 1). Интервал в этом случае будет
*- <n-i(0j05) |
S |
(1.30) |
*+r„_i(0,05) |
||
|
■Jn- |
1 |
Оценивание генеральной дисперсии на основе интервальной оцен ки. Если математическое ожидание ц не известно, то исходят из того, что для генеральной совокупности с нормальным распределением статистиче-
ская оценка |
nS |
2 |
/ ст |
2 |
2 |
|
|
имеет %-распределение с числом степеней свободы |
|||
|
|
|
Л |
|
|
(п - 1). Здесь |
S |
=ст2 - выборочная дисперсия. Отсюда |
/>{ х" " ( 1 - § ) ' ^ * x" - ( f )} - 1 - < u i >
Доверительный интервал для генеральной дисперсии а 2 с уровнем досто верности (1 - а) составит
П = |
(1.32) |
Если математическое ожидание р известно и |
|
п \ п |
~ |
s 02 = - X (* ,-- n )2, |
|
п ы\ |
|
то nSo /ст2 подчиняется распределению % с числом степеней свободы п.
Тогда доверительный интервал для генеральной дисперсии ст2 с уровнем достоверности (1 - а) составит
Q = |
(1.33) |
1.3.3. Проверка гипотез
Параметры генеральной совокупности определяются на основе огра ниченной выборки благодаря выдвижению предположений и их проверке. Заранее выдвинутое предположение называют гипотезой, а способ рассу ждения - проверкой гипотез. При этом выдвигаемое предположение при нимается за нулевую гипотезу HQ. Противоположное предположение при нимается за альтернативную гипотезу Н\.
Ошибки первого и второго рода. Всегда существует опасность от брасывания верной гипотезы на основе выборки. Такая ошибка называется ошибкой первого рода.
Случай, когда нулевая гипотеза не верна, но ее не отвергают на ос нове выборки, называют ошибкой второго рода.