Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистическое управление качеством технологических процессов

..pdf
Скачиваний:
2
Добавлен:
12.11.2023
Размер:
6.88 Mб
Скачать

1.2.1. Параметры положения Медиана, среднее и математическое ожидание характеризуют поло­

жение центра рассеяния.

Медиана определяется как точка генеральной совокупности, лежа­ щая в центре: 50 % измеренных значений находятся ниже ее и 50 % - вы­ ше. Аналитическая оценка этой величины не дается. При четном числе из­ меренных значений для определения медианы берут два ближайших к цен­ тру упорядоченного ряда значения, складывают их и результат делят по­ полам. Таким образом для определения медианы необходимо первона­ чально упорядочить исходные данные. Медиану предпочтительно исполь­ зовать при малом числе измеренных значений.

Среднее используют на практике для определения центра рассеяния при наличии конечного числа дискретных данных. Пусть имеются числен­ ные данные х \у*2, ... хп. Если все они равнозначны, то среднее вычисляет­ ся по формуле

* с р = - (* 1 + * 2 + - + * л ) = - 1 > 1-

(1-6)

П

Я/=1

 

Если «весомость» данных разная, то среднее вычисляется с учетом

их веса:

п

 

 

 

*ср = <*1*1 + <*2*2 + -

+ <*л*п = ! > ;* ,• ,

(1 .7 )

 

1=1

 

где а, - весовые коэффициенты, соотношение которых отражает различ­ ную весомость значений xif причем

СЦ + а 2 + ... + а„ =1.

Если при этом известны только пропорции весовых коэффициентов Л,-, сумма которых не равна единице, то следует провести нормирование ко­ эффициентов:

щ =-£*—, / = 1,2.... и.

( 1.8)

1 4 i=i

Если есть факторы >4, 5, С, каждый из которых определяет свою пропорцию вхождения исходных данных в общий результат:

то нормирование весовых коэффициентов производят по формуле

a

/ = 1,2,..„я.

(1.9)

I ( 4 4 Q )

/ = 1

Наиболее точной характеристикой центра распределения является математическое ожидание р случайной величины х (генеральное среднее значение). Оно определяет истинное среднее и при наличии всех значений и знании вероятностей их появления или дифференциальной функции распределения случайной величины определяется выражением

п+°0

ц= £*,■

P(xi)= \х- f(x)dx,

(1.10)

/=0

—00

 

где P(xt) - вероятность появления значения *,■; Дх) - дифференциальная функция (плотность) распределения случайной величины.

На практике истинное распределение fix) не известно, поэтому вме­ сто истинного распределения используют какую-либо модель этого рас­ пределения.

С математической точки зрения для определения математического ожидания случайной величины используют теорему о среднем значении определенного интеграла и формулу отыскания центра тяжести фигуры, ограниченной кривой плотности распределения. Эти выражения часто ис­ пользуют в прикладных задачах для усреднения по распределению той или иной физической величины (например, стоимости, затрат изготовления и т.п.).

1.2.2. Параметры разброса

Все реальные процессы дают разброс (рассеяние) показателя качест­ ва на выходе. Существует несколько методов оценки величины разброса: размах, дисперсия, стандартное отклонение.

Размах R есть разница между самым большим и самым малым зна­ чением в выборке:

^ = *max “ *mi

0 • ^ 1)

Размах легко подсчитать. При вычислении используются только два значения выборки, а возможные ошибки при определении этих двух зна­ чений и ложные значения можно легко обнаружить. Он часто используется для ручной обработки контрольных карт.

Более точными оценками разброса являются дисперсия и стандарт­ ное отклонение, показывающие расстояние, на которое в среднем случай­ ная величина х отклоняется от центра ц.

При определении дисперсии сначала возводят в квадрат отклонение от среднего, а затем вычисляют среднее отклонение. При возведении в квадрат все отрицательные числа превращаются в положительные и боль­ шие отклонения выражаются большими величинами. Вычисление средне­ го отклонения ведется также на основе распределения по формуле

_

*max

(1.12)

a 2 = D =

J ( * - ц)2/ ( х)с1х.

•*min

Дисперсия оценивает разброс измеренных значений относительно среднего, выраженных в квадратных единицах. Для возвращения к исход­ ным измеряемым единицам берут квадратный корень из дисперсии:

G = 4 D .

( и з )

Получаемая величина называется стандартным или среднеквадратическим отклонением.

Точные значения параметров D и а могут быть вычислены только при точном знании Дх). На практике для их определения используют вы­ борочные данные. Сначала по выборке делают оценку выборочного сред-

Л

него р:

 

Ц = * = - £ * , , 1 = 1,2,...,я.

(114)

л ;=1

 

Затем вычисляют выборочную дисперсию как среднеарифметическое от квадратов отклонений случайной величины от выборочного среднего:

Л

о 1 п

л 0

(1.15)

Д = я 2 = - £ ( * , - - Ю 2

П /=1

Однако из опыта известно, что получаемые оценки выборочной дис­ персии оказываются заниженными по сравнению с истинным значением Д т.е. оценка является смещенной. Для определения более точного значения (несмещенной) оценки на практике используют выражение

D = S 2 = - i - 1 ( х,- - ц)2

(1.16)

я —1 /=1

 

Извлекая квадратный корень, получаем выборочное среднеквад­ ратическое отклонение или выборочное стандартное отклонение

Л

Гл I 1

п

л Т

(1.17)

a = S = i D = \ —

Y ( X i - \ i ) 2,

V« -1 ,=1

которое характеризует среднюю величину отклонений случайной величи­ ны от своего «центра».

1.2.3. Типы распределений случайной величины

При статистическом управлении процессами используют следую­ щие распределения:

- гипергеометрическое; f- биномиальное;

- распределение Пуассона; u - нормальное распределение.

Знание типа распределения позволяет определить вероятность Р по­ явления того или иного события, данных определенной величины, доли брака и т.п. Для этого необходимо знать выражение для кривой распреде­ ления генеральной совокупности. Для указанных выше типов распределе­ ний такие выражения известны.

\Jj4nepгеометрическое распределение. Если имеется генеральная со­ вокупность объемом N и известна доля брака в ней р, то вероятность обна­ ружения х дефектных изделий в выборке объемом п из этой совокупности будет определяться гипергеометрическим распределением и может быть вычислена по выражению

 

Р(х) =

 

 

 

 

(1.18)

где

 

 

 

 

 

 

 

т 1

т\

 

 

 

 

 

 

г\ (т -

/*)!

 

 

 

Графическая интерпретация

гипергеометрического

распределения

показана на рис. 1.4.

 

 

 

 

 

 

Характеристики гипергеометрического

распределения являются

Р -

пр - математическое ожидание, и a

2

 

N - n

дисперсия, где

 

=npg------- -

<7 = 0

-Р).

 

 

 

N -1

 

 

 

 

 

 

Рис. 1.4. График плотности гипергеометрического распределения

Биномиальное распределение. В большинстве практических случаев объем генеральной совокупности неизвестен или чрезвычайно велик по сравнению с объемом выборки. В этом случае гипергеометрическое рас­ пределение может быть приближенно представлено членами разложения бинома:

(Я + Р)" = я" +... + Р" (1.19)

Тогда вероятность обнаружения х дефектных деталей в выборке объемом п при известной дефектности партии р определится выражением

п\

 

л-х X

( 1.20)

Р(х) =

Я

(л-*)!*!

Р

 

Для многих комбинаций членов разложения бинома составлены таб­ лицы, поэтому это распределение широко используется на практике. В ча­ стности, биномиальное распределение используют для определения сред­ неквадратического отклонения числа дефектных изделий пр, для опреде­ ления среднеквадратического отклонения доли дефектных изделий /?, а также при входном, приемочном, контроле. Достоинством этого распре­ деления является то, что параметры его могут быть определены по резуль­ татам наблюдений серии выборок.

Графическая интерпретация биномиального распределения пред­ ставлена на рис. 1.5.

Характеристиками биномиального распределения при определении числа дефектных изделий пр являются \inp = пр - математическое ожида­ ние числа дефектных изделий, и Snp = Jnpq = л]пр(1 - р) - стандартное (среднеквадратическое) отклонение числа дефектных изделий; при опреде-

Рис. 1.5. График плотности биномиального распределения

лении доли р дефектных изделий - [ip = р - математическое ожидание до­ ли дефектных изделий, и Sp = ^Jp(l - p)ln - стандартное (среднеквадрати­

ческое) отклонение доли дефектных изделий.

Распределение Пуассона. Названо по имени ученого Симеона Дени­ са Пуассона (1781-1840). Распределение Пуассона - подходящая стохас­ тическая модель для многих случайных событий, его часто применяют при приемочном контроле для аппроксимации более сложных дискретных рас­ пределений. При определенных предпосылках оно является распределени­ ем дискретного качественного признака. В обеспечении качества его на­ значение - аппроксимация биномиального и гипергеометрического рас­ пределения.

При увеличении объема выборки п и одновременном уменьшении доли дефектности р при условии, что величина пр будет оставаться посто­ янной, вероятность обнаружения х дефектных изделий в выборке прибли­ женно можно определить распределением Пуассона по выражению

P(JC) = —

при x = 0,1,2,...

(1.21)

х\

 

 

где Х = п р .

 

 

Графическая интерпретация распределения Пуассона показана на

рис. 1.6.

 

 

Характеристиками распределения Пуассона являются ц = А, -

мате­

матическое ожидание, и ст2 = X - дисперсия.

Нормальное распределение. Является одним из самых важных в статистике и играет существенную роль в обеспечении качества. Это обу­ словлено тем, что случайная переменная даже при очень общих предпо­ сылках достаточно близко описывается этим распределением. Оно широко

используется в статистическом анализе для совокупности данных, выра­ женных числовыми признаками.

Нормальное распределение впервые было открыто в 1733 году Аб­ рахамом де Муавром (1667-1754) как предельный случай биномиального распределения и позднее вновь было, открыто Карлом Фридрихом Гауссом (1777-1855) как распределение погрешностей измерения.

Кривая плотности нормального распределения имеет легко узнавае­

мую куполообразную форму (рис. 1.7) и описывается выражением

 

 

(*-ц)2

 

Р(х) =

2о2

( 1.22)

Рис. 1.7. График плотности нормального распределения

Нормальное распределение может быть получено из биномиального распределения с увеличением объема выборки п при условии сохранения неизменной доли брака р. В этом случае вероятность обнаружить в выбор­ ке х дефектных деталей можно определить на основе нормального распре­ деления

 

(х-пр)2

 

Р(х) = . 1

е 2прч

(1.23)

Лj2nnpq

 

 

Характеристиками нормального распределения являются ц -

мате­

матическое ожидание, ст2 - дисперсия.

1.3. Основы теории статистического вывода

Теория статистического вывода позволяет оценивать генеральную совокупность по выборке на основе гипотез. При этом математическая ста­ тистика четко и последовательно различает совокупность и выборку. Все имеющиеся данные на практике представляют собой выборки. На основе статистических оценок, вычисленных по выборке, оценивается все явление целиком, т.е. конкретные значения совокупности и ее распределение.

Для оценивания используют два способа: точечное и интервальное оценивание. Точечное оценивание связано с прямым расчетом самих зна­ чений параметров: среднего, дисперсии. Интервальное оценивание связано с оценкой показателя достоверности параметров при тех или иных интер­ валах.

13.1. Методы получения точечных оценок

Желаемые точечные оценки должны обладать:

- состоятельностью - при увеличении объема выборки оценки па­ раметров должны сходиться к истинным значениям;

-эффективностью - среди нескольких состоятельных оценок эф­ фективней та, которая имеет наименьшую дисперсию;

-достаточностью - условное распределение вероятностей стати­ стической оценки не зависит от значения параметров;

-несмещенностью - с ростом выборки п получаются значения, асимптотически сходящиеся к фактическим значениям параметров.

Поэтому для определения параметров распределения генеральной совокупности по выборке используют следующие выражения:

для оценки математического ожидания случайной величины - среднеарифметическое значений выборки

л

1

п

I = 1,2,...,/!;

(1.24)

|i = x = -5 > ,-,

 

я/=1

 

 

 

для оценки дисперсии генеральной совокупности -

выборочную

дисперсию

 

1

п

 

 

А

~

А 0

(1.25)

Я = (5)2 = - Ц - 1 ( х,- - ц)2-

« -1 ,=г

для оценки стандартного отклонения генеральной совокупности - выборочное стандартное отклонение

А/ А

а = т

(1.26)

1.3.2. Интервальные оценки

При использовании интервальных оценок вместо значения параметра выбирают длину интервала (а, Ь) так, чтобы он накрывал значение пара­ метра (р) с достоверностью 100-а %, т.е.

Р(а <х<Ь) = а.

(1.27)

Интервал (а, Ь) называют доверительным интервалом с уровнем до­ верия а (доверительной вероятностью 100-а %).

Оценивание генерального среднего на основе интервальной оцен­ ки. Если генеральная дисперсия а 2 известна, то интервал оценивания вы­ бирают исходя из зависимости

х± 1 ,9 6 -i.

(1.28)

Ып

 

Это означает, что точное значение математического ожидания для гене­ ральной совокупности находится в интервале

1,96-5=;

*+1,96-^= .

(1.29)

■yjn

V/I

 

Если генеральная дисперсия а 2 не известна, то интервал выбирают исходя из того, что выборочные средние подчиняются распределению Стьюдента (^-распределению) с числом степеней свободы (п - 1). Интервал в этом случае будет

*- <n-i(0j05)

S

(1.30)

*+r„_i(0,05)

 

■Jn-

1

Оценивание генеральной дисперсии на основе интервальной оцен­ ки. Если математическое ожидание ц не известно, то исходят из того, что для генеральной совокупности с нормальным распределением статистиче-

ская оценка

nS

2

/ ст

2

2

 

 

имеет %-распределение с числом степеней свободы

 

 

 

Л

 

(п - 1). Здесь

S

=ст2 - выборочная дисперсия. Отсюда

/>{ х" " ( 1 - § ) ' ^ * x" - ( f )} - 1 - < u i >

Доверительный интервал для генеральной дисперсии а 2 с уровнем досто­ верности (1 - а) составит

П =

(1.32)

Если математическое ожидание р известно и

п \ п

~

s 02 = - X (* ,-- n )2,

п ы\

 

то nSo /ст2 подчиняется распределению % с числом степеней свободы п.

Тогда доверительный интервал для генеральной дисперсии ст2 с уровнем достоверности (1 - а) составит

Q =

(1.33)

1.3.3. Проверка гипотез

Параметры генеральной совокупности определяются на основе огра­ ниченной выборки благодаря выдвижению предположений и их проверке. Заранее выдвинутое предположение называют гипотезой, а способ рассу­ ждения - проверкой гипотез. При этом выдвигаемое предположение при­ нимается за нулевую гипотезу HQ. Противоположное предположение при­ нимается за альтернативную гипотезу Н\.

Ошибки первого и второго рода. Всегда существует опасность от­ брасывания верной гипотезы на основе выборки. Такая ошибка называется ошибкой первого рода.

Случай, когда нулевая гипотеза не верна, но ее не отвергают на ос­ нове выборки, называют ошибкой второго рода.