Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистические исследования контроля качества в автоматизированных системах

..pdf
Скачиваний:
0
Добавлен:
12.11.2023
Размер:
6.86 Mб
Скачать

Рис. 3.6. Кривые распределения случайной величины X: а – одномодальная; б – двухмодальная; в – антимодальная

m2 m1

 

Mo = x0 + h (m2 m1 ) + (m2 m3 ) ,

(3.5)

где x0 – начальная (нижняя) граница модального интервала; h – ве-

личина интервала; m2 – частота модального интервала; m1 – частота интервала, предшествующего модальному; m3 – частота интервала, следующего за модальным.

В ряду с неравными интервалами мода определяется в интервале, имеющем наибольшую плотность распределения, и в формуле вместо m1, m2, m3 принимаются соответствующие плотности распределения.

Математическое ожидание – среднее взвешенное по вероятностям значение случайной величины и определяется как сумма произведений всех возможных значений случайной величины на вероятности этих значений:

n

 

Mx = xi Pi .

(3.6)

i=1

Выражение (3.6) справедливо для дискретных случайных величин. Для непрерывных величин математическое ожидание случайной величины X, имеющей плотность распределения f (х), вычисляется по формуле

31

+∞

 

M x = x f (x) dx.

(3.7)

−∞

Статистической оценкой математического ожидания является выборочное среднее арифметическое значение случайной величины – сумма значений рассматриваемой величины, полученных по результатам испытания выборки, деленная на ее объём:

 

 

 

1

n

 

 

 

=

xi mi ,

(3.8)

x

 

 

 

 

 

N i=1

 

где mi – частота появления xi.

Математическое ожидание (среднее арифметическое значение) случайной величины называют часто центром рассеяния или центром группирования случайной величины. Математическое ожидание является оценкой истинного значения измеряемой величины.

Медианой случайной величины (Ме) называется значение, для которого

Р(х < Ме) = Р(х > Ме),

то есть вероятность появления случайной величины, меньшей, чем медиана, или большей, чем медиана, одинакова (рис. 3.7).

f(x)

x

Ме

Рис. 3.7. Геометрическая медиана

32

Геометрическая медиана – это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам:

Ме

 

f (x) dx = f (x) dx.

−∞

Ме

В случае симметричного одномодульного распределения медиана совпадает с математическим ожиданием и модой:

Ме = Мх = Мо.

Ввиду того, что величина Х является случайной, фактические значения ее будут лежать как правее, так и левее среднего значения.

Для нахождения медианы (значения признака у средней единицы ранжированного ряда) используют ряд накопленных частот. Медианным является интервал, в котором накопленная численность единиц совокупности составляет более половины их общего числа (накопленная относительная численность более 50 %).

Сначала определяется порядковый номер медианы

m

,

 

2

 

 

 

 

 

а затем по накопленным частотам определяется либо сама медиана (для дискретных рядов), либо медианный интервал (для интервальных рядов), в котором путем простой интерполяции рассчитывается значение медианы по формуле

 

 

m

m

Me1

 

 

Me = x0

+ h

2

 

,

(3.9)

 

 

 

mMe

 

 

 

 

 

 

 

где x0 – нижняя граница медианного интервала; h – величина меди-

анного интервала; m – порядковый номер медианы; mMe1 – на-

2

копленная частота до медианного интервала; mMe – частота медианного интервала.

33

Медиану используют вместо средней арифметической, когда крайние варианты ранжированного ряда (наименьшая и наибольшая) по сравнению с остальными оказываются чрезмерно большими или чрезмерно малыми.

Мерой рассеяния случайной величины Х около ее среднего значения x служит стандартное (или среднее квадратическое) отклонение σ:

 

 

 

1

n

 

σ =

(xi M x )2 .

(3.10)

 

 

 

 

N i=1

 

Для непрерывной случайной величины σ определяется по

формуле

 

 

1

n

 

σ =

(xi Mx )2 f (x) dx .

(3.11)

 

 

N i=1

 

Когда оценка стандартного отклонения осуществляется на основе статистических данных, ее называют выборочным средним квадратическим отклонением, обозначают буквой S и определяют по формуле

n

(xi x )2

S =

i=1

 

.

(3.12)

 

N 1

 

 

 

 

С целью экономии времени и уменьшения ошибок при подсчетах S, когда n велико, а хi – большие или нецелые числа, следует использовать тождество:

n

n

1

n

 

(xi

 

)2

= xi2

xi2 .

(3.13)

x

 

i=1

i=1

N i=1

 

При этом для определения σ по данным непосредственных измерений (формула (3.12)) погрешность определения среднего

34

квадратического, обозначаемого в этом случае буквой S, зависит от общего количества N измерений изучаемого признака и в отдельных случаях весьма значительно. Учитывая это обстоятельство, для предотвращения возможного появления брака целесообразно при использовании формулы ω 6 σ (поле рассеяния, определяемое кривой Гаусса) принять соотношение:

σ = kσ S,

где kσ коэффициент, учитывающий погрешность определения среднего квадратического (табл. 3.1); S – среднее квадратическое,

определяемое по формуле (3.12).

 

 

 

 

 

 

 

Таблица 3 . 1

Значения максимальной погрешности

S определения S

 

 

 

 

 

 

N, шт.

S, %

kσ

N, шт.

S, %

kσ

25

42,4

1,40

200

15,0

1,15

 

 

 

 

 

 

50

30,0

1,30

300

12,2

1,12

 

 

 

 

 

 

75

25,0

1,25

400

10,6

1,11

 

 

 

 

 

 

100

21,2

1,20

500

10,0

1,10

 

 

 

 

 

 

Для характеристики разброса значений случайной величины относительно ее математического ожидания используют вторую меру рассеяния – дисперсию (означает рассеивание). Ее значение возрастает с увеличением рассеяния результатов наблюдения.

Дисперсия определяется по формулам (3.13)…(3.15):

n

 

Dx = σ2 = (xi M x )2 Pi ,

(3.14)

i=1

где хi− дискретная случайная величина. Для непрерывной случайной величины хi дисперсия определяется по формуле

+∞

 

Dx = M (x Mx )2 = (xi Mx )2 f ( x)dx.

(3.15)

−∞

35

Дисперсия эмпирических данных вычисляется по формуле

n

(xi x )2

Dx =

i=1

 

(3.16)

 

N 1

 

 

 

Пример 3.2. Проведем расчёт средней арифметической, моды и медианы по данным интервального ряда (сгруппированным данным) согласно табл. 3.2.

Для расчёта средней арифметической используем середины интервалов в качестве значений признаков, что несколько исказит результат, поскольку априори полагаем, что внутри групп распределение равномерное.

Допущение: исходя из того, что для открытых интервалов расчёт, строго говоря, не возможен, в этом случае берут величины предыдущих (последующих) интервалов, либо для расчета в качестве средней арифметической используют моду или медиану.

 

 

Таблица 3 . 2

Производительность труда на предприятии N

 

 

 

Производительность

Число работников,

Накопленная

труда, изделий в час, хi

mi

частота, ∑mi

0…20

20

20

20…40

40

60

40…60

35

95

60…80

30

125

80…100

25

150

Решение. Рассчитаем среднюю арифметическую величину:

x = 10 20 + 30 40 + 50 35 + 70 30 + 90 25 = 50. 150

Для расчёта моды по табл. 3.2 определяем, что второй интервал является модальным (мода находится в интервале от 20 до 40). Далее применяется формула (3.5):

36

Мо= 20 + 20

40 20

= 36.

(40 20) + (40 35)

Для расчёта медианы определяем накопленную частоту, которая превышает половину суммы накопленных частот (в нашем случае – 75) и находится в третьем интервале, то есть имеет значение между 40 и 60. Для точного расчёта применяется формула (3.9):

 

 

150

60

 

 

 

Мe= 40+ 20

2

 

 

= 48,57.

 

 

 

 

 

 

 

 

 

35

 

 

 

 

Используя формулы (3.10)–(3.13), произведем расчёт мер рас-

сеяния (среднего квадратического и дисперсии):

 

S =

20 (1050)2

+ 40 (3050)2 + 35 (50

50)2 + 30 (7050)2 + 25 (9050)2

=

 

 

 

 

 

 

 

150

1

 

 

 

=671,14 = 25,91;

σ= 1,175 · 25,91 = 30,44; Dx = 926,59.

3.5.РАСЧЁТ МЕР ПОЛОЖЕНИЯ И РАССЕЯНИЯ КРИВОЙ

РАСПРЕДЕЛЕНИЯ В ПРОГРАММЕ «STATISTICA 8»

Приведем расчёты мер положения и рассеяния случайной величины в программном продукте «STATISTICA 8», используя в качестве изучаемого признака (xi) размер детали (приложение 1 «Исходные данные»).

На первом этапе работы с программой необходимо сформировать (загрузить) исходные данные (101 значение) и отсортировать их в порядке возрастания (рис. 3.8). Для этого необходимо использовать либо открытую по умолчанию электронную таблицу («Spreadsheet»), либо создать новую, выбрав в основном меню «File» пункт «New» (вкладка «Spreadsheet»).

37

Рис. 3.8. Формированиеисходных статистическихданных

в программе «STATISTICA 8»

Для того чтобы осуществить предварительную обработку исходных статистических данных (например, группирование по частотам) и провести их описательный анализ, а также вычислить парные и частные корреляции, используют модуль «Основные стати-

стики и таблицы» – «Basic Statistics/Tables».

На основной панели программы в меню «Statistics» выбрать пункт «Basic Statistics/Tables» (рис. 3.9).

Частоты или одновходовые таблицы представляют собой простейший метод анализа категориальных переменных. Часто их используют как одну из процедур разведочного анализа, чтобы посмотреть, каким образом различные группы данных распределены в выборке. При этом исходные данные представляются в виде частот наблюдений, попавших в некоторые, определенные исследователем, категории или классы. Из списка выбираем таблицы частот –

«Frequency tables» (рис. 3.10).

Для построения таблицы частот необходимо выбрать исходные статистические данные (рис. 3.8), то есть в качестве переменных («Variables») использовать первый столбец с названием «input_data_1», которыйпо умолчанию именуется как «Var1» (рис. 3.11).

38

Рис. 3.9. Меню «Statistics» на основной панели программы

Рис. 3.10. Окно «Basic Statistics/Tables»

39

Рис. 3.11. Внешний вид меню «Frequency Tables»

Далее для построения таблицы частот и полигона (практического распределения случайной величины) выбираем процедуры под названиями «Summary: Frequency tables» и «Histograms».

В результате получаем таблицу и гистограмму, представлен-

ные на рис. 3.12 и 3.13.

Для того чтобы произвести расчёт мер положения и рассеяния кривой распределения в окне «Basic Statistic/Tables», выберем опи-

сательные статистики – пункт «Descriptive statistics» (см. рис. 3.10).

Описательные статистики предоставляют исследователю основную информацию относительно различных мер положения и рассеяния кривой распределения: среднее, мода, медиана, дисперсия, минимальное и максимальное значения, а также характеристики формы распределения.

В появившемся окне (рис. 3.14) в качестве переменных «Variables» выбираем колонку «input_data_1». Во вкладке «Advanced» от-

метим следующие расчётные величины: «Mean» – арифметическое среднее, «Median» – медиана, «Mode» – мода, «Standart Deviation» –

40

Соседние файлы в папке книги