Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Организация и математическое планирование эксперимента.-1

.pdf
Скачиваний:
0
Добавлен:
20.11.2023
Размер:
1.64 Mб
Скачать

объеме выборки равно оцениваемому параметру. Эффективность выборки обратно пропорциональна дисперсии оценки параметра.

Для получения оценок наиболее распространен метод

максимального правдоподобия.

Сущность метода максимального правдоподобия заключается в нахождении таких оценок неизвестных параметров, для которых функция правдоподобия будет иметь максимальное значение. Для нормального распределения случайной величины метод максимального правдоподобия дает среднее арифметическое a и математическое ожидание mx a:

a n ai ,

i 1 n

и выборочную дисперсию

si2 n (ai na)2 .

i 1

Оценка дисперсии оказывается несколько смещенной, поэтому несмещенное значение si2 вычисляют по формуле

n

(a a)2

 

si2

i

.

n 1

i 1

 

Уменьшение знаменателя на единицу связано с тем, что величина a, относительно которой берутся отклонения, сама зависит от элементов выборки. Каждую величину, зависящую от элементов выборки и входящую в формулу выборочной дисперсии, называют связью.

Знаменатель выборочной дисперсии всегда равен разности между объемом выборки и n и числом связей l, наложенных на эту выборку:

f n l.

Эту разность называют числом степеней свободы выборки f.

21

Все ошибки наблюдений классифицируют как грубые (из-за нарушения условий измерений), систематические (постоянные во всей серии измерений, их устраняют введением поправок) и случайные (обусловленные большим числом факторов столь незначительных, что их нельзя выделить в отдельности). В дальнейшем будут рассмотрены только случайные ошибки измерений.

Закон сложения ошибок. Для независимых случайных величин свойством аддитивности обладают дисперсии, а не среднеквадратичные ошибки. Если Х1 + Х2 + … + Хn – независимые случайные величины, которые можно интерпретировать как n независимых наблюдений одной и той же случайной величины, тогда

sa2 sa2 . n

Практический вывод состоит в том, что при более высокой точности метода можно добиться более точного результата даже при меньшем времени эксперимента.

Измерения делят на прямые и косвенные. В первом случае определенная величина определяется непосредственно, при косвенных измерениях она задается некоторой функцией от непосредственно измеряемой величины. Дисперсия косвенного измерения σz2 определяется так же, как обычная дисперсия, только отклонения берут от среднего косвенного измерения az. Ее можно найти, зная дисперсии отдельных наблюдений и вид функции f. На практике определяют выборочные дисперсии sxi2 и по ним выборочную дисперсию косвенного измерения sz2, которая слу-

жит оценкой генеральной дисперсии σz2.

sz2 определяют по закону сложения дисперсий (закон на-

копления ошибок):

2

n

 

df

2

2

sz

 

 

 

sxi ,

 

 

i 1

dxi

 

где dxdfi – частная производная.

22

Математическое ожидание (среднее) и дисперсия генеральной совокупности оценивают средним и дисперсией выборки тем точнее, чем больше объем выборки. При этом среднее характеризует результат измерений, а дисперсия точность этого результата (дисперсия воспроизводимости). Если при неизмен-

ных условиях проведено m параллельных опытов и получена выборка у1, у2, …, уu значений измеряемой величины, то дисперсия воспроизводимости

 

 

2

m

yu y 2

,

 

 

sвоспр

m 1

 

 

 

u 1

 

где y

um 1yu

,

 

 

 

m

 

 

 

 

 

 

 

 

откуда ошибка воспроизводимости (опыта)

Sвоспр Sвоспр2 .

При равном числе параллельных опытов общая дисперсия воспроизводимости равна среднеарифметическому значению частных дисперсий. При этом число степеней свободы общей дисперсии

fвоспр n m 1 ,

и тогда

2

n m

yiu yi 2

 

Sвоспр

 

.

n m 1

 

i 1 u 1

 

Число степеней свободы у общей дисперсии воспроизводимости гораздо больше, чем у каждой частной дисперсии в отдельности. Исходя из этого общая дисперсия воспроизводимости намного точнее оценивает дисперсию генеральной совокупности воспр2 . При вычислении sвоспр2 по текущим измерениям

23

объединяют только те пробы, которые можно рассматривать как выборки из генеральных совокупностей с равными дисперсиями. Каждое из значений s12, s22, …, sn2 можно рассматривать как оценку одной и той же генеральной дисперсии.

Поскольку оценка отклонений носит вероятностный характер, можно лишь указать вероятность той или иной погрешности. Для этого в математике используют доверительный ин-

тервал и доверительную вероятность.

Пусть для генерального параметра а из опыта получена несмещенная оценка а*. Нужно оценить возможную при этом ошибку. Назначим достаточно большую вероятность β, такую, что событие с вероятностью β можно считать практически достоверным, и найдем такое значение ε = f (β), для которого

P a* a .

Диапазон практически возможных ошибок при замене а на а* будет ±ε, большие по абсолютной величине ошибки будут появляться только с малой вероятностью

p 1 ,

называемой уровнем значимости (т.е. вероятность, с которой гипотеза может быть отвергнута). Иначе полученные выражения для β можно интерпретировать как вероятность того, что истинное значение параметра а лежит в пределах

a* a a* .

Вероятность β называют доверительной вероятностью,

она характеризует надежность полученной оценки, а интервал

а*±ε называют доверительным интервалом.

Для построения доверительного интервала необходимо знать распределение математического ожидания mx, наилучшей оценкой которого является среднее выборки ā.

24

Нормальное распределение нормированной случайной величины (т.е. значение величины поделено на ее среднеквадратичное отклонение V = x/σ) называют стандартным. Его функция распределения имеет вид

F0 x

1

x x2

e 2 dx.

2

График этой функции представлен на рис. 2.1.

Рис. 2.1. График функции F0(x) стандартного нормального распределения нормированной случайной величины

Функцию Ф (х) = F0 (x) – 1/2 называют функцией Лапласа:

Ф x F0 x F0 0

1

x x2

0e 2 dx.

2

Значения функции Лапласа приводят в таблицах, эта функция нечетная, а значит, Ф x Ф x и таблицы составлены

лишь для значений х больше нуля.

Функцию Лапласа используют для определения β:

P x mx x ср .

25

Задавшись доверительной вероятностью β, по таблицам

функции Лапласа определяют k

 

. Тогда доверительный

 

 

x ср

интервал для математического ожидания имеет вид

xср k x ср mx xср k x ср

или с учетом закона сложения ошибок Sa2 Sa2 n

xср k nx mx xср k nx .

Из представленных оценок видно, что для уменьшения возможной ошибки в 2 раза необходимо увеличить число наблюдений в 4 раза.

Пример расчета доверительного интервала при известном генеральном стандарте (среднеквадратичном отклоне-

нии). Средняя температура в печи, полученная по четырем независимым измерениям оптическим пирометром, – 2250 С. Ошибка при таком методе измерения 10 С. Найти с надежностью 95 % доверительные границы, внутри которых лежит истинное значение измеряемой температуры.

Решение. Полагаем, что ошибка измерения – это известный генеральный стандарт σх = 10 °С и что случайная величина Х (температура печи) распределена нормально. Имеем

xср k nx mx xср k nx ;

2250 k 104 mx 2250 k 104 ;

2240,2 mx 2259,8,

при β = 95 % k = 1,96 (табл. 2.1).

26

Таблица 2.1

Квантили нормального распределения

p

1

p

 

k

p

1

p

 

k

 

 

 

2

 

 

 

2

 

 

0,80

0,60

 

0,25

0,05

0,975

1,96

0,50

0,75

 

0,67

0,04

0,980

2,05

0,40

0,80

 

0,84

0,02

0,990

2,33

0,30

0,85

 

1,04

0,01

0,995

2,58

0,25

0,875

1,15

0,005

0,9975

2,81

0,20

0,90

 

1,28

0,002

0,999

3,09

0,15

0,925

1,44

0,001

0,9995

3,29

0,10

0,95

 

1,64

0,0001

0,999 95

3,89

Закон распределения а* зависит от закона распределения случайной величины Х, в частности от самого параметра а. Чтобы исключить это затруднение:

1)при n ≥ 50 заменяют в выражениях для ε неизвестные параметры их оценками;

2)переходят от случайной величины а* к другой, распределение которой не зависит от оцениваемого параметра а, а зависит только от n и вида закона распределения Х.

2.2. Проверка статистических гипотез

Под статистическими гипотезами понимают некоторые предположения относительно распределений генеральной совокупности случайной величины. Проверка гипотезы заключается в сопоставлении критериев проверки (критериев значимости),

вычисленных по выборке, со значениями этих показателей, определенных в предположении, что проверяемая гипотеза верна. При проверке гипотез подвергается испытанию некоторая гипотеза в сравнении с альтернативной или альтернативными, если их несколько. Чтобы принять или отвергнуть гипотезу, еще до получения выборки задаются уровнем значимости р (обычно 0,05; 0,02; 0,01; 0,001), которому соответствует доверительная

27

вероятность 1 p. По этой вероятности, используя гипотезу

о распределении оценки * (критерий значимости), находят квантильные доверительные границы, как правило симметрич-

ные p и 1 p . Числа p и 1 p называют критическими значе-

 

2

 

2

 

2

 

 

2

 

 

 

 

 

ниями гипотезы; значения *

меньше

p

и больше

1 p

обра-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

2

 

зуют критическую область, или область непринятия гипотезы. Если по выборке находится значение 0, которое попадает между

p и 1 p , то гипотеза допускает такое значение и нет оснований

22

ееотвергать. В том случае, когда 0 попадает в критическую об-

ласть, по данной гипотезе оно является практически невозможным, но так как оно все-таки появилось, то отвергается гипотеза.

2.3. Оценка математического ожидания нормально распределенной случайной величины

Математическое ожидание совпадает с истинным результатом наблюдений, поэтому так важно его знать. Генеральную дис-

персию 2 нельзя получить из наблюдений, ее можно только оценить при помощи выборочной дисперсии s2, ошибка от замены2x на s2 тем меньше, чем больше объем выборки n. При n ≥ 50 генеральный параметр x заменяют выборочным стандартом sx .

Для небольших объемов выборок доверительный интервал строят с помощью распределения Стьюдента (псевдоним английского статистика В. Госсена), или t-распределения:

t

xср mx

n

sx

.

 

 

Плотность распределения случайной величины t обычно обозначают t . Если дисперсия sx2 , среднее xср определены

28

по одной выборке, то число степеней свободы f n 1. При

стремлении числа степеней свободы к бесконечности выборочная дисперсия стремится к генеральной, поэтому распределение Стьюдента сближается с нормальным. Вероятность того, что случайная величина попадет в некоторый интервал (t p ; t1 p ), определяет выражение

22

 

 

 

 

 

1 p.

P t p t t

p

 

 

1

 

 

 

2

2

 

Из симметричности распределения Стьюдента следует

t p t1 p

2 2

или с учетом определения (формулы распределения Стьюдента) получаем неравенство

 

 

 

t

p sx

 

 

 

 

 

 

 

 

t

p sx

 

 

 

x

 

1

 

 

 

m

 

x

 

1

 

 

 

.

 

 

 

 

2

 

 

x

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ср

 

 

n

 

 

 

 

 

ср

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значения квантилей

 

t

p

 

для различных чисел степеней

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

свободы f и уровней значимости рприведены в табл. 2.2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.2

 

Квантили распределения Стьюдента

 

 

 

 

 

 

 

 

 

 

Уровень значимости р

 

 

Числостепеней

 

 

 

 

 

 

 

 

 

свободы f

0,20

 

0,10

 

 

0,05

 

0,02

 

0,01

 

0,005

0,001

1

3,08

 

6,31

 

12,71

 

31,82

 

 

63,66

 

127,32

636,62

2

1,89

 

2,92

 

 

4,30

 

6,97

 

 

9,93

 

14,09

31,60

3

1,64

 

2,35

 

 

3,18

 

4,54

 

 

5,84

 

7,45

12,94

4

1,53

 

2,13

 

 

2,78

 

3,75

 

 

4,60

 

5,60

8,61

5

1,48

 

2,02

 

 

2,57

 

3,37

 

 

4,03

 

4,77

6,86

6

1,44

 

1,94

 

 

2,45

 

3,14

 

 

3,71

 

4,32

5,96

7

1,42

 

1,90

 

 

2,37

 

3,00

 

 

3,50

 

4,03

5,41

8

1,40

 

1,86

 

 

2,31

 

2,90

 

 

3,36

 

3,83

5,04

29

Окончание табл. 2.2

Числостепеней

 

 

Уровень значимости р

 

 

свободы f

0,20

0,10

0,05

0,02

0,01

0,005

0,001

9

1,38

1,83

2,26

2,82

3,25

3,69

4,78

10

1,37

1,81

2,23

2,76

3,17

3,58

4,59

11

1,36

1,80

2,20

2,72

3,11

3,50

4,44

12

1,36

1,78

2,18

2,68

3,06

3,43

4,32

13

1,35

1,77

2,16

2,65

3,01

3,37

4,22

14

1,34

1,76

2,15

2,62

2,98

3,33

4,14

15

1,34

1,75

2,13

2,60

2,95

3,29

4,07

16

1,34

1,75

2,12

2,58

2,92

3,25

4,02

17

1,33

1,74

2,11

2,57

2,90

3,22

3,97

18

1,33

1,73

2,10

2,55

2,88

3,20

3,92

19

1,33

1,73

2,09

2,54

2,86

3,17

3,88

20

1,33

1,73

2,09

2,53

2,85

3,15

3,85

21

1,32

1,72

2,08

2,52

2,83

3,14

3,82

22

1,32

1,72

2,07

2,51

2,82

3,12

3,79

23

1,32

1,71

2,07

2,50

2,81

3,10

3,77

24

1,32

1,71

2,06

2,49

2,80

3,09

3,75

25

1,32

1,71

2,06

2,48

2,79

3,08

3,73

26

1,32

1,71

2,06

2,48

2,78

3,07

3,71

27

1,31

1,70

2,05

2,47

2,77

3,06

3,69

28

1,31

1,70

2,05

2,47

2,76

3,05

3,67

29

1,31

1,70

2,04

2,46

2,76

3,04

3,66

30

1,31

1,70

2,04

2,46

2,75

3,03

3,65

40

1,30

1,68

2,02

2,42

2,70

2,97

3,55

60

1,30

1,67

2,00

2,39

2,66

2,91

3,46

120

1,29

1,66

1,98

2,36

2,62

2,86

3,37

1,28

1,64

1,96

2,33

2,58

2,81

3,29

При доверительной вероятности 1 p оценка для слу-

чайной величины t сверху имеет вид

 

 

 

 

 

 

 

 

 

 

t t

 

,

x

m

 

s

x t

,

 

m

 

x

 

t1 p sx

;

 

 

x

 

 

 

x

 

 

 

 

 

 

 

 

 

 

1 p

 

ср

 

n

1 p

 

 

 

 

ср

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оценка для величины t снизу имеет вид

 

 

 

 

 

 

 

 

 

t t

,

x

m

s

x t

 

,

m

 

x

 

 

t1 p sx

.

x

 

 

 

x

 

 

 

 

 

 

 

 

 

1 p

 

 

ср

n

 

1 p

 

 

 

ср

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30

Соседние файлы в папке книги