книги / Автоматизация научных исследований
..pdfПусть
Тогда (рис. 4.14)
Нг.„ >? ..„)= |
(4.63) |
|
а |
4.7. Доверительный интервал и доверительная вероятность
Рассмотрим понятия точечной оценки и интервальной оценки.
л
Точечная оценка 0» =<р(л:|,х2 неизвестного параметра 0 опре
деляется одним числом. При выборке малого объема точечная оценка
д
0 Иможет сильно отличаться от оцениваемого параметра 0 , т.е. может приводить к большим ошибкам.
При малом объеме выборки используется интервальная оценка. Ин тервальная оценка определяется двумя числами - концами интервала.
Чтобы получить представление о точности и надежности оценки
л
0 » параметра 0 , в статистической обработке результатов измерений используются понятия доверительного интервала и доверительной вероятности.
л
Пусть по данным выборки получена оценка 0» неизвестного пара-
л
метра 0. Оценка 0» тем точнее определяет параметр 0, чем меньше
Л Л
разность 0 - 0 » . Если 8 > 0 и 0 - 0 » < s , то чем меньше 8 , тем точнее
оценка 0». Следовательно, число е характеризует точность оценки.
л
Доверительной вероятностью оценки 0» называется вероятность
Р = (1 - а ) , с которой выполняется неравенство 0 - 0 » < 8 . Обычно
доверительная вероятность оценки задается заранее. Наиболее часто полагают:
1 - а = 0,95; 1 - а = 0,99;
1- а = 0,9973; 1- а = 0,999.
Имеем |
|
|
|
|
е-е„ < е У= 1- а |
(4.64) |
|
или |
|
|
|
/Ч 0/,- 8 < 0 < 0л + Б У= 1 - а , |
(4.65) |
||
т.е. вероятность того, что |
интервал |
0 ,,-е,0 „ + 8 |
заключает в себе |
неизвестный параметр 0, равна 1 - а . Интервал |
0 ,,-е,0 „+Е назы- |
||
вается доверительным интервалом (рис. 4.15). |
|
||
6 |
|
|
|
- к - |
|
|
|
J___ 1 |
L |
|
|
0 м Б |
0м |
0 Н + Б |
|
Рис. 4.15
Длина доверительного интервала равна 2 s.
4.8. Корреляционный анализ
Задача корреляционного анализа заключается в исследовании свя зи между двумя случайными величинами X и У ,в исследовании сте пени близости этой связи к функциональной зависимости у = / (х).
На рис. 4.16 показана схема измерения случайных величин X и У Задача корреляционного анализа решается с помощью определе
ния коэффициента корреляции вида
(4.66)
где
Кху= М [ { Х - т х){У-т>)\-
тх =М[Х\,ту =М[У\,
ах=Щ х\-,оу=^Ъ[У]-
D[X] = М[(Х - тх)2];ЦУ] = М[(У - ту)2].
Здесь mx,mv - математические ожидания случайных величин X и Y ;
<Ух,ау - среднеквадратические значения случайных величин I и F;
D[X],D[Y] - дисперсии случайных величин X и Y
Исследуемый |
У |
> |
Датчик |
объект |
|
> |
Датчик |
Рис. 4.16
Коэффициент корреляции р принимает значения от - 1 до +1, т.е. (4.68)
При статистической обработке результатов измерений мы опреде
л
ляем не сам коэффициент рху, а оценку коэффициента корреляции ptl, по выборке (х1,.у1),(х2,>'2),...,(хп,^п). Здесь х,,/ = 1,2,...,и - элементы выборки случайной величины X ; yt,i = 1,2 ,...,и - элементы выборки случайной величины Y
Оценка коэффициента корреляции определяется по формуле
л-ХО< - т*)(у, -ту)
(4.69)
Л Л
Or Or
где
(4.70)
<у.г~ = - Ц х, ~тхУ\ о / =~2,(У, ~ту)2.
Формула (4.69) может быть приведена к виду
пЛ Л
Y,x,y, -пт<ту
(4.71)
По формуле (4.71) удобнее вести расчеты вручную. На рис. 4.17
л
показана зависимость Y от X при р =1 (см. рис. 4.17, а) и при
л
Pv =-1 (см. рис. 4.17, б).
Рис. 4.17
На рис. 4.18 показана зависимость Y от X при рТ1.« 0,8 (см. рис. 4.18, а)
д
и при р * -0,8 (см. рис. 4.18, б).
|
W . |
|
.• «• |
\ |
\ |
|
||
|
Рх, 550.8 |
|
|
P.W~ ~0,8 |
|
|
+Х |
-+Х |
Рис. 4.18
На рис. 4.19 показана зависимость Y от X при 0 < р х>. <1
(см. рис. 4.19, а и 4.19, б).
На рис. 4.19,б имеет место нелинейная корреляция между X и У
••• •••<
о < р < 1
0 < р„ < 1
Рис. 4.19
Р,, «О
О |
-> |
X |
|
|
Рис. 4.20 |
На рис. 4.20 показана зависимость Y от X при рху ~ 0, а также
видно отсутствие корреляции между X и Г
4.9.Проверка гипотезы о равенстве нулю коэффициента корреляции рТ).
Выдвигается гипотеза Н0: ptv = 0 против альтернативной гипоте
зы Н, :pv;, *0 .
Рассмотрим случайную величину
л
Z = —In 1 + р.„
2
1-Р,
Случайная величина Z при небольших п (п< 50) и при совокуп ности случайных величин X, Y , имеющих нормальный закон распре деления, приближенно подчиняется нормальному закону распределе ния с математическим ожиданием
m,=M[Z) =- In |
1 + Рлху |
(4.73) |
|
|
2 |
1 ~ Р * у |
|
|
|
|
|
и дисперсией |
|
|
|
D[Z] = а] = |
1 |
(4.74) |
|
|
|
п - 3 |
|
Введем в рассмотрение случайную величину £,, |
|
||
Z - m . |
|
(4.75) |
|
4 = - |
а. |
|
|
|
|
||
где |
|
|
|
МШ = 0 ; |
Щ ] = 1 . |
|
Случайная величина £, имеет нормальный закон распределения (рис. 4 .2 1 ):
1 £
№ ) = л/2 л
где £> - возможные значения случайной величины £,.
Рис. 4.21
При справедливости гипотезы Н0 имеем т2 - 0. Тогда
5- ^ - .
а.
е 2
Если £, > t,al2 или |
, то гипотеза Н0 откло- |
няется, т.е. корреляционная зависимость случайной величины Y от |
|
случайной величины X |
является статистически значимой. Здесь Е,аП |
определяется из соотношения
Область применения гипотезы Н0 о равенстве нулю коэффициен та корреляции определяется неравенством
—^а/2 —£ —£а/2 •
На рис. 4.21 S0 обозначает область принятия гипотезы Н0, S', - область отклонения гипотезы Н0.
Из соотношений (4.76), (4.72), (4.74) имеем
л
(4.77)
Контрольные вопросы
1 . Что понимается под генеральной совокупностью и выборочной совокупностью случайной величины X ?
2.Какими свойствами должна обладать выборка случайной вели чины X ?
3.Какие задачи решаются при статистической обработке резуль татов измерений случайной величины X ?
4.Какие статистические характеристики случайной величины X оцениваются по выборке?
л
5. Какая оценка 9 „ параметра 0 является несмещенной?
л
6 . Какая оценка 0„ параметра 0 является состоятельной?
л
7. Какая оценка 0„ параметра 0 является эффективной?
л
8 . Какая оценка 0„ параметра 0 является достаточной?
9.Какие достоинства и недостатки присущи методу моментов
иметоду максимума правдоподобия?
10.От какого параметра зависит закон распределения % 2 ?
11.Какой формулой определяется случайная величина, подчи няющаяся закону распределения Стьюдента?
12.Какой формулой определяется случайная величина, подчи няющаяся закону распределения Фишера?
13.Что понимается под понятиями «доверительный интервал»
и«доверительная вероятность»?
14.Что понимается под задачей корреляционного анализа?
15.Какое неравенство должно выполняться при справедливости
гипотезы о равенстве нулю коэффициента корреляции рtv ?
ГЛАВА 5. ПОСТРОЕНИЕ МАТЕМАТИЧЕСКОЙ МОДЕЛИ ИССЛЕДУЕМОГО ОБЪЕКТА С ПОМОЩЬЮ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ
5.1. Статистические математические модели исследуемого объекта
В некоторых отраслях производства, в частности в химической промышленности, производственные и исследовательские системы являются особенно сложными. Многие проблемы недостаточно про работаны, так что экспериментальные исследования на лабораторных, опытных и промышленных установках играют особую роль. На соз дание экспериментальных установок и на проведение экспериментов здесь приходится тратить много времени и средств.
С помощью традиционных методов не удается обеспечить тре буемые темпы развития ни в фундаментальных, ни в прикладных ис следованиях. Поэтому в науке, технике и производстве при решении разнообразных задач во все больших масштабах применяются новые эффективные методы исследования. При этом особое внимание уде ляется моделям процессов, протекающих в исследуемом объекте, и способам построения этих моделей.
Для эффективного анализа механизма явлений и управления про изводственными процессами необходимо выявить взаимосвязь между факторами, определяющими ход процесса, и представить их в коли чественной форме - в виде математической модели. Математическая модель является математическим отображением наиболее существен ных сторон процесса. Модель позволяет получать информацию
опроцессах, протекающих в исследуемом объекте.
Взависимости от источника информации, используемого при по строении математической модели, различают физико-химические мо дели, называемые также иногда аналитическими или теоретическими,
истатистические модели. В первом случае за основу берутся физико химические закономерности моделируемых процессов. Построение теоретических моделей сопряжено с проведением обширных и дли тельных исследований. Статистические модели получаются в резуль тате статистической обработки экспериментальных данных, собран ных на исследуемом объекте.
Статистические модели имеют относительно простую структуру. После установления структуры модели необходимо численно оценить
по экспериментальным данным параметры модели. В зависимости от того, как эти параметры входят в модель, говорят о линейных и нели нейных по параметрам моделях. Кроме того, различают модели ли нейные и нелинейные по независимым переменным.
Все переменные, определяющие состояние исследуемого объекта, можно разделить на три группы (рис. 5.1)
|
> |
+У\ |
*2 |
> Исследуемый |
+У2 |
Х„ |
объект |
|
> |
+Ут |
d\ di |
dr |
Рис. 5.1
В группу X = (хрх2,...,х;|) входят контролируемые входные факто ры или независимые переменные на входе объекта. Переменные группы
Y = {У\.у1,-.-,ут) называют выходными. Группу D = (d{,d2,...,dr) обра
зуют неконтролируемые факторы. Они характеризуют действующие на объект возмущения, которые не могут бьггь измерены количественно. Временные характеристики, точки приложения и интенсивность дейст вия этих возмущений носят случайный характер.
Часто задача состоит в том, чтобы определить зависимость между выходными и входными переменными исследуемого объекта или найти значения входных факторов, обеспечивающие достижение экс тремума (максимума или минимума) некоторой выходной перемен ной (возможно, при каких-то ограничениях). Это означает, что пере менные группы Y часто выступают в качестве целевых величин при оптимизации исследуемог о объекта.
На практике встречаются процессы в исследуемом объекте, харак тер протекания которых детерминированным образом зависит от опре деленных величин Х|,х2,...,хп. Например, выходу некоторого иссле дуемого объекта (химический реактор) может определяться значением давления Р , температуры Т и времени протекания реакции t . Пере менные х,,х2,...,хл называют, как уже говорилось выше, входными контролируемыми или независимыми переменными, и их возможные