книги / Автоматизация научных исследований
..pdfОпределим вероятность Р(-е < X < е). Имеем (рис 5.2)
|
Р(-е < X <s) = Р(-ъ |
<*/ |
<е) = |
|
|||
|
|
|
|
|
|
||
|
|
|
г2 |
|
|
t 2 |
|
|
= ff, (x)dx =- J = \e |
2 dx = -Д = (e ~2 dx. |
|
||||
|
-V' |
-J2n -L |
|
|
л/2л 0 |
|
|
Зададим эту вероятность: Р = (1 - а ) . В результате получим |
|
||||||
|
Р (-е< 4~Д, <е) = |
■ £1 |
|
|
|
|
|
|
\е 2 dx =Р = (\-а) =2Ф(е), |
(5.48) |
|||||
|
О/ |
О |
|
|
|
|
|
где Ф(е) - функция Лапласа, определяемая соотношением |
|
||||||
|
|
|
е |
t2 |
|
|
|
|
|
Ф(е) = —^= je |
|
2 die. |
|
(5.49) |
|
|
|
\ 2 TI о |
|
|
|
|
|
Из (5.48) имеем |
2Ф(е) = (1 - а ) . |
|
|
(5.50) |
|||
|
|
|
|
||||
Определим е из таблицы функции Лапласа из условия |
|
||||||
|
|
- , . |
1 - а |
|
|
|
(5.51) |
|
|
Ф(е) = —— • |
|
|
|||
В |
табл. 5.2 приведены значения |
доверительной вероятности |
|||||
(1 - а ) |
и соответствующие значения s , взятые из таблицы функции |
||||||
Лапласа. |
|
|
|
|
|
|
|
|
|
|
Таблица 5.2 |
|
|||
|
Доверительная вероятность (1 - а) |
6 |
|
||||
|
|
0,90 |
|
|
|
1,64 |
|
|
|
0,95 |
|
|
|
1,96 |
|
|
|
0,99 |
|
|
|
2,58 |
|
|
|
0,9973 |
|
|
|
3,00 |
|
Из (5.48) имеем |
|
|
|
|
|
|
|
|
Р(-еа, < а, - а, < еа() = 1 - а |
|
|
||||
или с учетом (5.40) |
|
|
|
|
|
|
|
|
Р ( - е ^ а |
< а, - а, < Су[с~а) =1 - а . |
(5.52) |
||||
Из (5.52) получим |
|
|
|
|
|
|
|
|
~ |
^ в/ |
е^с~(т) = 1 - а . |
(5.53) |
Доверительный интервал определяется как |
|
I = (а,-ел[с~о,а1+ел[с~1о). |
(5.54) |
При этом доверительный интервал I содержит в себе неизвестное значение а, с доверительной вероятностью Р = (1 - а ) , т.е. значение
а] попадает в доверительный интервал / с доверительной вероятно
стью Р = (1 - а ) .
Точность оценки неизвестного значения ai определяется как |
|
д = Еу[с~а |
(5.55) |
Длина доверительного интервала 1 равна 26, т.е. |
|
26 = 2бу[с~о. |
(5.56) |
Имеет место следующее неравенство с доверительной вероятностью
Р = (1 - а ) : |
|
|а,. - я,|<5. |
(5.57) |
5.2.3.3. Определение доверительного интервала для коэффициентов а, при неизвестной
дисперсии ошибок наблюдения о 2
Вобщем случае дисперсия ошибок наблюдения о2 не известна
идолжна быть оценена с помощью полученных экспериментальных данных. При этом может быть использована остаточная сумма квад ратов S(a) [см. (5.33), (5.34)]:
Si&) = SK= ' Z ( y ' - y ) 2 = Y - Y = (Y - Y ) T(Y - Y ) . |
(5.58) |
i=I |
|
Эта сумма квадратов имеет |
|
<р = ЛГ-*-1 |
(5.59) |
степеней свободы [N слагаемых, между которыми существует k +1 линейная связь, определяемая системой уравнений (5.37)].
Величина
а1
а" =
ф
является несмещенной оценкой дисперсии ошибок наблюдений сг Оценка а 2 для дисперсии ст2 вычисляется аналогично формуле (5.40) с помощью выражения
а? =сйа 2,/ = 0,1 ,2 ,...,*. |
(5.61) |
Величина
(5.62)
подчиняется распределению Стьюдента с ср степенями свободы (рис. 5.3).
На рис. 5.3 обозначено: - плотность распределения вероятно
стей случайной величины t'v; 7^ - возможные значения случайной величины 7^.
Вероятность того, что < > £ * 2 |
, определяется по формуле (рис. 5.3) |
w , > r ^ ) = |
(5.63) |
V<*/2
Из таблицы распределения Стьюдента (см. [13, с. 270]) для заданного а находим величину Т^а/2. Например, для ср = 30;а = 0,05;а/2 = 0,025 имеем
7' |
- 7' |
=2 042 |
• |
*4>;ot/2 |
\10;0,025 |
|
Вероятность того, что случайная величина t‘ попадает в интервал
(-^'а/2. |
(p';a/2)> запишется в виде |
|
|
|
||
п -т ^ п s< sг^д) = р ( - т; ^ |
< |
=i . |
(5.64) |
|||
Из (5.64) имеем |
|
|
|
|
|
|
|
рЫ т п°, £ а, -а, < Т;а/2а,) = 1 - а |
|
||||
ИЛИ |
|
|
|
|
|
|
|
р (а, ~ С /2^, ^ а<^ “, +С /2^-) = 1 - «• |
(5.65) |
||||
Выражение (5.65) с учетом формулы (5.61) имеет вид |
|
|||||
|
р (а, ~ (p'a/2 |
|
а, + |
^ ';а/2 ^ |
а ) = 1 - а . |
(5.66) |
Следовательно, доверительный интервал / |
вида |
|
||||
|
* = ( 4 -Х1-ф4сА |
Ч + ^.аплЯ,°) |
(5.67) |
|||
содержит |
в себе а( с |
заданной |
доверительной вероятностью |
|||
Р = (1 - а ) , т.е. значение |
а, |
попадает в доверительный интервал I |
||||
с доверительной вероятностью Р = (1 - а ) . |
|
|
||||
Точность оценки неизвестного значения а, определяется как |
||||||
|
|
8 , = й « / 2 л £ > |
|
(5 -6 8 ) |
||
Длина доверительного интервала I равна 26,, т.е. |
|
|||||
|
|
2 8 , - 2 ^ ^ - |
|
(5 -6 9 ) |
||
С доверительной вероятностью Р = (1 - а) |
имеет место следующее |
|||||
неравенство: |
|
|
|
|
|
|
|
|
|
|a ,- a ,|< 6 ,. |
|
(5.70) |
|
5.2.3.4. Проверка значимости коэффициентов а,,/ = 0,1,2,...,А: |
||||||
математической модели исследуемого объекта |
|
|||||
Для проверки значимости коэффициентов ani = 0,1,2,..., А |
матема |
|||||
тической модели исследуемого объекта используется величина |
||||||
|
|
С |
= - ^ |
г‘ = °^2,...,А, |
(5.71) |
|
|
|
|
сг |
|
|
|
которая имеет распределение Стьюдента с числом степеней свободы Ф. Выдвигается гипотеза Н0: а, = 0, т.е. коэффициент а, считается незначимым. При этом альтернативная гипотеза формулируется сле дующим образом: Я,: а,* 0, т.е. коэффициент а, считается значи мым и значительно отличается от нуля.
При проверке гипотезы Я0: а, = 0 используется величина
<=■?-,/= 0,1,2 |
(5.72) |
имеющая распределение Стьюдента с числом степеней свободы ф (рис. 5.4).
На рис. 5.4 обозначено: /((,') |
- |
плотность распределения вероятно |
стей случайной величины t'^; |
- |
возможные значения случайной ве |
личины 7 ; а - уровень значимости, который выражает вероятность того, что гипотеза Я0 отвергается, когда в действительности она вер на; S0 - область принятия гипотезы Я0; 5, - область отклонения ги потезы Я0; 7ц.ф - критическое значение распределения Стьюдента при известных ф и а .
Критическая область 5, для случайной величины 7 задается не равенствами
или |
|
|
|
|
|
|
|
|
(5.74) |
Область SQдля случайной величины t' |
задается неравенством |
|||
|
—t ‘ |
< t‘ |
< t ' |
’ |
|
*q>;a/2 |
“ |
~ V,a/2 |
|
Запишем вероятность выполнения неравенства (5.74). Имеем |
||||
|
|
|
|
(5.75) |
Вычисленная величина |/ф| сравнивается с критическим значением |
||||
/ф'.а/2. Если |
|/,'р| > Хё-ап’ то нУлевая гипотеза |
Н0: а, = 0 на уровне зна |
||
чимости а |
отвергается, т.е. коэффициент я, является значимым |
и существенно отличается от нуля. Напротив, если |^| < ^р'а/2, то нуле вая гипотеза Я0: Ц = 0 принимается, т.е. коэффициент я, является незначимым и, следовательно, нельзя утверждать, что коэффициент я, существенно отличается от нуля.
Заметим, что в общем случае оценка я, и ее дисперсия зависят от оценок всех других коэффициентов ap j * i
Если тот или иной член исключается из уравнения математиче ской модели (например, из-за незначительности соответствующего коэффициента), необходимо пересчитать оценки всех остальных ко эффициентов и их дисперсии. При этом могут измениться как довери тельные интервалы для коэффициентов, так и выводы относительно значимости коэффициентов.
Пример 5.2. Продолжим рассмотрение примера 5.1. Рассчитаем прежде всего Y Имеем
65,4
55.1
44,8
55.1
Найдем остаточную сумму квадратов S,{ по формуле (5.58). Получим
Slt = 4(0,1) 2 = 0,04.
Мы имеем N = 4 эксперимента и £ + 1 = 3 оцениваемых параметра а0,а] ,а2. Тогда число степеней свободы ср = 1. В силу (5.60) получаем
ст = Д 0 4 = 0 ,2 .
В данном случае си = и а, = д/с~а = 0,1.
Для а = 0,1;а/2 = 0,05;ср = 1 из таблицы распределения Стьюдента на ходим 7’.а/2 = ('0>05 = 6,3 и \а, - а , |<0,63.
Таким образом, с доверительной вероятностью Р = (1 - а) = 0,9 получаем [см. (5.65)]:
55,1 - 0,63 < а0 <55,1 + 0,63;
5,15 - 0,63 <а, < 5,15 + 0,63;
5,15- 0,63 <а2<5,15 + 0,63.
5.2.4. Ошибки при выборе вида математической модели исследуемого объекта
Результаты, относящиеся к методу наименьших квадратов и из ложенные в разделах 5.2.2 и 5.2.3, были получены в предположении, что модель вида (5.11) является адекватной (т.е. модель соответствует действительности). Метод, позволяющий проверить, можно ли неко торую модель рассматривать как адекватную, будет рассмотрен ниже в разд. 5.2.5. Здесь же мы проанализируем лишь последствия, возни кающие при неправильном выборе вида модели.
Рассмотрим случай, когда модель имеет следующий вид:
У = "o/oW + ЩМх) +... + a j k(х) + (х) +... + b,g,(x). |
(5.76) |
Здесь а, и 6, - истинные значения параметров модели, а /(х )
и &,(*) - известные функции независимых переменных хрх2,...,х(1.
Выражение (5.76) можно записать в форме
y = aTf(x) +b Tg(x), |
(5.77) |
где а и /(х ) определены выше [см. (5.8) и (5.10)], а b и #(х) зада
ются следующим образом:
b = ( b J 2,..J lf |
(5.78) |
При этом для вектора Y объекта имеем:
где
G =
истинных значений выхода исследуемого
Y = Fa + Gb , |
|
(5.80) |
|
&(*') |
g20 ') |
£/(*’) ' |
|
g,(*2) |
g2(*2) |
8,(x2) |
(5.81) |
|
|
|
g2(*'V) g,(xN)_
Если теперь вектор параметров а заменить на вектор оценок а , рас считанный согласно (5.36) в предположении адекватности модели
(5.11), то выражение М[а] = а и, соответственно, М[у] = у |
уже не |
|
будут справедливы. Для М[а] в этом случае получим |
|
|
М[а] = M[CFrY] = CFrM[Y) = CFrY = CFr(Fa + Gb) = |
(5.82) |
|
= (FTF)-' F rFa + CF’Gb = a + CFrGb =a + Ab. |
||
|
||
Матрицу |
|
|
A = CFTG, |
(5.83) |
будем называть матрицей смещения. Эта матрица характеризует сме щение в оценках коэффициентов.
Если бы, например, функции f(x ) были заданы согласно (5.12),
а истинная модель имела вид (5.77), причем часть b ‘g(x) содержала
бы нелинейные функции х , то эту часть можно было бы исключить из рассмотрения, если в (5.82)
М[а1] = а1 для /' = 1,2,...,и.
В этом случае ошибка в выборе вида модели не сказывается на мате матических ожиданиях оценок коэффициентов.
В общем случае можно поставить вопрос о том, когда условие М[а1] = а, справедливо, а когда нет.
Чтобы ответить на этот вопрос, введем прежде всего следующие
обозначения: |
|
H = FrG = {ti,h\...,h'), |
(5.84) |
/-й вектор-столбец матрицы Н = F 1G будем обозначать через h'. По ложим далее
В силу того, что |
|
А =CF'G =СН , |
(5.86) |
можно записать |
|
c=C(h%+h2b2+... + h%). |
(5.87) |
Отсюда следует, что величина М[а] не зависит от 6(, если СИ' = 0.
Поскольку С - невырожденная матрица, то можно сформулиро вать нижеследующее утверждение.
Утверждение 5.3. Оценка ai является несмещенной в случае не правильного выбора модели, если i -й вектор-столбец матрицы Н - F lG равен нулю.
Пример 5.3. Продолжим рассмотрение примеров 5.1 и 5.2, приняв, что линейное описание
у = а0+ а,*, + а2х2
недостаточно и истинная модель исследуемого объекта представляет ся полиномом второй степени,
у= а0 + + а2х2+ 6|Х,х, + b2x2x2 + b2xtx2.
Вэтом случае для (5.79) получаем
g(x) = (x,x1,x2x2,x,x2)/ |
||
а матрица G принимает вид |
|
|
"1 |
1 |
Г |
1 |
1 |
- 1 |
G = |
|
|
1 |
1 |
1 |
u 1 |
1 |
- 1 |
В силу (5.84) имеем
" |
|
|
|
г |
■1 |
1 |
1 |
' |
4 |
0' |
|
1 |
1 |
1 |
1 |
1 |
- 1 |
'4 |
|||||
Я = FrG = |
1 |
1 |
- 1 |
- 1 |
= 0 |
0 |
0 |
||||
1 |
1 |
1 |
|||||||||
|
1 |
- 1 - 1 |
1 |
0 |
0 |
0 -1 |
|||||
|
_ 1 |
1 |
- 1 |
||||||||
а из (5.86) получаем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
1 |
О |
|
|
|
А = СН = —LH = —Я = 0 0 0 |
|
|
|||||||||
|
|
|
|
|
|
0 |
0 |
0 |
|
|
Следовательно, согласно (5.82)
М[а0] = а0+ Ц + Ь2; М[а,] = а ,; М[а2] = а2.
Несмотря на то, что линейная модель неадекватна (не соответст вует действительности), оценки а, и а2 получаются несмещенными.
5.2.5. Проверка адекватности математической модели исследуемого объекта
После того как в разд. 5.2.4 были проанализированы последствия неправильного выбора вида модели, обсудим теперь метод, который дал бы нам возможность принимать решения о том, адекватной или неадекватной является принятая модель исследуемого объекта.
Проверка адекватности модели означает проверку того, согласу ется ли модель (5.9) вида
y(a,x) = a0f 0(x) + a j x(х) +... + akf k(х)
с данными эксперимента.
Для проверки гипотезы об адекватности модели необходимо со поставить достигнутую точность модели с величиной, характеризую щей точность наблюдений. Если ошибки, характеризующие точность модели, превосходят ошибки наблюдений, то гипотеза об адекватно сти модели отклоняется. В этом случае уже нельзя оценивать ошибку наблюдений путем нахождения разности между результатом наблю дения выходной переменной исследуемого объекта и результатом ее расчета по модели, так как в случае неправильного выбора вида моде ли определяемая по модели величина у, уже не может служить доста точно хорошей оценкой среднего значения наблюдений, поскольку
М[у‘ ] ф у' Поэтому дисперсия ошибок наблюдений может быть оце нена лишь путем сравнения результатов нескольких параллельных опытов, проведенных в каждой экспериментальной точке.
Опишем методику проверки адекватности модели, полагая, что в каждой из N точек х',/ = 1,2,...,N реализуется v экспериментов.
Результаты этих экспериментов для каждой точки х' представляются рядом