книги / Автоматизация научных исследований
..pdfДля расчета оценок коэффициентов будем использовать средние зна чения у' ряда наблюдений для каждой точки х‘, определяемые со гласно (5.17) по формуле
У1= -(У' + У12 +... + y'v) i =1,2,..., N |
(5.88) |
V |
|
Для проверки гипотезы адекватности модели необходимо сравнить две суммы квадратов:
1 ) сумму квадратов, характеризующую неадекватность (дефект)
модели, |
|
5 o = iv ( y '- j) ') 2 =v5/r |
(5.89) |
/=1 |
|
Эта сумма зависит от разности между рассчитанными по модели и на блюдаемыми значениями выходной переменной исследуемого объекта; 2 ) сумму квадратов, характеризующую ошибки наблюдения,
(5.90)
/=1 ] = \
Сумма SD состоит из N слагаемых, между которыми имеет ме
сто (к +1 ) линейных связей, определяемых формулой (5.37). Поэтому с суммой SDсвязано
Ф, =JV —Аг-1 |
(5.91) |
степеней свободы.
Сумма Sc состоит из Nv слагаемых, между которыми согласно
(5.17) существует N линейных связей. При этом сумма Se имеет
<p2= N v - N = N (v -\) |
(5.92) |
степеней свободы. |
|
Для оценки ст2 дисперсии ошибок наблюдения а 2 |
выражение |
(5.60) в силу приведенных выше соображений не может быть исполь зовано. Оценка а 2 получается теперь с помощью суммы квадратов Se
по формуле
а 2 |
(5.93) |
|
v<P2 |
Заметим, что а 2 в (5.93) является оценкой дисперсии величины у , которая представляет собой среднее по v параллельным наблюдениям.
Это означает, что с 2 в данном случае не является оценкой дисперсии ошибки единичного наблюдения, а определяет величину дисперсии среднего, рассчитанного по v наблюдениям. Оценка дисперсии <т2
ошибки единичного наблюдения равна va2
Перейдем теперь к проверке адекватности математической моде ли исследуемого объекта. Частное от деления оценки дисперсии не адекватности на оценку дисперсии ошибки единичного наблюдения
_ Sp /Ф1
" 2 S./ф
в случае, когда модель адекватна, является случайной величиной, подчиненной распределению Фишера с числами степеней свободы (р, и ф2 (рис. 5.5).
На рис. 5.5 обозначено: / ( ^ |
<р ) - плотность распределения вероят |
|
ностей случайной величины F |
ф;; FVt ф2 - возможные значения слу |
|
чайной величины F ф2; F |
,а |
критическое значение распределе |
ния Фишера (определяется по таблице распределения Фишера (см. [13], с. 273) при известных ср,,ф2;а).
Выдвигается гипотеза Н0: имеет место адекватная модель иссле дуемого объекта. При этом формулируется альтернативная гипотеза
# ,: имеет место неадекватная модель исследуемого объекта. На рис. 5.5 область SQесть область принятия гипотезы Н0. Область S', есть область отклонения гипотезы Н0 или область принятия гипотезы Я ,.
Величина F а определяется из условия |
|
P ( F ^ 2> F ^ a) = a . |
(5.95) |
Для этого используется таблица распределений Фишера. Например, при ср, = 1;ф2 = 4 для а = 0,01 из таблицы находим
F |
= ГF1,4;0,01 |
= 212 |
Проверка гипотезы Н0 осуществляется следующим образом. Если |
||
|
^ФЬФ, |
(5-% ) |
то гипотеза Н0 принимается, т.е. модель исследуемого объекта адек ватна, и это дает основание исследователю остановиться на выбран ных факторах х,,дг2 ,...,хп. В противном случае число учитываемых факторов нужно увеличить или заменить линейные уравнения (5.9)
нелинейным. Чем больше значение F „;а превышает F |
, тем эф |
фективнее модель исследуемого объекта. Если |
|
^ , . Ф2 >F„„Pj;a, |
(5.97) |
то гипотеза Н0 отклоняется, т.е. имеет место неадекватная модель исследуемого объекта.
Пример 5.4. Для пояснения процедуры проверки адекватности модели вернемся к примерам 5.1 и 5.2, сняв, разумеется, предположе ние о том, что линейная модель является адекватной. Чтобы прове рить адекватность линейной модели, необходимо добавить по край ней мере еще по одному эксперименту в каждой точке примера 5.1. После проведения этих опытов (табл. 5.3) получим следующие ре зультаты.
|
|
|
Таблица 5.3 |
/ |
у'1 |
у'2 |
|
|
|
||
1 |
65,5 |
65,6 |
65,55 |
2 |
55 |
55,2 |
55,1 |
3 |
44,9 |
45 |
44,95 |
4 |
55 |
54,8 |
54,9 |
Здесь |
N = 4, к = 2, v = 2 и в соответствии |
с выражениями (5.91), |
|
(5.92) |
ф ,=1;ф ,=4. При новых |
значениях |
Y рассчитаем согласно |
(3.37) оценки |
|
|
|
|
|
55,125 |
|
|
а = |
5,2 |
|
|
|
5,1 |
|
При этом
j) = 55,125 + 5,2х, + 5,1х2 и Y = (65,425; 55,225;44,825;55,025)'
Теперь можно рассчитать суммы квадратов SD и Sc по формулам
(5.89) и (5.90):
Sp = 0,125, Se = 0,05.
Согласно (5.93)
с 2 = - ^ - = 0,056, Уф2
и для среднеквадратических ошибок оценок коэффициентов получаем о ,= - = 0,028.
'2
Из (5.65) для а = 0,1 с доверительной вероятностью Р = (1 -а ) = 0,9 и при ф =ф2 =4 получаем Т^.а/2 = ТА'.005 =2,1 и, соответственно,
\а, - я,|< 0,028-2,1 = 0,06.
В данном случае получаются существенно более точные оценки, чем в примере 5.2. Для проверки адекватности примем
P(Fa „ |
„ .„) = а = 0.0 1 . |
V ср),Ф2 |
ф|,ф2 , а / |
Для ф, = 1;ф2 = 4 и а = 0,01 из таблицы распределения Фишера нахо-
ДИМ |
ф|.Ч>2;а =F 00, =21,2. |
0,125 = 1 0 . Поскольку |
Согласно (5.94) вычисляем F |
||
|
ф| ,ф2 |
0,0125 |
|
|
|
■Рф|^ |
< F ;а , то результаты не противоречат предположению об аде |
кватности модели.
Пример 5.5. Введем нормированные переменные
Т - 260
х, = / - 8, х2
10
ивыберем модель в виде квадратичного уравнения [см. (5.4) и (5.13)]:
у= а0 +а,х, + а2х2 + а3(х, ) 2 + а4(х2) 2 + а5х,х2.
Линейная модель здесь уже оказывается недостаточной, так как целевая функция в окрестностях оптимума имеет существенную кри визну. В каждой из указанных точек поставим по два эксперимента (табл. 5.4).
|
|
|
Таблица 5.4 |
||
/ |
х' |
|
.Vм |
Г |
У |
|
|
||||
|
Х1 |
*2 |
|
|
|
1 |
0 |
0 |
88 |
88,2 |
88,1 |
2 |
1 |
0 |
89,2 |
89,1 |
89,15 |
3 |
0 |
1 |
82,2 |
82,1 |
82,15 |
4 |
-1 |
0 |
83,7 |
83,8 |
83,75 |
5 |
0 |
-1 |
87,3 |
87,4 |
87,35 |
6 |
1 |
1 |
82,6 |
82,7 |
82,65 |
7 |
1 |
-1 |
89,6 |
89,6 |
89,6 |
8 |
-1 |
-1 |
82,2 |
82,1 |
82,15 |
9 |
-1 |
1 |
79,3 |
79,1 |
79,2 |
Здесь N = 9, v = 2 , |
к = 5, |
(р, =3, |
ф2 =9. |
Для а = 0,05,^ = 0,025, |
ср = ф2 = 9 из таблицы распределения Стьюдента находим
(р;а/2 — ^9;0,025 —2,26 .
Согласно (5.13), (5.21), (5.37) и (5.38) имеем
1 |
0 |
0 |
0 |
0 |
0 |
|
|
|
|
|
1 |
1 |
0 |
1 |
0 |
0 |
0 |
0 |
6 |
6 |
0 ' |
|
|
|
|
|
"9 |
|||||
1 |
0 |
1 |
0 |
1 |
0 |
6 |
0 |
0 |
0 |
0 |
|
|
|
|
|
0 |
|||||
1 |
- 1 |
0 |
1 |
0 |
0 |
0 |
6 |
0 |
0 |
0 |
F = 1 |
|
|
|
|
0 |
|||||
0 |
- 1 |
0 |
1 |
0 , F'F = |
0 |
0 |
6 |
4 |
0 |
|
|
|
|
|
|
6 |
|||||
1 |
1 |
1 |
1 |
1 |
1 |
0 |
0 |
4 |
6 |
0 |
|
|
|
|
|
6 |
|||||
1 |
1 |
- 1 |
1 |
1 |
- 1 |
0 |
0 |
0 |
0 |
4 |
|
|
|
|
|
0 |
|||||
1 |
- 1 |
- 1 |
1 |
1 |
1 |
|
|
|
|
|
1 |
- 1 |
1 |
1 |
1 |
- 1 |
|
|
|
|
|
II О
" 5/9
0
0
-1/3 -1/3
0
II -т ч /
2/9
1 /6
0
-1/6 -1/3
0
'5 /9 |
0 |
0 |
-1/3 |
-1/3 |
0 |
|
0 |
1 /6 |
0 |
0 |
0 |
0 |
|
0 |
0 |
1 /6 |
0 |
0 |
0 |
|
-1/3 |
0 |
0 |
1 / 2 |
0 |
0 |
|
-1/3 |
0 |
0 |
0 |
1 / 2 |
0 |
|
0 |
0 |
0 |
0 |
0 |
1/4 . |
|
2/9 |
2/9 |
2/9 |
-1/9 |
-1/9 |
-1/9 |
-1/9' |
0 |
- 1 /6 |
0 |
1 /6 |
1 /6 |
1 /6 |
- 1 /6 |
1 /6 |
0 |
-Г/ 6 |
1 /6 |
- 1 /6 |
- 1 /6 |
1 /6 |
1/3 |
- 1 /6 |
-1/3 |
1 /6 |
1 /6 |
1 /6 |
1 /6 |
1 /6 |
-1/3 |
1 /6 |
1 /6 |
1 /6 |
1 /6 |
1 /6 |
0 |
0 |
0 |
1/4 |
-1/4 |
1/4 |
-1/4 |
'87,97 "
2,717
о.= CF7 f = -2,517
|
-1,45 |
а4 |
-3,15 |
А _ |
- 1 |
Таким образом,
у = 87,97 + 2,717JC, -2,517х2 -1,45(дг,) 2 -3,15(х2)2 - х,х2
И
Y = (87,97; 89,24; 82,3; 83,8; 87,34; 82,57; 89,6; 82,17; 79,14)7 Суммы квадратов SD и Se рассчитываем по формулам (5.89) и (5.90):
SD=0,121, Sc - 0,07
Далее согласно (5.93)
<Г = А _ = о,0039.
vcp2
Оценки а 2 для дисперсий о] вычисляются по формуле (5.61). Имеем:
а2 =(5/9)ст2 =0,00217,
а2 = (1/ 6)а 2 = 0,00065,
ст2 = (1/ 6)6 2 =0,00065,
а2 = (1/2)ст2 = 0,00195,
а2 = (1/2)а2 =0,00195,
а 2 = (1/4)а2 =0,01.
Из (5.65) с доверительной вероятностью Р = (1 - а) = 0,95 получаем:
« 0 ■ц
- s ~ j
NJ
Q> о
II
= 0,105,
| я , - |
| < |
|
щ |
((>;а/2^1 = |
|
И з - |
“2 |
|
|
1< (р ,а/2СТ2 = |
0,0576,
0,0576,
И з
%
| « J -
-
-
« з | |
- (р ;а/2^ 3 |
= 0,1, |
|
~ (р ;а /2 ^ 4 |
= 0,1, |
| < |
(р ,а /2 ^ 5 = |
0,0715. |
Для проверки адекватности модели примем
P(Fa т > Fa ю.„) = а = 0,01. |
|
4 Ф1.Ф2 |
Ф1.Ф2»а / |
Для ф,=3;ф2=9 и а = 0,01 |
из таблицы распределения Фишера |
находим |
|
.„ = Д = 6,99
Ф|.ф2;<* 3,9;0,01
Согласно (5.94) вычисляем
рУ Ф, _ 0,0403
ф,,<Рг S J y 2 0,0078 |
’ |
Следовательно,
Р< р
~ Г Ф,,Ф2;а ’
отсюда следует вывод об адекватности квадратичной модели.
Контрольные вопросы
1.Что понимается под математической моделью исследуемого объекта?
2.Какие виды переменных определяют состояние исследуемого
объекта?
3.Какой вид имеет математическая модель исследуемого объек та, если она описывается линейной и квадратической функцией?
4.Что понимается под моделью полиномиального вида?
5.По какой формуле определяется оценка а вектора параметров модели?
6. Какие условия накладываются на результаты наблюдений при
определении модели исследуемого объекта?
7.По каким формулам определяются показатели точности оце нок а, и величины у ?
8.Как вычисляется дисперсионная матрица С ?
9.Как определяется доверительный интервал для коэффициентов
о, при известной дисперсии ст2 ошибок наблюдений?
10.Как определяется доверительный интервал для коэффициен тов а, при неизвестной дисперсии а 2 ошибок наблюдений?
11.Как осуществляется проверка значимости коэффициентов а,,/ = 0 ,1,...,& математической модели исследуемого объекта?
12.Когда оценка а, является несмещенной для случая непра
вильного выбора вида модели исследуемого объекта?
13.При выполнении какого неравенства модель исследуемого объекта является адекватной (т.е. модель согласуется с данными экс перимента)?
14.Какой вид имеет уравнение регрессии?
ГЛАВА 6. ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА
6.1.Теория эксперимента
Внастоящее время возрастает необходимость рационального ис пользования в науке труда ученых. Одно из направлений повышения производительности научного труда заключается в применении со временных математических методов и технических средств, таких как планирование эксперимента, исследование операций, математическое моделирование, вычислительная техника.
Вразделе 5.1 рассмотрены статистические математические модели исследуемого объекта, которые получаются в результате статистической обработки данных эксперимента, собранных на исследуемом объекте.
Многие задачи и проблемы неразрешимы без проведения экспе риментов. Под экспериментом понимаются любые действия, связан ные с наблюдением и измерением свойств, параметров, характеристик исследуемого объекта. Эксперимент занимает главенствующее место среди способов получения информации о внутренних взаимосвязях явлений, происходящих в исследуемом объекте.
Значительная часть усилий по выявлению взаимосвязи между факторами, определяющими ход процесса, протекающего в исследуе мом объекте, связана с затратами на эксперименты. Эксперименты по выяснению механизма явлений дают возможность получить пред ставление (формализованное в виде адекватной математической мо дели) о поведении исследуемого объекта в целом.
Широкое применение экспериментальных методов привело к соз данию теории эксперимента.
Эта теория призвана дать экспериментатору ответы на следующие вопросы:
1.Как нужно организовать эксперимент, чтобы наилучшим обра зом решить поставленную задачу в смысле затрат времени и средств или точности результатов?
2.Как следует обрабатывать результаты эксперимента, чтобы полу чить максимальное количество информации об исследуемом объекте?
3.Какие обоснованные выводы можно сделать об исследуемом объекте по результатам эксперимента?
Основой теории эксперимента является математическая статистика, которая применима для анализа эксперимента в тех случаях, когда ре зультаты эксперимента могут рассматриваться как случайные величины
или случайные процессы. Это условие выполняется в большинстве ис следований, поскольку, как правило, результаты эксперимента связаны с некоторой неопределенностью. Среди прочих причин такой неопре деленности можно назвать случайный характер исследуемых процес сов, влияние неконтролируемых факторов на исследуемый объект, не контролируемые изменения условий эксперимента и ошибки наблюде ний. Сюда же относятся измерительные ошибки, причины которых кроются в несовершенстве приборов, методов измерений и устройств передачи данных. Влияние этих возмущений на результат наблюдений может во многих случаях рассматриваться как случайное.
Математическая статистика предоставляет в распоряжение экспе риментатора методы анализа данных и решений, принятых относи тельно исследуемого объекта на основании обработанных результатов эксперимента. Эти методы учитывают случайный характер результа тов и основываются на статистической проверке гипотез.
Вотношении статистических выводов необходимо всегда иметь
ввиду следующее обстоятельство: положительные результаты про верки некоторой статистической гипотезы означают лишь то, что вы двинутая гипотеза не противоречит результатам эксперимента. Ре зультаты проверки гипотезы никогда не могут служить доказательст вом абсолютной справедливости и правильности гипотезы.
Аналогичная ситуация возникает при построении математической
модели исследуемого объекта. Исследователь может выдвинуть це лый ряд гипотез о виде модели и экспериментальным путем выбрать среди этих моделей ту, которая наилучшим образом соответствует результатам экспериментов.
Большое значение имеет концепция использования области варьи рования условий эксперимента при проведении исследования с целью построения математической модели объекта. Как уже отмечалось в разделе 5.1, построение математической модели по эксперименталь ным данным выполняется следующим образом: выбирается вид моде ли, проводятся эксперименты в некотором числе N точек; на основании результатов экспериментов рассчитываются оценки неизвестных пара метров модели и проверяется правильность выбранной модели. Стати стический анализ характеристик экспериментальных моделей показы вает, что точность модели существенным образом зависит от выбора условий проведения экспериментов, т.е. является функцией плана экс периментов. Это означает, что с помощью целенаправленного выбора