Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Автоматизация научных исследований

..pdf
Скачиваний:
3
Добавлен:
12.11.2023
Размер:
6.33 Mб
Скачать

значения принадлежат некоторой области Qt п -мерного пространст­ ва. Выходную переменную у будем в дальнейшем называть зависимой переменной, целевой величиной или выходом процесса, протекающего в исследуемом объекте. В общем случае можно сказать, что между вы­ ходной переменной у и независимыми переменными существует функциональная связь

У = У(х),

(5.1)

= (х12,...,хп)'/

(5.2)

Здесь х - вектор значений независимых переменных; Т - знак транс­ понирования вектора. Зависимость (5.1) на практике часто бывает не­ известна, и тогда ее пытаются найти путем обработки эксперимен­ тальных данных.

Поскольку всякий эксперимент связан с появлением случайных ошибок, то при построении математической модели на основе экспе­ риментальных данных необходимо использовать методы обработки результатов эксперимента, т.е. методы математической статистики. Наиболее часто при решении этой задачи применяется метод наи­ меньших квадратов.

5.2.Метод наименьших квадратов

5.2.1. Постановка задачи

Пусть требуется на основе экспериментальных данных построить модель исследуемого объекта. При этом прежде всего необходимо составить себе какое-то представление о структуре этой модели. Из физических соображений можно, например, предположить, что взаи­

мосвязь между у и х, линейна,

 

у(а,х) = а0 +а,х, + а2х2+... + а„х„.

(5.3)

При этом а, является неизвестным параметром исследуемого объек­ та, оценки которого требуется найти путем обработки эксперимен­ тальных данных. В случае, если характер связи описывается квадра­ тичной функцией, имеем

у(а,х) =а0+а,х, + а2х2+... + апхп+ а„+1х,х, + апу2х2х2+... +

 

+ З Д Л . + «2Я+1*!*2 + Я2»+2*1*3 + - +

+

(5-4)

+ Яз„х2х3+... + а*х„_,х„.

 

 

Здесь

п + 2 {п + 2)(п + 1 )

к + 1=

Обычно коэффициенты квадратической модели (5.4) нумеруются не по порядку, а так, что коэффициент при функции - обозначается через я, :

У ( а , х ) = я0 + £ я,х, + J a ^ x ,

+ ^ а их ] ,

(5.5)

(=1

7.<=1

1=1

 

где al,alj,all - коэффициенты, характеризующие соответственно ли­ нейные эффекты, эффекты взаимодействия и квадратичные эффекты. Коэффициенты aQ,al,aIJ,all называются коэффициентами регрессии,

а уравнение (5.5) - уравнением регрессии.

Модели полиномиального вида имеют большое значение в связи с тем, что с их помощью любая аналитическая функция (5.1) может быть описана как угодно точно. Однако с увеличением степени поли­ нома весьма существенно увеличивается число оцениваемых пара­ метров модели и соответственно затраты на эксперимент. Так, если

степень полинома есть т , то

 

 

(* + !) =

п + т

(п + 1)(и + 2 )...{п + т)

(5.6)

т

т\

 

 

В дальнейшем мы будем иметь дело с моделями вида

 

 

 

у = у(х,а),

(5.7)

где а - вектор параметров модели,

 

 

а = (at,a2,...,ak)'

(5.8)

Примем, что модель (5.7) линейна относительно коэффициентов а,,

т.е.

 

у(х,а) = я0/ 0(х) + a j x(х) +... + a j k(х).

(5.9)

При этом /(х ) - известные функции, являющиеся

компонентами

вектора

 

Д х) = (Л(х),У;(х),...,/А(х))'/

(5.10)

Используя векторные обозначения, вместо (5.9) можно записать

у = а‘ f{x) = f ‘\x)a.

(5.11)

В случае модели (5.3) или (5.4) получаем соответственно следующие выражения для компонент / (х):

/(х) = (1,х„х2,...,х;>)/

(5.12)

и

/(х ) = (1,Х1,Х2,...,Х я,Х]Х1,Х2Х2,...,Х 11Х)„

(5.13)

Х|Х2,Х|Х2,...,Х|ХП,Х2Х2,...,Х||_|ХП)

Для истинных значений вектора коэффициентов а в (5.11), которые будем обозначать через а , требуется найти оценки а , используя для

этой цели результаты эксперимента. При этом оценка у

для у рас­

считывается по формуле

 

 

 

у =а‘f{x) = f r{x)a.

(5.14)

Эксперимент проводится в N точках

 

1

2

N

 

X

, Х

V ..,JC

 

с координатами

 

 

 

х'=(х;,х',...,х;)7 ,/-1,2,...,^

(5.15)

Результаты наблюдений у' в точках х' представляются с помощью вектора наблюдений

Y = (y',y2,...,yNjr

(5.16)

Вкаждой точке х' может быть поставлено v опытов, результатами которых будут

Г, у ,2, - , Г

Вэтом случае в качестве у 1 используется среднее значение наблюде­

ний в точке х'

^ = 1 (^ + у'2+... + Г ) .

(5.17)

v

 

Задача состоит в том, чтобы на основе результатов (5.16) найти наи­ лучшие в определенном смысле оценки a n y

5.2.2. Решение задачи определения математической модели исследуемого объекта

Чтобы решить задачу, сформулированную в разделе 5.2.1. необ­ ходимо сначала выяснить, что следует понимать под наилучшими оценками.

Будем исходить из того, что модель вида (5.11) является адекват­ ной (т.е. модель вида (5.11) соответствует действительности). Вопросы о том, что произойдет, если (5.11) не соответствует действительности, и как на основе экспериментальных данных проверить адекватность модели, будут обсуждаться в разделах 5.2.4 и 5.2.5 соответственно.

Сопоставим теперь друг с другом экспериментальные результаты

(5.16), отражающие действительность, и значения

 

Y = {y \y \.,.,y N)‘

(5.18)

рассчитанные с помощью оценки а и представляющие модель (5.14). Имеем

 

у' = arf(x') = f r(x')a,i = 1,2,..., iV

(5.19)

или соответственно

 

 

 

 

 

где матрица F имеет вид:

Y = Fa,

 

 

(5.20)

 

 

 

 

 

 

/оО')

М * 1)

f k(x')

 

 

F =

/ о ( * 2 )

и х 1)

М х 2)

(5.21)

 

 

 

 

 

 

 

 

fo(xN)

U x N)

/Лх")

 

Результат наблюдения у'

в некоторой точке х' зависит от слу­

чайной ошибки е'

 

 

 

 

 

 

 

 

e " = y ' - y ' , /

= l,2,...,W,

(5.22)

где у' -

истинное

значение выходной

переменной

в точке

x'J = 1,2,..., N

Множество значений ошибок в N экспериментальных

точках может быть представлено вектором е

вида

 

 

 

 

e = Y - Y

 

 

(5.23)

Здесь черта сверху в (5.23) означает истинное значение вектора. Наложим на результаты наблюдений три условия, которые на

практике, как правило, выполняются:

1 ) результаты эксперимента свободны от систематических оши­ бок, т.е. математическое ожидание величины у' равно действитель­

ному значению у ' :

 

М[?) = 7 = ( y \ f , . . . , y N)r = F a ,

(5.24)

т.е.

 

М[е] = 0;

(5.25)

2 ) результат наблюдения в точке xJ не зависит от результата в точке х , т.е.

М{{у‘ - y')(yJ - / ) } = 0 для / * j

5.26)

или

 

M{e'eJ} = 0 для i*j",

(5.27)

3) дисперсия результатов наблюдений во всех точках х'

одинако-

ва, т.е.

 

D(y') = М[(у‘ - у')2] = cf2 для всех i

(5.28)

или

 

D(e') = М[(е)2~\ - а 2 для всех /.

(5.29)

Условия 2 и 3 выполняются, если

 

М[еет] = о21

(5.30)

где / - единичная матрица размерности N *N

Наложим еще два условия на оценки а , обратив внимание на то, что оценки а , полученные на основе обработки случайных результа­ тов наблюдений, представляют собой некоторых случайный вектор.

1) оценка а не должна содержать систематических ошибок (т.с.

оценка а должна быть несмещенной)

 

М[а] = а\

(5.31)

2) дисперсия а 2 оценки а, должна быть минимальной:

 

ст2 = D[a] = М[(а, - а,)2] = min,/ = 0,1,2,..„А:.

(5.32)

При этом рассматривается класс оценок, образуемых линейными

комбинациями результатов наблюдений y ‘,(i = 1,2,...,У) .

Эти два требования представляют собой только одну из многих возможных конкретизаций понятия «наилучшая оценка». Вместо вто­ рого требования могут быть использованы такие условия, как

maxiа, - а,I = min

0<i &k ' 1

или

maxiу, - у,| = min

os,s/VK'

ит.д.

Условие (5.32) является наиболее приемлемым, так как оно приво­ дит к методу наименьших квадратов и при нормально распределенных

результатах наблюдений в каждой точке х' позволяет провести стати­ стический анализ полученных оценок, а также проверить адекватность модели.

Теоретическую основу метода наименьших квадратов составляют

следующие утверждения:

 

 

Утверждение 5.1.

Оценка а

удовлетворяет условиям

(5.31)

и (5.32), если сумма

 

 

 

s = T.(y

-у'У = Y - Y

= (Y - Y f ( Y - Y )

(5.33)

/=1

 

 

 

минимальна, т.е.

 

 

 

 

S(a) = minS(a).

(5.34)

 

а

 

 

Очевидно, что S в (5.33) является функцией а, причем в силу (5.20) можно записать, что

S = (Y - Fa)' (Y - Fa) ,

т.е.

5 = S(a) = Y 'Y + arF rFa - 2Y TFa.

(5.35)

S является расширенной квадратичной формой а , которая в слу­ чае невырожденности матрицы F 1F имеет единственный минимум

при

 

a = {FTF y 'F ‘Y

(5.36)

Матрица F 1F не вырождена, т.е.

 

|F 7 F | ф о ,

 

если матрица F имеет ранг к +1. Здесь \А\ - определитель матрицы А .

Утверждение 5.2. Если матрица F имеет ранг

£ + 1, то сумма

квадратов (5.35) достигает минимума при

 

а = (FrF y ] F rY = CF'Y

(5.37)

Матрица С в (5.37) размера (к + 1)х +1)

 

C = (FrFy'

(5.38)

называется дисперсионной матрицей.

Для пояснения утверждения 5.2 рассмотрим пример.

Пример 5.1. Выход у исследуемого объекта зависит от длительно­ сти реакции t и температуры Т Эту зависимость можно считать ли­ нейной в окрестностях точки t = 4 ч , Т =220°С .

Меняя t с шагом в 1 ч и температуру с шагом в 10°С, поставим опыты в следующих точках (рис. 5.1):

/ = (4±1) ч, Т = (220±10)°С.

Рис. 5.1

В дальнейшем для упрощения вычислений введем нормированные переменные х, и х2 (рис. 5.1):

х, = t -

.

Т - 220

.

4,х, =

---------

1

2

1 0

 

Для оценивания коэффициентов линейной модели y = a0+aixl +а2х2

проводятся опыты в следующих точках (табл. 5.1). Таблица 5.1

/

 

*2

 

1

1

1

2

1

-1

3

-1

-1

4

-1

I

Результаты опытов (в процентах) представлены вектором

Y = (65,5; 55; 44,9; 55)'

Пользуясь формулами (5.12), (5.21), (5.37), (5.38) и (5.19), получа­ ем следующие результаты:

Г1 1 1'

1 - 1 1

"4

0

0 "

 

'1

0

o'

F rF = 0

4

0 = 4/3,

/3= 0

1

0

0

0

4

 

0

0

1

 

C = (FrF y ' Л

 

 

 

 

 

1

1

1

 

 

CF =■

1

- 1

- 1

,

 

 

4

- 1

- 1

1

 

 

 

 

 

 

a =

oQ>

 

= CF'Y

Л .

'

1

1

1

= -

1

1

- 1

4

1

- 1

- 1

 

 

1

Г

З

 

- 1

а

1

44,9

_

_ 55 _

'55,1'

5,15

Л 15.

у= 55,1 + 5,1 5 л:, + 5 ,1 5 х 2.

5.2.3.Ошибки оценивания при использовании метода

наименьших квадратов

5.2.3.1. Определение показателей точности оценок ai и величины у

Оценки а,., рассчитанные согласно (5.37), отличаются от истин­ ных значений коэффициентов at, причем ошибка тем больше, чем больше дисперсия ошибок наблюдений. Показателями точности оце­ нок at и величины у являются дисперсии о] и сг2 соответственно. Эти дисперсии зависят не только от дисперсии ошибок наблюдений а 2, но и от выбранной структуры модели и точек постановки опытов,

т.е. от матрицы F (см. (5.21)). Для определения этой зависимости не­ обходимо прежде всего найти выражения для ковариационной матри­ цы COV(a) вектора а:

COV(a) = М[(а - а)(а - а)1].

Из (5.37), (5.31) и (5.45) следуют выражения:

а = CFrY

 

а = М[а) = CFrM[Y] = CFrY

 

Используя эти выражения, получаем

 

М[(а - а)(а - а)1] = M[CFr(Y - Y)(Y - ?)' FCr] =

 

= CF' M[(Y - Y)(Y - Y)T]FCr

 

В силу (5.23), (5.24) и (5.30) имеем

 

COV(a) = CFrM[(Y - Y)(Y - Y)T]FCr = CF' FC' a2

 

Поскольку матрица F 1F симметрична, то

 

CF'FC1 =(FrF y 'F rF(FlFT' =C,

 

и для COV(a) получаем

 

COV(a) =Ca2

(5.39)

При этом для дисперсии а ,2 оценки о, имеем

 

a 2 = c,7a 2,

(5.40)

где c„ - i -й элемент главной диагонали матрицы С .

 

Коэффициент корреляции между оценками at и а] определяется

формулой

2

(5-41)

с"см

Дисперсию ст2 для величины у получаем с помощью следующих преобразований:

а? = М[{у - Я 2] = М[((а - a f f i x ) ) 2] = M [ f (х)(а - а)(а - a f fix ) ] = = f (х)М[(а - а)(а - a f) f( x ) = f (x)COV(а\f(x) = / ' (х)Сст2Дх).

Таким образом,

 

o ] = f ‘\x)Cf(x)<y2

(5.42)

5.2.3.2. Определение доверительного интервала для коэффициентов а, при известной дисперсии

ошибок наблюдения а 2

 

С помощью оценок о определяется оценка у функции у :

 

У = агЯ х ) .

(5.43)

При этом можно рассчитать значения оценок выходной переменной в точках х1,i = 1 ,2 ,..., JV

у 1=arf ( x ‘).

(5.44)

Рассчитанные значения выхода исследуемого объекта представляются с помощью вектора

f = (yl,y 2,...,yN)T

(5.45)

При дополнительном предположении о нормальности закона распре­ деления результатов наблюдений в любой точке постановки экспери­ мента случайная величина

X =

 

(5.46)

распределена нормально и имеет место соотношение (рис. 5 .2 )

 

 

х2

(5.47)

/(* ) =

2

 

 

где yj(x) - плотность распределения вероятностей случайной вели­ чины X ; х - возможные значения случайной величины X

Соседние файлы в папке книги