Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Численные методы решения задач строительства. Ч. 1

.pdf
Скачиваний:
6
Добавлен:
20.11.2023
Размер:
4.02 Mб
Скачать

ностей исследуемого объекта и необходимой точности представления.

Геометрически задача построения уравнения регрес-

сии состоит в проведении кривой L: y = (х), «возможно ближе» примыкающей к системе экспериментальных то-

чек Mi(xi, yi), I = 1, 2, ..., n, заданной табл. 5.1 (рис. 5.2).

y

σi

yi

M(xi, yi) xi x

Рис. 5.2. Геометрический смысл задачи среднеквадратичного приближения

При нахождении уравнения регрессии интерполяционный подход заведомо является неудачным, так как не требу-

ется, чтобы значения аппроксимирующей функции у = (x) совпадали с экспериментальными значениями yi. Достаточ-

но, чтобы разность их [ (xi) – yi], i = 1, 2, ..., n была мала в известном смысле.

Построение уравнения регрессии (эмпирической функции) состоит из 2 этапов:

1)выбор общего вида уравнения регрессии,

2)определение его параметров.

Удачный выбор уравнения регрессии во многом зависит от опыта экспериментатора, исследующего какой-либо процесс или явление.

Часто в качестве уравнения регрессии выбирают полином (многочлен)

101

m

x a0 a1x a2 x2 am xm ak xk . (5.10)

k 0

Вторая задача, нахождение параметров уравнения регрессии, решается регулярными методами, например мето-

дом наименьших квадратов (МНК), который широко ис-

пользуется при изучении какой-либо закономерности на основе наблюдений или экспериментов.

Разработка этого метода связана с именами известных математиков прошлого – К. Гаусса и А. Лежандра.

5.3.2. Метод наименьших квадратов

Допустим, что результаты эксперимента представлены в виде табл. 5.1. Уравнение регрессии записывается в виде

m

 

 

x, a0 , a1, a2 , , am ak xk ,

(5.11)

k 0

 

 

т.е. зависит от (m + 1) параметров a0 , a1

, a2 , , am .

 

Эти параметры и определяют расположение графика уравнения регрессии относительно экспериментальных

точек Mi(xi, yi), i = 1, 2, ..., n (см. рис. 5.2).

Однако эти параметры определяются неоднозначно. Требуется подобрать параметры так, чтобы график уравнения регрессии был расположен «как можно ближе» к системе этих экспериментальных точек.

Введем понятие отклонения значения уравнения регрессии (5.11) от табличного значения yi для xi, i = 1, 2, ..., n.

i xi , a0 , a1, am yi ,

 

i 1, 2, n.

(5.12)

Рассмотрим сумму квадратов отклонений, которая за-

висит от (m + 1) параметра a0 , a1, a2 , ,am :

 

 

S a , a , , a

 

 

n

 

 

 

y 2

n

(5.13)

m

x , a , a , , a

m

2 .

0 1

 

 

i

0 1

i

i

 

 

 

 

i 1

 

 

 

 

i 1

 

102

Согласно МНК [3, 6] наилучшими коэффициентами ai (i = 0, 1, ..., m) являются те, которые минимизируют сумму квадратов отклонений, т.е. функцию S(a0 , a1, a2 , , am ).

Используя необходимые условия экстремума функции нескольких переменных, получим так называемую нормальную систему для определения неизвестных коэффициентов a0 , a1, a2 , , am :

S

0,

S

0,

,

S

0.

(5.14)

a

a

a

 

 

 

 

 

0

 

1

 

 

m

 

 

Для аппроксимирующей функции (5.11) система (5.14) является системой линейных алгебраических уравнений относительно неизвестных a0 , a1, a2 , , am .

Возможны случаи:

1) если m n, то существует бесконечно много много-

членов (5.11), минимизирующих функцию (5.13);

2) если m = n – 1, то существует только один многочлен (5.11), минимизирующий функцию (5.13).

Будем считать, что m < n – 1.

Чем меньше m, тем проще эмпирическая формула, но это не всегда лучше. Необходимо помнить, что полученная эмпирическая формула должна быть адекватной изучаемому объекту.

5.3.3. Линейная эмпирическая формула (линейная регрессия)

Самой простой является аппроксимация (приближение) прямой линией, так называемой линейной регрессией. Рассмотрим МНК для такого случая, когда уравнение регрессии имеет вид

y = (x, a, b) = a + bx.

(5.15)

103

Согласно МНК наилучшими параметрами функции

(x, a, b) считаются те, для которых сумма квадратов отклонений S(a, b) является минимальной:

S a,b

n

 

2

 

n

(a bx y )2

. (5.16)

x, a,b y

 

 

 

 

i

 

 

i i

 

 

i 1

 

 

 

i 1

 

 

Для минимизации функции S = S(a,b) достаточно продифференцировать ее по параметрам a и b и приравнять производные нулю.

В результате получим систему линейных алгебраических уравнений, из которой определим параметры a и b:

 

na b xi yi ,

 

 

 

 

 

 

 

 

 

 

n

n

 

 

 

 

 

 

 

 

 

 

i 1

i 1

 

 

 

 

(5.17)

 

 

 

 

n

 

n

 

n

 

 

 

 

a xi b xi2 xi yi .

 

 

 

 

 

i 1

 

i 1

 

i 1

 

 

 

Решив эту систему (например, методом Крамара), по-

лучим неизвестные параметры а и b:

,

 

 

b

 

1 n xi yi

xi

yi

 

 

 

 

 

 

 

 

n

 

n

 

n

 

 

 

 

 

 

 

 

 

i 1

i 1

 

i 1

 

 

 

 

1

 

 

n

2

n

n

 

n

 

 

 

a

 

 

 

 

xi

yi

xi

yi xi

,

(5.18)

 

 

 

 

 

i 1

 

i 1

i 1

 

i 1

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

n

n

 

 

 

 

 

n xi2 xi xi .

 

 

 

 

 

 

 

 

 

i 1

i 1

i 1

 

 

 

Подставив найденные значения а и b в линейную формулу (5.15), получим математическую модель исследуемого процесса.

104

Степень точности аппроксимации исследуемого про-

цесса с помощью полученной функциональной зависимости может быть оценена по значению среднего квадратичного отклонения.

Под средним квадратичным отклонением функций y = f(x) и y = (x) на множестве точек x1, x2 , , xn a,b понимается число

 

1

n

 

n .

yi (xi ) 2 ,

(5.19)

 

n i 1

 

где yi экспериментальное значение; (xi) – расчетное

значение, вычисленное по формуле (5.15) для xi (i = 1, 2, ..., n).

В численных методах анализа [6] доказывается, что если среднее квадратичное отклонение n мало для «по-

давляющего большинства» значений x [a, b] (т.е. в «среднем» на [a, b]),

Рис. 5.3. Геометрический смысл точности аппроксимации

то абсолютная величина f(x) – (x) также мала на отрезке

[a, b], т.е. f x x для x [a, b] (рис. 5.3).

105

5.3.4. Коэффициент корреляции

Всегда ли существует функциональная зависимость между экспериментальными данными, заданными, например, табл. 5.1.

Оценить функциональную близость (в линейном смысле) значений x, y можно с помощью коэффициента корреляции:

 

 

 

1

n

 

n

n

 

 

 

 

 

 

 

 

 

 

 

 

 

Rxy

 

 

 

n xi yi

xi yi ,

 

(5.20)

 

w

 

 

 

 

 

i 1

 

i 1

i 1

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

n

 

n

 

 

n

n

n

 

 

 

 

 

 

 

 

 

 

w n xi2

xi xi

n yi2

yi yi .

 

i 1

 

i 1

i 1

 

i 1

i 1

i 1

 

Если зависимость между

значениями x, y

линейная

(y = ax+b), то

 

 

 

 

 

 

 

 

 

 

 

 

для а > 0

–1< Rxy < 0,

 

 

 

 

 

 

для а < 0

0 < Rxy < 1.

 

 

 

 

 

 

При Rxy = 0 cвязь отсутствует. Принято считать:

Rxy 0,3 – наблюдается слабая линейная связь;

Rxy = 0,3 – 0,7 – средняя;

Rxy 0,7 –сильная;

Rxy = 1 – линейная зависимость, все точки лежат на одной прямой.

5.3.5. Квадратичное (параболическое) приближение

Чаще всего линейная аппроксимация является достаточно грубым приближением. При решении задач строительства возникает необходимость использования более сложной аппроксимирующей функции.

106

Ограничимся случаем m = 2. Уравнение регрессии 2-го порядка в этом случае называется квадратичным (или параболическим) и имеет вид

y = (x, a, b, c) = a + bx + cx2.

(5.21)

Неизвестные параметры a, b, c согласно МНК находим из условия минимизации функции S(a, b, c), суммы квадратов отклонений:

S a,b,c

n

 

2

 

x, a,b,c y

 

 

 

i

 

 

 

i 1

 

 

(5.22)

n

 

 

 

(a bxi cxi2 yi )2 .

i 1

После дифференцирования и соответствующих преобразований получим нормальную систему для определения неизвестных параметров a, b, c.

 

 

n

n

n

 

na b xi c xi2 yi ,

 

 

 

i 1

i 1

i 1

 

 

n

n

n

n

 

a xi

b xi2

c xi3 xi yi .

(5.23)

i 1

i 1

i 1

i 1

 

 

n

n

n

n

 

a xi2 b xi3 c xi4 xi2 yi ,

 

 

i 1

i 1

i 1

i 1

 

Решая систему (5.23), получим уравнение регрессии 2-го порядка, степень точности такого приближения для исследуемого процесса оценивается по величине средне-

квадратичного отклонения (5.19).

Если точность этого приближения не устраивает, повышают степень аппроксимирующей функции m (но надо помнить, что m < n–1).

107

5.3.6. Эмпирические формулы с двумя параметрами (метод выравнивания)

Для описания некоторых технологических процессов удобно использовать эмпирические формулы, содержащие два параметра:

y = (x, a, b).

(5.24)

Например: y = a xb, y = a + b/x,

y = x/(a + bx),

y = a bx и т.д.

 

Пусть заранее известно, что экспериментальные точки M(xi, yi), i = 1, … n, заданные табл. 5.1, не лежат на одной прямой. Для нахождения параметров a, b использу-

ется метод выравнивания.

Идея метода. Вводятся новые переменные (новая система координат X*OY*)

x* x, y ;

y* x, y

(5.25)

так, чтобы преобразованные точки M*(xi*, yi*), i = 1, … n, в плоскости X*OY* могли быть аппроксимированы линейной зависимостью

y* = A + Bx*.

(5.26)

Здесь xi* x, y ; yi* x, y (i = 1, 2, …, n) (рис. 5.4).

Рис. 5.4. Схема метода выравнивания:

а – старая система координат; б – новая система координат

108

Параметры А и В находятся методом наименьших квадратов (см. п. 5.3.3).

Пример 5.2. Пусть заранее известно, что экспериментальные точки M(xi, yi), i = 1, 2, … n, заданы в виде табл. 5.1 и не лежат на одной прямой. А эмпирическая формула имеет вид

y = a xb.

(5.27)

Для определения новой системы координат прологарифмируем выражение (5.27):

ln y = ln a + b ln x

и введем новые переменные:

 

y* = ln y;

x* = ln x.

Обозначив A = lna; B = b, получим линейную эмпирическую формулу в новой системе координат X*OY*:

y* = A + Bx*.

Неизвестные параметры А, В находим, используя МНК, и по аналогии с (5.17) строим нормальную систему

 

 

n

n

 

 

nA B xi* yi* ,

 

 

 

i 1

i 1

 

 

 

n

 

n

n

 

 

 

*

*

 

*2

*

A xi

B xi

xi

yi .

 

i 1

 

i 1

i 1

 

Переходя к старым переменным, получим систему уравнений для определения параметров a, b:

 

n

 

n

 

 

 

 

n ln a b ln xi

ln yi ,

 

 

 

i 1

 

i 1

 

 

 

(5.28)

 

n

n

 

 

 

n

 

 

 

 

 

 

b (ln xi )

2

 

ln xi ln yi .

 

ln a ln xi

 

 

 

i 1

i 1

 

 

i 1

 

109

Решив эту систему относительно a, b (например, методом Крамара) и подставив их значения в выражение (5.27), получим нужную эмпирическую формулу. Насколько она хороша, можно оценить приведенным выше способом.

5.4.Решение задач аппроксимации

спомощью электронных таблиц Excel

5.4.1.Построение уравнений регрессии методом наименьших квадратов с использованием

надстройки «Поиск решения»

Имеются результаты (табл. 5.2) некоторой серии экспериментов, в которой выявлена некоторая зависимость параметров x иy.

Таблица 5.2 . Значения результатов экспериментов

x

1

2

4

5

7

8

9

y

1

3,5

5

4

5.5

6

9

Втаких случаях ставится задача о выявлении некоторой аналитической зависимости между величинами x и y, полученными в процессе эксперимента.

Вкачестве аппроксимирующих функций рассмотрим полиномы разной степени:

y = Pm(x) = a0 + a1 x + a2 x2 + … + amxm.

(5.29)

Поиск коэффициентов такого уравнения осуществляется с помощью МНК. При этом минимизацию суммы квадратов отклонений можно реализовать с помощью над-

стройки MS Excel «Поиск решения».

Рассмотрим 3 вида уравнений регрессий:

1.Прямая Р1(х) = a + bx.

2.Парабола Р2(х) = a + bx + cx2.

3.КубПарабола Р3(х) = a + bx + cx2 + dx3.

110