Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Моделирование функционирования изделий и технологических процессов в системах компьютерной математики

..pdf
Скачиваний:
1
Добавлен:
12.11.2023
Размер:
1.6 Mб
Скачать

1.5.Теория решения задач интерполяции

иаппроксимации

1.5.1. Общие положения теории интерполяции и аппроксимации

При разработке математических моделей часто возникает задача включения в модель экспериментальных данных, полученных при испытаниях технических объектов или их отдельных узлов. Результаты таких испытаний всегда представляют собой наборы величин, характеризующих работу объекта при различных сочетаниях режимных параметров. Результаты численных исследований отдельных элементов и узлов также представляют собой наборы величин и с точки зрения дальнейшего использования не отличаются от экспериментальных данных. Наиболее эффективным средством представления результатов экспериментов и численных расчётов в системах математического моделирования являются модели идентификации (интерполяции и аппроксимации), которые могут быть построены на основе как чисто эмпирических данных, так и результатов теоретических исследований.

При построении модели идентификации обычно предполагается, что физическая теория работы объекта отсутствует или по тем или иным причинам не может быть использована. Объект идентификации представляет собой так называемый чёрный ящик с некоторым числом регулируемых (или, по крайней мере, измеряемых) входов х и одним или несколькими наблюдаемыми (измеряемыми) выходами. Задачей идентификации является построение модели объекта по результатам наблюдений его реакции на изменение входных параметров. Это один из возможных путей математической обработки экспериментальных данных, который состоит в определении вида и параметров функциональной связи между исследуемыми величинами на основании результатов измерений.

Таким образом, аппроксимация (интерполяция) функций за-

ключается в приближённой замене заданной функции f(x) некоторой функцией h(x) так, чтобы отклонение функции h(x) от f(x) в заданной

21

области было наименьшим. Функция h(х) при этом называется ап-

проксимирующей или интерполирующей. Необходимость интер-

поляции и аппроксимации функций в основном связана с двумя причинами:

1.Функция f(x) имеет сложное аналитическое описание, вызывающее определённые трудности при его использовании.

2.Аналитическое описание функции f(x) неизвестно, т.е. f(x) задана таблично.

Табличное задание обычно возникает в результате эксперимента. Недостаток табличного задания функции заключается в том, что найдутся такие значения переменных, которые не определены таблицей. При этом необходимо иметь аналитическое описание, приближённо представляющее f(x) (например, для вычисления значений f(x) в произвольных точках (для которых не проводились измерения и вычисления), для определения интегралов и производных от f(x) и т.п.). Для решения этой задачи определяют приближающуюся к заданной функцию, называемую аппроксмирующей или интерполирующей, и производят замену, называемую аппроксимацией или интерполяцией.

1.5.2. Задачи интерполяции

При решении задач интерполяции функция h(x) проходит точно через все точки исходных данных. Иногда интерполяцию ещё называют точечной аппроксимацией.

Простейшая задача интерполяции заключается в следующем. На отрезке [x0, xn] заданы (n+1) точек (xi = х0, х1, ..., хn), которые называются узлами интерполяции, и значения некоторой функции f(x)

в этих точках (f(x0) = y0, f(x1) = y1, ..., f(xn) = yn).

Требуется построить функцию h(х) (интерполяционная функция), принадлежащую известному классу и принимающую в узлах интерполяции те же значения, что и f(x), т.е. такую, что

h(x0) = y0, h(x1) = y1, ..., h(xn) = yn.

22

Геометрически это означает, что нужно найти кривую h(х) некоторого определённого типа, проходящую через заданную систему точек M(xi, yi) (i = 0, 1, ..., n) (рис. 5).

Рис. 5. Иллюстрация решения задачи интерполяции

В такой общей постановке задача может иметь бесконечное множество решений (см. рис. 5) или совсем не иметь решений.

Однако эта задача становится однозначной, если вместо произвольной функции h(х) искать полином h(х) (интерполяционный полином) степени не выше n, удовлетворяющий условиям равенства интерполирующей функции и табличных значений в узлах.

Полученную интерполяционную формулу: an xn + an1xn1 + ... + a1x1 + a0 = h(x),

обычно используют для приближённого вычисления значений данной функции h(х) для значений аргумента х, отличных от узлов интерполяции.

Различают два вида интерполяции:

1)глобальная – соединение всех точек f(х) единым интерполяционным полиномом;

2)локальная – соединение точек отрезками прямой (по двум точкам), отрезками параболы (по трём или четырём точкам).

23

Глобальная интерполяция. Простейшим видом глобальной интерполяции является параболическая интерполяция, когда, используя описанные выше условия, для отыскания неизвестных (n+1) коэффициентов а0, а1, ..., аn интерполяционного полинома получают систему из (n+1) уравнений:

an x0n + an1x0n1

+ ... + a1x01

+ a0 = y0

;

 

n

n1

1

= y1

;

an x1

+ an1x1

+ ... + a1x1

+ a0

 

 

..............................

 

 

 

 

 

 

a xn

+ a xn1

+ ... + a x1

+ a

= y

.

 

n n

n1 n

1 n

0

n

 

Интерполяционная формула Лагранжа имеет вид:

hn (x) = yi

(x x0 )(x x1 )...(x xn ) .

n

 

 

 

 

 

 

 

 

i=0

(x

x

)(x

x )...(x

x

)

 

i

0

i

1

i

 

n

Локальная интерполяция. Однако интерполяция при большом числе узлов приводит к необходимости работать с многочленами высокой степени (например, 50-й или даже 100-й), что неприемлемо как из-за большого объёма вычислений, так и из-за склонности таких многочленов к осцилляции (колебаниям) между узлами сетки. Поэтому на практике часто используют интерполяцию кусочными многочленами (или локальную интерполяцию).

При этом между различными узлами выбираются различные многочлены невысокой степени.

Линейная интерполяция – интерполяция алгебраическим двучленом f(x) = ax + b функции f(x), заданной в двух точках x0 и x1 отрезка [x1, xn]. В случае, если заданы значения в нескольких точках, функция заменяется кусочно-линейной функцией.

Интерполяция сплайнами – это быстрый, эффективный и устойчивый способ интерполяции функций. Cплайн-интерполяция является одной из альтернатив полиномиальной интерполяции. Обычно применяют интерполяцию сплайнами, представляющими собой параболы 2-го и 3-го порядков.

24

В основе сплайн-интерполяции лежит следующий принцип. На каждом отрезке между соседними узлами функция задается полиномом второй или третьей степени (рис. 6). Коэффициенты полинома подбираются таким образом, чтобы выполнялись определённые условия (какие именно, зависит от способа интерполяции). Общие для всех типов сплайнов третьего порядка требования – непрерывность функции и, разумеется, прохождение через предписанные ей точки. Дополнительными требованиями могут быть линейность функции между узлами, непрерывность высших производных и т.д.

Рис. 6. Иллюстрация решения задачи интерполяции сплайнами

Основными достоинствами сплайн-интерполяции являются её устойчивость и малая трудоёмкость. Системы линейных уравнений, которые требуется решать для построения сплайнов, очень хорошо обусловлены, что позволяет получать коэффициенты полиномов с высокой точностью. В результате даже при очень большом n (числе экспериментальных точек) вычислительная схема не теряет устойчивости.

Сплайны в машиностроительном черчении и математике применяются уже давно, так как сплайн – это не что иное, как гибкая линейка, которую деформируют так, чтобы по ней можно было провести кривую через заданные точки (хi, yj). Будучи деформирована таким образом, линейка приобретает форму, при которой запасённая

25

в ней упругая энергия минимальна. Используя теорию изгиба бруса при малых деформациях, можно строго показать, что сплайн – это группа сопряжённых кубических многочленов, в местах сопряжения которых первая и вторая производные непрерывны. Такие функции называют кубическими сплайнами. Чтобы построить кубический сплайн, необходимо задать коэффициенты, которые единственным образом определяют кубический многочлен в промежутке между данными точками. Например, в случае, представленном на рис. 6, необходимо задать все кубические функции h1(x), h2(x), ..., hn(x). В наиболее общем случае эти многочлены имеют вид

hi (x) = a3i x3 + a2i x2 + a1i x + a0i , i = 1,2, …, n,

где aji – постоянные, удовлетворяющие условиям на границах сплайнов.

Первые 2n из этих условий требуют, чтобы сплайны соприкасались в заданных точках. Эти условия имеют вид:

hi (xi ) = yi , i = 1,2, …, n; hi+1 (xi ) = yi , i = 1,2, …, n – 1.

Следующие (2n – 2) из этих условий требуют, чтобы в местах соприкосновения сплайнов были равны первые и вторые производные:

hi+1(xi ) = hi(xi ) , i = 1,2, …, n – 1;

h′′

(x ) = h′′ (x ), i = 1,2, …, n – 1.

i+1

i

i i

Чтобы система алгебраических уравнений имела решение, необходимо, чтобы число уравнений точно равнялось числу неизвестных. На данном этапе мы имеем 4n неизвестных и (4n – 2) уравнений. Следовательно, мы должны найти ещё два уравнения. Обычно используют уравнения

h′′ (x ) = 0 и h′′ (x ) = 0.

1 0

n n

26

Полученный таким способом сплайн называют естественным кубическим сплайном. Найдя коэффициенты сплайна, можно использовать эту кусочно-гладкую полиномиальную функцию для представления данных при интерполяции, подгонке кривой или поверхности.

Следовательно, определение коэффициентов сводится к решению 4n уравнений с 4n неизвестными. Число определяемых коэффициентов равно числу заданных точек. Поэтому решение оказывается не более сложным, чем в случае аппроксимации (n+1) точек многочленом n-й степени. Часто оказывается, что кубический сплайн аппроксимирует функцию лучше, чем многочлен степени n. Следует отметить, что существуют и другие сплайны, получающиеся при других условиях на концах или использовании многочленов более высоких степеней.

1.5.3. Постановка и теория решения задач аппроксимации

Существует два основных подхода к аппроксимации табличных данных кривыми. При одном из них требуют, чтобы аппроксимирующая кривая (возможно, кусочно-гладкая) проходила через все точки, заданные таблицей. Это удаётся сделать с помощью методов интерполяции, рассмотренных выше.

При другом подходе данные аппроксимируют простой функцией, применимой во всём диапазоне табличных данных, но не обязательно проходящей через все точки. Такой подход называется подгонкой кривой, которую стремятся провести так, чтобы её отклонения от табличных данных были минимальными. Обычно стремятся свести к минимуму сумму квадратов разностей между значениями функции, определяемыми выбранной кривой и таблицей (сумму квадратов разностей между значениями аппроксимирующей и исходной функций). Такой метод подгонки называется методом наименьших квадратов [13]. Задачи же аппроксимации в литературе часто называются задачами регрессии или регрессионного анализа.

В этом случае определяемые параметры носят название «коэффициенты регрессии».

27

Пусть в таблице задана (п+1) точка (х0, y0), (х1, y1), ..., (хn, уп) и требуется найти аппроксимирующую кривую h(x) в диапазоне

х0 х хn. В этом случае погрешность в каждой табличной точке

εi = h(xi ) yi .

Сумма квадратов погрешностей

n

E = [h(xi ) yi ]2 .

i=0

Необходимо найти такой вид функции h(x), при котором обеспечивается минимальная среднеквадратическая погрешность аппроксимации (рис. 7, а).

5

)

 

 

 

 

5

 

 

 

 

 

 

 

 

 

ff(x), h(x))

 

n=m

 

 

 

ff(x), h(x)

n>m

 

 

 

4

 

 

 

 

4

 

 

 

 

 

 

 

 

б)

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

a)

2

 

 

 

 

 

1

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

0

 

 

 

 

5x

0

1

2

3

4

5x

0

1

2

3

4

 

 

а

 

 

 

 

 

 

б

 

 

6

 

 

 

 

 

f(x),),

 

n<m

 

 

 

h(x))

 

 

 

 

5

 

 

 

 

 

4

 

 

 

 

 

3

 

 

 

 

в)

2

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

0

 

 

 

 

x5

0

1

2

3

4

 

 

 

в

 

 

Рис. 7. Иллюстрация решения задачи аппроксимации

Приэтомрешениезадачи может вестисьвследующихусловиях: 1. Если вид функции h(x) известен, то определяются параметры, от которых зависит её значение при известных x, из системы

уравнений, выражающих равенство нулю частных производных:

28

EA = EB = CE = ... = 0.

Например, если известно, что функция h(x) = AeBx + C,

то определению подлежат коэффициенты A, B и C. Следует учитывать, что число определяемых коэффициентов (параметров) m не может превышать число экспериментальных точек n (см. рис. 7, а).

2. Если вид функции h(x) неизвестен, то аппроксимирующую кривуюможнопредставитьввиде суммы k известныхфункцийgk(x):

k

h(x) = ck gk (x).

i=1

Как правило, применяются линейные комбинации. Коэффициенты сk определяют из системы линейных уравне-

ний, выражающих равенство нулю частных производных:

E

=

E

=

E

= ... =

E

= 0.

c

c

c

c

 

 

 

 

1

 

2

 

3

 

k

 

Очевидно, что задача имеет решение при kn. В некоторых учебниках решение этой задачи называется построением линейной регрессии общего вида.

В целом, возможны три соотношения между количеством экспериментальных точек n и количеством коэффициентов регрессии т:

1. Количество коэффициентов регрессии равно количеству экспериментальных точек (т = п). В этом случае задача сводится к системе т уравнений с т неизвестными. В данном случае можно найти поверхность (кривую), точно проходящую через все экспериментальные точки.

В качестве примера на рис. 7, б показана такая кривая, построенная в виде полинома 3-й степени (n = 4, т = 4) по четырём экспериментальным точкам. Для опорных точек полученное решение является точным, т.е. обладает нулевой ошибкой. Однако точность

29

описания процесса в промежуточных точках и достоверность самого характера модели при этом достаточно сомнительны. В частности, для экспериментальных данных, показанных на рис. 7, б, более точной является совсем другая модель (кривая отклика показана пунктиром). Дело в том, что в случае n = m для определения коэффициентов регрессии используются все экспериментальные точки и не остаётся информации – степеней свободы – для проверки точности модели. Поэтому случай п = т с точки зрения идентификации не является оптимальным.

Число степеней свободы fS некоторой выборочной статистики равно числу независимых случайных величин минус число определённых по ним независимых параметров.

2.Количество коэффициентов регрессии больше количества экспериментальных точек (m>n). В этом случае в системе урав-

нений меньше, чем неизвестных. Система недоопределена, и, следовательно, существует неограниченное число моделей, обладающих нулевой ошибкой (т. е. неограниченное число поверхностей отклика, проходящих через все экспериментальные точки). Например, на рис. 7, в показано несколько кривых шестого порядка, построенных по четырём экспериментальным точкам (п = 4, m = 6). Модели этого типа неустойчивы и не могут быть использованы на практике.

3.Количество коэффициентов регрессии меньше количества экспериментальных точек (т<п). В этом случае число экспери-

ментов больше, чем количество независимых параметров, которые на основе экспериментальных данных требуется определить. Система уравнений для определения коэффициентов регрессии переопределена, и, следовательно, не существует ни одного решения, удовлетворяющего всем уравнениям (предполагается, что система не вырождена). Это значит, что нельзя построить поверхность отклика, проходящую через все экспериментальные точки (см. рис. 7, а). При этом, однако, можно построить приближённую модель, обеспечивающую в некотором смысле наилучшее совпадение с экспериментальными данными. Так, прямая, представленная на рис. 7, а, соответствует приближённой линейной модели, построенной по семи

30

Соседние файлы в папке книги