книги / Обработка и представление результатов эксперимента
..pdfЛинейное сглаживание экспериментальных данных по трем точкам реа лизуется с помощью следующего алгоритма:
Уо = (5^о + 2 У\ ~ У 2 )/6> |
i = 0; |
|
Л = (У*-1 + Л + Л+1)А |
1 ^ ^ |
- 1; |
® (5^ + 2.УЛМ “ yN -2) /6» |
* = N |
Более точным является линейное сглаживание по пяти точкам, которое
можно осуществить по следующим формулам:
Уо = (3>о + 2 У\ + У2 ~ У 4 )А |
*= о; |
>1 = (4^0 + 3У\ + 2у2 + Л)/10, |
/ = 1; |
Уг = (Д'у-г + Л -i + Л + Л +j + Л+2)/5.
Уы- 1 ^(УЫ-Ъ+2УЫ-2 +ъУИ-1 + 4.удг)/10, i = W- 1;
% =* + 2.УЛГ-1 + W -2 “ УN-4)15* 1= ^
Данные алгоритмы могут быть также использованы в численных методах
решения дифференциальных уравнений методом сеток, когда необходимо для повышения Устойчивости счета «сглаживать» массивы переменных.
10.Интерполяция и экстраполяция данных
10.1. Интерполяционный многочлен Лагранжа
ЧастОв процессе работы имеют дело с дискретными функциями, задан ными Таблично. Это могут быть математические справочные данные, результа ты экспериментов и т.д.
ЙереДКО случается так, что для работы могут понадобиться значения функции при промежуточных, не представленных в таблице, значениях незави симой Переменной (аргумента) - задача интерполяции, или при значениях ар гумент^, леж^щих за пределами данных таблицы, - задача экстраполяции (от лат. ииШер ~ Внутри, экстра - снаружи, полюс - точка). В этих случаях для по
лучения промежуточных значений используются интерполяционные многочле ны. Мы рассмотрим интерполяционный многочлен Лагранжа.
Пусть функция |
у = |
/ (х) задана дискретно, например в виде таблицы: |
|||
у0= / (х0); y \= f (*i); |
|
Уп=/(х„). Задача интерполяции ставится в следую |
|||
щей форме: найти многочлен Р(х) = Р„(х) |
степени не выше я, значения которо |
||||
го в заданных точках |
дг, |
(/ = 0, 1, |
п) совпадают со значениями данной |
||
функции у, в этих же точках, то есть Р ( JC, ) = У\ (/ = 0, 1, ..., я). |
Многочлен |
||||
Р(х) называется интерполяционным многочленом, точки х, (/ = 0, |
1, |
п) - |
|||
узлами интерполяции. |
|
|
|
|
|
Воспользуемся хорошо известным интерполяционным многочленом Ла гранжа при произвольном расположении узлов:
Ln(x) = 1 4 Л)(X) • УС |
где у, = / ( х ,) . |
|
|
1=0 |
|
Величины |
lfjn\ x ) называются коэффициентами Лагранжа и вычисляются |
|
по формуле |
|
|
|
~ хоХх ~ ■*!)•••(•* ~ -*i-lX * ~ •*/+1 )•••(■* ~ хп) |
|
|
(x i —JTQXXj |
)••Xx i ~~ x i—1X xi “ ■*/+] )••Xх i ~~ xn ) |
Тогда |
|
|
f( x k)* L n(xk)= i 4 |
n\ x k ) . f ( Xi) |
|
|
/=0 |
|
для любого |
Jt* из множества значений x. |
Для вычисления коэффициентов Лагранжа удобно применить матричное расположение разностей (подчеркнутые разности находятся на главной диаго
нали):
х ~ х0 |
х0 ~ х\ |
х0 ~ х2 |
хо ~ хп |
Х\ -XQ |
х - хх хх- х2 |
хг - х п |
|
х2 ~ х0 |
х2 ~ *1 |
х ~~х2 |
х2 ~ хп |
хп ~ х0 хп ~ х\ хп ~~х2 |
х ~ хп |
В матрице имеется (л+1) строк и (л+1) столбцов. Независимая переменная JC
находится на диагональных элементах.
Обозначим произведение элементов /-й строки (/ = 0, 1, ..., п)\
А=(•*» -*оХ*» --*1). •(* - */)•••(*,-х„ ).
Ввеличине Д содержится произведение (л+1) разностей. Произведение элементов главной диагонали обозначим как'
п
Щх) = П(* - х,) = (х - Х0)(х - *,)...(* -х„). i=0
В величине П(х) содержится произведение (n+1) разностей. Тогда /-й ко эффициент Лагранжа может быть рассчитан по формуле
/= 0, 1,2,...,л.
10.2.Варианты применения интерполяции
1. Линейная интерполяция: n = 1; / = 0,1 у тогда
/00 * 1 $ \ х ) ■Д х о ) + 4 1}О0 • Д х о .
где коэффициенты Лагранжа имеют вид
L(I)^ = Ot-*oX*-*l) = 0^*0 .
° (■* ~ -*оХ-*0 — (-*0 — '
ЛГ)(Х) = ( х - Х 0Х х -х { ) = (-У-ДГр)
^ |
’ |
(X I - X QXX - X,) |
(х, - х0) ' |
|
|
Тогда функцию f(x) можно представить следующим образом: |
|
||||
/ м |
- ^ |
Ц / ( « . ) +^ |
/ М - ■л '° х*' ~ |
Д { (^ |
~' о) |
|
/ м |
т |
т |
|
|
|
■X------------------ |
X---------------------- |
X---------------- |
х |
|
х0 |
X |
Х\ |
2. |
Квадратичная интерполяция: п = 2; |
/ = 0,1, 2 , тогда |
||||
/( х ) * 4 2>(х) • д * о ) + 4 2)м • / ы |
+ |
4 |
2)« |
• я * 2) ’ |
||
где коэффициенты Лагранжа имеют вид |
|
|
|
|
||
z,(2)(x) = |
|
_ |
(лг-*|Х *--*2) . |
|||
0 |
(JC—JCOX-^O - -^I Х^о —^2) |
(Jfo —^1 Х^о —^2 ) ’ |
||||
i i 2)(x ) = |
( * - * о Х * - * 1 Х * - * 2 ) |
= |
( * - * о2Х) *. - * |
|||
^ |
’ |
(*1 - * o X - * - * i X - * i -- * 2 ) |
|
C * |
i - * o X2)*’ i - * |
|
№ ( X) ~ / r - * o X * - * i X * - * 2 ) |
_ |
( * - * о Х * - * 1 ) |
/ м |
т |
f(*l) |
№ |
Хо |
X |
Х\ |
XI |
Экстраполяция из-за возможной большой погрешности целесообразна за пределы изменения х не более чем на половину интервала между ближайшими
значениями *, то есть на полшага.
Пример. Пусть у нас в распоряжении имеются не очень подробная таб лица синусов и калькулятор, на котором не вычисляются функции. В процессе работы нам понадобилось значение sin 18°. Здесь не обойтись без интерполя
ции. Выпишем соседние значения синусов: |
|
||
X |
15® |
20° |
25° |
sin д: |
0,2588 |
0,3420 |
0,4226 |
Линейная интерполяция: |
п = 1. |
|
SU1 18. * s™ 15°(20° -18°) + sin 20°(18° -15°) _ 20°-15°
Инженерный калькулятор дает значение (которое условно можно считать
точным) sinl8 = 0,3090. Относительная погрешность между результатом ин терполяции и «точным» - не более 0,1 %.
Квадратичная интерполяция: п = 2. Значок градуса над углами не пи
шем.
sin 18 « (18-20)(18-25) sin 15 -h (18-15)(18-25) sin 20 + (18-15)(18-20) sin 25 = (15-20)(15-25) (20 —15)(20 —25) (25 —15)(25 —20)
= 0,28sin 15 + 0,84 sin 20 - 0,12sin 25 = 0,3091.
Относительная погрешность этого результата интерполяции не более 0,03 %, что существенно меньше, чем при линейной интерполяции.
11. Смешанный второй момент и корреляция
11.1. Смешанный второй момент
Вернемся еще раз к вопросу о расчете ошибок в косвенных измерениях. Пусть имеется функция двух независимых переменных q = q (х, у). Сначала мы проводим N раз прямые измерения величин JC: JCJ, х2, ..., хц и у: УиУ2У• • •, Уы-
Затем вычисляем
* = ! > , |
стх = Z O ; - х ) 2 /м-. |
|
/ / |
/ |
/ |
У = 11.У1 |
G2y =Z ( y i - y ) 2/H - |
|
Следующий шаг - расчет N значений искомой функции |
||
?i ^ i C W /X |
7 ~ 1>2, |
N. |
Наша задача: получить выражения для среднего значения q = Y, Яi /М и стан
дартного отклонения Gg =£ (^ ; - q ) 2,j N - меры случайной погрешности в
значениях Будем предполагать, что все погрешности малы. В этом случае справед-
либо приближение
ч, - «<*, , У,У- «№ W ♦ |
J 4 - Ч ■* ( | ) _ _O’! - я |
Среднее значение
_ |
1 _ |
1 „ |
9 |
|
|
Преобразуем второе слагаемое под знаком суммы:
Аналогично, третье слагаемое будет равно нулю. Остается только отлич ное от нуля первое слагаемое, тогда
Я = 77 |
£ 4i = 77 Z я(х, Я = 77 Щ х, у) = q(х,у) |
|
|||
* 1 |
N |
i |
N |
|
|
|
|
||||
Таким |
|
образом, |
|
среднее арифметическое от |
есть значение самой |
функции q в точке (х, у ) . Ответ очевиден. Теперь рассчитаем стандартное отклонение:
■ ( * )
Здесь введена новая величина - смешанный второй момент (корреляци
онный момент,шт ковариация)
< * х у = ^ г Е (* /- * )(л - Я -
Если количество произведенных измерений независимых переменных х и
У, распределенных нормально, очень велико (N -> ад), то |
-> 0. В результа |
те получаем уже знакомое выражение |
|
11.2. Линейная'корреляция |
|
Пусть мы измерили N различных значений JCJ, JC2, |
хц и соответствую |
щих им значений уь Уг, ...».Ум то есть получили N точек (JCJ, уО, (JC2, у2),
(*N, Ун)- В методе наименьших квадратов (МНК) задача заключалась в том,
чтобы определить наилучшую прямую линию у = А + Дх, аппроксимирующую набор полученных экспериментальных точек (JCJ, yi), (х2, У2), • • - , (*м Ун)-
В этой части мы попытаемся ввести некоторую меру того, насколько хорошо полученные в эксперименте точки (х„ у,) ложатся на прямую линию. Это позволит провести предварительный анализ данных до использования
МНК. Здесь нам поможет введенное понятие смешанного второго момента а„..
Замечание: теперь х\, JC2, |
х^ - не результаты |
измерений одной |
|
величины |
группирующиеся возле наилучшего значения |
X, а N различных |
значений переменной х. То же можно сказать и о значениях переменной у. Введем новую величину - коэффициент линейной корреляции г, или про
сто коэффициент корреляции
Г--2*У
который показывает,насколько хорошо точки (х,-,у,-) аппроксимируются прямой линией. Подставим формулы о^, сХу су в выражение для г и получим
ОО'/--)')
Перечислим некоторые свойства коэффициента корреляции г.
1)диапазон изменения: - 1^ г < 1;
2)если г -> ± 1, то точки лежат вблизи некоторой прямой линии;
3)если г -» 0 , то точки не коррелированы и не группируются около пря
мой линии.
Обоснуем эти свойства:
1. Смешанный второй момент а**, удовлетворяет так называемому
неравенству Шварца |а ^ | £ с х • с у . Так как г = сг^ / с хс у , то |/j < 1 или
—1 < г ^ 1. |
|
|
2. Пусть все точки (х,, у,) |
лежат точно на прямой линии у - Л + Вх. Тогда |
|
у,- = А + Bxj |
V/ и у = А + Ях |
(показали в МНК). Разности у,- - у = 5(х#- - х ) |
/ = 1, 2, . . . , # |
подставим в выражение для г и получим |
Реально экспериментальные точки не лежат точно на прямой линии, поэтому
т—> ±1, т.е. близко к значениям ± 1.
3. Если нет связи между х и у, то в числителе (выражения для г) отдел
ные члены в сумме с одинаковой вероятностью могут быть и больше 0 и меньше 0, тогда как знаменатель всегда больше 0. В пределе N -> оо г * 0. Реально число точек ограничено, и г -» 0, т.е. если коэффициент г мал по мо дулю, то значения переменных х и у не коррелированы.
11.3.Количественный критерий значимости г
Унас пока нет еще полного ответа на вопрос «Насколько хорошо экспериментальные точки подтверждают линейную связь между х и у ?». Например, значение г = 0,6 будет ли разумно близко к 1 ? У нас всегда имеется
в распоряжении конечное число измерений,и пределы г ->±1 и г -» О практи чески недостижимы.
Существует оценка некоррелированности величин (обратите внимание на отрицание). Пусть две переменныех н у в действительности некоррелированы. Обозначим через £ ty) вероятность того, что N измерений двух некорре лированных переменных х и у приведут к значению коэффициента г, не мень шему чем любое заданное значение г0. Расчет таких вероятностей довольно сложен, но результаты вычислений известны и затабулиррваны. Пример таблицы приведен ниже.
N |
|
|
|
|
|
при Го |
|
|
|
|
|
|
0 |
0,1 |
0,2 |
0,3 |
0,4 |
0,5 |
°,6 |
0,7 |
°,8 |
0,9 |
1,0 |
3 |
100 |
94 |
87 |
81 |
74 |
67 |
59 |
51 |
41 |
29 |
0 |
6 |
100 |
85 |
70 |
56 |
43 |
31 |
21 |
12 |
6 |
1 |
0 |
10 |
100 |
78 |
58 |
40 |
25 |
14 |
7 |
2 |
0j5 |
- |
0 |
20 |
100 |
67 |
40 |
20 |
8 |
2 |
0£ |
ы |
- |
- |
0 |
50 |
100 |
49 |
16 |
3 |
№ |
- |
- |
- |
- |
- |
0 |
П р и м е ч а н и я |
к таблице: |
|
|
|
|
|
|
||||
1. Значения |
/Jy(|r| £ /р) даны в процентах. |
|
|
|
|
||||||
2. Прочерки - значения |
/fy(|r| ^ 'b) |
меньше 0,05 %. |
|
|
|
||||||
3 . N - число экспериментальных точек. |
|
|
|
|
|
||||||
4. г0 - значения, подсчитанные по формуле ф = ^ху/с хау |
|
|
|||||||||
Как пользоваться таблицей |
? Пусть, например, N=10, а |
г0 = 0,6. Из |
|||||||||
таблицы получаем, что |
/fy(|rj £ 0,6) = 7 % , то есть вероятность того, что 10 |
некоррелированных точек дадут |г| £ 0,6 составляет 7 %.
Принято считать, что «значимое» значение корреляции наступает при
ify(| /j>/ft)£5% , а «высокозначимое» - при Р^(\г\^.г^)й\% . «Значимые»
значения выделены в таблице подчеркиванием.
Если вероятность достаточно мала (например, при увеличении числа из мерений до N= 20 получаем Р2о(И ^ 0,6) = 0,5 %), то мы можем заключить, что очень невероятно, чтобы в этих условиях х и у были некоррелированы, а следо
вательно, очень вероятно (99,5 %), что они в действительности коррелированы.
Обратим внимание на некоторые особенности таблицы. В первом столбце
PN (\r\ > 0) = 100 %, так как |г| > 0 всегда. Аналогично, в последнем столбце fy(|/j > 1,0) = 0 %, так как вероятность точно получить |rj = 1 равна нулю, а ус ловие |r| > 1 просто невозможно. Вероятность уменьшается с ростом числа из
мерений И и с ростом значения г<>. Действительно, по 3 точкам трудно получить убедительное подтверждение корреляции, даже при высоком г0=0,9.
Окончательные выводы.
Имеется N пар значений (х„ у,). Насколько хорошо они ложатся на
линейную зависимость ? Вычисляем сначала = Gxy/axay • Затем по таблице
находим /^ (И ^ П )) - вероятность того, что эти N некоррелированных точек дадут для коэффициента корреляции г значение, не меньшее чем полученный коэффициент г0. Если эта вероятность достаточно мала (Рдг(|г| £ /&) ^ 5 %), то можно заключить, что очень невероятно, чтобы х и у были некоррелированы, а значит, очень вероятно, что они в действительности коррелированы.
11.4. Упражнения
1. Докажите тождество £ (* , - x \ y t - у) = £ Jt/у, - N • х • у .
/ |
/ |
Д о к а з а т е л ь с т в о : |
|