Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Основы математических знаний для изучения физики

..pdf
Скачиваний:
1
Добавлен:
12.11.2023
Размер:
4.06 Mб
Скачать

1.9. Метод наименьших квадратов

Метод наименьших квадратов (МНК) известен в математике со времен Гаусса. Немецкого математика Гаусса (1777-1855) часто называют королем математики. МНК полезен при обработке результатов измерений или наблюдений, содержащих случайные ошибки. Метод позволяет находить приближенные аналитические зависимости по полученным экспе­ риментальным данным. Можно без преувеличения сказать, что МНК позволяет находить исследуемые закономерности. Поэтому необходимо

знать основные понятия этого метода, используемые для

обработки

экспериментальных данных.

 

Типичная постановка задачи МНК такова. Имеется таблица значений аргумента (/ = 1, п) и соответствующих им значений функции у .. Полагается,

что значения функции получены с некоторой погрешностью. Требуется выяснить параметры предполагаемой аналитической зависимости у = fix ) так, чтобы сумма квадратов отклонения табличных значений от этой функции была минимальна. Сумма квадратов отклонения, называемая еще суммой квадратов невязок,

S = 2 > ,(/(c„ с2, ср>х^ - уУ , (1.77) /=)

где ck(k = 1, 2, ..., р) - параметры формулы.

Весовые коэффициенты р> могут учитывать «значимость» (точность) /-го измерения. Если нет каких-либо сведений о зависимости точности измерений

от его номера, весовые коэффициенты опускаются.

Задача заключается в

нахождении параметров, дающих минимум суммы

(1.77).

Параметрами

функции f{x)

могут быть, например, коэффициенты при известных выбранных

функциях фДдг):

 

 

 

/( * ) = X е* •%(*)•

 

о -78)

 

*=1

 

 

Такой

случай аппроксимации исследовал

русский

математик

П.Л. Чебышев.

Как правило, для корректности постановки задачи требуется, чтобы число параметров было меньше числа измерений ( р < п ). Найденные параметры

ближе к реальным параметрам при большом числе измерений (л > р).

В соответствии с законами математики минимум суммы квадратов невязок достигается при равенстве нулю частных производных от суммы квадратов невязок S по всем параметрам:

— = 0, * = 1, 2,

(1.79)

дск

 

Естественно предполагается, что искомая функция является аналитической и зависит от параметров непрерывным образом.

Задача поставлена, и теперь требуется решить систему уравнений (1.79). Но возникает ряд вопросов. Первый из них - всегда ли эта задача имеет решение? Второй - единственно ли оно? И практический вопрос - как найти соответствующее решение?

Трудность нахождения решения зависит от системы уравнений (1.79), которые в свою очередь определяются видом функции /(* ). Система уравнений (1.79) может оказаться нелинейной.

Доказано, что в случае многочлена система уравнений оказывается линейной и задача имеет единственное решение. Опишем этот случай, полагая,

что

 

f i x ) = Рт{х) = а0+а,х + а'х2+... + атхт

(1.80)

Параметрами многочлена являются коэффициенты ак(к = 0, 1, ..., т). Число этих коэффициентов (число параметров р ) равно т+1. Для построения системы уравнений (1.79) находим частные производные

ЛС

П

 

£ ~ = 2Z iK - P J x M (* = 0, 1, ...,« ) .

(1.81)

дак

В формуле (1.77) мы положили р>.=1. Приравнивая нулю найденные производные, убеждаемся в том, что соответствующая система уравнений линейна по отношению к искомым коэффициентам. Система уравнений (к =0, 1, ..., т ) имеет следующий вид:

п

\

( п

\

( п

\

( п

\

 

 

а0+

2 > "

)

а\ + £

х*+2 в2+...+

 

 

II

. /=1

J

V /=1

^ /=1

)

 

У

/=1

( 1.82)

Матрица коэффициентов этой системы симметрична. Определитель этой системы не равен нулю, следовательно, система разрешима. Выпишем все уравнения системы для часто используемого случая - полинома первой степени, когда данные аппроксимируются линейной зависимостью вида f ix ) = аа + а,х:

л\

п-а0 + 2 > , a , = Z ^ '

(1.83)

 

п

\

( п

у

п

 

2 > / 1

а0+ Z * - 2

)

Z у л -

 

/=1

/

V /=1

 

Еще раз подчеркнем, что для метода наименьших квадратов требуется

выполнение неравенства

n>(m-r 1). Если число параметров многочлена равно

числу заданных значений

{ п л -1), система

имеет решение, проходящее

через заданные точки; при этом, по сути дела, решается задача интерполяции. Покажем пример применения МНК для обработки данных по

радиоактивному распаду. Полагаем, что в результате п измерений в моменты

времени

/, (/ = 1, 2, ..., п) получены значения интенсивности распада

/V, . Из

физики

известен закон радиоактивного распада

 

 

N(t) = N0• exp (—Л./).

0-84)

Возникает вопрос -- как с помощью полученных измерений определить константу радиоактивного распада - X I Если использовать в сумме квадратов невязок функцию (1.84), метод приведет к необходимости решать нелинейную систему' уравнений. Решать нелинейную систему уравнений сложнее, чем линейную. Но оказывается, что задача может быть сведена к линейной. Для этого достаточно вспомнить, что в логарифмическом масштабе уравнение (1.84) превращается в линейное

/(О - 1п(.¥(/)) = ln(7V0) - Xt

(1.85)

Следовательно, необходимо прологарифмировать значения /V,., положив у, = 1п(А,), и сумму квадратов невязок записать в виде

S = £ ( .V/-1п(ЛГ0) + Ц )2

(1.86)

 

В результате приравнивания нулю

 

производных от этой суммы по двум

 

параметрам

(1п(А0)

и X)

придем

 

к линейной системе.

 

 

 

На

рис. 6

приведен

пример,

 

качественно

показывающий

распо­

 

ложение

данных

измерения

отно­

 

сительно

прямой.

Аналогичный

график

Рис. 6. Пример с определением

всегда

полезно

приводить

после

константы радиоактивного распада

нахождения

функции,

чтобы

увидеть

 

степень погрешности и убедиться в правильности решения (глаз человека легко заметит серьезную ошибку в аппроксимации).

1.10. Контрольные вопросы к главе 1

1.Чему равна длина вектора, равного сумме двух векторов А\{ 1, 2),

М4, 2)?

2.Чему равна третья производная от функции ехр(2х)?

3.Чему равно значение м(1) при линейной и квадратичной интерполяции, если дано и(0) = 0, и(2) = 2, и(3) = 8?

4.Сколько может быть вещественных корней у полинома третьей степени?

5.Оценить с помощью формулы Тейлора значение схр(0,01).

6.Сколько будет слагаемых в ряде Фурье, если разлагаемая в ряд Фурье функция и(х) = 2sin(x) + 4sin(2x)?

7.Чему равна относительная погрешность вычисления произведения х\х2з если 8, =0,01, 62=0,002?

8.Оцените погрешность вычисления fix ) = ехcos(2x)при х = л/ 2±0,01.

9.Чему равен угол наклона прямой, проведенной методом наименьших квадратов для следующих данных: y(l) = 1, у(2) ~ 2, у(3) = 1?

10.Сколько корней у производной от полинома второй степени?

через элементарную площадку

2, ЭЛЕМЕНТЫ ВЕКТОРНОГО АНАЛИЗА И ТЕОРИИ ПОЛЯ

2.1. Поток векторной величины

Понятие потока векторной величины неоднократно встречается в физике. Так, например, в электродинамике рассматривается поток напряженности электрического поля и с помощью этого понятия формулируется теорема Гаусса. Закон индукции Фарадея также использует понятие потока.

Дадим вначале понятие потока для любого вектора А , не привязываясь к его физическому смыслу. Однако для облегчения понимания можно считать,

что этот вектор соответствует скорости потока жидкости. Поток вектора А через малую площадку dS вычисляется с помощью скалярного произведения по формуле

= Л - dS = Л • dS • cos(qp).

(2.1)

Величина потока обозначена буквой Ф с индексом вектора. Ниже мы будем придерживаться таких же обозначений для потоков других величин,

используя в качестве индекса потока соответствующий вектор. Вектор dS

направлен по нормали

к

площадке

 

(dS = dS • п , п - единичный вектор нормали

 

к площадке). Угол (р (рис. 7) -

это

угол

 

между векторами A n n .

 

 

dS

 

Малость

размера

площадки

 

обеспечивает возможность в общем случае

 

пренебречь

кривизной

площадки

и

Рис. 7. Поток вектора

 

 

 

 

 

изменением вектора А в пределах площадки. Поток (2.1) называют иногда

элементарным. Напомним эквивалентные формы (см. параграф о произведениях векторов) записи скалярного произведения (2.1):

6ФА= A-dS = A„-dS.

(2.1)

Из свойств скалярного произведения следует, что величина потока максимальна при угле между векторами, равном нулю, и равна нулю, когда

нормаль площадки перпендикулярна вектору А (ср= л /2 ).

Поток вектора через любую поверхность вычисляется с помощью определенного интеграла от (2.1):

Ф 4= р Ф ^ = p d f

(2.2)

( S )

(S)

Заметим, что при интегрировании вектор нормали должен быть направлен в одну и ту же сторону относительно поверхности. В случае замкнутой поверхности следует выбирать вектор внешней нормали, г.е. вектор, направленный вовне из области, ограниченной поверхностью.

Приведем пример простой задачи, связанной с вычислением потока. Пусть солнце расположено над горизонтом под углом 10° Во сколько раз поток солнечного излучения через вертикальную площадку больше потока через горизонтальную площадку? Для горизонтальной площадки угол между направлением солнечных лучей и нормалью к площадке составляет 80°, а для вертикальной площадки 10°. Следовательно, отношение потоков равно отношению косинусов углов к = cos(10°)/cos(80°) «5,7. Примерно во столько раз эффективнее при низком солнце загорать стоя.

Важным случаем потока является поток через замкнутую поверхность. Формально формула для потока в случае замкнутой поверхности также вычисляется по формуле (2.2). Но чтобы подчеркнуть замкнутость поверхности для интеграла, используют другое обозначение:

= (^ Л • dS = (^ • d.S.

(2.3)

(S)(S)

Атеперь сформулируем теорему Гаусса (Гаусса - Остроградского) для вектора напряженности электростатического поля Е и покажем, как ее использовать в простейших ситуациях. Согласно этой теореме поток вектора Е через любую (мысленную) замкнутую поверхность пропорционален алгебраической сумме зарядов, находящихся внутри этой поверхности:

0 £ = <f£-dS = cj£(1-dS = - 2 X 6

(2.4)

(S)

(5)

8 0

 

Заряды в сумме отмечены индексом «охв», напоминающим, что суммирование касается лишь зарядов, охваченных замкнутой поверхностью. Если задано непрерывное распределение зарядов, вместо алгебраической суммы используется определенный инге^ал от плотности распределения заряда.

Покажем применение этой теоремы вначале для точечного заряда. Выберем в качестве замкнутой поверхности сферу, центр которой находится в месте расположения заряда. Отметим важный момент. Выбор замкнутой поверхности делается таким образом, чтобы облегчить вычисление потока. Этому выбору помогает знание свойств симметрии электрических полей. В случае точечного заряда известно, что вектор напряженности электрического поля направлен по радиусу и величина его на этой поверхности одинакова. Поэтому поток напряженности электрического поля через поверхность такой сферы легко вычисляется следующим образом:

Ф„Г. = cfП Еп -dS = Е,п cfп dS = En - 4nr2= Eг

-Am1

(S)

 

Приравнивая вычисленное

значение потока

величине qfe0

соответствии с теоремой), получим известную формулу для зависимости напряженности единичного заряда от расстояния:

4пе0г2

Приведем еще один пример. Пусть требуется вычислить напряженность поля от бесконечного заряженного цилиндра радиусом R, в предположении, что заряд распределен на цилиндре при г - R равномерно с поверхностной плотностью а . Геометрия подсказывает, что в качестве замкнутой поверхности следует выбрать также цилиндр с той же осью. Высота цилиндра роли не сыграет, так как и поверхность, и величина заряда пропорциональны высоте цилиндра. При вычислении потока учитываем, что вектор напряженности перпендикулярен оси цилиндра. Поэтому поток через торцевые поверхности оказывается равным нулю и полный поток легко вычисляется (S '-боковая поверхность цилиндра):

O t = c f £ - d S - [ Ег • dS' = £, • 2 я г# .

(S)

Всоответствии с теоремой Гаусса это значение следует приравнять величине заряда на боковой поверхности цилиндра, равное 2KRHG , и поделить

на константу е0, если r> R . При r< R величину заряда следует положить

раной нулю. В итоге получаем, что внутри цилиндра поле равно нулю, а вне цилиндра (г >R)

2.2. Связь потока с дивергенцией

Дивергенция (расходимость) вектора А есть предел отношения потока через замкнутую поверхность, окружающую рассматриваемую точку, к объему, ограничиваемому этой поверхностью, когда она стягивается к точке. Математически это определение записывается коротко:

Cp-dS

 

 

div^ = lim—

при V -> 0.

(2.5)

С помощью этого определения находятся формулы для вычисления дивергенции в точке. Эти формулы зависят от используемой системы координат. В декартовой системе координат

divA = V/4 =

дЛу |

дЛ2

(2.6)

+

dz

ох

ду

 

В формуле (2.6) отмечено еще одно обозначение для дивергенции вектора, принятое в векторном анализе. Это обозначение дается с помощью скалярного произведения оператора Гамильтона V на вектор. Оператор ГахМильтона определен соотношением

V

д г

д *7

н

д г

(2.7)

----

1

+

----- J

к .

 

дх

 

 

д)>

 

dz

 

В цилиндрических координатах г, <p, z дивергенция вычисляется по формуле

 

.

1

8(rAr)

1 дА

дА

 

(2.8)

diуА

=—

-— — +----- + —— .

 

 

 

г

дг

г дcp

dz

 

 

В сферических

координатах

г, 9, ср

дивергенция

вычисляется по

формуле

 

 

 

 

 

 

 

div^ 4 ^

f 4

) + ._ L .e ( 5 ! ! lM ) +_ J _

4 ,

(2.9)

г

дг

г sin 9

69

гsin 9

бср

 

где 9 - полярный угол, ф - азимутальный угол.

Русским математиком Остроградским в 1828 году получена формула (опубликована в 1931 году), связывающая величину потока через замкнутую поверхность с объемным интегралом от дивергенции:

<&, = < p d S =

Jdiv/i-dF

(2.10)

iS)

V

 

Формула Остроградского позволяет перейти от интегральных уравнений Максвелла к дифференциальным уравнениям.

Приведем пример формального вычисления дивергенции. Пусть компоненты вектора заданы формулами:

Ax =xz2, Av=xy2z \ Az =x2y 2z3

По правилам вычисления частных производных имеем

di\А = z2 + 2xyzJ-г3x2y 2z2

Желательно на конкретных примерах понять смысл дивергенции. Помочь этому пониманию помогает его определение (2.5).

На рис. 8 изображены три варианта полей некоторых векторных величин. В первом варианте поток вектора через замкнутую поверхность равен нулю. Следовательно, будет равна нулю и дивергенция (расходимость). Во втором

divA =О div.4 > О diуА < О

Рис. 8. Примеры полей с различными значениями дивергенции

варианте величина потока положительна. Положительной будет и дивергенция. В третьем варианте величина потока отрицательна. Отрицательной будет и величина дивергенции. Очевидно, что для однородных полей дивергенция тождественно равна нулю.

Вспомним пример применения теоремы Гаусса для точечного заряда.

Вычисленная

величина напряженности £г ~1/г2, поток через сферическую

поверхность

O£=const. Для вычисления дивергенции следует поток

разделить на объем сферы и устремить радиус сферы к нулю. При этом мы увидим, что дивергенция вектора напряженности поля точечного заряда в месте расположения заряда равна бесконечности.

Понятие дивергенции широко используется в гидродинамике. Для несжимаемой жидкости дивергенция скорости жидкости равна нулю. В этом заложен простой физический смысл - количество втекающей жидкости в любой объем равно количеству вытекающей жидкости.

2.3. Ротор и циркуляция вектора

Ротор или вихрь векторного поля вычисляется по формуле

(2.11)

Символ rot происходит от латинского слова rotatio (вращаю). В старых книгах встречается иногда символ curl (от английского слова, обозначающего локон, вихрь). Для облегчения запоминания компонент ротора следует учесть две особенности. Первая особенность - координаты, по которым определяются производные от компонент вектора, берутся в циклическом порядке: для

компоненты по

х - y,z; для компоненты по

~z,x;

для компоненты по

z -х ,у . Вторая

особенность - компоненты

вектора

имеют родственные

координаты в диагональных направлениях. Кроме того, компоненты ротора могут быть получены путем раскрытия определителя:

'•

j

к

 

rotF = д_

д_

д_

(2 . 12)

дх

ду

dz

 

F

F

F

 

Векторное поле считается безвихревым, если в каждой точке поля все компоненты ротора равны нулю. Особенности безвихревых полей мы обсудим позднее. Чтобы дать физическое толкование вихрю скорости, представим, что в потоке жидкости помещается вертушка, взаимодействующая с потоком. Такая вертушка является индикатором завихренности потока. В потоке с однородной скоростью эта вертушка не вращается. В однородном поле и все компоненты ротора скорости равны нулю. В неоднородном потоке скорость вращения этой вертушки будет пропорциональна ротору скорости.

На рис. 9 показаны возможные варианты потока жидкости или газа и соответствующие направления вращения вертушки.

rot V >0

rot V < 0

rot V - 0

Рис. 9. Примеры векторных полей с различным знаком ротора

Важным понятием, имеющим отношение к вихрю или ротору вектора, является интеграл вдоль некоторой линии L (p ис. 10)