Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Регулярные методы решения некорректно поставленных задач

..pdf
Скачиваний:
8
Добавлен:
12.11.2023
Размер:
11.88 Mб
Скачать

нения Эйлера

u £ ) = (uE + A *A yl (A*f+au*), ui2) = (uE'+A*Ayl (A*f + au<l)) =

 

 

 

 

 

 

0 )

= м<1) -(otE + A 'A )-1

(u* - u a1))(

duu

= u £ ) - a

 

 

 

 

 

 

da

т.е.

 

 

 

 

 

 

(2)

(1)

-

aUot

 

 

 

*4

= “<i

a — —

 

 

 

 

 

 

da

 

 

 

Аналогично

 

du(i)

 

 

 

■ДЗ) = М(1)

 

 

2„0>

 

UX

- a

2

da2

 

 

 

da

По индукции доказывается, что

 

 

 

 

 

 

dsu j1}

 

(3)

 

S = О

SI

da*

 

 

 

 

т.е. р-ичное семейство тесно связано с исходным регуляризованным семейством. Нетрудно видеть, что при и* = Uf справедливо тож­

дество и ^ = Uf,p> 1.

Далее будем рассматривать только случай р = 2.

Построим сетку {ay} (J = 0, . . . , N) такую, что а; + 1 = тоу; т& \ 9тФ 1, задает ’’шаг” сетки. Эта сетка обычно называется гео­ метрической [143] и часто используется при практическом приме­ нении метода регуляризации. Так как при т « 1 справедливы со­ отношения

duО)

,0 )

„0>

н(1 )-

w(1)

 

 

 

“л

 

 

da

а -

та

1

-

Т

то в силу (3) имеем

 

 

 

 

 

Л1)

7+1

_

 

(4)

“/ -

 

 

 

 

1

-

 

 

 

т

/

«/a )=«<Sj). / я О,...,ЛГ.

'

J

 

 

 

Формула (4) показывает, что элементы вторичного регуляризованного семейства на геометрической сетке приближенно можно вычислить непосредственно по элементам исходного семейства, Аналогичные выражения можно получить для произвольного р-ич- ного семейства регуляризованных решений.

221

2. Пусть в (1) вместо точных данных d = { Л, / } заданы приб­

лиженные d = { A , f }. В §4 показано, что существует а = а (о) та­

кое, что и ^ = UQ\O) сходятся в Я к решению м/ основной зада­ чи при о = (/г, 5) -> 0. Так как на практике 5 и h конечны, то, за­ давшись некоторым ’’подходящим” значением параметра ot = а , можно в его окрестности построить геометрическую сетку по а и вычислить элементы м /1^ (/ = 0, . . . , N) . Интуитивно представля­ ется правдоподобным выбрать такое значение j = / 0, для которого достигается

min ||ы}+} - u j l ) ||Н)

/

т.е. наиболее гладкое по параметру о: регуляризованное решение. Это соответствует факту существования регуляризованных реше­ ний, концентрирующихся около искомого решения м/.

Значение

принято

называть квазиоптимальным значением

параметра регуляризации

[91]. К сожалению, обосновать такой

способ выбора параметра

полностью пока не удалось, хотя он ши­

роко используется в практике решения неустойчивых задач. По идее он близок к известному правилу Рунге при решении задачи численного интегрирования [116].

Можно с уверенностью лишь сказать, что этот способ выбора параметра соответствует приближенной минимизации нормы вто­ рого члена разложения (3). Это замечание дает возможность даль­ нейших обобщений указанного способа выбора, что легко сделать на основе представления р-ичного регуляризованного семейства решений (3). При определенных условиях можно доказать сходи­ мость вторичного регуляризованного семейства к решению основ­

ной

задачи. С этим вопросом можно познакомиться в рабо­

тах

[53, 55]'

Метод выбора квазиоптимального значения параметра исполь­ зуется для дополнительного уточнения значений параметра, опре­ деленных на основе теоретически обоснованных критериев, таких, как критерии р, <р, у.

3. Пусть Я = Rn, F = R m и || м ||я = (См, м), где С —положитель­ но определенная симметричная матрица. Тогда регуляризованное решение имеет вид

иа = (аС +АТА)~1 (Л7/ + аСи*),

где / —некоторое приближение к / . Назовем оператор Ra = (аС +

+ А ТА)~ХА Т оператором обработки. Если / — случайный гаус­ совский вектор, M f = /, М££7 = о гЕ т , £ = /■ - / , где Е т - единич­ ная матрица порядка т, то при выборе параметра а естественно стремиться к минимизации как невязки М || (Л /^ - Е) f ||^ , так

222

и M\\ Ra %Нс* Целесообразность удовлетворения первого условия очевидна и не требует дополнительных разъяснений. Второе усло­ вие означает, что оператор обработки Ra должен быть выбран та­ ким, чтобы наилучшим образом подавлять воздействие ошибки в правой части уравнения. Ясно, что одновременное удовлетворе­ ние обоим этим требованиям невозможно. Поэтому представляет­ ся разумным выбор параметра регуляризации из компромиссного условия минимума по а выражения

M\\(ARa - E ) f \ \ m2 +M\\RQ$\\l.

Можно показать, что второе слагаемое здесь монотонно убывает. Так как первое слагаемое монотонно возрастает, то численное определение параметра, удовлетворяющего предложенному крите­ рию выбора, не вызывает затруднений. Вместо минимизации ука­ занного выражения по а можно воспользоваться условием выбора параметра как решения уравнения

M\\(ARa - E ) f \ \ 2m =M\\ Ra %\\h.

Смысл этого условия очевиден.

Численная апробация изложенных способов выбора параметра регуляризации применительно к задаче построения сглаживающих сплайнов осуществлена в [118].

§ 28. Исследование адекватности математических моделей 1. Пусть рассматривается задача решения уравнения

A u = f 9

 

(1)

где А : Н

- линейный оператор, действующий из гильбертова

пространства Н в аналогичное пространство F. В § 1 была введена

мера несовместности уравнения (1)

 

М л(/) =

inf \ \ A u - f \ \ F.

(2)

 

м ея

 

Если принять гипотезу, что элемент /

соответствует измеряемым

проявлениям (характеристикам) некоторого физического объекта, то меру несовместности можно считать мерой адекватности мате­ матической модели (1) изучаемому физическому явлению. Имен­ но, будем говорить, что модель (1) f -адекватна, если дг4 ( / ) <

В ряде случаев представляет интерес изучение величины рд ( /) как функции/ Е Q С F. Тогда величина

Мй (Q) = sup \iA ( /)

характеризует меру несовместности (адекватности) (1) на классе

223

входных данных Q. Если рА ( / )

=0, то будем говорить, что модель

(1)

f -совместна. Если рА (Q) =0, то будем говорить, что модель

(1)

Q-совместна.

 

Очевидно, функционал рА ( / )

определен для любого / Е F (су­

ществование элемента иЕН, на котором реализуется (2), не не­ обходимо) . Пусть элемент / задан приближенно, т.е. известен эле­

мент /

: II/ - /

IIF < 5. Выберем ие Е Н так, чтобы выполнялось

соотношение

 

 

 

 

 

 

1ХА ( / ) < II Аие - /

llF <fjtA (f)+e,

€ >0 .

 

Тогда иа ( / ) ^ ЦА( О

+ 5 + е. Выбирая и€ Е Я такие, что

Мл ( / ) < \\Аие - / 1 1 / г < мл ( / ) + е ,

 

 

аналогично получаем:

 

 

 

 

м л ( Я < м л ( / ) + $ + е .

 

 

 

Следовательно,

 

 

 

 

 

 

1 М л ( / ) - М л ( П 1 < 5 + е V е > 0,

 

 

то есть

 

 

 

 

 

 

 

! м л ( Я - М л ( / ) 1 < $ .

 

 

 

Итак, справедлива

Функционал

fiA ( / )

непрерывно зависит

Т е о р е м а

101.

от /

Е F.

 

 

 

 

 

^

2.

А.Н. Тихонов

ввел следующее определение [92]. П усть/ :

I I / - /

11/г < 5,

Щ ={ и е Н: II Ли -

/ 11/7 <5}.

Если и ъ Фф для

всех

достаточно

малых 6 > 0 , то модель

(1)

называется состоя­

тельной. Будем

говорить об f -состоятельности,

подразумевая, что

элемент / фиксирован. Можно говорить о Q- (или F-) состоятель­ ности, если модель (1) состоятельна для любого / Е Q (и ли/ Е F ) .

Выясним вопрос

о соотношении

понятий

/совместности и

/-состоятельности.

Для

/ -состоятельности модели

(1) необхо­

Т е о р е м а

102.

дима и достаточна ее /-совместность.

 

 

 

 

 

Д о к а з а т е л ь с т в о . Пусть модель

(1) /-состоятельна. Тогда

существуют элементы и ь Е Я :

\\Aub - f

II/? < 5, для

достаточно

малых 5. Значит, IIА иь - /

II/? <25 и, следовательно,

 

М л (/)< 25

V 5,

 

 

 

 

 

 

 

 

 

т-е. 1>а ( / ) =0.

 

т.е. модель

(1)

/-совместна, то

при любом

Если pA ( f ) =0,

е > 0 существует элемент и€ Е Я :

IIА и€ —/

II/?

< е . Тогда

IIАие - / II F < \\Аие - /

II F + II/ —/

II F <

е + 5,

 

т.е. при достаточно

малых

е

элемент ие Е 6^, и, следовательно,

224

множество U8 Фф при всех достаточно малых 6. Таким образом, модель (1)/-состоятельна. Теорема доказана.

Отсюда следует эквивалентность понятий /-совместности и /состоятельности.

3.Будем говорить, что модель (1) f -разрешима, если Uf={u€

ЕЯ : А и - ^ Ф ф . Ясно, что /-разрешимость влечет /-совмест­ ность (и/-состоятельность) модели (1). Однако обратное, вообще говоря, неверно, что можно легко обнаружить на простых приме­ рах. Будем говорить также о Q-разрешимости (1), подразумевая под этим/-разрешимость для всех/ Е Q.

Те о р е м а 103. Пусть Q - множество разрешимости для мо­ дели (1). Если модель (1) F -совместна (или F -состоятельна) , то

замыкание Q совпадает с F, т.е. Q = F.

Д о к а з а т е л ь с т в о .

Пусть Q ФЕ. Тогда

найдется элемент

/ # 0 ,

/ 1

Q , такой,

что

\ \ A u - f \ \ F > a > 0

У м Е Я .

Но

тогда

Дл ( / )

>а, что противоречит F -совместности (1). Теорема дока­

зана.

 

 

 

 

 

 

 

 

 

 

 

 

4. Пусть априорно известно, что модель (1) /-совместна. Можно

ли

в

рамках идеального

эксперимента, т.е. в условиях, когда

б

0, ответить на вопрос о

ее /-разрешимости?

 

 

 

Определим элементы и8 Е Uh условием

 

 

 

 

II и8 II# = inf

II и IIя,

 

 

 

 

 

 

 

 

 

 

 

и е и 8

 

 

 

 

 

 

 

 

 

т.е. применим метод невязки.

 

 

 

 

 

 

 

Следующая теорема дает ответ на поставленный вопрос.

 

Т е о р е м а

104.

Если

модель

(1)

/ -совместна,

то для ее

f -разрешимости необходимо и

достаточно, чтобы {II и8 II я )

для

всех достаточно малых 6 было ограничено.

 

 

 

 

Д о к а з а т е л ь с т в о .

Если

модель

(1) /-разрешима, то су­

ществует

нормальное решение

и

задачи

(1).

Тогда,

очевидно,

II и8

\\н <

II и \\н

= С

при всех 6.

 

 

 

 

 

 

Далее

предположим, что II и8 II я

< С <

+°°. Используя это ус­

ловие,

выделим

из

семейства

{м6}

последовательность {иьп)>

6и-►0 при

слабо сходящуюся к и0. Используя слабую полу-

непрерывность снизу нормы в гильбертовом пространстве и непре­ рывность оператора А в слабой топологии, получаем, обозначив

\\АUQ —/ ll/г ^ lim

IIА ип —/ IIр ^

п-+ 00

< Пт ( IIАип - /

\\F + б) =0;

п~*00

 

15. В .А . М орозов

225

Отсюда следует, что Ли0 = /, т.е. модель (1) /-разрешима. Теорема доказана.

Теорема 104 легко обобщается на общий случай основной задачи.

5. Вычисление меры несовместности д ^ ( / ) необходимо не только для оценки адекватности математической модели (1), описывающей физическое явление, но и при применении ряда ре­ гулярных методов решения (1) или, в обшем случае, основной

задачи. Пусть 3 = { A yf ) -

приближенные данные задачи

(1), где

оператор A

= A h ограничен и линеен

при любом h Е (0 ,h0]y

IIА - А К А , / : И / - / l l F < 5 .

 

 

Обозначим

 

 

 

да =

inf

\ \ A u - f \ \ Fy

o = (8yh).

 

 

 

u G H

 

 

 

 

Легко

показать, что при а-^0 соотношение д а “*Дл ( / )

не имеет

места. Действительно, если Н = F =Rn -

евклидово пространство

размерности

пуА =0 - нулевая матрица

размера п Хп у f ¥=0Уто

iif = II/ \\т Ф 0,. в то время как при A h - hE и любом h > 0 вели­ чина Да —0.

Как следует из теоремы 101, устойчивость по возмущениям пра­

вой части /

все же сохраняется. При наличии возмущения в опе­

раторе А можно лишь утверждать, что

 

lim

na =nA ( f ) .

 

о-+О

 

 

 

 

Действительно,

выбирая и€ Е Я

такое, что \\Аи€ —f \\р ^

( / ) + £ »

е > 0 , имеем

Iff+ е.

ца <ЪАие - f

WF <HA ( f ) +h IIMe

т.е.

 

 

 

 

lim

jua < jo y (/) + e, e > 0 ,

 

a~*0

 

 

 

 

откуда следует требуемое соотношение.

6.Далее рассматривается задача построения по любым прибли­

женным данным 3 ={Ayf } таких значений д а> которые удовлет­ воряют условию сходимости

lim va =HA (f),

о~*О

т.е. условию устойчивой аппроксимации меры несовместности

при возмущении исходных данных d = { A yf ) . Значение д ст может рассматриваться как приближение к оцениваемой мере несовмест­ ности д^ ( / ) . Заметим, что /-разрешимость задачи (1) не предпо­ лагается. Любой метод построения устойчивых аппроксимаций

226

меры несовместности может быть использован для предваритель­ ной оценки меры адекватности математической модели (1). Это весьма важно при решении ряда прикладных задач, в частности, при построении автоматизированных систем математической обработки результатов физического эксперимента.

Приведем ряд вспбмогательных утверждений, имеющих и не­

который

самостоятельный

интерес. Положим

в соответствии с

методом

регуляризации

Фа [и] =

\\А и~ f

\\2F + а II и \\2И% и Н ,

а > 0.

 

 

 

 

 

 

 

Справедлива

 

 

 

 

 

Л е м м а

59. Пусть

иа Е Н -

решение вариационной задачи

inf Ф<Ли]=Фа К ] .

 

 

 

 

 

u G H

 

 

 

 

 

 

 

Тогда

 

 

 

 

 

 

 

lxA if)=

iim ца,

ца =ЪАиа - / I f .

 

 

 

а—►0

 

Однозначная

разрешимость соответ­

Д о к а з а т е л ь с т в о .

ствующей вариационной задачи доказана ранее.

Выберем {е„} > 0

так, чтобы е„->0, п~+°°, и элементы ип € Н удовлетворяли усло­ вию

Ил(.П<ЪАи„ - / 1 ! р < ^ ( / ) + е„.

Тогда, используя очевидные свойства экстремальных задач, полу­ чаем

V2A( f ) < n l < Ф а [ма] < ф а [«„] <(М л(/) + е„)2 + а IIмп IIя .

т.е.

Iim |л в - n A ( f ) \ < e „ ,

еп -*■0, п ^ ° ° .

OL-+ 0

Лемма доказана.

Заметим, что элемент иа удовлетворяет уравнению Эйлера

(аЕ + А*А)иа = A*f.

Полагая f a =Aua и применяя оператор А к обеим частям приве­ денного уравнения, получаем

(aE+AA*)fa =AA*f9

и, следовательно,

На ( /) = Um ца , ца = II fa -f 11/7,

а-»0

где f a однозначно определяется выписанным уравнением. Элемент /<* можно определить также как решение следующей экстремаль­ ной задачи:

foe -

arg min ( I\A*{g - / )

II L + <* II# II *. ).

ic*

f t zF

227

л

Пусть / ' G F - элемент с минимальной нормой (нормальное ре­ шение) среди всех решений уравнения A*g =А */• В силу экстре­ мального свойства элемента f a имеем

1 1 Л * ( / а - П И я + а l / « l 2Н < « Wf'Wb,

и, следовательно,

 

lim \\A*fa - A * f , \\l1=0,

ita ll/a llF <l l / ' l l F .

ос-*- 0

а - * О

Из этих соотношений регулярности согласно основным результа­ там (§ 2) следует, что

Иш = /'.

а-* о

Таким образом, справедлива Л е м м а 55. Имеет место равенство

nA { f)=\ mr

l F ,

а - * О

 

где / ' - нормальное решение уравнения A*g - А */• Определим следующие функции параметра а:

p( a)=U*f* - A * f \ \ Hi

7(a) = IIfa IIF .

Из основных результатов следует

Л е м м а

56.

Функция p(ot) является непрерывной строго

возрастающей функцией, для которой

lim p (a )= 0 ,

lim

p(oi) = \\A*f II# .

OL-* 0

j<•'

а - + °о

 

Функция у (а) является непрерывной строго убывающей функ­ цией, причем

lim 7(a) = II/' \\Fi

lim 7 (а) = 0.

О!-»-О

Qt~* 00

Далее предполагается, что \\А*/\\н>0. Так как, очевидно,

lim

II A* f II# = IIЛ*/ II# ,

 

а-*О

 

 

 

то при достаточно малых а справедливо также неравенство

'\\A*f

\\H >h II/ llF .

 

 

Обозначим ра = II/а - /

IIF ,

где f a удовлетворяет уравнению

с возмущенными данными

 

 

(ctE+AA* ) f a = A A * f

,

 

а также

 

 

 

р(а)= 11^*(/а - / ) Ия ,

7(а)= II/* IIF .

228

Из приведенных выше утверждений следует Л е м м а 57. При достаточно малых о> 0 уравнение

p(a) = 2h \\f\\F .

(3)

имеет единственный корень аа .

7.Поставленную задачу вычисления приближений к нижней

грани функционала (2) решает следующая

»

л

л

л

_

Т е о р е м а

105.Пусть / а = / аб, Pa^ f a ~ f ИF >где а а определе­

но в лемме 57 в соответствии с принципом невязки. Тогда

lim Ио а (Л.

о~+О

Д о к а з а т е л ь с т в о . Пусть / ' - элемент с минимальной нор­ мой, являющийся решением уравнения A *g =А * / . При любом а > 0 имеем

IIА 7а - A''f II 2Я +а IIfa II 2F< h2( II/''iF + I f llF )2 + а II f l41 \ .

Полагая здесь a = a a и учитывая

(3), после несложных выкладок

получаем оценки

 

 

IIfa

IIF ,

\\A*fa - A * f f \\H <2h( I I / ' llF + II/ II*.).

Так как \ \ f f —/ ' IIF < 6 , то эти

оценки влекут соотношения регу­

лярности

 

 

lim

\\A*fa - A * f l * = 0 ,

 

а-*О

 

 

 

Шп

II f a llF < II/'

IIр ,

 

<7“*0

 

 

 

из которых получаем:

 

lim

H/a - / ' llF =0.

 

о -+0

 

 

 

Остается применить лемму 55. Теорема доказана.

8.

Рассмотрим

численные

аспекты реализации предложенного

метода вычисления нижней грани функционала (1) по приближен­ ным данным d . ^

Будем считать,

что А — матричный оператор, действующий из

H = R n B F = R m,

где R n и Rm суть евклидовы пространства,

т> п. Тогда и есть л-мерный вектор, / есть m-мерный вектор.

Для

упрощения записи знак возмущения у матрицы А и векто­

ра f

далее опускаем.

229

Следуя методу В.В. Воеводина [121], выполним разложение

A =QDR,

где 0, R - ортогональные матрицы, D - двухдиагональная мат­ рица, последние т—п строк которой нулевые.

Тогда уравнение для определения f a принимает вид

(aQQT + QDRRTD TQT)fa = QDRRTD TQTf.

Полагая здесь

 

 

У* =QTfa ,

'P~QTf,

 

получаем, что

удовлетворяет

уравнению с трехдиагональной

матрицей

 

 

(<хЕ +DDT)ya =DDT<p.

(4)

При указанных заменах, как легко проверить, справедливо соотношение

p(a) = lD V *-*)l« •

В соответствии с критерием (3)

выбора параметра, а а находит­

ся как решение скалярного уравнения

p(a) = 2*Mlm,

'(5)

А

искомые приближения д а определяются по формуле

До = И*“"-*1т.

Заметим, что указанный подход дает значительный выигрыш во времени решения задачи.

Уравнение (5) целесообразно записать в следующей эквивалент­ ной форме:

/ r ,(a)-(2Al*lM)-, >

( 6)

Д(а)зр(1/в).

Функция R (а) строго выпукла вверх и непрерывно дифферен­ цируема при а > 0 (см. § 26). Для решения (6) тогда применим метод касательных Ньютона, который сходится при любом выборе начального приближения.

Так

как т> п, то может показаться, что определение векто­

ра

из (4)

будет осуществляться из системы достаточно высо­

кого порядка. Замечая, однако, что

 

л

 

 

' D

 

D=

. . .

,

л

L0

.

где D - матрица порядка п, О - матрица размера ( т - п) X и с ну-

230