Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Решение некоторых многоэкстремальных задач методом сужающихся окрестностей

..pdf
Скачиваний:
3
Добавлен:
12.11.2023
Размер:
12.71 Mб
Скачать

ниями перестановки из П запишем следующим образом:

 

Ро ^

2,

3),

Рх =

(1>

3,

2),

р2 838 (2>

3),

 

Рз =

(2,

3,

1),

=

(3,

1,

2),

Pg = (3,

2,

1).

Таблица сложения для этих перестановок выглядит так:

Ро +

Ро =

Ро»

Pi 4" P i — Ра»

Ра

Рг — Р4» Рз +

Рз = Ро»

Р4 "Ь Ра = Ра*

 

 

 

 

 

 

Рб +

Рб =

Р4»

 

 

 

Ро"ЬPi— Pi* Pi"ЬРа= Рз» Ра+ Рз— Рв» Рз+ Р4==Pi* р4+ Рв= Рз»

Ро +

Ра =

Ра»

Pi Ч" Рз = Р4»

Ра “Ь Р4 =

Ро» Рз "Ь Рв в Ра»

 

 

Ро +

Рз ^

Рз»

Pi +

Р4 == Ре*

Ра +

Рв =

Pi»

 

 

 

Ро +

Р4 =

Р4 » Pi +

Рв = Ро»

 

 

 

 

 

 

 

Ро +

Рв =

Рв*

 

 

 

 

 

 

 

 

 

 

Нетрудно проверить, что свойства коммутативности, ассоциа­ тивности, существования нуля и противоположного элемента выпол­ няются. Они вытекают из соответствующих свойств операции сло­ жения по модулю.

кТаким образом, с операцией сложения во множестве переста­ новок сложностей не возникает. Однако не удается найти такую операцию умножения на вещественное число, которая бы вместе с циклическим сложением удовлетворяла аксиомам линейного про­ странства.

Как неудачный пример введения такой операции можно привес­

ти следующий.

0, то произведением произвольной перестановки

Если число а >

р на число а назовем перестановку q, для которой

К (q) =

entier {а [К (р) — 1]} + 1

(mod N).

Для чисел а <

0 произведением ар назовем

такую перестанов­

ку q, для которой

 

 

 

K(q) = N — entier {| а | [К (р) — 1]} +

1

(mod N).

Можно предположить, что эта неудача не является случайной, так как если пользоваться циклическим сложением, то результат умножения на число не будет «непрерывным». При умножении на близкие вещественные числа всегда будут получаться перестанов­ ки, отстоящие друг от друга на величину N. Отсутствие «непрерыв­ ности» ведет к нарушению аксиом линейного пространства. *

Можно рассмотреть еще одну алгебраическую структуру — мо­ дуль, частным случаем которой является линейное пространство. Напомним соответствующие определения [30J.

Модулем М, или, точнее, левым модулем над кольцом Л, называет­ ся абелева группа по сложению с некоторым действием А на М та­ ким, что для всех а, &£ Л и х, у £ М выполнены соотношения

(а + Ь) х = ах + Ьх, а (х + у) = ах + ау.

71

J

Множество А называется кольцом, если в нем определены две операции — сложение и умножение, обе коммутативные и ассо­ циативные, а также связанные законом дистрибутивности, причем сложение обладает обратной операцией — вычитанием.

Абелевой группой называется множество G с одной коммута­ тивной и ассоциативной операцией, причем для нее должна сущест­ вовать обратная операция.

Выше приведен способ введения операции сложения во множест­ ве П перестановок, который превращает это множество в абелеву группу.

В качестве кольца А выберем множество целых чисел г. Опера­ ция умножения целого числа на перестановку из П определяетсй естественным образом. Если а — положительное целое число, то произведением а р называется сумма из а перестановок р выбран­ ных в качестве слагаемых. Если а < 0, то составляется сумма из а слагаемых — р (перестановка — р определена выше). Если а — «= 0, то а р = рв = (1, 2, 3, ..., п).

Легко видеть, что множество перестановок с указанными опера­ циями является модулем над кольцом целых чисел.

Приведенные здесь исследования предполагается использовать при решении задач оптимизации функционалов на множестве переста­ новок.

Г Л А В А 3

МИНИМИЗАЦИЯ ОДНОГО КЛАССА ФУНКЦИОНАЛОВ,

ЗАДАННЫХ НА ПЕРЕСТАНОВКАХ

§ 1. Постановка задачи

Как показано в гл. 1, значительный интерес представляет реше­ ние задачи о минимуме функционала /, заданного на пространстве перестановок П. Задача эта формулируется следующим образом.

Среди всех перестановок р £ П найти такую перестановку ро» для которой

f(Po)<f(P)> Р€П .

Если функционал / рассматривается не на всем пространстве П, а на каком-то его подмножестве П*, то формулировка задачи

минимизации

будет

следующей.

 

Определить

перестановку р0 £ П*, для которой

 

 

/( Р о ) < /( Р ) .

П*.

Вследствие

того,

что пространство

перестановок П является

дискретным, методы минимизации, связанные с градиентным спус­ ком, оказываются неприменимыми.

Вместе с тем, дискретная природа пространства П дает возмож­ ность использовать для решения задачи минимизации полный пе­ ребор всех значений функционала. Достаточно просмотреть л! значений функционала f и путем сравнения выбрать из них наи­ меньшее.

Однако если учесть, что в обычно встречающихся задачах чис­ ло п символов в перестановке, как правило, превышает 25, при­ менение полного перебора становится не реальным.

Выполним простой подсчет. По формуле Стирлинга [27] находим, что пространство П перестановок из 20 символов содержит около 1018 элементов. Если предположить, что для вычисления значения функционала на перестановке требуется всего одна арифметиче­ ская операция, а за одну секунду ЭЦВМ (скажем, типа «БЭСМ-6») выполняет 10е таких операций, то полный просмотр значений функ­ ционала потребует 10и с машинного времени или около трех ты­ сяч лет. При этом не всегда можно учесть трудности, связанные с повторением уже просмотренных перестановок. Если к тому же иметь в виду, что рассматриваются перестановки и с большим числом

73

символов, а уже при п = 72 количество перестановок в прост­ ранстве П равно примерно 10100, то становится ясным, что никакое предвидимое увеличение быстродействия ЭЦВМ не сделает полный перебор эффективным способом решения задач минимизации на перестановках.

Обычный выход из такой ситуации состоит в обращении к так называемому слепому случайному поиску [44]. Наугад выбирает­ ся перестановка и вычисляется значение функционала на ней. Этот процесс продолжается определенное число шагов, после чего лучшее из полученных значений функционала считается приближе­ нием к глобальному минимуму, а соответствующая перестановка — минималью.

Такой способ решения, представляющий собой вариант метода Монте-Карло, при всей своей внешней тривиальности является лучшим способом поиска минимума функционала, когда нет ника­ кой информации о свойствах функционала, а проводить полный пе­ ребор не представляется возможным. Существенное затруднение вызывает выбор числа бросков, после которых процесс поиска пре­ кращается. Однако случай полного отсутствия информации о свой­

ствах

минимизируемого

функционала

сравнительно

редкий.

Между

тем такую информацию можно попытаться использовать

для модификации метода Монте-Карло.

появления этой

информа­

Остановимся вкратце на

источниках

ции. В задачах, где минимизируемый функционал имеет четкое ана­ литическое выражение, сведения о свойствах функционала можно получить, исследуя математическую модель. Чаще встречается случай, когда значения функционала на перестановке определяют­ ся лишь после применения сложной вычислительной процедуры. При этом информация о функционале накапливается путем анализа имеющейся статистики или вследствие наводящих соображений, связанных с физической природой задачи.

Рассмотрим пространство П, представляющее собой множество перестановок из п символов с какой-либо метризацией. Предполо­ жим, что функционал / имеет единственный глобальный минимум

f (ft)- i,

Обозначим т1 число перестановок, лежащих от перестановки р0 на расстоянии, не превышающем Rlt а т2— число перестановок,

удаленных от перестановки р0не более чем на расстояние R2.

г

Определение. Функционал /, заданный в пространстве П,

назы­

вается монотонным в среднем, если он имеет единственный мини­ мум f (р0) и если из неравенства Rt < Rt следует неравенство

I T E / ( P ) < :- S| - E / ( P).

(3-1)

т» (R t)

т 2 (R,)

 

где суммы берутся по всем перестановкам, отстоящим от р0 не более чем на указанное в круглых скобках под знаком суммы рас­ стояние.

Со стохастической точки зрения неравенство (3,1) можно тракто­

74

вать следующим образом. Математическое ожидание значений функционала f тем больше, чем шире рассматриваемая -окрестность перестановки р0.

Использование термина «монотонность в среднем» связано с тем, что даже вблизи от р0 могут найтись такие перестановки, на которых функционал принимает большие значения. Однако в сред­ нем по окрестностям функционал / уменьшается при движении к центру — к перестановке р0.

Из того, что функционал / монотонен в среднем, вытекает, что при достаточно малом радиусе v окрестности все значения f (pv) попадают в интервал Ov < / (Pv) < bv, где pv обозначены пере­ становки, для которых

Р (Ро. Pv) < v.

Наборы чисел av и bv такие, что при v < X а\ < av, bK> b v.

Функционал f(p) — детерминированный. Однако рассматривае­ мые в этой книге методы его минимизации являются стохастиче­ скими. Поэтому будут использоваться такие понятия, как закон распределения значений / (р) и характеристики этого закона: ма­ тематическое ожидание, дисперсия и прочие.

При этом имеется в виду следующее. «Опытом» или «наблюдением» будем называть выбор произвольной перестановки р из множества П. Результатом опыта, или событием, будем называть значение функ­ ционала / на перестановке р. Пространство элементарных событий [66] состоит из всевозможных исходов опыта, т. е. содержит все зна­ чения функционала f{p) при условии, что р пробегает все множест­ во П.

При таком подходе можно считать, что значение функционала /0?) есть случайная величина, и говорить о ее законе распределе­ ния и других вероятностных характеристиках.

Далее для краткости изложения будем говорить о законе рас­ пределения значений функционала, хотя по сути дела этот закон ха­ рактеризует не только функционал, но и описанный выше опыт или наблюдение.

Будем предполагать известным вид закона распределения зна­ чений /(/?). Иными словами, этот закон предполагается известным с точностью до некоторых числовых параметров, которые нужно оп­ ределить по правилам математической статистики на основе анализа выборочных значений f (р).

В нашей работе используются две гипотезы о характере распреде­ ления f (р): нормальный и логнормальный законы распределения. Такой выбор можно обосновать следующим образом. Указанные законы позволяют значительно упростить дальнейшее изложение. Действительно, для построения нормального закона

F(z) = P { f< z } =

exp / х — т \2 dx

(3.2)

У 2я a J c

\ V 2 a

 

75

достаточно знать математическое ожидание т и дисперсию <т* слу­ чайной величины /. Если известна нижняя оценка tj значений слу­ чайной величины /, то логнормальный закон распределения

Ф (z) = P { f< z )

ч

 

г>г\,

О,

г < г)

 

(3.3)

можно восстановить по

математическому ожиданию р величины

In (f — щ) и по дисперсии s2 этой величины.

Таким образом, гипотезы о нормальном или логнормальном ха­ рактере распределения значений функционала / (р) позволяют ограничиться информацией о математическом ожидании и диспер­ сии, т. е. оставаться в рамках корреляционной теории. Как отме­ чено в монографии [131, замечательным и нетривиальным можно считать то обстоятельство, что существует важный и достаточно широкий круг задач, для решения которых достаточно знать толь­ ко весьма общие свойства случайной функции и ее моменты перво­ го и второго порядков.

Представляет, однако, интерес и рассмотрение некоторых иных законов распределения. В работах [17,361 указывается, что предель­ ное распределение экстремальных значений описывается законом распределения Вейбулла — Гнеденко

1 — exp | — а -j*j

при

а = о — е, z > е,

G(z)=*p{f<z)

k > 0 ,

— ОО < 8 < 0 0 ,

V > 8 ,

Ов остальных случаях.

Вэтом законе распределения е, a, k — соответственно параметры положения, масштаба и формы. Для построения этого закона кро­ ме первого и второго нужно знать также третий центральный мо­

мент.

Вдействительности приходится иметь дело только с конечными значениями случайных величин, которые распределены, как пра­ вило, на асимметричном интервале. Происхождение этой асим­ метрии объясняется тем, что области допустимых решений функций цели реальных задач, которые приводят к рассмотрению функцио­ налов на множестве перестановок (гл. 1, § 4), имеют сложную геометрическую форму.

Внастоящее время исследования гипотезы о том, что законом распределения для /(р) является закон Вейбулла — Гнеденко, только начинаются. В данной книге используются лишь законы рас­ пределения (3.2) и (3.3).

Считается известным характер изменения закона распределе-

76

нйя случайной величины / (р) при переходе от выбора перестановок р из всего пространства П к их выбору лз некоторого подмножества П* с П.

В случае, когда известно, что для р £ П* значения f (р) лежат на интервале а < / < Ь, в качестве закона распределения случай­ ной величины f выбираем усечение основного закона распределе­

ния на интервал (а,

Ь). Под усечением закона на интервал будем

понимать следующее

[28]. Пусть

задан некоторый закон распреде­

ления F(z),

изображенный на рис. 17:

 

 

 

 

2

 

 

 

F (г) = j

(х) dx.

(3.4)

Рассмотрим

функцию

 

 

 

 

О,

если

г < а,

 

F* (г) =

если а < г < Ь,

 

 

 

если

г >-6,

график которой показан на рис. 18. Нетрудно видеть, что если вы­ брать

,p*W = J # L ,

где

ь

Р =* J ф (х) dx,

а

п

то функцию F*(z) можно считать законом распределения случай­ ной величины. Закон распределения

О,

если г < а,

г

 

F* (г) = -р- £ ф (х) dx,

если а < г < Ь,

1.

если z > 6

называется усечением закона распределения F(z), заданного соот­ ношением (3.4), на интервал (а, Ь).

В частности, усечением закона (3.2) на интервал (а, Ь) является закон

О, если у < а,

Р*(У) = i ^

! expN w ) ’]*:' ес”

‘’ < » < м з . 5 )

1,

если

y ^ b ,

где Р — вероятность

попадания величины, распределенной по

закону (3.2), на интервал (а, Ь),

 

 

&

 

Р =

1

 

]/2яо Н -(Т Г 7)1ЙЛГ.

(З .б)

78

Усечение закона распределения (3.3) на интервал

(а, Ь)

имеет

вид

если

у < а,

О,

Ф* (У) =

 

а <

 

 

 

<

У < Ь ,

1,

если у > Ь ,

 

 

(3.7)

где R — вероятность попадания на интервал (а, Ь) случайной ве­ личины, распределенной по закону (3.3), т. е.

Здесь,

естественно, предполагается, что rj < а.

Заметим, что использование усеченных законов распределения

(3.5)

и (3.7) возможно только в случае, когда известен интервал

(а, Ь)

изменения случайной величины /. Если же такие границы

неизвестны, считается, что случайная величина f(p) при случайном выборе перестановок р из подмножества П* распределена по зако­ нам вида (3.2) или (3.3). Однако параметры пг и а (р и s) определяют­ ся путем анализа статистики, набранной при выборе перестановок р именно из подмножества П*.

§ 2. Уменьшение математического ожидания

Рассматриваются такие функционалы /, что все их значения f(p) на перестановках р, удовлетворяющих неравенству

Р (Р. Ро) < v>

сосредоточены на сегменте [а, Ь]. Предполагается, что перестановка р0 является глобальной минималью функционала f. Обозначим Пу множество перестановок из П, удовлетворяющих неравенству

P(Pv, Po)<v.

Будем считать, что значения функционала

f(p)

распределены

по нормальному закону с параметрами /л и ст,

если

перестановки

рпроизвольно выбираются из пространства П. Если перестановки

рвыбираются из множества Пу, то значения функционала f(p) распределяются по закону, представляющему собой усечение нор­ мального закона на сегмент [av, bv\.

Основной закон распределения имеет вид

F« = y f c lexp [-(w )]* :-

79

Соответствующий

усеченный закон

 

 

 

О,

2

если

г <

а,

 

 

 

 

Р*(г) = —^ ---- Сexp | — |

1 dx, если a <

z < 6,

/

2яаР J F L V/ 2

a ) J

^

 

1,

 

если

г >

6.

Появление в знаменателе множителя Р связано с нормировкой. Для того чтобы F*(z) была функцией распределения случайной величины, необходимо, чтобы выполнялось условие F*(оо) = 1. Это условие выполнится, если Р равно вероятности того, что-слу­ чайная величина, распределенная по закону Р (г), попадает на сег­ мент [а, Ъ]. Такая вероятность определяется по формуле

Обозначение Е (и) удобно ввести для

функции,

определяемой

соотношением

U

 

 

—7-

f) dt.

(3.10)

Е (и) = - 7=

J exp ( -

УЛ

—оо

 

/

Функция Е(и) с известной функцией ошибок erf и связана со­

отношением

 

£■ (а) ==

[1 + erf м].

Для вычисления Е(и) можно воспользоваться программой ERFXX, входящей в стандартное математическое обеспечение ЭВМ серии ЕС и «БЭСМ-6». Ниже следует текст программы ERFXX.

n n n n o o n n n n o o n n n n o n n n

FUNCTION ERFXX(X)

*********************************************************************

ENTRY POINTS ... ERF, ERFC, FREQ.

THESE THREE FUNCTIONS ARE COMPUTED FROM THE RATIONAL APPROXIMATIONS OF W. J. CODY. MATHEMATICS OF COMPUTA­ TION, VOLUME 22 (1969), PAGES 631—637.

FOR ABS(X) LE 0.47 THE BASIC FUNCTION IS ERF. FOR ABS(X) GT 0.4 THE BASIC FUNCTION IS ERFC. THE FINAL RESULT IS OBTA­ INED IN TER OF THE BASIC FUNCTION AS SHOWN IN THE FOL­ LOWING TABLE. A = ABS(X) AND C = SQRT(2).

FUNCTION

A.LE.(0.47)

A.GT.(0.47)

REQUIRED

(ALL X)

(NEGATIVE X)

(POSITIVE X) j

ERF(X)

ERF(X),

ERFC(A) — 1

1 - ERFC(X)

ERFC(X)

1 — ERF(X)

2 — ERFC(A)

ERFC(X)

80

Соседние файлы в папке книги