Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Решение некоторых многоэкстремальных задач методом сужающихся окрестностей

..pdf
Скачиваний:
3
Добавлен:
12.11.2023
Размер:
12.71 Mб
Скачать

Заметим, что результат решения задачи размещения при та­ ком подходе существенно зависит от порядка установки объектов. На рис. 12, а изображено размещение кругов в порядке {3, 2, 4, 1}, а на рис. 12, б в порядке {4, 3, 2, 1}.

Этот факт подробно обсуждается в § 4 данной главы. Здесь же обратим внимание еще на одну особенность методов последова­ тельно-одиночного размещения.

В отличие от большинства известных методов минимизации он позволяет находить точки, лежащие на границе области допустимых решений. В caMqM деле, поскольку возможными точками установки полюса являются точки годографа, то часть неравенств, описыва­ ющих область решений, превращается в равенства.

Отметим некоторые преимущества и недостатки способа после­ довательно-одиночного размещения. Прежде всего рассмотрим при­ чины необходимости применения данного метода при решении задач рационального размещения геометрических объектов.

Во-первых, использование существующих методов, как детер­ минированных, так и методов случайного поиска, требует одновре­ менной проверки выполнения неравенств вида (1.5), (1.6), описы­ вающих область допустимых решений функции цели. Количество таких неравенств уже при п = 50 равно 1275, где п — количество размещаемых объектов. Даже если бы эта система неравенств, а также функция цели были линейными, чего практически не бы­ вает, то, применяя хорошо отработанный симплекс-метод, для на­ хождения одного локального экстремума потребовалось бы затратить не менее 10 минут машинного времени на ЭЦВМ типа «Минск-32».

Во-вторых, функция цели и система неравенств задач размеще­ ния геометрических объектов не всегда являются дифференцируе­ мыми. Поэтому применение градиентных методов в их чистом виде не представляется возможным. Использование различных модифи­ каций градиентных методов также приводит к неоправданно боль­ шим затратам машинного времени.

Воспользовавшись методами случайного поиска, приходим к не­ обходимости осуществлять перебор большого количества локальных

31

экстремумов для нахождения рационального результата. При этом затраты машинного"времени хотя и меньше по сравнению с за­ тратами перечисленных выше методов, однако затрудняют приме­ нение случайного поиска.

Применение способа последовательно-одиночного размещения избавляет от необходимости одновременной проверки выполнения неравенств, описывающих область G. При данном способе одно­ временно проверяются только те неравенства, в которые входят параметры размещаемого объекта. Нетрудно видеть, что число этих

условий в среднем равно - f, что существенно меньше, чем при про­

верке

всех условий, количество которых оценивается величиной

-j- +

~f- Естественно, что при больших значениях п такое преиму­

щество весьма

существенно.

Кроме того,

неравенства, описывающие область допустимых ре­

шений рассматриваемых задач, обладают тем свойством, что все они циклически зависят от небольшого числа переменных. Учиты­ вая такую специфику неравенств, при способе последовательно­ одиночного размещения их проверка осуществляется последователь­ но, что также резко сокращает время машинной реализации.

К преимуществам данного способа относится возможность ор­ ганизации сравнительно простого запоминания ранее просчитан­ ных вариантов размещения. Это следует из того, что последователь­ ность номеров объектов однозначно определяет координаты раз­ мещения всех объектов, т. е. вариант размещения.

Если размещенные ранее объекты занимают большую часть об­ ласти Q, чем все объекты в наилучшем из предыдущих вариантов, то размещение очередного объекта в этом случае можно прекратить. Тем самым уменьшается среднее время просчета одного варианта.

В некоторых случаях размещение объектов можно прекращать еще раньше, если на основе статистических данных с достаточной вероятностью можно утверждать, что, разлЛгстив оставшиеся объ­ екты, получим большее значение функции цели, чем в лучшем из предыдущих вариантов.

Однако способ последовательно-одиночного размещения, явля­ ясь в некотором смысле разновидностью метода Гаусса — Зайделя {частичного улучшения по группам переменных), обладает и его недостатками, перечисленными в начале данного параграфа. В част­ ности, точки из области допустимых решений, построенные с помо­ щью метода последовательно-одиночного размещения, в общем слу­ чае не совпадают с точками, в которых достигаются локальные эк­ стремумы функции цели. Значения функции цели в полученных точках также не всегда совпадают со значениями ее локальных эк­ стремумов. Поэтому размещения, полученные с помощью указан­ ного метода, будем называть возможными размещениями объектов, а соответствующие им точки области допустимых решений — точ­ ками, в которых достигаются рациональные значения функции це­

ли. Значит, в этих точках достигаются не локальные экстремумы функции цели, а ее рациональные значения. В некоторых случаях рациональные значения функции цели совпадают со значениями в точках локальных экстремумов.

На рис. 13 приведены примеры размещения трех кругов в полубесконечной полосе заданной ширины L. Функцией цели является длина занятой части полосы. Согласно способу последовательно­ одиночного размещения получаем вариант, соответствующий раци­

ональному значению функции цели (см. рис. 13, а). Размещение, соответствующее значению локального экстремума функции цели, показано на рис. 13, б. В данном случае при заданной ширине полосы L рациональное значение функции цели не совпадает с ее значением в точке локального экстремума. При непрерывном умень­ шении ширины полосы L до некоторого значения L0 разность между рациональным значением и значением в точке локального экстре­ мума функции цели будет уменьшаться. При ширине полосы, равной L0 (см. рис. 13, а), эти значения совпадают.

Очевидно, что недостатки рассматриваемого способа размеще­ ния являются следствием того, что ранее размещенные объекты считаются неподвижными, а это соответствует оптимизации функ­ ции цели только по группе текущих переменных, а все остальные неизвестные считаются фиксированными.

Чтобы уменьшить погрешности способа последовательно-оди­ ночного размещения, можно построить комбинированный способ размещения, который заключается в следующем. После постановки каждого объекта, группы объектов или всех объектов согласно спо­ собу последовательно-одиночного размещения осуществляется кор­ рекция координат всех размещенных объектов с помощью методов, гарантирующих получение более точного результата.

Отметим, что вследствие особенностей задач размещения гео­ метрических объектов [54, 56 ] не существует ни детерминированных методов, ни методов случайного поиска, позволяющих точно нахо­ дить локальные экстремумы. Таким образом, любое существующее решение является приближенным. Поэтому применение способа последовательно-одиночного размещения в такого рода задачах тем более оправдано.

3 9—961

§4. Выделение дискретной структуры

взадачах размещения геометрических объектов

Из постановки задачи размещения геометрических объектов, приведенной в § 2 , следует, что речь идет о минимизации функций,

заданных в пространстве Rn. Там же указывалось, что число локаль­ ных минимумов в этих задачах чрезвычайно велико и что их поиск с помощью традиционных методов не эффективен.

В связи со сказанным на первое место можно поставить метод последовательно-одиночного размещения, позволяющий получать некоторые приближения к локальным минимумам или сами локаль­ ные минимумы. Поэтому некоторые особенности, связанные с реше­ нием по методу последовательно-одиночного размещения будем счи­ тать свойственными задачам размещения геометрических объектов.

Обратимся к классической теории оптимизации. Рассмотрим функцию одной переменной / (х), график которой показан на рис. 14.

Механическая интерпретация поиска локальных минимумов в такой задаче следующая. В произвольной точке на графике, изоб­ раженном на рис. 14, устанавливают тяжелый шарик и дают ему свободно двигаться. Шарик остановится в локальном минимуме, в зоне влияния которого лежит начальная точка. Математическая интерпретация этого способа минимизации представляет собой про­ стейший (одномерный) вариант метода градиентного спуска. Важно, что выбор начальной точки однозначно определяет результат поис­ ка локального минимума (если шаг градиентного спуска выбран достаточно малым так, чтобы «не перескочить» через имеющиеся локальные максимумы).

34

При использовании метода последовательно-одиночного разме­ щения в качестве аналога начальной точки поиска используется порядок размещения объектов. Если порядок задан, то соответствую­ щее ему рациональное значение целевой функции определяется однозначно. Следовательно, можно установить взаимно однознач­ ное соответствие между порядками следования объектов (они выра­ жаются перестановками из п символов) и рациональными значения­ ми целевой функции (они представляют собой приближение к ло­ кальным минимумам или сами эти минимумы).

В § 2 данной главы указывалось, что решение задач размещения геометрических объектов распадается на два этапа: определение ло­ кальных минимумов (или приближений к ним) и организация пере­ бора минимумов. Представляется, что практическая реализация этих этапов сводится к следующему. Как метод локальной оптими­ зации используется способ последовательно-одиночного размеще­ ния, а перебор экстремумов проводится с использованием методов оптимизации функционалов, заданных в пространстве перестановок.

Таким образом, при решении задачи минимизации функций из

Rn используется этап минимизации функционалов от перестановок из п символов, т. е. задача 1.1. Единственное отличие состоит в том> как вычисляется значение функционала от перестановки. В зада­ чах § 1 этот функционал считался заданным. Здесь же восстанов­ ление рационального значения функции цели по перестановке про­ водится с использованием метода оптимизации, вычислительные аспекты которого могут быть довольно сложными.

Так или иначе основным предметом дальнейшего изучения в этой книге являются задачи минимизации функционалов на перес­ тановках. Основная цель данной главы — демонстрация связи кон­ тинуальных задач минимизации и дискретных. Оказалось, что от­ дельные задачи, которые традиционно ставились как задачи мини­

мизации функций из на каком-то этапе решения имеют типич­ ную дискретную структуру.

Что же касается метода последовательно-одиночного размеще­ ния, индуцирующего такую структуру, то в его применении и обос­ новании есть немало открытых вопросов. Хотя изучение этого мето­ да не входит в задачу данного исследования, укажем на две его осо­ бенное^, которые тесно связаны с практической реализацией пере­ бора экстремумов и до сих пор не освещались.

Во-первых, отметим, что локальные минимали, полученные при использовании метода последовательно-одиночного размещения, лежат не внутри области допустимых решений, а обязательно на ее границе.

Во-вторых, следует подробнее остановиться на вопросе о точ­ ности построения локальных минимумов. Как указывалось в § 2 данной главы, численные значения целевой функции в различных локальных минимумах сильно отличаются друг от друга. Поэтому на первых этапах поиска неточность в определении локальных ми­ нимумов несущественна. А при окончании поиска, когда дискретная

3*

35

структура решения определена, нужно возможно точнее определять соответствующие локальные минимумы.

К сожалению, во многих задачах размещения нет возможности изменять точность построения приближений к локальным миниму­ мам. Укажем, однако, на задачу, в которой изменение точности возможно.

При размещении объектов сложной геометрической формы их аппроксимируют многоугольниками. Точность аппроксимации опре­ деляет точность построения локальных минимумов. Поэтому страте­ гия выбора точности должна быть следующей. В начале поиска мож­ но проводить довольно грубую аппроксимацию контуров размеща­ емых объектов многоугольниками.

Если же найдена лучшая перестановка, то соответствующее размещение по методу последовательно-одиночного размещения следует проводить с многоугольниками, которые со всей возмож­ ной точностью аппроксимируют контуры размещаемых объектов. Более того, имеет смысл провести такое «точное» размещение не только с лучшей перестановкой, но и с несколькими перестановками, для которых значение целевой функции мало отличается от лучшего значения.

Из всего сказанного можно сделать важный вывод: существует целый класс многоэкстремальных задач, которые описываются кон­ тинуальной математической моделью, т. е. функция цели и функ­ ции, участвующие в формировании неравенств системы ограниче­ ний, являются кусочно-непрерывными. В то же время существуют такие методы поиска локальных экстремумов, которые позволяют устанавливать взаимно однозначное соответствие между началь­ ными точками поиска и локальными экстремумами, с одной стороны, и перестановками, с другой. При этом количество символов в пе­ рестановке определяется как физической сутью задачи, так и раз­ мерностью пространства, в котором задана функция цели. Иначе говоря, такой класс «континуальных» задач на определенном этапе решения — на этапе перебора локальных экстремумов — можно свести к некоторой «дискретной» задаче минимизации. Соответству­ ющая структура представляется в виде множества перестановок, на котором задан вполне определенный функционал, требующий минимизации. А такая задача, как показано в § 1 этой главы, и сама по себе представляет практический интерес.

Рассмотрению пространства перестановок (исследованию раз­ личных метрик), изучению свойств функционалов на этих прост­ ранствах и способов их минимизации посвящены следующие главы.

Г Л А В А 2

ПРОСТРАНСТВО ПЕРЕСТАНОВОК

§ 1. Множество перестановок. Упорядочение. Метрика

Как показано в первой главе, большой практический интерес представляет решение задачи о минимизации функционалов, за­ данных на множестве перестановок. В методах решения такой за­ дачи, излагаемых в третьей главе, существенно используется нали­ чие некоторой системы окрестностей во множестве перестановок. Данная глава посвящена различным способам введения такой струк­ туры на множестве перестановок. Для каждой метрики приводится алгоритм для случайного выбора перестановки из фиксированной окрестности.

Напомним некоторые определения (см., например, [10, 291). Всякое расположение чисел 1, 2....... п в некотором определен­ ном порядке называется перестановкой из п символов. Перестановки

будем обозначать следующим образом:

Р = 0'l> *2» ■• • » *"«)•

Множество всех перестановок из п символов обозначим П. Из простых комбинаторных соображений следует, что множество П содержит п\ элементов. В качестве примера перечислим все 4! = = 1 • 2 - 3 • 4 = 24 перестановки из четырех символов:

(1,

2,

3,

4),

(1,

2,

4,

3),

О,

3,

2,

4),

(1,

3,

4,

2),

(1,

4,

2,

3),

(1,

4,

3,

2),

(2,

1,

3,

4),

(2,

1,

4,

3),

(2,

3,

1 ,

4),

(2,

3,

4,

1),

(2, 4, 1 , 3),

(2,

4,

3,

1),

(3,

1,

2,

4),

(3,

1,

4,

2),

(3,

2,

1,

4),

(3,

2,

4,1),

(3,

4,

1,

2),

(3,

4,

2,

1),

(4,

1,

2,

3),

(4,

1,

3,

2),

(4,

2 ,

1 ,

3),

(4,

2 ,

3,

1),

(4,

3,

1,

2),

(4,

3,

2 ,

1 ).

Преобразование перестановки, при котором меняются местами какие-либо два символа, а все остальные остаются на месте, назы­ вается транспозицией.

П р и м е р . Пусть заданы перестановки pv = (1, 2, 3, 4, 5) и р2 = (3, 2, 1, 4, 5). Преобразование, которое переводит перестановку

37

Pi в перестановку р2, является транспозицией, поскольку символы 3 и 1 поменялись местами, а другие остались на своих мес­ тах. Транспозицию, в результате которой меняются местами сим­ волы Д и Д, будем обозначать (Д <-*• Д). В частности, транспози­ ция, переводящая перестановку рх в р2, обозначается (1 ++3).

От любой перестановки из п символов можно перейти к любой другой перестановке из тех же символов при помощи конечного числа транспозиций. Так, от перестановки (1, 2, 3, 4, 5) к переста­ новке (3, 1, 5, 4, 2) можно перейти, скажем, с помощью следующей

цепочки транспозиций: (1 <->• 3), (2 <->• 5),

(5 <-►1). При этом после­

довательно строятся перестановки

(3, 2 ,

1, 4, 5), (3, 5,

1, 4, 2) и

(3, 1, 5, 4,

2).

.... Д), ptj =

(Ji,

Д,

.... /„) — две

произволь­

Пусть pi

= (г*!, Д,

ные перестановки из

п символов;

Д,

it (k > l) — произволь­

ные элементы перестановки рх. Если в перестановке р2 найдется пара

элементов Д, Д такая, что Д Д,

Д = Д и г <

s, то говорят,

что пара Д, Д образует инверсию

относительно

перестановки рх.

В качестве примера рассмотрим две перестановки (1 , 2 , 3, 4, 5) и (3, 5, 4, 1, 2). Во второй перестановке относительно первой образу­ ют инверсии следующие пары элементов: (1, 3); (1, 4); (1, 5); (2, 3); <2, 4); (2, 5) и (4, 5).

Рассмотрим вопрос об упорядочении множества перестановок. Напомним соответствующие определения (см., например, (261).

Пусть М — произвольное множество. Обозначим М х М пря­ мое произведение множества М на себя, т. е. совокупность всех упо­ рядоченных пар (а, Ь), где а, b £ М. Говорят, что в М задано би­ нарное отношение <р, если в прямом произведении М х М выделено некоторое произвольное подмножество Rv. Точнее, элемент а на­ ходится в отношении <р к элементу Ь в том и только в том случае, если (а, Ь) принадлежит R<$.

Если на произвольном множестве М задано бинарное отношение (обозначается а < b и читается «а не превосходит Ь»), обладающее условиями рефлективности < а для каждого а £ М), транзитив­ ности (из а < b и b < с следует, что а < с) и антисимметричности

(из а < b и b < а следует, что а =

Ь), то оно

называется отноше­

нием частичной упорядоченности.

Множество,

в котором задана

некоторая частичная упорядоченность, называется частично упо­ рядоченным.

Если на множестве М задано бинарное отношение следования

(обозначается а -< Ь и читается «а предшествует 6 »),

которое явля­

ется частичной упорядоченностью, и притом такое,

что для любых

различных элементов a, b £ М либо а ■< Ь, либо b < а, то такое множество называется упорядоченным (или линейно упорядочен­ ным).

На множестве П введем так называемое лексикографическое отношение порядка. Будем считать, что перестановка р2 = (Д, Д, ...

.... /„) следует за перестановкой рх = (Д, Д.......i„) (pt -< р2), если существует такое целое число а (1 < а < п), что Д = Д, Д = Д ,...

28

/а-! =* /ое-ь но /« > * « . Легко проверить, что указанное от­ ношение обладает свойствами отношения линейного порядка. Дей­ ствительно, условия рефлексивности и антисимметричности, оче­ видно, выполняются. Рассмотрим перестановку рг = (klt k2, ...kn). Условие рг -< р2 записано в определении порядка на множестве

перестановок.

Запись рг -< р8 означает,

что найдено такое целое

число р (1 <

р <

п), что /х = ku ..., /*p_i = V -ь а /р < £р. Пусть

у = min (а,

Р).

Тогда tx = ku

i2 = k2,

.... i^_i — k^-u

iy < k,.

Точнее,

iy <

ky,

поскольку iy <

/ v (при у = а) или jy <

ky (при

Y = P).

Следовательно, px •< p3, что и доказывает выполнение ус­

ловия транзитивности. Для любых разных перестановок рх и рг всегда рх -< ра или р2 ■< рх вследствие того, что всегда найдется такой индекс а, для которого ta Ф /а. Тем самым показано, что лексикографическое отношение порядка линейно упорядочивает множество перестановок.

Во множестве перестановок можно ввести систему окрестностей или, как говорят, задать топологию. Приведем некоторые общие определения (подробнее об этом см., например, в [26]).

Пусть X — некоторое множество. Топологией в X называется

любая система т его подмножеств, удовлетворяющая следующим

условиям:

множество X и пустое множество 0 принадлежат т; 2 ) объ­

1)

единение любого числа множеств из т принадлежит т; 3) пересечение

конечного числа множеств из т принадлежит т.

Множество X с заданной на нем топологией т, т. е. пара (X, т)

называется топологическим пространством.

Множества, принадлежащие системе т, называются открытыми. Окрестностью точки х, принадлежащей топологическому про­ странству, называется любое открытое множество, содержащее

точку х.

В данной книге рассматриваются лишь способы введения топо­ логии в пространстве перестановок, связанные с метризацией этого пространства.

Напомним (см., например, [1]), что.числовая функция р (*, у),

заданная на множестве Х х Х ,

называется

расстоянием,

или мет­

рикой, на множестве X,

если:

расстояние

между ними

неотрица­

1 ) для любых точек х

и у

тельно,

Р(*.

У) > 0 ;

 

(2 .1 )

 

 

2 ) расстояние от точки до нее самой равно нулю,

 

 

р {х,

х) = 0 ;

 

(2 .2 )

3) если расстояние между двумя точками равно нулю, то эти

две точки совпадают,

 

 

 

(2.3)

Р (х, у) = 0 ф х = у;

4) расстояние между произвольными точками х и у равно рас­

стоянию между у и х,

Р (*. У) — Р(У, *);

 

(2-4)

 

 

5) для трех произвольных точек х, у viz множества X справедливо неравенство треугольника

р (х , г) < р (х, у) + р(у,

г).

(2.5)

Множество, в котором задано расстояние,

называется

метриче*

ским пространством.

 

 

В метрическом пространстве X шаром радиуса R с центром в точ­ ке х0 назовем множество точек х £ X, для которых

р (дг0, х) < R.

Некоторые авторы называют такое множество замкнутым шаром, однако вследствие того, что открытые шары здесь не рассматрива­ ются, используется просто Термин шар.

Ниже подробно рассматриваются различные способы метриза­ ции множества П перестановок. При этом вводятся как известные ранее метрики: цепная [15], транспозиционная [23], лексикографи­ ческая [15] и инверсная [151, так и некоторые новые: алфавитная [40] и численная. При изложении ранее предложенных способов метризации авторы в основном следуют монографии [15], в которой приведена соответствующая библиография.

Для всех указанных метрик, кроме численной, приводятся ал­ горитмы построения перестановок, лежащих в заданном шаре, и реализующие их программы на языке ФОРТРАН.

§ 2. Цепная метрика

В цепной метрике расстояние р (рь р2) между перестановками Pi и р2 вводится как минимальное число разрезов, которое необ­ ходимо сделать в одной из перестановок, чтобы из нее составить

вторую перестановку

[15].

 

 

 

Более точным является следующее определение. Пусть заданы

две перестановки рг =

(t1( t2, ...,

i„)

и р2 = (/х, /2, ...,

/„). Индекс

Р элемента /р , для которого /р =

ia,

обозначим р (а).

Расстоянием

Р (Ри Рг) между перестановками рх и рг назовем число таких пар

соседних элементов ia и <a+i,

для которых р (a + 1) Ф. Р (а) + 1 .

П р и м е р ы . Пусть рг =

(1, 2, 3, 4, 5), р2 = (4, 5, 1 , 2 , 3). Тог­

да Р (Pi. Рг) — 1» поскольку

в перестановке рх достаточно сделать

один разрез (между элементами 3 и 4), чтобы получить перестанов­ ку р2. Рассмотрим еще перестановку р3 = (3, 1, 5, 4, 2). Нетрудно видеть, что р (рь рз) = 4. В самом деле, никакие соседние элементы перестановки рх не остались соседними в перестановке р8. Следо­ вательно, необходимо провести разрезы между всеми элементами.

Из определения следует, что максимальное расстояние между двумя перестановками из п символов в цепной метрике равно п 1.

Убедимся, что введенное таким образом расстояние удовлетворя­ ет всем аксиомам метрики.

1.Очевидно, что р (ри р2) > 0.

2.Поскольку при переходе от перестановки р к ней же все сосе­ дние элементы остаются соседними, то р (р, р) = 0 .

40

Соседние файлы в папке книги