Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

8713

.pdf
Скачиваний:
0
Добавлен:
25.11.2023
Размер:
1.84 Mб
Скачать

котором лицо, принимающее решения, должно выделить ограниченные ресур-

сы для различных действий или операций с условием оптимизации измеримой цели. Наиболее известным методом этого семейства инструментов является ли-

нейное программирование. Оно широко используется в информационных си-

стемах поддержки руководителя (ИСПР) и имеет много важных практических приложений, например решение задачи распределения (ресурсов или времени).

Задачи распределения, решаемые на основе линейного программирования,

обычно отражают следующие характеристики:

для распределения доступно ограниченное количество ресурсов;

ресурсы используются в производстве продукции или услуг;

существует два или более путей использования ресурсов, каждый из которых называется решением или программой;

распределение обычно ограничивается несколькими доступными пределами и требованиями, называемыми ограничениями.

Модель распределения линейного программирования основывается на

следующих различных экономических допущениях:

отдача или доходность при различных вариантах распределения мо-

гут сравниваться, т.е. они могут быть измерены в общих единицах

(например, денежных);

отдача от одного распределения независима от других распределе-

ний;

общая доходность является суммой доходностей, принесенных раз-

личными действиями;

все исходные данные известны и определены.

Наиболее известны задачи линейного программирования, в которых мак-

симизируемая функция F(X) является линейной, а ограничения А задаются ли-

нейными неравенствами.

11

2.3.2. Методы принятия решений в условиях неопределенности и риска

Основные вопросы, рассматриваемые на лекции: критерии максимина,

Сэвиджа, Вальда, Гурвица, Лапласа. Дерево решений. Критерий максимизации ожидаемых доходов. Ожидаемая стоимостная оценка наилучшего решения.

Краткий теоретический материал.

При принятии решений в условиях неопределенности, когда вероятности возможных вариантов обстановки неизвестны, может быть использованы ряд кри-

териев, выбор каждого из которых, наряду с характером решаемой задачи, постав-

ленных целевых установок и ограничений, зависит также от склонности к риску лиц, принимающих решения.

К числу классических критериев, которые используются при принятии ре-

шений в условиях неопределенности, можно отнести:

максиминный критерий Вальда;

принцип недостаточного обоснования Лапласа;

критерий обобщенного максимина (пессимизма – оптимизма) Гурвица;

минимаксный критерий Сэвиджа.

Максиминный критерий Вальда используется в случаях, когда требуется га-

рантия, чтобы выигрыш в любых условиях оказывался не менее чем наибольший из возможных в худших условиях. Наилучшим решением будет то, для которого выигрыш окажется максимальным из всех минимальных при различных вариантах условий. Критерий, используемый при таком подходе, получил название максими-

на.

В соответствии с критерием Вальда в качестве оптимальной выбирается

стратегия: W max min wij , гарантирующая выигрыш не меньший, чем «ниж-

i

j

няя цена игры с природой».

Правило выбора решения в соответствии с критерием Вальда можно ин-

терпретировать следующим образом: матрица решений [Wir] дополняется еще одним столбцом из наименьших результатов Wir каждой строки. Выбрать

12

надлежит тот вариант, в строке которого стоит наибольшее значение Wir этого столбца. Выбранное таким образом решение полностью исключает риск. Это означает, что принимающий решение не может столкнуться с худшим результа-

том, чем тот, на который он ориентируется. Какие бы условия Vj не встретились,

соответствующий результат не может оказаться ниже W. Это свойство заставля-

ет считать критерий Вальда одним из фундаментальных. Поэтому в технических задачах он применяется чаще всего как сознательно, так и неосознанно. Однако в практических ситуациях излишний пессимизм этого критерия может оказаться очень невыгодным.

Применение этого критерия может быть оправдано, если ситуация, в кото-

рой принимается решение, характеризуется следующими обстоятельствами:

вероятности появления состояния Vj ничего не известно;

с появлением состояния Vj необходимо считаться;

реализуется лишь малое количество решений;

не допускается никакой риск.

Данный критерий прост и четок, но консервативен в том смысле, что ори-

ентирует принимающего решение на слишком осторожную линию поведения.

Поэтому критерием Вальда, главным образом, пользуются в случаях, когда необходимо обеспечить успех при любых возможных условиях.

Принцип недостаточного обоснования Лапласа используется в случае, если можно предположить, что любой из вариантов обстановки не более вероятен,

чем другой. Тогда вероятности обстановки можно считать равными и произво-

дить выбор решения так же, как и в условиях риска, – по минимуму средне-

взвешенного показателя риска.

Критерий Байеса-Лапласа учитывает каждое из возможных следствий всех

n

1

 

вариантов решений: W max

 

wij .

 

i j 1 n

 

Соответствующее правило выбора можно интерпретировать следующим образом: матрица решений [Wij] дополняется еще одним столбцом, содержащим

13

математическое ожидание значений каждой из строк. Выбирается тот вариант, в

строках которого стоит наибольшее значение Wir этого столбца.

Критерий Байеса-Лапласа предъявляет к ситуации, в которой принимается решение, следующие требования:

вероятность появления состояния Vj известна и не зависит от времени;

принятое решение теоретически допускает бесконечно большое количество реализаций;

допускается некоторый риск при малых числах реализаций.

Критерий обобщенного максимина (пессимизма – оптимизма) Гурвица ис-

пользуется, если требуется остановиться между линией поведения в расчете на худшее и линией поведения в расчете на лучшее.

В этом случае предпочтение отдается варианту решений, для которого ока-

жется максимальным показатель G, определяемый из выражения:

 

 

 

 

Gi k min wij

 

j

 

 

(1 k) max wij

j

где k – коэффициент, рассматриваемый как показатель оптимизма (0 <= k <= 1),

при k = 0 – линия поведения в расчете на лучшее, при k = 1 – в расчете на худ-

шее.

Нетрудно убедиться, что при k = 1 критерий Гурвица совпадает с критерием Вальда, т.е. ориентацией на осторожное поведение. При k = 0 – ориентация на предельный риск, так как большой выигрыш, как правило, сопряжен с большим риском. Значения k лежат в интервале [0,1] и являются промежуточными между риском и осторожностью и выбираются в зависимости от конкретной обстанов-

ки и склонности к риску лица, принимающего решение.

Правило выбора согласно этому критерию следующее: матрица решений [аij]

дополняется столбцом, содержащим средние взвешенные наименьшего и наибольшего результатов для каждой строки. Выбирается тот вариант, в строках которого стоят наибольшие элементы аir этого столбца.

14

В технических приложениях правильно выбрать этот множитель бывает так же трудно, как правильно выбрать критерий. Поэтому чаще всего весовой мно-

житель = 0.5 принимается в качестве средней точки зрения.

Минимаксный критерий Сэвиджа используется в тех случаях, когда требуется

влюбых условиях избежать большого риска.

Всоответствии с критерием Сэвиджа в качестве оптимальной выбирается такая стратегия, при которой величина риска принимает наименьшее значение в

самой неблагополучной ситуации: W min max(W j max wij ) .

i j

Здесь величину W можно трактовать как максимальный дополнительный выигрыш, который достигается, если в состоянии Vj вместо варианта Ui выбрать другой, оптимальный для этого внешнего состояния вариант.

Соответствующее критерию Сэвиджа правило выбора следующее: каждый элемент матрицы решений [Wij] вычитается из наибольшего результата W j max

соответствующего столбца. Разности образуют матрицу остатков. Эта матрица пополняется столбцом наибольших разностей Wir. Выбирается тот вариант, в

строке которого стоит наименьшее значение.

В соответствии с этим критерием предпочтение следует отдать решению,

для которого потери максимальные при различных вариантах условий окажутся минимальными.

Этот критерий также относится к разряду осторожных. Однако, в отличие от критерия Вальда, который направлен на получение гарантированного выиг-

рыша, критерий Сэвиджа минимизирует возможные потери.

Общие рекомендаций по выбору того или иного критерия дать затрудни-

тельно. Однако отметим следующее: если в отдельных ситуациях не допустим даже минимальный риск, то следует применять критерий Вальда; если опреде-

ленный риск вполне приемлем, то можно воспользоваться критерием Сэвиджа.

Можно рекомендовать одновременно применять поочередно различные крите-

рии. После этого среди нескольких вариантов, отобранных таким образом в ка-

15

честве оптимальных, приходится волевым решением выделять некоторое окон-

чательное решение Такой подход позволяет, во-первых, лучше проникнуть во все внутренние

связи проблемы принятия решений и, во-вторых, ослабляет влияние субъектив-

ного фактора. Кроме того, в области технических задач различные критерии ча-

сто приводят к одному результату.

Нами рассмотрены наиболее общие (классические) методы, которые поз-

воляют обосновывать и принимать решение при неопределенности экономиче-

ских данных и ситуаций, недостатке фактической информации об окружающей среде и перспективных ее изменениях.

2.3.3. Динамические задачи принятия решений

Динамическое программирование представляет собой метод оптимизации многошаговых процессов принятия решении, позволяющий указать пути ис-

следования целого класса экстремальных задач. 1950-е г.г. Беллман.

Метод оказывается весьма эффективным при анализе задач с аддитивной целевой функцией F(x1, x2 , , xn ) g1(x1) gn (xn ) , к которым относятся, в частности, задачи линейного и квадратичного программирования. Требуется

найти (x1*, x2 *, , xn *) , дающий max или min этой функции F.

Необходимость принять решение возникает тогда, когда производятся те или иные целенаправленные действия. Если в какой-либо реальной задаче по-

добные ситуации возникают периодически, то образуется процесс принятия решений. Примером может служить экономический процесс распределения средств между предприятиями, использование ресурсов в течение ряда лет, за-

мены оборудования, пополнения запасов и т.п.

Предположим, что интересующий нас процесс можно разбить на n шагов,

а действия, совершаемые на i-м шаге, характеризуются совокупностью показа-

телей X i (x1i , x2i , , xni ) . Состояние процесса к началу этого шага имеет ха-

рактеристику в виде набора параметров Si . Обычно предпринимаемые дей-

16

Si , кото-

ствия не являются полностью произвольными, а зависят от состояния рое возникло перед i-м шагом, т.е. X i = X i ( Si ).

Возникает вопрос: Как выбрать X i , чтобы величина F приняла экстре-

мальное значение?

Метод ДП позволяет провести оптимизацию поэтапно, анализируя после-

довательно каждый шаг процесса в поисках наилучших вариантов его продол-

жения.

Задача пошаговой оптимизации (задача ДП) формулируется с.о.: опреде-

лить такое допустимое управление Х= (x1, x2 , , xn ) , переводящее систему из

состояния S0 в состояние ˆ , при котором целевая функция F(x1, x2 , , xn )

S

примет наибольшее (наименьшее) значение.

Особенности модели ДП:

1.Возможность разбиения процесса принятия решений на ряд однотипных шагов или этапов, каждый из которых планируется отдельно, но с учетом результатов, полученных на других шагах.

2.Целевая функция равна сумме целевых функций каждого шага.

3.Выбор управления на i-м шаге зависит только от состояния системы к этому шагу, не влияет на предшествующие шаги (нет обратной связи).

4.Вычислительная схема ДП безразлична к способам задания функций и ограничений.

5.Вычислительная схема ДП основывается на двух важных принципах –

оптимальности и вложения.

Принцип оптимальности формулируется следующим образом:

На каждом этапе оптимальная стратегия определяется независимо от стратегий, примененных на предыдущих этапах.

Каково бы ни было состояние системы в результате какого-то числа шагов,

мы должны выбирать управление на ближайшем шаге так, чтобы оно, в сово-

купности с оптимальным управлением на всех последующих шагах, приводило

17

к максимальному выигрышу на всех оставшихся шагах, включая данный.

Принцип вложения утверждает, что природа задачи, допускающей исполь-

зование метода динамического программирования, не меняется при изменении количества шагов, т. е. форма такой задачи инвариантна относительно n.

6. Вычислительная схема ДП использует рекуррентные соотношения. fi (xi ) =max fi 1(xi 1) d(xi 1, xi )

На основе принципа оптимальности Беллмана строится схема решения монгошаговой задачи, состоящая из 2-х частей:

1)Обратный ход: от последнего шага к первому получают множество возможных оптимальных («условно-оптимальных») управлений.

2)Прямой ход: от известного начального состояния к последнему из по-

лученного множества «условно-оптимальных» управлений составляется иско-

мое оптимальное управление для всего процесса в целом.

Оптимальную стратегию управления можно получить, если сначала найти оптимальную стратегию управления на n-м шаге, затем на двух последних ша-

гах, затем на трех последних шагах и т.д., вплоть до первого шага.

Чтобы можно было использовать принцип оптимальности практически,

необходимо записать его математически. Обозначим через z1(xn-1), z2(xn-2),…, zn(x0) условно-оптимальные значения приращений целевой функции на послед-

нем шаге, двух последних,…, на всей последовательности шагов, соответствен-

но.

Тогда для последнего шага:

z1(xn-1) = max (min) {Fn(xn-1, un)},

un

где un – множество допустимых (возможных) управлений на n-ом шаге, xn-1

возможные состояния системы перед n-ым шагом.

Для двух последних шагов:

z2(xn-2) = max (min) {Fn-1(xn-2, un-1) + z1(xn-1)}.

un 1

18

Для k последних шагов:

zk(xn-k) = max (min) {Fn-k+1(xn-k, un-k+1) + zk-1(xn-k+1)}.

un k 1

Для всех n шагов:

zn(x0) = max (min) {F1(x0, u1) + zn-1(x1)}.

u1

Полученные рекуррентные соотношения называют функциональными уравнениями Беллмана. При этом согласно определению zn(x0) = F*.

Отметим преимущества и недостатки метода динамического программиро-

вания. К числу положительных качеств можно отнести:

1.МДП дает возможность решать задачи, которые раньше не исследовались из-за отсутствия соответствующего математического аппарата.

2.МДП в ряде случаев сокращает объем при поиске оптимальных решений.

Кнедостаткам относятся:

1.Отсутствие универсального алгоритма, который был бы пригоден для решения всех задач (мы имеем только схему).

2.Трудности при решении задач большой размерности.

Кмоделям (задачам) динамического программирования можно отнести модель распределения средств между n производственными отраслями (пред-

приятиями) и модель замены физически или морально устаревшего оборудова-

ния. Первая из них применяется с целью оптимального распределения средств между отраслями (предприятиями) для получения максимальной совокупной прибыли от вложения средств в них, а вторая для определения оптимальных сроков замены устаревшего оборудования.

Оптимальное распределение финансовых ресурсов между отраслями

(предприятиями).

Известно, что прибыль fk в каждой отрасли (на предприятии) зависит от количества вложенных средств X k , следовательно fk fk X k . Пусть имеется информация об этой зависимости. Введём некоторые ограничения. Вложенные в отрасль (предприятие) средства кратны х и не превышают заданной величи-

19

ны

X k dk , k 1, n , n – количество отраслей (предприятий).

Процесс распределения финансовых ресурсов между экономическими

объектами представим в виде графа:

 

x1

x2

x3

xn

S0

S1

 

 

S

S0 – количество средств выделенных для всех предприятий (бюджет);

 

S1 S0 X1 – количество средств, подлежащих распределению после того,

 

как первому предприятию будет выделено X1 средств и т.д.;

Sn Sn 1 X n 0 – количество оставшихся средств после того, как они будут

 

распределены между предприятиями.

 

Следует найти оптимальный вариант распределения средств между пред-

приятиями так, чтобы суммарная прибыль от них была максимальной:

Х ( Х1, Х 2 , , X n )

n

F fi (xi )

i 1

Уравнения состояний:

S1 S0 X1 1 S0 , X1

S2 S1 X 2 2 S1, X 2

………………………….

Sn Sn 1 X n n Sn 1, Xn

Для решения поставленной задачи используем уравнения Беллмана:

f Sn 1, X o max fn Sn 1, X n

o

 

 

 

 

 

 

n

n

n

 

 

 

 

Zn 1o

n 2

max fn 1

Sn 2

, X n 1

Z no S n 1

 

……………………………………..

 

Zko Sk 1 max fk Sk 1, X k Z k 1o

k

20

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]