книги / Методы принятия технических решений
..pdf132 |
Глава 9 |
ся большим числом вариантов (например, проблема развязки дорог) и для ее оценки необходима соответствующая постанов ка задачи. Часто нет необходимости подробно описывать саму задачу, потому что ее структура достаточно ясна и способ ре шения определенным образом следует из жизненного опыта. Такие рутинные решения обычно протекают по схеме: инициа тива (заказ) — ознакомление с задачей — сравнение с анало гичными или похожими решениями — определение рациональ ных вариантов. Для сложных или новых задач с однозначными параметрами необходима точная и подробная постановка за дачи. В этом случае необходимо иметь значительный объем информации, касающийся и цели задачи. Необходимо соста вить представительное множество рациональных вариантов ре шения и затем выбрать оптимальный вариант с большим или меньшим объемом обработки данных. Этот объем, когда мы имеем дело с неоднозначными параметрами, по крайней мере не меньше, а обычно намного больше, чем при однозначных па раметрах. Другие особенности выявляются при наличии допол нительной информации. То же относится и к стадиям инициа тивы, проверки результатов и оформления решения. Процесс принятия новых решений при многозначных параметрах может быть различным в зависимости от того, применяют ли класси ческие, производные или гибкие критерии. Соответствующие процессы представлены на рис. 9.8, 9.9 и 9.10. В то время как при использовании классических критериев внимание прини мающего решение должно концентрироваться на заключитель ном этапе выбора, применение гибкого критерия характеризу ется более важной ролью анализа информации в принятии ре шения. Сам акт выбора, т. е. выбор оптимального варианта ре шения из совокупности доминирующих, в последнем случае мо жет быть передан устройству обработки данных. Для примене ния производных критериев необходимо задать некоторые до полнительные условия. Некоторые критерии сами определяют эти дополнительные параметры, тогда как такие параметры, как границы риска, доверительные факторы или весовые ха рактеристики, должны быть заданы. При предварительном ана лизе (см. рис. 9.9) нужно во всяком случае найти достаточное обоснование, почему выбор решения определяется именно этим критерием. В остальном процесс поиска оптимального решения идентичен таковому при использовании классических критериев. Из всех трех схем (рис. 9.8, 9.9 и 9.10) видно, что формирова ние множества рациональных вариантов решения следует не посредственно из постановки задачи. Если какая-либо естест венная дискретизация отсутствует, то она выбирается прини мающим решение. Для этого нельзя указать какой-нибудь об щий подход. Надежным является итерационный метод. Сначала
Анализ ситуаций выбора решения |
133 |
Рис. 9.8. Процесс выбора решения согласно классическим критериям.
проводят грубую дискретизацию и рассчитывают решение в пер вом приближении. Затем около этого приближенного решения формируют ряд более детально дискретизированных альтерна тив и с большей точностью приближаются к оптимуму.
9.4.2. Многошаговые решения
Многошаговый процесс принятия решений характеризуется особенностями, которые выходят за рамки описанного одноша гового процесса. В общем случае объем влияющей на решение
9 Глава
Рис. 9.9. Процесс выбора решения согласно производным критериям.
о
з:
решения выбора ситуаций Анализ
Рис. 9.10. Процесс выбора решения согласно гибкому критерию.
оо
сл
136 Глава 9
информации возрастает с течением времени. При принятии ре шений в области конструирования новая информация получает ся или из результатов параллельно проводимых исследований, или благодаря появлению изобретений, которые стимулируют создание нового оборудования. Всякое исследование с этой точ ки зрения, безусловно, лучше рассматривать в момент, как можно более близкий к его завершению и реализации. Если, например, мы имеем дело с неточно известным состоянием ис ходных данных F , которое в момент времени t находится в диа
пазоне x t ^ F = x t, |
то относительно |
имеющего |
место |
для более |
позднего момента |
/ + А^ диапазона |
изменения |
этого |
состояния |
xt+M = F^:xt+At в |
среднем справедливо неравенство |
\xt— |
> | xt+м—Xt+At |. Отсюда следует, что решение нужно принимать не ранее, чем это необходимо, чтобы обеспечить наиболее вы сокий уровень информированности. Беляев [12] в этой связи го ворит о «принципе минимальной заблаговременности». Разуме ется, решение нельзя принимать и позже, чем это необходимо. Неблагоприятные последствия в этом случае могут быть даже значительно тяжелее, чем при слишком рано принятом реше нии. В принципе при многошаговых процессах принятия реше ния имеются различные типы стратегий. Выбор стратегии опре деленного типа делается прежде всего исходя из соображений точности, оценки затрат, а также простоты использования не которой в известном смысле оптимальной стратегии. Для по
лучения общей |
формулировки примем, |
что процесс |
имеет |
|||
N шагов, причем каждый шаг характеризуется начальным со |
||||||
стоянием хк, вариантом решения ук |
и |
конечным состоянием |
||||
Xk+u 6 = 0, 1, • •, |
N — 1. |
|
|
|
|
|
При этом пусть на £-м шаге реализуется промежуточный ре |
||||||
зультат eh+i (xk, ук, xk+i), |
а общий результат Z N-шагового про |
|||||
цесса аддитивен |
и складывается |
из |
промежуточных |
резуль |
||
татов: |
|
|
|
|
|
|
|
N - |
1 |
|
|
|
|
|
^ ^ 2 |
^k+i {Xk* |
Ук> |
Xk+i)‘ |
(^*3) |
|
|
k~0 |
|
|
|
|
Под состояниями хк будем понимать в общем случае случай ные величины, которые мы будем обозначать прописными бук
вами Хк, k = 0, 1,..., |
N. Далее примем, что переход от некото |
|||
рого наблюдаемого |
состояния хк путем выбора варианта |
реше |
||
ния yk к состоянию Xk+i осуществляется с соответствующей |
ве |
|||
роятностью Pyk |
(Xk+i = Xk+i/Xh= Xk) =PA+I [Xh+i/Xk, ук), |
&=0, |
||
1,..., N— l. Справедливы также равенства pk+1 (ук+i/xh, |
Ук)ШО |
|||
и S Рш (Ук+ilxk, |
Ук) = 1, причем суммирование проводится |
по |
||
Ук+ 1 |
|
|
|
|
всем возможным состояниям на (£ + 1)-м шаге.
Анализ ситуаций выбора решения |
13Г |
Управление процессом происходит теперь в соответствии со стратегией 5. Под нею мы понимаем последовательность опти
мальных |
функций |
управления |
(«решающих |
функций») |
|
S (d0, di, ... |
, dN- 1), с использованием которых на £-м шаге для |
||||
имеющего место состояния Xk исходных |
данных |
посредством |
|||
dk(xk)=yk |
однозначным образом |
определяется вариант реше |
|||
ния yki £ = 0, 1,..., |
N—1. В более общем |
случае |
можно также |
полагать, что значения решающих функций dk зависят от всего хода процесса до каждого соответствующего шага, т. е. от х0, Уо, *i, Ук-ь xk, однако для упрощения рассмотрения огра ничимся более простым и, кроме того, наиболее часто встречаю щимся на практике случаем, указанным выше, когда dk зависит
только от наблюдаемого состояния Хи- |
S (d0, |
|
При управлении процессом |
посредством стратегии |
|
db ..., djv-i) из-за случайности |
появления состояний X0f Хи ..., |
|
XN на отдельных шагах процесса получается случайный итого |
||
вый результат: |
|
|
Z= Д **+1 |
dh {Xh)' Xh+l ) ‘ |
(9‘4> |
В большинстве случаев мы имеем дело с определенным не случайным начальным состоянием Хо= Хо. В общем случае, однако, начальное состояние также случайно и реализуется с вероятностью
Р (Хо= х0) =р0 (х0).
Первый вариант установления оптимальной стратегии осно вывается на применении так называемых OL-стратегий (OL — англ, open loop — разомкнутый контур). Здесь в качестве стра тегий используют просто определенную числовую последова тельность S = ( y 0, уо>...> yN-\) и вычисляют затем среднее зна чение
MSZ= 2 |
Msek+1 (Xk, yky Xk+\). |
(9.5) |
<7 = 1 |
|
|
При расчете по формуле |
(9.5) мы исходим из |
справедливого |
для всех k = 1,..., N соотношения |
|
|
Ps (Хо = Хо, Х\=хи Х2 = Х 2 у . . . у Xk = Xh) = |
||
= Ро{Хо)р\(Х\/УОу х0)р2(х2/уи Xi)... |
|
|
...рк(Хк/Ук-и X/t-i), |
(9.6) |
причем S(y0, f/i,..., yhy• ••> UN-\) — применяемая OL-стратегия,
138 Глава 9
Отсюда следует
|
|
P (xh+l= x h+l/x k= Xh) = 2 2 ... |
|
|||||||||
|
|
|
|
|
|
|
|
|
*0 |
*1 |
|
|
|
|
. . . |
2 |
|
|
|
|
* о ) . .. |
|
|||
|
|
|
|
* Л - 1 |
|
|
|
|
|
|
|
|
...p k - l (Xk-l/lJk-2 , |
Xk-i) pk(Xk/yh-U |
Xk-l) pk+l{Xk+U Ук> Xh). |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
(9.7) |
Суммирование здесь нужно производить по всем состояниям |
||||||||||||
на данном шаге. Для слагаемых в (9.5) получаем |
|
|||||||||||
|
|
|
M s e h + i ( X h f |
Уку |
|
= |
|
|
||||
|
== 2 |
2 |
&k+l {Xju |
Уку |
Xk+l) Р |
{%k+l == Xk+l/Xk == |
|
|||||
|
xk |
xk+\ |
|
|
|
|
|
|
|
|
|
|
|
•= |
|
= |
2 |
2 |
• • • |
2 |
2 |
|
(xkj y^y |
|
|
|
|
|
|
XO |
X l |
|
x k |
Xk + l |
|
|
|
|
|
|
Xk+l)po(Xo)p\(Xi/yOy |
Xo) . .. |
|
|
|||||||
|
.-•pk (xk/yk- 1, xh-i)ph+i (Xk+i/yhy |
xk), |
(9.8) |
|||||||||
откуда |
путем сложения |
по |
индексу k |
от |
0 до N—1 |
соглас |
||||||
но (9.4) |
получается |
значение для MsZ при S = ( y 0f уь ..., ум-1). |
Максимизация при управлении по принципу OL-стратегии со стоит теперь в том, чтобы определить стратегию S*, для кото
рой (9.5) (и, следовательно, средний общий результат) |
оказы |
||
вается максимальным: |
|
|
|
Ms*Z= max MSZ. |
|
(9.9) |
|
Такая оптимальная стратегия |
S * = (J/Q*, |
#I* ,..., y*N-i) |
имеет |
то важное для практики свойство, что |
локально-оптимальные |
||
варианты решения #о*, у |
y*jv-i определяются с самого на |
чала. Случайные состояния исходных данных, выявляющиеся в процессе реализации выбора, при последующем определении переменных решения не учитываются независимо от того, воз можен такой учет или нет, либо им сознательно пренебрегают.
На другом полюсе возможных оптимальных стратегий ле жат CL-стратегии (англ, closed loop — замкнутый контур), на зываемые также FB-стратегиями (англ, feed back — обратная связь). Эти стратегии учитывают каждое реализуемое в ходе процесса состояние для установления последующих оптималь ных реш ений.Расчет самой стратегии, а также максимально достижимый средний результат получаются за счет использова ния обратной связи при стохастической динамической оптими зации. Снова исходят из того, что процесс имеет конечное чис-
’> Нередко только что описанные O L-стратегии называют также статиче скими, а CL-стратегии — последовательными. — Прим, перев.
Анализ ситуаций выбора решения |
|
139 |
ло N шагов и на fe-м шаге имеется конечное |
число |
состояний |
Xk, которым соответствует также конечное |
число |
возможных |
решений ук. Индекс, относящийся к состояниям, принимает зна чения в диапазоне fee{0, 1,..., N}, а относящийся к решени ям — в диапазоне fe e {0, 1 ,..., N—1}. В дальнейшем как для со бытий на этапе eh+i(xk, ук, *M-I), так и для функций перехода
ph+1 (Xh+ilyk, xk) справедливы те же |
сформулированные |
|
выше |
||||
предположения. Максимизируемой |
итоговой |
величиной, |
как |
в |
|||
(9.5), снова является MSZ, с тем отличием, что теперь |
вместо |
||||||
OL-етратегий применяются обладающие |
наибольшей |
приспо |
|||||
собляемостью CL-стратегии. Эти последние |
определяются |
по |
|||||
алгоритму стохастической динамической |
оптимизации |
следую |
|||||
щим образом. |
|
наступает |
состояние |
||||
Шаг k=V—1. Если к моменту N—1 |
|||||||
Хк~и то оптимальный средний итоговый результат V*JV- I (XJV- I), |
|||||||
т. е. оптимальный средний результат на |
последнем |
шаге |
при |
||||
оптимальном варианте решения y *N-i = a * N-i(xN -i) |
выражается |
||||||
формулой: |
|
|
|
|
|
|
|
v*iv-i(XJV- I) =max 2 PN {XN!HN-\, *pr-i)£jv(*jv-i» UN- U XN ) = |
|
||||||
V N - 1 XN |
|
|
|
|
|
|
|
— 2 PN(XN/y*N-l, XN- I )SN (XN-U y*N-l, XN ). |
|
(9.10) |
|||||
*N |
|
|
|
|
|
|
|
Шаги k=0, 1, N —2. Если к моменту fe наступает состоя ние то оптимальный средний итоговый результат v*k(xk), т. е. оптимальный средний результат на шаге fe п.ри оптималь ном варианте решения у *к— b*k(Xk), выражается формулой
v \ (х ) = max ( 2 |
Ph+i (хш1Ук, x k) \ек+1 ( x k, y k , хк+1) + |
|||
Vk ( |
|
|
|
|
+ А +1 |
|
\ = |
2 Ри 1 (xh+i/y*k, хк) X |
|
|
|
} |
**-Н |
|
X \еш |
( х к , |
у*к, x k+i) + v \ +1 (xk+l)\. |
(9.11) |
|
На шаге k=0 должно |
быть также реализовано |
начальное |
состояние хо с начальным распределением р0.
Принцип обратной связи в соотношениях (9.10) и (9.11) на ходит выражение в том, что для расчета оптимальной приведен
ной функции затрат vk* на шаге k |
необходимы заранее опреде |
||||
ленные оптимальные |
приведенные |
функции |
затрат |
v*k+i |
по |
всем состояниям xh+i |
(&+1)-го шага. Этот расчет в |
обратном |
|||
направлении обеспечивает, таким |
образом, |
определение |
для |
каждого шага оптимальной функции затрат v&*, так что, собст венно, в процессе управления, т. е. при расчете в прямом на правлении каждому достигаемому состоянию Хь. ставится в со ответствие имеющийся оптимальный вариант решения Ул*(х&) =
140 |
Глава 9 |
=Ук- Средний оптимальный итоговый результат при оптималь ной стратегии S*.= (v0*,..., v V i) выражается формулой
Ms*Z='2po(xo)v*0(xo). |
|
(9.12) |
|
*0 |
|
|
|
Различие оптимально достижимых средних итоговых |
величин |
||
MS*Z в классе OL-стратегий, с одной |
стороны, |
и в |
классе |
CL-стратегий, с другой, обычно весьма значительно; при этом |
|||
СЬнстратегии дают существенно более |
высокие |
результаты, |
правда, ценой и существенно более высоких затрат. Промежу точное положение занимают так называемые OLFB-етратегии. Их принцип состоит в том, чтобы на каждом шаге 6= 0, 1,..., N—1, исходя из реализованного состояния хку рассчитать опти мальный способ управления для оставшегося времени, руковод ствуясь OL-стратегией Sk(OL) = (6{h)ky 6(ft)/t+b ... , 6(/i)^_i) и только потом принять решение для следующего шага 6к{к)(хк)у благодаря чему процесс на следующем своем шаге приводит к новому состоянию Xk+i. Этот образ действий повторяют, причем на каждом шаге рассчитывают оптимальную OL-стратегию и только в соответствии с ней принимают следующее решение. Достижимые с помощью OLFB-стратегии оптимальные резуль таты оказываются значительно более высокими, чем при ис пользовании OL-стратегии, и довольно близкими к результа там, обеспечиваемым CL-стратегией. В особом случае, когда все
подлежащие учету состояния исходных данных |
не случайны, |
а характеризуются единственным определенным |
значением хк |
на каждом шаге 6= 0, 1, ... , N, это приводит к тому, что веро ятности перехода вырождаются в «одноточечные» распределе ния, т. е. pk+i(xk+i/yh, Xh) = 1, независимо от вариантов реше ния уку и все типы стратегий становятся равноценными — нет никакой разницы, следовать ли OLили FB-стратегии.
9.5. Дискретизация и комбинирование внешних состояний
Пусть некоторый параметр внешнего состояния х влияет на свойства системы или процесса и по условиям задачи ограничен
пределами х^[ху х]. Из этого интервала следует выбрать пред ставительные значения х]у / = 1, ... , п так, чтобы решаемая за дача описывалась достаточно точно, но чтобы п в интересах упрощения расчетов было как можно меньше. Эти два требова ния явно противоречивы. Предельно простыми расчеты стано вятся, когда весь интервал представляется единственным зна чением x = xiy что соответствует детерминированной оптимиза ции. Аналогично можно говорить о квазидетерминированных
Анализ ситуаций выбора решения |
141 |
оптимизационных расчетах в случаях, когда представительные
значения переменных из интервала х^[х, х] не рассматривают ся как неизвестные (неважно, на каком основании). Например, использование неопределенных величин часто не предусмотре но нормами, или же затраты, которые мы можем себе позво лить, предопределяют выбор представительных значений. Зада ние параметров в этом случае осуществляется однозначно и не
является случайным. Обыкновенно используют среднее л;= =z~{x+x), а также крайние х и х значения. Если различные
возможные состояния параметра представляют многими зна чениями xi, 1= 1, ... , м, то целесообразно исходить из равномер ного разделения диапазона изменения параметра, а в качестве Представительных значений выбирают середины интервалов (рис. 9.11). Непосредственное влияние предельных значений
Xi и Xi проявляется тогда только с ростом щ.
Г{х)
■1
--- ,------ ,------- :-----
|
Xll |
|
|
Рис. 9.11. Выбор дискретных реа |
i l |
l |
I I |
лизаций. |
хч |
|
хь |
Желаемая формулировка задачи получается из комбинации выбранных представительных значений, которые должны адек ватно характеризовать анализируемый параметр внешнего со стояния.
Кроме снижения затрат на обработку, имеются и другие ос нования, которые заставляют делать число выбранных предста вительных значений как можно меньше. Исследователь стре мится из осторожности сделать диапазон столь большим, что бы гарантированно охватить все реализации анализируемого параметра внешнего состояния. Однако краевые области интер