Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические основы теории принятия решений

..pdf
Скачиваний:
4
Добавлен:
12.11.2023
Размер:
865.71 Кб
Скачать

ресами, поэтому одного из конфликтующих игроков удобно называть «мы», а другого – противником.

Стратегия, которая обеспечит одной стороне максимальный выигрыш, а другой – минимальный проигрыш, называется оптимальной. Основная задача теории парных игр – отыскание игроками оптимальной стратегии.

8.2.2. Матричные игры. Принцип минимакса

Рассмотрим конечную игру двух игроков A и B. Игра, в которой игрок A имеет m стратегий, а игрок B n стратегий, называется игрой m×n. Предположим, что игрок A выбрал стратегию Ai, а игрок B – стратегию Bj. Если игра состоит только из личных ходов, то выбор стратегий Ai и Bj однозначно определит исход игры как выигрыш игрока A, равный aij.

Если же, кроме личных ходов, допускаются случайные ходы, то при той же паре стратегий Ai и Bj выигрыш будет величиной случайной, зависящей от исходов случайных ходов. В этом случае можно оценить ожидаемый выигрыш aij как математическое ожидание выигрыша (сохранив за математическим ожиданием выигрыша обозначение aij).

Если известны значения выигрыша aij для каждой из возможных пар Ai Bj стратегий (i = 1, 2, ..., m; j = 1, 2, …, n), то можно составить матрицу ║aij║ размерности m×n, строки которой соответствуют стратегиям Ai игрока A, а столбцы – стратегиям Bj игрока B, которая на-

зывается платёжной матрицей (матрицей игры).

Матрицу ║aij║ игры m×n принято записывать в виде табл. 8.1.

 

 

 

 

 

 

 

 

Таблица 8.1

 

 

Платёжная матрица игры

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Стратегии игрока B

 

 

 

 

 

 

B1

 

B2

 

 

 

Bn

Стратегии

A1

 

a11

 

a12

 

 

a1n

A2

 

a21

 

a22

 

 

a2n

игрока A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Am

 

a1m

 

a2m

 

 

amn

81

В матрице ║aij║ индекс i – это номер стратегии игрока A, а j – номер стратегии игрока B (i = 1, 2, ..., m; j = 1, 2, …, n).

Дадим определение верхней и нижней цены игры. Предположим, что игрок A выбирает стратегию Ai, тогда он

должен рассчитывать, что его противник игрок B ответит на неё та-

кой стратегией Bj, для которой выигрыш игрока A минимален:

 

ai = min aij.

(8.1)

j

 

Элементы ai (i = 1, 2, .., m) составят правый добавочный столбец платёжной матрицы (табл. 8.2).

 

 

 

 

 

Таблица 8.2

Платёжная матрица игры с добавочными элементами

 

 

 

 

 

 

Стратегия

B1

B2

Bn

ai = min aij

j

 

 

 

 

 

 

A1

a11

a12

a1n

a1

A2

a21

a22

a2n

a2

 

 

 

 

 

 

Am

a1m

a2m

amn

a m

bj = max aij

b1

b2

 

bn

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, если игрок A выбирает стратегию Ai, то игрок B, перебрав все возможные из своих ответных стратегий Bj (j = 1, 2, …, n), среди всех выигрышей aij (j = 1, 2, …, n) игрока A найдёт минимальное значение, которое обозначено как ai. Поэтому, прежде чем реально выбрать какую-то стратегию Ai, игрок рассматривает элементы этого добавочного столбца и, естественно, выбирает в нем строку (то есть номер i) с максимальным выигрышем a:

a = max ai.

i

Определив таким образом номер i своей стратегии, в результате её реализации игрок A ожидает получить не меньше, чем выигрыш a, вычисляемый по формуле

82

a = max min aij.

(8.1)

i

j

 

Величина a, вычисляемая по формуле (8.1), называется максимином (максиминным выигрышем) или нижней ценой игры, а соответствующая стратегия Ai игрока A называется максиминной стратегией. Придерживаясь максиминной стратегии, игрок A при любом поведении противника получит выигрыш, не меньший, чем a. Таким образом, максиминная стратегия – это стратегия осторожного игрока, который гарантирует себе выигрыш не меньше максиминного.

Аналогичные рассуждения можно провести и за игрока B, который заинтересован в том, чтобы выигрыш игрока A был минимальным. Поэтому сначала, перебирая построчно элементы столбца Bj, игрок B находит среди них максимальный:

bj = max aij. i

Таким образом, в каждом столбце игрок B определит номер i строки с максимально возможным значением выигрыша игрока A, то есть игрок B предполагает, что игрок A поступает разумно, желая обеспечить себе максимальный выигрыш при любой из стратегий своего противника.

Элементы bj (j = 1, 2, …, n) составят нижнюю добавочную строку платёжной матрицы. Перебирая далее элементы bj этой строки, игрок B ищет среди них минимальный:

b = min bj.

j

Поступая таким образом, игрок B находит номер j своей стратегии так, чтобы выигрыш игрока A был бы минимальным. Найденное значение

b = min max aij

j

i

называется минимаксным или верхней ценой игры. Соответствующая минимаксному выигрышу стратегия называется минимаксной стра-

тегией.

83

Минимаксная стратегия – это стратегия осторожного игрока, который не желает в любом случае проиграть больше, чем минимаксное значение b.

Принцип осторожности, диктующий игрокам выбор соответственно максиминной и минимаксной стратегий, в теории игр принято называть общим термином «принцип минимакса», а максиминную и минимаксную стратегии игроков часто обозначают общим термином «минимаксные стратегии».

В заключение отметим, что теория матричных игр не учитывает элементы риска. Она выявляет лишь наиболее осторожные стратегии поведения игроков. В реальности противник может ошибиться, и тогда второй игрок может воспользоваться ситуацией с пользой для себя.

8.3.Принятие решений

встохастических «играх с природой»

Врассмотренных выше матричных играх предполагалось, что оба игрока действуют разумно, выбирая свои стратегии на основании расчётов, при этом интересы обоих игроков предполагались противоположными. Но существуют задачи другого рода, в которых игрок B равнодушен к итогам игры и не выбирает стратегии. Роль такого «игрока» играет объективная реальность. Примером может служить природа, в которой могут складываться различные ситуации, не зависящие от чьей-то воли. Эти объективные обстоятельства, которые обычно для простоты терминологии так и называют «природными», вынуждают игрока A, по-прежнему действующего в своих интересах, сравнить возможные варианты стратегий между собой. Иногда игроку A удаётся оценить, с какой вероятностью реализуется то или иное состояние «природы» (окружающей среды), то есть перевести неоп-

ределённую ситуацию в разряд стохастических (вероятностных). В стохастической ситуации можно взвесить возможные последствия для каждого из возможных состояний «природы». Выбирая наилучшую стратегию, игрок A стремится либо максимизировать свой выигрыш, либо минимизировать свои потери. Математически строго

84

задача о выборе наилучшей стратегии в стохастической «игре с природой» может быть сформулирована следующим образом.

Предположим, что окружающая среда («природа») имеет n различных состояний Пj, каждое из которых реализуется с соответствующей вероятностью pj (j = 1, 2, …, n). Предположим, что игрок A может выбрать любую из m своих стратегий A1, A2, …, Am. Платёжную матрицу такой «игры» можно записать в виде табл. 8.3.

 

 

 

 

 

 

Таблица 8.3

Платёжная матрица стохастической игры с «природой»

 

 

 

 

 

 

 

 

 

Состояния природы и их вероятности

n

 

 

 

 

 

 

Mi = p j aij

 

 

П1

П2

Пn

 

 

p(П1) = p1

p(П2) = p2

p(Пn) = pn

j = 1

Страте-

A1

a11

a12

a1n

M1

A2

a21

a22

a2n

M2

гии

игрока A

Am

a1m

a2m

amn

M m

 

 

bj = max aij

b1

b2

 

bn

 

 

i

 

 

 

 

 

 

 

 

Желая максимизировать свой выигрыш, игрок A выбирает ту стратегию, для которой математическое ожидание Mi выигрыша, вычисленное по строке, максимально:

n

 

Mi = pj aij → max.

(8.2)

j = 1

Номер i строки с максимальным значением Mi – это номер наилучшей из стратегий игрока A.

Интересно, что стратегия, которая позволяет игроку максимизировать математическое ожидание своего выигрыша, – это та же стратегия, которая позволяет ему минимизировать свои потери.

Потери возникают, если в окружающей среде реализуется не то состояние, которое ожидает игрок A. Например, игрок ожидает состояние Пj и соответственно выбирает ту стратегию Ai, которая должна бы принести ему максимальный выигрыш bj. Но если он

85

ошибается, и выбранная им стратегия с номером i не является оптимальной, то его потеря с вероятностью pj окажется равной разности bj aij. Желая минимизировать свои потери, игрок должен найти стратегию Ai, которая минимизирует математическое ожидание Ri его потерь:

n

Ri = pj (bj aij ) → min.

j = 1

Отметим, что здесь математическое ожидание Ri потерь называ-

ется риском.

Как отмечалось выше, стратегия, позволяющая минимизировать риск, и стратегия, максимизирующая выигрыш, совпадают. Таким образом, в рисковой ситуации существует единственная оптимальная стратегия. Но сложность представляет проблема оценки вероятностей pj реализации тех или иных состояний окружающей среды. Для получения соответствующих оценок можно использовать опытные данные, а если это не удаётся, то можно использовать методы экспертного оценивания, рассмотренные в главе 9.

8.4. Принятие решений в ненадёжных ситуациях. Критерии Вальда, Сэвиджа, Гурвица, Лапласа

Самая неприятная ситуация в играх с «природой» возникает, когда необходимо принять решения в условиях непрогнозируемой неопределённости. В этом случае ЛПР приходится полагаться на своё «чутьё» и опираться на собственное представление о возможных неприятностях в случае неудачного выбора. Тем не менее существует несколько подходов к решению подобных проблем и предлагается несколько критериев, используя которые ЛПР может сделать какието приблизительные расчёты, и с помощью которых он может лучше оценить ситуацию.

Представим несколько таких критериев.

Для начала снова составляется платёжная матрица, аналогичная матрице табл. 8.2. Только на этот раз роль игрока B играет «природа» и предсказать её «стратегии», то есть поведение, невозможно.

86

1. Максиминный критерий Вальда. Согласно этому критерию,

игрок A предполагает, что внешние обстоятельства сложатся наихудшим для него образом, и он старается даже в этой ситуации выиграть как можно больше. Таким образом, согласно критерию Вальда, оптимальной считается стратегия, в которой гарантируется выигрыш, не меньший, чем нижняя цена «игры с природой»:

a = max min aij.

(8.3)

i

j

 

Таким образом, в соответствии с формулой (8.3), игроку A необходимо выбрать стратегию с номером i, дающую максимальное из минимально возможных (по столбцу) значений выигрыша. Критерий Вальда называют ещё критерием «крайнего пессимизма».

Однако очевидно, что условия внешней среды не всегда складываются для игрока A наихудшим образом, поэтому имеет смысл рассмотреть другие критерии оптимальности.

2. Критерий Сэвиджа. Согласно этому критерию, в качестве оптимальной выбирается стратегия, в которой величина проигрыша bjaij окажется минимальной:

S = mini maxj (bj aij ).

Смысл этого выбора состоит в том, чтобы минимизировать потери, то есть сначала ищется максимальный проигрыш в каждой строке (то есть при каждом из возможных состояний внешней среды), а потом игрок A выбирает стратегию, то есть строку с минимальным из возможных проигрышей.

Критерий Сэвиджа также выражает пессимистичную точку зрения игрока A, но на этот раз игрок желает, главным образом, избежать значительных потерь.

3. Критерий Гурвица позволяет игроку A самому оценить степень своего пессимизма (оптимизма). Критерий применяется в тех случаях, когда игрок A предполагает, что внешние обстоятельства не так уж и плохи.

87

Согласно критерию Гурвица, стратегия выбирается игроком A из следующего условия:

H = max [λ min aij + (1 λ) max aij].

i

j

j

Коэффициент λ называется коэффициентом пессимизма игрока A. При λ = 1 критерий Гурвица превращается в критерий Вальда, а при λ = 0 – в критерий «крайнего оптимизма», согласно которому рекомендуется рассчитывать на самый большой из всех возможных выигрышей (что, вероятно, не слишком разумно). При 0 < λ < 1 выбираемая стратегия тем оптимистичней, чем ближе к единице выбирается значение коэффициента λ. Если же игрок не слишком оптимистично оценивает внешние обстоятельства, то он выбирает число λ поближе к нулю.

4. Критерий Лапласа. Критерий Лапласа основан на предположении, что все возможные состояния внешней среды равновероятны, то есть в табл. 8.3 вероятности следующие:

p(Пj) = 1n , j = 1, 2, …, n.

Тогда стратегия Ai выбирается из следующего условия, аналогичного условию (8.2):

 

1

n

Li =

aij → max.

 

n

j = 1

 

 

Критерий Лапласа призывает ориентироваться на среднее значение выигрыша и пытаться максимизировать именно его. Однако очевидно, что желательно всё же пытаться оценить вероятности реализации тех или иных «природных» событий с помощью понятия относительной частоты.

Все четыре критерия основаны на том, что игроку недоступна информация, в которой он так нуждается. Однако проблему выбора решения можно сформулировать и иначе: как добыть необходимую информацию?

88

Информацию можно добыть, например, из накопленных ранее статистических данных или из эксперимента. И тогда первоочередным становится вопрос о цене информации, так как экспериментальные исследования стоят дорого. Вопросами оптимизации экспериментальных исследований занимается другая наука – планирование эксперимента. В теории планирования эксперимента постулируется следующий тезис: при получении новой информации каждое из принятых ранее решений должно пересматриваться. При этом неизбежно будет происходить перерасчёт вероятностей на основе знаменитой формулы Бейеса из курса теории вероятностей.

Однако есть ещё один вариант поведения игроков в реальных «играх с природой»: в некоторых случаях информацию можно купить. Если внешние обстоятельства связаны с экономическими отношениями, то с этой целью можно вступить в коалиционные отношения с партнёрами, обладающими нужными сведениями.

Отметим, что отдельные проблемы выбора решения и минимизации потерь в условиях неопределённости могут быть решены с помощью различных видов страхования.

Контрольные вопросы

1.Укажите основные источники и виды неопределённости.

2.Что такое риск? Как можно оценить риск по статистическим данным?

3.Приведите классификацию ситуаций принятия решений по степени возможной неопределённости.

4.Какой риск называется ожидаемым (допустимым, критическим, катастрофическим)?

5.Что такое конфликтная ситуация?

6.Что такое игра с математической точки зрения?

7.Как определяется цель игры?

8.Какая игра называется парной (коалиционной, конечной)?

9.Что такое ход игрока?

89

10.Дайте определение и приведите примеры личных и случайных ходов игрока.

11.Дайте определение стратегии игрока.

12.В каком случае стратегия называется оптимальной?

13.Что такое матричная игра размерности m×n?

14.Что такое платёжная матрица игры? Что означают её эле-

менты?

15.Как определяется нижняя (верхняя) цена игры?

16.Как ищется максиминная (минимаксная) стратегия?

17.В чём состоит принцип минимакса?

18.Чем отличается модель «игры с природой» от моделей конфликтных игр? Напишите платёжную матрицу игры с «природой».

19.Как оценивается риск в играх с природой?

20.Какие стратегии являются оптимальными в рисковых играх

с«природой»?

21.Сформулируйте критерий Вальда. Когда он используется и в чём его смысл?

22.Сформулируйте критерий Сэвиджа. Когда он используется и в чём его смысл?

23.Запишите критерий Гурвица. В чём его основное достоинство?

24.Как записывается и в чём смысл критерия Лапласа?

25.Как можно оценить вероятность события на основе опытных данных?

9. ПРИМЕНЕНИЕ МЕТОДОВ ЭКСПЕРТНОГО ОЦЕНИВАНИЯ В ПРИНЯТИИ РЕШЕНИЙ

Экспертами чаще всего называют высококвалифицированных специалистов, привлекаемых к решению сложных проблем. В частности, экспертов используют с целью постановки и решения задач оптимизации в условиях определённости. Но не менее часто методы экспертного оценивания применяют в условиях неопределённости.

В процедурах разработки управленческих решений экспертов можно привлекать с целью составления прогнозов и разработки ве-

90