Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

QalOGUGtk0

.pdf
Скачиваний:
2
Добавлен:
15.04.2023
Размер:
4.97 Mб
Скачать

min max aij max min aij

1 j n 1 i m

1 i m 1 j n

По теореме1 max min aij min max aij , следовательно, справедливо равен-

 

1 i m 1 j n

1 j n 1 i m

ство max min aij min max aij , что и требовалось доказать.■

1 i m 1 j n

1 j n 1 i m

 

2. Смешанное расширение матричной игры.

Опр. Смешанной стратегией игрока называется полный набор вероятностей применения его чистых стратегий.

Таким образом, если игрок 1 имеет m чистых стратегий 1,2,...,m, то его смешанная стратегия x– это вектор x = (x1,...,xm) удовлетворяющий соотношениям

m

1 xi 0 (i= 1,m), xi =1.

i 1

Аналогично для игрока 2, который имеет n чистых стратегий, смешанная стратегия y– это вектор

n

y = (y1, ..., yn), 1 yj 0, (j = 1,n), y j = 1.

j 1

Так как каждый раз применение игроком одной чистой стратегии исключает применение другой, то чистые стратегии являются несовместными событиями. Кроме того, они являются единственными возможными событиями.

Чистая стратегия есть частный случай смешанной стратегии. Если в смешанной стратегии какая-либо i-я чистая стратегия применяется с вероятностью 1, то все остальные чистые стратегии не применяются. И эта i-я чистая стратегия является частным случаем смешанной стратегии. Для соблюдения секретности каждый игрок применяет свои стратегии независимо от выбора другого игрока.

Опр.Система G(Х,Y,А), где Х – множество смешанных стратегий игрока 1, Y – множество смешанных стратегий игрока 2, А - платежная матрица, называется матричной антагонистической игрой в нормальной форме Опр. Средний выигрыш игрока 1 в матричной игре с матрицейА выражается в виде математического ожидания его выигрышей

m n

E(A, x, y) = aij xi y j = xAyT

i 1 j 1

Первый игрок имеет целью за счёт изменения своих смешанных стратегий х максимально увеличить свой средний выигрыш Е (А,х,y), а второй – за счёт своих смешанных стратегий стремится сделать Е (А,х,y) минимальным, т.е. для решения игры необходимо найти такие х и y,при которых достигается верхняя цена игры

vв min max Е (А,х,y).

y x

91

Аналогичной должна быть ситуация и для игрока 2, т.е. нижняя цена игры должна быть

vн max min Е (А, х, y).

x y

Опр. Аналогично играм, имеющим седловые точки в чистых стратегиях, вводится следующее определение: оптимальными смешанными стратегиями игроков 1 и 2 называются такие наборы хо, уо соответственно, которые

удовлетворяют равенству

min max Е (А,х,y) = max min Е (А, х, y) = Е (А, хо, уо).

y

x

x

y

Опр.Величина Е (А, хоо) называется ценой игры и обозначается через .

Другими словами хо, уо называются оптимальными смешанными стратегиями соответственно игроков 1 и 2, если они образуют седловую точку:

Е (А, х, уо) Е (А, хо, уо) Е (А, хо, у)

Опр. Оптимальные смешанные стратегии и цена игры называются решением матричной игры.

Теорема3(о минимаксе). Для матричной игры с любой матрицей А величины

vн

max min Е (А, х, y) и vв

min max Е (А,х,y)

 

x y

y x

существуют и равны между собой.■

3. Свойства решений матричных игр.

Пусть G(Х,Y,А) игра двух лиц с нулевой суммой, в которой игрок 1 выбирает стратегию х Х, игрок 2 –y , после чего игрок 1 получает выигрыш А = А(х, y) за счёт игрока 2.

Опр.Стратегия х1 игрока 1 доминирует (строго доминирует) над стратегией х2, если

А (х1, y) А (х2, y)(А (х1, y)> А (х2, y)), y .

Стратегия y1 игрока 2 доминирует (строго доминирует) над стратегией y2, если

А (х, y1) А (х, y2)(А (х, y1)< А (х, y2)), х Х.

При этом стратегии х2и y2 называются доминируемыми (строго доминируемыми).

Опр. Спектром смешанной стратегии игрока в конечной антагонистической игре называется множество всех его чистых стратегий, вероятность которых положительна.

Свойство 1. Если чистая стратегия одного из игроков содержится в спектре некоторой его оптимальной стратегии, то выигрыш этого игрока в ситуации, образованной данной чистой стратегией и любой оптимальной стратегией другого игрока, равен цене игры.

92

Свойство 2. Ни одна строго доминируемая чистая стратегия игрока не содержится в спектре его оптимальной стратегии.

Опр.Игра G = (Х ,Y ,А ) называется подыгрой игры G(Х,Y,А), если Х Х,, а матрица А является подматрицей матрицы А. Матрица А при этом строится следующим образом. В матрице А остаются строки и столбцы, соответствующие стратегиям Х и , а остальные “вычеркиваются”. Всё то что “останется” после этого в матрицеА и будет матрицей А .

Свойство 3. Пусть G = (Х,Y,А) – конечная антагонистическая игра, G = (Х \х ,Y,А) –подыгра игры G, а х – чистая стратегия игрока 1 в игре G, доминируемая некоторой стратегией x , спектр которой не содержит х . Тогда всякое решение (хо, yо, ) игры G является решением игры G.

Свойство 4. Пусть G = (Х,Y,А) – конечная антагонистическая игра, G = (Х,Y\y ,А) –подыгра игры G, а y – чистая стратегия игрока 2 в игре G, доминируемая некоторой стратегией y , спектр которой не содержит y .Тогда всякое решение игры G является решением G.

Свойство 5. Если для чистой стратегии х игрока 1 выполнены условия свойства 3, а для чистой стратегии y игрока 2 выполнены условия свойства 4, то всякое решение игры G = (Х \х ,Y\y ,А) является решением игры G =

(Х,Y,А).

Свойство 6.Тройка (хо, yо, ) является решением игры G = (Х,Y,А) тогда и только тогда, когда (хо, yо, к +а) является решением игры G(Х,Y,кА+а), где a, k , k 0 .

Свойство 7. Для того, чтобы хо = ( x1o , ..., xoi , ..., xom ) была оптимальной сме-

шанной стратегией матричной игры с матрицей А и ценой игры , необходимо и достаточно выполнение следующих неравенств

m

aij xio (j = 1, n ) * i 1

Аналогично для игрока 2 : чтобы yо = ( y1o , ..., y oj , ..., yno ) была оптимальной

смешанной стратегией игрока 2 необходимо и достаточно выполнение следующих неравенств:

n

 

ij

j

 

 

 

 

 

 

j 1

a

 

y o (i =1, m )

* *

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из последнего свойства вытекает: чтобы установить, является ли предполагаемые (х, y) и решением матричной игры, достаточно проверить, удовлетворяют ли они неравенствам (*) и (**). С другой стороны, найдя неотрицательные решения неравенств (*) и (**) совместно со следующими ограничениями

m

 

i

 

 

n

 

j

 

 

 

 

x

1

,

 

y

1

i 1

 

j 1

 

* * *

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

получим решение матричной игры.

93

Таким образом, решение матричной игры сводится к нахождению неотрицательных параметров решений линейных неравенств (*) (**) и линейных уравнений (***).

4. Игры порядка 2 х 2.

В общем случае игра 2 2 определяется матрицей

a11

a12

 

A

 

 

a21

a22

Прежде всего, необходимо проверить, есть ли у данной игры седловая точка. Если да, то игра имеет решение в чистых стратегиях, причём оптимальными стратегиями игроков 1 и 2 соответственно будут чистая максиминная и чистая минимаксная стратегии.

Если игра с матрицей выигрышей А не имеет чистых стратегий, то оба игрока имеют только такие оптимальные стратегии, которые используют все свои чистые стратегии с положительными вероятностями. В противном случае один из игроков (например 1) имеет чистую оптимальную стратегию, а другой – только смешанные. Не ограничивая общности, можно считать, что оптимальной стратегией игрока 1 является выбор с вероятностью 1 первой строки. Далее, по свойству 1 следует, что а11 = а12 = и матрица имеет вид

 

 

 

.

a21

a22

Легко видеть, что для матриц такого вида одна из стратегий игрока 2 является доминируемой. Следовательно, по свойству 4 этот игрок имеет чистую стратегию, что противоречит предположению.

Пусть Х = (, 1 ) – оптимальная стратегия игрока 1. Так как игрок 2 имеет смешанную оптимальную стратегию, из свойства 1 получим, что (см. также свойство 7)

a11 a21 (1 ) ,a12 a22 (1 ) .

Отсюда следует, что при 0 столбцы матрицыА не могут быть пропорциональны с коэффициентом пропорциональности, отличным от единицы. Если же коэффициент пропорциональности равен единице, то матрица А принимает вид

a11

a11

 

 

 

 

a12

a12

и игрок 1 имеет чистую оптимальную стратегию (он выбирает с вероятностью 1 ту из строк, элементы которой не меньше соответствующих элементов другой), что противоречит предположению. Следовательно, если0 и игроки имеют только смешанные оптимальные стратегии, то опре-

94

делитель матрицыА отличен от нуля. Из этого следует, что последняя система уравнений имеет единственное решение. Решая её, находим

 

 

a22

a21

 

;

a11 a12 a21 a22

 

a11 a22

a12

a21

 

.

a11 a12

a21 a22

Аналогичные рассуждения приводят нас к тому, что оптимальная стратегия игрока 2 Y = ( , 1 - ) удовлетворяет системе уравнений

a11 a12 (1 )a21 a22 (1 )

откуда

a22 a12 . a11 a12 a21 a22

5. Графический метод решения игр 2 х n и m х 2.

Поясним метод на примерах.

Пример 1.

Рассмотрим игру, заданную платёжной матрицей.

 

 

 

 

 

2

 

 

 

1

B1

B2

B3

 

 

 

 

 

 

1

A

 

 

2

3

11

 

 

 

 

 

 

A 2

7

5

2

На плоскости хОy введём систему координат и на оси Ох отложим отрезок единичной длины А1, А2, каждой точке которого поставим в соответствие некоторую смешанную стратегию игрока 1 (х, 1 х). В частности, точке А1 (0;0) отвечает стратегия А1, точке А2 (1;0) – стратегия А2 и т.д.

95

В точках А1 и А2 восстановим перпендикуляры и на полученных прямых будем откладывать выигрыш игроков. На первом перпендикуляре (в данном случае он совпадает с осью 0y) отложим выигрыш игрока 1 при стратегии А1,а на втором – при стратегии А2. Если игрок 1 применит стратегию А1,то выиграет при стратегии В1 игрока 2 – 2, при стратегии В2– 3, а при стратегии В3– 11. Числам 2,3,11 на оси соответствуют точки В12 и В3.

Если же игрок 1 применит стратегию А2,то его выигрыш при стратегии В1 равен 7,при В2– 5,а при В3– 2.Эти числа определяют точки В 12 3 на перпендикуляре, восстановленном в точке А2.Соединяя между собой точки В1 и В 12 и В 23 и В 3 получим три прямые, расстояние до которых от оси определяет средний выигрыш при любом сочетании соответствующих стратегий. Например, расстояние от любой точки отрезка В1В 1 до оси определяет средний выигрыш 1 при любом сочетании стратегий А1 А2 (с частотами х и 1–х) и стратегией В1 игрока 2. Это расстояние равно

2х1 + 6(1 х2) = 1

Таким образом, ординаты точек, принадлежащих ломанной В13 определяют минимальный выигрыш игрока 1 при применении им любых смешанных стратегий. Эта минимальная величина является максимальной в точке ; следовательно этой точке соответствует оптимальная стратегия Х* =(х,1х),а её ордината равна цене игры . Координаты точки находим как точку пересечения прямых В2B2 и В3B3.

Соответствующие два уравнения имеют вид

3x 5(1 x)

x

3

 

,

49

.

 

 

 

 

 

 

 

 

 

 

 

11x 2(1

x)

 

11

 

11

 

Следовательно Х = ( 113 ; 119 ), при цене игры = 4911 . Таким образом мы мо-

жем найти оптимальную стратегию при помощи матрицы

 

 

 

 

3

11

 

 

5

2

Оптимальные стратегии для игрока 2 можно найти из системы

3y 5(1 y)

y

9

 

 

 

 

 

 

 

5y 2(1

y)

 

11

и, следовательно, Y = (0; 119 ; 112 ). (Из рисунка видно, что стратегия B1 не войдёт в оптимальную стратегию.

Пример 2. Найти решение игры, заданной матрицей

96

 

 

 

 

2

 

 

B1

B2

 

A1

 

6

5

 

 

 

 

 

1

A2

 

4

6

A

 

2

7

 

3

 

 

 

 

A4

1

8

Решение. Матрица имеет размерность 2 х 4. Строим прямые, соответствующие стратегиям игрока 1. Решение игры таково

= ( 83 ; 85 ); Х = ( 78 ; 0; 0; 81 ); = 438 .

97

Давидюк Е.С.

Решение задач по теме «Биматричные игры»

1. Решение в чистых стратегиях.

Опр. Биматричная игра – это конечная бескоалиционная игра двух игроков. Каждый игрок делает один ход. Выигрыши игроков задаются двумя матрицамиAи B.

Пусть у игрока 1 имеется m стратегий, i =1, m , у игрока 2 имеется n стратегий, j =1, n . Выигрыши игроков 1 и 2 соответственно задаются матрицами

a11

a1n

b11

b1n

 

 

 

 

A

 

; B

 

 

 

 

 

am1

amn

bm1

bmn

Опр. Ситуация (i°, j°) биматричной игры называется ситуацией равновесия по Нэшу, если

aijo

aio jo ;

(1)

bio j

bio jo

(2)

Другими словами, это такая ситуация, отклонение от которой для каждого игрока в отдельности не выгодно.

Свойства равновесия по Нэшу.

1.Равновесие по Нэшу может не существовать.

2.Равновесие по Нэшу не единственно

3.Равновесие по Нэшу может быть неэффективным

Опр.Ситуация (i°, j°) называется оптимальной по Парето, если не существует такой ситуации (i, j), что выполнены неравенства

aij aio jo , и при этом хотя бы одно из них – строгое.

bij bio jo

В примере 4 ситуация равновесия не является оптимальной по Парето.

2. Решение в смешанных стратегиях.

Опр. Смешанная стратегия игрока 1 – полный набор вероятностейx = (x1,

..., xm) применения 1 игроком своих чистых стратегий

Смешанная стратегия игрока 2 – полный набор вероятностейу = (y1, ..., yn) применения 2 игроком своих чистых стратегий Средние выигрыши игроков 1 и 2 соответственно равны

 

m

n

 

 

T

E( A, x, y) = a ij xi

y j

= xAy

 

 

 

 

 

 

 

 

 

 

 

i 1

j 1

 

 

(*)

 

m

n

 

 

E(B, x, y) = bij xi

y j

= xBy T

 

 

 

 

i 1

j 1

 

 

 

 

 

 

 

 

 

 

 

98

Ситуация равновесия в смешанных стратегиях для биматричной игры составляет пару (x,y) таких смешанных стратегий игроков 1 и 2, которые удовлетворяют неравенствам:

 

n

 

 

 

m

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a ij y j

 

a ij xi

y j

(i = 1, m)

(1)

 

j 1

 

 

i 1

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

m

n

 

 

 

 

 

 

 

 

 

 

 

 

 

bij xi

 

bij xi

 

 

 

 

 

 

 

 

 

 

y j

 

(j = 1, n)

(2)

 

 

 

 

i 1

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ay T

xAy T

( E

1

( A, x, y))

(1' )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

( E2 ( B, x, y))

 

 

 

 

 

 

xBy

(2' )

 

 

xB

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для определения ситуаций равновесия необходимо решить систему неравенств (1) и (2)( (1' ) и (2' ) ) относительно неизвестных x = (x1, ..., xmу = (y1,

..., yn) при условиях

m

n

 

 

 

 

 

xi

1 , y j

1,xi 0(i =

 

),yj 0(j=

 

).

1, m

1, n

i 1

j 1

 

 

 

 

 

Теорема (Нэша). Каждая биматричная игра имеет по крайней мере одну ситуацию равновесия в смешанных стратегиях.■

Пример 2.1.

Рассмотрим случай, когда каждый игрок имеет две чистые стратегии. В этом случае матрицы A и B равны:

a11

a12

 

b11

b12

 

 

 

 

A=

,B =

.

 

 

 

 

 

 

 

b21

b22

 

 

 

 

a21

a22

 

 

 

 

 

Смешанные стратегии для игроков 1 и 2 имеют вид:

(x, 1–x),(y, 1–y)0 x 1;0 y 1,

 

 

 

а средние выигрыши равны:

 

 

 

 

E1(A,x,y) = xA y T

 

a11

a12

y

= (x; 1x)

 

 

=

 

 

 

 

a21

a22 1 y

xa11 (1 x)a21

 

 

 

y

 

 

 

xa12 (1 x)a22

y

(xa11 (1 x)a21 ) y (xa12 (1 x)a22 )(1 y)

 

 

 

 

1

 

 

 

= (a11 – a12 – a21 + a22) xy + (a12 a22) x + (a21 a22) y + a22.

E2(B,x,y) = xB y T

 

b11

b12

 

 

y

= (x; 1x)

 

 

 

=

 

 

 

 

b21

b22

1

y

= (b11 b12 b21 + b22) xy + (b12 b22) x + (b21 b22) y + b22.

Условия (1' )

и (2' ) будут выглядеть

a11

a12

 

y

 

 

 

 

E1(A,x,y),

a21

a22 1

y

 

 

b11

 

b12

 

E2(B,x,y),

(x; 1x)

 

b22

 

 

b21

 

 

 

99

или

a11 y a12 (1 y)

E1 (A, x, y)

(3)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a21 y a22 (1 y)

E1 (A, x, y)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b11 x b21 (1 x)

E2 (B, x, y)

(4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b12 x b22 (1 x)

E2 (B, x, y)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Преобразовав (3), получим

 

 

 

 

 

 

 

(a11 a12 a21 + a

22 ) (1x) y +

 

( a

12

a

22 )

 

(1x) 0

 

 

 

 

 

 

 

:=a1

 

 

 

 

 

 

 

:=

a2

 

(a11 a12 a21 + a22) xy + (a12 a22) x 0

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

a1 (1 x) y a2 (1 x) 0

 

 

 

 

 

 

 

(5)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(6)

a1 xy a2 x 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т. о., множество всех приемлемых стратегий для игрока 1 удовлетворяет условиям (5) и (6),0 x 1;0 y 1. Чтобы найти x рассмотрим 3 случая: 1.Если x = 0, то (6) справедливо y, а (5) имеет вид:

a1y a2 0. (7)

2.Если x = 1, то (5) справедливо y, а (6) имеет вид: a1y a2 0. (8)

3.Если 0 <x< 1, то (5) разделим на (1 x), а (6) – наxи получим

a1 y a2

0,

a1 y a2

0 (9)

 

 

 

a1 y a2

 

0

 

 

 

 

 

 

 

 

 

Итак, множество K решений системы (5) – (6) состоит из всех ситуаций вида (0; y), еслиa1y a2 0;0 y 1;

всех ситуаций вида (x; y), еслиa1y a2 = 0;0 <x< 1;

всех ситуаций вида (1; y), еслиa1y a2 0;0 y 1.

Еслиa1 = a2 = 0, то решением являетсяx[0; 1],y [0; 1],т. к. все неравенства(7) – (8) выполняются при всехx и y,т. е. множество приемлемых для игрока 1 ситуаций покрывает весь единичный квадрат.

Еслиa1 = 0,a2 0,то выполняется либо (7), либо (8), и поэтому решением является либоx = 0, либо x=1при0 y 1 (приемлемой стратегии в игре не существует).

Еслиa1> 0,то из (7) получаем решение

x= 0;y a2 := ,

a1

Из (8) следует ещё решениеx = 1,y ,из (9) следует ещё решение

0 <x< 1,y = .

Если a1< 0, то решение следующее: x = 0,y;

x = 1,y;

100

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]