1.4 Решите матричную игру методом Брауна-Робинсон и методом обратной матрицы.
Решение:
Пусть игра задана
матрицей A размерности m
x n. Каждое
разыгрывание игры в чистых стратегиях
будет далее называться партией. Метод
Брауна-Робинсон —
это итеративная процедура построения
последовательности пар смешанных
стратегий игроков, сходящейся к решению
матричной игры.
В 1-ой партии оба
игрока выбирают произвольную чистую
стратегию. Пусть сыграно k
партий, причем выбор стратегии в каждой
партии запоминается. В (k
+ 1)-ой партии каждый игрок выбирает ту
чистую стратегию, которая максимизирует
его ожидаемый выигрыш, если противник
играет в соответствии с эмпирическим
вероятностным распределением,
сформировавшимся за k
партий. Оценивается интервал для цены
игры и, если он достаточно мал, процесс
останавливается. Полученные при этом
вероятностные распределения определяют
смешанные стратегии игроков.
Пусть
на первом этапе выбрана стратегия
№1
Итерация №1. Минимальный
элемент для нее равен -1 и находится под
номером j=3. Следовательно,
игрок II выбирает стратегию
№3
Максимальный элемент равен 4 и
находится под номером j=3.
Следовательно, игрок I
выбирает стратегию №3
Итерация №2.
Минимальный элемент для нее равен 2 и
находится под номером j=2.
Следовательно, игрок II
выбирает стратегию №2
Максимальный
элемент равен 6 и находится под номером
j=3. Следовательно, игрок
I выбирает стратегию
№3
Остальное решение сведем в таблицу.
k
|
i
|
B1
|
B2
|
B3
|
j
|
A1
|
A2
|
A3
|
Vmin
|
Vmax
|
Vср
|
1
|
1
|
5
|
0
|
-1
|
3
|
-1
|
2
|
4
|
-1
|
4
|
3/2
|
2
|
3
|
6
|
2
|
3
|
2
|
-1
|
0
|
6
|
1
|
3
|
2
|
3
|
3
|
7
|
4
|
7
|
2
|
-1
|
-2
|
8
|
4/3
|
8/3
|
2
|
4
|
3
|
8
|
6
|
11
|
2
|
-1
|
-4
|
10
|
3/2
|
5/2
|
2
|
5
|
3
|
9
|
8
|
15
|
2
|
-1
|
-6
|
12
|
8/5
|
12/5
|
2
|
6
|
3
|
10
|
10
|
19
|
1
|
4
|
-5
|
13
|
5/3
|
13/6
|
23/12
|
7
|
3
|
11
|
12
|
23
|
1
|
9
|
-4
|
14
|
11/7
|
2
|
25/14
|
8
|
3
|
12
|
14
|
27
|
1
|
14
|
-3
|
15
|
3/2
|
15/8
|
27/16
|
9
|
3
|
13
|
16
|
31
|
1
|
19
|
-2
|
16
|
13/9
|
19/9
|
16/9
|
10
|
1
|
18
|
16
|
30
|
2
|
19
|
-4
|
18
|
8/5
|
19/10
|
7/4
|
здесь:
k
- номер партии.
i - номер
стратегии, выбираемой игроком A.
j
- номер стратегии, выбираемой игроком
В.
Bi -
накопленный игроком А выигрыш за k
партий, при условии, что в данной партии
B выбирает стратегию
Bi.
Аj -
накопленный игроком В проигрыш за k
партий, при условии, что в данной партии
A выбирает стратегию
Аj.
Vmin -
нижняя оценка игры = min
(накопленный выигрыш)/k.
Vmax -
верхняя оценка игры = max
(накопленный проигрыш)/k.
Доказано,
что:
W=(Vmin+Vmax)/2,
при k → ∞ и
pi =
Ni/k
qj =
Nj/k
Ni -
сколько раз выбирается Аi
стратегия.
Nj -
сколько раз выбирается Bj
стратегия.
NA1 =
2
P(A1)
= 2/10 = 1/5
NA2 =
0
P(A2)
= 0/10 = 0
NA3 =
8
P(A3)
= 8/10 = 4/5
NB1 =
4
Q(B1)
= 4/10 = 2/5
NB2 =
5
Q(B2)
= 5/10 = 1/2
NB3 =
1
Q(B3)
= 1/10 = 1/10
Цена
игры, W = 7/4
Стратегия
игрока I: p
= (1/5, 0, 4/5)
Стратегия
игрока II: q
= (2/5, 1/2, 1/10)
Метод обратной
матрицы
Главный определитель:
∆=5*((-2)*4 - 2*2) - 1*(0*4
- 2*(-1)) + 1*(0*2 - (-2)*(-1)) = -64
Найдём миноры и
алгебраическое дополнение:
M11=
= -12
A11 =
(-1)1+1
* M1= 1 * (-12) = -12
M12
= 2; A12 = -2
M13
= 4; A13 = 4
M21 = -2;
A21 = -2
M22 = 21;
A22 = 21
M23 = 10;
A23 = -10
M31 = -2;
A31 = -2
M32 = 11;
A32 = -11
M33 = -10;
A33 = -10
Выпишем союзную
матрицу (матрицу алгебраических
дополнений):
C*=
-12
|
-2
|
4
|
-2
|
21
|
-10
|
-2
|
-11
|
-10
|
Транспонированная
союзная матрица (поменяем местами строки
со столбцами):
C*T=
-12
|
-2
|
-2
|
-2
|
21
|
-10
|
4
|
-11
|
-10
|
Найдем
обратную матрицу: