Дискретная математика & математическая логика
..pdfИгра «Три пальца»
Два игрока К и С одновременно и не сговариваясь показывают один, два или три пальца.
Если всего показанных пальцев (у К и С) будет чётное число, то выигрывает К – он получает столько очков, сколько показанных пальцев. Если всего показанных пальцев (у К и С) будет нечётное число, то выигрывает С.
Запишем игру в нормальной форме:
|
|
|
С1 |
С2 |
С3 |
|
|
К1 |
2 |
–3 |
4 |
|
|
|
К2 |
|
–3 |
4 |
–5 |
|
|
К3 |
|
4 |
–5 |
6 |
|
Как получить наибольшую выгоду в наихудших условиях? Определим максимум столбцов и минимум строк для платёжной матрицы игры «Три пальца»:
|
|
С1 |
С2 |
С3 |
Минимум строк |
|
К1 |
2 |
–3 |
4 |
–3 |
|
К2 |
–3 |
4 |
–5 |
–5 |
|
К3 |
4 |
–5 |
6 |
–5 |
|
Максимум |
4 |
4 |
6 |
|
|
столбцов |
|
|
|
|
Нижняя цена игры– максимин α – максимальный элемент среди минимумов строк. Верхняя цена игры– минимакс β – минимальный элемент среди максимумов столбцов. Это принцип минимакса, и он является в теории игр основным, т.е. нужно вести себя так, чтобы получить наибольшую выгоду в наихудших условиях. Значит, для К целесообразно показыватьодин палец, адляС– либоодин, либодва.
Найденные нами стратегии все же неустойчивы. Пусть К показывает один палец (К1), а С – тоже один (С1). К всегда выигрывает 2 очка. Тогда С переходит на С2 и будет выигрывать 3 очка. Тогда сообразительный К переходит на К2. А С в ответ – на С3 и т.д. Равновесие нарушается.
211
Седловая точка. Чистая цена игры
Рассмотрим другой пример:
|
С1 |
С2 |
С3 |
С4 |
min |
К1 |
10 |
1 |
2 |
1 |
1 |
К2 |
6 |
8 |
5 |
6 |
5 |
К3 |
2 |
4 |
4 |
8 |
2 |
max |
10 |
8 |
5 |
8 |
|
Здесь α = 5 и β = 5. Особый случай! Пара стратегий К2, С3 устойчива и представляет собой решение игры. Никому не выгодно отступать от своих стратегий. Это связано с тем, что в матрице есть элемент, являющийся одновременно и минимаксом и максимином. Такой элемент называется седловой точкой. Сама седловая точка – цена игры.
Если матрица игры имеет седловую точку (седловые точки), то игра имеет решение в так называемых чистых стратегиях. Это пара стратегий, пересекающихся в седловой точке.
Аесли α ≠ β? Решение есть и в этом случае, только оно лежит
вобласти смешанных стратегий, т.е. задача решается путём чередования стратегий с какими-то вероятностями.
Систематическое применение этих стратегий, называемых оптимальными, обеспечивает каждой стороне максимально возможный для неё выигрыш, определяемый ценой игры. Если же одна из сторон отказывается от своей оптимальной стратегии (в то время как другая продолжает придерживаться своей), то это ни в коем случае не может быть выгодно: выигрыш либо будет неизменным, либо уменьшится.
Таким образом, каждая конечная игра имеет решение (возможно, в области смешанных стратегий). Это утверждает основная теорема теории игр.
212
Игра «Осада и оборона города»
«Красные» стремятся занять город, «синие» обороняют. У «красных» дваотряда, у«синих» – три.
Если встречаются равные силы «красных» и «синих», то в 50 % случаях «красные» побеждают и занимают город, а в 50 % случаев отступают.
Если «красные» встречаются с превосходящими силами «синих» (один отряд на два или два с тремя), они отступают. Как должны действовать «красные»?
Стратегии «красных» (дискретные):
–К1 – послать оба отряда по дороге 1,
–К2 – послать оба отряда по дороге 2,
–К3 – послать по одному отряду на каждую дорогу. Стратегии «синих» (дискретные):
–С1 – поставить все три отряда на дорогу 1,
–С2 – поставить все три отряда на дорогу 2,
–С3 – поставить два отряда на дорогу 1 и один на дорогу 2,
–С4 – поставить два отряда на дорогу 2 и один на дорогу 1. Нет «одноотрядных» стратегий:
|
|
|
|
С1 |
|
|
|
С2 |
|
|
|
С3 |
|
|
С4 |
|
|
К1 |
0 % |
|
100 % |
|
50 % |
|
100 % |
|
|||||||
|
К2 |
|
100 % |
|
0 % |
|
100 % |
|
50 % |
|
||||||
|
К3 |
|
100 % |
|
100 % |
|
50 % |
|
50 % |
|
Выигрыш – процент случаев, когда «красным» удается занять город.
Максимум столбцов и минимум строк для платёжной матрицы игры «Осада и оборона города»:
|
|
|
С1 |
С2 |
С3 |
|
С4 |
|
min |
|
|
К1 |
0 % |
100 % |
50 % |
100 % |
0 % |
|
|||
|
К2 |
|
100 % |
0 % |
100 % |
50 % |
0 % |
|
||
|
К3 |
|
100 % |
100 % |
50 % |
50 % |
|
50 % |
|
|
|
max |
100 % |
100 % |
100 % |
|
100 % |
|
|
|
213
Таким образом, нижняя чистая цена игры α = 50 %, верхняя
чистая цена игры β = 100 %. |
|
|
|
|
|
|
|
||||||
|
|
Тогда цена игры при смешанных стратегиях α ≤ ν≤ |
|
β. |
|||||||||
|
|
Будем указывать не проценты, а числовое значение выигры- |
|||||||||||
ша – 1 либо 0,5: |
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С1 |
С2 |
С3 |
С4 |
|
min |
|
||
|
|
К1 |
|
0 |
1 |
0,5 |
1 |
0 |
|
|
|||
|
|
К2 |
|
|
1 |
0 |
1 |
0,5 |
|
0 |
|
|
|
|
|
К3 |
|
|
1 |
1 |
0,5 |
0,5 |
|
|
0,5 |
|
|
|
|
max |
|
1 |
1 |
1 |
1 |
|
|
|
|
|
Составим систему уравнений для неизвестных значений оптимальной стратегии «красных»:
0 ξ1 + 1 ξ2 + 1 ξ3 ≥ ν, |
|
||||||||
1 ξ1 + 0 ξ2 + 1 ξ3 ≥ ν, |
|
||||||||
|
|
|
|
|
|
|
|
|
|
0,5 ξ1 + 1 ξ2 + 0,5 ξ3 ≥ |
ν, |
||||||||
|
1 ξ1 + 0,5 ξ2 +0,5 ξ3 ≥ |
ν, |
|||||||
|
ξi |
≥ |
0, |
|
|
|
|
||
|
ξ |
|
+ |
ξ |
|
+ ξ |
|
= 1. |
|
|
1 |
2 |
3 |
|
|||||
|
|
|
|
|
|
|
Разделим левые и правые части неравенств на значение правой части:
0 |
ξ1 |
+ 1 |
|
ξ2 |
|
|
+ 1 |
|
ν3 |
|
≥ 1, |
|
||||||||||||||||
ν |
|
ν |
|
|
|
ν |
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
1 |
|
ξ1 |
+ 0 |
|
ξ2 |
|
|
+ 1 |
|
ξ3 |
≥ 1, |
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
ν |
|
|
ν |
|
|
|
ν |
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
0,5 |
|
ξ1 |
+ |
1 |
|
ξ2 |
+ 0,5 |
|
ξ3 |
≥ |
1, |
|||||||||||||||||
ν |
ν |
|
|
ν |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
ξ1 |
|
|
|
|
|
|
|
|
ξ2 |
|
|
|
|
|
|
|
ξ3 |
|
|
|||||
1 |
|
|
+ |
0,5 |
|
|
+ 0,5 |
|
≥ |
1, |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
ν |
|
|
|
|
|
|
|
ν |
|
|
|
|
|
|
|
|
ν |
|
|
||||
ξ1 + ξ2 + ξ3 |
= |
1 |
|
. |
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
ν |
|
|
|
|
ν |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
214
Обозначим |
ξi |
|
= pi |
|
и |
введём переменную z для перехода |
ν |
|
|||||
|
|
|
|
|
||
к следующим равенствам: |
|
|
|
|||
|
0 p1 +1 p2 +1 p3 − z1 = 1, |
|||||
|
|
p1 + 0 p2 +1 p3 − z2 = 1, |
||||
|
1 |
|||||
|
|
|
+1 p2 + 0,5 p3 − z3 = 1, |
|||
|
0,5 p1 |
|||||
|
|
p1 + 0,5 p 2 +0,5 p3 − z4 = 1, |
||||
|
1 |
|||||
|
p + p |
2 |
+ p → min. |
|||
|
|
1 |
|
3 |
Мы стремимся максимизировать выигрыш ν:
p1 + p2 + p3 = 1ν.
Получили задачу линейного программирования. При полезных стратегиях «синих» получаем zi = 0. Тогда из первого уравнения
p2 =1 − p3 .
Из второго:
p1 =1 − p3
Из третьего находим
1 (1 − p3 ) +1 (1 − p3 ) + 1 p3 = 1, |
|
2 |
2 |
отсюда
p3 = 1 = p1 = p2 , 2
тогда
215
ν = |
|
1 |
= |
2 |
, |
|
+ p2 + p3 |
|
|||
|
p1 |
3 |
|
следовательно:
|
ξ1 |
= ν p1 = |
2 |
|
|
|
1 |
|
= |
1 |
, |
|||||
|
|
|
|
|
|
|
|
|
|
|||||||
3 |
|
2 |
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
3 |
|
|
||||||
|
|
= ν p2 = |
2 |
|
|
1 |
= |
1 |
|
|
||||||
ξ2 |
|
|
|
|
|
|
|
|
|
, |
||||||
3 |
2 |
|
||||||||||||||
|
|
|
|
|
|
3 |
|
|||||||||
|
ξ3 |
= ν p3 = |
2 |
|
|
1 |
= |
1 |
|
. |
||||||
|
|
|
|
|
|
|
|
|
|
|||||||
3 |
|
2 |
3 |
|||||||||||||
|
|
|
|
|
|
|
Таким образом, оптимальная смешанная стратегия «красных» имеет вид
|
|
|
|
|
|
|
|
|
|
|
|
|
|
К1 |
|
К2 |
|
К3 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
, |
|
1 |
|
|
1 |
|
|
1 |
|
||||
|
|
|
|
|
||||||||
|
3 |
|
3 |
|
3 |
|
|
т.е. «красные» должны одинаково часто применять каждую из своих стратегий.
Составим теперь систему уравнений для неизвестных значений оптимальной стратегии «синих»:
|
η1 |
+ 1 η2 |
+ 0,5 η3 + 1 η4 |
= |
2 |
|
= ν, |
||||
0 |
|
|
|
||||||||
3 |
|
||||||||||
|
|
|
|
|
|
|
|
|
|||
|
η1 |
+ 0 η2 |
+ 1 η3 + 0,5 η4 |
= |
2 |
|
|
|
|||
1 |
|
|
|
, |
|
||||||
3 |
|||||||||||
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
2 |
|
|
1 η1 |
+ 1 η2 |
+ 0,5 η3 + 0,5 η4 |
= |
, |
|||||||
|
|||||||||||
|
|
|
|
|
|
|
|
3 |
|
||
|
η1 + η2 + η3 + η4 = 1. |
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
216
Разрешено за один шаг перемещать один верхний груз. Целевое состояние:
В качестве эвристической функции |
ˆ |
h(v) используем количество |
кубиков, расположенных не на своём месте, и общее число кубиков, препятствующих установлению каждого из них на своё место. Препятствующими считаются кубики, расположенные сверху какого-либо кубика, который нужно переставить, и кубики, занимающие чужие места в целевой конфигурации, т.е. места, в которые должны быть установленыкубики, расположенные нена своём месте.
Рассмотрим все варианты первого шага: поставим первый кубик над третьим:
Это мы получим вершину № 1. Определим эвристическую функцию для этой вершины. Не на своём месте расположены кубики 3 и 2 (2). Места, которые они должны занять, заняты другими
219