Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Дискретная математика & математическая логика

..pdf
Скачиваний:
48
Добавлен:
15.11.2022
Размер:
19.42 Mб
Скачать

Игра «Три пальца»

Два игрока К и С одновременно и не сговариваясь показывают один, два или три пальца.

Если всего показанных пальцев (у К и С) будет чётное число, то выигрывает К – он получает столько очков, сколько показанных пальцев. Если всего показанных пальцев (у К и С) будет нечётное число, то выигрывает С.

Запишем игру в нормальной форме:

 

 

 

С1

С2

С3

 

 

К1

2

–3

4

 

 

К2

 

–3

4

–5

 

К3

 

4

–5

6

 

Как получить наибольшую выгоду в наихудших условиях? Определим максимум столбцов и минимум строк для платёжной матрицы игры «Три пальца»:

 

 

С1

С2

С3

Минимум строк

 

К1

2

–3

4

–3

 

К2

–3

4

–5

–5

 

К3

4

–5

6

–5

 

Максимум

4

4

6

 

 

столбцов

 

 

 

 

Нижняя цена игры– максимин α – максимальный элемент среди минимумов строк. Верхняя цена игры– минимакс β – минимальный элемент среди максимумов столбцов. Это принцип минимакса, и он является в теории игр основным, т.е. нужно вести себя так, чтобы получить наибольшую выгоду в наихудших условиях. Значит, для К целесообразно показыватьодин палец, адляС– либоодин, либодва.

Найденные нами стратегии все же неустойчивы. Пусть К показывает один палец (К1), а С – тоже один (С1). К всегда выигрывает 2 очка. Тогда С переходит на С2 и будет выигрывать 3 очка. Тогда сообразительный К переходит на К2. А С в ответ – на С3 и т.д. Равновесие нарушается.

211

Седловая точка. Чистая цена игры

Рассмотрим другой пример:

 

С1

С2

С3

С4

min

К1

10

1

2

1

1

К2

6

8

5

6

5

К3

2

4

4

8

2

max

10

8

5

8

 

Здесь α = 5 и β = 5. Особый случай! Пара стратегий К2, С3 устойчива и представляет собой решение игры. Никому не выгодно отступать от своих стратегий. Это связано с тем, что в матрице есть элемент, являющийся одновременно и минимаксом и максимином. Такой элемент называется седловой точкой. Сама седловая точка – цена игры.

Если матрица игры имеет седловую точку (седловые точки), то игра имеет решение в так называемых чистых стратегиях. Это пара стратегий, пересекающихся в седловой точке.

Аесли α ≠ β? Решение есть и в этом случае, только оно лежит

вобласти смешанных стратегий, т.е. задача решается путём чередования стратегий с какими-то вероятностями.

Систематическое применение этих стратегий, называемых оптимальными, обеспечивает каждой стороне максимально возможный для неё выигрыш, определяемый ценой игры. Если же одна из сторон отказывается от своей оптимальной стратегии (в то время как другая продолжает придерживаться своей), то это ни в коем случае не может быть выгодно: выигрыш либо будет неизменным, либо уменьшится.

Таким образом, каждая конечная игра имеет решение (возможно, в области смешанных стратегий). Это утверждает основная теорема теории игр.

212

Игра «Осада и оборона города»

«Красные» стремятся занять город, «синие» обороняют. У «красных» дваотряда, у«синих» – три.

Если встречаются равные силы «красных» и «синих», то в 50 % случаях «красные» побеждают и занимают город, а в 50 % случаев отступают.

Если «красные» встречаются с превосходящими силами «синих» (один отряд на два или два с тремя), они отступают. Как должны действовать «красные»?

Стратегии «красных» (дискретные):

К1 – послать оба отряда по дороге 1,

К2 – послать оба отряда по дороге 2,

К3 – послать по одному отряду на каждую дорогу. Стратегии «синих» (дискретные):

С1 – поставить все три отряда на дорогу 1,

С2 – поставить все три отряда на дорогу 2,

С3 – поставить два отряда на дорогу 1 и один на дорогу 2,

С4 – поставить два отряда на дорогу 2 и один на дорогу 1. Нет «одноотрядных» стратегий:

 

 

 

 

С1

 

 

 

С2

 

 

 

С3

 

 

С4

 

 

К1

0 %

 

100 %

 

50 %

 

100 %

 

 

К2

 

100 %

 

0 %

 

100 %

 

50 %

 

 

К3

 

100 %

 

100 %

 

50 %

 

50 %

 

Выигрыш – процент случаев, когда «красным» удается занять город.

Максимум столбцов и минимум строк для платёжной матрицы игры «Осада и оборона города»:

 

 

 

С1

С2

С3

 

С4

 

min

 

К1

0 %

100 %

50 %

100 %

0 %

 

 

К2

 

100 %

0 %

100 %

50 %

0 %

 

 

К3

 

100 %

100 %

50 %

50 %

 

50 %

 

 

max

100 %

100 %

100 %

 

100 %

 

 

 

213

Таким образом, нижняя чистая цена игры α = 50 %, верхняя

чистая цена игры β = 100 %.

 

 

 

 

 

 

 

 

 

Тогда цена игры при смешанных стратегиях α ≤ ν≤

 

β.

 

 

Будем указывать не проценты, а числовое значение выигры-

ша – 1 либо 0,5:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

С1

С2

С3

С4

 

min

 

 

 

К1

 

0

1

0,5

1

0

 

 

 

 

К2

 

 

1

0

1

0,5

 

0

 

 

 

 

К3

 

 

1

1

0,5

0,5

 

 

0,5

 

 

 

 

max

 

1

1

1

1

 

 

 

 

 

Составим систему уравнений для неизвестных значений оптимальной стратегии «красных»:

0 ξ1 + 1 ξ2 + 1 ξ3 ≥ ν,

 

1 ξ1 + 0 ξ2 + 1 ξ3 ≥ ν,

 

 

 

 

 

 

 

 

 

 

 

0,5 ξ1 + 1 ξ2 + 0,5 ξ3

ν,

 

1 ξ1 + 0,5 ξ2 +0,5 ξ3

ν,

 

ξi

0,

 

 

 

 

 

ξ

 

+

ξ

 

+ ξ

 

= 1.

 

 

1

2

3

 

 

 

 

 

 

 

 

Разделим левые и правые части неравенств на значение правой части:

0

ξ1

+ 1

 

ξ2

 

 

+ 1

 

ν3

 

≥ 1,

 

ν

 

ν

 

 

 

ν

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

ξ1

+ 0

 

ξ2

 

 

+ 1

 

ξ3

≥ 1,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ν

 

 

ν

 

 

 

ν

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,5

 

ξ1

+

1

 

ξ2

+ 0,5

 

ξ3

1,

ν

ν

 

 

ν

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ξ1

 

 

 

 

 

 

 

 

ξ2

 

 

 

 

 

 

 

ξ3

 

 

1

 

 

+

0,5

 

 

+ 0,5

 

1,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ν

 

 

 

 

 

 

 

ν

 

 

 

 

 

 

 

 

ν

 

 

ξ1 + ξ2 + ξ3

=

1

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ν

 

 

 

 

ν

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

214

Обозначим

ξi

 

= pi

 

и

введём переменную z для перехода

ν

 

 

 

 

 

 

к следующим равенствам:

 

 

 

 

0 p1 +1 p2 +1 p3 z1 = 1,

 

 

p1 + 0 p2 +1 p3 z2 = 1,

 

1

 

 

 

+1 p2 + 0,5 p3 z3 = 1,

 

0,5 p1

 

 

p1 + 0,5 p 2 +0,5 p3 z4 = 1,

 

1

 

p + p

2

+ p min.

 

 

1

 

3

Мы стремимся максимизировать выигрыш ν:

p1 + p2 + p3 = 1ν.

Получили задачу линейного программирования. При полезных стратегиях «синих» получаем zi = 0. Тогда из первого уравнения

p2 =1 p3 .

Из второго:

p1 =1 p3

Из третьего находим

1 (1 p3 ) +1 (1 p3 ) + 1 p3 = 1,

2

2

отсюда

p3 = 1 = p1 = p2 , 2

тогда

215

ν =

 

1

=

2

,

 

+ p2 + p3

 

 

p1

3

 

следовательно:

 

ξ1

= ν p1 =

2

 

 

 

1

 

=

1

,

 

 

 

 

 

 

 

 

 

 

3

 

2

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

= ν p2 =

2

 

 

1

=

1

 

 

ξ2

 

 

 

 

 

 

 

 

 

,

3

2

 

 

 

 

 

 

 

3

 

 

ξ3

= ν p3 =

2

 

 

1

=

1

 

.

 

 

 

 

 

 

 

 

 

 

3

 

2

3

 

 

 

 

 

 

 

Таким образом, оптимальная смешанная стратегия «красных» имеет вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

К1

 

К2

 

К3

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

1

 

 

1

 

 

1

 

 

 

 

 

 

 

3

 

3

 

3

 

 

т.е. «красные» должны одинаково часто применять каждую из своих стратегий.

Составим теперь систему уравнений для неизвестных значений оптимальной стратегии «синих»:

 

η1

+ 1 η2

+ 0,5 η3 + 1 η4

=

2

 

= ν,

0

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

η1

+ 0 η2

+ 1 η3 + 0,5 η4

=

2

 

 

 

1

 

 

 

,

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

1 η1

+ 1 η2

+ 0,5 η3 + 0,5 η4

=

,

 

 

 

 

 

 

 

 

 

3

 

 

η1 + η2 + η3 + η4 = 1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

216

Решение имеет вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

С1

 

С2

 

С3

 

С4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

1

 

 

1

 

 

1

 

 

1

 

 

 

 

 

 

 

 

6

 

6

 

3

 

3

 

 

т.е. «синие» в одной трети случаев посылают все три отряда на одну дорогу (любую), а в остальных – две на одну, а один – на другую.

Однако все эти рассуждения ориентированы на многократное проведение «экспериментов» – сражений. Реальный бой реализуется один раз, и кто выиграет – определяется не теорией игр, а военным искусством… На то оно и искусство!

217

8. АЛГОРИТМЫ УПОРЯДОЧЕННОГО ПЕРЕБОРА

Для большинства практических задач удаётся сформулировать правила, позволяющие уменьшить перебор вариантов. Полученные таким образом алгоритмы называют эвристическими. Они используют опыт, интуицию и здравый смысл [14].

Пусть g(v) – стоимость кратчайшего (оптимального) пути из

любой начальной вершины в некоторую вершину v. Стоимость кратчайшего путиизвершиныv доближайшей целевойобозначимh(v).

Функция f (v) = g(v) + h(v) – стоимость кратчайшего пути из начальной вершины в целевую при условии, что этот путь проходит

через v.

ˆ

 

Введём оценочные функции

 

h(v) – оценка стоимости кратчай-

шего пути из начальной вершины в вершину v,

g(v) – оценка стоимо-

 

 

ˆ

сти кратчайшего путиизвершиныv вцелевуювершину. Тогда

ˆ

ˆ

 

f (1) = gˆ

(1) + h(1)

 

будет оценкой стоимости кратчайшего пути из начальной вершины

вцелевую, при условии, что этот путь проходит через v.

Вкачестве оценочной функции gˆ (v) выбираем действитель-

ную стоимость пути из начальной вершины в вершину v (например, число шагов). В ряде случаев значениеgˆ (v) может меняться в про-

цессе решения задачи, как это происходит, например, при разметке графа в задаче нахождения кратчайшего пути в графе с рёбрами неединичной длины [1, 2]. Но если задача представляется деревом, этого не происходит.

Определение ˆ опирается на любую эвристическую инфор h(v) -

мацию поэтому ˆ называют эвристической функцией

, h(v) .

Пример. Пусть необходимо переместить грузы 1, 2, 3, находящиеся на трёх площадках.

218

Разрешено за один шаг перемещать один верхний груз. Целевое состояние:

В качестве эвристической функции

ˆ

h(v) используем количество

кубиков, расположенных не на своём месте, и общее число кубиков, препятствующих установлению каждого из них на своё место. Препятствующими считаются кубики, расположенные сверху какого-либо кубика, который нужно переставить, и кубики, занимающие чужие места в целевой конфигурации, т.е. места, в которые должны быть установленыкубики, расположенные нена своём месте.

Рассмотрим все варианты первого шага: поставим первый кубик над третьим:

Это мы получим вершину № 1. Определим эвристическую функцию для этой вершины. Не на своём месте расположены кубики 3 и 2 (2). Места, которые они должны занять, заняты другими

219

двумя кубиками (2), и над кубиком № 2 – два кубика (2), а над кубиком 3 – один (1), над кубиком № 1 – нет кубиков (0):

Номер кубика

На своём месте?

1

Да

2

Нет

3

Нет

2

 

 

Место кубика

Занято?

1

Нет

2

Да

3

Да

2

 

 

Номер кубика

Сколько кубиков сверху?

1

0

2

2

3

1

3

 

Тогда

эвристическая

функция

для

первой вершины

ˆ

= 2 + 2

+ 2

+ 1 + 0 = 7, а оценочная функция

 

h(1)

 

 

ˆ

ˆ

ˆ

= 8, здесь

ˆ

– стоимость крат-

 

f (1)

= g(1) + h(1) = 1 + 7

g(1) = 1

чайшего пути из исходной вершины, шаг первый, вот она и равна 1,

ˆ

ˆ

ˆ

это оценочная функция для первого шага.

f (1)

= g(1)

+ h(1) –

Получимоценочнуюфункциюдлявтороговариантапервогошага:

Это мы получим вершину № 2. Определим эвристическую функцию для этой вершины. Не на своём месте расположены кубики 3, 2, 1 (3). Места, которые они должны занять, заняты другими

220

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]