close

Вход

Забыли?

вход по аккаунту

?

Имитация матричных игр как метод анализа практических стратегий принятия решений..pdf

код для вставкиСкачать
Библиографический список
ПУРТОВ Андрей Михайлович, кандидат технических наук, доцент (Россия), старший научный сотрудник лаборатории методов проблем преобразования информации.
Адрес для переписки: andr.purtov@yandex.ru
ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (117) 2013
1. Пуртов, А. М. Интеграция технологии ГИС и метода редукции графов для анализа транспортных сетей / А. М. Пуртов //
Омский научный вестник. – 2011. – № 1(97). – C. 164–168.
2. Юршевич, Е. А. Опыт использования пакета ANYLOGIC
для моделирования городского трафика / Е. А. Юршевич, Е. И.
Петрова // Имитационное моделирование. Теория и практика
(ИММОД-2005) : сб. докл. 2-й Всерос. конф. Т. 1. – СПб. : ЦТ
СС, 2005. – С. 298–305.
3. Долгушин, Д. Ю. Двухуровневое моделирование автотранспортных потоков на основе клеточных автоматов и
систем с очередями / Д. Ю. Долгушин, В. Н. Задорожный,
С. В. Кокорин // Имитационное моделирование. Теория и
практика (ИММОД-2011) : материалы 5-й Всерос. конф. Т. 1. –
СПб. : ЦТ СС, 2011. – С. 139–144.
4. Живоглядов, В. Г. Теория движения транспортных и пешеходных потоков / В. Г. Живоглядов. – Ростов н/Д. : Изд-во
журн. «Изв. вузов. Сев.- Кавк. регион», 2005. – 1082 с.
5. Яцкив, И. В. Использование возможностей имитационного моделирования для анализа транспортных узлов /
М. В. Яцкив, Е. А. Юршевич, Н. В. Колмакова // Имитационное
моделирование. Теория и практика (ИММОД-2005) : сб. докл.
2-й Всерос. конф. Т. 2. – СПб. : ЦТ СС, 2005. – С. 237–245.
6. PTV VISION [Электронный ресурс] / Программные продукты PTV Vision. – Режим доступа: http://www.ptv-vision.ru
(дата обращения: 02.08.2012).
Статья поступила в редакцию 15.08.2012 г.
© А. М. Пуртов
А. М. ПУРТОВ
О. Г. ЧАНЫШЕВ
УДК 681.3
Омский филиал
Института математики
СО РАН
ИМИТАЦИЯ МАТРИЧНЫХ ИГР
КАК МЕТОД АНАЛИЗА
ПРАКТИЧЕСКИХ СТРАТЕГИЙ
ПРИНЯТИЯ РЕШЕНИЙ
Приводятся результаты использования имитационных моделей для сравнительного
анализа практических стратегий принятия решений. Качество стратегий оценивается
с помощью матричных игр.
Ключевые слова: стратегия принятия решений, имитационное моделирование, матричные игры.
ной из главных целей информационного процесса
является получение объективных оценок различных ситуаций. Такие оценки можно считать текущим уровнем знаний. Изучение целенаправленного
движения и принятия решений в игровых ситуациях
дает знания в следующих направлениях:
— свойства эвристических (практических) процедур принятия решений;
— влияние свойств ЛПР (игроков), на возможность достижения собственных целей;
— влияние организации игрового процесса на
формирование объективных оценок ситуаций.
Многие игры можно рассматривать как модели
реальных ситуаций. Поэтому представляется целесообразным их использование для изучения свойств
процедур принятия решений, используемых в повседневной жизни.
Величина выигрыша является важным критерием качества игрока, алгоритма принятия решений.
С другой стороны, с точки зрения общества (множества игроков), большое значение имеет возмож-
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
Введение. Проблемы целенаправленного движения и принятия решений являются предметом
исследований в различных областях научно-практической деятельности: философия, психология, экономика, военное дело, техника, спорт, математика
и др. В каждой из областей решаются свои задачи,
используются специфические методы, алгоритмы,
критерии. Стратегии поведения в хорошо формализованных ситуациях разрабатываются математической теорией принятия решений. Большинство
реальных ситуаций трудно формализовать. В таких
случаях для принятия решений используются проверенные практикой относительно простые методы,
алгоритмы. Известные специалисты в области математической теории принятия решений Р.Л. Кини и
Г. Райффа в одной из своих последних работ [1] отмечают, что методам принятия решений в реальных
ситуациях уделяется незаслуженно мало внимания.
На качество принимаемых решений большое
влияние оказывает уровень информированности
лица, принимающего решение (ЛПР). Поэтому од-
229
ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (117) 2013
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
230
ность получения объективных оценок множества
ситуаций в результате многочисленных реализаций
процессов принятия решений.
Хорошими моделями для анализа процедур принятия решений и процессов формирования оценок
ситуаций являются матричные В матричных играх
можно аналитически найти цену игры (абсолютную оценку ситуации) и оптимальные стратегии
для игроков. Этим они удобны для сравнительного
анализа различных стратегий, алгоритмов принятия
решений. Эффективным методом анализа игровых
ситуаций является имитационное моделирование,
позволяющее практически на любом уровне детализации представить исследуемый процесс.
Целью работы был сравнительный анализ эвристических (практических, простых) стратегий (алгоритмов) принятия решений. Основными критериями качества стратегий считались два параметра:
— величина выигрыша игроков, использующих
стратегию;
— близость получаемых в результате игры статистических оценок к известным абсолютным оценкам ситуаций.
Для сравнения алгоритмов использовались имитационные модели матричных игр.
1. Имитационные модели стратегий принятия
решений. Для проведения экспериментов использовалась матрица (рис. 1), приведенная в [2]. Игроки
независимо друг от друга выбирают строки и столбцы матрицы. Цель игрока 1, выбирающего строки,
получить максимальный выигрыш. Цель игрока 2,
выбирающего столбцы, минимизировать выигрыш
игрока 1. При имитации удобно представлять этот
процесс в виде графа, изображенного в правой части рисунка. Это позволяет использовать понятия
траекторий движения, стоимости вершин. Вершины (1,1), (2,1), (3,1) выбираются игроком 1, а вершины (1,2), (2,2), (3,2) выбираются игроком 2. Выбирая
вершину, игрок 2 не знает, в какой вершине он находится. Этим обеспечивается независимость выбора
игроков. Абсолютная стоимость начальной вершины С(0) равна вычисленной цене игры.
Эксперименты заключались в проведении турниров среди стратегий, используемых игроком 1 и
игроком 2. Словом «ход» будем обозначать один выбор игроком строки или столбца. Словом «партия»
будем обозначать процесс выбора игроками заданного на входе модели какого-то количества ходов.
При моделировании в каждой партии вычисляются
текущие статистические оценки стоимости вершин.
Обозначим S(i) — текущая статистическая оценка
стоимости вершины i. S(i) равна отношению текущего суммарного выигрыша при выборе вершины i
к числу выборов этой вершины на момент времени
вычислений.
Результат партии определялся следующим образом:
— S(0)>1,86 — победа игрока, выбирающего
строки;
— S(0)<1,84 — победа игрока, выбирающего
столбцы;
— 1,84≤S(0)≤1,86 — ничья.
За победу игроку (стратегии) присуждалось 2
очка, за ничью 1 очко, за поражение 0 очков.
В турнирах участвовали 2 игрока, использующих семь стратегий. В [3] приведены результаты состязаний для пяти стратегий. Тогда использовались
модели на GPSS PC. В дальнейшем студент ОмГТУ
О. В. Гердт разработал программу моделирования
Рис. 1. Переход от игровой матрицы к графу
турниров на C# и добавил для анализа еще две стратегии. Перечислим стратегии, используемые игроками.
SP1 — используется вычисленная оптимальная
стратегия. Вероятности выбора строк (вершин графа 1,1 2,1 3,1) равны соответственно 0.55, 0.2, 0,25.
Вероятности выбора столбцов (вершин графа 1,2
2,2 3,2) равны 0.4, 0,35, 0,25. Оптимальная стратегия, по принятым в теории матричных игр определениям, должна обеспечивать величину выигрыша, равную вычисленной цене игры независимо от
применяемой противником стратегии. В нашей постановке задачи она со всеми должна делать ничью
(1,84≤S(0)≤1,86).
В реальных условиях игровая матрица редко бывает известна. Поэтому для других стратегий и игроков, их использующих, были выдвинуты следующие
требования:
— игроки знают цену игры;
— игроки не знают значения ячеек игровой матрицы, но знают оценку сделанного хода;
— игроки ничего не знают о стратегиях, используемых другими игроками;
— игрокам известны текущие статистические
оценки стоимости вершин;
— стратегии должны быть легко реализуемы на
практике.
В результате для экспериментов были разработаны следующие стратегии.
SP2 — выбор вершины с вероятностью, пропорциональной S(i), (с учетом цели игрока). Для игрока 1
чем больше S(i), тем больше вероятность выбора вершины с номером i. Для игрока 2 чем меньше S(i), тем
больше вероятность выбора вершины с номером i.
SP3 — если после выбора i-ой вершины ход оказался неудачным, на следующем ходу игрок выбирает другую вершину. Для игрока, выбирающего строки, ход считается неудачным, если приз меньше S(0).
Для игрока, выбирающего столбцы, ход считается
неудачным, если приз больше S(0). Новая вершина
выбирается с вероятностью, пропорциональной S(i),
(с учетом цели игрока).
Для стратегий SP2 и SP3 важно набрать объективную первоначальную статистику. Если одна вершина случайно окажется «плохой», то из-за малой вероятности ее выбора будет долго такой и оставаться.
SP4 — при выборе каждого следующего хода
происходит простой последовательный перебор
вершин независимо от ситуации. Самая простая и
часто используемая в реальности стратегия.
Таблица 1
Результаты турнира 1
SP1
SP3
SP4
SP5
SP6
SP7
Очки
1 R 1,85 1 R 1,85 1 R 1,85 1 R 1,86 1 R 1,85 1 R 1,86
1 C 1,85 1 C 1,84 1 C 1,86 1 C 1,84 1 C 1,85 1 C 1,85
12
0 R 1,38 0 R 1,75 0 R 1,42 0 R 1,43 0 R 1,25
0 C 1,94 2 C 1,75 0 C 2,19 0 C 2,03 0 C 2,24
4
0 R 1,59 0 R 1,29 0 R 1,60 0 R 1,64
2 C 1,75 0 C 2,33 0 C 2,03 0 C 2,23
8
2 R 3,33 2 R 2,04 0 R 1,34
2 C 0,33 2 C 1,53 0 C 1,94
14
2 R 2,17 2 R 3,00
2 C 1,47 0 C 2,49
16
0 R 1,51
0 C 2,01
10
SP2
1 C 1,85
1 R 1,85
SP3
1 C 1,85 2 C 1,38
1 R 1,84 2 R 1,94
SP4
1 C 1,85 2 C 1,75 2 C 1,59
1 R 1,86 0 R 1,75 0 R 1,75
SP5
1 C 1,86 2 C 1,42 2 C 1,29 0 C 3,33
1 R 1,84 2 R 2,19 2 R 2,33 0 R 0,33
SP6
1 C 1,85 2 C 1,43 2 C 1,60 0 C 2,04 0 C 2,17
1 R 1,85 2 R 2,03 2 R 2,03 0 R 1,53 0 R 1,47
SP7
1 C 1,86 2 C 1,25 2 C 1,64 2 C 1,34 0 C 3,00 2 C 1,51
1 R 1,85 2 R 2,24 2 R 2,23 2 R 1,94 2 R 2,49 2 R 2,01
20
Таблица 2
Оценки стоимости игры в турнире 1
SP2
SP3
SP4
SP5
SP6
S(0)
1,73625
1,73875
1,75875
1,81625
1,7875
C(0)–S(0)
0,11375
0,11125
0,09125
0,03375
0,0625
— результат партии (2 — победа, 1 — ничья, 0 —
проигрыш);
— обозначение игрока, использовавшего стратегию (R, C);
— статистическая стоимость игры S(0).
Последний столбец показывает количество набранных стратегий очков в турнире.
По результатам турнира 1 можно сделать следующие выводы.
Стратегия SP1, оптимальная с математической
точки зрения, обеспечивает во всех партиях приз,
примерно равный вычисленной абсолютной цене
игры. Поэтому игроки, использующие стратегию
SP1, делают ничьи (с позиции силы) с игроками, использующими все другие стратегии. Это походит
на сильного шахматиста, который делает со всеми
игроками ничьи (независимо от их силы) на основании того, что начальная позиция объективно равная.
Стратегии SP2 и SP3, при которых выбираются
вершины с вероятностями, зависящими от текущих
статистических оценок S(i), набрали наименьшее
число очков. Это связано с тем, что статистические
оценки стоимости вершин изменяются относительно медленно. Поэтому игроки, использующие такие
оценки для принятия решений, консервативны, не
реагируют оперативно на изменение обстановки.
Стратегии SP4, SP5, SP6 часто меняют выбираемые вершины и не учитывают их консервативные
статистические оценки. Стратегии SP4 и SP5 опередили стратегию SP1 благодаря их более успешным
выступлениям против «слабых» стратегий. Успех
стратегии SP5 можно объяснить тем, что в рассматриваемых условиях после неудачного хода однозначно менять выбор более эффективно, чем менять
его с какой-то вероятностью.
Убедительная победа стратегии SP7 связана с
большой форой, предоставленной ей другими стратегиями (кроме SP1) в виде возможности перед началом игры оценить стоимости вершин графа.
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
SP5 — игрок выбирает вершину i до первого неудачного хода. В отличие от SP3, в случае неудачи
выбор следующей вершины детерминированный,
простым перебором. В отличие от SP4, в случае удачного хода вершина выбирается повторно.
SP6 — задается число допустимых неудачных выборов (n) вершины i после того, как она была выбрана удачно (так поступает азартный игрок). При исчерпании числа неудачных попыток, на следующем
ходу вершины выбираются равновероятно. Предварительные эксперименты показали, что увеличение n ухудшает результаты стратегии SP6. Поэтому
в описываемых экспериментах n=1 (разрешается
только одна неудачная попытка).
Стратегии SP5, SP6 учитывают текущий опыт, но
не учитывают накопленную статистику.
SP7 — перед игрой тестируется игровая матрица.
Это нарушение требования о незнании игровой матрицы и серьезная фора по сравнению со стратегиями SP2, SP3, SP4, SP5, SP6. Перед игрой вычисляются
первоначальные стоимости вершин. Во время игры
S(i) модифицируются и вершины выбираются с вероятностями, пропорциональными их стоимости.
При моделировании в каждой партии игроки делали по 50000 ходов.
Основные цели моделирования заключались в
сравнительной оценке стратегий по двум критериям:
— относительная сила стратегий (количество набранных очков);
— близость получаемой статистической оценки
S(0) к абсолютной оценке C(0).
2. Проведение экспериментов на матрице 3Х3.
Результаты турнира 1, в котором использовались матрица и граф, описанные выше, приведены в табл. 1.
Строка таблицы содержит результаты стратегии
в партиях против той стратегии, обозначением которой назван столбец. Каждая пара стратегий использовалась игроками в двух партиях. В первой партии
одну стратегию использовал игрок 1, другую стратегию использовал игрок 2. Во второй партии игроки
менялись стратегиями.
Если стратегию использовал игрок 1 (выбирал
строки игровой матрицы), результат помечен буквой R. Если стратегию использовал игрок 2 (выбирал
столбцы игровой матрицы), результат помечен буквой C. Ячейки с результатами содержат по две строки, в которых записана информация о партиях:
ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (117) 2013
SP1
SP2
231
Таблица 3
Результаты турнира 2
ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (117) 2013
SP1
SP1
SP2
SP3
SP4
SP5
SP6
SP7
Очки
1 R 1,86 0 R 1,51 1 R 1,85 0 R 1,42 0 R 1,45 2 R 1,88
1 C 1,86 0 C 1,98 1 C 1,85 0 C 1,99 0 C 1,97 0 C 1,86
6
0 R 1,21 0 R 1,75 0 R 1,20 0 R 1,25 0 R 1,24
0 C 1,90 2 C 1,74 0 C 2,16 0 C 2,10 0 C 2,31
4
0 R 1,68 0 R 1,19 0 R 1,35 0 R 1,71
2 C 1,52 0 C 1,90 2 C 1,57 2 C 1,39
14
2 R 2,30 0 R 1,61 0 R 1,44
2 C 0,45 2 C 1,57 0 C 2,04
12
0 R 1,76 2 R 3,18
2 C 1,28 2 C 1,46
18
0 R 1,74
2 C 1,54
16
SP2
1 C 1,86
1 R 1,86
SP3
2 C 1,51 2 C 1,21
2 R 1,98 2 R 1,90
SP4
1 C 1,85 2 C 1,75 2 C 1,68
1 R 1,85 0 R 1,74 0 R 1,52
SP5
2 C 1,42 2 C 1,20 2 C 1,19 0 C 2,30
2 R 1,99 2 R 2,16 2 R 1,90 0 R 0,45
SP6
2 C 1,45 2 C 1,25 2 C 1,35 2 C 1,61 2 C 1,76
2 R 1,97 2 R 2,10 0 R 1,57 0 R 1,57 0 R 1,28
SP7
0 C 1,88 2 C 1,24 2 C 1,71 2 C 1,44 0 C 3,18 2 C 1,74
2 R 1,86 2 R 2,31 0 R 1,39 2 R 2,04 0 R 1,46 0 R 1,54
14
Таблица 4
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
Оценки стоимости игры в турнире 2
232
SP1
SP2
SP3
SP4
SP5
SP6
SP7
S(0)
1,79
1,715
1,575
1,65
1,690
1,599
1,815
C(0) - S(0)
0,06
0,135
0,274
0,2
0,159
0,250
0,034
В табл. 2 показана способность стратегий, не
зная игровую матрицу, получать оценки S(0), близкие к C(0). В таблицу не включены стратегии SP1 и
SP7, знающие игровую матрицу.
В таблице для пяти стратегий приведены средние
значения S(0), рассчитанные по результатам партий,
проведенных между ними. Таблица показывает, что
простые эвристические стратегии позволяют получить неплохие оценки стоимости игры. Среднее значение S(i) для всех стратегий равно 1,77. Отклонение
от C(0) равно 0,08, что составляет 4 %.
Цель следующей серии экспериментов заключалась в анализе способности стратегий адаптироваться к изменению ситуаций. Текущие значения игровой матрицы были случайными величинами. Через
каждые 100 ходов начальные значения игровой матрицы умножались на равномерно распределенную
случайную величину от 0 до 2. Остальные условия
турнира 2 такие же, как в турнире 1. Результаты турнира 2 приведены в табл. 3. Структура, обозначения
в табл. 3 такие же, как и в табл. 1.
В турнире 2 резко снизилась эффективность
стратегий SP1 и SP7, знающих игровую матрицу. Это
объяснимо тем, что роль знания средних значений
ячейки матрицы снижается при случайном изменении их величины в процессе игры. Стратегия SP1 не
использует средств адаптации к изменению ситуации. Стратегия SP2, ориентированная на использование статистических оценок стоимости вершин
графа, опять заняла последнее место. Значительно
улучшились результаты стратегий SP3 и SP6, повторяющих выбор в случае удачного хода и изменяющих выбор в случае неудачного хода. Стратегии SP4
и SP5, тоже часто меняющие выбор вершин графа,
остались на высоком уровне.
По структуре табл. 4 аналогична табл. 2. Она построена по результатам турнира 2. В табл. 4 включены стратегии SP1 и SP2, т.к. в этом турнире знание средних значений игровой матрицы не дает им
большого преимущества перед другими. Сравнивая
значения таблиц 2 и 4, можно сделать вывод об ухудшении оценки стратегиями значения С(0). Среднее
значение S(i) для всех стратегий равно 1,69. Отклонение от C(0) равно 0,16, что составляет 9 %. Стратегия SP7 хуже выступила в турнире 2, чем в турнире 1, но показала хороший результат по оценке стоимости игры C(0).
3. Проведение экспериментов на матрице 4Х4.
Основная цель анализа стратегий на матрице 4х4
состояла в ответе на вопросы: какие результаты покажут стратегии на матрице большей размерности,
привязаны ли выводы, сделанные в предыдущих
экспериментах, к конкретной игровой матрице или
имеют более общий характер. Эксперименты этой
серии провел студент ОмГТУ О. В. Гердт. Для проведения экспериментов (турнир 3) использовалась
игровая матрица на рис. 2. Вычисленные параметры
игры:
— вероятности для оптимальной стратегии: (0,3;
0,4; 0,17; 0,13) для строк и (0,3; 0,3; 0,3; 0,1) для столбцов;
— цена игры C(0)=1,8.
Результат партии определялся следующим образом:
Рис. 2. Игровая матрица для турнира 3
Таблица 5
Результаты турнира 3
SP1
SP3
SP4
SP5
SP6
SP7
Очки
1 R 1,81 1 R 1,80 1 R 1,80 1 R 1,80 1 R 1,80 1 R 1,80
1 C 1,80 1 C 1,80 1 C 1,80 1 C 1,80 1 C 1,80 1 C 1,80
12
0 R 1,68 2 R 1,91 0 R 1,58 0 R 1,64 0 R 1,33
0 C 2,00 0 C 1,92 0 C 2,07 0 C 2,03 0 C 2,09
4
0 R 1,69 0 R 1,28 0 R 1,64 0 R 1,52
0 C 1,98 0 C 2,15 0 C 1,99 0 C 2,11
6
0 R 1,38 2 R 2,02 0 R 1,51
2 C 1,38 2 C 1,47 0 C 1,89
14
2 R 2,01 2 R 3,00
2 C 1,41 0 C 2,69
18
2 R 2,00
0 C 2,05
12
SP2
1 C 1,81
1 R 1,80
SP3
1 C 1,80 2 C 1,68
1 R 1,80 2 R 2,00
SP4
1 C 1,80 0 C 1,91 2 C 1,69
1 R 1,80 2 R 1,92 2 R 1,98
SP5
1 C 1,80 2 C 1,58 2 C 1,28 2 C 1,38
1 R 1,80 2 R 2,07 2 R 2,15 0 R 1,38
SP6
1 C 1,80 2 C 1,64 2 C 1,64 0 C 2,02 0 C 2,01
1 R 1,80 2 R 2,03 2 R 1,99 0 R 1,47 0 R 1,41
SP7
1 C 1,80 2 C 1,33 2 C 1,71 2 C 1,51 0 C 3,00 0 C 2,00
1 R 1,80 2 R 2,09 2 R 1,39 2 R 1,89 2 R 2,69 2 R 2,05
18
Таблица 6
Оценки стоимости игры в турнире 3
SP2
SP3
SP4
SP5
SP6
S(0)
1,85375
1,80125
1,71875
1,6575
1,77625
C(0)–S(0)
–0,05375
–0,00125
0,08125
0,1425
0,02375
имитационного моделирования матричных игр для
генерации и сравнительного анализа различных
стратегий. Проведенные эксперименты показали,
что матричные игры можно использовать для анализа качества стратегий по критериям:
— способность побеждать;
— возможность получения объективных оценок
ситуаций.
Выводы, сделанные в статье, предназначены не
столько для обобщений, сколько для получения информации для размышлений.
Библиографический список
1. Джон С. Хэммонд. Умный выбор: как научиться принимать правильные решения / Джон С. Хэммонд, Ральф Л. Кини,
Говард Райффа ; пер. с англ. – Новосибирск : Сиб. унив. издво, 2007. – 187 с.
2. Дж. Мак Кинси. Введение в теорию игр / Дж. Мак Кинси ;
пер. с англ. ; под ред. Д. Б. Юдина. – М. : Гос. изд. физ.-мат. лит.,
1960. – 420 с.
3. Пуртов, А. М. Имитация процессов принятия решений /
А. М. Пуртов // Имитационное моделирование. Теория и практика : материалы конф. В 2 т. Т. 2. – СПб., 2007. – С. 169–173.
ПУРТОВ Андрей Михайлович, кандидат технических наук, доцент (Россия), старший научный сотрудник лаборатории методов проблем преобразования информации.
ЧАНЫШЕВ Олег Георгиевич, кандидат технических наук, старший научный сотрудник лаборатории методов проблем преобразования информации.
Адрес для переписки: andr.purtov@yandex.ru
Статья поступила в редакцию 04.12.2012 г.
© А. М. Пуртов, О. Г. Чанышев
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
S(0)>1,81 — победа игрока, выбирающего строки;
S(0)<1,79 — победа игрока, выбирающего столбцы;
1,79≤S(0)≤1,81 — ничья.
Другие условия такие же, как в турнире 1. Результаты турнира 3 приведены в табл. 5. Структура, обозначения в табл. 5 такие же, как и в табл. 1.
Сравнение количества очков, набранных стратегиями в турнирах 1 и 3, показывает малое изменение
результатов, несмотря на увеличение размерности
игровой матрицы. Это говорит о том, что выводы по
турнирам 1 и 2 относятся не только к конкретной матрице на рис.1. Таким образом, появляется возможность при анализе стратегий на матричных играх
делать относительно общие выводы.
По структуре табл. 6 аналогична табл. 2. Но она
построена по результатам турнира 3. Среднее значение S(i) для всех стратегий равно 1,76. Отклонение
от C(0) равно 0,04, что составляет 2%. Несмотря на
усложнение игровой ситуации (размерности игровой матрицы), точность оценки стратегиями цены
игры повысилась.
Анализ результатов экспериментов позволяет
сделать следующие выводы:
— оптимальная (по определению) стратегия делает ничью со всеми другими стратегиями (сильными и слабыми) в матричных играх с фиксированными значениями игровой матрицы. В турнире многие
стратегии более эффективны за счет выигрыша у
более слабых;
— в рассматриваемых условиях стратегии, использующие для принятия решений статистические
оценки ситуаций (вершин графа), показывают плохие результаты (SP2, SP3). Это происходит из-за консервативности статистических оценок. Стратегии,
оперативно реагирующие на изменение ситуации,
показывают хорошие результаты;
— простые эвристические (практические) стратегии, даже не зная игровую матрицу, позволяют
получать хорошую оценку стоимости игры;
— результаты, полученные на одной игровой матрице, достаточно хорошо совпадают с результатами, полученными на других игровых матрицах.
Заключение. Простые эвристические стратегии
принятия решений имеют большое значение как в
повседневных бытовых, так и в объектно-ориентированных профессиональных ситуациях. В работе
сделана попытка показать пользу от использования
ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (117) 2013
SP1
SP2
233
Документ
Категория
Без категории
Просмотров
9
Размер файла
501 Кб
Теги
анализа, игр, решение, метод, матричный, практическая, pdf, принятие, стратегия, имитация
1/--страниц
Пожаловаться на содержимое документа