close

Вход

Забыли?

вход по аккаунту

?

Дифференциальная игра с изменением цели одного из игроков.

код для вставкиСкачать
Известия Института математики и информатики. Иевск. 2004. Є2(30)
УДК 519.833
Ю.Н. Житенева
molostvisa.a.ru
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА С ИЗМЕНЕНИЕМ
В ТЕЧЕНИЕ ИГРЫ ЦЕЛИ ОДНОГО ИЗ ИГРОКОВ
Ключевые слова:
1
игра, стратегия, равновесная ситуация.
Abstrat. A dierential linear{quadrati dynamial problem with
alternate aim is onsidered. Guaranty solution is formalized.
1.
Математическая модель
Рассмотрим дифференциальную позиционную бескоалиционную
линейно{квадратичную игру двух лиц
h{1, 2}, , U1 , U2 , {Ji (U, t? , x? )}i=1,2 i.
(1.1)
В этой игре динамика управляемой системы описывается
обыкновенным линейным векторным диференциальным уравнением
x_ = A(t)x + u1 + u2 , x(t? ) = x? ,
(1.2)
где t { текущее время; x = (x1 , . . . , xn ) ? Rn { фазовый вектор, управляющее воздействие i {го игрока ui ? Rn (i = 1, 2) ;
элементы n ╫ n { матрицы A(t) предполагаются непрерывными на [0, ?? (обозначаем этот факт A(╖) ? Cn╫n [0, ?? ), фиксированы момент окончания игры ? > 0 и начальная позиция
(t? , x?) ? [0, ?) ╫ Rn .
1
Работа поддерана грантом РФФИ ( 02{01{00612).
107
Мноество стратегий
Ui
Ui
у i {го игрока
= {Ui ў ui (t, x)|ui (t, x) = Qi(t)x + qi (t),
(1.3)
?Qi (╖) ? Cn╫n [0, ??, qi (╖) ? Cn [0, ??} (i = 1, 2).
Таким образом, выбор конкретной стратегии Ui из мноества
Ui сводится к выбору конкретных непрерывных (по t ) матрицы
Qi (t) и вектора qi (t) .
?артия игры развертывается следующим образом. Игроки независимо друг от друга выбирают и используют свои конкретные
стратегии U1 ? U1 и U2 ? U2 . В результате складывается ситуация U = (U1 , U2 ) ? U1 ╫ U2 = U . Тогда єразвитие игры
во времени происходит в соответствии с векторным линейным
неоднородным дифференциальным уравнением с непрерывными
(по t ) коэффициентами
x_ = [A(t) + Q1 (t) + Q2 (t)?x + q1 (t) + q2 (t), x(t? ) = x? .
Решение этого уравнения x(t) существует, единственно, непрерывно дифференцируемо и продолимо на интервал [t? , ?? .
Оно єпородает реализации выбранных игроками стратегий
ui [t? = ui (t, x(t)) = Qi (t)x(t) + qi (t) (i = 1, 2) . На полученных
в итоге наборах (x(t), u1 [t?, u2 [t?) , t? 6 t 6 ? , определена функция выигрыша i {го игрока, заданная следующим квадратичным
функционалом
Ji (U, t? , x? ) =
?
R
(1.4)
= x?(?)Ci x(?) + (u?1 [t?Di1 u1 [t? + u?2 [t?Di2 u2 [t?)dt,
t?
где n ╫ n {матрицы Ci, Dij (i, j = 1, 2) постоянны и симметричны; штрих сверху означает операцию транспонирования.
На єсодерательном уровне цель 2{го игрока состоит в выборе и использовании стратегии U2 ? U2 , доставляющей ему
наибольший возмоный выигрыш J2 (U, t? , x? ) в слоившейся
108
ситуации U . В отличие от него, 1{й игрок, выбирая свою стратегию U1 ? U1 , стремится не только достичь максимального собственного выигрыша J1 (U, t? , x? ) , но при этом елает влиять на
выигрыш 2{го игрока: за период времени [t?, t1 ? его увеличить,
а за промеуток [t1 , ?? уменьшить (насколько это возмоно).
?ричем момент времени t1 ? (t?, ?) будем считать фиксированным и заданным до начала игры. Заметим, что игроки не знают
о преследуемых друг другом целях.
2.
Формализация решения
Формализуем решение игры (1.1).
О п р е д е л е н и е 2.1. Гарантированным t1 {равновесием игры (1.1) назовем пару (U ? , J ? ) ? U ╫ R2 такую, что
= (J1 (U ? , t? , x? ), J2 (U ? , t? , x?))
и для всякой начальной позиции (t? , x?) ? [0, t1 ) ╫ Rn будут
выполняться следующие условия:
10 ) при t ? [t? , t1 ) для кадого U1 ? U1 несовместна система
неравенств
J1 (U1 , U2? , t? , x? ) > J1 (U ? , t? , x? ),
(2.1)
J2 (U1 , U2? , t? , x? ) > J2 (U ? , t? , x? );
J?
20 ) при t ? [t1 , ?? для любых U1 ? U1 несовместна система
неравенств
J1 (U1 , U2? , t1 , x(t1 , U1 , U2? )) > J1 (U ? , t? , x(t1 , U ? )),
(2.2)
J2 (U1 , U2? , t? , x(t1 , U1 , U2? )) < J2 (U ? , t? , x(t1 , U ? ));
30 ) для всех
U2 ? U2
J2 (U1? , U2 , t? , x? ) 6 J2 (U ? , t? , x? ).
Вектор
J?
назовем векторной гарантией.
109
(2.3)
З а м е ч а н и е 2.1. Стратегия 1{го игрока из гарантированного t1 {равновесия имеет вид
?
U11 при t ? [t? , t1 ),
?
U1 =
? при t ? [t , ??,
U12
1
где U11? удовлетворяет условию 10 , а U12? { условию 20 определения. ?оэтому будем искать ситуацию U ? = (U1? , U2? ) , реализующую гарантированное t1 {равновесие, в виде
(U11? , U21? ) при t ? [t?, t1 ),
?
U =
(U12? , U22? ) при t ? [t1 , ??,
причем U21? удовлетворяет условию 30 определения 2.1 при
? отвечает этому е условию при t ? [t , ?? .
t ? [t? , t1 ) , а U22
1
З а м е ч а н и е 2.2. Функции выигрыша игроков (1.4)
представим в виде
Ji (U, t? , x? ) =
где
Z
t1
t?
fi (t, u, x)dt +
Z
?
t1
fi (t, u, x)dt,
fi (t, u, x) = x? (t)(A? Ci + Ci A)x(t) + 2u?1 [t?Ci x(t) + 2u2? [t?Ci x(t) +
?
+ u?1 [t?Di1 u1 [t? + u?2 [t?Di2 u2 [t? + x?? C?itx? (i = 1, 2).
?
3.
Достаточные условия
?риведем достаточные условия существования гарантированного t1 {равновесия (U ? , J ? ) игры (1.1). Для этого рассмотрим
вспомогательную дифференциальную игру
h{1, 2}, , U1 , U2 , {J(i) (U, t? , x? )}i=1,2 i.
110
(3.1)
Эта игра отличается от (1.1) лишь функциями выигрыша
игроков
J
(1)
(U, t? , x? ) =
+
J
(2)
Z
t1
t?
Z ?
t1
{?f1 (t, u, x) + (1 ? ?)f2 (t, u, x)}dt +
{?f1 (t, u, x) ? (1 ? ? )f2 (t, u, x)}dt,
(U, t? , x? ) =
Z
t1
t?
f2 (t, u, x)dt +
Z
?
t1
f2 (t, u, x)dt,
где постоянные ? ? [0, 1? , ? ? [0, 1? .
Введем обозначения (i = 1, 2)
Di (?) = ?D1i + (1 ? ?)D2i ,
Di (? ) = ?D1i ? (1 ? ? )D2i ,
C1 (?) = ?C1 + (1 ? ?)C2 ,
C2 (? ) = ?C1 ? (1 ? ? )C2 .
С учетом обозначений (3.3) функция выигрыша
игрока из (3.2) примет вид
J
(1)
(U, t? , x? ) =
где
Z
t1
f
t?
(1)
(t, u, x)dt +
Z
?
t1
(3.2)
(3.3)
J (1)
f (2) (t, u, x)dt,
у 1{го
(3.4)
f (1) (t, u, x) = x? (t)[A? C (?) + C (?)A?x(t) +
где
+2u1? [t?C (?)x(t) + +2u?2 [t?C (?)x(t) +
+2u?1 [t?D1 (?)u1 [t? + 2u2? [t?D2 (?)u2 [t? + f01 ,
f (2) (t, u, x) = x? (t)[A? C (? ) + C (? )A?x(t) +
+2u1? [t?C (? )x(t) + 2u?2 [t?C (? )x(t) +
+2u1? [t?D1 (? )u1 [t? + 2u?2 [t?D2 (? )u2 [t? + f02 ,
= x??C?(?t)x? ,
?
f01
= x??C?(?t)x? .
?
f02
?
111
?
(3.5)
В качестве решения игры (3.1) будем использовать равновесную по Нэшу ситуацию. Напомним, что ситуация
Ue
= (U1e , U2e ) ? U1 ╫ U2
называется равновесной по Нэшу в игре (3.1), если при любой
начальной позиции (t? , x? ) ? [0, t1 ) ╫ Rn будет
J (1) (U1 , U2e , t? , x? ) 6 J (1) (U e , t? , x? ), ?U1 ? U1 ,
J (2) (U1e , U2 , t? , x? ) 6 J (2) (U e , t? , x? ), ?U2 ? U2 .
У т в е р д е н и е 3.1. Равновесная по Нэшу ситуаU e в игре (3.1) реализует гарантированное t1 {равновесие
игры (1.1), то есть U ? = U e , J ? = (J1 (U e , t? , x? ), J2 (U e , t? , x? )) .
Для построения гарантированных t1 {равновесий игры (1.1)
воспользуемся методом динамического программирования.
С этой целью введем функции (i = 1, 2)
ция
(1)
W1
(2)
W1
(1)
(2)
(2)
(t, x, u, V1(2) ) = ?V?t1 + [ ?V?x1 ??[Ax + u1 + u2 ? + f (2) (t, u, x),
(t, x, u, V ) =
и обозначим
W
(1)
(t, x, u, V1(1) ) = ?V?t1 + [ ?V?x1 ??[Ax + u1 + u2 ? + f (1) (t, u, x),
(i)
2
(i)
2
V
=
(
(i)
?V2
?t
(i)
+ [ ?V?x2
?? [Ax + u1 + u2 ? + f2 (t, u, x)
(V1(1) , V2(1) ) при t ? [t?, t1 ),
(V1(2) , V2(2) ) при t ? [t1 , ??.
У т в е р д е н и е 3.2. ?усть существуют функции
ui1 (t, x, V ) , определенные при t ? [0, t1 ? , ui2 (t, x, V ) , определенные при t ? [t1 , ?? (i = 1, 2) , и непрерывно дифференцируемые
112
скалярные функции
1)
при всех x ? Rn
(j )
Vi
(t, x) (i, j = 1, 2)
такие, что
(?, x) = 0, Vi(1) (t1 , x) = Vi(2) (t1 , x);
(2)
t ? [t1 , ?? , x ? Rn и Vi ? R (i = 1, 2)
(2)
Vi
2)
для всех
(2)
(2)
max
W1 (t, x, u1 , u22 (t, x, V ), V1 ) =
u1
= W1(2) (t, x, u12 (t, x, V ), u22 (t, x, V ), V1(2) ),
(2)
(2)
max
W2 (t, x, u12 (t, x, V ), u2 , V2 ) =
u2
= W2(2) (t, x, u12 (t, x, V ), u22 (t, x, V ), V2(2) ),
(1)
? R (i = 1, 2)
для любых t ? [0, t1 ? , x ? Rn и Vi
(1)
(1)
W1 (t, x, u1 , u21 (t, x, V ), V1 ) =
max
u1
= W1(1) (t, x, u11 (t, x, V ), u21 (t, x, V ), V1(1) ),
(1)
(1)
max
W2 (t, x, u11 (t, x, V ), u2 , V2 ) =
u2
= W2(1) (t, x, u11 (t, x, V ), u21 (t, x, V ), V2(1) );
3) для любых x ? Rn и t ? [t1 , ??, i = 1, 2
(2)
(2)
Wi (t, x, u12 (t, x, V (t, x)), u22 (t, x, V (t, x)), Vi (t, x)) = 0,
для всех x ? Rn и t ? [0, t1 ?, i = 1, 2
(1)
(1)
Wi (t, x, u11 (t, x, V (t, x)), u21 (t, x, V (t, x)), Vi (t, x)) = 0,
4) uij (t, x, V (t, x)) = u?ij (t, x) , Uij? ў u?ij (t, x) , Uij ? Ui
(i, j = 1, 2) .
Тогда ситуация
U
?
=
(U11? , U21? ) ў (u?11 (t, x), u?21 (t, x)) при t ? [t?, t1 ),
? (t, x), u? (t, x)) при t ? [t , ??
(U12? , U22? ) ў (u12
1
22
реализует гарантированное
начальных позициях
(3.6)
t1 {равновесие игры (1.1) при любых
(t? , x?) ? [0, t1 ) ╫ Rn .
113
У т в е р д е н и е 3.3.
и существуют постоянные
?усть в игре
(1.1)
? , ? ? [0, 1? такие, что
D22 <
0
D1 (?) < 0, D1 (? ) < 0,
и система
?_1
?1
C2 ? + [A? ? C1 (? )D1?1 (? ) ?
+ ?1(2) [A ? D1?1 (? )C1 (? ) ? D22
?1 (2)
?1
?1 (2)
?C2 D22
D2 (? )D22
?2 +
??1 ? ?1(2) D1?1 (? )?1(2) + ?2(2) D22
?1
?1
?1
C2 ? C1 (? )? + [C2 D22
D2 (? ) ?
[D2 (? )D22
+?2(2) D22
(2)
(
?
1)
?1
?C1 (? )?D22
?2 + AC1 (? ) + C1 (? )A? ? C1 (? )D1 (? )C1 (? ) ?
?1
?1
?1
?1
?C1 (? )D22
C2 ? C2 D22
C1 (? ) + C2 D22
D2 (? )D22
C2 = 0n╫n ,
(2)
?1 (?) = 0n╫n ;
(2)
?_2
?1
C2 ? + [A? ? C1 (? )D1?1 (? ) ?
+ ?2(2) [A ? D1?1 (? )C1 (? ) ? D22
(2)
?1 (2)
?1 (2)
?C2 D22
?2 + ?1 D1?1 (? )[D21 D1?1 (? )C1 (? ) ?
??2 ? ?2(2) D22
(2)
?C2 ? + [C1 (? )D1?1 (? )D21 ? C2 ?D1?1 (? )?1 + AC2 + C2 A? ?
?C2 D1?1 (? )C1 (? ) ? C1 (? )D1?1 (? )C2 +
?1
C2 = 0n╫n ,
+C1 (? )D1?1 (? )D21 D1?1 (? )C1 (? ) ? C2 D22
(2)
?2 (?) = 0n╫n
(2)
(2)
имеет продолимое на [?, t1 ? решение ?1 (t) , ?2 (t) , а систе(2)
ма
?_1
?1
C2 ? + [A? ? C1 (?)D1?1 (?) ?
+ ?1(1) [A ? D1?1 (?)C1 (?) ? D22
?1 (1)
?1
?1 (1)
?C2 D22
D2 (?)D22
?2 +
??1 ? ?1(1) D1?1 (?)?1(1) + ?2(1) D22
(1)
?1
?1
?1
+?2 D22 [D2 (?)D22 C2 ? C1 (?)? + [C2 D22 D2 (?) ?
?1 (1)
?C1 (?)?D22
?2 + AC1 (?) + C1 (?)A? ? C1 (?)D1?1 (?)C1 (?) ?
?1
?1
?1
?1
?C1 (?)D22
C2 ? C2 D22
C1 (?) + C2 D22
D2 (?)D22
C2 = 0n╫n ,
(1)
(2)
?1 (t1 ) = ?1 (t1 );
(1)
114
?_2
?1
C2 ? + [A? ? C1 (?)D1?1 (?) ?
+ ?2(1) [A ? D1?1 (?)C1 (?) ? D22
(1)
?1 (1)
?1 (1)
?C2 D22
?2 + ?1 D1?1 (?)[D21 D1?1 (?)C1 (?) ?
??2 ? ?2(1) D22
(1)
?C2 ? + [C1 (?)D1?1 (?)D21 ? C2 ?D1?1 (?)?1 + AC2 + C2 A? ?
?C2 D1?1 C1 (? ) ? C1 (?)D1?1 (?)C2 +
?1
C2 = 0n╫n ,
+C1 (?)D1?1 (?)D21 D1?1 (?)C1 (?) ? C2 D22
(1)
(2)
?2 (t1 ) = ?2 (t1 ).
Тогда ситуация U ? = (U1? , U2? ) из гарантированного t1 {
(1)
равновесия имеет вид
U1?
U2?
=
(
? ў ?D ?1 (?)[? (t) + C (?)?x при t ? [0, t ),
U11
1
1
1
1
? ў ?D ?1 (? )[? (2) (t) + C (? )?x при t ? [t , ??,
U12
1
1
1
1
=
(
? ў ?D ?1 [? (t) + C ?x при t ? [0, t ),
U21
2
1
22
2
? ў ?D ?1 [? (2) (t) + C ?x при t ? [t , ??.
U22
2
1
2
22
(1)
(1)
Автор благодарит проф. В.И. Жуковского за обсудение работы и замечания.
Список литературы
1. Житенева Ю.Н. Дифференциальная игра с єсоюзниками и єпротивниками // ?роблемы управления и информатики. 1999. Є 5.
С. 23 - 33.
115
Документ
Категория
Без категории
Просмотров
4
Размер файла
173 Кб
Теги
игра, дифференциальной, одного, цели, игроков, изменения
1/--страниц
Пожаловаться на содержимое документа