close

Вход

Забыли?

вход по аккаунту

?

К теории линейных динамических неантагонистических игр.

код для вставкиСкачать
№ 2 (26), 2013
Физико-математические науки. Математика
УДК 517.977
В. Л. Пасиков
К ТЕОРИИ ЛИНЕЙНЫХ ДИНАМИЧЕСКИХ
НЕАНТАГОНИСТИЧЕСКИХ ИГР
Аннотация. В предлагаемой работе изучены задачи из теории динамических
игр нескольких лиц с ненулевой суммой, когда ценой игры является система
функционалов типа расстояния. Особенность работы заключается в том, что
для описания эволюции объектов выделены три случая линейных систем типа
Вольтерра: интегродифференциальная система уравнений с управляющими
воздействия вне интеграла, интегродифференциальная система уравнений
с управляющими воздействиями под знаком интервала и система интегральных уравнений. Решение задачи заключается в построении равновесного, по
Нэшу, набора оптимальных стратегий для указанных типов динамических систем и выбранного функционала. Задача решается построением некоторой модификации известной экстремальной конструкции академика Н. Н. Красовского, которая заключается в новом определении позиции игры, для чего используется полная память по управляющим воздействиям, что существенно
усложняет все исследование. Доказаны соответствующие теоремы.
Ключевые слова: интегродифференциальное уравнение Вольтерра, интегральное уравнение Вольтерра, управляющее воздействие, измеримая функция, траектория, позиция, оптимальная стратегия.
V. L. Pasikov
TOWARDS THE THEORY OF LINEAR DYNAMIC
NONANTAGONISTIC GAMES
Abstract. The article studies the problems of the theory of dynamic games of several
persons with non-zero sum, when the value of the game is the system of functionals
of distance type. The peculiarity of the work lies in the fact that to describe the evolution of objects there may be used three cases of linear systems of Volterra type: integro-differential system of equations with managing impacts outside of the integral,
integro-differential system of equations with control actions under the sign of the interval and the system of integral equations. Solution of the problem lies in the construction of equilibrium, the Nash equilibrium, the set of optimal strategies for specified types of dynamical systems and the selected features. The problem is solved by
constructing some modification of the well known extreme construction of the academician N. N. Krasovskiy, which is based on a new definition of the position of the
game that uses a full memory of the control inputs, which significantly complicates
the entire study. The corresponding theorems have been proven.
Key words: Volterra integral differential equation, Volterre’s integral equation, control action, measurable function, trajectory, game position, optimal strategy.
Рассмотрим неантагонистические динамические игры, в которых динамика описывается линейными интегродифференциальными и интегральными
системами Вольтерра. Решение задач проводится на основе методов, разработанных в [1–3], которые модифицированы к рассмотренным ниже случаям.
Пусть, как и в [3], задана система функционалов
Yi (u1 ,..., um ) = ci − x(θ) , i = 1, m,
Physics and mathematics sciences. Mathematics
(1)
75
Известия высших учебных заведений. Поволжский регион
предполагается, что игрок Pk стремится минимизировать k-й функционал из
(1) на траекториях некоторой системы, описывающей динамику игры; • –
символ евклидовой нормы в R n .
Динамика управляемой системы определяется векторным интегродифференциональным уравнением Вольтерра
t
m
x(t ) = f (t ) + A(t ) x(t ) + K (t , s ) x( s )ds +  ui (t ), x(0) = x0 ,
i =1
0

(2)
где x – n-мерный фазовый вектор; f(t) – n-мерная интегрируемая по Лебегу на
[0, θ] вектор-функция; θ > 0 – фиксированный момент окончания игры; A(t) –
непрерывная на [0, и] матрица n × n ; ui(t), i = 1, m , – управляющие воздействия, стесненные ограничениями, ui ∈U i ; Ui – выпуклые компакты в Rn,
а их реализации u[t], t ∈ [t0 , θ) , – измеримые по Лебегу функции. Такие
управления называют допустимыми.
Стратегией Uk игрока Pk называется правило выбора управления uk
в каждый момент t ∈ [t0 , θ) , t0 ∈ [0, θ) – начало процесса управления.
Задача 1. Для системы функционалов
Yi (u1 ,..., um ) = ϕi ( x[θ]), i = 1, m − 1 ;
(3)
r
Ym (u1 ,..., um ) =
α j
d j − x[θ] = ϕm ( x[θ]), α j > 0 ,
(4)
j =1
e
найти такие стратегии U1e ,...,U m
, для которых выполняются соотношения
ϕi ( xe [θ]) ≤ ϕi ( x k [θ]) , i = 1, m ; xe [θ] – точка реализовавшейся траектории x[t],
t ∈ [0, θ] , системы (2), которая отвечает стратегиям U1e ,...,U me ; x k [θ] – точка
реализовавшейся траектории x[t], t ∈ [0, θ] , системы (2), которая отвечает реаe
лизациям управлений u1e [t ],..., uke −1[t ], uk [t ], uke +1[t ],..., um
[t ] , где uie [t ], i = 1, m,
i ≠ k , формируется на основе U ie ; uk [t ] – реализация произвольного, измеримого по Лебегу управления, стесненного условием uk ∈U k . Если задача 1
e
разрешима, то набор стратегий U e = {U ie ,...,U m
} называется равновесным по
Нэшу [3] для игры, описываемой задачей 1. Такие стратегии называются оптимальными для игроков P1 ,..., Pm . Система функционалов (3), (4) интерпретируется следующим образом: игроки P1 ,..., Pm−1 стремятся «поразить» в момент и заданные точки c1 ,..., cm−1 , а игрок Pm – систему точек d1 ,..., d r [3]. Есr
ли
 αi = 1 ,
j=1
r
то
α j
d j − x(θ)
– математическое ожидание дискретной
j =1
случайной величины, возможными значениями которой являются евклидовы
расстояния от x(θ) до каждой из точек d1 ,..., d r [4]. Считаем, что к моменту
76
University proceedings. Volga region
№ 2 (26), 2013
Физико-математические науки. Математика
t0 ∈ [0, θ) все игроки уже реализовали некоторые допустимые управления
ui [t ] согласно тем или иным соображениям, а для t ≥ t0 управления должны
реализовываться согласно выбранным стратегиям. Предположив, что после
некоторого момента t ≥ t0 управления u[t ] ≡ 0 , получаем согласно [5] состояние системы (2) в момент t:
m t
x(θ, t ) = x(θ, t0 ) +
  x(θ, s)ui (s)ds ,
(5)
i =1 t0
где
m t0
θ

x(θ, t0 ) = X (θ,0) x0 + x (θ, s )ϕ( s )ds +
  x(θ, s)ui [s] ds ,
i =1 0
0
t

ϕ( s ) = Ô ( s,0) x0 + f ( s ), Ô (t , s ) = K (t , τ)X (τ, s )d τ ,
s
X(t, s) – матрица Коши системы x = A(t ) x(t ) ,
t

x (t , s ) = X (t , s ) + X (t , τ) R (τ, s )d τ ,
(6)
s
R(t, s) – резольвента матрицы Ф(t, s).
Для построения оптимальной стратегии игрока Pk рассматриваем выражение, построенное по (5), (6):
θ

ε k (t0 , x(θ, t0 ), ck ) = max lk′ (ck − x(θ, t0 )) − max {lk' x (θ, s)}uk ( s )ds −
lk =1 
u ∈U
t0 k k




−
min {lk' x (θ, s )}ui ( s )ds  ,
u ∈U

i =1, t0 i i

i≠k
m θ

(7)
которое является евклидовым расстоянием от начальной позиции x(θ, t0 ) до
точки ck , k = 1, m , при соответствующих управляющих воздействиях игроков
P1 ,..., Pm . В соотношении (7) максимум достигается на единственном векторе
lk0 = lk ( t , x(θ, t ) ) , непрерывно зависящем от позиции {t , x(θ, t )} , в случае, когда ε k (t , x(θ, t ), ck ) > 0 , т.е. рассматривается регулярный случай; считаем что
∀t ∈ [t0 , θ)  ε k (t , x(θ, t ), ck ) > 0 [1]; здесь и далее штрих означает транспонирование. После решения задачи (7) в момент t ∈ [t0 , θ) определяем оптималь-
ную стратегию игрока Pk , k = 1, m , соотношением
Physics and mathematics sciences. Mathematics
77
Известия высших учебных заведений. Поволжский регион
{lk0' x (θ, t )}uke = max {lk0' x (θ, t )}uk .
(8)
uk ∈U k
Обозначим xke (t ) = {lk0' x (θ, t )} . Как это следует из (6), xke (t ) – решение
интегрального уравнения второго рода
xke (t ) = {lk0' X (θ, t )} +
θ
 Ô ′(τ, t ) xk (τ)d τ ,
e
t
в котором {lk0' X (θ, t )} – решение системы
dxk
= − A' (t ) xk с краевым условием
dt
dxk
= A(t ) xk , t ∈ [t0 , θ) , k = 1, m [1].
dt
Окончательно условие (8) переписываем в виде
xk (θ) = lk0 , сопряженной к системе
xke (t )uke = max xke (t )uk .
(9)
uk ∈U k
В работе [5] было доказано, что введенные оптимальные стратегии
уравновешивают систему функционалов (1) в смысле Нэша. Будем теперь исследовать решение задачи 1. Для игроков P1 ,..., Pm−1 оптимальные стратегии
определяются равенством (9). Для построения оптимальной стратегии игрока
Pm рассматриваем выражение
θ

ε mj (t0 , x(θ, t0 ), d j ) = max l ′j (d j − x(θ, t0 )) − max {l ′j x (θ, s )}um ( s )ds −
u ∈U
l j =1 
t0 m m



′

−
min {l j x(θ, s )}ui ( s )ds  ,

ui ∈U i
i =1 t0

m−1 θ

(10)
значение которого является евклидовым расстоянием от точки x(θ, t0 ) до
точки d j , j = 1, r , при указанных управляющих воздействиях всех игроков.
Предполагается, что решение в (10) достигается на единственном векторе
l 0j = l 0j (t0 , x(θ, t0 )) и ε mj (t0 , x(θ, t0 ), d j ) > 0 , вектор l 0j непрерывно зависит от
позиции [1].
0
=
После решения задачи (10) составляем вектор lm
r
 α j l 0j
и определя-
j =1
e
игрока Pm из условия
ем оптимальную стратегию U m
0' 
e
e
{lm
x(θ, t )}um
(t ) = max xm
(t )um , t ∈ [t0 , θ)
um∈U m
или по аналогии с (9)
78
University proceedings. Volga region
№ 2 (26), 2013
Физико-математические науки. Математика
e
e
e
0' 
xm
(t )uke (t ) = max xm
(t )um , t ∈ [t0 , θ), xm
(t ) = {lm
x(θ, t )} .
um∈U m
(11)
Записываем функции
ε mj (t ) = ε mj (t , x(θ, t ), d j ) = l 0'
j (d j
t
− x(θ, t0 )) −
{l j x (θ, s)}um ( s)ds −
 umax
∈U
t0
−

{l 0'
j x (θ, s )}um ( s ) ds −
0'
m
m
m −1 θ
  {l 0'j x (θ, s)}uie (s)ds.
(12)
j =1 t0
t
Из функций (12) записываем линейную комбинацию
r
ε m (t ) =

α j ε mj (t , x(θ, t ), d j ) =
j =1
t
r
0'
 u ∈U {α j l j x (θ, s)}um (s)ds −
max
m
t0
−

 α j l 0'j (d j − x(θ, t 0 )) −
j =1
−
r θ
r
m
j =1
{α j l 0'
j x (θ, s )}um ( s ) ds −
j =1 t
m −1 θ r
  {α j l 0'j x(θ, s)}uie (s)ds,
(13)
i =1 t0 j =1
с использованием условия (11) формула (13) переписывается в следующем
виде:
r
ε m (t ) =

t

e
e
α j l 0'
j ( d j − x (θ, t0 )) − xm ( s )um ( s ) ds −
j =1
θ
−

t
e
xm
( s )um ds −
t0
m −1 θ
  xme (s)uie (s)ds ,
(14)
i =1 t0
здесь управления игроков P1 ,..., Pm−1 являются оптимальными; ε m (θ) – значение ε m (t ) при t = θ , когда все игроки применяли свои оптимальные управления; ε m (t0 ) – значения t = t0 при ε m (t ) , когда игроки P1 ,..., Pm−1 применяют свои оптимальные стратегии, а игрок Pm применяет произвольное допустимое управление.
Вычисляем производную
d ε m (t )
e
e
e
e
e
= − xm
(t )um
(t ) + xm
(t )um (t ) = − max xm
(t )um + xm
(t ) ≤ 0 ,
dt
um∈U m
таким образом, при замене в (13) (или в (14)) произвольного допустимого
управления игрока Pm на оптимальное функция ε m (t ) не возрастает, т.е.
ε m (t ) ≤ ε m (t0 ) . Следовательно доказана
Physics and mathematics sciences. Mathematics
79
Известия высших учебных заведений. Поволжский регион
Теорема 1. Оптимальные стратегии, определяемые равенствами (9), когда k = 1, m − 1 и (11) при k = m, уравновешивают в смысле Нэша систему
функционалов (3), (4).
Пусть теперь динамика управляемого объекта описывается системой
t
m t

x (t ) = f (t ) + A(t ) x(t ) + K (t , s )x( s )ds +
  Bi (t, s)u(s)ds, x(0) = x0 ,
(15)
i =1 0
0
на которую дополнительно к (2) наложены следующие ограничения: f(t) –
функция с ограниченной вариацией на [0, и]; Bi (t , s ) – непрерывные при
0 ≤ s ≤ t ≤ θ матрицы n × ri с интегрируемыми по Лебегу производными по
первому аргументу; ui (t ) ∈U i , U i – ограниченные выпуклые замкнутые
множества в R ri .
Решение (15) с заданным начальным условием записывается следующим образом [6]:
t

x(t ) = X (t ,0) x0 + X (t , s )Ψ ( s,0)dsϕ(0) +
0
t t
t m t


 X (t , τ)χi (τ, s ) d τ  ui ( s ) ds,
+  X (t , τ) Ψ ( τ, s )d τ d ϕ( s ) +




0 s
0 i =1  s


 

(16)
здесь ϕ(t ) = f (t ) + Φ (t ,0) x0 – функция с ограниченной вариацией и, следовательно, интеграл Стилтьеса, содержащийся в правой части (16), существует;
t

Ψ (t , s ) = E + R (t , τ)d τ , Е – единичная матрица; R(t, s) – резольвента матрицы
s
t
Ф(t, s), χi (t , s ) = Ψ (t , s ) Bi ( s, s ) +

s
∂Bi ( τ, s )
dt , теперь обозначим
∂τ
θ

x(θ, t0 ) = X (θ,0) x0 + X (θ, s )Ψ ( s,0)ds ϕ(0) +
0
t0 m  θ
θ θ


 X (θ, τ)χi (τ, s )d τ  ui [ s ]ds,
+  X (θ, τ)Ψ ( τ, s )d τ  d ϕ( s ) + +




0 s
0 i =1  s


 

тогда состояние системы (15) в момент t, t0 ≤ t ≤ θ , определяется формулой
θ

 X (θ, τ)χi (τ, s )d τ ui ( s )ds .


t0 i =1  s

t m
x(θ, t ) = x(θ, t0 ) +
80
 
(17)
University proceedings. Volga region
№ 2 (26), 2013
Физико-математические науки. Математика
С помощью формулы состояния (17) динамической системы(15) решаем задачу (1). Для любой начальной позиции (t0 , x(θ, t0 )) , t0 ∈ [0, θ) , решаем
вспомогательную задачу нахождения экстремального вектора lk0 , k = 1, m :
θ


ε k (t0 , x(θ, t0 ), Ck ) = max l '(Ck − x(θ, t0 )) − max (l ' xk (θ, s )uk ( s) ds −
l =1 
u ∈U
t0 k k




−
min {l ' xi (θ, s )}ui ( s ) ds  ;
u ∈U

i =1 t0 i i

i≠k
m θ

(18)
θ

xi (θ, s ) = X (θ, τ)χi (τ, s )d τ , i = 1, m .
(19)
s
Пусть lk0 – решение задачи (18), тогда обозначим xke (t0 ) = lk0' ⋅ xk (θ, t0 ),
для игрока Pk , k = 1, m , оптимальное управление определяется условием
xke (t )uke (t ) = max xke (t )uk , t ∈ [t0 , θ) , k = 1, m .
uk ∈U k
(20)
Оптимальные стратегии, определяемые равенствами (20), уравновешивают в смысле Нэша систему функционалов (1) [7].
Решаем теперь задачу 1 для функционалов (3), (4) и управляемой системы (15). Записываем функцию по аналогии с (12):
θ

j (t , x(θ, t ), d ) = max l '(d − x(θ, t ) − max {l ' x (θ, s )}u ( s )ds −
εm
0
0
0
j
j
m
m
l =1 
u ∈U
t0 m m



−
min {l ' xi (θ, s )}ui ( s )ds  ,

ui ∈U i
i =1 t0

m −1 θ

(21)
xi (θ, s ) определяется формулой (19).
Решением задачи (21) является единственный вектор l 0j , теперь записываем функцию
r
ε m (t ) =

ε mj (t , x(θ, t ), d j ) =
j =1
 α j l 0j ′ (d j − x(θ, t0 )) −
j =1
t
−
r
r
0′
 u ∈U {α j l j xm (θ, s)}um (s)ds −
max
t0
m
m
j =1
Physics and mathematics sciences. Mathematics
81
Известия высших учебных заведений. Поволжский регион
θ r
m −1 θ
r
0′ 
−
{α j l j xm (θ, s )}um ( s )ds −
min
{α j l 0j ′ x j (θ, s )}uie ( s )ds,
ui ∈U i
i =1 t0
j =1
t j =1


0
обозначим lm
=

(22)
r
 α j l 0j , тогда оптимальная стратегия m-го игрока определяj =1
ется условием
e
e
e
(t ) ⋅ um
(t ) = max xm
(t ) ⋅ u m ,
xm
um∈U m
(23)
e
0' 
(t ) = lm
⋅ xm (θ, t ) ; равенство (22) записываем следующим образом:
где xm
r
ε m (t ) =

α j l 0'
j (d j
t

e
e
− x(θ, t0 )) − xm
( s )u m
( s )ds −
j =1
t0
θ

e
− xm
( s )um ( s )ds −
m −1 θ
  xme (s)uie (s),
(24)
i =1 t0
t
0' 
в (22) xie ( s ) = lm
xi (θ, s ); ε m (θ) – значение ε m (t ) при t = θ , когда все игроки
на [t0, θ) применяют свои оптимальные управления; ε m (t0 ) – значение ε m (t ) ,
при t = t0, когда игрок Pk применяет произвольное допустимое управление,
а остальные игроки свои оптимальные управления.
Дифференцируя (24), получаем
d ε m (t )
e
e
e
e
e
= − xm
(t )um
(t ) + xm
(t )um (t ) = − max xm
(t )um (um ) + xm
(t )um (t ) ≤ 0,
dt
uk ∈U k
следовательно, при подстановке в (22) оптимального управления игрока Pm
значения ε m (t ) не возрастают, таким образом, ε m (θ) ≤ ε m (t0 ) , что доказывает следующую теорему.
Теорема 2. Оптимальные стратегии, определяемые равенствами (20),
когда k = 1, m − 1 и (23) при k = m, уравновешивают в смысле Нэша систему
функционалов (3), (4).
Будем теперь рассматривать управляемую систему, динамика которой
описывается системой линейных интегральных уравнений Вольтерра 2-го рода:
t

x(t ) = f (t ) + A(t , s ) x( s )ds +
0
m t
  Bi (t , s)ui (s)ds,
(25)
i =1 0
x(t) – n-мерный фазовый вектор; f(t) – n-мерная вектор-функция с ограниченной вариацией; A(t , s ), Bi (t , s ), i = 1, m, – матрицы n × n , n × ri соответственно, непрерывно дифференцируемые по первому аргументу и непрерывные по
второму.
82
University proceedings. Volga region
№ 2 (26), 2013
Физико-математические науки. Математика
Тогда [8, 9] состояние системы (25) в момент t ∈ [t0 , θ) определяется
формулой
θ

x(θ, t ) = Ô (θ,0) f (0) + Ô (θ, s )df ( s ) +
0
m t0
m t
i =1 0
i =1 t0
  X i (θ, s)ui [s]ds +   X i (θ, s)ui (s)ds ,
t

где Ô (t , s ) = E + R (t , τ) d τ , Е – единичная матрица; R(t, s) – резольвента матs
θ

рицы A(t, s), X i (θ , s ) = Ô (θ, s ) Bi ( s, s ) + Ô (θ, τ)
s
∂Bi (τ, s )
d τ.
∂τ
Как было показано в [7, 8], l 'Ô (θ, t ) = *x(t ) является решением интеθ

грального уравнения *x(t ) = l '+ *x( s ) * A( s, t )ds, сопряженного уравнению
t
t

x(t ) = f (t ) + A(t , s ) x( s )ds,
0
t
где * A(t , s ) = A(t , t ) +

s
∂A(t , τ)
d τ , тогда
∂t
θ

l ′X i (θ, t ) = *x(t ) Bi (t , t ) + *x( s )
t
∂Bi ( s, t )
ds .
∂s
m t0
θ
Обозначив

x(θ, t0 ) = Ô (θ,0) f (0) + Ô (t , s ) df ( s ) +
  X i (θ, s)ui (s)ds,
i =1 0
0
получаем равенство:
m t
x(θ, t ) = x(θ, t0 ) +
  X i (θ, s)ui (s)ds,
(26)
i =1 t0
которое определяет позицию игры в момент t как пару {t, x(θ, t)}; {t0, x(θ, t0)} –
начальная позиция.
Записываем выражение
θ


ε(t0 , x(θ, t0 ), ck ) = max l '(ck − x(θ, t0 ) − max {l ' X k (θ, s )} uk ( s ) ds −
l =1 
u ∈U
t0 k k



m
−
{l '⋅ X i (θ, s )}ui ( s )ds  .
 umin
∈U

i =1
i≠k
k
k
Physics and mathematics sciences. Mathematics
(27)

83
Известия высших учебных заведений. Поволжский регион
Оптимальная стратегия игрока Pk согласно (27) определяется соотношением {lk0′ X k (θ, t )}uke (t ) = max {l 'k X k (θ, t )}uk , здесь lk0 = lk0 (t , x(θ, t )) – реuk ∈U k
шение задачи (27) в каждый момент t ∈ [t0 , θ).
Обозначим xke (t ) = {lk0′ X k (θ, t )} , тогда получаем соотношения, определяющие оптимальные стратегии игроков в следующей форме:
xke (t )uke = max xke (t )uk .
(28)
uk ∈U k
Оптимальные стратегии, построенные согласно соотношению (28),
уравновешивают в смысле Нэша систему функционалов (1), [9].
Решаем теперь задачу 1. Составляем функции

ε mj (t0 , x(θ, t0 ), d j ) = max l '( d j
l =1 
t
− x(θ, t0 ) −

{l ' X m (θ, s )}um ( s )ds −
 umax
∈U
t0
m
m

− {l ' X m (θ, s )}um ( s ) ds −
min {l '⋅ X i (θ, s )}ui ( s )ds  .

ui ∈U i
i =1 t0
t

θ
m −1 θ


(29)
После нахождения единственного решения l 0j задачи (29) записываем
функцию
r
ε m (t ) =

α j ε mj (t , x(θ, t ), d j ) =
j =1
r
0
 u ∈U {α j l ' j X m (θ, s)⋅}um (s)ds −
max
m
0
m
j =1
θ r

−
{α j l '0j
t j =1
X m (θ, s )}um ( s ) ds −
m −1 θ r
  {α j l '0j X j (θ, s)}uie (s)ds .
(30)
i =1 t0 j =1
r
Обозначим
 α j l '0j (d j − x(θ, t0 )) −
j =1
t
−
r

e
αi l 0'
j X m (θ, s ) = xm ( s ),
j =1
r
 α j l 0'j X i (θ, s) = xme (s) , i = 1, m − 1 ,
j =1
тогда
r
ε m (t ) =

α j l 0j ′ (d j − x(θ, t0 )) −
j =1
θ

e
− xm
( s )um ( s )ds −
t
84
t
 umax
∈U
t0
m −1 θ
m
e
xm
( s )um ( s )ds −
m
  xme (s)uie (s)ds ,
(31)
i =1 t0
University proceedings. Volga region
№ 2 (26), 2013
Физико-математические науки. Математика
где ε m (t0 ) – значение ε m (t ) , когда игрок Pk в течение всей игры применяет
произвольную допустимую стратегию, а остальные свои оптимальные стратегии; ε m (θ) – значение ε m (t0 ) , когда все игроки применяют свои оптимальные стратегии. Дифференцируем (31):
d ε m (t )
e
e
e
= − max xm
(t ) ⋅ um + xm
(t ) ⋅ um
≤0.
dt
uk ∈U k
Таким образом, если игрок Pk применяет стратегию
e
e
e
xm
(t ) ⋅ um
(t ) = max xm
(t )um ,
uk ∈U k
(32)
функция не возрастает, тогда ε m (t ) ≤ ε(t ) . Следовательно, доказана теорема.
Теорема 3. Оптимальные стратегии, описываемые условиями (28), когда k = 1, m − 1 и (32) при k = m, уравновешивают систему функционалов (3),
(4) в смысле Нэша.
Список литературы
1. К р а с о в с к и й , Н . Н . Игровые задачи о встрече движений / Н. Н. Красовский. –
М. : Наука, 1970. – 420 с.
2. С у б б о ти н , А . И . Оптимизация гарантии в задачах управления / А. И. Субботин, А. Г. Ченцов. – М. : Наука, 1981. – 288 с.
3. Г о р о х о в и к , В. В. О линейных дифференциальных играх нескольких лиц /
В. В. Гороховик, Ф. М. Кириллова // Управляемые системы : сб. тр. – Вып. 10. –
Новосибирск, 1971. – С. 3–9.
4. Г н е д е н к о , Б. В. Курс теории вероятностей / Б. В. Гнеденко. – М. : Наука,
2005. – 448 с.
5. П а с и к о в ,
В.
Л.
Позиционное управление линейными интегродифференциальными системами Вольтерра для случая управляющих воздействий
вне интеграла / В. Л. Пасиков // Известия РАЕН. Дифференциальные уравнения. –
2008. – № 13. – С. 95–101.
6. П а с и к о в , В. Л. Задачи сближения-уклонения для линейных интегродифференциальных систем Вольтерра с управляющими воздействиями под знаком интеграла / В. Л. Пасиков // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. – 2011. – № 2. – С. 58–70.
7. П а с и к о в , В. Л. Игровые задачи наведения для линейных интегродифференциальных систем Вольтерра с управляющими воздействиями под знаком интеграла / В. Л. Пасиков // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. – 2012. – № 2.
8. П а с и к о в , В. Л. Экстремальное прицеливание в игре линейных систем Вольтерра / В. Л. Пасиков // Дифференциальные уравнения. – 1986. – Т. XXII, № 5. –
С. 907–909.
9. П а с и к о в , В. Л. Игровые задачи для систем интегральных уравнений Вольтерра / В. Л. Пасиков. – Рязань : Рязанский ордена «Знак почета» госпединститут,
1983. – 42 с.
References
1. Krasovskiy N. N. Igrovye zadachi o vstreche dvizheniy [Game problem on motions
meeting]. Moscow: Nauka, 1970, 420 p.
2. Subbotin A. I., Chentsov A. G. Optimizatsiya garantii v zadachakh upravleniya [Assurance optimization in control problems]. Moscow: Nauka, 1981, 288 p.
Physics and mathematics sciences. Mathematics
85
Известия высших учебных заведений. Поволжский регион
3. Gorokhovik V. V., Kirillova F. M. Upravlyaemye sistemy: sb. tr. – Vyp. 10 [System
control: collected papers – Issue 10]. Novosibirsk, 1971, pp. 3–9.
4. Gnedenko B. V. Kurs teorii veroyatnostey [Probability theory course]. Moscow: Nauka,
2005, 448 p.
5. Pasikov V. L. Izvestiya RAEN. Differentsial'nye uravneniya [Bulletin of the Russian
Academy of Natural Sciences. Differential equations]. 2008, no. 13, pp. 95–101.
6. Pasikov V. L. Izvestiya vysshikh uchebnykh zavedeniy. Povolzh-skiy region. Fizikomatematicheskie nauki [University proceedings. Volga region. Physics and mathematics
sciences]. 2011, no. 2, pp. 58–70.
7. Pasikov V. L. Izvestiya vysshikh uchebnykh zavedeniy. Povolzh-skiy region. Fizikomatematicheskie nauki [University proceedings. Volga region. Physics and mathematics
sciences]. 2012, no. 2.
8. Pasikov V. L. Differentsial'nye uravneniya [Differential equations]. 1986, V. XXII, no.
5, pp. 907–909.
9. Pasikov V. L. Igrovye zadachi dlya sistem integral'nykh uravneniy Vol'terra [Gamy
problems for Volterra integral equations system]. Ryazan: Ryazanskiy ordena «Znak
pocheta» gospedinstitut, 1983, 42 p.
Пасиков Владимир Леонидович
кандидат физико-математических
наук, доцент, кафедра естественноматематических дисциплин, Орский
филиал Оренбургского государственного
института менеджмента (Оренбургская
область, г. Орск, Орское шоссе, 4)
Pasikov Vladimir Leonidovich
Candidate of physical and mathematical
sciences, associate professor,
sub-department of natural
and mathematical disciplines, Orsk branch
of Orenburg State Institute of Management
(Orenburg region, Orsk, 4 Orskoe road)
E-mail: pasikov_fmf@mail.ru
УДК 517.977
Пасиков, В. Л.
К теории линейных динамических неантагонистических игр /
В. Л. Пасиков // Известия высших учебных заведений. Поволжский регион.
Физико-математические науки. – 2013. – № 2 (26). – С. 75–86.
86
University proceedings. Volga region
Документ
Категория
Без категории
Просмотров
3
Размер файла
439 Кб
Теги
неантагонистические, игр, линейный, теория, динамическое
1/--страниц
Пожаловаться на содержимое документа