close

Вход

Забыли?

вход по аккаунту

?

Гарантированный результат в задаче минимизации расстояния с интегральным ограничением.

код для вставкиСкачать
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
С. Р. АЛЕЕВА
ГАРАНТИРОВАННЫЙ РЕЗУЛЬТАТ
В ЗАДАЧЕ МИНИМИЗАЦИИ РАССТОЯНИЯ
C ИНТЕГРАЛЬНЫМ ОГРАНИЧЕНИЕМ
Рассматривается однотипная игра, в которой первый игрок имеет интегральное ограничение на управление, а второй — геометрическое. Цель первого игрока
состоит в минимизации расстояния между игроками в фиксированный момент времени p при ограниченном запасе ресурса, цель второго противоположна. Строятся
управления игроков, гарантирующие выполнение цели.
Kлючевые слова: дифференциальные игры, интегральное ограничение, гарантированный результат.
Введение
Из [1] известно, что линейные задачи управления с фиксированным моментом окончания можно с помощью линейной замены переменных свести к задаче
с простым движением. При такой замене переменных дифференциальная игра
сводится к виду, когда вектограммы игроков в каждый момент времени гомотетичны одному и тому же выпуклому симметрическому компакту. Такой класс игр
называется классом однотипных игр. Решение однотипной задачи с интегральными ограничениями сводится к экстремальной задаче. Область достижимости при
интегральных ограничениях нелинейно зависит от потраченного запаса ресурсов.
Это обстоятельство может приводить к дополнительным трудностям при построении оптимальных стратегий. В теории позиционных игр реализовавшееся движение понимается как пучок функций, каждая из которых является равномерным пределом некоторой последовательности ломаных при диаметре разбиения,
стремящемся к нулю. В данной работе используется это определение реализовавшегося движения. Предлагается алгоритм построения гарантирующих стратегий
игроков при начальном положении t0 , z0 и ресурсе, ограниченном величиной µ0 .
Придерживаясь такой стратегии, первый игрок может сделать расстояние между игроками в конечный момент времени не больше чем цена игры, а второй
игрок не меньше чем цена игры. Теоретическое обоснование результата приведено в [2; 3], также для разного вида однотипных игр в [4; 5] решалась задача о
минимизации запаса ресурса.
42
С. Р. Алеева
1. Постановка задачи
Игра «мальчик и крокодил» может быть сведена к однотипной игре с фиксированным временем окончания p [1]:
ż = −(p − t)u + bv; b > 0, z, u, v ∈ Rn ; kvk 6 1,
µ̇ = −ku(t)k2 , µ > 0.
(1)
Стратегией первого игрока является функция вида
u = ϕ(t)w(t, z),
здесь w(t, z) любая функция, удовлетворяющая равенству
kw(t, z)k = 1.
Функция ϕ ∈ L2 [t, p] неотрицательна, строится в зависимости от начального состояния t0 , z0 , µ0 и удовлетворяет неравенству
Z p
ϕ2 (t)dt 6 µ0 .
t0
Стратегия второго игрока — любая функция v(t, z), удовлетворяющая неравенству
kv(t, z)k 6 1.
Рассмотрим задачу, когда цель первого игрока заключается в минимизации расстояния между игроками в конечный момент времени p:
(2)
kz(p)k → min,
при условии осуществления неравенства
Z p
ϕ2 (t) dt 6 µ0 .
t0
То есть первый игрок минимизирует расстояние между игроками, используя для
этого ограниченный ресурс.
2. Аналитическое решение задачи
В гл. 1 [3] в общем виде было доказано, что существует решение ϕ0 (t) задачи
Z p
G(t0 , z0 , µ0 ) = inf G∗ (t0 , z0 , ϕ(·)), ϕ(t) > 0,
ϕ2 (t)dt 6 µ0 ,
(3)
ϕ(·)
t0
где для нашей задачи (1)
G∗ (t0 , z0 , ϕ(·)) = max{F (t0 , ϕ(·)); kz0 k + f (t0 , ϕ(·))},
Z p
(b − (p − r)ϕ(r)) dr,
f (t, ϕ(·)) =
t
F (t0 , ϕ(·)) = max f (τ, ϕ(·)),
t0 6τ 6p
43
Гарантированный результат в задаче минимизации расстояния. . .
при этом G(t0 , z0 , µ0 ) является ценой игры (1) с целью (2), а функция ϕ0 (t) используется в построении управления, гарантирующего результат. Перейдем к непосредственному построению цены в зависимости от начальных условий t0 , z0 , µ0
и времени окончания p.
2.1. Построение цены игры
Ценой игры является минимальное значение следующей величины
Z p
(p − r)ϕ(r) dr ;
G∗ (t0 , z0 , ϕ(·)) = max max b(p − τ ) −
t0 6τ 6p
τ
Z p
kz0 k + b(p − t0 ) −
(p − r)ϕ(r) dr ,
t0
поэтому от ее вида зависит значение цены при фиксированных начальных условиях.
2.1.1. Случай 1
Пусть
kz0 k + b(p − t0 ) −
Z
p
t0
(p − r)ϕ(r) dr > max
t0 6τ 6p
Тогда задача (3) принимает вид
Z p
kz0 k + b(p − t0 ) −
(p − r)ϕ(r) dr → min,
b(p − τ ) −
Z
p
τ
(p − r)ϕ(r) dr . (4)
Z
ϕ(t) > 0,
t0
p
ϕ2 (t) dt 6 µ0 .
t0
Решением этой задачи является функция
s
3µ0
ϕ0 (t) =
(p − t).
(p − t0 )3
(5)
Теперь выясним, какие начальные условия характеризуют (4). Предположим,
что максимум в правой части достигается в точке τ ∗ ∈ [t0 , p], тогда условие (4)
примет вид
Z
τ∗
kz0 k + b(p − t0 ) −
t0
(p − r)ϕ(r) dr > 0.
(6)
Возможны следующие случаи.
1. Пусть τ = t0 , тогда в силу убывания b(p − τ ) −
∗
Z
p
τ
(p − r)ϕ0 (r) dr имеем
b2
−b + (p − t0 )ϕ0 (t0 ) 6 0 и при любом z0 и 0 < p − t0 6
3µ0
r
µ0
(p − t0 )3 .
G(t0 , z0 , µ0 ) = kz0 k + b(p − t0 ) −
3
(7)
44
С. Р. Алеева
2. τ ∗ 6= p, так как в противном случае −b+(p−t)ϕ0 (t) 6 0 при любом t ∈ [t0 , p],
но b > 0.
3. Пусть τ ∗ ∈ (t0 , p), тогда −b + (p − τ )ϕ0 (τ ) = 0 и −b + (p − t0 )ϕ0 (t0 ) > 0, из
данных условий и вида (5) получаем ограничение для начальных значений
b2
p − t0 >
. Остается предъявить ограничение для z0 . Предположим, что
3µ0
kz0 k >
3µ2
2b3
− b(p − t0 ) + 30 (p − t0 )3 .
9µ0
b
Покажем, что при p − t0 >
(8)
b2
выполнено
3µ0
2b3
3µ2
− b(p − t0 ) + 30 (p − t0 )3 > 0.
9µ0
b
(9)
В самом деле, рассмотрим функцию
3µ20 3
2b3
9µ20 2
′
h(x) = 3 x − bx +
, h (x) = 3 x − b
b
9µ0
b
2 2
6
3
2
3µ
b
2b
b
b
= 30 ·
+
= 0.
−b
иh
3
3µ0
b
27µ0
3µ0 9µ0
Следовательно, h(p − t0 ) > 0 и условие (9) выполнено.
Из (6) следует, что
kz0 k > b(p − τ ∗ ) − b(p − t0 ) −
s
3µ0
(p − τ ∗ )3 − (p − t0 )3
·
.
(p − t0 )3
3
(10)
Сделаем замену p − τ ∗ = t, при t ∈ (0, p − t0 ) введем функцию
g1 (t) = bt − b(p − t0 ) −
g1′ (t) = b −
s
s
3µ0
t3 − (p − t0 )3
·
,
(p − t0 )3
3
3µ0
· t2 = 0.
3
(p − t0 )
С учетом рассматриваемого интервала едиственная точка экстремума удовлетворяет соотношению
v s
u
u
(p − t0 )3
,
p − τ ∗ = tb
3µ0
v s
u
u
(p − t0 )3
τ ∗ = p − tb
.
3µ0
(11)
45
Гарантированный результат в задаче минимизации расстояния. . .
Так как g1′ (0) > 0, а g1′ (p − t0 ) < 0, то при τ ∗ из (11) достигается максимум
g1 (t) и
(p − τ ∗ )3 − (p − t0 )3
b
·
=
(p − τ ∗ )2
3
2
b(p − t0 )3
=
b(p − τ ∗ ) − b(p − t0 ) +
=
3
(p − τ ∗ )2
r
µ0 (p − t0 )3
2
b(p − τ ∗ ) − b(p − t0 ) +
.
=
3
3
g1 (p − τ ∗ ) = b(p − τ ∗ ) − b(p − t0 ) −
Теперь
2b3
3µ2
− b(p − t0 ) + 30 (p − t0 )3
9µ0
b
max g1 (t) = g1 (p − τ ∗ ) >
(0,p−t0 )
b2
и при выполнении условия (8) будет выполнено (10).
3µ0
Поэтому окончательно имеем при
для p − t0 >
3µ2
2b3
− b(p − t0 ) + 30 (p − t0 )3 ,
9µ0
b
kz0 k >
p − t0 >
b2
,
3µ0
как и в (7),
G(t0 , z0 , µ0 ) = kz0 k + b(p − t0 ) −
r
µ0
(p − t0 )3 .
3
2.1.2. Случай 2
Пусть теперь
kz0 k + b(p − t0 ) −
или
Z
p
t0
(p − r)ϕ(r) dr 6 max
t0 6τ 6p
∗
kz0 k + b(τ − t0 ) −
У нас есть следующие ограничения:
Z
b(p − τ ) −
Z
p
τ
(p − r)ϕ(r) dr
τ∗
t0
(p − r)ϕ(r) dr 6 0.
b2
,
3µ0
3µ2
2b3
− b(p − t0 ) + 30 (p − t0 )3 .
kz0 k <
9µ0
b
b2
Найдем точку s ∈ t0 , p −
из уравнения
3µ0
p − t0 >
kz0 k = b(p − s) − b(p − t0 ) +
b
(p − t0 )3 − (p − s)3 .
2
3(p − s)
(12)
(13)
(14)
(15)
46
С. Р. Алеева
Изучим вопрос о существовании решения
(15) при условиях
2 уравнения
2
b
b
< p − s 6 p − t0 . Обозначим p−s = x ∈
, p − t0 и рассмотрим функцию
3µ0
3µ0
g2 (x) = bx − b(p − t0 ) +
Тогда (15) имеет вид
b
3
3
.
(p
−
t
)
−
x
0
3x2
(16)
kz0 k = g2 (x),
b
2b x3 − (p − t0 )3
2b
3
(p
−
t
)
−
=
·
6 0,
0
3x3
3
3
x3
поэтому на рассматриваемом промежутке
g2′ (x) = b −
g2 (x) 6
2b3
3µ2 (p − t0 )3
.
− b(p − t0 ) + 0 3
9µ0
b
Рассматриваем только kz0 k, удовлетворяющие
приэтом ограничении урав (14),
b2
нение (16) имеет единственный корень x ∈
, p − t0 , так как g2 (x) убывает
3µ0
3µ2 (p − t0 )3
2b3
до g2 (p − t0 ) = 0, а kz0 k находится на этом про− b(p − t0 ) + 0 3
от
9µ0
b
межутке в силу (14). Следовательно, s = p − x удовлетворяет условиям
t0 6 s < p −
b2
.
3µ0
(17)
Замечание 1. При z0 = 0 значение s = t0 .
Будем искать решение ϕ0 (t) в следующем виде:

b
∗

 (p−s)2 (p − t), t0 6 t 6 τ ;
b
,
s < t < τ ∗;
ϕ0 (t) =
(p−t)

b

(p − t), τ ∗ 6 t 6 p.
(p−τ ∗ )2
(18)
Замечание
2. Z При таком выборе ϕ0 (t) выполняется условие (12),
s
kz0 k + b(s − t0 ) −
(p − r)ϕ(r) dr = 0.
t0
Осталось проверить условие (3). Подставим (18) в это ограничение:
b2
(p − s)4
Z
s
2
t0
(p − r) dr + b
2
Z
τ∗
s
b2
dr
+
(p − r)2 (p − τ ∗ )4
Z
p
τ∗
(p − r)2 dr = µ0 .
Получаем условие для определения τ ∗ :
4b2
b2 (p − t0 )3
4b2
=
µ
+
−
.
0
3(p − τ ∗ )
3(p − s)
3(p − s)4
(19)
47
Гарантированный результат в задаче минимизации расстояния. . .
Так как s 6 τ ∗ , то правая часть в (19) должна быть не меньше чем
Имеем условие существования ϕ0 (t) в виде (18):
4b2
.
3(p − s)
3µ0 (p − s)4 − b2 (p − t0 )3 > 0.
(20)
Замечание 3. При s = t0 и выполнении (13) условие (20) выполняется
строго,
2
b
поэтому (20) выполняется и при других значениях s ∈ t0 , p −
.
3µ0
Цена игры при kz0 k <
b2
3µ2
2b3
− b(p − t0 ) + 30 (p − t0 )3 и p − t0 >
:
9µ0
b
3µ0
2
G(t0 , z0 , µ0 ) = b(p − τ ∗ ).
3
(21)
Таким образом, цена игры вычисляется в зависимости от начальных значений t0 ,
z0 , µ0 , времени окончания p и имеет либо вид (7), либо (21).
2.2. Гарантирующие стратегии игроков
При условии, что есть начальные условия из областей, запишем полученные
решения.
b2
I. Пусть 0 < p − t0 6
, любое z0 . Тогда
3µ0
s
3µ0
(p − t),
ϕ0 (t) =
(p − t0 )3
G(t0 , z0 , µ0 ) = kz0 k + b(p − t0 ) −
r
µ0
(p − t0 )3 .
3
r
µ0
(p − t0 )3 .
3
2b3
3µ20
b2
, kz0 k >
− b(p − t0 ) + 3 (p − t0 )3 имеем
II. При p − t0 >
3µ0
9µ0
b
s
3µ0
(p − t),
ϕ0 (t) =
(p − t0 )3
G(t0 , z0 , µ0 ) = kz0 k + b(p − t0 ) −
2b3
3µ2
b2
, kz0 k <
− b(p − t0 ) + 30 (p − t0 )3 , то
3µ0
9µ0
b

b
∗

 (p−s)2 (p − t) , t0 6 t 6 τ ;
b
, s < t < τ ∗;
ϕ0 (t) =
(p−t)

b

(p − t) , τ ∗ 6 t 6 p ;
(p−τ ∗ )2
III. Если p − t0 >
2
G(t0 , z0 , µ0 ) = b(p − τ ∗ ),
3
48
С. Р. Алеева
где τ ∗ удовлетворяет условию (19).
Cтратегией первого игрока, гарантирующей выполнение цели, является u =
ϕ0 (t)w(z), стратегией второго игрока будет v = w(z), где
w(z) = z/kzk при kzk 6= 0;
w(z) = s, ∀s : ksk = 1, при kzk = 0.
Список литературы
1. Красовский, Н. Н. Позиционные дифференциальные игры / Н. Н. Красовский,
А. И. Субботин. — М. : Наука, 1974.
2. Алеева, С. Р. Однотипная игра с интегральным ограничением первого игрока /
С. Р. Алеева, В. И. Ухоботов // Вестн. Челяб. гос. ун-та. — 1999. — № 1 (4). —
Математика. Механика. Информатика. — С. 16–29.
3. Алеева, С. Р. Моделирование гарантированного результата в задачах управления движением с интегральными ограничениями в условиях воздействия помех :
дис. . . . канд. физ.-мат. наук / С. Р. Алеева. — Челябинск, 2002. — 145 с.
4. Алеева, С. Р. Дифференциальная игра «мальчик и крокодил» с интегральным
ограничением преследователя / С. Р. Алеева ; Челяб. гос. ун-т. — Челябинск,
1999. — 10 с. — Деп. в ВИНИТИ 04.10.99, № 2985–В99.
5. Алеева, С. Р. Об одной дифференциальной игре с интегральным ограничением /
С. Р. Алеева // Математика. Механика. Информатика : материалы Всерос. науч.
конф., Челябинск, 19–22 сент. 2006 г. / отв. ред. С. В. Матвеев. — Челябинск :
Челяб. гос. ун-т, 2007. — C. 7–13.
Документ
Категория
Без категории
Просмотров
5
Размер файла
210 Кб
Теги
интегральная, результаты, ограничений, гарантированное, минимизации, расстоянии, задачи
1/--страниц
Пожаловаться на содержимое документа