close

Вход

Забыли?

вход по аккаунту

?

Нелинейная игровая задача преследования на плоскости.

код для вставкиСкачать
УЧЕНЫЕ
Тоя
удк
ЗАПИСКИ
V
ЦАГИ
1974
МБ
518.9
НЕЛИНЕЙНАЯ ИГРОВАЯ ЗАДАЧА ПРЕСЛЕДОВАНИЯ
НА ПЛОСКОСТИ
Ю. н. Желнин, Ю. Я. Шилов
Рассматривается нелинейная задача преследования на
плоскости
для двух динамических объектов, движущихся в среде с сопротив­
лением, которые могут управлять в сграниченных пределах кривизной
траектории и тангенциальным ускорением. Анализируется структура
опгимадьного управления. Приводятся примеры численного решения
задачи преследованияс несколькими видами критериев оптимальности.
Рассмотрена задача определения границ области, где преследование
может быть осуществлено за конечное время, и
расчетов границ этой области.
приведены примеры
Дадим общую постановку игровой задачи преследования для
двух динамических объектов и приведем необходимые условия
оптимальности управления противников [1-41, которые затем будут
использоваться при решении рассматриваемой в работе конкретной
задачи.
Пусть
поведение
динамических
объектов
описывается
следующими дифференциальными уравнениями
2:1 = /1 (z\, и 1 ) ,
Z2 = 12 (Z2' и 2 ) ,
( 1)
здесь Z!, Z2 -- n-мерные векторы, описывающие фазовые состояния
системы; U l , и 2 - г-мерн ые векторы управлений. Для определенности
индекс
"1" приписывается преследующему объекту, а индекс
"2" - преследуемому. Задача преследования заключается в следую­
щем: преследующий объект стремится "сблизиться" с преследуемым
за минимальное время Т, тог да как его противник стремится
максимально увеличить время. Условием окончания преследования
является выполнение определенных соотношений между фазовыми
координатами объектов. Тогда задача преследования определяется
условием
J=miпmахТ,
и,
G(Zl' z2)lt=T=O.
(2)
U'J
85
Эта постановка задачи может быть трансформирована в следующую
в определенном смысле эквивалентную задачу: время преследования
Т задано
или определяется из некоторых других соображений, а в­
качестве критерия оптимальности используется иеноторвя функция,
характеризующая относительное фазовое положение объектов в
конечный
момент времени
J
ппп max·w (Z!, Z2) It=T.
=
и1
(3)
и~
в качестве критерия оптимальности может быть принят фу нк­
ционал, характеризующий относительное положение не только в
момент Т, но и на всем интервале преследования:
т
J
ппп птах \ (.) (ZI' Z2) dt .
=
и,
На
и~
(4)
[о
управляющие параметры и}, и 2 и фазовые координаты в общем
случае
наложены
ограничения
следующего
вида:
(5)
где ср}, СР2
векторы
-
размерности
т
-< r.
Оптимальное управление
для обоих противников в области "регулярности" определяется
следующими необходимыми условиями оптимальности [1-4]
H='fl!l (Z" U1)
+ Ф2j2 (Z2' [[2) - ,
дw
(Т) =--'
дг , '
'1/.)
(Т)
.-
дН _
tfl'
~2
n-мерные
-
ности
т.
воряют
Для
игровую
Отметим,
с
(6)
~
дг
.
2
'
д<р з = О'
,
ди:
вспомогательных
неопределенн ых
переменные,
интегральным
Вариационную
что
-
---
(сопряженных)
множителей
конкретности краевые условия , которым
вспомогательные
следования
з ада ч
векторы
векторы
=
'1.,
ди;
переменных; '1], '12 -
и '2€<P~
.])
, 1
здесь
тiп тах;
UI€ r.pi
задачу
указанные
динамики
полета
выписаны
критерием
к
(3).
двухточечной
постановки
летательных
для
Условия
ра змер­
удовлет­
задачи
пре­
(6)
сводят
краевой
задаче.
охватывают большое число
аппаратов,
представляющих
практичесний интерес.
Перейдем
динамических
каж дый
из
ограниченных
к
задаче
преследования
на плоскости для двух
объектов, движущихся в среде с сопротивлением,
которых
пределах
может
в
процесс е
кривианой
движения управлять в
траектории
и тангенциальным
ускорением. Для уменьшения размерности задачи запишем уравне­
86
ния движения объектов, как
системе координат (фиг. 1):
.=
х
go
- -V!
это
У,]
делается в
в относительной .
[1],
+ V2 .
вгп ер;
(7)
go -- ускорение
здесь
v2 -
щие
силы
тяжести;
1" 12' 'lJ1> 'lJ2 -
скорости;
QI'
параметры;
Q2 -
v1,
управляю­
сопротивле­
ние внешней среды, которое в общем слу­
чае зависит
параметров
от
скорости
11, 12;
ТОв. Заметим,
т -,
что
и
mz -
управляющих
массы о бъек­
приведенные
уравне­
НИя описывают движение в атмосфере
летательных аппаратов, обладающих тя­
гой и перемещаюшихся в горизонтальной
плоскости.
Управляющие
параметры
обоих объектов ограничены по величине
и
удовлетворяют
ствам:
раметров
1
от
неравен­
11 1-< Iшах (v), 0-< 'lJ -< 'lJma x (v).
хПредельные
Фиг.
следующим
значения
(8)1
управляющих па ­
l' 'lJ в общем случае зависят
скорости.
В качестве критерия оптимальности рассмотрим функционал
вида (3), характеризующий относительное положение противников
в конечный момент времени Т. Структура функции w з а в и с и т от
конкретных целей, которые ставятся
в задаче преследования, и
может
быть
достаточно
рассматривается
противниками
виз ирования
образом
и
крит ерий,
разнообразной.
ориентации
и в общем
В
КОТОрЫЙ зависит
их
настоящей
от
скоростей
расстояния
относительно
работе
между
линии
виде может быть пре дставлен следующим
J = ппп тах w (г, ql' q ~) It=T.
(9)
Т " 1)1 Т , , 1),
Здесь
r-
расстояние
между
объектами;
q1
и
q2 - углы
между
линией визирования и направлением скорости (см. фиг . 1).
Оптимальные значения управляющих параметров определяется
из условия максиминв гамильтониана системы (7) и удовлетворяют
следующим
соотношениям:
l
(10)
}
87
Вспомогательные
переменные ЧJ х' ЧJУ' ЧJ""
ЧJ1 v. ЧJ2 v удовлетворяют
следующей системе дифференциальных уравнений:
)
I
I
(11 )
f
I
I
Для
краткости здесь приведена
случая,
когда
максимальные
вспомогательная система
значения
управляющих
для
параметров
не зависят от скорости. Эта зависимость может быть легко учтена
в соответствии со стандартной процедурой [4].
12'
Соотношения
получены
в
определяющие оптимальное управление 11,
предположении, что сопротивления Q[, Q2 не
(10),
зависят
от управлений
зависят
от
указанных
соотношений
когда
11
меняется.
зависимость
и
12,
соответственно если сопротивления
управляющих
пара метров,
Рассмотрим
сопротивления
то
характер
для определенности
от
управления
этих
случай,
определяется
следующим образом:
(12)
Здесь
Qo (v),
k (v) -
заданные
функции
скорости.
Отметим,
что
зависимость (12) является характерной для летательных аппаратов.
В этом случае оптимальное управление удовлетворяет следующим
соотношениям:
3g
o
11=- ----­
2k 1v10/ l v '
т1 =
-- 11 птах s1gn '&,
12=
~1v<0
0/", go
2k~V2
0/2 v '
12 = _. 12 птах slgn
.~""
'f2 v
< О,
ЧJ2 v
>О
{\go
I
'f1 ё'>О,
I 2k 1v 10/-1 Z'
Ii 2k
или
1
1
I
.
<;; т. гпа х-
3go
I
v 1 ф1v
<j!<1Jg()
> 11 тпах-.
I
,< в 2тах;
I 0/", go
I
2k v 0/v > 12 гпах-
I 2k з ~~ O/~
или
I
2
Z
2
Помимо управления, определяемого в соответствии с
возможны
траектории
с
"особым"
управлением,
)
I
I
l
I
I
(13)
I
I
(10), (13),
которое
имеет
место, если функции '&, ~"" ЧJl v' ЧJ2 v тождественно равны нулю.
Рассмотрим вначале особое управление для 'lIl' 'lI2' Предполагая,
что .&:/ О, о'" =1= О, замечаем, что в этом случае должны быть выпол­
нены
равенства
ЧJl v
О,
tJi2 v
О. Используя дифференциальные
уравнения дЛЯ ЧJI v' tj;2 v' негрудно получить условия:
=
i
88
(14)
Разрешив
значения
эти
соотношения
скорости
ными для обоих
=
V1
V;, V 2
=
относительно Vj
и 'V2 , найдем
являются оптималь­
которые
V;,
противников. Продифференцировав полученные
'Выражения для скоростей и используя дифференциальные уравне­
ния (7), можно определить управления
которые позволят
'"1);, '"1);,
реализовать
эти
скорости.
Интересно отметить,
условия
максимума
пара метрам
V1
и
и
что соотношения
минимума
Оценивая
V 2•
представляют собой
(14)
гамильтониана
качественно
соответственно
по
эти режимы, можно
<сказать, что они соответствуют наиболее благоприятным в смысле
критерия (9) значениям скорости сближения и обеспечения опти­
мального
углового
Рассмотри.м
возникает
в
полотения.
еще
один
режим
'от скоростигл, тах
~~: + tJi y = О,
+р =
~::
I tJi<p I
'д"'l
дV1
(J)1 =
-
...fL 11'
(J)2
Vl
к«
=
go.
дV2 - '~y
V~ 12 тах
cos
ер
режим
лений 11
(15)
+ V2 дV2
12
гпахэ
+ '1Jx sin ер.
= _..fL 12-- угловые скорости разворота вектоVz
режим соответствует
этот
vjдVj 11 гпахэ
gод
ра скорости объектов. Отсюда следует, что
(экстремальными)
gод
+
vT 11 птах
-
д"'2 _
О,
р =
Здесь
управления, который
11' 12 зависят
этом случае условия (14) могут
В
(V 1 ) , 12max(V 2 ) ,
быть представлены в виде
I~ I
особого
том случае, когда максимальные значения
скоростям
значениями
реализуется
движения
О)1 птах
лишь
при
И
при
V;, V;
(J)2 птах-
'fy =- tJi х == О
особый
с максимальными
Отметим
максимлаьных
также,
значениях
что
управ­
=
11 гпахэ 12 = 12 птах­
Рассмотрим условия особого управления 11. 12' которые имеют
место при ~ _О, tJi<p
О. При
одновременном
выполнении
этих
условий получим с учетом уравнений (11)
~=~хУ-'1Jух+,~'I'
.~<p = О,
откуда
~<p =
:Jix=O' '1J'f-0,
V2
'~gX
О, {}=v j '1Jx== O, }
(16)
('1Jy sin ер - !jJ х со s ер) == О,
О.
Эти условия соответствуют прямолинейному движению против­
ников (11 - О, 12 - О) вдоль оси у.
Рассмотрим теперь случай особого
Нетру дно убедится,
'fх И соответствует
екта,
в
то
линейным
О,
'fу = - 1,
как
= == Х,
выбирается
уравнения
tJi'f
11 -
О,
12
минимума
:::=0, tJi<p
О.
условиях:
-* О
преследующего
преследуемого
из условия
для
управления ~
при следующих
движению
движение
Пусть, наконец,
особое
реа лиэует ся при выполнении
циального
'f<p
прямолинейному
время
и
что он реализуется
является
объ­
криво­
гамильтониана.
управление
преследуемого
объекта
условий ~ =1= О, t.Ji<p
О. Из дифферен­
=
получим
'~x siп ер -
ljJy
соз Ч' = О.
(17)
89
*
Продифф еренцирова в
'fy
это
о, п ол учим :
со отношение
( '1т х COS
из которого, В сил у
10
т
л,I ,1,Ту si n (0Т ) л2.~
V
и
учитывая,
=
о
1'
(17), им е ем
"(2
=0.
объе кт а
-
'Ji...
что
*
о,
J
Отсюда след у ет, что осо бая
тр аектория
пр е с ледуемого
в то время,
к ак движение преслед у ющего
прямолинейное
движени е ,
криво линейное .
-
Угол
9 в относит ельной сист еме координат опреде ляется и з ( 17):
.
S 1П ~
•
=
Ф.,
-----:==
'= =
~/ <!J2 + ф2
IY
( 18)
'
. х
П р и в е д е н н ы е условия особого у правлен и я соответствуют слу ­
чаю, когд а со проти вление Q не зависит от управления l' ДлЯJ
случая, ко гда со проти вление определяется по формуле (12), особое
упра вление за висит от з нака функ ций 'Jil у' 'Ji2 у ' Р а с с м о т р и м осо­
бое управле ние для п р е с л е д у ющ ег о объекта . Е с л и 'Jil у > о, то
особое управле ние сов падает с расс мотрен ны м в ыш е . Действи­
тельно, и з услови я макси мума гамил ьтониана п о л уч и м , ч т о 11 *0,
Фl У> о . Есл и же 'fl V <О , то максимум гамильтониана достигается
п р и "(\
11 ша х- В этом случае особое управление пре дс тавл яет
собой "скольз ящий" режим п р и предельных зна чениях 11, в сред ­
=+
нем приводящий к прямолинейному движению .
После того как условия, определ яющие оптимальное управле­
ние найдены, решения игровой з а да ч и свод итс я )( двухточе чной
краевой з а д а ч е , котора я ре шаетс я численно . Д л я решения крае ­
вой задачи
необходимо
в сп ом огательн ы х
тран сверсальности
решении
зов анием
з а да ч и
найти
п е р е м е н н ы х,
на правом
применялись
неизвестные
при
которых
конце
начальные
з начен ия
выполняются
траектории.
итерационные
При
процед ур ы
условия
численном
с
исполь­
м етода Ньютон а .
Р ассмотрим за д а ч у пре следования, в КОТОрОЙ В
качестве
кри ­
терия оптимальности использ уется время преследо вания (2). Усло­
вие
ОКОНЧdНИЯ
пресл едовани я
задано
V х 2 + у2 !I=T- r -< о,
Здесь
r-
в
ви де
ч.
;t= т =
о.
( 19)
з а да н н о е расстояние между объектами . Вс помогательные
пере ме нные в этом слу чае в м о м е н т времени
следующим
t=
Т удовлетвор яют
соо тн оше ния м :
'~ .,. ( ~.~
,.."( I
+
V 2
si n
ер) -
'fy (v 1 -
v 2 COS 9)
It- T=
1;
)
'fl V It=T= 'f2 v II=T = ?'f lt=T= О.
На фи г .
2
представлены
ре зуль таты
расче то в
(20 )'
оптимал ьных
траек торий пресле дования и у к л о н е н и я в абсолютной (фиг . 2, а ) и
относительной (фиг. 2, б) системах координат . Коор динаты объек­
тов отнесены к некогорой длине, характерной дл я рассм атриваемы х
маневров . Как вид но на фиг . 2, а, противники после некот орого срав­
нител ьно слабого ра зворота движутся п о ч т и прямолинейно, стре ­
мясь к некогорому о п т и м а л ьн о м у для обоих направлению движения .
Управления 11, "(2' определяемые в соотв етствии
гают п р е д е л ь н ы х значений
с (13),
11 птах, "( 2т ах . Управления 1)"
мают максимальные з н а ч е н и я 'У/ l пга х , 'У/2mах н а
90
не д о с т и ­
'У/2
прини ­
вс ей траектории .
И звестно
НОй
игры
[1, 4J,
что все пространство решений дифференциаль­
ра зделено
гиперповерхностями,
на
которых
стратегии
противников могут резко меняться. Достаточно подробная клас­
сификация этих гиперповерхност ей приведена в работах [1, 4J.
Рассмотрим
поверхность,
которая
носит
на звание
"барьер" и
является особенно важной в рассматриваемой з а д а ч е . Эта поверх­
ность отделяет область в
пространстве начальных положений, при
которых преследование может быть закончено з а конечное время,
от области, в которой преследующий не может выполнить свою
задачу. Гиперповерхность, соответствующая барьеру,
ряет условию [1 J
miп тах gradz~(z)f(z, щ, и 2 ) = О .
удовлетво­
(21)
n ,€If , U2€'f2
Здесь
z-
вектор относительных фазовых координат ПрОТИВНИКОВ,
и], и2) - уравнение относительного движения, ~ (z) - по­
верхность "барьера" в фа зовом пространстве.
z
=
j(z.
Используя
версальности
это соотношение,
и
определить
можно
траекторию,
записать
начальные
условия
условия
транс­
кото­
рой прин адлежат барьеру. Поверхность в фазовом пространстве,
образованная начальными условиями семейства этих траекторий,
представляет собой границу ~ (z) или барьер [1]. На фиг . 3, а
представлены результаты расчетов барьера ~(z) в плоскости Х , у
для двух фиксированных з н а ч е н и й начальной скорости преследуе­
м ого объекта. Внутри области, определяемой этой
следующий
может
за
конечное
время
выполнить
вия, обеспечивающие окончание преследования,
рых
в
границей, пре­
заданные
усло­
качестве
кото­
приняты
1-/ х з
+ Y2It=T - i = о, Iq] ilt=T - qt ~ О.
qt - заданное угловое
Зцесь т - заданное расстояние ,
(22)
положение
преслелующег о объекта.
При расчетах предполагалось, что на­
ч альное у г л о во е положен ие пресл ед уемого ер ио) является оп ти­
28
t =O
а)
t=O
мальным. В результате этого пр едпол ожения Оптимальным ' управ­
л ением для пресл еду емого явля ется о с обый режим (18), со ответ­
ствующий прямо лин ейном у
дви ж ению (ф и г. 3, б) . От м ети м , чт о
к ажд ая точк а гр аницы ~ (z) опред еляет ся и з решения дву хточечно й
краевой з ада ч и .
Рассмотрим
фиксировано,
а
п о лож ение,
з а да ч у
прес лед ов ания , в К ОТ ОРО Й вр емя
t= Т
фу н кцион ал,
ха р а к те р и з у ю щ ий
относите льное
за даетс я
w
в
с л едую щ ем
=r­
ви де:
k q , cos ql - k q , cos q 2 1 1~T ,
ь. .
k q , > 0,
(23)
> 0,
где k q "
k q , - н екоторые ве совые к оэффициенты . З ам етим, чт о
критерии (23) в отличие от (19), (22) за в и с я т от уг Л08 0ГО полож е­
ния пр е с л ед уем ог о (qз) , в ре з ул ьт ате ч его т ра е кто р и я прес ле дов а­
ния ка ч е с т ве н н о меняется. В эт ом с л учае пр есл е дуемый стремит ся
не
только
м ент
увелич ить
о ко н ча н и я
с б л и жа я с ь с
r,
р асстояни е
пр е сл едов ания.
пр отивником,
но
и
уве личить
Пре сл ед ующий,
в
....
s
а)
~
~
I
~r-­
;
/
V
3
г-,
2
~
1
I
/
.:::,.~ (Х,!/) "» оарь/!р»
/­
-!I..
/
-.;
.:
/r \
-:LJ
2
1
Фиг .
92
угол
свою
с т р е м и т с я уменьшить уго л
.r
I
в
3
ох
q2'
q2
в
м о­
оч еред ь ,
Оптимальная траектория
траектория
ранее
и
в
этом
случае
представляет
приведена
сильно
собой
на
фиг.
отличается
ряд
4,
от
а.
Видно, что
рассмотренных
последовательных
поворотов,
напоминающих "змейку". Характерным
является также то, что
преследующий объект сближается с преследуемым на расстояние,
несколько меньшее конечного (фиг. 4,6). Затем происходит "01'­
ставание", в
и
q2
процессе которого преследующий
преследования
в
уменьшает углы
q]
(фиг . 4,8).
В заключение приведем результаты численного решения задачи
с
интегральным
критерием,
который
задавался
виде
т
J
= S(r -
k q,
1.
k q,
COS
q! - k q, cos q2) dt,
> О,
k q,
(24)
> О.
Как показали результаты численных расчетов, для оптималь­
ных траекторий с критерием (24) характерными являются два типа
траекторий. Один из них представляет
собой ряд циклически
повторяющихся маневров, по характеру близких к траекториям.
~)
OJ
о
tf,
t1)
SOO
- 5"0
Фиг.
4
93
показанным на фиг. 4. Другой тип траекторий пока зан на фиг . 5
и предст авляет собой траектории, бли зкие к окружностям по ­
с т о я н н о г о радиуса . Скорости объектов V p V2 также принимают
знач ен ия ,
близкие к установившимся.
В за ключ е ни е
отметим, что
в
статье
исследования оптимальных траекторий в
в ания,
полученные
на
основании
приведены
ре зультаты
игровой задаче преследо­
использования
необходимых
ФИГ.5
условий оптимальности в форме принципа максимума. Эти
усло­
вия
отме­
по зволяют получить решение игровой задачи, как
уже
чалось, только в области " р е г у л я р н о с т и ~ , где справедливы усло­
вия оптимальности в " м а ло м ~ [1]. В связи с ЭТим полученные
р е зультаты
не охватывают
всего семейства
решений
рассматри­
ваемой
игровой
сложный
ния
задачи, для
аппарат
траекторий
поверхностей ,
дифференциальной
рыв [3,
41 .
получения
исследования
игры, г де
которых
с привлечением
разделяющих
стратегии
необходим
условий
пространство
противников
более
пересече­
решений
терпят
ра з­
ЛИТЕРАТУРА
Айз е к с Р . А . Д и ф ф е р е н ц и а л ь н ы е игры. М . , .Мир", 1967.
П о н т р я г и и Л . с . к т е о р и и дифференциальных. игр. Успе­
х и математических наук , т. XXl, вып . 4, 1966.
3. К Р а с о в с к и й Н. Н . Игровые задачи о встрече движений.
1.
2.
.Наука ", 1970.
4. Л е й т м а и Г., М о н Г .
ных и гр .• Кибернетика", 1968, N~
М.,
Об
одном
классе
дифференциаль­
1.
Рукопись по ст упила б/Х/
1973
г.
Документ
Категория
Без категории
Просмотров
11
Размер файла
3 847 Кб
Теги
нелинейные, игровая, преследования, плоскости, задачи
1/--страниц
Пожаловаться на содержимое документа