close

Вход

Забыли?

вход по аккаунту

?

Приближенный синтез оптимального управления в вариационных и игровых задачах механики полета со свободным концом траектории.

код для вставкиСкачать
УЧЕНЫЕ
т о.м
удк
ЗАПИСКИ
ЦАГИ
мз
1972
1/1
629.7.015.531.55
ПРИБЛИЖЕННЫЙ СИНТЕЗ ОПТИМАЛЬНОГО
УПР АВЛЕНИЯ В ВАРИАЦИОННЫХ И ИГРОВЫХ
ЗАДА ЧАХ МЕХАНИКИ ПОЛЕТА СО СВОБОДНЫМ
КОНЦОМ ТРАЕКТОРИИ
В. А. БоБЦО8, А. з. Брауде, г. Е. Куз.мак
Рассматривается задача синтеза оптимального управления в ва­
риационных
и
игровых
задачах
для
случаев,
когда
на
конце
траек­
тории нет никаких условий, кроме условия, определяющего конец
траектории. Для решения данной задачи предлагается приближенный
метод, представляющий собой развитие метода локальной оптими­
зации, удобный для реализации на ЭЦВМ. С помощью
9ТОГО метода
в ряде случаев могут быть найдены простые приближенные анали­
тические решения задачи синтеза. Для иллюстрации рассматриваются
три
примера:
о наборе
двух лиц,
задача
заданной
о
полете
на
максимальную
высоты за минимальное
управляющих
плоским
дальность,
задача
время и задача об игре
движением
двух материальных
то­
чек. В двух первых примерах получены результаты, имеющие прос­
той физический смысл.
В течение последних лет математическая теория оптимальных
процессов
получила
это, решение
задач
значительное
синтеза
развитие. Однако, несмотря на
оптимального управления в нелиней­
ных системах возможно лишь в исключительных ситуациях. Целью
настоящей работы является приближенное решение таких задач
Для
случая,
когда
на
конце
траектории
нет
никаких других
усло­
вий, кроме условия, определяющего ее конец. Предлагаемый ме­
тод представляет собой развитие метода локальной оптимизации,
который, в частности, широко применяется в задачах аэродинами­
ческого
расчета
[1].
Основная идея метода
состоит в вычислении
приращения функционала на не котором интервале времени, при­
мыкающем к рассматриваемой точке. Это приращение оказывается
ф.ункциеЙ от известных значений фазовых координат и управлений
в данной точке. Величины управлений выбираются таким образом,
чтобы приращение функционала было максимально.
В работе изложена методика расчета приращения
нала, удобная для реализации на ЭЦВМ. Аналогичным
учитываются
ограничения,
налагаемые
на
фазовые
функцио­
способом
координаты
и управления. При использовании этого метода в механике полета
61
задача
синтеза
оптимального
управления
сводится
к
решению
на
каждом шаге задачи нелинейного программирования малой раз­
мерности. Наиболее существенна указанная методика для решения
игровых задач [2, 3], поскольку именно в этом случае определение
оптимального
вается
на
управления
значительные
с
помощью
точных
методов
наталки­
трудности.
1. Постановка задачи. Условие оптимальности. Рассмотрим ди­
намическую систему, движение которой описывается следующей
системой уравнений:
~
dx/
(1.1 )
dГ=Ji(t; Х!, . . . , Х n ; и 1 , . . • , и г )
(i
=
1, ... , n).
Здесь Х ! ~ фазовые координаты; U j - управляющие функции; t время или какая-либо другая монотонная переменная, для которой
задан момент окончания процесса. Будем предполагать, что дви­
жение
происходит
в
интервале
(1.2)
в процессе движения должны выполняться ограничения в виде
неравенств, налагаемые. на фазовые координаты и управления:
~s(t; Х 1 , . . • , Х n ; U 1 ,
••• ,
(8=1,2, ... ,
иг)<:;:О
( 1.3)
р).
Будем предполагать, что при всех рассматриваемых в ин.тер­
вале O<:;:t<:;: т значениях Х ! и U j , связанных между собою уравне­
ниями (1.1), задана функция
(1.4)
t,
характеризующая при выбранных
Х ! и U j качество процесса, про­
исходящего в системе (1.1). В настоящем разделе будет рассмат­
риваться вариационная задача. В этом случае управляющие функ­
ции р" ... , и г должны быть выбраны таким образом, чтобы вы­
полнялись неравенства (1.3) и в момент t = Т функция Р прини­
мала
максимально
возможное
значение.
При выборе оптимальных управлений будем считать, что они
могут быть аппроксимированы кусочно-линейными непрерывными
или кусочно-постоянными функциями (фиг. 1, а). Обозначим через h
длину интервала динейности или постоянства управляющих функ­
ций. Будем предполагать, что величина h достаточно мала. Опре­
деление управляющих функций будем производить последова­
тельно, переходя от момента времени k к моменту tk+l = k
h.
t
t
+
Основная идея метода состоит в определении оптимальных
управлений в интервале времени (t k , t k
h) исходя из условия
максимума A-Fk - величины приращения функции Р в интервале
(t k , t k
A-t), где /).t h (фиг. 1, б), т. е. на большем интервале
+
+
>
времени:
(1.5)
Величина /).F k , очевидно, представляет собой прогнозируемое
приращение функционала," которое может быть определено в рас­
сматриваемый момент времени t
k • Степень приближенности
такого подхода определяется точностью определения A-Pk и мерой
=t
62
влияния величин управляющих функций на предшествующих шагах
на величину возможного приращения функции в последующих ин­
тервалах
времени. Для тех случаев, когда это влияние невелика,
указанный
подход
позволяет
получить
достаточно
хорошее при­
ближение к оптимальному решению.
Заметим, что определение управления из условия максимума
f:.F k одновременно с указанной выше задачей дает решение вариа­
ционной
F
задачи о достижении
= F тах > F /t=o
и
заданного
значения
функционала
за минимальное время.
IfYCIl'lIlIl-ЛlltШIlЯ'IfН!7:i1
tlllllj7tllfC"'M!7qf/fl.
\
Ifj'Cl7l{lftl-Лtl Ifп}IIОЯ
'"
ОIlIlj7IlНС"'Мt1i/UЯ ./ /'
./
f
I
I
I '.
:. . .",
[т
--+i
~(iKL_ , , - I
I
I
I
/l
t
/l
Фиг.
Величина f:.F k может быть вычислена либо непосредственно
с помощью численного интегрирования уравнений движения, либо
с помощью выражения
*
f:.P k=8Fk +f:.t[(
~~)k+ (d;t~)k д;
+( ~t~)k Д: + ...],
2
(1.6)
где 8P/I=P(t/l+O)- F(t«-O).
Индексом k здесь обозначаются производные, вычисленные
при
t k О. Эти производные вычисляются с учетом зависимо­
сти F от X i И Uj вдоль траекторий, определяющихс~ системой
_ уравнений (1.1). При этом на интервале времени (t k h, t k
f:.t)
управляющие функции прогнозируются в соответствии с выбран­
t=
+
+
+
ным для них типом аппроксимации: при кусочно-постоянной аппро­
ксимации
они
оказываются
константами,
при
кусочно-линейной
аппроксимации они изменяются линейно (см. фиг. 1, а, пунктирные
линии). Метод расчета производных, входящих в выражение для
f:.Pk , будет описан далее. Член 8Fk учитывает скачкообразное при­
ращение функционала, связанное с возможными разрывами управ­
ляющих функций при t = k • Это приращение вычисляется непос­
редственно по известной зависимости Р от и 1 , •• , и г • Заметим, что
при использовании выражения (1.6) следует предполагать достаточ­
t
ную гладкость функций fl и Р.
Перейдем далее к вопросу об учете ОГР(iничений (1.3). Пред­
положим, что при t = t k неравенства (1.3) выполняются. Потре-
буем, чтобы они выполнялись также при t
*
Идея максимизации линейной комбинации
женного определения оптимального управления
также предложена В. А. Ярошевским.
=
t/l
+ д7,
г де f:.l~ h. Та-
dF) k + (ddt2F)
(dt
Л
независимо
2
от
/1
для
прибли-
авторов
была
63
ким образом, здесь так же, как и ранее, используется идея прогно­
зирования.
При
отрезок ряда
достаточно
s
CPs !t=tk +A7= 'P !t=tk+O
Все
гладких ФУНКЦИЯХ
Тейлора, это
условие
используя
(1.7)
входящие сюда производные вычисляются вдоль траекто­
нарушаться,
значениях
можно
i1
однако
пренебречь.
производные
ответствии
с
можно
+ Ll1)
ожидать,
ограничения (1.3)
что
при
небольших
величина этого нарушения будет невелика и
2. Определение
дят
li'
+ ( ~~s) k Д + ( ~t;S )k ~2 + ... <: о.
рий системы (1.1). Внутри интервала (tk , t k
могут
'P s и
можно записать в виде
производных. В выражения
ею
(1.6) и (1.7) вхо­
от заданных функций Х ; и Uj , вычисляемые в со­
уравнениями
движения.
Принципиально
они
могут
быть вычислены с помощью непосредственного дифференцирова­
ния. В тех случаях, когда это можно сделать в обозримой форме.
указанный в предыдущем разделе метод позволяет получить при­
ближенное
решении
аналитическое
решение
задачи
синтеза.
Однако
при
реальных задач механики полета вычисление производных
второго и более ВЫСОКИХ-"1Iорядков таким способом, с одной сто­
роны, весьма трудоемко, а с другой стороны, связано с необходи­
мостью численного дифференцирования аэродинамических характе­
ристик ихарактери~тик двигателя, которые, вообще говоря, мо­
гут быть заданы не в виде аналитических зависимостей. Поэтому
важной является разработка численного метода их расчета, удоб­
ного для использования на ЭЦВМ. Для определенности рассмот­
рим задачу о вычислении производных от функции Р. Задача о вы­
числении производных от функций 'Ps решается аналогично. Соста­
вим выражение для первой производной от функции F по
учи­
t,
тывающее
то,
с уравнениями
что
переменные
~ дР
dF
Это
изменяются
duj _
dt -
дР dU j
r
Как
уже
считать
du.
d/ = О,
(
U(~-l) )
U(k) j
h.
J
(j
=
при tE(t k , t k
1, ... ,
времени
управления
= 'f (t,
(tk' t k + h)
является
X 1, . . . , Х n '
(2.2)
h)
определяются
ujk)
последова­
значения
ujk-l)
мож­
следует, что производная
независимо от типа аппрокси-
известной
uik ),
+
г).
известными. Из сказанного
управлений
dF
dt
64
(2.1 )
а при кусочно-линейной
указывалось,
в интервале
мации
дР
~дx1 1; + J=l
~дU.dt
+д['
,=1
]
тельно, шагами, поэтому при определении
dP
dt
соответствии
уравнение будет использоваться в интервале времени
При кусочно-постоянной аппроксимации управлений
+ h).
в этом интервале
но
в
(1.1):
([[=
(t k , tk
хi
... ,
функцией
U~k»
при
от
X i ' i и ujk) :
t Е (t k , t k
+ h).
(2.3)
Здесь 'У -известная ФУНКЦИЯ от указанных аргументов, равная
правой части уравнения (2.1), вычисленной с учетом (2.2)
Способ выбора значений управлений u~) будет указан в сле~
дующем разделе. В соответствии с этим при выбранных значениях
ujk) для обоих типов аппроксимации при любом tE(t k , t k
h) управ~
+
ляющие Функции Uj (t) можно считать известными. Разделим далее
промежуток времени (tk , t k
h) на т равных частей. Используя
+
какой-либо из численных методов интегрирования системы ypaB~
нений (1.1), вычислим значения фазовых координат X i в моменты
.
h
t k , tk +-,
т
времени
2h
+-,
... ,
tk
tk+h.
т
При известных значениях Хl (tk+v ~
т) можно
(v=O, 1 ... ,
)
вычислить в эти же моменты времени значения правой части урав­
нения
(2.3).
Обозначим их следующим
=
"'I(k)
fO
il't t . ,I,(k)
I - k' 11
= ш It=t
т
k
+
образом:
h
m ' ...
=
,I,(k)
'1т
,1, It-t
- k+
I
h
(2.4)
•
Теперь производные функционала F при t = t k можно вычислить по известным формулам численного дифференцирования [4]:
dt
(dF)
d2 Р) ~!!!... (Дф(k)
( dt 2 k
h
о
k
=,!.{k).
fO'
__
1
2
)
А2 ,I,(k)
+ _1 дЗ ;jJ(k)_
о
3
10
h 4 \)
- 41 Д4'110(k) + • •• ) + О ( m
4
2
d3 _
F ) = _m
_
h2
( df3
I
(
дЗ ,I,(k) _
дЗ ,I,(k)
fO
10
k
11
+ _22
•
,
д4 ,I,(k) i"-
)
10
• . .
h
+ О (_
3
I
(2.5)
)
.
тЗ'
I
( d,dtF)
т,3
~d4,',(k)+
h3 ,(дЗ"'(k)_
10
2
10
. . .
4
=
4
k
4
d5 F )
т (А 4 (k)
( ---;[l5 k = ~ ц 'УО
Через
)+0 (~) .
т2
'
+ • . •)+ О ( m·
h)
dS ф~k) (s= 1, 2, ... ) обозначены разности различных по'
рядков от значений функции ф:
Д,Цk)
fз
д2
,!.(k)
fO
= d.!.(k)
_
11
= ,t.(k) _
дф(k).
,о
д2 ф~k) =
дЗ
,I,(k) _
10
-
Д
2 ",(k) __
f1
,I,(k)
14
'
13'· ..
д2
dq;&k) _
д2 ф(k).
10 ,
дЗ
,I,(k) _
11 -
dMk).
f 1 '
Дф~k), .•.
,I,(k) _
11 -
Д4фьk)=д3фtk)_дз ф&k) ,
чин
d",(k) _
12
д2
uik)
Т2
д2
1
(2.6)
",(k).
11'
.•.
Из формул (2.5) и (2.6) видно, что точность 8ычисления вели­
(2.4) должна быть тем выше, чем более высокого порядка про-
5-Учеиые записки N. 3
65
изводные от F необходимо вычислять. Другими словами, потреб­
ная точность вычисления ljJ~k) (s
1, 2, ... , т) определяется по-
=
рядком
погрешности в
последней из формул
того, чтобы иметь возможность вычислить
(
(2.5).
Ясно, что для
~t~ ) k' необходимо
Iji~k) и связанное с этим численное интегрирование системы уравне­
ний
(1.1)
производить с погрешностью не большей, чем О ( ~:
) .
-Именно такой точностью обладают формулы четвертого порядка
метода Рунге - Кутта. Таким образом, при использовании этого
метода возможно вычислить производные от функционала вплоть
до пятого порядка включительно. В этом случае т
4, что озна­
=
чает,
что
для
вычисления
пяти
шага
численного интегрирования. При т
ного интегрирования системы
F,
производных от
производных
(1.1)
надо
сделать
< 4 число
четыре
шагов числен­
меньше, однако меньше и число
которые можно вычислять. Так, например, при
т = 3 делается три шага и вычисляются первые четыре производ­
ные. Соответствующие формулы для производных получаются из
формул (2.5) путем вычеркивания последних слагаемых. При т
2
=
делается
два
шага
численного
интегрирования
и
вычисляются
три
производные от F, формулы для которых получаются из формул
(2.5) путем вычеркивания двух последних слагаемых. Наконец,
при т = 1 значения !)I вычисляются лишь при t = t k И t
t k h;
(~j) kИ
=
(~2tt) k вычисляются с помощью первых двух из формул
в правых частях которых следует вычеркнуть все слагаемые,
(2.5),
кроме
первых.
Численное
разно
F,
+
вычисление производных от функций
производить
одновременно
с
вычислением
предварительно выписав выражения для
dd;'
<Ps целесооб­
про из водных
от
3. Задача нелинеЙIЮГО программирования. Перейдем к вопро­
су об определении управляющих функций при t Е (tk, t k
h). Из
сказанного
ранее
следует, что
+-
решение этого вопроса при обоих
типах аппроксимации управлений сводится к определению констант
ujk) (j = 1, 2, ... ,
г). От этих
дящие в выражения
(1.6)
и
констант
(d~;
(1.7):
зависят
)И
k
(
производные, вхо-
d~~s
)
k(S=
1,2, ... , р),
и эта зависимость может быть определена по методике, указанной
выше. Таким образом, при известных значениях фазовых коорди-
нат и управлений при t
= tk
И выбранных шагов прогноза М и А.?
в соответствии с равенствами
(1.6)
и
(1.7)
имеют место следующие
функциональные зависимости:
t:J.Fk = A.Fk (U~k),
~
CPs It=fk +llf =
ф(k)(
s
. . . , U~k»;
(k»
и 1 ,···, и,
(S = 1, 2, ... ,
р).
I
(3.1)
Зависимость от величин, значения которых известны, здесь не
указывается. Функции ф~k) представляют собой отрезки рядов Тей­
лора,
66
входящие~в неравен{;тва
(1.7).
Рассмотрим
г-мерное
эвкли-
дово
пространство
через Q область
Qпределяется
параметров
допустимых
lР)
J
(j = 1, 2, ... , г). Обозначим
значений
этих параметров,
которая
неравенствами
(З.2)
Обозначим через
В
соответствии
с
ujk)
('Iптимальные значения этих параметров.
условием
оптимальности,
в разд. 1, значения параметров
значение
U)k)
сформулированным
в области Q дают максимальное
прогнозируемой величине приращения функционала:
t1Fk -
Задача максимизации t:.F k при ограничениях (З.2) представляет
<:обой стандартную задачу нелинейного программирования, для ре­
шения которой разработан целый ряд методов [5]. Эта задача
должна решаться последовательно для моментов времени t=O,
h, 2 h, ... , т h, последнему из которых предшествует окончание
процесса. Указанная процедура оптимизации проводится при фик­
-
,сированных шагах прогноза
функционала
t1t
и прогноза ограниче­
ний t1т. Можно поставить задачу об оптимальном выборе этих ве­
.личин. Для этого нужно решить
задачу
тории при различных значениях t1t и
t1t и
оптимизации всей траек­
выбрать те из них, при
которых ограничения (I.З) выполняются с достаточной точностью,
-а величина F при t= Т оказывается наибольшей.
В заключение рассмотрим одно обобщение описанного метода.
Это
обобщение
касается
характера
функций в интервалах времени
ного выше будем при t Е (t k , t k
в виде
отрезка
ряда
Тейлора
аппроксимации
+
управляющих
(t k , t k
h). В отличие от изложен­
h) искать управляющие функции
+
-
кусочно-аналитической
аппрокси­
мации:
du)k) )
U)k)(t)=U~k)(tk)+ ( dГ k(t-t k)
+(
d3 ujk) ) (t - t k)3
dt 3
k
6
и==
1,2, ... ,
2
+ (d dt~u(k») k(t - 2 t k)2 +
+ ...
(З.4)
г).
Число членов, которые целесообразно учитывать в таком раз­
.ложении,
очевидно,
определяется
наивысшим
порядком
производ­
ных, которые учитываются при вычислении t1Fk : чем их больше,
тем больше слагаемых целесообразно взять в выражении (З.4). Все
входящие в равенство (З.4) производные следует рассматривать
как варьируемые параметры. Произвол в выборе этих параметров
в дополнение к неравенствам (I.З) ограничивается условиями
сопряжения управляющих функций в момент t k • В рассматривае­
мом случае правые части в равенствах (З.l) зависят от производ­
ных, входящих В выражение (З.4) для U~k) (t). Вследствие этого получающаяся задача нелинейного
программирования отличается от
описанной выше несколько большей размерностью.
67
4. Конфликтные ситуации. Рассмотрим применение изложенной
выше методики для приближенного синтеза оптимального управ­
ления в дифференциальных играх двух лиц с не нулевой суммой
[2, 3]. Применение ее к этому классу задач является особенно важ­
ным, та:< как если число решенных
велико,
ются
то,
напротив,
случаи
варйационных задач достаточно
решения
игровых
задач
насчитыва­
единицами.
Пусть игрок А управляет движением системы А с фазовыми
координатами Х/ и распоряжается выбором управляющих функ­
ций U , а игрок Б управляет движением системы Б с фазовыми
i
координатами У/ и распоряжается выбором управляющих функ­
ций 'V j •
Уравнения движения системы А:
dx
d/=ЛХ) (t;
(i
X
j
•••
Ир
хn;
,
и,)
..• ,
(4.1)
1, ... , n).
=
Уравнения движения системы Б:
dYi=!(y)
/
dt
i
(t;
YI"'"
Уm;
(i = 1, ... ,
(4.2)
т).
O.z;. t.z;. Т.
Игра рассматривается в интервале времени
Игрок А
стремится к максимизации функционала
(4.3)
а игрок Б стремится к максимизации Функционала
,-,(Б) _
Г'
-
ния
и
р(Б)
(t., X.
.
1 , ••• , Х N '
YI"'"
Уm;
Uj,
)!
и,;
••• ,
'V 1 , · · · , 'V l t=T·
(4.4)
При движении систем А и Б должны выполняться ограниче­
в виде неравенств, налагаемые на их фазовые координаты
управления:
X 1, · · · , Х n ;
CPs (t;
Эти
Ур"" Ут; И р . . . ,и,;
(s = 1, ... , р).
неравенства включают в себя
'V t ,
.. ·,
'Vд ~ о (4.5)
как ограничения,
налагае­
мые на движение систем А и 5, так и ограничения, налагаемые
на их взаимное расположение. Применим для выбора оптимальных
управлений обеих систем описанный выше метод. Управление, так
же как и ранее, будет выбираться шагами. Предположим, что при
t Е (t k , t k h) управления U}k-I) и 'V)'~-1) известны, и рассмотрим воп-
+
рос
о
ствии
выборе
со
управлений U)k) и 'V~) при
сказанным
выше
вычислим
t
Е
(t k ,
t k + h).
прогнозируемые
В соответ­
приращения
функционалов AFkA ), Ар~Б) и прогнозируемые величины
tjls !t=tk+U.
Имеют место
Ap~A)
AP<t) (u~k),
Ар(Б) _
лр(Б) (U(k)
'-1
'-1
CPs
68
=
k
-
~
!t=tk+At
•.. ,
U~k);
(k).
1 , . . . , и"
k
_
=
функций
следующие функциональные соотношения:
ф(k)
s
( (k)
(k).
l l l , . · · , и"
k
'Vl ), .•• ,
'V~k»;
(k)
'VI,""
(k».
'Vl ,
(k)
(k)
'Vl, ..• , 'Vl •
)
(4.6)
Зависимость от И<lвестных величин здесь, так же как и ранее,
не указывается. Предположим, что оба игрока узнают об управ­
лениях друг друга с некоторым запаздыванием. Более того, будем
<считать, что величина этого запаздывания равняется h. Тогда при
выборе U)k) игроком А ему известны управления противыика V)k-O
на
предыдущем шаге и, наоборот" при выборе
vjk)
игроком Б ему
известны
U)k-l). При использовании этой информации в простей­
шей форме положим V)k) ~ V)k-l) при выборе управления игроком
А и
U)k) ~ ujk-l) при выборе управления игроком Б. Соответствен­
значения управлений U)k) игрока А выбираются
из условия максимума функции AP~A) (u~k), " ., u~k); V\k-l), ... , V/ k- 1»
но,
оптимальные
при
ограничениях
( (k)
Ф (k)
s
Ul,
-
(k).
(k-l)
..• , Ur ,
Vl
-
.а оптимальные значения управлений
Ар(Б)
J.1
k
(k-l)
(Ul
(k-l)
, . . . ,Ur
;
( (k-l)
Ф (k)
s
Ul
,
(k)
Vl ,
••. ,
(k)
Vl )
(k-l)
... , Ur
;
(k-l)
, . , . , V,
)
-< ,
О
(4.7)
игрока Б максимизируют
v)k)
при условиях
(k)
(k»
Vt , . . . ,V/
=
=
-< "
О
(4.8)
Параметры, подлежащие определению в приведенных здесь
формулах, подчеркнуты. Таким образом, определение оптималь­
ных значений u)k) = и?) и V)k)
= vJk)
сводится к решению
двух не­
зависимых задач нелинейного программирования.
Возможны различные обобщения указанной методики, основан­
ные на использовании каждым из игроков более точных предпо­
ложений
об
является
использование в качестве
управлениях
противника.
Простейшим
обобщением
управлений противника вели­
чин управлений U}k) и vjk>, полученных в результате решения ука­
занных
выше
задач
нелинейного
программирования.
После
чего
для получения более точных значений оптимальных управлений
эти задачи должны быть решены еще раз.
5.
Примеры.
Рассмотрим
сначала
две
вариационные
задачи,
относящиеся к движению в вертикальной плоскости. В обеих за­
дачах. управляющей функцией является обусловленная подъемной
силой перегрузка n у ' значения которой ограничены: nу Е (nу min,
Л у тах)' При
расчете
приращения
функционала
учитываются
две
производные.
Полет на максимальную дальность за заданное время. В этом
.случае выражение для прогнозируемого приращения дальности L
имеет
вид
1
6.L k =At Vkсоs6k+2g(n~k)соs6k-n~k)Siп6k)
;
At
[
здесь
g-
лона
траектории к горизонту; n<:) и n~k) -
ускорение
силы
тяжести;
Vk -
скорость;
6k
компоненты
-
угол
(5.1)
нак­
перегрузки
.соответственно по вектору скорости и по направлению подъемной
k) и n~k) определяется полярой лета<силы. Зависимость между
n1
тельного
аппарата.
69
Анализ выражения
позволяет получить следующий закон
(5.1)
оптимального управления:
-(k) _
nу -
где
{
ek -< О;
ek >- О,
min (n~klnax' n~k~Pt) при
«k)
(k)
тах nу min, nу opt) при
(5.2)
(k)
n у opt определяется из уравнения:
dn(k)
~k)
j
(k)
d nу
Этот
закон
управления
nyopt
= tg е k
стремится
(5.3.)
.
выдержать траекторию го­
ризонтальной с наименьшими потерями скорости. Для случая уста­
новившегося
ным
планирования
он
реализует траекторию
с
максималь­
качеством.
Полет на
случае
имеет
м,аксимальную
выражение для
высоту
за заданное
прогнозируемого
вид
AHk =,М [
Закон
Vksin
ek + ~t g (n~k) sin ek + n~k) cos ek
оптимального
время. В этом
приращения
высоты
-1)] .
Н
(5.4)
управления для реального диапазона па­
раметров записывается в форме
-(k)
nу
здесь n(k)
у opt
{
=
n~k~ax
при 6k
i
(
(k)
(k»
m n n тах' n opt при е k
у
у
-< О ;
> о .,
корень уравнения
dn(k)
-d n tk)
у
I
(k)
nу
opt
=-
ctg6 k
(5.5)
•
Для случая траекторий малой протяженности этот закон управ­
ления обеспечивает возрастание высоты полета, близкое к опти­
мальному [6].
Игра nреследованuя. Рассмотрим движение двух материальных
точек А и Б на плоскости (фиг. 2). Предположим, что оно проис­
ходит с постоянными значениями модулей скорости V A и VБ~
а
управление
движением
осуществля­
ется путем изменения углов е А
и
еБ
между
направлениями
скоростей и
некоторым фиксированным направле­
нием.
Скорости
углов
еА и
6Б'
равляющими
по
модулю
ЮА
И
которые
ЮБ
изменения
являются
функциями,
некоторыми
уп­
ограничены
константами
Ю А тах И ЮБ шах' Игра рассматривается в
фиксированном
0< t < Т.
интервале
Управление
времени
точкой А
вы­
бирается таким .образом, чтобы умень­
ФИГ.2
шить рассто~ие между точками Аг, а
управление точкой Б выбирается так.
чтобы его увеличить. Таким образом, выражения для
функ­
ционалов Р(А) и F(Б), которые максимизируются в процессе игры,
имеют вид
Р(А) =
70
-
Аг
It=T;
F(Б) =
Аг
It=T.
(5:6)
Форму лы
для
приращения
этих
функционалов,
полученные
с учетом первых двух производных, можно записать в форме
др(А)
м.
Р] . .
(5 7)
k
=-I!.Р(Б)
k =-М l' 2(-VБ(I)Бsш8Б+VА(I)Аsiп8А)+
Через Р здесь обозначены члены, не зависящие от управлений.
Законы управления движением точек А и Б записываются, соот­
ветственно,
в
виде
(5.8)
Через 8А и 8Б
обозначены
углы
между
векторами
скоростей
точек А· и Б и линией, соединяющей эти точки (см. фиг. 2).
Из равенств (5.8) следует, что в процессе движения оба игрока
стремятся с максимальной скоростью привести к нулю yr лы 8А
И 8 Б , после чего, если начальное расстояние между точками доста­
точно велико, обе точки будут двигаться по некоторой фиксиро­
ванной прямой. Эта картина движения в основном совпадает с ре­
зультатами точного решения данной задачи, полученными в работе
с помощью необходимых условий оптимальности. Отличие сос­
тоит лишь в том, что при управлениях (5.8) переход на движение
[7]
по
в
прямой
точном
происходит
несколько
дольше,
чем
это
получается
решении.
ЛИТЕРАТУРА
1.
М и е л е
А. Механика полета. М., .Наука",
2.
Г а в р и л о в В. М. Оптимальные
ситуациях. М., .Советское радио", 1969.
3.
4.
Айз е к с
Р.
процессы
1965.
в
конфликтных
Дифференциальные игры. М., .Мир·,
К рыл о в А.
Н. Лекции
М.-Л., Гостехтеориздат, 1950.
о
приближенных
1967.
вычислениях.
5. Z о u t е n d i j k О. Nonlinear programming: а numerical survey.
SIAM Journal оп Contro!, vo!. 4, No. 1, 1966.
6. В r у s о'п А. Е., D е n h а m W. Р. А steepest-ascent method
for solving орНтит programming probIems. Journa! of Applied Mechanlcs, vol. 29, 1962.
7. С и м а к о в а Э. И. Об одной дифференциальной игре прес­
ледования .• Автоматика и телемеханика", 1967, Jlf2 2.
Рукоnись поступила
17/1 1972
г.
1/--страниц
Пожаловаться на содержимое документа