close

Вход

Забыли?

вход по аккаунту

?

Об устойчивости одной процедуры управления с оптимальной гарантией результата.

код для вставкиСкачать
ISSN 1810-0198. Вестник ТГУ, т. 18, вып. 5, 2013
minimization and obtaining the necessary and sufficient conditions for the existence of the minimum of
functional is set.
Key words: Boundary and initial-boundary value problems on graph; generalized solutions; one-valued
solvability; optimal control.
УДК 517.977
ОБ УСТОЙЧИВОСТИ ОДНОЙ ПРОЦЕДУРЫ УПРАВЛЕНИЯ
С ОПТИМАЛЬНОЙ ГАРАНТИЕЙ РЕЗУЛЬТАТА
c
⃝
М.И. Гомоюнов, Н.Ю. Лукоянов
Ключевые слова: оптимальное управление; дифференциальные игры; устойчивость.
Рассматривается задача о вычислении оптимального гарантированного результата и
построении соответствующих оптимальных стратегий обратной связи в линейной динамической системе, управляемой в условиях помех. Оптимизируется евклидова норма
совокупности отклонений движения в заданные моменты времени от заданных целей.
Исследуется вопрос об устойчивости разрешающей процедуры, основанной на построении выпуклых сверху оболочек вспомогательных функций из метода стохастического
программного синтеза.
Рассматривается управляемая динамическая система
dx/dt = A(t)x + f (t, u, v), t0 6 t < ϑ, x ∈ Rn , u ∈ P ⊂ Rr , v ∈ Q ⊂ Rs , x(t0 ) = x0 ,
при показателе качества
√
)
(
)
(
)
(
γ = ∥D1 x(ϑ1 ) − c1 ∥2 + ∥D2 x(ϑ2 ) − c2 ∥2 + . . . + ∥DN x(ϑN ) − cN ∥2 .
Здесь t — время, x — фазовый вектор, u — вектор управления, v — вектор помехи; t0 ,
ϑ и ϑi ∈ [t0 , ϑ], i = 1, N , зафиксированы, причем ϑi+1 > ϑi , i = 1, N − 1 и ϑN = ϑ; P и Q
компактны; A(t) и f (t, u, v) непрерывны; (pi × n) -матрицы Di и n -векторы ci заданы,
i = 1, N ; ∥ · ∥ — евклидова норма; выполнено условие седловой точки для маленькой игры
[1, с. 79]; цель управления — минимизация показателя γ.
В рамках теоретико-игрового подхода [1, 2] ставится задача о вычислении оптимального гарантированного результата Γ0 (t0 , x0 ) и построении закона управления по принципу
обратной связи, обеспечивающего этот результат. Согласно [2–4], эта задача может быть
решена на основе
{ следующей процедуры.
Пусть ∆k = τj : τ1 = t0 , τj < τj+1 , j = 1, k, τk+1 = ϑ}, ϑi ∈ ∆k , i = 1, N , и X(t, τ ) — матрица Коши для уравнения dx/dt = A(t)x. Для j = 1, k + 1 определим множества Gj± ⊂ Rn
±
+
+
и функции φ±
j (m), m ∈ Gj . При j = k + 1 полагаем Gk+1 = {0}, φk+1 (m) = 0 и
{
}
−
T
Gk+1
= m ∈ Rn : m = D N
l, l ∈ RpN , ∥l∥ 6 1 , φ−
k+1 (m) = −⟨m, cN ⟩,
где верхний индекс T означает транспонирование. Для текущего j определяем
Gj+
=
−
Gj+1
,
τ∫j+1
{
}∗
−
min max⟨m, X(ϑ, τ )f (τ, u, v)⟩dτ, φ+
j (m) = ∆ψj + φj+1 G + (m),
∆ψj (m) =
u∈P v∈Q
j
τj
2485
ISSN 1810-0198. Вестник ТГУ, т. 18, вып. 5, 2013
где символ {ψ}∗G (m) означает выпуклую сверху оболочку функции ψ(m) на множестве G,
а ⟨·, ·⟩ — скалярное произведение векторов. Далее, если τj не совпадает ни с одним из ϑi
+
из показателя γ, то полагаем Gj− = Gj+ , φ−
j (·) = φj (·). Если же τj = ϑh , определяем
{
}
Ω(m) = (ν, m∗ , l) ∈ R × Gj+ × Rph : m = νm∗ + X T (ϑh , ϑ)DhT l, ν > 0, ∥l∥2 6 1 − ν 2 ,
{
}
Gj− = m : Ω(m) ̸= ∅ ,
φ−
j (m) =
max
(ν,m∗ ,l)∈Ω(m)
]
[ +
νφj (m∗ ) − ⟨l, Dh ch ⟩ .
e ± и функции φ
Пусть множества G
ej± (·), j = 1, k + 1, построены по этой же процедуре,
j
но вместо X(ϑ, τj ), X(τj , ϑ) и ∆ψj (·) использовались их приближения — невырожденные
e
e j , ϑ) и непрерывные неотрицательные функции ∆ψej (·), такие, что
матрицы X(ϑ,
τj ), X(τ
e
e j , ϑ)∥ 6 ξ1 , |∆ψj (m) − ∆ψej (m)| 6 ξ2 , m ∈ Rn .
∥X(ϑ, τj ) − X(ϑ,
τj )∥ 6 ξ1 , ∥X(τj , ϑ) − X(τ
b ± ⊂ Rn и непрерывные функции φ
b ± , таковы, что
Пусть компакты G
bj± (m), m ∈ G
j
j
b± ⊂ G
e± ⊂ G
b ± + B[0, ξ3 ],
G
j
j
j
|φ
ej± (m) − φ
bj± (m)| 6 ξ4 ,
b ±,
m∈G
j
где B[0, ξ3 ] ⊂ Rn — шар радиуса ξ3 с центром в нуле. Определим систему величин
e
ebj± (x) = max [⟨m, X(ϑ,
τj )x⟩ + φ
bj± (m)],
b±
m∈G
j
x ∈ Rn ,
j = 1, k + 1.
Пусть управление формируется так, что u = u
bj , t ∈ [τj , τj+1 ), j = 1, k, причем
max⟨b
xj − s0 , f (τj , u
bj , v)⟩ 6 min max⟨b
xj − s0 , f (τj , u, v)⟩ + ξ5 ,
v∈Q
u∈P v∈Q
∥x(τj ) − x
bj ∥ 6 ξ6 ,
√
) T
0
e
e T (ϑ, τj )m0 ∥2 ,
s = ε + ε(τj − t0 ) X (ϑ, τj )m / 1 + ∥X
[
]
(
)√
e
e T (ϑ, τj )m∥2 .
m0 ∈ arg max ⟨m, X(ϑ,
τj )b
xj ⟩ + φ
bj+ (m) − ε + ε(τj − t0 ) 1 + ∥X
0
(
b+
m∈G
j
Т е о р е м а. Для любого ζ > 0 можно указать ε(ζ) > 0 и δ(ζ, ε) > 0, выбрать какие-либо
0 < ε 6 ε(ζ) и разбиение ∆k с диаметром δk 6 δ(ζ, ε), а затем указать ξq > 0, q = 1, 6, так,
что
будет
справедливо
неравенство
|Γ0 (t0 , x0 ) − eb1− (x0 )| 6 ζ,
а указанный закон управления будет гарантировать неравенство γ 6 Γ0 + ζ.
ЛИТЕРАТУРА
1. Красовский Н.Н. Управление динамической системой. М.: Наука, 1985.
2. Krasovskii A.N., Krasovskii N.N. Control under Lack of Information. Berlin etc.: Birkhäuser, 1995.
3. Лукоянов Н.Ю. К вопросу вычисления цены дифференциальной игры для позиционного функционала // Прикладная математика и механика. 1998. Т. 62. Вып. 2. С. 188-198.
4. Корнев Д.В. О численном решении позиционных дифференциальных игр с нетерминальной платой // Автоматика и телемеханика. 2012. № 11. С. 60-75.
БЛАГОДАРНОСТИ: Работа выполнена в рамках программы Президиума РАН «Динамические системы и теория управления», при финансовой поддержке УрО РАН (12-П-11002), а также при поддержке РФФИ (12-01-00290-а, 12-01-31300-мол а).
Gomoyunov M.I., Lukoyanov N.Y. STABILITY PROPERTIES OF CONTROL PROCEDURE WITH
OPTIMAL GUARANTEE OF RESULT
2486
ISSN 1810-0198. Вестник ТГУ, т. 18, вып. 5, 2013
A problem of calculating the optimal guaranteed result and constructing the corresponding op-timal
feedback strategies is considered for a linear dynamical system controlled under disturbances is considered.
The Euclidian norm of a set of motion deviations at given instants of time from given target points is
optimized. Stability properties of a solving procedure based on constructing upper convex hulls of auxiliary
functions from the method of stochastic program synthesis are investigated.
Key words: optimal control; differential games; stability.
УДК 519.85, 517.97
ОБ УСТОЙЧИВОЙ СЕКВЕНЦИАЛЬНОЙ ТЕОРЕМЕ КУНА–ТАККЕРА В
ВЫПУКЛОМ ПРОГРАММИРОВАНИИ В РАВНОМЕРНО ВЫПУКЛОМ
ПРОСТРАНСТВЕ И ЕЕ ПРИЛОЖЕНИИ
c
⃝
А.А. Горшков
Ключевые слова: выпуклое программирование; секвенциальная оптимизация; параметрическая задача; теорема Куна–Таккера в недифференциальной форме; двойственная
регуляризация; оптимальное управление; неустойчивые задачи.
Обсуждаются устойчивая к ошибкам исходных данных секвенциальная теорема КунаТаккера в недифференциальной форме для параметрической задачи выпуклого программирования в рефлексивном пространстве и возможности ее приложения при решении неустойчивых задач оптимального управления, обратных задач.
Постановка задачи. Рассматриваем параметрическую задачу выпуклого программирования
δ )
(Pp,r
f δ (z) → inf, Aδ z = bδ + p, g δ (z) 6 r, z ∈ D ⊂ Z, p ∈ B, r ∈ Rm — параметры,
где f δ : D → R1 — липшицев строго равномерно выпуклый функционал; Aδ : D → B —
δ ) : D → Rm —
линейный непрерывный оператор; bδ — заданный элемент; g δ ≡ (g1δ , . . . , gm
векторный функционал с выпуклыми липшицевыми компонентами gi , i = 1, . . . , m, D ⊂
⊂ Z — ограниченное выпуклое замкнутое множество; Z — равномерно выпуклое банахово
пространство; B — рефлексивное банахово пространство; δ ∈ [0, δ0 ], δ0 > 0 — некоторое
фиксированное число. Верхний индекс δ характеризует ошибку задания исходных дан0 ) обозначает невозмущенную (исходную) задачу. Будем считать,
ных задачи, при этом ( Pp,r
что выполняются следующие оценки |f δ (z) − f 0 (z)|, |g δ (z) − g 0 (z)| 6 Kδ, ∀ z ∈ D, ∥Aδ z −
− A0 z∥ 6 Kδ(1 + ∥z∥) ∀ z ∈ Z, ∥hδ − h0 ∥ 6 Kδ с некоторой не зависящей от δ постоянной
0ε ≡ {z ∈ D : ∥A0 z − b0 − p∥ 6 ε, g 0 (z) 6 r + ε, i = 1, . . . , m}, ε > 0. ОпреK > 0. Обозначим: Dp,r
i
i
делим выпуклую полунепрерывную снизу функцию значений β 0 : B × Rm → R1 ∪ {+∞}
0ε =
0 ): β 0 (p, r) ≡ lim β 0 (p, r), β 0 (p, r) ≡ inf f 0 (z),
βε (p, r) ≡ +∞, если Dp,r
задачи ( Pp,r
ε
ε
0ε
ε→+0
z∈Dp,r
δ
δ
δ
= ∅. Примем обозначение Lp,r (z, λ, µ) ≡ f (z) + ⟨λ, A z − bδ − p⟩ + ⟨µ, g δ (z) − r⟩ и определим
δ (λ, µ) ≡ inf Lδ (z, λ, µ) → sup, (λ, µ) ∈ B ∗ × Rm , а также элемендвойственную задачу Vp,r
+
p,r
z∈D
δ
δ
0
0
∗
ты zp,r ≡ argmin{f (z) : z ∈ Dp,r }, z [λ, µ] ≡ argmin{Lp,r (z, λ, µ) : z ∈ D}. Обозначим через
δ,α
∗
m
(λδ,α
p,r , µp,r ) произвольную точку в B × R+ , дающую на этом множестве максимум функδ,α
2
m.
δ
ционалу Rp,r (λ, µ) ≡ Vp,r (λ, µ) − α∥λ∥ − α|µ|2 , (λ, µ) ∈ B ∗ × R+
2487
Документ
Категория
Без категории
Просмотров
3
Размер файла
235 Кб
Теги
оптимальное, процедур, гарантией, результаты, одной, управления, устойчивость
1/--страниц
Пожаловаться на содержимое документа