close

Вход

Забыли?

вход по аккаунту

?

Многопрограммная стабилизация квазилинейных систем.

код для вставкиСкачать
ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
Сер. 10. 2010. Вып. 4
УДК 517.977+519.71
Н. В. Смирнов, Я. А. Шахов
МНОГОПРОГРАММНАЯ СТАБИЛИЗАЦИЯ
КВАЗИЛИНЕЙНЫХ СИСТЕМ
1. Введение. Обеспечение функционирования системы в приемлемом, заранее прогнозируемом режиме – одна из основных прикладных задач, стоящих перед исследователями различных областей науки. В математической теории управления данная
задача формально решается для широкого класса линейных и нелинейных моделей.
Иногда перед исследователями возникает необходимость обеспечить не один запланированный режим функционирования системы, а целый спектр таких режимов в зависимости лишь от начальных данных. Впервые задачу синтеза многопрограммных
устойчивых управлений сформулировал В. И. Зубов [1, 2]. В работе [2] изложены вопросы построения управления, обеспечивающего реализацию заданного семейства движений и их асимптотическую устойчивость по Ляпунову для линейных стационарных
систем. Также приведены примеры приложения такого подхода в задачах управления
механическими системами и движением заряженных частиц в электромагнитном поле.
Дальнейшее распространение эти результаты получили в работах [3–5] для билинейных
систем и систем Лотки–Вольтерры. В настоящей работе изучаются вопросы синтеза
многопрограммных управлений для класса квазилинейных систем.
2. Постановка задачи. Следуя монографии [6], рассмотрим квазилинейную управляемую систему
ẋ = A(t)x + B(t)u + f (t) + μG(t, x, u, μ),
(1)
где x = (x1 , . . . , xn )T – n-мерный вектор фазового состояния; u = (u1 , . . . , ur )T –
r-мерный вектор управлений; элементы матриц A(t), B(t) и компоненты вектора f (t)
заданы при t 0, вещественны, непрерывны и ограничены; G(t, x, u, μ) – вещественная, непрерывно дифференцируемая по t и компонентам x, u вектор-функция; μ 0 –
малый параметр.
Предположим, что для системы (1) построены программные управления u1 (t), . . . ,
uN (t) в классе непрерывных и ограниченных при t 0 функций, а также соответствующие им программные движения x1 (t), . . . , xN (t). Число программных движений
N не связано с размерностью системы (1) и размерностью пространства управлений.
Смирнов Николай Васильевич – доктор физико-математических наук, профессор кафедры моделирования экономических систем факультета прикладной математики–процессов управления СанктПетербургского государственного университета. Количество опубликованных работ: 81. Научные направления: теория устойчивости, математическая теория управления, управление макроэкономическими системами. E-mail: nvs v@mail.ru.
Шахов Яков Александрович – аспирант кафедры моделирования экономических систем факультета прикладной математики–процессов управления Санкт-Петербургского государственного университета. Научный руководитель: доктор физико-математических наук, проф. Н. В. Смирнов. Количество опубликованных работ: 5. Научное направление: математическая теория управления. E-mail:
yakov.shakhov@gmail.com.
c Н. В. Смирнов, Я. А. Шахов, 2010
128
Для определенности будем полагать, что каждое программное управление uj (t) и программное движение xj (t) строятся как решение некоторой специальной граничной задачи. В [7] предложен один из подходов к решению подобных задач в квазилинейных
системах вида (1). Таким образом, если систему (1) замкнуть программным управлением uj (t), то она будет иметь соответствующее частное решение xj (t), отвечающее
выбранным начальным и конечным данным.
Задача многопрограммной стабилизации для системы (1) состоит в том, чтобы построить управление u = u(x, t), которое реализует заданные программные движения
x1 (t), . . . , xN (t) и обеспечивает их асимптотическую устойчивость.
3. Построение программных управлений. Исходя из предположения о полной
управляемости при t ∈ [0, T ] линейной системы
ẋ = A(t)x + B(t)u + f (t),
(2)
стандартный подход [6, 8] предполагает вывод системы интегральных уравнений, которой удовлетворяет пара функций – программное управление и соответствующее
ему программное движение ξ(t) = (x(t), u(t))T . Эта система имеет вид
ξ(t) = ξ 0 (t) + μK(ξ, μ, t),
где интегральный оператор
⎛
7t
(3)
⎞
−1
Y(t)Y (τ )G(τ, ξ(τ ), μ)dτ −
⎜
⎜
0
⎜
7T
⎜
K(ξ, μ, t) = ⎜ −Y(t)D(t)D−1 (T ) Y−1 (τ )G(τ, ξ(τ ), μ)dτ ;
⎜
0
⎜
7T −1
⎝
T
−1
−P (t)D (T ) Y (τ )G(τ, ξ(τ ), μ)dτ
⎟
⎟
⎟
⎟
⎟;
⎟
⎟
⎠
0
ξ 0 (t) = (x0 (t), u0 (t))T – пара программного движения и программного управления
для линейной системы (2); Y(t) – нормированная в точке t = 0 фундаментальная матрица системы
ẋ = A(t)x;
t
P(τ )PT (τ )dτ,
D(t) =
P(t) = Y−1 (t)B(t).
0
Решение интегрального уравнения (3) можно построить как предел последовательности
приближений
ξ k+1 (t) = ξ 0 (t) + μK(ξ k (t), μ, t),
(4)
k = 0, 1, . . .
Данный подход основывается на следующем утверждении [6, 9].
Теорема 1. Пусть матрица D(T ) – неособая. Тогда для любых двух ограниченных множеств X0 и X1 можно указать число μ0 = μ0 (X0 , X1 ) такое, что при всех
всех μ μ0 существует управление u(t), переводящее систему (1) из произвольной
точки x0 ∈ X0 в произвольную точку x1 ∈ X1 за время T . Это управление непрерывно и может быть построено как предел равномерно сходящейся последовательности,
129
каждый член которой определяется единственным образом рекуррентным соотношением.
З а м е ч а н и е 1. Представление решения задачи программного управления в виде
последовательности (4) предполагает, что на практике вместо точного (предельного)
программного управления приходится использовать его приближение. В этом случае
необходимо иметь возможность оценивать отклонение фактического движения от точного программного.
В доказательстве теоремы используется ряд
ξ 0 + (ξ 1 − ξ 0 ) + . . . + (ξ k+1 − ξk ) + . . . ,
который при выполнении сформулированных условий и предположений сходится равномерно на [0, T ]. Заметим, что частичная сумма этого ряда совпадает с соответствующим приближением ξ k (t). Отсюда можно получить следующее представление:
ξ ∗ (t) = ξ 0 +
∞
∞
(ξ i+1 − ξi ) = ξ k +
(ξ i+1 − ξ i ).
i=0
i=k
Построим числовую оценку остаточного члена данного функционального ряда [10]:
ξ ∗ (t) ξk +
∞
(μM (μL)i ) ξk + μM
i=k
где
L=
max
t∈[0,T ]
∂K(ξ, μ, t) ,
∂ξ
μL < 1,
M=
(μL)k
,
1 − μL
max
K(ξ, μ, t).
t∈[0,T ]
μμ2
μμ2
ξr2
ξr2
Здесь μ2 , r2 – положительные постоянные [6, 9].
В дальнейшем будем использовать такие обозначения: ξ ∗j (t) = (x∗j (t), u∗j (t))T , j =
1, N , – пара предельных (точных) функций – суть программное движение и программное управление, которые являются решением конкретной задачи программного управления и представляют собой предел последовательности (4); ξ kj (t) = (xkj (t), ukj (t))T –
соответствующее k-тое приближение этой пары, вычисленное по формулам (4).
4. Синтез многопрограммного управления. Для решения поставленной задачи
запишем представление многопрограммного управления [2, 3] в следующем виде:
u∗ (x, t) =
#
N "
N
(x∗j − x∗i )(x − x∗j )
u∗j + C(t)(x − x∗j ) − 2u∗j
pj (x),
(x∗j − x∗i )2
j=1
(5)
i=1,i
=j
где
pj (x) =
N
1
i=1,i
=j
(x − x∗i )2
.
(x∗j − x∗i )2
(6)
Управление (5), (6) будем называть точным многопрограммным управлением, так как
оно построено с использованием точных программных движений x∗j (t) и соответствующих им управлений u∗j (t), j = 1, N . Выражения (x∗j − x∗i )(x − x∗j ) и (x∗j − x∗i )2
130
означают скалярные произведения соответствующих векторов. В формулах (5), (6)
и далее по тексту, где это не мешает пониманию сути преобразований, не указывается
зависимость функций x∗i , x∗j , u∗j и т. д. от t. А в случае, где это действительно важно, следует учитывать неявную зависимость p∗j (x) и u∗ (x, t) от времени t через u∗j (t)
и x∗j (t), j = 1, N .
Скалярные функции (6) обладают такими очевидными свойствами:
pj (x∗i (t)) ≡ 0, i = j;
pj (x∗j (t)) ≡ 1, j = 1, N.
(7)
Функция (5) представляет собой интерполяционный полином Эрмита, в котором роль
узловых точек играют программные движения x∗j (t), а роль значений – программные
управления u∗j (t). Действительно, она с учетом (7) обладает свойством
u∗ (x∗j (t), t) ≡ u∗j (t).
(8)
Теорема 2. Пусть для системы (1) выполнены следующие условия:
1) однородная система
ẋ = A(t)x + B(t)u
(9)
стабилизируема управлением u = C(t)x;
2) заданные программные движения x∗1 (t), . . . , x∗N (t) различимы при t t0 0,
иначе говоря,
inf x∗i (t) − x∗j (t) > 0, i = j;
t0
3) для функции G(t, x, u, μ) при допустимых значениях величин u, μ справедлива оценка G(t, x, u, μ) ψ(t)xm , где m > 1, ψ(t) – непрерывная положительная
функция при t 0, характеристический показатель Ляпунова которой равен нулю.
Тогда для системы (1) существует управление (5), (6), реализующее программные
движения x∗1 (t), . . . , x∗N (t), при этом каждое из них будет экспоненциально устойчиво
при t 0.
З а м е ч а н и е 2. Стабилизируемость однородной системы (9) управлением
u = C(t)x понимается в смысле возможности обеспечить соответствующей замкнутой
системе наперед заданный спектр характеристических показателей Ляпунова [8].
Д о к а з а т е л ь с т в о. В силу свойств (7), (8), очевидно, что система (1), замкнутая управлением (5), (6), имеет заданные программные движения x∗1 (t), . . . , x∗N (t).
Перейдем к доказательству их асимптотической устойчивости.
Индексом s обозначим некоторое программное движение x∗s (t) из исходного семейства и построим для него систему в отклонениях. Для отклонения ys (t) = x(t) − x∗s (t)
получим
ẏs = A(t)ys + B(t)
N "
u∗j + C(t)(ys + x∗s − x∗j ) −
j=1
− 2u∗j
#
N
(x∗j − x∗i )(ys + x∗s − x∗j )
pj (ys + x∗s ) −
(x∗j − x∗i )2
i=1,i
=j
− B(t)u∗s + μQ(t, ys , μ), (10)
Q(t, ys , μ) = G(t, ys + x∗s , u∗ (ys + x∗s , t), μ) − G(t, x∗s , u∗s , μ).
В системе (10) выделим линейное приближение. Для этого учтем свойства функций
pj (ys + x∗s ), j = 1, N :
где
131
1) если j = s, то в составе произведения
pj (ys + x∗s ) =
N
1
i=1,i
=j
(ys + x∗s − x∗i )2
,
(x∗j − x∗i )2
при i = s будет сомножитель
(x∗j
j = 1, N,
ys2
.
− x∗s )2
Это означает, что все слагаемые суммы в правой части (10) при j = s имеют порядок
не меньше второго по компонентам вектора ys и, следовательно, не входят в систему
линейного приближения;
2) если j = s, то
N
1
(ys + x∗s − x∗i )2
ps (ys + x∗s ) =
.
(11)
(x∗s − x∗i )2
i=1,i
=s
Очевидно, что каждый сомножитель в (11) имеет вид
(ys + x∗s − x∗i )2
y2
(x∗ − x∗i )ys
= ∗ s ∗ 2 + 2 s∗
+ 1,
∗
∗
2
(xs − xi )
(xs − xi )
(xs − x∗i )2
i = 1, N, i = s.
В результате (11) можно представить в виде
ps (ys + x∗s ) = 1 + 2
N
(x∗s − x∗i )ys
+ hs (ys ),
(x∗s − x∗i )2
(12)
i=1,i
=s
где hs (ys ) – скалярная функция, являющаяся суммой слагаемых, порядок которых
по компонентам вектора ys не меньше двух.
Вернемся к рассмотрению правой части системы (10). С учетом свойств 1), 2) функций pj (ys + x∗s ), j = 1, N, очевидно, что дополнительные линейные члены по ys могут
появиться только при j = s. Рассмотрим отдельно слагаемое, соответствующее j = s,
и учтем (12):
#
"
N
(x∗s − x∗i )ys
×
B(t) u∗s + C(t)ys − 2u∗s
(x∗s − x∗i )2
i=1,i
=s
"
#
N
(x∗s − x∗i )ys
: s (ys , t),
× 1+2
+
h
(y
)
= B(t)u∗s + B(t)C(t)ys + H
s s
(x∗s − x∗i )2
i=1,i
=s
где
"
#
N
(x∗s − x∗i )ys
∗
:
Hs (ys , t) = B(t) C(t)ys − 2us
×
(x∗s − x∗i )2
i=1,i
=s
#
" N
(x∗s − x∗i )ys
+ hs (ys ) + B(t)u∗s hs (ys ).
× 2
(x∗s − x∗i )2
i=1,i
=s
132
C учетом данного представления система (10) примет вид
ẏs = A(t) + B(t)C(t) ys + Hs (ys , t) + μQ(t, ys , μ),
(13)
здесь
: s (ys , t) + B(t)
Hs (ys , t) = H
"
N
u∗j + C(t)(ys + x∗s − x∗j ) −
j=1,j
=s
−
2u∗j
N
j=1,i
=j
#
(x∗j − x∗i )(ys + x∗s − x∗j )
pj (ys + x∗s ).
(x∗j − x∗i )2
Функция Hs (ys , t) имеет полиномиальный вид. Ее порядок по компонентам вектора
ys не меньше второго, а максимальная степень конечна и зависит только от параметра
N . При этом Hs (ys , t) зависит от u∗j (t), x∗j (t), j = 1, N . Однако, в силу ограниченности
этих функций, второго условия теоремы и при достаточно малых по норме отклонениях
ys справедлива оценка
Hs (ys , t) ays b ,
(14)
где b 2, a – положительная константа, зависящая от норм матриц B(t), C(t) и функций u∗j (t), x∗j (t), j = 1, N .
По первому условию теоремы система линейного приближения в (13) стабилизируема, т. е. можно построить матрицу C(t) (см. [8]), при которой замкнутая система
ẏs = A(t) + B(t)C(t) ys
будет экспоненциально устойчивой, правильной (приводимой) и иметь наперед заданные отрицательные характеристические показатели Ляпунова. В этом случае, с учетом
(14) и третьего условия теоремы, нулевое решение каждой системы (13) при s = 1, N
экспоненциально устойчиво по теореме об устойчивости по линейному приближению
[11]. Следовательно, все программные движения системы (1) при управлении (5), (6)
будут экспоненциально устойчивы.
Теорема доказана.
5. Реализация многопрограммного управления. Теорема 2 дает представление
многопрограммного управления, решающего поставленную задачу для исходной системы (1). Однако точное вычисление пары функций ξ∗j (t) = (x∗j (t), u∗j (t))T по рекуррентным формулам (4) невозможно. Рассмотрим ξ kj (t) = (xkj (t), ukj (t))T – соответствующее
k-тое приближение этой пары, вычисленное по формулам (4), j = 1, N .
Для решения задачи практической реализации многопрограммного управления
в системе (1) построим функцию
uk (x, t) =
#
N "
N
(xkj − xki )(x − xkj ) k
ukj + C(t)(x − xkj ) − 2ukj
pj (x),
(xkj − xki )2
j=1
i=1,i
=j
где
pkj (x) =
N
1
i=1,i
=j
(x − xki )2
.
(xkj − xki )2
(15)
(16)
133
Скалярные функции (16) обладают следующими очевидными свойствами:
pkj (xki (t)) ≡ 0, i = j;
pkj (xkj (t)) ≡ 1,
j = 1, N.
(17)
Заметим, что функция (15) представляет собой интерполяционный полином Эрмита, в
котором роль узловых точек играют k-тые приближения программных движений xkj (t),
а роль значений – k-тые приближения программных управлений ukj (t). Действительно,
функция (15) с учетом (17) обладает свойством
uk (xkj (t), t) ≡ ukj (t).
(18)
Назовем функцию (15) k-тым приближением многопрограммного управления (5).
Лемма. При увеличении количества итераций k в (4) для системы (1) последовательность k-тых приближений многопрограммного управления (15), (16) равномерно
сходится к точному многопрограммному управлению (5), (6), т. е.
lim uk (x, t) = u∗ (x, t),
k→+∞
lim pkj (x) = pj (x).
k→+∞
(19)
Д о к а з а т е л ь с т в о. Действительно, используя утверждение теоремы 1
и известные свойства пределов, получим
lim pkj (x) = lim
k→+∞
k→+∞
N
1
i=1,i
=j
N
1
(x − xki )2
(x − x∗i )2
=
= pj (x),
(x∗j − x∗i )2
(xkj − xki )2
i=1,i
=j
#
N
N "
(xkj − xki )(x − xkj ) k
k
k
k
lim u (x, t) = lim
uj + C(t)(x − xj ) − 2uj
pj (x) =
k→+∞
k→+∞
(xkj − xki )2
j=1
i=1,i
=j
k
#
N "
N
(x∗j − x∗i )(x − x∗j )
∗
∗
∗
=
uj + C(t)(x − xj ) − 2uj
pj (x) = u∗ (x, t).
(x∗j − x∗i )2
j=1
i=1,i
=j
Лемма доказана.
Оценим теперь отклонение движения системы (1), замкнутой управлением (15),
от движения той же системы, замкнутой точным многопрограммным управлением (5).
Для этого рассмотрим соответствующие замкнутые системы и некоторый фиксированный программный режим движения с номером s ∈ {1, N }:
ẋ = A(t)x + B(t)u∗ (x, t) + f (t) + μG(t, x, u∗ (x, t), μ),
ẋ = A(t)x + B(t)uk (x, t) + f (t) + μG(t, x, uk (x, t), μ).
Выбор конкретного программного движения с номером s означает, что для обеих систем установлены одни и те же начальные условия x(0) = xs0 . Обозначим решение вто:ks (t). Тогда вектор-функции x∗s (t) и x
:ks (t) являются непрерывными
рой системы через x
решениями соответствующих интегральных уравнений
x∗s (t)
t +
A(τ )x∗s (τ ) + B(τ )u∗ (x∗s , τ ) + f (τ ) + μG(τ, x∗s (τ ), u∗ (x∗s , τ ), μ) dτ ,
= xs0 +
0
134
:ks (t)
x
t +
:ks (τ ), uk (:
A(τ ):
xks (τ ) + B(τ )uk (:
= xs0 +
xks , τ ) + f (τ ) + μG(τ, x
xks , τ ), μ) dτ.
0
Вычитая одно равенство из другого и учитывая (8), находим
x∗s (t)
−
:ks (t)
x
t +
=
0
:ks (τ ) + B(τ ) u∗s (τ ) − uk (:
A(τ ) x∗s (τ ) − x
xks (τ ), τ ) +
:ks (τ ), uk (:
+ μ G(τ, x∗s (τ ), u∗s (τ ), μ) − G(τ, x
xks (τ ), τ ), μ) dτ.
(20)
Поскольку функция G(t, x(t), u(t), μ) непрерывно дифференцируема по всем своим аргументам, то для нее существует константа Липшица
∂G(t, ξ(t), μ) .
LG = max ∂ξ
t∈[0,T ]
μμ2
ξr2
k
T
k
:s (t), uk (:
Введем вспомогательную векторную функцию :
ξs (t) = x
xks (t), t) . Тогда,
переходя в (20) к оценке по норме и принимая во внимание очевидное неравенство
k
:ks (t) + u∗s (t) − uks (t) + uks (t) − uk (:
ξ ∗s (t) − :
ξ s (t) x∗s (t) − x
xks (t), t),
имеем
x∗s (t)
−
:ks (t)
x
t +
:ks (τ ) +
A(τ ) + μLG x∗s (τ ) − x
0
+ B(τ ) + μLG u∗s (τ ) − uks (τ ) + uks (τ ) − uk (:
xks (τ ), τ ) dτ.
Так как u∗s (t)−uks (t) – остаток равномерно сходящегося ряда (см. п. 3), то существует
величина δk > 0 такая, что u∗s (t)− uks (t) δk для любого t ∈ [0, T ]. Кроме того, в силу
равномерной сходимости последовательности (4) и свойств (17)–(19) функции uk (xk , t),
существует величина δ:k > 0 такая, что uks (t) − uk (:
xks (t), t) δ:k для любого t ∈ [0, T ].
Далее введем обозначения A = max A(t), B = max B(t), тогда последняя оценка
t∈[0,T ]
t∈[0,T ]
примет вид
x∗s (t)
−
:ks (t)
x
t +
:ks (τ ) + B + μLG δk + δ:k
A + μLG x∗s (τ ) − x
dτ.
0
Используя обобщенную лемму Грануолла [11], найдем
x∗s (t)
−
:ks (t)
x
B + μLG δk + δ:k (A+μLG )T
−1 .
e
A + μLG
(21)
135
Если зафиксировать требуемую точность вычислений ε > 0, тогда c учетом (21)
получим уравнение, связывающее ε и δk :
B + μLG δk + δ:k (A+μLG )T
−1 ,
ε=
e
A + μLG
откуда
ε(A + μLG )
− δ:k .
δk (ε) = B + μLG e(A+μLG )T − 1
(22)
Таким образом, при замыкании системы (1) k-тым приближением многопрограммного управления uk (x, t) вместо точного многопрограммного управления u∗ (x, t) норма
разности соответствующих решений отличается не более чем на величину ε, которая
связана формулой (22) с величиной δk .
Объединяя полученные результаты, сформулируем следующее утверждение.
Теорема 3. Пусть для системы (1) выполнены условия теоремы 2. Тогда для нее
существует многопрограммное управление (5), (6), реализующее программные движения x∗1 (t), . . . , x∗N (t), каждое из которых экспоненциально устойчиво при t 0.
При этом в качестве k-го приближения многопрограммного управления может
быть использована функция (15), (16), обладающая свойством (19) и обеспечивающая
для выбранного программного движения точность (21).
З а м е ч а н и е 3. Оценки точности приближений программных управлений и движений (21), (22) можно использовать на практике следующим образом. Сначала по требуемой точности отклонения от программных режимов ε по формуле (22) вычисляется
значение отклонения δk . Далее оно сравнивается с оценкой остаточного члена функционального ряда (см. п. 3 и замечание 1). Если δk больше этой оценки, то заданная
точность движения будет обеспечена k-тым приближением. В противном случае следует вычислить (k + 1)-тое приближение и заново сравнить δk с оценкой остаточного
члена функционального ряда. При этом равномерная сходимость последовательности
(4) гарантирует, что требуемая точность будет достигнута за конечное число шагов.
З а м е ч а н и е 4. Для оценки величины δ:k в (22) можно проделать следующую процедуру. Проинтегрировав систему (1), замкнутую управлением (15), найдем
:ks (t). Поскольку это можно сделать до непосредственной реалифактическое решение x
зации k-го приближения многопрограммного управления (15), (16), то оценка величины
xks (t), t) не представляет особых трудностей.
uks (t) − uk (:
6. Пример. Рассмотрим следующую квазилинейную управляемую систему:
⎧
2
⎪
⎨ẋ1 = −x2 + u + μx1 ,
ẋ2 = x1 + μx22 ,
⎪
⎩
ẋ3 = x2 .
Требуется на отрезке времени t ∈ [0, 2π] реализовать два
⎛ ⎞
⎛
0
0
a) xa0 = ⎝ 0 ⎠ , xa1 = ⎝ 0
0
1
⎛ ⎞
⎛
1
1
b) xb0 = ⎝ 0 ⎠ , xb1 = ⎝ 0
0
0
136
режима движения системы:
⎞
⎠,
⎞
⎠.
Фундаментальная матрица для данной системы имеет вид
⎛
⎞
cos t
− sin t 0
cos t 0 ⎠ .
Y(t) = ⎝ sin t
1 − cos t sin t 1
Используя формулы (4), найдем два приближения для программного управления и соответствующего ему программного движения обоих режимов функционирования системы:
⎛
⎞
sin t
1
1 ⎝
1 − cos t ⎠ ;
, x0a (t) =
u0a (t) =
2π
2π
t − sin t
4π − μ
μ
− 2 sin t;
u1a (t) =
8π 2
2π
⎛
⎞
sin t
1
⎝ 1 − cos t ⎠ +
x1a (t) =
2π
t − sin t
⎞
⎛
1
(1 − 4π1 2 )t sin t + ( 12 + 8π1 2 ) cos t − 13 sin 2t + 17
12 cos 2t − 4
1
1
1
⎠;
−( 12 + 8π1 2 ) sin t − (1 + 4π1 2 )t cos t + 19
+ μ⎝
12 sin 2t + 6 cos 2t + ( 2 − 8π 2 )
1
1
1
17
1
1
1
−(1 + 4π2 )t sin t + (1 − 8π2 ) cos t + 12 sin 2t − 12 cos 2t + ( 2 − 8π2 )t + 4
⎛
⎞
cos t
u0b (t) = 0, x0b (t) = ⎝ sin t ⎠ ;
1 − cos t
⎞
⎛
⎞
⎛ 1
1
1
cos t
3 sin 2t − 6 cos 2t − 2
μ
⎠.
− 31 sin 2t − 16 cos 2t
u1b (t) = − , x1b (t) = ⎝ sin t ⎠ + μ ⎝
2
1
1
1
− 12 sin 2t + 6 cos 2t + 2
1 − cos t
Первое приближение многопрограммного управления, согласно (15), (16), примет вид
'
(x1 − x1 )(x − x1 ) ( (x − x1b )2
+
u1 (x) = u1a + C(x − x1a ) − 2u1a a 1 b 1 2 a
(xa − xb )
(x1a − x1b )2
'
(x1 − x1 )(x − x1 ) ( (x − x1a )2
,
+ u1b + C(x − x1b ) − 2u1b b 1 a 1 2 b
(xb − xa )
(x1b − x1a )2
где C – матрица стабилизирующей обратной связи. В данном примере она не вычисляется, но метод ее построения хорошо известен [6].
Используя формулу (22) и замечания 1, 4, оценим отклонение приближенного управления и соответствующего ему движения от их точных предельных программных аналогов:
598μ2
(2 + 40μ)ε1
, δ1 (ε1 ) =
+ δ:1 ,
a) u∗a (t) − u1a (t) 1 − 26μ
(1 + 40μ)(e2π(2+40μ) − 1)
где 0 μ <
1
26 ;
b) u∗b (t) − u1b (t) 3μ2
,
1−μ
δ1 (ε1 ) =
(2 + 7μ)ε1
+ δ:1 ,
(1 + 7μ)(e2π(2+7μ) − 1)
где 0 μ < 1. В данных оценках по сути найдены значения величины μ0 из теоремы 1.
137
7. Заключение. В настоящей работе предложен конструктивный метод синтеза
многопрограммных управлений для класса квазилинейных систем, обеспечивающий
наперед заданную точность реализации программных движений. При этом предельные
функции экспоненциально устойчивы.
Литература
1. Зубов В. И. Интерполяция систем дифференциальных уравнений // Докл. АН СССР. 1991.
Т. 318, № 1. С. 28–31.
2. Зубов В. И. Синтез многопрограммных устойчивых управлений // Докл. АН СССР. 1991. Т. 318,
№ 2. С. 274–277.
3. Смирнов Н. В., Смирнова Т. Е. Синтез многопрограммных управлений в билинейных системах // Прикл. математика и механика. 2000. Т. 64, № 6. С. 929–932.
4. Смирнов Н. В., Соловьева И. В. Применение метода позиционной оптимизации для многопрограммной стабилизации билинейных систем // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2009. Вып. 3. С. 253–261.
5. Соловьева И. В. О позиционной оптимизации в задаче многопрограммной стабилизации системы
Лотки–Вольтерры // Процессы управления и устойчивость: Труды 40-й междунар. науч. конференции
аспирантов и студентов / под ред. Н. В. Смирнова, Г. Ш. Тамасяна. СПб.: Издат. дом С.-Петерб. гос.
ун-та, 2009. С. 67–72.
6. Зубов В. И. Лекции по теории управления. М.: Наука, 1975. 496 с.
7. Демидова А. М., Квитко А. Н. Решение граничной задачи для квазилинейных управляемых
систем // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2006. Вып. 1. С. 140–147.
8. Смирнов Е. Я. Стабилизация программных движений. СПб.: Изд-во С.-Петерб. ун-та, 1997.
307 с.
9. Карелин В. В., Харитонов В. Л., Чижова О. Н. Лекции по теории стабилизации программных
движений: учеб. пособие / под общ. ред. В. И. Зубова. СПб.: Издат. дом С.-Петерб. гос. ун-та, 2003.
80 с.
10. Шахов Я. А. Построение программного управления в одной квазилинейной динамической системе // Процессы управления и устойчивость: Труды 40-й междунар. науч. конференции аспирантов
и студентов / под ред. Н. В. Смирнова, Г. Ш. Тамасяна. СПб.: Издат. дом С.-Петерб. гос. ун-та, 2009.
С. 85–90.
11. Демидович Б. П. Лекции по математической теории устойчивости. М.: Наука, 1967. 472 с.
Статья рекомендована к печати проф. А. П. Жабко.
Статья принята к печати 10 июня 2010 г.
Документ
Категория
Без категории
Просмотров
12
Размер файла
239 Кб
Теги
квазилинейных, многопрограммная, стабилизацией, система
1/--страниц
Пожаловаться на содержимое документа