close

Вход

Забыли?

вход по аккаунту

?

Решение задачи синтеза дискретной стабилизации с учетом неполной информации для нелинейной стационарной управляемой системы.

код для вставкиСкачать
УДК 517.977
Вестник СПбГУ. Сер. 1. 2012. Вып. 2
РЕШЕНИЕ ЗАДАЧИ СИНТЕЗА
ДИСКРЕТНОЙ СТАБИЛИЗАЦИИ
С УЧЕТОМ НЕПОЛНОЙ ИНФОРМАЦИИ
ДЛЯ НЕЛИНЕЙНОЙ СТАЦИОНАРНОЙ
УПРАВЛЯЕМОЙ СИСТЕМЫ
А. Н. Квитко1 , Д. Б. Якушева2
1. С.-Петербургский государственный университет,
д-р физ.-мат. наук, профессор, alkvit46@mail.ru
2. С.-Петербургский государственный университет,
аспирант, dariayakusheva@gmail.com
Часто при решении практических задач формировать закон управления на основе информации о полном фазовом состоянии объекта не представляется возможным
ввиду доступности измерению лишь некоторой функции от фазовых координат. В
связи с этим обстоятельством возникает проблема нахождения искомых управляющих функций по реально измеряемым величинам. Одним из подходов к решению
этой проблемы является метод, связанный с построением асимптотического наблюдателя. Основы теории асимптотических наблюдателей для линейных стационарных
систем были заложены работой Люенбергера [2]. В последующие десятилетия появились работы, обобщающие и распространяющие эту теорию на линейные нестационарные, билинейные и нелинейные системы специального вида [3–9]. Однако проблема построения асимптотических наблюдателей для нелинейных управляемых систем
общего вида еще недостаточно изучена и далека от своего решения. Аналогично обстоит дело и с решением задачи дискретной стабилизации нелинейных систем общего
вида. Основные усилия авторов данной статьи направлены на разработку достаточно простого для численной реализации алгоритма синтеза дискретного управления
и соответствующего асимптотического наблюдателя при решении задачи дискретной стабилизации для широкого класса нелинейных стационарных систем с учетом
нелинейности и дискретности измерителя, ограниченности управления, а также нахождению конструктивных критериев, гарантирующих существование решения поставленной задачи.
Объектом исследования является управляемая система обыкновенных дифференциальных уравнений
ẋ = f (x, u),
(1)
x = (x1 , . . . , xn )T ,
u = (u1 , . . . , ur )T ,
u Rr ,
f C 2 (Rn " Rr ; Rn ),
©
x Rn ,
r n,
t [0, ),
f = (f 1 , . . . , f n )T ,
(2)
f (0, 0) = 0,
(3)
rank (B, AB, . . . , An−1 B) = n,
(4)
А. Н. Квитко, Д. Б. Якушева, 2012
21
A=5
∂f i
(0, 0)6 ,
∂xj
i = 1, . . . , n,
j = 1, . . . , n,
B=5
∂f i
(0, 0)6 ,
∂uj
i = 1, . . . , n,
j = 1, . . . , r,
7u7 < C.
(5)
Предположим, что в некоторые дискретные моменты времени t = kh, h 0,
k = 0, 1, . . ., доступен измерению вектор y(kh) Rm , m n, связанный с фазовым
вектором x уравнением
y(kh) = g(x(kh)),
(6)
где
g C 2 (Rn ; Rm ),
g = (g 1 , . . . , g m )T ,
n−1
rankT , A T , . . . , A
(7)
T = n,
(8)
∂g
(0) .
∂x
Определение. Управление u(t) называется дискретным, если
T =
u(t) = u(kh),
t [kh, (k + 1)h),
k = 0, 1, . . . ,
h 0.
Задача 1. Используя результаты измерения y(kh), k = 0, 1, . . . , h 0, найти
дискретное управление u(t) так, чтобы решения системы (1) удовлетворяли условиям
x(0) = x0 ,
x(t) 0
при t .
(9)
Теорема. Пусть для системы (1) и уравнения измерителя (6) выполнены условия (2)–(4), (7), (8). Тогда существуют ε 0, h0 0 такие, что для всех x0 Rn ,
h 0, удовлетворяющих неравенствам
7x0 7 < ε,
0 < h < h0 ,
существует решение задачи 1, которое может быть получено после решения задачи непрерывной стабилизации линейной стационарной системы и построения матрицы асимптотического наблюдателя типа Люенбергера.
Доказательство. Будем искать уравнение асимптотического наблюдателя в
виде
(10)
x̂˙ = Ax̂ + Bu + K(y(kh) − g(x̂(kh))), x̂ = (x̂1 , . . . , x̂n )T .
В уравнении (10) K — неизвестная постоянная матрица размерности [n"m], подлежащая определению. Используя свойства (2), (7), системы (1) и (10) можно представить
в виде
ẋ = Ax + Bu + ϕ(x, u) + ϕ1 (x, u),
(11)
ϕ = (ϕ1 , . . . , ϕn )T ,
ϕi =
22
n
r
2 i
ϕ1 = (ϕ11 , . . . , ϕn1 )T ,
r
r
(12)
2 i
1
1
∂ f
∂ f
(x̃, ũ)xj uk + (x̃, ũ)uj uk ,
j
k
2 j=1 k=1 ∂x ∂u
2 j=1 k=1 ∂uj ∂uk
(13)
ϕi1 =
1 n n ∂2f i
(x̃, ũ)xj xk ,
2 j=1 k=1 ∂xj ∂xk
x̃ = θi x,
ũ = θi u,
i = 1, . . . n,
θi [0, 1],
x̂˙ = Ax̂ + Bu + KT (x(kh) − x̂(kh)) + K(g1 (x(kh)) − g1 (x̂(kh))),
g1 =
g1i =
1 m m ∂ 2gi ˜ j k
(x̃)x x ,
2 j=1 k=1 ∂xj ∂xk
˜ = θ̄i x,
x̃
Рассмотрим систему
(14)
(g11 , . . . , g1m ),
θ̄i [0, 1],
(15)
i = 1, . . . , m.
ẋ = Ax + Bu,
(16)
x̂˙ = Ax̂ + Bu + KT (x − x̂).
(17)
Будем искать постоянные матрицы Mrn , Knm так, чтобы система (16), (17), замкнутая управлением
u(t) = M x̂(t),
(18)
была экспоненциально устойчивой.
Сделаем замену переменной x̂ на δ по формуле
x̂ − x = δ.
(19)
Тогда в новых переменных x, δ система (16), (17), замкнутая управлением (18), примет вид
ẋ
x
A + BM
BM
,*
,.
(20)
*
,=*
A
−
KT
δ
O
δ̇
1
Здесь O1 — матрица, состоящая из нулевых элементов размерности n " n. Используя
известный алгоритм непрерывной стабилизации линейных стационарных систем [1],
находим матрицу M , при которой спектр матрицы A + BM лежит в левой полуплоскости. Чтобы подобрать матрицу K, гарантирующую расположение спектра матрицы
A−KT в левой полуплоскости, достаточно по упомянутому алгоритму найти матрицу
K такую, чтобы спектр матрицы −A + T K лежал в правой полуплоскости. Тогда
из свойства произведения фундаментальных матриц исходной и сопряженной систем
будет следовать, что спектр матрицы A − KT лежит в левой полуплоскости. Отсюда
и из структуры матрицы системы (20) следует экспоненциальная устойчивость системы (20) при выбранных матрицах M и K. С другой стороны, согласно замене (19),
получим экспоненциальную устойчивость системы (16), (17), замкнутой управлением
(18). Для удобства дальнейших рассуждений запишем ее в виде одного уравнения
ξ˙ = P ξ,
(21)
где
ξ = (x, x̂)T ,
P =*
A
KT
BM
,.
A − KT + BM
Рассмотрим систему (10), (11), замкнутую дискретным управлением
u(t) = M x̂(kh),
t [kh, (k + 1)h),
k = 0, 1, . . . .
(22)
23
По аналогии с системой (16), (17) ее можно записать в виде одного уравнения
ξ˙ = Qξ + Rξ(kh) + ϕ̄(ξ, ξ(kh)) + ϕ̄1 (ξ, ξ(kh)).
(23)
Здесь
Q=*
A
O
O
,,
A
R=*
O
O
BM
,,
BM
ϕ̄ = (ϕ(Γ1 ξ, M Γ2 ξ(kh)), K(g(Γ1ξ(kh)) − g(Γ2 ξ(kh))))T ,
(24)
ϕ̄1 = (ϕ1 (Γ1 ξ, M Γ2 ξ(kh)), 0, . . . , 0)T2n1 ,
Γ1 = (E, 0)n2n ,
Γ2 = (0, E)n2n ,
где O — матрица с нулевыми элементами размерности [n " n]. Наряду с системой (23)
рассмотрим систему
ξ̇ = Qξ + Rξ(kh) + ϕ̄(ξ, ξ(kh)).
(25)
Введем в рассмотрение функцию z(t):
ξk = ξ(kh),
z(t) = ξ(t) − ξ(kh) = ξ(t) − ξk ,
t [kh, (k + 1)h].
(26)
Решение системы (25) на промежутке [kh, (k + 1)h], k = 0, 1, . . . , имеет вид
t
ξ(t) = eQ(t−kh) ξk + eQt 8
kh
e−Qτ (Rξk + ϕ̄(ξ, ξk )) dτ.
(27)
Сделаем в (27) замену переменной t на θ по формуле t − kh = θ. Тогда при θ [0, h]
получим
ξ(θ + kh) = eQθ ξk + eQ(θ+kh) 8
θ+kh
e−Q(τ +kh) (Rξk + ϕ̄(ξ, ξk )) dτ.
kh
(28)
Равенство (28) можно записать в виде
ξ(θ + kh) = ξk + QeQt̃ hξk + eQ(θ+kh) 8
θ+kh
kh
θ [0, h],
e−Q(τ +kh) (Rξk + ϕ̄(ξ, ξk )) dτ,
t̃ [0, h].
(29)
Подставив (29) в (26), получим
z(θ+kh)=ξ(θ+kh)−ξ(kh)=QeQt̃ hξk +eQ(θ+kh) 8
θ [0, h],
θ+kh
kh
e−Q(τ +kh) (Rξk + ϕ̄(ξ, ξk )) dτ,
t̃ [0, h].
(30)
Из (30) следует
7z(θ + kh)7 7Q77eQt̃ 77ξk 7h + 7eQθ 7 8
θ+kh
kh
θ [0, h],
7e−Qτ 77Rξk + ϕ̄(ξ, ξk )7 dτ,
t̃ [0, h].
(31)
На основании (2), (7), (12), (24) в области
7ξ7 < C1
24
(32)
существует константа L такая, что
7ϕ̄(ξ, ξk )7 L7ξk 7.
(33)
В (32) C1 0 — произвольное число.
Используя (33), неравенство (31) можно записать в более компактном виде:
7z(t)7 L1 h7ξk 7 + L2 h7ξk 7,
t [kh, (k + 1)h].
(34)
Константы L1 , L2 в неравенстве (34) не зависят от номера промежутка [kh, (k + 1)h].
С другой стороны, согласно (26)
7ξk 7 7ξ(t)7 + 7z(t)7,
t [kh, (k + 1)h].
(35)
Неравенства (34), (35) дают оценку
7z(t)7 (L1 + L2 )h
7ξ(t)7,
1 − (L1 + L2 )h
t [kh, (k + 1)h].
(36)
В силу экспоненциальной устойчивости системы (21) существует положительно определенная квадратичная форма V (ξ) [1] такая, что
dV
= −7ξ72 .
dt (21)
(37)
После несложных рассуждений нетрудно видеть, что производную V (ξ) в силу системы (25) можно записать так:
dV
= −7ξ72 − (grad V, Rz) + (grad V, Γ3 z) + 9grad V, ϕ̄2 &ξ, ξ(kh)' − ϕ̄2 (ξ, ξ):+
dt (25)
(38)
+&grad V, ϕ̄2 (ξ, ξ)',
где
Γ3 = *
O
−KT
O
,,
KT
T
ϕ̄2 (ξ, ξ(kh)) = 9ϕ(Γ1 ξ, M Γ2 ξ(kh)), K(g1 (Γ1 ξ(kh)) − g1 (Γ2 ξ(kh))): ,
T
ϕ̄2 (ξ, ξ) = 9ϕ(Γ1 ξ, M Γ2 ξ), K(g1 (Γ1 ξ) − g1 (Γ2 ξ)): .
(39)
В области (32) справедливы оценки
7grad V 7 γ1 7ξ7,
(40)
7ϕ̄2 (ξ, ξ(kh)) − ϕ̄2 (ξ, ξ)7 γ2 7ξ(kh) − ξ7 = γ2 7z7.
(41)
Используя (38)–(41), получаем неравенство
dV
−7ξ72 + γ3 7ξ77z7 + γ4 7ξ77z7 + γ5 7ξ73 .
dt (25)
(42)
25
В (42) γi , i = 1,¯5 — положительные константы, зависящие от области (32). Из (36),
(38), (42) следует
γ4 (L1 + L2 )h
γ3 (L1 + L2 )h
dV
+
,7ξ72 + γ5 7ξ73 .
−7ξ72 + *
dt (25)
1 − (L1 + L2 )h 1 − (L1 + L2 )h
(43)
Выберем константы C2 0, h0 0: 0 < C2 < C1 так, чтобы выполнялось неравенство
γ3 (L1 + L2 )h0
γ4 (L1 + L2 )h0
+
+ γ5 C2 < 1.
1 − (L1 + L2 )h0 1 − (L1 + L2 )h0
(44)
Тогда для всех h 0 < h < h0 оценка (43) в области
7ξ7 < C2
(45)
примет вид
dV
−γ6 7ξ72 ,
dt (25)
γ6 0.
(46)
Производную функции V (ξ) в силу системы (23) можно записать так:
dV
dV
=
+ &grad V, ϕ̄1 '.
dt (23) dt (25)
(47)
Оценивая правую часть (47) в области (45), с учетом (46), (45), (24), (13) получаем
dV
−γ6 7ξ72 + γ7 7ξ73 .
dt (23)
(48)
Здесь γ7 0 — константа. Выберем константу C3 : 0 < C3 < C2 так, чтобы
Тогда в области
γ7 C3 < γ6 .
(49)
7ξ7 < C3
(50)
на основании (49) имеет место неравенство
dV
−γ8 7ξ72 ,
dt (23)
γ8 0.
(51)
С другой стороны, согласно [2] функция V (ξ) является квадратичной формой, которая находится после решения уравнения Ляпунова (37), и для нее справедлива
оценка
α1 7ξ72 V (ξ) α2 7ξ72 .
(52)
Константы α1 0, α2 0 определяются матрицей квадратичной формы V (ξ). Из (51),
(52) следует
V (ξ) V (ξ0 )e−γ8 (2α2 )t ,
26
ξ0 = (x(0), x̂(0))T ,
t [0; +).
(53)
Окончательно условия (52), (53) дают оценку
7ξ(t, 0, ξ0 )7 Пусть
7ξ0 7 <
α2
7ξ0 7e−γ8 (2α2 )t ,
α1
α1 C3
,
α2
Положим
ε = min 5
7ξ0 7 <
t [0, +).
(54)
α1 C
.
α2 7M 7
(55)
α1 C3 α1 C
6.
,
α2 α2 7M 7
Тогда из неравенств (54), (55) следует, что решение системы (23) не покидает области
(50) и удовлетворяет условиям (9), а соответствующее ему управление (22) удовлетворяет ограничению (5). Теорема доказана.
Замечание 1. Повторяя дословно доказательство теоремы 1, нетрудно убедиться, что в качестве асимптотического наблюдателя можно принять уравнение
dx̂
= f (x̂, u) + KT (g(x) − g(x̂)).
dt
Задача 2. Используя результаты измерителя (6), найти пару функций x(t), u(t),
удовлетворяющих системе (1) и условиям
x(0) = 0,
7x(t )7 < ε1 ,
где ε1 0 — произвольное число, t — заранее неизвестный момент времени.
Замечание 2. Очевидно, что решение задачи 1 на промежутке [0, t ] дает решение задачи 2 при t , удовлетворяющем условию
α2
7ξ0 7e−γ6 (2α2 )t < ε1 .
α1
Пример. Решение задачи межорбитального перелета. В качестве иллюстрации предложенного метода приведем решение задачи перевода материальной
точки, движущейся в центральном поле тяготения, на круговую орбиту, лежащую
в плоскости орбиты движущейся точки с помощью реактивной силы. Согласно [10]
система уравнений в отклонениях относительно указанного движения по круговой
орбите имеет вид
ẋ1 = x2 ,
ẋ2 = ν1 (x1 , x4 ) + u1 ,
ẋ3 = x4 ,
ẋ
4 = ν2 (x1 , x2 , x4 ) + ν3 (x1 )u2 ,
где x1 = r − r0 , x2 = ṙ, x3 = ψ − α0 t, x4 = ψ̇ − α0 , u1 = ar ṁm, u2 = aψ ṁm, r0 —
радиус круговой орбиты, ṙ — радиальная скорость, ψ — полярный угол, ψ̇ — скорость
изменения полярного угла, ar , aψ — проекции вектора относительной скорости отделяющейся частицы на направление радиуса и на ортогональ к направлению соответственно, m, ṁ — соответственно масса и скорость изменения массы, α0 — угловая
скорость движения по заданной круговой орбите,
ν1 = −
ν
+ (x1 + r0 )(x4 + α0 )2 ,
(x1 + r0 )2
ν2 = −2
x2 (x4 + α0 )
,
x1 + r0
ν3 =
1
,
x1 + r0
27
ν = ν 0 M , ν 0 — постоянная всемирного тяготения, M — масса планеты. Далее,
x = (x1 , x2 , x3 , x4 )T ,
u = (u1 , u2 )T .
Матрицы A и B имеют вид
A=
a21 =
0
a21
0
0
1
0
0
a42
0
0
0
0
0 a24
,
1
0 !
B=
0 0 1 0
,
0 0
0 β0 !
∂ν1
∂ν1
∂ν2
(0, 0), a24 =
(0, 0), a42 =
(0, 0, 0), β0 = ν3 (0),
∂x1
∂x4
∂x2
B = (b1 , b2 ), b1 = (0, 1, 0, 0)T , b2 = (0, 0, 0, β0 )T ,
0 1
0
1 0 a21 + a24 a42
0 0
a42
0
0 a42
Рассматривалось следующее уравнение измерителя:
2
rankb1 , Ab1 , A b1 , b2 = rank y = T x,
T =*
0
0
1 0
0 1
0
,,
0
0 0
= 4.
0
β0 !
rankT , A T , A2 T , A3 T = 4.
Численное моделирование. В процессе численного моделирования интегрировалась расширенная система
ẋ1
ẋ2
ẋ
3
ẋ
4
˙
x̂1
x̂˙ 2
x̂˙ 3
˙
x̂4
;
α0 =
= x2 ,
= ν1 (x1 , x4 ) + u1 ,
= x4 ,
= ν2 (x1 , x2 , x4 ) + ν3 (x1 )u2 ,
2 + a21 + a24 a42
2a24
= x̂2 +
(x2 − x̂2 ) −
(x3 − x̂3 ),
a21
a21
= ν1 (x̂1 , x̂4 ) + u1 + 3(x2 − x̂2 ),
= x̂4 + 3(x3 − x̂3 ),
= ν2 (x̂1 , x̂2 , x̂4 ) + ν3 (x̂1 )u2 + 2(x3 − x̂3 ),
ν
рад/сек,
r03
x11 = 100 м,
r0 = 7 ċ 106 м,
x13 = −
α0
рад,
106
на промежутке [0, 20] с начальными данными
x1 (0) = x11 ,
x2 (0) = 0.2,
x3 (0) = x13 ,
x4 (0) = 0.00001,
замкнутая управлениями
u1 = (−m − 11)x̂1 (kh) − 6x̂2 (kh) −
u2 =
a42
1
x̂1 (kh) − x̂4 (kh),
ν3
ν3
где m = a21 + a24 a42 , h = 0.1, k = 0, 1, . . . .
28
6
x̂3 (kh),
a42
ε = 0.01
(56)
Рис. 1. Графики изменения во времени: a — координаты x1 , b — управления u1 , c — координаты
x2 , d — управления u2 .
На рис. 1 представлены графики изменения искомых управляющих функций u1 ,
u2 и соответствующих им функций фазовых координат x1 (t), x2 (t).
Предварительный анализ результатов численного моделирования позволяет сделает следующие выводы:
1) критическое значение шага дискретности при условиях (56) h = 0.2; критическое значение для x11 изменяется в зависимости от ограничений на управляющие
воздействия;
2) задача межорбитального перелета легко решается с помощью персональных
ЭВМ средних возможностей.
29
Литература
1. Каллман Р., Фалб П., Арбиб М. Очерки по математической теории систем / пер. с
англ. под ред. Э. Л. Напельбаума. М.: Мир, 1971. 399 с.
2. Luenberger D. G. Determing the state linear system with observers low dynamic order.
Ph. D. dissertation. Stanford University. 1963.
3. Luenberger D. G. Observers for multivariable systems // IEEE Transactions of Automatic
Controll. 1966. P. 190–197.
4. Trin H., Ha Q. P. Design of linear functional observers for linear systems with unknown
inputs // International Journal of Systems Science. 2000. Vol. 31, N 6. P. 741–749.
5. Roman J. R., Bullok T E. Design of minimal-order stable observes for linear functions
of the state via realization theory // IEEE Transactions of Automatic Control. 1975. Vol. 20.
P. 613–622.
6. Bhattachargun S. P. Observer design for linear system with unknown input // IEEE
Transactions of Automatic Control. 1978. Vol. 23. P. 483–484.
7. Коровин С. К., Фомичев В. В. Экспоненциальные наблюдатели билинейных систем
на плоскости // Дифференциальные уравнения. 2001. Т. 37, № 12. С. 1605–1612.
8. Коровин С. К., Фомичев В. В. Экспонециальные наблюдатели билинейных систем на
плоскости // Докл. РАН. Теория управления. 2001. Т. 385, № 5. С. 713–728.
9. Коровин С. К., Фомичев В. В. Асимптотические наблюдатели для некоторых классов
билинейных систем с линейным входом // Докл. РАН. Теория управления. 2004. Т. 398, № 1.
С. 38–43.
10. Красовский Н. Н. Теория управления движением. М.: Наука, 1968. 475 с.
Статья поступила в редакцию 22 декабря 2011 г.
ХРОНИКА
23 марта 2011 г. на заседании секции теоретической механики им. проф.
Н. Н. Поляхова в Санкт-Петербургском Доме Ученых РАН выступили канд.
физ.-мат. наук, доц. А. Б. Бячков (Пермский ГУ) и д-р физ.-мат. наук,
проф. М. П. Юшков (СПбГУ) с докладом на тему «Тензорная форма уравнений
Удвадиа—Калабы движения неголономных систем».
Краткое содержание доклада:
Ф. Удвадиа и Р. Калаба вывели уравнения движения неголономных систем с линейными связями второго порядка, не содержащие реакций связей. Количество этих
уравнений равно числу обобщенных координат системы. Уравнения были получены
с помощью понятия псевдообратной матрицы, предложенной Э. Х. Муром и Р. Пенроузом. В докладе показано, что подстановка выражений обобщенных реакций из
второй группы обобщенных уравнений Маджи в уравнения Лагранжа второго рода с
множителями дает наглядную форму записи уравнений Удвадиа—Калабы в тензорной форме.
30
1/--страниц
Пожаловаться на содержимое документа