close

Вход

Забыли?

вход по аккаунту

?

Робастная Инвариантная стабилизация непрерывных и дискретных нелинейных систем.

код для вставкиСкачать
УДК 517.938
Вестник СПбГУ. Сер. 1, 2008, вып. 2
И. Е. Зубер, А. Х. Гелиг
РОБАСТНАЯ ИНВАРИАНТНАЯ СТАБИЛИЗАЦИЯ
НЕПРЕРЫВНЫХ И ДИСКРЕТНЫХ НЕЛИНЕЙНЫХ СИСТЕМ∗
1. Введение
Под инвариантностью понимается независимость данного выхода системы от возмущения, постоянно действующего на систему через один из её входов. Первой работой
в этой области явилась статья [1], в которой было предложено решение задачи инвариантности для линейной стационарной системы шестого порядка. Эта работа стала
предметом оживлённой дискуссии, описанной в книге [2], и стимулировала многочисленные исследования, обзор которых приведён в [3]. В большинстве работ по проблеме
инвариантности изучались линейные системы (из последних работ см., например, [4–7]).
Инвариантности нелинейных систем посвящено значительно меньше работ (см. обзор
[3] и статьи [8, 9]).
В данной статье для нелинейных непрерывных и дискретных систем осуществлен
синтез робастных управлений, обеспечивающих инвариантность. Термин «робастное»
означает, что возмущение и матрица коэффициентов объекта измеряются с погрешностями. При этом управление не зависит от этих погрешностей, а выход системы не
зависит от внешнего возмущения.
2. Инвариантная стабилизация нелинейных непрерывных систем
Рассмотрим при t ≥ 0 систему
ẋ = (A(x) + ∆(x))x + b1 (x)u1 + b2 (x)u2 + g(x)(ψ(t) + δ(t)),
(1)
σ = c∗ x,
(2)
где A(x) и ∆(x) — непрерывные и ограниченные на Rm матрицы-функции размерности
m × m, b1 (x), b2 (x) и g(x) — непрерывные и ограниченные на Rm столбцы-функции, c —
постоянный m-мерный столбец, ψ(t) и δ(t) — непрерывные и ограниченные при t ≥ 0
скалярные функции, ∗ — знак транспонирования. Здесь все величины, кроме ∆(x), δ(t)
и скалярных управлений u1 и u2 считаются известными. Предполагается, что погрешности ∆(x) и δ(t) удовлетворяют оценкам
sup | δ(t) |= δ0 ,
t≥0
sup k ∆(x) k= ∆0 .
(3)
x∈Rm
Задача заключается в построении управлений u1 и u2 , обеспечивающих при любом
x(0) выполнение следующих свойств:
lim | σ(t) |≤ δ1 (∆0 , δ0 ),
(4)
lim k x(t) k≤ γ0 lim | ψ(t) | +δ1 (∆0 , δ0 ),
(5)
t→∞
t→∞
t→∞
где δ1 (∆0 , δ0 ) + δ2 (∆0 , δ0 ) −→ 0 при ∆0 + δ0 → 0.
∗ Работа выполнена при финансовой поддержке РФФИ (гранты № 05-01-00238 и 05-01-00290).
c И. Е. Зубер, А. Х. Гелиг, 2008
109
Следуя [8], будем искать управления u1 и u2 в виде
u1 = s∗1 x,
(6)
u2 = s∗2 (x)x + α(t, x),
(7)
где s1 — постоянный m-мерный столбец, s2 (x) — m-мерный столбец-функция, α(t, x) —
скалярная функция.
Зафиксируем ε > 0 и рассмотрим выражение σ̇ + εσ. Ввиду (1), (2), (6) и (7) оно
имеет вид
σ̇ + εσ = c∗ [A(x)x + b1 (x)s∗1 x + b2 (x)s∗2 (x)x+
+ b2 (x)α(t, x) + g(x)ψ(t) + εx] + ν(t, x),
(8)
где ν(t, x) = c∗ ∆(x)x + c∗ g(x)δ(t).
Предположим, что выполнено свойство
inf | c∗ b2 (x) |> 0,
(9)
c∗ g(x)
ψ(t),
c∗ b2 (x)
c∗ (A(x) + b1 (x)s∗1 + εx)
s∗2 (x) = −
.
c∗ b2 (x)
(10)
x∈Rm
и положим
α(t, x) = −
После подстановки выражений (10) в равенство (8) последнее примет следующий
вид:
σ̇ + εσ = ν(t, x).
(11)
Поскольку функция ν(t, x) не ограничена по x, сначала построим управление (6) таким
образом, чтобы выполнялась оценка (5). В силу выражений (10) уравнение (1) примет
следующий вид:
ẋ = A1 (x)x + b(x)s∗1 x + f (t, x),
(12)
где
b2 (x)c∗
b2 (x)c∗
I− ∗
A(x) − ε ∗
+ ∆(x),
c b2 (x)
c b2 (x)
b2 (x)c∗
b(x) = I − ∗
b1 (x),
c b2 (x)
c∗ g(x)
f (t, x) = g(x) − ∗
b2 (x) ψ(t) + g(x)δ(t).
c b2 (x)
A1 (x) =
Задача свелась к такому выбору s1 (x), при котором выполняется свойство (5). Предположим, что система
ż = A1 (z) + b(z)u1
(13)
принадлежит к одному из двух классов, для которых в [10, гл. 2] было построенном
робастное стабилизирующее управление. В первом классе A1 (z) является матрицей
Фробениуса с функциональной нижней строкой, а у вектора b(x) последний элемент
превалирует над остальными. Во втором классе матрица A1 (z) является треугольной,
110
а вектор b(x) является последним единичным ортом. Для обоих классов робастное стабилизирующее систему (13) управление имело вид
u1 = s∗1 x,
(14)
s1 = λHem ,
где em — последний единичный орт, H — постоянная положительно определенная матрица специального вида, λ — скалярная величина. При этом матрица H при всех z
удовлетворяет неравенству
(A1 (z) + b(z)s∗1 )∗ H −1 + H −1 (A1 (z) + b(z)s∗1 ) + βH −1 < 0,
(15)
где β — положительная постоянная.
Рассмотрим теперь для системы (12) функцию Ляпунова V (x) = x∗ H 1 x. Ввиду (15)
ее производная по t, взятая в силу системы (12), удовлетворяет неравенству
V̇ ≤ −βV + 2x∗ H −1 f.
(16)
При любом µ > 0 очевидно соотношение
| 2x∗ H −1 f |≤ µ k x k2 +
1
k H −1 f k2 .
µ
(17)
1
V (x), где λ− — минимальное собственное число матрицы H −1 ,
λ−
из (16), (17) вытекает оценка
V̇ ≤ −æV + γ(t),
(18)
Поскольку k x k2 ≤
где æ = β − λµ− , γ(t) = µ1 k H −1 k2 supx∈Rm k f (t, x) k2 .
Из неравенства (18) после умножения его на exp(æt) и интегрирования получим
соотношение
Z t
V (x(t)) ≤ [V (x(0)) +
eæλ γ(λ)dλ]e−æt .
(19)
0
Введем обозначения γ∗ = lim γ(t) и рассмотрим функцию
t→+∞
γ1 (t) =
γ(t), если γ(t) > γ∗ ,
γ∗ ,
если γ(t) ≤ γ∗ ,
которая обладает свойствами
γ(t) ≤ γ1 (t),
(20)
lim γ1 (t) = γ∗ .
t→+∞
Заменим в правой части неравенства (19) γ на γ1 и представим полученное неравенство
в виде
Z t
Z t
−æt
−æt
æλ
−æt
V (x(t)) ≤ V (x(0))e
+e
e (γ1 (λ) − γ∗ )dλ + e
eæλ γ∗ dλ.
(21)
0
0
Пусть введенный в (17) параметр µ удовлетворяет неравенству µ < βλ− . Тогда
æ > 0 и ввиду (20) первые два слагаемых в правой части соотношения (21) стремятся к
111
нулю при t → +∞, а последнее слагаемое стремится к величине γ∗ /æ. Таким образом,
доказана оценка
γ∗
lim V (x(t)) ≤ ,
t→+∞
æ
из которой вытекает свойство (5). Из (5) следует равномерная по t ≥ 0, x ∈ Rm , ограниченность функции ν(t, x). Поэтому согласно (11) справедливо свойство (4). Таким
образом, получен следующий результат.
Теорема 1. Предположим, что выполнены условия (3), (9) и управления u1 и u2
определяются формулами (6), (7), (10), (14). Тогда любое решение системы (1) обладает свойствами (4), (5).
3. Инвариантная стабилизация дискретных нелинейных систем
Рассматривается система
xk+1 = (A(k, xk ) + ∆k )xk + b1 (k, xk )uk + b2 (k, xk )υk + g(ψk + δk )
σk = c∗ xk ,
k = 0, 1, 2, · · · ,
(22)
(23)
где A и ∆k — m × m-матрицы, b1 , b2 , g и c — m-мерные столбцы, ψk и δk — скалярные
величины. Здесь и в дальнейшем будут иногда применяться обозначения, уже использованные в предыдущем разделе, что не приведет к недоразумениям, поскольку разделы 2
и 3 независимы. Предполагается, что g и c — известные постоянные столбцы, а A(k, xk ),
b1 (k, xk ), b2 (k, xk ) — известные непрерывные и ограниченные на Z × Rm функции, ∆k
и δk — неизвестные помехи, удовлетворяющие оценкам
sup k ∆k k= ∆∗ ,
k∈Z
sup | δk |= δ∗ .
(24)
k∈Z
Требуется построить управления uk и υk таким образом, чтобы выполнялись следующие свойства:
lim | σk |≤ δ1 (∆∗ , δ∗ ),
(25)
k→∞
lim k xk k≤ γ0 lim | ψk | +δ2 (∆∗ , δ∗ ),
k→∞
k→∞
(26)
где δ1 (∆∗ , δ∗ ) + δ2 (∆∗ , δ∗ ) −→ 0 при ∆∗ + δ∗ → 0.
Для построения управлений uk и υk воспользуемся методикой, развитой в [9]. Введем
обозначения:
A(k, xk ) = Ak , b1 (k, xk ) = b1k , b2 (k, xk ) = b2k .
Зафиксируем параметр β ∈ (0, 1) и рассмотрим выражение σk+1 − βσk . В силу системы
(22), (23) оно имеет следующий вид:
σk+1 − βσk = c∗ (Ak xk + b1k uk + b2k υk − βxk + gψk ) + νk ,
(27)
νk = c∗ ∆k xk + c∗ gδk .
(28)
где
Предположив выполнение условия
c∗ b2k 6= 0
112
при k = 0, 1, 2, . . . ,
(29)
выберем управление υk в виде
υk =
1
(βc∗ xk − c∗ Ak xk − c∗ b1k uk − c∗ gψk ).
c∗ b2k
(30)
Тогда равенство (27) примет вид
(31)
σk+1 = βσk + δk .
Поскольку величины νk в силу (28) не ограничены относительно xk , оценим сначала
lim k xn k .
n→∞
В силу (30) система (21) примет следующий вид:
где
ek xk + bk uk + rk ,
xk+1 = A
(32)
b2k c∗
gc∗
b2k c∗
I − ∗ 2 Ak + β ∗ 2 , gk = I − ∗ 2 g,
c bk
c bk
c bk
b 2 c∗
bk = I − k∗ 2 b1k , rk = gk ψk + gδk + ∆k xk .
c bk
ek =
A
ek имеет форму Фробениуса с функциональной нижней
Предположим, что матрица A
строкой
k
k
ak = (αk1 , . . . , αm
b∗k = (β1k , . . . , βm−1
, βm
),
k ),
причем последний элемент столбца bk превалирует над остальными элементами:
m−1
X
j=1
k
| βjk |≤ æ | βm
|,
k
6= 0.
βm
(33)
Следуя [9], будем искать стабилизирующее управление uk в виде
uk = s∗k xk .
(34)
Vk = x∗k Hxk ,
(35)
0 < γ1 < . . . < γm .
(36)
Рассмотрим функцию Ляпунова
где H = diag{γ1 , . . . , γm } и
В силу (32), (34), (35) справедливо представление
Vk+1 − Vk = x∗k Lk xk + mk ,
где
Lk = Qk + sk fk∗ + fk s∗k + sk b∗k Hbk Sk∗ ,
e∗k H A
ek − H,
Qk = A
ek + Hbk s∗ )xk + r∗ Hrk .
mk = 2rk∗ (H A
k
k
(37)
e∗k Hbk ,
fk = A
(38)
113
Положим
sk = −
fk
.
b∗k Hbk
(39)
Тогда матрица Lk примет вид
L k = Qk −
fk fk∗
.
b∗k Hbk
(40)
В [9] было показано, что матрица Lk при выполнении условия доминирования (33)
удовлетворяет соотношению
x∗k Lk xk ≤ −(γ − ν)x2k ,
(41)
где γ = min{γ1 , γ2 − γ1 , . . . , γm − γm−1 }, ν = ν(æ) = æγm µ1 +
æ2 µ22
, µ1 = supk (2µ2 +
1 + æ2
ek k) k A
ek k, µ2 = supk k ak k.
ækA
Потребуем, чтобы æ из условия (33) удовлетворяло неравенству
0 < ν(æ) < γ.
(42)
Оценим величину (38). Очевидно неравенство
k rk k2 ≤ 3(µ3 ψk2 + k g k2 δk2 + ∆2∗ k xk k2 ),
(43)
где µ3 = sup k gk k2 . В силу (38) справедлива оценка
k∈Z
| mk |≤ 2µ4 k rk kk xk k +γm k rk k2 ,
(44)
ek + Hbk s∗ k. Поскольку при любом µ > 0 имеет место соотношение
где µ4 = sup k H A
k
k∈Z
2 k rk kk xk k≤
k rk k2
+ µ k xk k2 ,
µ
из (44) вытекает неравенство
| mk |≤ µµ4 k xk k2 +
µ4
+ γm
µ
k rk k2 .
Отсюда в силу (43) получаем оценку
| mk |≤ [µµ4 + 3
µ4
+ γm ∆2∗ ] k xk k2 +ϕk ,
µ
µ4
+ γm µ3 ψk2 + k g k2 δk2 .
µ
Из (37), (41), (45) следует соотношение
где ϕk = 3
Vk+1 − Vk ≤ −λ k xk k2 +ϕk ,
µ4
где λ = γ − ν − µµ4 − 3
+ γm ∆2∗ .
µ
114
(45)
Поскольку Vk ≤ γm k xk k2 , из последнего соотношения вытекает неравенство
Vk+1 ≤ δVk + ϕk ,
(46)
λ
. Согласно (42) можно выбрать сначала µ, а затем ∆∗ столь
γm
малыми, чтобы выполнялась оценка 0 < δ < 1. Из (46) с помощью рассуждений, проведенных в [9], вытекает неравенство
в котором δ = 1 −
lim Vk ≤
k→∞
1
lim ϕk .
1 − δ k→∞
Отсюда следует оценка (26), а следовательно, и свойства инвариантности (25) в силу
(31). Сформулируем полученный результат.
Теорема 2. Если управления uk и υk построены по формулам (30), (34), (39) и выполнены условия (29), (33), то при достаточно малых æ и ∆∗ любое решение системы
(22), (23) обладает свойствами (25), (26).
Литература
1. Щипанов Г. В. Теория и методы проектирования автоматических регуляторов // Автоматика и телемеханика. 1939. № 1. С. 4–37.
2. Левина З. М., Левин В. И. Г. В. Щепанов и теория инвариантности. М.: Физматлит. 2004.
3. Кухтенко А. И. Обзор по теории инвариантности // Автоматика. 1984. № 2. С. 3–13.
1985. № 2. С. 3–14. № 6. С. 3–14.
4. Якубович В. А. Универсальные регуляторы в задачах инвариантности и отслеживавния
// ДАН СССР. 1995. Т. 343. № 2. С. 172–175.
5. Якубович В. А. Синтез стабилизирующих регуляторов, обеспечивающих независимость
выходной переменной системы управления от внешнего воздействия // Докл. РАН. 2001.
Т. 380. № 1. С. 25–30.
6. Якубович В. А., Проскурников А. В. Задача об инвариантности системы управления //
Докл. РАН. 2003. Т. 343. № 6. С. 742–746.
7. Проскурников А. В., Якубович В. А. Приближённое решение задачи об инвариантности
системы управления // Докл. РАН. 2003. Т. 392. № 6. С. 750–754.
8. Зубер И. Е. Инвариантная стабилизация и задача слежения // Вестн. С.-Петерб. ун-та.
Сер. 1. 2006. Вып. 4. С. 41–47.
9. Зубер И. Е., Гелиг А. Х. Инварантная стабилизация нелинейных дискретных систем //
Вестн. С.-Петерб. ун-та. Сер. 1. 2007. Вып. 1. С. 91–95.
10. Гелиг А. Х., Зубер И. Е., Чурилов А. Н. Устойчивость и стабилизация нелинейных систем. СПб: Изд-во С.-Петерб. ун-та. 2006.
Статья поступила в редакцию 20 февраля 2007 г.
115
Документ
Категория
Без категории
Просмотров
4
Размер файла
237 Кб
Теги
нелинейные, инвариантная, стабилизацией, дискретное, система, робастная, непрерывные
1/--страниц
Пожаловаться на содержимое документа