close

Вход

Забыли?

вход по аккаунту

?

Аналитический синтез стабилизирующего управления по выходу для нестационарныхимпульсных систем.

код для вставкиСкачать
УДК 517.929
Вестник СПбГУ. Сер. 1, 2004, вып. 2
А. Х. Гелиг
АНАЛИТИЧЕСКИЙ СИНТЕЗ СТАБИЛИЗИРУЮЩЕГО
УПРАВЛЕНИЯ ПО ВЫХОДУ ДЛЯ НЕСТАЦИОНАРНЫХ
ИМПУЛЬСНЫХ СИСТЕМ∗
1. Введение
Начиная с работ [1, 2] для решения задачи стабилизации систем управления используются преобразования подобия специального вида, переводящие исходную систему к
форме, позволяющей получить явное решение поставленной задачи. На этом пути для
непрерывных линейных нестационарных и нелинейных систем в [3, 4] был осуществлен аналитический синтез стабилизирующего управления при условии, что доступен
измерению весь вектор фазовых координат (синтез по состоянию). В [5] аналитический синтез произведен для случая, когда измеряется лишь одна скалярная величина
(синтез по выходу).
Для импульсных систем [6, 7] аналитический синтез стабилизирующего управления
по состоянию был осуществлен в [8] для случая стационарной линейной непрерывной
части системы, в [9] для случая нестационарной линейной непрерывной части системы
и в [10, 11] для случая нелинейной непрерывной части системы. При этом, если в [8,
9] предполагается линейность статической характеристики импульсного модулятора,
то в [10, 11] допускается ее нелинейность. В данной статье для импульсной системы
с нестационарной непрерывной линейной частью и нелинейной статической характеристикой импульсного модулятора получен аналитический синтез стабилизирующего
управления по выходу.
Рассуждения основаны на использовании преобразования подобия специального вида и наблюдателя Калмана—Луенбергера [12], а также на методе усреднения [13].
2. Постановка задачи
Рассмотрим импульсную систему, описываемую функционально-дифференциальными уравнениями
(1)
ẋ = A(t)x + b(t)ξ, σ = c∗ (t)x,
ξ = M η,
η = U [σ],
(2)
где A(t) ∈ R
, x(t), b(t), c(t) ∈ R , ∗ — знак транспонирования, все величины вещественные. Уравнения (1) описывают линейную непрерывную часть системы, σ —
наблюдаемая величина (сигнал на выходе непрерывной линейной части), M — нелинейный оператор, описывающий функционирование импульсного модулятора, η(t) —
сигнал на входе модулятора, ξ(t) — сигнал на его выходе. Оператор M отображает каждую непрерывную на [0, +∞) функцию η(t) в функцию ξ(t) и последовательность {tn }
(n = 0, 1, 2, . . . ; t0 = 0), обладающие следующими свойствами:
1) существует такие положительные постоянные T и δ0 , что для всех n верна оценка
m×m
m
δ0 T tn+1 − tn T ;
(3)
∗ Работа выполнена пpи поддержке РФФИ (проект № 02-01-00542) и Совета по грантам Президента
РФ для поддержки ведущих научных школ (грант НШ-2257.2003.1).
c А. Х. Гелиг, 2004
15
2) функция ξ(t) кусочно непрерывна на промежутке [tn , tn+1 ) и не меняет знака на
нем;
3) ξ(t) зависит только от значений η(τ ) при τ t, tn зависит только от значений η(t)
при t tn ;
4) для каждого n существует такое tn ∈ [tn , tn+1 ), что среднее значение n-го импульса
1
vn =
tn+1 − tn
t
n+1
ξ(t)dt
tn
удовлетворяет равенству
vn = ϕ(η(
tn )),
(4)
где ϕ(η) — монотонная и непрерывная на (−∞, +∞) функция, которая описывает статическую характеристику модулятора, причем ϕ(0) = 0, ϕ(+∞) = +∞, ϕ(−∞) = −∞.
Свойствами 1–4 обладают различные виды комбинированной импульсной модуляции
[6, 13], например, широтно-амплитудные модуляции первого и второго рода.
Матрица A(t), векторы b(t), c(t) и оператор M заданы. Требуется определить оператор U [σ] таким образом, чтобы любое решение обладало асимптотикой
x(t) → 0 при t → +∞,
(5)
если параметр T удовлетворяет некоторой верхней оценке.
3. Формулировка результата
−1
Положим в (2) η = ϕ (ζ), ζ = U1 [σ], где ϕ−1 — функция, обратная к ϕ, а U1 —
оператор, подлежащий определению. Тогда уравнения (2) примут вид
ξ = M1 ζ,
ζ = U1 [σ],
где M1 — оператор, обладающий свойствами 1–4 с той лишь разницей, что вместо (4)
имеет место соотношение
tn )
(6)
vn = ζ(
Для нахождения оператора U1 мы воспользуемся развитой в [12] методикой построения наблюдателя и разработанным в [13] методом усреднения. Введем в рассмотрение
матрицу управляемости W (t) и матрицу наблюдаемости N (t), определяемые равенствами
W (t) = b(t), Db(t), . . . , Dm−1 b(t),
N (t) = c(t), D∗ c(t), . . . , (D∗ )m−1 c(t),
где D = A −
d
dt ,
а матрицы Lk (t) являются матрицами производных Ли:
L1 (t) = A(t),
Lk (t) = L̇k−1 (t) + Lk−1 (t)A(t),
k = 2, . . . , m.
Предполагается, что коэффициенты матриц A(t), b(t), c(t) равномерно на [0, +∞) ограничены вместе с производными до порядка 2m − 1 включительно и матрицы W (t), N (t)
равномерно невырождены:
inf | det W (t)| > 0,
t>0
16
inf | det N (t)| > 0.
t>0
(7)
Сделаем в системе (1) замену координат x
(t) = G(t)x(t), где G(t) согласно [14] имеет
вид
e∗ B −1 (t)
m
d ∗ −1
∗
−1
em B (t) + em B (t)L1 (t)
dt
.
G(t) = ..
.
m−1
j
j
d
∗
−1
Cm−1 j (em B (t))Lm−1−j (t)
dt
j=1
Здесь B(t) = b0 (t), . . . , bm−1 (t), em = 0, . . . , 0, 1∗ — последний единичный орт,
k−1
j
dk
k d
b0 = b(t), bk (t) = fk −
Cj j fk−j (t), fk (t) = Lk (t) − k b(t), k = 1, m − 1, Cjk —
dt
dt
j=0
биноминальные коэффициенты. В [14] показано, что
inf | det G(t)| > 0,
t>0
(8)
и система (1) принимает вид
x + em ξ,
x
˙ = A(t)
σ=
c∗ (t)
x,
(9)
— матрица Фробениуса с последней функциональной строгде c∗ (t) = c∗ (t)G−1 (t), а A(t)
кой:
0
1
0 0
0
0 .
..
.. .
=
A
..
.
. 0
0
1 α1 (t) α2 (t) · · · αm (t)
Фиксировав произвольный гурвицев полином π(λ) = λm +ρm λm−1 +. . .+ρ1 , построим
+ em s∗ (t) будет
вектор s(t) с координатами si (t) = −ρi − αi (t). Тогда матрица D = A(t)
матрицей Фробениуса с постоянной нижней строкой − ρ1 , . . . , −ρm , характеристическим полиномом π(λ) и, следовательно, гурвицевой. Представим первое уравнение в
(9) в виде
(10)
x
˙ = D
x + em s∗ (t)z + em (ξ − s∗ (t)x̂),
где вектор x̂(t) удовлетворяет уравнению наблюдателя Калмана—Луенбергера
x̂˙ = Dx̂ + d(t)
c∗ (t)z + em (ξ − s∗ (t)x̂),
(11)
в котором z = x̂ − x
— ошибка наблюдения, а вектор d(t) коэффициентов усиления
наблюдателя будет выбран ниже. Вычитая уравнение (10) из (11), получим для z(t)
систему
(12)
ż = A(t)z
+ d(t)
c∗ (t)z.
Выберем теперь, следуя [12], вектор d(t) таким образом, чтобы выполнялась асимптотика
z(t) → 0 при t → +∞.
(13)
17
d
zk−1 (k = 2, . . . , m), где
С этой целью, введя новые координаты z1 = c∗ (t)z, zk =
dt
d
берутся в силу системы ż = A(t)z,
построим преобразование
производные
dt
z = P (t)z,
(14)
где z∗ = (
z1 , . . . , zm ),
∗
c (t)
∗
d
c (t)
∗
+
c
(t)
A(t)
.
P (t) = dt
..
.
m−1 ∗
c (t)
d
∗
m−1
+
.
.
.
+
c
(t)
A
(t)
dtm−1
В результате преобразования (14) система (12) примет форму
−1
z˙ = P (t)A(t)P
(t) + Ṗ (t)P −1 (t) + P (t)d(t)c∗ (t)P −1 (t) z.
(15)
−1
(t) + Ṗ (t)P −1 (t), d = P (t)d(t) и учитывая соотВведя обозначение D0 (t) = P (t)A(t)P
∗
−1
∗
ношение c (t)P (t) = e1 = (1, 0, . . . , 0), систему (15) можно записать в виде
∗ )
(16)
z˙ = (D0 (t) + de
1 z,
где D0 (t) — матрица Фробениуса с функциональной последней строкой. Возьмем, следуя [12], для системы (16) функцию Ляпунова в виде V (
z ) = z∗ H0 z, где H0 — положительно определенная трехдиагональная матрица
с элементами hij (i, j = 1, m), удовле
творяющими условиям hii > 0, hij = − 21 hii hjj при j = i − 1 и j = i + 1, hij = 0 при
j < i − 1 и j > i + 1. Фиксировав α > 0 и взяв d = λH0−1 e1 , где λ — параметр, потребуем,
чтобы производная V̇ от функции V (
z (t)), взятая в силу системы (16), удовлетворяла
неравенству V̇ < −αV , т.е. чтобы матрица
M = (D0 (t) + λH0−1 e1 e∗1 )∗ H0 + H0 (D0 (t) + λH0−1 e1 e∗1 ) + αH0
была отрицательно определенной. Как показано в [9], выбором чисел hii (i = 1, m) можно добиться m−1 перемен знаков в последовательности главных диагональных миноров
матрицы M , отсчитываемых от нижнего конца главной диагонали. Последняя перемена
знаков в этой последовательности обеспечивается выбором λ. Таким образом, свойство
(13) выполняется при d(t) = λP −1 (t)H0−1 e1 . Поэтому для доказательства асимптотики
x
(t) → 0 при t → +∞
(17)
достаточно убедиться в справедливости свойства
x̂(t) → 0 при t → +∞.
(18)
∗
С этой целью определим оператор U1 следующим образом: ζ(t) = s (t)x̂(t), где x̂(t)
определяется по σ(t) с помощью уравнения (11).
В дальнейших рассуждениях воспользуемся методом усреднения [13]. Будем обознаtn ) при tn t <
чать чертой сверху “замороженные” функции. Например, ζ(t) = ζ(
t
tn+1 (n = 0, 1, 2, . . .). Введя функции v(t) = ζ(t) и u(t) = [ξ(λ) − v(λ)]dλ, сделаем в
0
уравнении наблюдателя (11) замену переменных
x̂ = y + em u.
18
(19)
Исключив посредством (19) ξ(t) в уравнении (11), получим равенство
c∗ (t)z.
ẏ = Dy + Dem u + em (ζ − ζ) + d
∗
(20)
∗
Поскольку ζ − ζ = s (y − y) + s em (u − u), уравнение (20) примет вид
ẏ = Dy + w + ε,
∗
∗
(21)
∗
c z. В [13] была установлена оценка
где w = em s (y − y) + Dem u + em s em (u − u), ε = d
|u(t)| T |v(t)|.
(22)
Отсюда, ввиду (19), следует цепочка неравенств
|u(t)| T |ζ(t)| = T |s∗ (t)x̂(t)| T δ1 |x̂(t)| T δ1 (|y(t)| + |u(t)|),
(23)
где δ1 = sup |s(t)|, под | · | понимается эвклидова норма матрицы либо вектора. Предt>0
положим, что T удовлетворяет условию
T δ1 < 1.
(24)
Тогда из (23) вытекает оценка
|u(t)| T δ2 |y(t)|,
(25)
δ1
где δ2 =
. Оценим теперь вектор w(t) при t ∈ [tn , tn+1 ). В силу (25) имеем
1 − T δ1
цепочку неравенств
|w(t)| δ1 |y(t) − y(t)| + (|D| + 2δ1 ) sup |u(t)| δ1 |y(t) − y(t)| + T δ3 |y(t)|,
tn t<tn+1
где δ3 = δ2 (|D| + 2δ1 ). Поскольку |y| |y − y| + |y|, справедлива оценка
|w(t)| δ4 |y(t) − y(t)| + T δ3 |y(t)|,
(26)
где δ4 = δ1 + T δ3 . Оценим теперь величину
t
n+1
|y(t) − y(t)|2 dt.
Jn =
tn
Ввиду неравенства Виртингера [13] и свойства (3) справедливо неравенство
4T 2
Jn 2
π
t
n+1
|ẏ(t)|2 dt.
(27)
tn
Из уравнения (21) вытекает соотношение
|ẏ(t)|2 3(|D|2 |y(t)|2 + |w(t)|2 + |ε(t)|2 ).
(28)
Отсюда, воспользовавшись оценкой (26), получаем неравенство
|ẏ(t)|2 3|D|2 |y(t)|2 + 3|ε(t)|2 + 6δ42 |y(t) − y(t)|2 + 6T 2 δ32 |y(t)|2 .
Проинтегрировав обе части этого неравенства, приходим в силу (27) к соотношению
4T 2 (29)
Jn 2 (3|D|2 + 6T 2 δ32 )Yn + 6δ42 Jn + 3εn ,
π
tn+1
tn+1
где Yn =
|y(t)|2 dt, εn =
|ε(t)|2 dt. Предположим, что T удовлетворяет неравенству
tn
tn
24T 2δ42 < π 2 .
(30)
19
Тогда из (29) вытекает требуемая оценка
Jn T 2 δ5 Yn + δ6 εn ,
2
где δ5 =
12|D| + 24T 2δ32
,
π 2 − 24T 2δ42
(31)
2
12T
. Из (26), (31) следует неравенство
π 2 − 24T 2δ42
δ6 =
t
n+1
|w(t)|2 dt T 2 δ7 Yn + 2δ42 δ6 εn ,
(32)
tn
где δ7 = 2δ42 δ5 + 2δ32 . Рассмотрим функцию Ляпунова
V (y) = y ∗ Hy,
где H — положительно определенная матрица, удовлетворяющая уравнению
HD + D∗ H = −I.
Здесь I — единичная m × m матрица. Производная по времени от функции V (y(t)),
взятая в силу системы (21), имеет вид
V̇ = −|y|2 + 2y ∗ H(w + ε)
и оценивается следующим образом:
1
2
V̇ −|y|2 + μ|Hy|2 + |w + ε|2 −|y|2 + λ2+ μ|y|2 + (|w|2 + |ε|2 ).
μ
μ
Здесь λ+ — максимальное собственное значение матрицы H, а положительный параметр μ будет выбран ниже. Проинтегрировав последнее неравенство по t от tn до tn+1 ,
приходим в силу (32) к соотношению
2δ7 T 2
2
Vn+1 − Vn μλ2+ − 1 +
Yn + (1 + 2δ42 δ6 )εn ,
μ
μ
где Vn = V (y(tn )). Полученное соотношение эквивалентно неравенству
pYn Vn − Vn+1 + δ8 εn ,
(33)
2
2δ7 T
2
, δ8 = (1 + 2δ42 δ6 ). Просуммировав неравенства (33) по n от 0
μ
μ
до произвольного N , придем к оценке
где p = 1 − μλ2+ −
tN
P
|y(t)|2 dt V0 − VN + δ9 ,
(34)
0
где δ9 = δ8
∞
εn . Выберем теперь положительный параметр μ таким образом, чтобы
n=0
выполнялось неравенство p > 0, которое эквивалентно соотношению λ2+ μ2 −μ+2T 2δ7 <
0. Очевидно, что требуемое μ найдется, если T удовлетворяет оценке
8λ2+ δ7 T 2 < 1.
(35)
Из (34) вытекает свойство
|y(t)| ∈ L2 [0, +∞).
(36)
Поскольку H > 0, из оценки (34) следует, что |y(tn )| ограничена равномерно по n. Из
(28), (32), (36) вытекает свойство |ẏ(t)| ∈ L2 [0, +∞). Поэтому |y(t)| ограничена равномерно по t > 0.Следовательно, в силу (22) этим же свойством обладает |u(t)|. Отсюда,
20
в силу (26), (28), |ẏ(t)| ограничена равномерно по t > 0. Следовательно, ввиду свойства (36) |y(t)| → 0 при t → +∞. Отсюда согласно (22) вытекает свойство u(t) → 0
при t → +∞. Поэтому в силу (19) справедлива асимптотика (18), а, следовательно, и
(17). Из (17) ввиду свойства (8) вытекает требуемая асимптотика (5). Таким образом,
получен следующий результат.
Теорема. Пусть элементы матриц A(t), b(t), c(t) имеют равномерно по t > 0
ограниченные производные порядка 2m − 1, выполнены свойства (3), (4), (7), и T удовлетворяет оценке
1
1
π
√
√
,
,
.
(37)
T < min
δ1 δ4 24 λ+ 8δ7
Определим оператор U [σ] следующим образом:
η = ϕ−1 [s∗ (t)x̂(t)],
где вектор x̂(t) является решением уравнения наблюдателя (11). Тогда при любом x(0)
решение системы (1), (2) обладает асимптотикой (5).
4. Заключение
Для вполне управляемой и вполне наблюдаемой импульсной системы, описываемой
функционально-дифференциальными уравнениями (1), (2), с помощью специальных
преобразований подобия и метода усреднения построен оператор U [σ], стабилизирующий систему по выходу σ, если параметр T удовлетворяет оценке (37).
Summary
A. Kh. Gelig. An analytical synthesis of stabilizing output control for nonstationary sampled-data
systems.
A sampled-data system with a nonstationary linear part and a nonlinear static characteristic of
the pulse modulator is considered. With the help of special similarity transformation, the averaging
method and a Kalman—Luenberger observer an analytical synthesis of stabilizing control in a scalar
output is performed.
Литература
1. Isidory A. Nonlinear Control Systems. Berlin: Springer Verlag. 1989.
2. Кунцевич В. М., Лычак М. М. Синтез систем автоматического управления с помощью
функций Ляпунова. М., 1977.
3. Зубер И. Е. Спектральная стабилизация нелинейных систем на основе специального преобразования подобия // Вестник СПбУ. Сер. 1. 2000. Вып. 2 (№ 8). С. 8–13.
4. Зубер И. Е. Спектральная стабилизация динамических систем // Вестник СПбУ. Сер. 1.
2001. Вып. 1 (№ 1). С. 15–22.
5. Зубер И. Е. Стабилизация нелинейных систем управления по выходу // Вестник СПбУ.
Сер. 1. 2002. Вып. 3 (№ 17). С. 27–31.
6. Кунцевич В. М., Чеховой Ю. Н. Нелинейные системы управления с частотно- и широтноимпульсной модуляцией. Киев, 1970.
7. Цыпкин Я. З., Попков Ю. С. Теория нелинейных импульсных систем. М., 1973.
8. Чурилов А. Н. Стабилизация линейной системы с помощью комбинированной импульсной
модуляции // Автоматика и телемеханика. 2000. № 10. С. 71–76.
9. Гелиг А. Х., Зубер И. Е. Стабилизация нестационарных импульсных систем // Вестник
СПбУ. Сер. 1. 2003. Вып. 1 (№ 1). С. 20–29.
21
10. Гелиг А. Х., Кабриц М. С. Стабилизация нелинейных импульсных систем // Вестник
СПбУ. Сер. 1. 2003. Вып. 4 (№ 25). С. 20–27.
11. Кабриц М. С. Синтез стабилизирующих управлений для нелинейных импульсных систем // Дифференциальные уравнения и процессы управления. 2003. № 4.
http://www.neva.ru//journal//.
12. Зубер И. Е. Экспоненциально устойчивый наблюдатель для управляемых и наблюдаемых нелинейных систем // Вестник СПбУ. Сер. 1. 2004. Вып. 2. С. 33–37.
13. Gelig A. Kh., Churilov A. N. Stability and Oscillations of Nonlinear Pulse-Modulated Systems. Boston: Birkhäuser. 1998.
14. Зубер И. Е. Стабилизация линейных нестационарных систем на основе специального
преобразования подобия // Кибернетика и системный анализ. 1998. № 5. С. 27–39.
Статья поступила в редакцию 23 сентября 2003 г.
Документ
Категория
Без категории
Просмотров
7
Размер файла
191 Кб
Теги
аналитическая, синтез, стабилизирующих, нестационарныхимпульсных, выход, система, управления
1/--страниц
Пожаловаться на содержимое документа