close

Вход

Забыли?

вход по аккаунту

?

Минимаксное управление линейным объектом при внешнем возмущении и неопределенных начальных условиях на конечном временном интервале.

код для вставкиСкачать
Р.С. Бирюков
206
УДК 517.977
МИНИМАКСНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМ ОБЪЕКТОМ ПРИ ВНЕШНЕМ
ВОЗМУЩЕНИИ И НЕОПРЕДЕЛЕННЫХ НАЧАЛЬНЫХ УСЛОВИЯХ
НА КОНЕЧНОМ ВРЕМЕННОМ ИНТЕРВАЛЕ
 2013 г.
Р.С. Бирюков
Нижегородский госуниверситет им. Н.И. Лобачевского
ruslan.biryukov@gmail.com
Поступила в редакцию 12.03.2013
Для линейного объекта при внешнем возмущении и неопределенных начальных условиях определяется уровень гашения возмущений как наибольшее значение L2 -нормы целевого выхода, при условии, что L2 -норма внешнего возмущения и выбранная положительно определенная квадратичная
форма начального состояния ограничены некоторыми постоянными. С использованием вариационного подхода показано, что построение минимаксных регуляторов, обеспечивающих минимальный уровень гашения, сводится к решению нелинейной краевой задачи для матричного дифференциального
уравнения Риккати.
Ключевые слова: оптимальное управление, минимаксный подход, конечный временной интервал,
внешнее возмущение, неопределенные начальные условия.
Введение
При разработке стратегий управления объектом в случае, когда ни начальное состояние, ни
внешнее возмущение точно неизвестны, разумно
основываться на принципе гарантированного
результата, когда о качестве управления судят по
наихудшему возможному случаю.
Если на объект не действует внешнее возмущение, то, следуя [1, 2], назовем уровнем гашения начальных возмущений максимально возможное отношение L2 -нормы его целевого выхода к евклидовой норме начального состояния.
Закон управления, минимизирующий уровень
гашения, называется  -оптимальным.
В случае когда начальное состояние объекта
нулевое и на него действует внешнее возмущение, под уровнем гашения внешнего возмущения
понимают наибольшее значение отношения L2 нормы целевого выхода объекта и возмущения.
Задача минимизации уровня гашения совпадает с
классической задачей H  -оптимального управления [3, 4].
Особый интерес представляет ситуация, когда
объект находится в неизвестном начальном состоянии и на него действует внешнее возмущение. В этом случае в [5] в качестве уровня гашения рассматривалось наибольшее отношение L2 нормы целевого выхода к квадратному корню от
суммы квадрата L2 -нормы внешнего возмущения и заданной квадратичной формы начального
состояния. Подобный подход называется обобщенным H  -оптимальным управлением. С использованием вариационного подхода в [6] было
показано, что вычисление оптимального уровня
гашения сводится к решению нелинейной краевой задачи для некоторого дифференциального
матричного уравнения Риккати, которая, в силу
нелинейности, может быть решена аналитически
лишь в вырожденных случаях.
В данной работе в качестве уровня гашения
предлагается взять наибольшее значение L2 нормы целевого выхода, при условии, что L2 норма внешнего возмущения и выбранная положительно определенная квадратичная форма начального состояния ограничены некоторыми
постоянными. В этом случае задача вычисления
минимального уровня гашения также сводится к
решению нелинейной краевой задачи для матричного дифференциального уравнения Риккати.
Для решения данной задачи используется метод
Ньютона.
Постановка задачи
Рассмотрим на отрезке [0, T ] линейный
управляемый объект
x = A(t ) x  B1 (t )w  B2 (t )u, x(0) = x0 ,
(1)
z = C (t ) x  D(t )u,
в котором x  R nx – состояние объекта, u  R nu
– управление, z  R nz – управляемый выход и
Минимаксное управление линейным объектом
w R nw — возмущение, A = A(t ) , B1 = B1 (t ) ,
B2 = B2 (t ) , C = C (t ) и D = D(t ) – заданные
матричные функции соответствующих порядков.
В дальнейшем для краткости мы будем опускать
указание аргумента t , если это не вызывает недоразумений.
Также
предположим,
что
T
справедливо
и
t [0,T ]
D (t ) D(t ) > 0
C T (t ) D(t ) = 0 .
Относительно возмущения v(t ) будем пред-
полагать, что
неравенство
v  L2 [0, T ] , т.е. справедливо
T
 | w|
2
dt < ,
| w |2 = wT w.
0
В качестве допустимых законов управления для
системы (1) будем рассматривать такие u = u(t ) ,
при которых для любых возмущений w L2 [0, T ]
существует и единственно решение системы (1).
Данное множество управлений будем в дальнейшем обозначать через U . Очевидно, что с учетом
сделанных предположений для любого решения
системы (1) управляемый выход z (t ) также будет
принадлежать L2 [0, T ] .
Определим целевой функционал формулой
T

J (u, x0 , w) = | z |2 dt  x T (T ) Sx(T ), S T = S  0, (2)
0
тогда задача минимаксного управления системой (1) заключается в определении такого
управления u* , начального возмущения x0* и
внешнего возмущения w* , что
J (u* , x*0 , w* ) = min max J (u, x0 , w),
uU ( x0 , w)W
(3)
где
W : {( x0 , w)  R n x  L2 [0, T ] :
T

2
x0T Rx0  1, w dt   2 }
0
и R = R > 0 . При этом соответствующие
начальное возмущение x0* будем называть
наихудшим начальным возмущением, внешнее
возмущение w* – наихудшим возмущением, а
u * – минимаксным управлением.
Заметим, что в случае  min ( R)   , где
T
 min ( R)
через
обозначено минимальное
собственное число матрицы R , справедливо
x0  0 , т.е. система в начальный момент
времени находится в покое и на нее действует
только внешнее возмущение w , поэтому задача
минимаксного управления сводится к класси-
207
ческой задаче H  -управления. С другой стороны,
как нетрудно видеть, если   0 , то мы получаем
задачу  -оптимального управления.
Решение задачи
о минимаксном управлении
Сформулируем и докажем основной результат.
Теорема. Задача (3) имеет решение тогда и
только тогда, когда на интервале [0,T ]
существует решение X (t ) матричного дифференциального уравнения Риккати
X  AT X  XA  C T C 


 X B2 ( D T D) 1 B2T   1 B1 B1T X = 0,
(4)
X (T ) = S ,
параметр  удовлетворяет уравнению

T
0
x T XB1 B1T Xxdt =  2  2 ,
(5)
где x — решение системы:
x = A  B2 ( D T D) 1 B2T X   1 B1 B1T X x,


(6)
x(0) = x .
В этом случае оптимальное значение
функционала J (u* , x0* , w* ) =   2 достигается
при минимаксном законе управления
(7)
u* (t ) = ( DT D) 1 B2T X (t ) x(t ),
наихудшем внешнем возмущении
(8)
w* (t ) =  1B1T X (t ) x(t )
и наихудших начальных условиях
(9)
x0* = e,
2 = eT Re,
где e — единичный собственный вектор, соответствующий  =  max ( R 1 X (0)), т.е. максималь*
0
ному собственному числу матрицы R 1 X (0) .
Доказательство. Сначала докажем необходимость, для этого предположим существование
решения задачи (3) и воспользуемся вариационным методом на основе подхода Лагранжа. Составим вспомогательный функционал
( x, u, x0 , w) = x T (T ) Sx(T ) 
T

 (1  x (0)Rx(0)) L( x, x, u, w)dt,
T
(10)
0
где лагранжиан L имеет вид
L( x, x, u, w) = z T z  wT w 
 2T ( x  Ax  B1w  B2u ),
(11)
при этом ,  R и   (t )  R nx – множители
Лагранжа.
Условие стационарности по x записывается
как
d
Lx  Lx = 2 T  2 x T C T C  2T A = 0
dt
Р.С. Бирюков
208
или
(12)
  C TCx  AT  = 0.
Граничные условия на множители Лагранжа
(t ) получаем из условий трансверсальности на
концах интервала:
(0) = Rx(0),
(13)
(T ) =  Sx(T ).
Поскольку в лагранжиан (11) не входят
производные u и w , то соответствующие
условия стационарности
d
d
Lu  Lu = 0 и
Lw  Lw = 0
dt
dt
являются
алгебраическими
уравнениями,
разрешая которые относительно u и w приходим к следующим соотношениям:
u * = ( D T D) 1 B2T ,
(14)
w* =  1 B1T .
Подставляя найденные значения в систему
(1) и добавляя уравнение (12), приходим к
системе для отыскания как состояния x , так и
множителей Лагранжа  :
 x = Ax  B2 ( D T D) 1 B2T   1 B1 B1T ,
(15)

T
T
 =  A x  C C,
с граничными условиями
x(0) = x0 , (0) = Rx0 , (T ) = Sx(T ). (16)
Существование решения полученной двухточечной краевой задачи следует из предположения о существовании решения задачи (3).
Запишем решение системы (15) в терминах
фундаментальной матрицы:
 x(t )   11 (t , T ) 12 (t , T )   x(T ) 
(t ) =  (t , T )  (t , T ) (T ),
22

  21




 11 (T , T ) 12 (T , T ) 
 (T , T )  (T , T ) = I .
22
 21

x(t ) = 11 (t , T ) x(T )  12 (t , T )(T ) =


= 11 (t , T )  12 (t , T ) S x(T ).
Так как решение краевой задачи (15), (16)
существует, то матрица 11 (t , T )  12 (t , T )S
обратима для всех t [0,T ] , следовательно,
выражая из второго соотношения x(T ) и
подставляя в первое, получаем:
(t ) =  X (t ) x(t ),
(18)
где
X (t ) =  22 (t , T ) S   21 (t , T )
(19)
1
 11 (t , T )  12 (t , T ) S .
и

 X B2 ( D T D) 1 B2T   1 B1T B1 X ) x = 0.
Данное соотношение должно выполняться
при всех x , следовательно,
X  AT X  AX  C T C 


 X B2 ( D T D) 1 B2T   1 B1T B1 X = 0.
Дополним полученное уравнение начальным
условием, для чего в соотношении (19)
положим t = T , тогда:
X (T ) =  22 (T , T ) S   21 (T , T )
(20)
1
 11 (T , T )  12 (T , T ) S = S .
Далее, подставим
в (18) и
t=0
воспользуемся условиями (16), после чего
получаем соотношение:
X (0)  Rx0* = 0,
откуда следует, что наихудшее начальное
возмущение x0* = e , где e – единичный
собственный вектор, соответствующий собственному числу  матрицы R 1 X (0) . Поскольку по
условию матрица R положи-тельно определена,
как и решение X (t ) , то для  справедливо
условие
положительности,
т.е.
>0.
Множитель  находится из соотношения
(1 ( x0* )T Rx0* ) = 0,
2
(17)

 X Ax  ( B2 ( D T D) 1 B2T   1 B1T B1 ) ,
подставим вместо  выражение (18)
упростим:
x T ( X  AT X  AX  C T C 
подставляя
Тогда
(t ) =  21 (t , T ) x(T )   22 (t , T )(T ) =
=  21 (t , T )   22 (t , T ) S x(T ),
Покажем, что функция X (t ) удовлетворяет
матричному дифференциальному уравнению
Риккати (4). Для этого продифференцируем
соотношение (18) в силу системы (15)
 AT   C T Cx =  Xx 
в
которое
x0* = e
получаем
 = e Re , что совпадает с условием (9).
Уравнение (4) также необходимо дополнить
условием для определения  . Из условия
положительности получаем, что  > 0 , а из
условия дополняющей нежесткости
T

 | w* |2 dt    = 0,


0

после подстановки выражения w* через X (t ) ,
получаем соотношение (5).
Теперь докажем достаточность, т.е. что
решение, определяемое уравнением (4) и
соотношениями (7), (8) и (9), действительно
является минимаксом функционала (2). Для
этого рассмотрим следующее выражение
T

Минимаксное управление линейным объектом
V  z T z  wT w,
где
V = x T Xx , а матрица
X = XT 0
удовлетворяет уравнению (4), и покажем, что
его можно представить в виде:
V  z T z  wT w = (u  u * ) T ( D T D)(u  u * ) 
(21)
 ( w  w* ) T ( w  w* ),
где u * и w* определяются формулами (7) и (9)
соответственно. Действительно, вычислим от
функции V производную в силу системы (1):
V  z T z  wT w =


(22)
 w B Xx  x XB w  w w 
T
T
1
T
T
1
T
 u T B2T Xx  x T XB2 u  u T D T Du
и преобразуем выражение, стоящее в правой
части равенства, выделяя полный квадрат по w :
wT B1T Xx  x T XB1T w  wT w =
= ( w  w* ) T ( w  w* )   1 x T XB1 B1T Xx
и по u :
u T B2T Xx  x T XB2u  u T D T Du =
= (u  u * ) T ( D T D)(u  u * )  x T XB2 ( D T D) 1 B2T Xx.
Подставляя полученные соотношения в (22)
получаем:
V  z T z  wT w = (u  u * ) T ( D T D)(u  u * ) 
 ( w  w* ) T ( w  w* )  x T { X  AT X  XA  (23)


 C T C  X B2 ( D T D) 1 B2T   1 B1 B1T X }x.
Выражение, стоящее в фигурных скобках, в
силу (4) обращается в ноль, следовательно,
справедливость соотношения (21) доказана.
Далее, проинтегрируем выражение (21) по
переменной t на интервале от 0 до T
T
T

Vdt 
0
z
T

z  w w dt =
T
0
T

= (u  u * ) T ( D T D)(u  u * )dt 
0
T

  ( w  w* ) T ( w  w* )dt
0
и учтем, что
T
Vdt = x
T
(T ) Sx(T )  x0T X (0)x0 .
0
Таким
получаем
образом,
после
преобразований
T

x Sx1  z T zdt = 2    x0T ( X (0)  R) x0 
T
1
0
T

 (u  u * ) T ( D T D)(u  u * )dt 
0
T

  ( w  v* ) T ( w  w* )dt.
(24)
0
Выражение, стоящее в левой части равенства
(24), есть функционал (2), поэтому исходная
задача (3) сводится к следующей:
T
min max [ x0 ( X (0)  R) x0 
uU ( x0 , w )W
T

 (u  u * ) T ( D T D)(u  u * )dt 
0
T

  ( w  w* ) T ( w  w* )dt],
= x X  AT X  XA  C T C x 
T
209
0
где  > 0 . Последняя же задача легко решается
в силу того, что расщепляется на три подзадачи
и подынтегральные выражения представляют
собой полные квадраты:
max
x0T ( X (0)  R) x0 
T
x0 Rx0 1
T

 min (u  u * ) T ( D T D)(u  u * )dt 
uU
0
T

  max ( w  w* ) T ( w  w* )dt.
w 
0
Выше было показано, что  есть одно из
собственных чисел матрицы R 1 X (0) , однако
выражение
max
x0T ( X (0)  R) x0
T
x0 Rx0 1
достигает
своего
максимального
значения
1
только тогда, когда  =  max ( R X (0)), где через
 max ( R 1 X (0))
обозначено
максимальное
1
собственное число матрицы R X (0) . Таким
образом, получаем, что набор (u * , x0* , w* ) ,
определяемый соотношениями (7), (8) и (9),
действительно
доставляет
минимакс
функционалу (2), при этом оптимальное
значение равно
J (u* , x0* , w* ) =   2 .
Теорема доказана.
Заметим, что уравнение (4) совместно с
условиями (5), (6) есть нелинейная краевая
задача, решением которой являются как
матричная функция X (t ) , так и параметр  .
Для ее решения удобно упростить интегральное
условие (5), воспользовавшись следующей
хорошо известной леммой (см., например, [7]).
Лемма. Если W (t ) является решением
уравнения
W  PTW  WP  Q = 0,
V (T ) = 0,
Р.С. Бирюков
210
а x(t ) – решение системы x = Px при t [0,T ] ,
то справедлива формула

T
x T Qxdt = x T (0)W (0)x(0).
0
Чтобы
применить
лемму,
положим
и Q = XM1 X , где
P = A  M 2 X   1M1 X
M1 = B1B1T и M 2 = B2 ( DT D)1 B2T , тогда левая
часть соотношения (5) принимает вид:

T
0
x T XB1 B1T Xxdt = ( x0* ) T U (0)x0* ,
где функция U (t ) является решением уравнения
T
U  A  M 2 X   1 M 1 X U 




1
 U A  M 2 X   M 1 X  XM1 X = 0,
(25)
U (T ) = 0.
Далее, подставим полученное соотношение в
(5) и заменим выражение для x0* согласно (9).
Тогда после упрощения получаем соотношение:
(26)
eT U (0)   22 R e = 0.
Таким образом, исходная краевая задача (4) –
(6) после упрощений свелась к решению
уравнений (4) и (25) совместно с условием (26).
Ввиду нелинейности данных уравнений краевая
задача может быть решена аналитически лишь в
исключительных случаях, поэтому возникает
необходимость использовать численные методы.
В следующем параграфе описывается применение
метода Ньютона для решения поставленной
задачи.


Численное решение краевой задачи
Для решения краевой задачи (4), (25) и (26)
рассмотрим соотношение (26) как нелинейное
уравнение относительно  :
f () = eT U (0)   22 R e = 0,
зависящее от решений (4) и (25). Тогда,
используя метод Ньютона, решение этого
уравнения можно найти с достаточно высокой
скоростью с заданной точностью  . В этом
случае итерационная формула имеет вид:
f ( k )
eT U (0)   2k  2 R e
 k 1 =  k 
= k  T
, (27)
f ( k )
e V (0)  2 k 2 R e
где V = U  – производная по параметру 
функции U . Для определения уравнения,
которому удовлетворяет функция V , продифференцируем уравнение (25) по параметру  , тогда:
T
V  A  M X   1M X V 








2


1
1

M X U 
 V A  M 2 X   M1 X 
1
 M 2Y   M 1Y  
2
T
1


 U M 2Y   1M 1Y   2 M 1 X 
 XM1Y  YM1 X = 0, (T ) = 0,
(28)
где Y = X  . Аналогично находится уравнение,
которому удовлетворяет Y , для этого продифференцируем (4) по параметру  , после чего
получаем:
T
Y  A  M X   1 M X Y 


2
1
1


 Y A  M 2 X   M1 X 
(29)
   2 XM1 X = 0, Y (T ) = 0.
Окончательно получаем, что на каждом шаге
метода Ньютона по формуле (27) необходимо
решать систему уравнений (4), (25), (28) и (29) с
заданными начальными условиями. Приведем
схему вычислений:
1. Задать допустимую абсолютную погрешность  > 0 и начальное приближение  0 .
2. Положить  =  0 .
3. Найти решение уравнений (4), (25), (28) и
(29) с заданными начальными условиями.
4. Вычислить следующее приближение w по
формуле (27).
5. Если | w   |<  , то останавливаем вычисления и полагаем * = w . В противном
случае  = w и возвращаемся на шаг 3.
В качестве иллюстрации изложенного алгоритма рассмотрим систему первого порядка
x =  x  u  w,
1  0
z =   x   u,
 0 1
для которой S  0 и R > 0 . Оптимальное
значение функционала (2) равно
J (u* , x0* , w* ) = R 1 X (0)  2 ,
где X (t ) и  находятся как решение задачи (4),
(25) и (26):
3 X  1  2 X  (1   1 ) X 2 = 0, X (T ) = S ,
W  2 1  (1   1 ) X W  X 2 = 0,


W (T ) = 0,W (0) =  2  2 R.
Для решения системы и нахождения 
использовался метод Ньютона (27), а для
численного интегрирования систем уравнений –
метод Рунге – Кутты пятого порядка с
модификацией Мерсона. Проверка эффективности работы алгоритма осуществлялась следующим образом. Начальное приближение  0
выбиралось как случайная величина, равномерно
распределенная на отрезке [0.5,2.0]. Алгоритм
стартовал 5000 раз, и каждый раз его работа
завершалась успешно, т.е. находилось минимальное значение  = 0.66937 с принятой точностью  = 105 . Число выполненных итераций в
Минимаксное управление линейным объектом
211
быть выражено через решение нелинейной
краевой задачи для матричного уравнения
Риккати.
Работа выполнена при финансовой поддержке
Российского фонда фундаментальных исследований
(проект 12-01-31358 мол_а).
Список литературы
Рис.
этих случаях в процентном отношении отображено на гистограмме. Как видно из рисунка, в
подавляющем числе случаев для завершения
работы алгоритма потребовалось не более 28 –
30 итераций.
Заключение
В данной статье рассмотрена задача синтеза
минимаксного управления для линейных детерминированных систем при внешнем возмущении и неопределенных начальных условиях.
Показано, что минимаксное управление может
1. Баландин Д.В., Коган М.М. Синтез оптимальных линейно-квадратичных законов управления
на основе линейных матричных неравенств // АиТ.
2007. № 3. С. 3–18.
2. Баландин Д.В., Коган М.М. Линейно-квадратичные и  -оптимальные законы управления // АиТ.
2008. № 6. C. 5–14.
3. Doyle J.C., Glover K., Khargonekar P.P., Francis
B.A. State-space solutions to standard H 2 and H 
control problems // IEEE Trans. Automat. Control. 1989.
V. 34. № 8. P. 831–847.
4. Kwakernaak H. Robust control and H∞optimization – Tutorial paper // Automatica. 1993. V. 29.
№ 2. P. 255–273.
5. Khargonekar P.P., Nagpal K.M., Poolla K.R. H 
control with transients // SIAM J. Control Optim. 1991.
V. 29. № 6. P. 1373–1393.
6. Lu W.W., Balas G.J. and Lee E.B. A variational
approach to H  control with transients // IEEE Trans.
Automat. Control. 1999. V. 44. P. 1875–1879.
7. Андреев Ю.Н. Управление конечномерными
линейными объектами. М.: Наука, 1976. 424 с.
MINIMAX CONTROL OF A LINEAR OBJECT UNDER EXTERNAL DISTURBANCE AND UNKNOWN
INITIAL CONDITIONS ON A FINITE TIME HORIZON
R.S. Biryukov
The suppression level of perturbations for a linear object with an external disturbance and unknown initial conditions is determined as the greatest value of the L2-norm of the objective output when the L2-norm of the external disturbance and some positive definite quadratic form of the initial state are bounded by some constants. Using a variational approach, it is shown that the construction of minimax controllers ensuring a minimum level of perturbation suppression is reduced to the solution of a nonlinear boundary value problem for a matrix Riccati differential equation.
Keywords: optimal control, minimax approach, finite horizon, external disturbance, unknown initial conditions.
1/--страниц
Пожаловаться на содержимое документа