close

Вход

Забыли?

вход по аккаунту

?

Оптимальное управление динамикой объектов.

код для вставкиСкачать
НАУЧНЫЙ ВЕСТНИК МГТУ ГА
2012
№ 184
УДК 629.735
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ДИНАМИКОЙ ОБЪЕКТОВ
А.Б. АКАЕВ
Обсуждается метод синтеза алгоритмов оптимального управления с обратной связью динамическими объектами. Разработанные на его основе программные средства эффективны для систем транспорта, машиностроения, робототехники.
Ключевые слова: оптимальное управление, динамический объект, ограничения, обратная связь.
Рассмотрим задачу оптимального управления динамическим объектом или процессом с обратной
связью по состоянию на основе следующих компонент.
Модель процесса изменения состояния динамического объекта в виде непрерывного отображения
f : F → R n × R1 ; F ⊂ R n × R m × R1 ; где F – открытое множество в фазовом пространстве
R n × R m × R1 ; R1 – независимая переменная (время); n – размерность вектора состояния объекта;
m – размерность вектора управления.
1. Отображение g , определенное на множестве F и выделяющее в нем функционально ограниченное множество Θ : g 0 : F → Θ ; Θ ⊂ R S (t ) , где ∀t ∈ [t0 , t k ] S (t ) ⊂ КC (t , R 1 ) – функция времени,
принадлежащая множеству кусочно-непрерывных функций в пространстве R 1 , определяющая размерность множества Θ . При отсутствии ограничений S (t ) = n , g 0 : F → F , Θ ≡ F .
2. Закон управления объектом с обратной связью, который необходимо получить, и формализуемый в общем виде отображением u : R n × R 1 → R m × R 1 .
3. Функционал качества, обеспечение экстремума которого соответствует реализации требуемой
динамики объекта управления или процесса I : R n × R m × R 1 × R 1 → R 1 .
Требуется синтезировать закон управления с обратной связью, доставляющий экстремум функционалу I, обеспечивающий заданные показатели точности и качества управления в интервале [t0 , t k ] .
Управляемый объект представляет собой динамическую систему x& ( t ) = f ( x (t ), u (t ), t ) , x ( t0 ) = x 0 ,
где f – непрерывная по x(t ) и u(t ) вектор-функция, удовлетворяющая условиям существования и
единственности решения, x (t ) – n -мерный вектор состояния, u(t ) – m - мерный вектор управления, t –
независимая переменная (время). В замкнутом виде u (t ) = u ( x (t ), t ) ∈ W 1 ( t , R m ) , принадлежащий к
классу непрерывно дифференцируемых функций в пространстве R m и доставляющий минимум функционалу качества вида I ( x (t ), u (t ), t ) = Φ К (x(t K ), t K ) +
tk
∫ Φ( x(t ), u(t ), t )dt , при ограничениях на фазоt0
∗
вые координаты вида g ∗ (t ) ≤ g ( x (t ), t ) ≤ g (t ); t ∈[ t 0 , t K ], где g 0 – непрерывно дифференцируемая по
x (t ) вектор-функция, а последние неравенства выполняются покомпонентно. Отображение
0
g 0 : R n × R1 → R S ( t ) таково, что область его определения можно разбить на конечное число непересекающихся
областей,
g∗ (t ) ∈ KC ([tO , t K ], R
S (t )
в каждой из которых
) ; g ∗ (t ) ∈ KC ([tO , tK ], R S (t ) ) ,
оно
т.е.
взаимно однозначно. Предполагается:
g0 и g* кусочно-непрерывные на
[ t O , t K ] , g∗ (t 0 ) ≤ g 0 ( x0 , t 0 ) ≤ g ∗ (t 0 ) , g ∗ (t K ) ≤ g 0 ( x1 , t K ) ≤ g ∗ (t K ) , x1 = arg min Φ K ( x(tk , tk )
функции
ΦK , Φ непрерывно дифференцируемы в R × R , R × R × R , ∀t ∈ [t0 , t k ] . Величина t K может принимать любое значение из полуинтервала [ 0,+∞ ) . Если t K = ∞ , то Φ k ( x (t k ), t k ) ≡ 0 .
n
1
n
m
1
Структура функционала определяется постановкой конкретной задачи, а его параметры – требованиями к качеству и точности управления. При отсутствии ограничений g 0 ( x (t )) = E × x ( t ) .
133
Оптимальное управление динамикой объектов
В соответствии с предложенными принципами построения систем управления динамическими объектами с учетом функциональной ограниченности подпространства, обусловливающего замкнутость
допустимой области исходной задачи, перейдем к решению вспомогательной задачи аналитического
синтеза с открытым классом допустимых элементов. Для динамического объекта требуется определить
закон управления в замкнутом виде, минимизирующем функционал качества вида
I ВС ( x(t ), u (t ), t ) = Φ K ( x(t K ), t K ) + ∫ {Φ( x(t ), u (t ), t ) + Φ 0 (e( x(t )), u (t ), t )} dt , где функции Φ , Φ K опреtK
t0
деляются критерием качества исходной задачи.
Рассмотрим задачу синтеза системы управления моделью динамического объекта по указанному
критерию качества вида IВС, где функции Φ , Φ K определяются функционалом исходной задачи, а функция Φ O выражениями, приведенными выше. Для решения поставленной задачи нетрудно сформулировать и доказать соответствующие необходимые и достаточные условия оптимальности.
Метод не предполагает решения нелинейных матричных уравнений, решения двухточечной краевой
задачи, реализации итерационных процедур. Последнее позволяет использовать линейные нестационарные модели компонент постановки задачи. Нет необходимости выделять линейную и нелинейные составляющие в моделях, разделять управление на составляющие, а также строить модели в полиномиальных классах. Реализуется метод в рамках технологии, разработанной в [1].
Первый этап предполагает построение математических моделей компонент постановки задачи с
максимальной степенью адекватности. Последнее является причиной необходимости нелинейных зависимостей с последующим переходом к линейным нестационарным моделям вплоть до дифференцирования матриц в автоматизированном режиме.
На следующем этапе с использованием полученных векторно-матричных коэффициентов формируется новый или используется уже существующий в базе данных программного комплекса моделирующий программный модуль, в крайнем случае, с коррекцией, величин некоторых параметров.
На этапе моделирования выясняется существование решения и отрабатывается алгоритм.
Актуальной проблемой является управление поведением тел вращения (ТВ), совершающих вращательно-поступательное движение в опорах или подвесах различного вида. Сюда относятся, в частности,
валы, оси, роторы, стержни на активных магнитных опорах (АМО), представленные на рис. 1.
Вектор управления моделируемого объекта u (t ) имеет
размерность N = 9 (по количеству опор). При этом u iU (t ) ,
iU = 1, N – напряжение в цепи iU -го электромагнитного
контура АМО ТВ. Вектор состояния x (t ) , i = 1, n , n = 19
формируется так: xi (t ) , i ∈ {1,3,5} – x0 (t ) , y0 (t ) , z0 (t ) начало координат подвижной системы 0XoYoZo, связанной с
центром масс ТВ в неподвижной 0XYZ; xi (t ) , i ∈ {2,4,6} –
скорости изменения координат подвижной системы
0XoYoZo в неподвижной 0XYZ; xi (t ) , i ∈ {7,9} , – угловые
Рис. 1. Схема жесткого тела вращения
на активных магнитных опорах
координаты ϑ ((t ),ψ (t ) , характеризующие ориентацию
осей координат подвижной системы относительно неподвижной; xi (t ) , i ∈ {8,10}, – скорости изменения угловых
координат ϑ ((t ),ψ (t ) ; xi (t ), i = 11,19 – ток в цепи i − го электромагнитного контура АМО.
Система дифференциальных уравнений в нормальной форме Коши, формализующая нелинейную
модель рассматриваемого объекта, имеет следующий вид
x&1 (t ) = x2 (t ) ; x&2 (t ) = (Q1 + meω 2 cos ωt )/ m ; x& (t ) = x (t ) ; x&4 (t ) = (Q2 + meω 2 sin ωt )/ m ;
3
4
x&5 (t ) = x6 (t ) x&6 (t ) = Q3 / m x&7 (t ) = x8 (t ) x&8 (t ) = (Q4 − J 3ωψ − ( J1 − J 3 )γω 2 sin ωt )/ J1 x&9 (t ) = x10 (t )
;
;
;
;
;
x&5 (t ) = x6 (t ) ; x&6 (t ) = Q3 / m ; x&7 (t ) = x8 (t ) ; x&8 (t ) = (Q4 − J 3ωψ − ( J1 − J 3 )γω 2 sin ωt )/ J1 ; x&9 (t ) = x10 (t ) ;
134
А.Б. Акаев
(
)
(
)
x&10 (t ) = Q5 + J 3ωυ + ( J1 − J 3 )γω 2 cos ωt / J1 ; x&10+iU (t ) = x10+iU + M iU , 1υ& + M iU , 2ψ& − uiU / LiU ,
где m − масса динамического объекта; e(t ) – параметр неуравновешенности, фактически e(t ) = x1 (t ) ;
Q j (t ) , i j = 1, nQ ; nQ = 5 , обобщенные силы; в общем случае это квадратичные формы от элементов вектора состояния, что обусловливает нелинейность модели [2; 3].
nQ
nQ
r =1
r =1
Q j (t ) = Pj (t ) + Fj (t ) − ∑ cTjr qr − ∑ bTjr q&r = Pj (t ) + Fj (t ) − (CT j )T q(t ) − ( BT j )T q& (t ) ,
(1)
C , B ∈ R n × R n – квадратные матрицы коэффициентов линейных упругих и диссипативных составляющих; T ∈ R n × R
nQ
такая, что Tq x(t ) = q (t ) ; Pj (t ) – электромагнитная реакция j -й АМО.
Pj (t ) =
∂L (q )
1 N N ∂Lk , s (q )
1 N N
ik is = ∑∑ (Λ j , k , s − Λ j , s , k )ik is , Λ j , k , s = k , s
;
∑∑
2 k =1 s =1 ∂q j
2 k =1 s =1
∂q j
(2)
F j (t ) – возмущающая сила; здесь F j (t ) = 0 ; Lks (q ) – коэффициент взаимоиндукции контуров k и s ,
который зависит от зазоров в них; qT (t ) = [x0 (t) y0 (t) z0 (t ) ϑ(t) ψ (t )] – вектор обобщенных координат объекта; j = 1, nQ ; ω – частота вращения объекта; ω = 2πν C , где ν C – собственная частота колебаний системы; J1 , J 3 − моменты инерции объекта относительно соответствующих осей в связанной с его
центром масс системой координат; M i , j − коэффициенты, зависящие от конструктивных и динамических характеристик АМО.
Вектор правых частей модели формализован следующим образом f ( x (t ), u (t ), t ) =
x2 (t )



 1 N N

  ∑∑ (Λ1,k , s − Λ1, s,k ) x10+k (t ) x10+ S (t ) − x T (t )(CTq ) T − x& T (t )( BTq& ) T + mx1 (t )ω 2 cosωt  / m 


  2 k =1 s =1


x4 (t )
N N


1



 ∑∑ (Λ 2,k ,s − Λ 2, s,k ) xk (t ) x s (t ) − x T (t )(CTq ) T − x& T (t )(BTq& ) T + mx2 (t )ω 2 sin ωt  / m


 2 k =1 s =1



x6 (t )


N N
1



 ∑∑ (Λ 3,k ,s − Λ 3, s,k ) xk (t ) x s (t ) − x T (t )(CTq )T − x& T (t )(BTq& ) T  / m


 2 k =1 s =1



x8 (t )

=  1 N N
 
T
T
2
 ∑∑ (Λ
&
− Λ 4, s,k ) xk (t ) xs (t ) − (CT4 ) q(t ) − ( BT4 ) q(t ) − J 3ωx9 (t ) − ( J 1 − J 3 )γω sin ωt  / J
 2 k =1 s=1 4,k ,s
 


x10 (t )


N N
 
T
T
2
 1
&
(
)
x
(
t
)
x
(
t
)
(
CT
)
q
(
t
)
(
BT
)
q
(
t
)
J
ω
x
(
t
)
(
J
J
)
γω
cos
ω
t
/
J
Λ
−
Λ
−
−
−
−
−

5, k , s
5, s , k
k
s
5
5
3
7
1
3
 2 ∑∑
k =1 s =1
 


(
)
x11 (t ) + M 12 x8 (t ) + M 12 x10 (t ) − u1 (t ) / L1


(x12 (t ) + M 21 x8 (t ) + M 22 x10 (t ) − u 2 (t )) / L2




.....




.....


(x19 (t ) + M 91 x8 (t ) + M 92 x10 (t ) − u9 (t )) / L9


Вектор-функция модели фазовых ограничений в терминах физических параметров
Т


dR
dR
g O ( x0 (t ), y0 (t ), z0 (t ),ψ (t ),ϑ (t )) =  x0 (t ) +
y0 (t ) +
z0 (t ) .
2 cosψ (t )
2 cosϑ (t )


Переходя к терминам элементов вектора состояния оптимального управления, получаем
135
Оптимальное управление динамикой объектов
Т

g O ( x(t )t ) =  x1 (t ) +
dR
2 cos x7 (t )
x3 (t ) +
dR
2 cos x9 (t )

x5 (t )  ,


где dR диаметр ротора.
Векторы g * (t ) и g* (t ) размерности s (в данном случае s = 3 ) в соответствии с [1] формируются
следующим образом
g *T (t ) = [d S / 2 − δ M d S / 2 − δ M zmax ] ; g *T (t ) = [0M0Mδ ] ,
где δ – минимальный радиальный зазор между опорой и объектом.
Конкретная величина zmax принципиального значения не имеет и может назначаться из эксплуатационных требований к моделируемой системе в данной постановке задачи.
Вектор-функция
ошибки,
возникающей
при
реализации
алгоритма
управления,
ru
Т
eУПР (t ) ∈ R ; ru = 5 , формализуется как e УПР (t ) = [x1 (t ) x3 (t ) x5 (t ) x7 (t ) x9 (t )] . Минимизация
взвешенной квадратичной формы от этого вектора (сведение всех его компонентов к нулю по окончании
переходного процесса по x (t ) при t → tЗАД ) означает максимальную степень совмещения начал подвижной и неподвижной систем координат. Вектор-функция ошибок выдерживания фазовых ограничений eОГР (t ) ∈ R rОГР ; rОГР = 3 формируется в соответствии с вышеуказанным методом с помощью специальной кусочно-линейной функции z (eОГР (t )) .
Для нахождения оптимального закона управления разработаны математические, алгоритмические и
программные средства [1]. Результаты моделирования переходных процессов позволяют говорить о сокращении времени переходных процессов на 8-15% по сравнению с алгоритмами, использующими линейные модели. Аналогично спроектированы и смоделированы в реальном времени алгоритмы управления траекторными характеристиками летательных аппаратов, а также вращением центрифуги при производстве нанопленок [2; 3] для электронных компонентов.
ЛИТЕРАТУРА
1. Акаев А.Б. Оптимальное управление динамикой нелинейно формализуемых объектов в функционально ограниченных
подпространствах // Фундаментальные физико-математические проблемы и моделирование технико-технологических систем:
сб. науч. тр. Моделирование нелинейных процессов и систем: труды II междунар. конф. / под ред. Л.А. Уваровой. - М.: Янус-К,
2011. - Вып. 14.
2. Вейнберг Д.М., Верещагин В.П., Данилов-Нитусов Н.Н., Шереметьевский Н.Н. Системы магнитного подвеса в
исполнительных органах управления ориентацией космических аппаратов // Изв. АН СССР, МТТ. - 1981. - № 3.
3. Журавлев Ю.Н. Электромагнитные силы в радиально-упорном коническом подшипнике // Электричество. - 1982. - № 11.
OPTIMAL CONTROL DYNAMICS OF OBJECTS
Akaev A.B.
The method for control of dynamic objects with optimal feedback which allows to create effective software is discussed.
Key words: optimal control, dynamic object, constraints, feedback.
Сведения об авторе
Акаев Александр Борисович, 1958 г.р., окончил МАИ (1981), доктор технических наук, профессор кафедры
вычислительных машин, комплексов, систем и сетей МГТУ ГА, автор более 80 научных работ, область научных
интересов – оптимальное управление нелинейными динамическими объектами в условиях ограничений.
Документ
Категория
Без категории
Просмотров
6
Размер файла
157 Кб
Теги
оптимальное, объектов, динамикой, управления
1/--страниц
Пожаловаться на содержимое документа