close

Вход

Забыли?

вход по аккаунту

?

Синтез квазиоптимальных регуляторов для объектов одного класса..pdf

код для вставкиСкачать
УДК 681.513.5
СИНТЕЗ КВАЗИОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ
∗
ДЛЯ ОБЪЕКТОВ ОДНОГО КЛАССА
В. И. Ловчаков1, А. А. Лупачев2,
Б. В. Сухинин1, Е. И. Кретов1
Кафедра электротехники и электрооборудования,
ФГБОУ ВПО «Тульский государственный университет», г. Тула (1); lovvi50@mail.ru;
кафедра информационно-измерительной техники, ФГБОУ ВПО «Национальный
исследовательский университет «МЭИ», г. Москва (2)
Ключевые слова и фразы: задача Летова–Калмана; математическое моделирование; объект последовательной структуры; оптимальный регулятор; энергосберегающее управление.
Аннотация: Предложен новый метод решения задачи аналитического конструирования оптимального регулятора в постановке Летова–Калмана для нелинейных объектов высокого порядка, структура которых может быть представлена
последовательным соединением звеньев низкого порядка (первого, второго).
Соответственно метод синтеза законов обратной связи для объектов указанного
класса основан на многократном, последовательном использовании известных
оптимальных алгоритмов управления объектами низкого порядка. Так как алгоритмы управления объектами первого или второго порядков определяются относительно просто, то предлагаемый метод позволяет многократно сократить число
вычислений, необходимых для решения рассматриваемых задач аналитического
конструирования оптимального регулятора в сравнении с известными способами.
Метод успешно применен для решения актуальной в настоящее время научнотехнической задачи энергосберегающего управления электротермическим объектом, описываемым стандартной передаточной функцией второго порядка. Проведено компьютерное моделирование синтезированных энергосберегающих систем
управления его температурным режимом и определена оценка величины экономии электроэнергии предлагаемыми регуляторами.
Постановка задачи исследования
Рассматриваемая задача аналитического конструирования оптимальных регуляторов (АКОР) в постановке Летова–Калмана формулируется следующим образом [1, 2]. Имеется стационарный объект управления, движение которого описывается дифференциальным уравнением
X& (t ) = A[ X (t )] + B[ X (t )]U (t ) ,
(1)
причем составляющие xi(t), i = 1, 2, …, n, вектора состояния X(t) объекта имеют
смысл отклонений траектории от заданного (невозмущенного) движения. Предполагается, что компоненты функциональных матриц A( X ), B ( X ) размерностей
n × n и n × m этого уравнения представляют собой непрерывные, в частности,
* По материалам доклада на конференции ММТТ-2014.
700
ISSN 0136-5835. Вестник ТГТУ. 2014. Том 20. № 4. Transactions TSTU
полиномиальные зависимости. Требуется найти m-мерное управление в форме
обратной связи U = U ( X ) ≡ U ( x1 , x2 , ..., xn ) , которое в совокупности с объектом (1)
образует асимптотически устойчивую систему, переводящее ее из начального
состояния X(t = 0) = X0 в конечное нулевое состояние X(t → ∞) = 0 с минимальным значением интегрального функционала
∞
I=
∫ ( Q [ X (t )] + U
0
т
)
(t ) RU (t ) dt ,
(2)
где − Q[X (t )] положительно-определенная функция, в частности квадратичная
Q [ X (t )] = X т (t )QX (t ); Q, R − симметричные вещественные положительно определенные матрицы размерностей n × n и m × m коэффициентов критерия.
Наиболее приспособленным к решению сформулированной вариационной
задачи управления является метод динамического программирования Р. Беллмана
[1], в соответствии с которым оптимальное управление в задаче (1) – (2) определяется выражением
т
⎛ ∂S ⎞
U = −0, 5 R −1B( X ) т ⎜
⎟ ,
⎝ ∂X ⎠
(3)
где функция Беллмана S(X) удовлетворяет следующему уравнению в частных
производных
⎛ ∂S
⎜
⎝ ∂X
т
1 ∂S
⎞
⎛ ∂S ⎞
B( X ) R −1B т ( X ) ⎜
⎟ A( X ) −
⎟ + Q ( X ) = 0,
4
∂
X
⎠
⎝ ∂X ⎠
(4)
известному в литературе как уравнение Гамильтона–Якоби–Беллмана.
Необходимо отметить, что уравнение (4) известно более 50 лет, но общие
методы его решения в настоящее время по существу отсутствуют и синтез оптимальных управлений нелинейными объектами наталкивается на серьезные математические трудности поиска численного и, тем более, аналитического решения
данного уравнения. Общее решение уравнения (4) установлено только для линейных объектов управления [1, 2]. Нелинейная же задача АКОР полностью (аналитически) решена только для объекта первого порядка x& (t ) = a[ x(t )] + b[ x(t )] u (t ) ,
для которого управление (3) принимает вид [2, 3]:
u ( x) = −
2
⎡
⎤
⎛ a( x) ⎞
b( x) ∂S
a( x)
Q( x) ⎥
= −⎢
+ sign ( x) ⎜
+
≡ F ( x) .
⎟
⎢ b( x )
2r ∂x
b( x ) ⎠
r ⎥
⎝
⎣⎢
⎦⎥
(5)
Для нелинейных объектов более высокого порядка задача АКОР решается,
как правило, приближенно методом степенных рядов [1]. Применение последнего
метода, во-первых, сопряжено с выполнением большого объема вычислений,
что ограничивает порядок решаемых задач управления часто значениями 3 или 4.
Во-вторых, для многих задач управления область сходимости степенных рядов
(область существования управления) оказывается достаточно узкой, что лишает
получаемое решение практического смысла.
В связи с вышеуказанными обстоятельствами предлагается для решения задачи АКОР n-го порядка использовать n раз решение (5). Такая идея в теории
управления не является новой: в литературе для ее реализации предлагались различные подходы [1, 2]. Предложим новый подход использования данной идеи
в решении задачи АКОР для нелинейных объектов определенного класса – объектов, для которых модели динамики можно представить последовательным соединением соответствующих звеньев низкого порядка.
ISSN 0136-5835. Вестник ТГТУ. 2014. Том 20. № 4. Transactions TSTU
701
Метод синтеза квазиоптимальных регуляторов
Для простоты описания предлагаемого метода синтеза рассмотрим его содержание на примере решения задачи АКОР для объекта второго порядка, структура которого показана на рис. 1.
В соответствии с рис. 1 рассмотрим x2 (t ) условно как сигнал некоторого
промежуточного управления для первого звена объекта. Применяя к этому звену
результат (5), найдем промежуточное управление
x2 (t ) = F1[ x1Z − x1 (t )],
(6)
где функция F1 описывается выражением (5), в котором параметры объекта имеют
значения a( x) = a1 ( x1 ), b( x) = b1 ( x1 ), а параметры критерия – Q( x) ≡ Q1 ( x1 ), r ≡ r1;
x1Z = const – сигнал задания регулятора, учитываемый как начальное отклонение
фазовой координаты x1 (t ) объекта.
Промежуточный сигнал управления (6) необходимо сформировать за счет
соответствующего изменения настоящего управления u (t ) вторым подобъектом
(звеном) первого порядка. С этой целью будем управлять им оптимальным образом по интегральному критерию с параметрами Q( x) ≡ Q2 ( x2 ), r ≡ r2 , стремясь
на выходе подобъекта получить сигнал, равный значению (6), то есть сигнал (6)
будем рассматривать как сигнал задания для переменной x2 (t )
x2 Z (t ) = F1[ x1Z − x1 (t )] .
(7)
Если сигнал (7) изменяется достаточно медленно по сравнению с x2 (t ) (то
есть x2Z (t ) ≅ const, что возможно, если первое звено в сравнении со вторым является значительно более инерционным), то решение последней задачи управления
описывается уравнением
u (t ) = F2 [ x2 Z (t ) − x2 (t )] = F2 [F1[ x1Z − x1 (t )] − x2 (t )] ,
(8)
в котором функция F2 представляется выражением (5) с параметрами
a ( x) = a2 ( x2 ), b( x) = b2 ( x2 ), Q( x) ≡ Q2 ( x2 ), r ≡ r2 .
Работоспособность системы с управлением (8) исследовалась в работе [4].
Если второй подобъект является линейным, то решение сформулированной
задачи оптимального управления можно уточнить, сняв предположение
x2 Z (t ) = const, определяющее приближенный характер управления (8).
Для учета изменения сигнала x2 Z (t ) воспользуемся описанием в отклонениях объекта управления, представленного на рис. 1. Так как e2 (t ) = x2 Z (t ) − x2 (t )
и x2 (t ) = x2 Z (t ) − e2 (t ), то объект описывается уравнением
e&2 (t ) = a2e2 (t ) + b2 ⎣⎡( x&2 Z (t ) − a2 x2Z (t ) ) b2 − u (t ) ⎦⎤ .
(9)
Выражение в квадратных скобках будем рассматривать как некоторое новое
управление объектом (9)
U (t ) = ( x&2 Z (t ) − a2 x2 Z (t ) ) b2 − u (t ).
Рис. 1. Структурная схема объекта управления
702
ISSN 0136-5835. Вестник ТГТУ. 2014. Том 20. № 4. Transactions TSTU
(10)
Для данного объекта решение задачи АКОР по критерию качества вида (2)
имеет вид U (t ) = F2 [e2 (t )] . На его основе с учетом (10) получаем соотношение
( x&2 Z (t ) − a2 x2 Z (t ) )
b2 − u (t ) = F2 [ x2 Z (t ) − x2 (t )],
откуда находим искомое управление
u (t ) = ( x&2 Z (t ) − a2 x2 Z (t ) ) b2 − F2 [ x2 Z (t ) − x2 (t )] .
С использованием соотношения (7) искомое управление окончательно представляем в форме
⎛d
⎞
u (t ) = ⎜ F1[e1 (t )] − a2 F1[e1 (t )] ⎟ b2 − F2 [ F1[e1 (t )] − x2 (t )] .
(11)
⎝ dt
⎠
Управление (8) входит составной частью в обратную связь (11).
Изложенный метод синтеза легко обобщить на объекты указанной структуры
с порядком выше второго, а также на объекты, образованные последовательным
соединением звеньев второго (третьего) порядков.
Пример применения метода синтеза
Применим предложенный метод к решению актуальной в настоящее время
научно-технической задачи энергосберегающего управления электротермическим
объектом, описываемым по каналу «напряжение на нагревательной спирали –
температура» передаточной функцией
W ( p) = K (T1 p + 1)(T2 p + 1)
(12)
со следующими параметрами: K = 0, 768 °С/B; T1 = 17, 7 мин; T2 = 59, 5 мин.
Для применения метода представим структуру исследуемого объекта (12)
последовательным соединением двух апериодических звеньев, показанных
на рис. 1, с постоянными параметрами a1, b1 и a2, b2. В указанном фазовом пространстве ( x1 (t ) = x (t ) – отклонение регулируемой температуры от задания,
u(t) – напряжение на нагревателе) данный объект управления описывается дифференциальными уравнениями
x&1 (t ) = ( − x1 (t ) + x2 (t ) ) T1 , x&2 (t ) = ( − x2 (t ) + Ku (t ) ) T2 ,
u (t ) ≤ U m = 220 B. (13)
Необходимо отметить, что математическое описание (12) или (13) является
достаточно простым, но в то же время и типовым для печей сопротивления, которое используется при решении как традиционных задач управления, так и задач
энергосберегающего управления.
Задачу оптимального энергосберегающего управления сформулируем следующим образом: найти закон обратной связи u(x), переводящий объект (13)
из начального состояния X(0) = X0 в конечное нулевое состояние X(Т) = 0 за время
T с минимальным значением функционала качества
J2 = ∫
T
0
(u 2 (t ) r + q ) dt → min,
q > 0, r = 59 Oм.
(14)
при наличии указанного ограничения на сигнал управления.
Функционал (14) является комбинированным критерием «энергосбережения/
быстродействия» (КЭБ), минимизация которого означает достижение максимального быстродействия системы с весом q при использовании управлений с минимальной энергией (r представляет электрическое сопротивление нагревателя).
С точки зрения многокритериальной оптимизации КЭБ представляет собой результирующий (комбинированный) функционал качества, изменением весового
коэффициента q которого определяется множество всех Парето-оптимальных реISSN 0136-5835. Вестник ТГТУ. 2014. Том 20. № 4. Transactions TSTU
703
шений, характеризующихся частными критериями энергосбережения и быстродействия [1].
Для приближенного решения сформулированной задачи оптимального
управления (13), (14) воспользуемся известным ее аналитическим решением
для апериодического объекта первого порядка, которое для критерия (14) с учетом ограничения на управление принимает вид [3]
⎧⎪ 1 ⎡ ax
⎫
−1
K
ax 2 q ⎤⎪
+
+
≡ F (x), a = , b = . (15)
sign(
)
u(x) = −Um sat ⎨
x
⎬
⎢
⎥
U
b
b
r
T
T
⎦⎥⎭⎪
⎩⎪ m ⎣⎢
В соответствии с изложенным методом синтеза энергосберегающие алгоритмы управления объектом (13) будут описываться уравнениями (8) или (11),
в которых функция F1 определяется выражением (15) с параметрами a = −1/T1,
b = K /T1. Соответственно, функция F2 также описывается выражением (15),
но с параметрами a = −1/T2 , b = K2 /T1, где K2 для упрощения вычислений принимается равным единице.
Результаты сравнительного компьютерного моделирования систем с алгоритмами управления (8), (11) и оптимального программного управления при выводе ими объекта на температурный режим x1z = 50 °C за время нагрева Т = 1,4 ч
приведены на рис. 2, а.
Для обеспечения указанного времени переходных процессов энергосберегающих систем управления выбраны значения q1 = 2000, q2 = 886, x2max = 56 °C,
которые получены в результате использования алгоритма оптимизации Latin
Hypercube. Графики на рисунке 2, а показывают изменения температуры и напряжения систем в сравнении со строго оптимальным по критерию (2) программным
управлением, которое обеспечивает уменьшение потребления электроэнергии W
в сравнении с энергией Wном при прямом пуске объекта с управлением
( )
U, В
160
140
120
100
80
60
40
20
0
500
1000
1500
2000
2500
3000
3500
4000
Т, с
а)
Рис. 2. Сравнительные графики изменения температуры (1 – 3)
и напряжения (4 – 6) при использовании программного управления (1, 4),
алгоритмов (8) (2, 5) и (11) (3, 6) и различных температурах задания, °С:
а – 50, б – 65; в – 80;
704
ISSN 0136-5835. Вестник ТГТУ. 2014. Том 20. № 4. Transactions TSTU
U, В
160
5
140
120
6
100
80
60
40
3
20
0
1000
2000
3000
4000
5000
6000
Т, с
б)
U, В
150
5
100
6
50
3
0
2000
4000
6000
8000
10000
Т, с
в)
Рис. 2. Окончание
Uном = 220 В. В работе процентное уменьшение потребления системой электроэнергии оценивается по формуле ΔW% = (Wном − W ) ⋅ 100% Wном . Рассчитанная
таким образом экономия энергии для программного управления составляет
ΔW% ≥ 54 %, для регулятора (8) – ΔW% ≥ 43, 9 % и для регулятора (11) –
ΔW% ≥ 44, 6 % соответственно.
Результаты дальнейшего моделирования при заданиях регулятора x1z = 65 °C
и x1z = 80 °C представлены на рис. 2, б и в соответственно.
Различие в экономии энергии, обеспечиваемое алгоритмами управления (8)
и (11), при температуре задания x1z = 65 °C составляет ΔW% Re g (8) − ΔW% Re g (7) =
= 47 % − 36,9 % = 10,1%, а при x1z = 80 °C – ΔW%Re g (8) −ΔW%Re g (7) = 36,6 % − 29,1% =
ISSN 0136-5835. Вестник ТГТУ. 2014. Том 20. № 4. Transactions TSTU
705
= 7, 5 %, то есть регулятор (11) является более эффективным как минимум в рассмотренном диапазоне температур. Повышенная экономия энергии данным регулятором достигается за счет увеличения времени переходных процессов, а также
меньшей величины перерегулирования.
Таким образом, квазиоптимальный энергосберегающий закон управления (8)
обеспечивает уменьшение потребления энергии на величины, достаточно близкие
к предельно возможному значению (в случае оптимального программного управления), причем он относительно просто может быть модифицирован в алгоритм
управления (11) для бóльшего повышения экономии в требуемом диапазоне температур.
Список литературы
1. Современная прикладная теория управления : в 3 т. / под ред. А. А. Колесникова. – М. : ФЦ «Интеграция» ; Таганрог : Изд-во Таганрог. гос. радиотехн. ун-та,
2000. – 3 т.
2. Петров, Ю. П. Вариационные методы теории оптимального управления /
Ю. П. Петров. – Л. : Энергия, 1977. – 280 с.
3. Ловчаков, В. И. Энергосберегающие управления электротехническими
объектами / В. И. Ловчаков, Е. В. Ловчаков, Б. В. Сухинин // Электрика. – 2009. –
№ 12. – С. 7– 13.
4. Пат. 2453890 Российская Федерация, МПК G05B 13/00. Способ автоматического управления в нелинейной системе и следящая система для его осуществления / Ловчаков В. И., Ловчаков Е. В., Сухинин Б. В., Сапожников А. М. –
№ 2010150556 ; заявл. 10.12.2010 ; опубл. 20.06.2012, Бюл. № 17. – 11 с.
Synthesis of Quasi-Optimal Controllers for Objects of the Same Class
V. I. Lovchakov1, A. A. Lupachev2,
B. V. Sukhinin1, E. I. Kretov1
Department of Electrical Engineering and Electrical Equipment,
Tula State University, Tula; lovvi50@mail.ru (1);
Department of Information-Measurement Technologies,
National Research University “MEI”, Moscow (2)
Key words and phrases: energy-saving control; Letov-Kalman’s objective;
mathematical modeling; object with sequential structure; optimal controller; optimal
regulator.
Abstract: In this paper, we consider a new method for solving the problem of
analytical construction of optimal regulator (ACOR) staged on Letov-Kalman’s
interpretation for nonlinear high-order structure, which may be represented by a series
connection of the low order elements (first, second). Accordingly, the method of
synthesis of feedback for this objects based on multiple, sequential use of the wellknown optimal control algorithms for low order objects. Since the algorithms of objects
control of the first or second orders are determined relatively simply, the proposed
method allows reducing the number of computations needed for solving the above
problems ACOR in comparison with known methods. The method was successfully
applied for the solution of relevant scientific and technical problems of energy-saving
control electrothermal objects described by a standard transfer function of the second
order. Also, we made computer modelling of the synthesized power-saving control
systems and estimated the value of energy savings.
706
ISSN 0136-5835. Вестник ТГТУ. 2014. Том 20. № 4. Transactions TSTU
References
1. Kolesnikov A.A. (Ed.) Sovremennaya prikladnaya teoriya upravleniya (Modern
applied management theory), Moscow: FTs “Integratsiya”; Taganrog: Izdatel'stvo
Taganrogskogo gosudarstvennogo radiotekhnicheskogo universiteta, 2000.
2. Petrov Yu.P. Variatsionnye metody teorii optimal'nogo upravleniya (Variational
methods of optimal control theory), Leningrad : Energiya, 1977, 280 p.
3. Lovchakov V. I., Lovchakov E. V., Sukhinin B. V. Elektrika, 2009, no. 12, pp. 7-13.
4. Lovchakov V.I., Lovchakov E.V., Sukhinin B.V., Sapozhnikov A.M. Sposob
avtomaticheskogo upravleniya v nelineinoi sisteme i sledyashchaya sistema dlya ego
osushchestvleniya (A method of automatic control in a nonlinear system and tracking
system for its implementation), Russian Federation, 2012, Pat. № 2453890.
Synthese der quasioptimalen Regler für die Objekte einer Klasse
Zusammenfassung: Es ist die neue Methode der Lösung der Aufgabe des
analytischen Konstruierens des optimalen Reglers (АCОR) in der Errichtung von
Letov-Kalman für die nichtlinearen Objekte der hohen Ordnung, deren Struktur von der
konsequenten Vereinigung der Glieder der niedrigen Ordnung (der ersten, der zweiten)
dargelegt sein kann, vorgeschlagen Die angebotene Methode lässt zu, die Zahl der
Berechnungen, die für die Lösung der betrachteten Aufgaben von АCОR im Vergleich
mit den bekannten Weisen notwendig sind, vielfach zu verringern. Es ist die
Computermodellierung der synthetisierten energiesparenden Steuersysteme von seiner
Temperaturregime durchgeführt und es ist die Einschätzung der Größe der Einsparung
der Elektroenergie mit den angebotenen Reglern bestimmt.
Synthèse des régulateurs pour les objets d’une classe
Résumé: Est proposée une nouvelle méthode pour la solution de la construction
analytique du régulateur dans l’interprétation de Letov-Kalman pour les objets non
linéaires du haut ordre dont la structure peut être présentée par une série séquentielle des
éléments de l’ordre plus bas (premier, second). La méthode proposée permet de diminuer
les calculs nécessaires pour la solution des problèmes de la construction analytique du
régulateur examinés en comparaison avec d’autres moyens connus. Est effectué le
modélage informatique des systèmes économes d’énergie, est définie l’estimation de la
valeur de l’économie de l’énergie électrique par des régulateurs proposés.
Авторы: Ловчаков Владимир Иванович – доктор технических наук, профессор кафедры электротехники и электрооборудования, ФГБОУ ВПО «Тульский
государственный университет», г. Тула; Лупачев Алексей Алексеевич – кандидат
технических наук, старший научный сотрудник кафедры информационно-измерительной техники, ФГБОУ ВПО «Национальный исследовательский университет «МЭИ», г. Москва; Сухинин Борис Владимирович – доктор технических наук, профессор, заведующий кафедрой электротехники и электрооборудования;
Кретов Егор Игоревич – аспирант кафедры электротехники и электрооборудования, ФГБОУ ВПО «Тульский государственный университет», г. Тула.
Рецензент: Матвейкин Валерий Григорьевич – доктор технических наук,
профессор, заведующий кафедрой «Информационные процессы и управление»,
ФГБОУ ВПО «ТГТУ».
ISSN 0136-5835. Вестник ТГТУ. 2014. Том 20. № 4. Transactions TSTU
707
Документ
Категория
Без категории
Просмотров
9
Размер файла
708 Кб
Теги
синтез, объектов, одного, pdf, класс, квазиоптимального, регуляторов
1/--страниц
Пожаловаться на содержимое документа