close

Вход

Забыли?

вход по аккаунту

?

К обоснованию решения задачи реконструкции динамики одного класса нелинейных моделей.

код для вставкиСкачать
ISSN 1810-0198. Вестник ТГУ, т. 20, вып. 5, 2015
УДК 517.977
К ОБОСНОВАНИЮ РЕШЕНИЯ ЗАДАЧИ РЕКОНСТРУКЦИИ
ДИНАМИКИ ОДНОГО КЛАССА НЕЛИНЕЙНЫХ МОДЕЛЕЙ
c
Е.А. Крупенников
Ключевые слова: динамическая реконструкция; оптимальное управление; принцип максимума Понтрягина.
Предложен метод восстановления динамики и управлений для одного класса нелинейных управляемых систем по известным неточным замерам траектории движения. Этот
метод опирается на принцип максимума Понтрягина и метод регуляризации Тихонова
для вспомогательных задач оптимального управления с заданной целью.
1. Вступление
Задачи реконструкции динамики и управлений по истории неточных замеров траектории движения управляемых систем исследовались многими авторами. Наиболее близким к методу, обсуждаемому в данной работе, является подход, предложенный и развитый
Ю.С. Осиповым и его учениками [1] и опирающийся на метод регуляризации Тихонова [2]
и метод экстремального прицеливания Н.Н. Красовского [3].
Предложена модификация метода решения этих задач, изложенного в работе [4], который опирается на необходимые условия оптимальности во вспомогательной задаче оптимального управления с интегральным функционалом регуляризованной невязки [5] и метод
характеристик [6] для соответствующего уравнения Беллмана.
В предлагаемой модификации изменено целевое множество во вспомогательной задаче
оптимального управления. Исследуется один существенно нелинейный класс управляемых
систем.
2. Постановка задачи
Рассмотрим задачу реконструкции динамики и управлений для управляемых систем
вида
ẋi (t) = gi (x(t))ui (t), x(t) ∈ Rn , t ∈ [0, T ], i = 1, . . . , n,
(1)
где управления ui удовлетворяют ограничениям
−∞ < U i 6 ui (t) 6 Ūi < ∞,
i = 1, . . . , n.
(2)
Реконструкция производится по известной дискретной истории замеров
{yδ (ti ) = yi ∈ Rn ,
i = 1, . . . , N,
t0 = 0 < t1 < . . . < tN = T }
базовой траектории x∗ (t) . Замеры определяют x∗ (ti ) с абсолютной точностью δ .
Предполагается, что для рассматриваемых входных данных задачи реконструкции выполняются следующие условия:
П р е д п о л о ж е н и е 1. Функции gi (x) , i = 1, . . . , n , непрерывно дифференцируемы
в Rn .
П р е д п о л о ж е н и е 2. Существует такие константы ω i > 0, ω̄i > 0, i = 1, . . . , n и
такое число a > 0 , что при t ∈ [0, T ] выполняются оценки
0 < ω 2i < gi (x)2 < ω̄i2 ,
1222
(t, x) ∈ Ψ = {t ∈ [0, T ], kx − x∗ (t)k 6 a}.
ISSN 1810-0198. Вестник ТГУ, т. 20, вып. 5, 2015
Под решением задачи динамической реконструкции по замерам {yδ (·)} понимается построение управлений u(t) = uδ (t) , удовлетворяющих ограничениям (2) таких, что они и
порождаемые ими траектории x(t) = xδ (t) системы (1) удовлетворяют условиям:
lim kxδ (·) − x∗ (·)kC = 0,
δ→0
lim kuδ (·) − u∗ (·)kL2 = 0,
δ→0
где символы k·kC и k·kL2 обозначают нормы в пространствах C и L2 , а u∗ (t) — нормальное управление — измеримая функция, удовлетворяющая ограничениям (2), порождающая
x∗ (t) и при этом имеющая минимальную норму в L2 . Заметим, что при сделанных предположениях нормальное управление единственно в L2 (см. [4]).
Введем функции y(t) = yδ (t) , интерполирующие известные замеры. Предполагается,
что функции yδ (t) должны быть непрерывно дифференцируемы, а их производные равномерно (относительно параметра δ ) ограничены, причем существует такое δ0 , 0 < δ0 6 a
(где a — константа из предположения 2), что
dyδ (t) 6 Ȳ ,
dt
δ ∈ (0, δ0 ],
t ∈ [0, T ],
Ȳ = 2 max ω̄i · max{|U i |, |Ūi |} .
i=1,...,n
(3)
Ограничение (3) учитывает то обстоятельство, что в области Ψ , описанной в предположении 2, скорости ẋ∗i (t) , согласно (1), (2) и предположениям 1–2, ограничены, и естественно
рассматривать лишь те интерполяции, скорости которых ẏi (t) ограничены. Будем также
считать, что
lim kyδ (·) − x∗ (·)kC = 0.
δ→0
3. Алгоритм решения задачи реконструкции
Предлагается следующий алгоритм решения поставленной задачи реконструкции.
Пусть y(t) = yδ (t) — некоторая интерполяция замеров x∗ (t) . Введем интегральный
функционал невязки вида
I(x(t), u(t)) =
ZT 0
−
kx(t) − y(t)k2 α2 ku(t)k2 +
dt,
2
2
(4)
где α — малый регуляризирующий параметр.
Рассмотрим вспомогательную задачу оптимального управления о переводе траектории
x(·) системы (1) из точки x(t0 ) = x0 ∈ Rn , t0 < T в заданный конечный момент времени T на целевую точку y(T ) с условием минимизации функционала (4). Введем также
дополнительное условие, ограничивающее скорость ẋ(t) в конечной точке – пусть
kẋ(T ) − ẏ(T )k 6 δ.
(5)
Для построения решений вспомогательной задачи оптимального управления воспользуемся
принципом максимума Понтрягина в гамильтоновой форме.
Для упрощения изложения полагаем, что ограничения на управления (2) достаточно
велики, так что оптимальное управление во вспомогательной задаче не выходит на границы
этих ограничений. Рассмотрим те оптимальные процессы x(t) , u(t) , для которых оптимальные траектории в этой задаче проходят в начальный момент времени t0 = 0 через
область
{x ∈ Rn : xi ∈ [yi (0) − δ, yi (0) + δ], i = 1, . . . , n}.
Наконец, выберем среди таких оптимальных процессов тот, который будет доставлять наименьшее значение функционалу (4). Полученную траекторию и порождающее её управление будем считать решением задачи реконструкции при заданных параметрах δ и α .
1223
ISSN 1810-0198. Вестник ТГУ, т. 20, вып. 5, 2015
Заметим, что такое решение может быть не единственно. В таком случае в качестве решения задачи реконструкции можно взять произвольное решение из тех, что минимизируют
функционал.
Введем следующее предположение относительно управлений и траекторий системы (1):
П р е д п о л о ж е н и е 3. Пусть существует такое число b, 0 < b 6 δ0 (где δ0 —
из (3)), что при 0 < δ 6 b, 0 < α 6 b фазовые характеристики xα,δ (t) содержатся при
t ∈ [0, T ] в компакте Ψ из предположения 2. Под xα,δ (t) подразумеваются решения характеристической системы принципа максимума Понтрягина, удовлетворяющие условию (5)
при фиксированных параметрах α и δ .
Отметим, что выполнение такого предположения в рассматриваемых примерах (в том
числе и существенно нелинейных) было показано эмпирически.
4. Полученные результаты
Была доказана следующая теорема о сходимости предложенного алгоритма:
Т е о р е м а 1. При выполнении предположений 1 – 3 , а также условия согласования
параметров α = α(δ) > δ 2 , α < b ( где b — из предположения 3) характеристики xα,δ (t) ,
удовлетворяющие условию (5) , а также порождающие их управления, удовлетворяют
условиям
lim kxα,δ (·) − x∗ (·)kC = 0, lim kuα,δ (·) − u∗ (·)kL2 = 0.
α→0
α→0
Полученные теоретические результаты проиллюстрированы на примере численного решения задачи динамической реконструкции макроэкономической модели [6, 7].
ЛИТЕРАТУРА
1. Осипов Ю.С., Васильев Ф.П.,Потапов М.М. Основы метода динамической регуляризации. М.: Изд-во
МГУ, 1999. 237 с.
2. Тихонов А.Н. Об устойчивости обратных задач // ДАН СССР. 1943. Т. 39, №4. С. 195–198.
3. Красовский Н.Н. Теория управления движением. М.: Наука, 1968. 476 с.
4. Субботина Н.Н., Токманцев Т.Б. Исследование устойчивости решения обратных задач динамики
управляемых систем по отношению к возмущениям входных данных // Труды ИММ УрО РАН. 2014. Т. 20.
№ 3. С. 218-233.
5. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1961. 393 с.
6. Субботина Н.Н., Колпакова Е.А., Токманцев Т.Б., Шагалова Л.Г Метод характеристик для уравнения Гамильтона–Якоби–Беллмана. Екатеринбург: РИО УрО РАН, 2013. 244 с.
7. Альбрехт Э.Г. Методика построения и идентификации математических моделей макроэкономических
процессов // Электронный журнал «Исследовано в России». 2002. №5. C. 54-86. URL:
http://zhurnal.ape.relarn.ru/articles/2002/005.pdf
БЛАГОДАРНОСТИ: Работа выполнена при поддержке РФФИ (проект 14–01–00168).
Поступила в редакцию 26 мая 2015 г.
Krupennikov E.A. ON JUSTIFICATION OF THE SOLUTION OF A RECONSTRUCTION PROBLEM FOR A CLASS OF NON-LINEAR MODELS
A dynamic reconstruction method using known measurements is described for a class of nonlinear
controlled systems. The method is based on Pontryagin’s maximum principle and Tikhonov’s regularization
method for auxiliary problem of optimal control with a determined target set.
Key words: dynamic reconstruction; Pontryagin’s maximum principle; optimal control.
Крупенников Евгений Александрович, Уральский федеральный университет имени первого
Президента России Б.Н. Ельцина, Екатеринбург, Российская Федерация, аспирант, e-mail:
krupennikov@imm.uran.ru
1224
ISSN 1810-0198. Вестник ТГУ, т. 20, вып. 5, 2015
Krupennikov Evgenii Aleksandrovich, Ural Federal University named after the first President of
Russia B.N. Yeltsin, Ekaterinburg, the Russian Federation, Post-graduate Student, e-mail:
krupennikov@imm.uran.ru
УДК 517.929
ПРИЗНАКИ УСТОЙЧИВОСТИ НЕАВТОНОМНОГО РАЗНОСТНОГО
УРАВНЕНИЯ С ОГРАНИЧЕННЫМИ ЗАПАЗДЫВАНИЯМИ
c
А.Ю. Куликов
Ключевые слова: разностные уравнения; устойчивость; признаки устойчивости; функция Коши.
Для разностного уравнения с ограниченными запаздываниями получены новые эффективные достаточные признаки устойчивости, выраженные в терминах оценок его
функции Коши.
Обозначим N0 = N∪ {0} , Nm = {n ∈ N : n > m} , ∆ = {(n, m) ∈ N20 : n > m},
R+ = [0, ∞) , [n1 , n2 ] = n ∈ Z : n1 6 n 6 n2 , если n1 > n2 , то [n1 , n2 ] = ∅ .
Настоящая работа посвящена исследованию устойчивости разностного уравнения вида
x(n + 1) = ax(n) −
N
X
k=1
bk (n)x(n − hk (n)),
n ∈ Nm ,
(1)
где 0 < a < 1 , bk : N0 → R+ , hk : N0 → N0 .
N
P
Положим b(n) =
bk (n) при n ∈ N0 , b(n) = 0 при n ∈
/ N0 , h(n) = max hk (n) .
k=1
k∈[1,N ]
Обозначим H = sup h(n) и потребуем выполнения условия 0 < H < ∞ .
n∈N0
Функцию x будем доопределять начальной функцией ξ : {n ∈ Z, n 6 m} → R , а
решением уравнения (1) будем называть функцию, x : Nm → R , удовлетворяющую ему
при всех n ∈ Nm .
Отказ от постоянства параметров уравнения практически исключает возможность получить необходимые и достаточные признаки устойчивости и делает неприменимым хорошо разработанный аппарат исследования устойчивости автономных уравнений, основанный на опредлении расположения корней соответствующего уравнению характеристического полинома. Поэтому работы, посвященные исследованию устойчивости неавтономных
разностных уравнений, опираются на принципиально иные подходы. В частности, в последние десятилетия многие авторы стали рассматривать разностное уравнение как аналог
функционально-дифференциального уравнения (ФДУ) с сосредоточенными запаздываниями и применять для его изучения идеи и методы, разработанные в интенсивно развивающейся теории устойчивости ФДУ.
В работах [1–3] для разностного уравнения с запаздываниями были получены аналоги известных в теории ФДУ неулучшаемых достаточных признаков устойчивости — так
называемых « 3/2 -теорем» [4, 5]. Дальнейшие исследования показали, что разностные уравнения проявляют свою «дискретную природу» и константа 3/2 в признаках устойчивости
1225
Документ
Категория
Без категории
Просмотров
5
Размер файла
251 Кб
Теги
динамика, нелинейные, решение, обоснование, одного, класс, моделей, задачи, реконструкция
1/--страниц
Пожаловаться на содержимое документа