close

Вход

Забыли?

вход по аккаунту

?

Порядковая регуляризация в задаче оптимального управления.

код для вставкиСкачать
Математическое моделирование. Оптимальное управление
Вестник Нижегородского
университета им.
Н.И. Лобачевского,
2013,
№ 4 (1), с. 211–215
Порядковая регуляризация
в задаче
оптимального
управления
211
УДК 519.6
ПОРЯДКОВАЯ РЕГУЛЯРИЗАЦИЯ
В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
 2013 г.
А.Л. Калашников
Нижегородский госуниверситет им. Н.И. Лобачевского
allk123@yandex.ru
Поступила в редакцию 25.04.2013
Рассматривается задача оптимального управления в KB-линеале с единицей. На основе метода
Тихонова строится регуляризирующая последовательность. Приводятся условия её порядковой сходимости к оптимальному множеству управлений в KB-линеале ограниченных элементов.
Ключевые слова: оптимальное управление, KB-линеал, регуляризация, порядковая сходимость.
Введение
В работе рассматривается задача минимизации функционала при операторном и функциональных ограничениях на состояние x и управление u . Пространство управлений U здесь –
KB-линеал с единицей e . Отметим, что к такой
постановке приводят многие задачи оптимального управления, в которых банахово пространство управлений является и полуупорядоченным
пространством, например, задача оптимального
управления для динамической системы с интегральными ограничениями и интегральным целевым функционалом, в которой U = Ln2 [t0 , t1 ] , а
за e берётся вектор-функция e(t ) = (1,1,,1)T .
Как известно [1], в KB-линеале с единицей
можно ввести KB-линеал e-ограниченных элементов U e . При этом из сходимости в U e следует сходимость в U к тому же пределу, что
означает более сильную метрику в U e , чем в U .
0
Если для оптимального множества U управлений исходной задачи будет U e  U 0   , то
целесообразно строить минимизирующие последовательности, сходящиеся ко множеству
U 0 в метрике U e . В этом случае возможно сужение пространства управлений, например, до
Ue .
Так,
при
U = Ln2 [t0 , t1 ]
подлинеал
U e = Ln [t 0 , t1 ], и сходимость в U e будет почти
всюду равномерная. Но при замене пространства U на U e возникает вопрос о корректности
исходной задачи оптимизации в U e . Это связано с тем, что хотя в U корректность может
быть, но в более «узком» пространстве U e она
отсутствует [2]. Тем более подобное относится
к случаю, когда в U задача оптимизации некорректна. Для некорректных задач оптимизации
разработаны методы регуляризации [2]. В настоящей работе на основе метода А.Н. Тихонова
приведены условия порядковой сходимости в U e
регуляризирующей последовательности, а также
e-ограниченности оптимальных управлений. Отметим, что такая усиленная (в порядковом смысле) регуляризация получена без стабилизатора.
Порядковая ограниченность
оптимального множества
Рассматривается 0-задача: g 0 ( x, u )  inf,
F ( x, u ) = 0, g j ( x, u )  0, x  X , u  U , j = 1, n.
Здесь операция F : X  U  Z , где X , Z – банаховы пространства, а U является KBлинеалом с единицей e . Функционалы g0 , g j и
операция F класса C 1 определены на X  U . В
дальнейшем будем называть U пространством
управлений, а X – пространством состояний.
Пусть для всех u  U уравнение F ( x, u ) = 0
имеет единственное решение x = x(u) класса
C 1 . Такое, в частности, будет при выполнении
условий теоремы о существовании неявной
функции в банаховом пространстве. Тогда 0задача сводится к задаче минимизации функционала
g0 ( x(u), u )
с
ограничениями
g j ( x(u ), u )  0 , j = 1, n , u  U . Очевидно, все
функционалы g j ( x(u ), u ) для
j = 0, n непре1
рывны и принадлежат классу C на U . Предположим также, что D   , где D – допустимое множество управлений в 0-задаче, и суще-
212
А.Л. Калашников
ствует некоторое множество S  U , для которого
D  S . Например, такое S может быть получено
на основе одного из неравенств g j ( x(u ), u )  0 .
0
Обозначим U множество оптимальных управлений в 0-задаче, и пусть U 0   . Достаточные
условия этого имеются, например, в [2]. Очевидно, для оптимального управления u0  U 0 оптимальное состояние x0 = x(u0 ) .
Исходная 0-задача может быть некорректна в
пространстве U или в более «узком» подпространстве U e при наличии дополнительной информации об оптимальном управлении, в частности, его ограниченности. Поэтому здесь применимы методы регуляризации, например, метод
А.Н. Тихонова [2] с его функцией Tk ( x(u ), u ) =
= g 0 ( x(u ), u )   k (u ) при u  U и k  1 , где
1
функционал (u )  0 и принадлежит классу C
на U , а числовая последовательность  k  0 .
Введём k -задачи: Tk ( x(u ), u )  inf ,
g j ( x(u), u )  0, j = 1, n, u  U .
Пусть, теперь, g j ( x, u ) = a j (u )  b j ( x, u ) для
j = 0, n , где a j (u ) , b j ( x, u ) – некоторые функ-
ционалы класса C 1 на X  U . Предположим
также, что сопряженное пространство U * является KB-линеалом с единицей a . Введём U a* –
KB-линеал a-ограниченных элементов в U * .
Обозначим  e норму в U e , а  a – норму в
*
a
U . Их определение имеется в [1], и по [1] из
сходимости последовательности в U e следует
её сходимость в U к тому же пределу. Аналогичное же относится и к U a* . Поэтому функ-
ционалы g j ( x(u ), u ) , (u ), при j = 0, n непрерывные в U , будут непрерывны и в U e . Обозначим | u | модуль элемента u  U , а числом
d0 – inf в 0-задаче и {vkm } – подпоследовательность последовательности {vk } . Введем для
u  U e и множества Q  U e расстояние
e (u , Q) = inf || u  v ||e .
существует {sk m }, для которой lim ρ e ( s k , Q) 
k
 lim ρ e ( sk m , Q) . В силу компактности {sk } счиkm
таем для удобства обозначения {skm } сходящейся
к некоторой предельной точке v  lim skm в U e .
km
На основе условия леммы v  Q. Нетрудно установить
неравенство:
 e ( s k m , Q) =
= inf || s k m  u ||e  || sk m  v || e . Но lim || s k  v ||e = 0 .
km
uQ
m
Тогда lim e ( skm , Q) = 0 , и поэтому lim ρ e ( s k , Q) 
km
k
 lim ρ e ( s km , Q)  0 . Поскольку 0  lim e ( sk , Q) 
km
k
 lim  e ( sk , Q) = 0 , то получаем lim e ( sk , Q) 
k
k
 lim  e ( sk , Q) = 0 . Отсюда
lim e ( sk , Q ) = 0.
k
k
Лемма доказана.
Обозначим U e0 множество e-ограниченных
оптимальных управлений u0 в 0-задаче.
Теорема 1. Пусть 1) существуют числа
,  > 0 , для которых при j = 0, n и всех u  S
модули | aj , u (0) | a и | bj , u ( x (u ), u ) | a ; 2) существует линейный оператор B > 0 : U *  U с
0 < Ba < e для некоторого числа   0 и такой,
n
что при всех u , v  S для чисел λ j  0 с

j
=1
j=0
будет
| u  v | B | u (u ,  )  u (v,  ) |,
где
n
(u, ) =
 a (u ) и вектор   R
j
n 1
j
.
j =0
Тогда U e0   и | u0 | (   )e , а любое
u0  U e0 .
Доказательство. Введём функцию Лагранжа
n
L( x(u ), u,  ) 
  (a (u)  b ( x(u), u)) . Тогда по
j
j
j
j 0
[3] для любого u0  U 0 существуют множители
n
0j  0 с

0
j
 1 , для которых Lu ( x(u0 ), u0 ,
j 0
vQ
0
n
0
Лемма. Пусть последовательность {sk }  U e
и компактна в U e , а любая её предельная точка
v  Q  U e . Тогда lim ρe ( sk , Q ) = 0.
Поскольку u0  S , то по условию 1) bj ,u ( x (u0 ),
Доказательство. Так как e ( sk , Q)  0 , то 0 
 lim  e ( s k , Q) По определению верхнего предела

u 0 )  U a . Поэтому  


 )  0 . Отсюда u (u0 ,  )  
  b
0
j
j,u
( x(u0 ), u0 ) .
j 0
k
k
n
  b
0
j
j 0
j ,u

( x (u 0 ), u0 )   U a .


213
Порядковая регуляризация в задаче оптимального управления
0
линейный оператор C > 0 : U *  U с 0 < Ca 
 e для некоторого числа   0 , такой, что при
n
всех u , v  S и   R n 1 с
Тогда и u (u0 ,  )  U a . На основе условия 1)
получаем неравенства
| u (0, 0 ) | 
 n

0j  | aj ,u (0) |  0j  a  a


j 0
 j 0



и
0
n
| u (u 0 ,  ) | 

0
j
| bj ,u ( x (u0 ), u 0 ) |
n

| u0 | B | u (u0 , 0 )  u (0, 0 ) |
 n

 B(| u (u0 , 0 ) |  | u (0, 0 ) |)   0j (   )  Ba .
 j 0




n
0
j
ем неравенство
| u  v | C | k ,u (u , )   k ,u (v,  ) | .
II) lim g 0 ( x (uk0 ), uk0 ) = d 0 , и { uk0 }  минимизиk
рующая в 0-задаче; III) для всех k  1 значение
(uk0 )  inf (u0 ) .
u0U 0
Доказательство. Поскольку условия теоремы 2 аналогичны условиям теоремы 1, то доказательство I) проводится также аналогично.
Докажем II). Имеем неравенства:
d 0  g 0 ( x (u k0 ), u k0 )  g 0 ( x(u k0 ), u k0 )   k (u k0 ) 
 Tk ( x (u k0 ), u k0 )  Tk ( x (u0 ), u0 ) 
 1 , то | u0 |
j 0
Таким образом, множество U e0  , и любое
оптимальное u0  U e0 . Теорема 1 доказана.
Замечание 1. В теореме 1 приводятся условия, когда U 0  U e и содержится в некотором
порядковом отрезке, или e-ограниченность оптимальных управлений 0-задачи, а также условия локализации области поиска U 0 . Отсюда
возможно построение минимизирующих последовательностей в более сильной метрике пространства U e .
Обозначим a0, k (u ) = a0 (u )   k (u ) . Тогда
Введём
при

 j g j ( x, u )
j =1
с  = ( j ) |
n
j 0
и
n
 k (u , ) =  0 a0,k (u ) 
 a (u) ,
j
j
j =1
n
p ( x, u ,  ) 
Из (2) d0  g 0 ( x (uk0 ), uk0 )  d 0   k (u0 ) . Тогда
lim g 0 ( x (uk0 ), uk0 ) = d 0 при  k  0 , и { uk0 } будет
k
минимизирующей в 0-задаче. Из (2) получаем
g0 ( x(uk0 ), uk0 )   k (uk0 )  d 0   k (u0 ) . Но d 0 
 g 0 ( x(u k0 ), u k0 ) .
 k (uk0 )   k (u0 )
Тогда
0
k
0
k
(u )  (u0 ) . Отсюда (u )  inf (u0 ) .
и
Тем
u0U 0
самым установлена справедливость III), и теорема 2 доказана.
Теорема 3. Пусть выполнены условия теоремы 2, и для всякой {vk }  S и j = 0, n последовательность {bj , u ( x(vk ), vk )} компактна в U a* .
Тогда {uk0 } компактна в U e , а любая её пре-
n
Lk ( x, u,  ) =  0  Tk ( x, u) 
(2)
 g 0 ( x (u0 ), u0 )   k (u 0 )  d 0   k (u0 ).
 (  ) e . Отсюда u0 будет e-ограниченным.
Tk ( x(u ), u ) = a0, k (u )  b0 ( x(u ), u ) .
k  1 функции Лагранжа
= 1 и  j  0 име-
Тогда I) uk0  U e , и модуль | uk0 | (   )e ;
 n

  0j  a  a.
 j 0



Используя же условие 2) доказываемой теоремы, выводим неравенства

j
j=0
j 0
Но так как 0 < Ba < e и

дельная точка v  U e0 .
Доказательство. Поскольку {uk0 }  S , то
на основе условия теоремы 3 получаем компактность {bj ,u ( x (uk0 ), uk0 )} в U a* . Согласно [3]
n
существуют 0  0k
с

0
j,k
= 1 , для которых
j 0
 b ( x, u) .
j
j
j =0
Очевидно,
Lk ( x, u ,  ) = k (u ,  )  p( x, u ,  ) .
(1)
Теорема 2. Пусть выполнены условия теоремы 1 и 1) в любой k -задаче существует оптимальное управление uk0 ; 2) существует число
 > 0 , для которого при j = 0, n и всех u  S
модули | a0, k , u (0) | , | aj , u (0) | a ; 3) существует
Lk , u ( x (uk0 ), uk0 , 0k ) = 0 . Отсюда
k ,u (uk0 , 0k ) 
  pu ( x(uk0 ), uk0 , 0k ) . Так как 0  0j , k  1 , то не-
трудно установить компактность { pu ( x(u k0 ),
u k0 , 0k )} в U a* , а с ней и компактность
{k ,u (uk0 , 0k )} в U a* . Обозначим wk  k ,u (uk0 , 0k ) .
Тогда {wk }  U a* и компактна в U a* . На основе
неравенства условия 3) теоремы 2 получаем
| uk0  um0 | C | wk  wm | . Для компактности {uk0 }
214
А.Л. Калашников
в U e достаточно показать, что у всякой ее
0
kj
Тогда
А)
последовательность
{vk }  U e ,
{u } существует сходящаяся в U e подпоследова-
компактна в U e , а любая её предельная точка
тельность. По компактности {wk } для {wk j } суще-
v  U e0 ;
ствует {wk jm }, сходящаяся в U a* , которая, оче-
C) lim g 0 ( x (vk ), vk )  d 0 .
видно, будет фундаментальной в U a* . Тогда для
всякого числа   0 существует такой номер N,
что
при
всех
k jm1 , k jm 2  N
получаем
| wk j  wk j | a . Следовательно, | u k0 jm1  u k0 jm 2 |
m1
m2
 C | wk j  wk j
m1
m2
| Ca  e ,
так
как
0<
< Ca  e для некоторого числа   0 , что до-
В) lim e (uk0 ,U e0 ) = lim e (vk ,U e0 ) = 0 ;
k
k
k
Доказательство. По теоремам 2, 3 uk0  U e и
{uk0 } компактна в U e , а любая её предельная
точка u  U e0   . Из условия 2) теоремы 4
(vk  uk0 )  U e и vk  uk0  k с k  0 . Тогда
e
0
k
{vk }  U e и lim || vk  u ||e = 0 . Отсюда {vk } комk
0
k jm
казывает фундаментальность {u } в U e и, тем
пактна в U e , а все ее предельные точки v совпа-
самым, ее сходимость в U e .
Таким образом,
дают с предельными для {uk0 } . Тогда v  U e0 , и
тем самым А) доказано.
Используя A) и применяя лемму для случаев sk  uk0 и sk  vk для множества Q  U e0 , по-
{uk0 } компактна в U e , а все её предельные точки
принадлежат U e . Пусть v – любая предельная
точка
для {uk0 } . Тогда существует
{uk0m } с
lim u k0m = v в U e . По непрерывности функциоkm
налов a j (u ) , b j ( x (u ), u ) в U e при j = 0,n получаем при km   сходимости
k
k
доказывает B).
По доказанному в А) последовательность
{vk }  U e и компактна в U e , а любая её предельная точка v  U e0 . Тогда для v существует
a j (uk0m )  a j (v ) ,
{vk j } с lim vk j  v в U e , а по [1] lim vk j  v и в
b j ( x (uk0m ), uk0m )  b j ( x (v), v) .
kj
0
km
Так как g j ( x, u ) = a j (u )  b j ( x, u ) , то g j ( x(u ),
0
km
u )  g j ( x(v), v) . Но поскольку верны неравен0
km
лучаем lim e (uk0 ,U e0 ) = lim e (vk ,U e0 ) = 0 , что и
0
km
ства g j ( x(u ), u )  0 при j = 1, n , то в пределе
g j ( x(v ), v)  0 . Следовательно, любая предельная
точка v – допустимое управление в 0-задаче.
По теореме 2 {uk0 } – минимизирующая в 0-за-
kj
U . Из непрерывности функционала g0 ( x(u), u )
получаем g 0 ( x(v ), v) = lim g 0 ( x(vk j ), vk j ) . Но так
kj
как по А) v  U e0 , то g0 ( x(v ), v)  d0 . Отсюда
имеем
компактность
последовательности
{g 0 ( x(vk ), vk )} и, как нетрудно установить, число d0 есть ее единственный частичный предел.
lim g 0 ( x (vk ), vk )  d 0 .
даче. Тогда {uk0m } – тоже минимизирующая. Из не-
Следовательно,
прерывности функционала g0 ( x(u), u ) и lim uk0m =
образом, верно C), и теорема 4 доказана.
Замечание 2. Приближение v k можно получить каким-либо методом минимизации. Из
теоремы 4 получаем усиленную регулярность в
U e минимизирующей {uk0 } . Тогда с учетом
km
= v в KB-линеале U e получаем lim g 0( x(uk0m ),
km
0
km
u )  d 0 . Но
0
km
0
km
lim g 0 ( x(u ), u )  g 0 ( x(v), v) .
km
Отсюда g0 ( x(v ), v)  d0 . Так как предельная точка
v является e-ограниченным допустимым управлением в 0-задаче, то v будет оптимально в ней.
Следовательно, v  U e0 . Теорема 3 доказана.
k
Таким
терминологии [2] такую регулярность в U e
можно назвать e-регулярностью.
Рассмотрим
минимизацию функционала
(u ) на U 0 . Введём число n  inf (u ) . ПоuU 0
Порядковая сходимость
регуляризирующей последовательности
Теорема 4. Пусть 1) выполнены условия
теоремы 3; 2) для всех k  1 существует vk  D
при (vk  uk0 )  U e и vk  uk0  k , где k  0 .
e
скольку (u )  0 , то существует n  0 . Определим  -нормальное решение un0  U 0 как
(un0 )  n . Если же un0  U e0 , то un0 назовем
e -нормальным решением, а U e0,n – множест-
вом  e -нормальных решений.
215
Порядковая регуляризация в задаче оптимального управления
Теорема 5. Пусть выполнены условия теоремы 4. Тогда U e0, n  , и любая предельная в
0
k
U e точка последовательностей {u }, {vk } при-
надлежит U e0,n , и
t1

g 0 ( x, u ) = (a0 (u , t )  b0 ( x, t )) dt  inf,
t0
x = A( x, t )  B(t )u, x(t 0 ) = x0 , t  [t0 , t1 ],
(3)
t1

g j ( x , u )  ( a j (u , t )  b j ( x , t )) dt  0,
lim e (uk0 ,U e0, n ) = lim e (vk ,U e0, n ) = 0.
k
k
j = 1, N ,
t0
Доказательство. Согласно теоремам 3, 4
{u }, {vk } компактны в U e , а любая их предельная
0
k
где состояние x  X = C ([t0 , t1 ], R m ) , управление
дельная точка для {uk0} . Тогда существует {u k0m },
u  U = Ln2 [t0 , t1 ] , а все функции, входящие в задачу (3), достаточно гладкие. Здесь векторфункция e(t ) = (1,1,,1)T является единицей e
такая, что lim uk0m = u p в U e . Поскольку по [1] из
в KB-линеале Ln2 [t0 , t1 ] . Функционал (u ) мож-
сходимости в U e следует сходимость в U, то су-
(uk0m )  inf (u0 ) . Тогда в пределе (u p ) 
но взять, например, как (u ) = u в Ln2 [t0 , t1 ] . В
работе [4] приведены условия на функции задачи (3), при которых применимы теоремы 1–5. В
частности, это сведение дифференциальной задачи к интегральной форме, ограниченность по
норме в Ln2 [t0 , t1 ] допустимого множества
управлений и непрерывная дифференцируе-
 inf (u0 )  n . На основе теоремы 3 u p  U e0 .
мость функционалов
0
e
точка принадлежит U . Пусть u p – любая пре-
km
ществует lim uk0m = u p в U.
km
Из непрерывности
функционала ω(u ) в U получаем lim ω(u k0m ) =
km
= ω(u p ). На основе заключения III) теоремы 2
u0 U 0
u0U 0
Отсюда (u p )  n . Следовательно, любая для
{uk0} предельная точка u p будет e-ограниченным ω-нормальным решением. Поэтому
U e0,n   , а u p  U e0,n . По условию теоремы 4
uk0  vk  k , где  k  0 . Тогда lim || uk0 
e
k
vk ||e = 0 . По заключению A) теоремы 4
{vk }  U e и компактна в U e . Тогда нетрудно
показать, что {vk } имеет такие же предельные
точки, как и {uk0 } . Отсюда все предельные точки
для {vk } принадлежат U e0,n . Применяя лемму для
случаев sk  uk0 , sk  vk и множества Q  U e0,n ,
получаем lim e (uk0 ,U e0, n )  0 , lim e (uk0 ,U e0, n )  0 .
k
k
Теорема 5 доказана.
Вышеизложенная теория порядковой регуляризации применима к 0-задаче оптимального
управления:
2
t1

t1
a j ( u , t ) dt и
t0
при
 b ( x, t )) dt
j
t0
j = 0, N . Для U = Ln2 [t0 , t1 ] пространство
U e = Ln [t0 , t1 ] . Поэтому сходимость регуляризи-
рующей последовательности будет в Ln [t0 , t1 ] ,
то есть в более сильной метрике по сравнению с
Ln2 [t0 , t1 ] .
Список литературы
1. Вулих Б.З. Введение в теорию полуупорядоченных пространств. М.: Физматгиз, 1961. 407 с.
2. Васильев Ф.П. Методы оптимизации. М.: Факториал пресс, 2002. 824 с.
3. Кларк Ф. Оптимизация и негладкий анализ. М.:
Наука, 1988. 280 с.
4. Калашников А.Л. Аппроксимация и ограниченность оптимального множества управлений для динамической системы // Вестник ННГУ. Математическое
моделирование и оптимальное управление. 2003.
Вып. 1(26). С. 138–141.
ORDINAL REGULARIZATION IN AN OPTIMAL CONTROL PROBLEM
A.L. Kalashnikov
An optimal control problem in a KB-lineal with unit e is considered. Based on the Tikhonov method, a regularizing
sequence is built. The conditions of its order convergence to the set of optimal controls are given in the KB-lineal of
e-limited elements.
Keywords: optimal control, KB-lineal, regularization, order convergence.
Документ
Категория
Без категории
Просмотров
4
Размер файла
279 Кб
Теги
оптимальное, регуляризация, порядков, управления, задачи
1/--страниц
Пожаловаться на содержимое документа