close

Вход

Забыли?

вход по аккаунту

?

Сходимость конечномерной регуляризирующей последовательности для задачи оптимизации в пространстве порядковоограниченных элементов.

код для вставкиСкачать
Математическое моделирование и оптимальное управление
Вестник Нижегородского
им. Н.И.
Лобачевского, 2007,
№задачи
2, с. 181–185
Сходимость
конечномерной университета
регуляризирующей
последовательности
для
оптимизации
181
УДК 519.6
СХОДИМОСТЬ КОНЕЧНОМЕРНОЙ РЕГУЛЯРИЗИРУЮЩЕЙ
ПОСЛЕДОВАТЕЛЬНОСТИ ДЛЯ ЗАДАЧИ ОПТИМИЗАЦИИ
В ПРОСТРАНСТВЕ ПОРЯДКОВООГРАНИЧЕННЫХ ЭЛЕМЕНТОВ
 2007 г.
А.Л. Калашников
Нижегородский госуниверситет им. Н.И. Лобачевского
аllk123@yandex.ru
Поступила в редакцию 19.02.2007
Рассматривается задача оптимального управления в КВ-линеале с единицей e . Пространство
управлений аппроксимируется конечномерными подпространствами. На основе метода А.Н.Тихонова
приводятся условия порядковой сходимости конечномерной регуляризирующей последовательности к
оптимальному множеству управлений в КВ-линеале e -ограниченных элементов.
Введение
ной задачи оптимизации в U e . Это связано с
В работе рассматривается задача минимизации функционала при операторном и функциональных ограничениях на состояние x и управление u . Пространство управлений U здесь
КВ-линеал с единицей e . Отметим, что к такой
постановке приводят многие задачи оптимального управления, в которых банахово пространство управлений является и полуупорядоченным пространством. Например, задача оптимального управления динамической системы с
интегральными ограничениями и интегральным
целевым
функционалом,
в
которой
тем, что хотя в U и может быть корректность,
но в более «узком» пространстве U e она может
отсутствовать. Тем более подобное относится к
тому случаю, когда в U задача оптимизации
некорректна. Рассмотрим пример такой задачи
оптимального управления:
U=
Ln2 [t0 , t1 ] ,
а за e берётся вектор-функция
e(t ) = (1,1, K ,1) T . Как известно [1], в КВлинеале с единицей можно ввести КВ-линеал
e -ограниченных элементов U e . При этом из
сходимости в U e следует сходимость в U к
тому же пределу, что означает более сильную
метрику в U e , чем в U . Если априорно для
1
2
2
∫ ( x (t ) + u (t )) dt → inf ,
0
1
x& (t ) = u(t ), x (0) = 0, t ∈ [0;1], ∫ u 2 (t )dt ≤ 1, (1)
0
где u ∈ L2 [0;1] , а x ∈ C[0;1] . Как нетрудно
показать, здесь единственное оптимальное
управление u 0 (t ) ≡ 0 и соответствующее состояние x 0 (t ) ≡ 0 . Очевидно, u 0 ∈ L∞ [0;1] .
Тем самым u 0 ∈ U e = L∞ [0;1] , где e(t ) ≡ 1 .
Пусть {u k } – любая минимизирующая последовательность в задаче (1). Тогда, поскольку inf
U 0 – оптимального множества управлений ис- в ней равен нулю, имеем
ходной задачи будет U 0 ⊂ U e или, хотя бы,
U e I U 0 ≠ ∅ , то целесообразно строить минимизирующие последовательности, сходящиеся
0
ко множеству U в метрике U e . Возможно
также в этом случае при наличии такой априорной информации сузить пространство управлеn
ний до U e . Так для U = L2 [t 0 , t1 ] подлинеал
Ue =
Ln∞ [t 0 , t1 ] и сходимость в
1
lim ∫ ( xk2 (t ) +
k 0
+ uk2 (t ))dt = 0 . Отсюда, вследствие положи1
тельности слагаемых, lim ∫ uk2 (t )dt = 0 . Поэтому
k 0
lim uk = 0 в L2 [0;1] . Поскольку расстояние
k
между точкой и множеством [2] здесь равно
ρ(u k , U 0 ) = u k
в
L2 [0;1] ,
то
предел
U e будет п.в.
lim ρ(u k , U 0 ) = 0 , где U 0 = {u 0 = 0} . Таким
k
равномерная. Но при замене пространства U
образом,
на основе [2] задача (1) корректна в
на U e возникает вопрос о корректности исход-
182
А.Л. Калашников
L2 [0;1] . Возьмём теперь последовательность линеалом с единицей e . Функционалы g 0 , g j
1
u k (t ) , как u k (t ) ≡ 0 на 0;1 − 1  и u k (t ) ≡ k 4
k

 1 
на 1 − ;1 . Очевидно,
 k 
uk
1
∫u
2
k
(t )dt = k
−
1
2
<1 и
и операция F класса C на X × U . В дальнейшем будем называть U пространством
управлений, а X – пространством состояний.
Пусть для всех u ∈ U уравнение F ( x, u ) = 0
1
имеет единственное решение x = x (u ) класса
0
– допустимое управление. Траектория
t
C 1 . Такое, в частности, будет при выполнении
условий теоремы о существовании неявной
xk (t ) = ∫ uk (τ )dτ и x k (t ) ≡ 0 на 0;1 −  и функции в банаховом пространстве. Тогда 0k

1
0
задача сводится к задаче минимизации функ-
1
4
g 0 ( x(u ), u )
с
ограничениями
ционала
1
 1 
x k (t ) = k (t − 1 + ) на 1 − ;1 . Нетрудно
k
 k 
g j ( x(u ), u ) ≤ 0 , j = 1, n , u ∈ U . Очевидно,
5
1
показать, что ∫ xk2 (t )dt =
0
1 −2
k
и, тем самым,
3
1
2
2
lim ∫ ( x k (t ) + u k (t ))dt = 0 . Поэтому последоk
0
вательность u k – минимизирующая в задаче
(1). В L∞ [0;1] норма || uk || =
= || uk ||=
1
k4
1
k4
и ρ ( uk , U 0 ) =
, а lim ρ (uk ,U 0 ) = ∞ . Следовательk
но, задача (1) некорректна в L∞ [0;1] .
Для некорректных задач оптимизации разработаны методы регуляризации [2]. В настоящей
работе на основе метода А. Н. Тихонова строится
регуляризирующая
последовательность
{u k } , когда пространство U аппроксимируется конечномерными пространствами U k ⊂ U .
При этом {u k } ⊂ U k и сходится по расстоянию
кU
0
в метрике U e . Приведены также условия,
когда U ⊂ U e , то есть e -ограниченность оптимальных управлений. Отметим, что такая
усиленная (в порядковом смысле) регуляризация получена без стабилизатора.
0
Порядковая ограниченность
оптимального множества
Рассматривается 0-задача:
все функционалы g j ( x (u ), u ) для
j = 0, n
1
непрерывны и класса C на U . Предположим
также, что D0 ≠ ∅ , где D0 – допустимое множество управлений в 0-задаче, и существует
некоторое множество S ⊂ U , для которого
D0 ⊂ S . Например, такое S может быть получено на основе одного из неравенств
g j ( x(u ), u ) ≤ 0 . Обозначим U 0 множество
оптимальных управлений в 0-задаче, и пусть
U 0 ≠ ∅ . Достаточные условия этого имеются,
например, в [2]. Очевидно, для оптимального
управления u 0 ∈ U
0
оптимальное состояние
x0 = x(u 0 ) .
Исходная 0-задача может быть некорректна
или в пространстве U , или в более «узком»
подпространстве при наличии дополнительной
информации об оптимальном управлении. Поэтому в таком случае применяются методы регуляризации. Используем здесь метод А.Н. Тихонова [2]. Определим для k = 1, ∞ функции
А.Н. Тихонова:
Tk ( x(u ), u ) = g 0 ( x(u ), u ) + α k ω(u ), u ∈ U ,
где функционал ω(u ) ≥ 0 на U и класса C , а
1
числовая последовательность α k → +0 . Пусть
в пространстве U существует линейнонезависимая система из элементов hi ∈ U при
g 0 ( x, u ) → inf ,
i = 1, ∞ , а множества U k – линейная оболочка
F ( x, u ) = 0, g j ( x, u ) ≤ 0,
для элементов h1 , h2 , K , hk . Очевидно, U k с
x ∈ X , u ∈ U , j = 1, n.
Здесь операция F : X × U → Z , где X , Z –
банаховы пространства, а U является КВ-
той же нормировкой, что и в U , будет конечномерным банаховым подпространством. При
этом сходимость по норме эквивалентна сходимости по координатам, а ограниченность по
183
Сходимость конечномерной регуляризирующей последовательности для задачи оптимизации
норме эквивалентна ограниченности по координатам [3]. Введём k -задачи:
Tk ( x(u ), u ) → inf ,
2)
существует
линейный
всех u , v ∈ S и λ j ≥ 0 с
g j ( x(u ), u ) ≤ 0, j = 1, n, u ∈ U k .
оператор
B > 0 : U * → U с Ba ∈ U e , такой, что при
n
∑ λ j = 1 верно неj =0
Очевидно, в любой k -задаче допустимое
множество управлений определяется как
Dk = D0 I U k . Пусть D1 ≠ ∅ . Тогда по вклю-
равенство | u − v | ≤ B | qu′ (u , λ ) − qu′ (v, λ ) |;
чению U k ⊂ U k +1 будет Dk ⊂ Dk +1 и, значит,
ствует
все Dk ≠ ∅ . Отметим, что D1 ≠ ∅ , например,
в случае, если u = 0 является внутренней точкой множества D0 . Такое, опираясь на непрерывность функционалов g j ( x (u ), u ) , в частности, будет при g j ( x (0),0) < 0 , j = 1, n .
Пусть теперь g j ( x, u ) = a j (u ) + b j ( x, u ) для
j = 0, n , где a j (u ) , b j ( x, u ) – некоторые
функционалы класса C на X × U . Предполо1
3) для некоторого управления w ∈ S суще*
λ ≥0
n
с
*
∑λj =1,
что
j =0
*
Lu′ ( x( w), w, λ ) = 0 .
Тогда I) управление w будет e -ограничено,
если выполнено условие (4). Существуют числа
α, β, γ > 0 , для которых 0 < Ba < β e ,
| p ′j ,u (0) |≤ αa , | c′j,u ( x(u), u) |≤ γa , где j = 0, n ,
а u ∈ S тогда верно II): модуль | w |≤ ( γ + α)βe .
Приведём теперь достаточные условия, когда оптимальные управления в 0-задаче и
k-задачах будут e -ограничены.
*
жим также, что сопряженное пространство U
является КВ-линеалом с единицей a . Введём
U e – КВ-линеал e -ограниченных элементов в
U , а U a* – КВ-линеал a -ограниченных эле*
ментов в U . Обозначим
⋅
e
– норму в U e , а
Теорема 1. Пусть 1) для всех u ∈ S функ*
ционалы b ′j ,u ( x (u ), u ) , a ′j ,u (0) ∈ U a , j = 0, n ;
2)
существует
линейный
оператор
B1 > 0 : U * → U с B1a ∈ U e , такой, что при
n
∑λ
– норму в U . Как определяются эти
a
нормы, описано в [1]. На основе [1] получаем,
что из сходимости последовательности в U e
всех u , v ∈ S и чисел λ j ≥ 0 с
следует и сходимость в U к тому же пределу.
ϕ(u , λ ) = ∑λ j a j (u ) , а вектор λ ∈ R n +1 .
⋅
*
a
*
Аналогичное же относится и к U a . Поэтому
функционалы, непрерывные в U , будут непрерывны и в U e . Тем самым g j ( x (u ), u ) , ω(u )
при j = 0, n непрерывны в U e . Далее | ⋅ | –
j
= 1 бу-
j =0
дет | u − v |≤ B1 | ϕ′u (u , λ ) − ϕ′u (v, λ ) |, где
n
j =0
Тогда a) любое оптимальное управление u 0
в 0-задаче будет e -ограничено, а если выполнено
условие
3):
существуют
числа
α 1 , β1 , γ 1 > 0 , для которых при всех u ∈ S
p j (u ) , c j ( x, u ) , будет
0 < B1 a ≤ β1e ,
| a ′j ,u (0) |≤ α 1 a ,
1
j = 0, n – некоторые функционалы класса C
| b ′j ,u ( x(u ), u ) |≤ γ 1 a , то верно b): модуль
модуль элемента. Пусть
на X × U и s j ( x, u ) = p j (u ) + c j ( x, u ) . Введём
для u ∈ U и λ = (λ0 , λ1 ,K, λn ) ∈ R
n +1
функ-
n
ционалы q(u, λ ) = ∑ λ j p j (u ) , L( x (u ), u, λ ) =
j =0
n
= ∑ λ j s j ( x (u ), u ) , которые, очевидно, класса
j =0
1
C на U .
Лемма. Пусть 1) для всех u ∈ S функциона*
лы c ′j ,u ( x (u ), u ) , p ′j ,u (0) ∈ U a , где
| u 0 |≤ ( γ 1 + α1 )β1e .
j = 0, n ;
Замечание 1. В теореме 1 приводятся достаточные условия, когда множество U 0 ⊂ U e ,
а по заключению b) содержится в некотором
порядковом отрезке. Тем самым теорема 1
приводит априорную информацию об оптимальных управлениях 0-задачи: их e -ограниченность. Поэтому возникает вопрос о локализа0
ции области поиска U и построении минимизирующих последовательностей, регулярных в
184
А.Л. Калашников
более сильной метрике пространства U e . При
этом целесообразно использовать регуляризацию, поскольку, как показывает пример введения, задача оптимизации в U e может быть
некорректной.
Пусть теперь функции Tk ( x(u), u) = a0,k (u) +
+ b0,k ( x (u ), u ) ,
где
a 0,k (u ) = a 0 (u ) ,
при
Теорема 3. Пусть выполнены условия 1), 2)
теоремы 2 и 1) для всякой последовательности
{vk } ⊂ S , последовательности b0,′ k ,u ( x (vk ), vk ) ,
b ′j ,u ( x(v k ), v k ) , где j = 1, n , компактны в U a* ;
∞
2) замыкание U U k = U ; 3) множество D0
k =1
или
ограничено по норме в U . Тогда A) в любой k задаче существует оптимальное управление
a 0, k (u ) = a 0 (u ) + α k ω(u ) , если b0,k ( x (u ), u ) =
u k0 ∈ U e ; B) последовательность {u k0 } ком-
= b0 ( x (u ), u ) . Отметим, что такое представление зависит от свойств регуляризатора ω(u ) ,
связанное с условиями 1), 2) нижеследующих
теорем 2, 3.
пактна в U e и минимизирующая в 0-задаче, а
b0,k ( x(u ), u ) = b0 ( x(u ), u ) + α k ω(u )
любая её предельная точка будет e -ограниченным оптимальным управлением в 0-задаче и
0
0
существует lim g 0 ( x (u k ), u k ) = d 0 .
k
Введем расстояние между элементом u ∈ U e
Теорема 2. Пусть в любой k -задаче существует оптимальное управление u и 1) для всех
и
u ∈ S функционалы b ′j ,u ( x(u ), u ) , a ′j ,u (0) ∈
= inf u − v
0
k
∈ U a* ,
j = 1, n
при
и
b0,′ k ,u ( x(u ), u ) ,
a 0,′ k ,u (0) ∈ U a* ; 2) существует линейный опера-
множеством
при всех u , v ∈ S и чисел λ j ≥ 0 с ∑ λ j = 1
j =0
будет | u − v |≤ B2 | θu′ (u, λ ) − θu′ (v, λ ) |, где θ (u, λ ) =
n
n +1
.
= λ0a0,k (u ) + ∑ λ j a j (u ) , а вектор λ ∈ R
0
Тогда a) управление u k будет e -ограничено,
а если выполнено условие 3): существуют числа
α 2 , β 2 , γ 2 > 0 , для которых 0 < B2 a ≤ β 2 e и
при
u∈S
всех
модули
ρ e (u , Q ) =
v ∈ Q . Обозначим
всем
Теорема 4. Пусть выполнены условия теоремы 3. Тогда C) множество
U e0 ≠ ∅
и
lim ρ e (u , U ) = 0 . Если же для всех k ≥ 1
0
k
k
0
e
существует
vk ∈ Dk
аппроксимация
( vk − uk0 ) ∈ U e и vk − uk0
j =0
как
U e0 = U e I U 0 – множество e -ограниченных
оптимальных управлений в 0-задаче.
тор B2 > 0 : U * → U с B2 a ∈ U e , такой, что
n
по
e
Q ⊂ Ue ,
e
с
≤ ε k , где ε k → +0 ,
то D) последовательность {v k } ⊂ U e , компактна в U e и минимизирующая в 0-задаче,а
0
любая её предельная точка принадлежит U e и
′ k ,u (0) | , пределы
| a 0,
0
lim g0 ( x (vk ), vk ) = d 0 , lim ρ ( vk ,U e ) = 0 .
| a ′j ,u (0) |≤ α 2 a , и | b0,′ k ,u ( x(u ), u ) | , | b′j ,u ( x (u ),
u ) |≤ γ 2 a , то верно b): модуль | uk0 |≤ (γ 2 +
+ α2 )β 2e .
Сходимость регуляризирующей
последовательности
k
k
Замечание 2. Здесь приближение v k можно получить каким-либо численным методом
оптимизации в конечномерном пространстве.
Отметим также, что если базисные элементы
hi будут e -ограничены, то приближение по
координатам осуществляет и приближение по
Приведём условия, когда существует u
0
k
в
0
k
k -задаче, {u } является минимизирующей для
0-задачи
U e0
и
сходится
по
расстоянию
к
0
= U I U e в пространстве U e , что, тем
самым, осуществляет усиленную регулярность
{u k0 } . Далее, число d o есть inf в 0-задаче.
норме ⋅
e
.
Определим, как обычно [2], для 0-задачи ω
– нормальное решение u~0 = arg min ω(u ) по
~
0
всем u ∈ U . Обозначим U 0 множество ω ~
~
нормальных решений, а U e0 = U 0 I U e – множество e -ограниченных ω -нормальных реше-
Сходимость конечномерной регуляризирующей последовательности для задачи оптимизации
ний. Введём также wk = arg min u − v
всем v ∈ Dk , где
⋅
по
где состояние x ∈ X = C ([t0 , t1 ], R m ) , управле-
– норма в пространстве
ние u ∈ U = Ln2 [t0 , t1 ] , а все функции, входящие
в задачу (2), достаточно гладкие. Здесь единица
U . Согласно [2], wk = PDk (u ) является проекцией элемента u на множество Dk . Очевид0
но, управление u~0 ∈ U , а проекция wk ∈ Dk .
Теорема 5. Пусть выполнены условия теоремы 4. Тогда E) для любого u ∈ D0 существует wk = PDk (u ) и lim PDk (u ) = u . Если же
k
существует
185
числовая
последовательность
e(t ) = (1,1,K,1)T .
Функционал ω(u ) можно взять, например, как
e
есть
ω(u ) = u
вектор-функция
2
n
в L2 [t 0 , t1 ] . На основе работы [4]
возможны и другие выборы ω(u ) и функций
задачи (2), при которых выполняются условия
теорем статьи, применительно к задаче (2). Для
U = Ln2 [t 0 , t1 ] пространство U e = Ln∞ [t 0 , t1 ] .
Поэтому сходимость e -регулярной последоваn
тельности будет в L∞ [t 0 , t1 ] , то есть более
γk
= 0 , такая, что PDk (u) − u ≤
k αk
≤ γ k для всех u ∈ D0 и равномерно по u ∈ U с сильной метрике, чем в Ln [t , t ] . Отметим,
2 0 1
γ k → +0 с lim
′ u ( x (u ), u ) ≤ const , то F)
u ≤ const будет g 0,
любая предельная точка последовательностей
{u k0 } , {v k } является e -ограниченным ω ~
нормальным решением, множество U e0 ≠ ∅ и
~
~
пределы lim ρ e (uk0 ,U e0 ) = lim ρ e (vk ,U e0 ) = 0.
k
k
вектор-функции hi (t ) полиномиального типа,
линейная оболочка которых, как известно, всюn
Замечание 3. Здесь на основе теорем 4, 5
получаем регулярность в метрике U e минимизирующей последовательности, построенной
по методу регуляризации А.Н. Тихонова. Тогда,
по терминологии [2], регулярность в U e можно назвать e -регулярностью.
Вышеизложенные результаты статьи применимы к задаче оптимального управления:
t1
∫ ( a0 (u, t ) + b0 ( x, t )) dt → inf ,
t0
x& ( t ) = A( x, t ) + B ( t )u, x (t0 ) = x0 , t ∈ [t0 , t1 ],
t1
∫ ( a j (u, t ) + b j ( x, t )) dt ≤ 0, j = 1, N ,
что при интегрировании дифференциального
уравнения мы получаем задачу (2) с операторным ограничением в интегральной форме [2].
В нашем случае за hi можно взять, например,
(2)
ду плотна в пространстве L2 [t 0 , t1 ] .
Список литературы
1. Вулих Б.З. Введение в теорию полуупорядоченных пространств. – М.: Физматгиз, 1961. – 407 с.
2. Васильев Ф.П. Методы решения экстремальных задач. – М.: Наука, 1981. – 400 с.
3. Вулих Б.З. Введение в функциональный анализ. – М.: Наука, 1967. – 416 с.
4. Калашников А.Л. Усиленная регуляризация в
методе А.Н. Тихонова для задачи оптимального
управления // Вестник ННГУ. Серия Математическое
моделирование и оптимальное управление. – Н. Новгород: Изд-во ННГУ, 1997. – С. 104–107.
t0
CONVERGENCE OF THE FINITE-DIMENSIONAL REGULARIZING SEQUENCE
FOR THE PROBLEM OF OPTIMIZATION IN THE SPACE OF e -LIMITED ELEMENTS
A.L. Kalashnikov
We consider the problem of optimal control in a KB-lineal with unit e . The space of controls is approximated
by finite-dimensional subspaces. Based on the Tikhonov method, we present the conditions for e -convergence of
the finite-dimensional regularizing sequence to a set of optimal controls in the KB-lineal of e -limited elements.
1/--страниц
Пожаловаться на содержимое документа