close

Вход

Забыли?

вход по аккаунту

?

Параметрическая задача субоптимального управления системой Гурса--Дарбу с поточечным фазовым ограничением.

код для вставкиСкачать
2005
ИЗВЕСТИЯ ВЫСШИХ УЧЕБНЫХ ЗАВЕДЕНИЙ
МАТЕМАТИКА
Є 6 (517)
УДК 517.977
В.С. ГАВРИЛОВ, М.И. СУМИН
ПАРАМЕТРИЧЕСКАЯ ЗАДАЧА СУБОПТИМАЛЬНОГО
УПРАВЛЕНИЯ СИСТЕМОЙ ГУРСА{ДАРБУ
С ПОТОЧЕЧНЫМ ФАЗОВЫМ ОГРАНИЧЕНИЕМ
Введение
Основным предположением теории необходимых условий оптимальности в задачах оптимального управления традиционно является предположение о существовании оптимального
элемента, каковым может служить как обычное, т. е. измеримое по Лебегу, так и обобщенное
управление [1], [2]. Как известно [3], в случае обычного оптимального управления именно это обстоятельство привело к словосочетанию \наивная теория оптимального управления". Заметим,
что для задач оптимального управления обыкновенными дифференциальными уравнениями, а
также полулинейными уравнениями в частных производных существование оптимальных обобщенных [1], [2] элементов дается \практически даром". Естественно, постулирование факта
существования сопряжено с наложением весьма жестких условий на исходные данные задач.
В то же время специфика управляемых распределенных систем такова, что несуществование обычных оптимальных управлений и одновременно невозможность расширения задачи в
каком-либо естественном смысле (А.Ф. Филиппов, Л. Янг, Р.В. Гамкрелидзе, Дж. Варга) представляет собой их типичное свойство, которым они существенно отличаются от управляемых
систем обыкновенных дифференциальных уравнений. Содержательные примеры таких задач
многочисленны и, например, в случае управляемой системы Гурса{Дарбу могут быть найдены
в [4], [5]. Анализ подобного примера для задачи оптимизации системы Гурса{Дарбу с поточечным фазовым ограничением приводится в заключительной части данной работы. Этот анализ, а
также анализ многих других аналогичных примеров (напр., [4], [5]) позволяет заключить, что в
общем нелинейном случае системы Гурса{Дарбу ее нельзя расширить в смысле А.Ф. Филиппова,
Л. Янга, Р.В. Гамкрелидзе, Дж. Варги. Поэтому изучаемая в данной работе задача с поточечным фазовым ограничением принципиально отличается от задач с аналогичным ограничением
работ [6], [7].
По этой причине естественным представляется построение теории субоптимального управления системами с распределенными параметрами, т. е. оптимизационной теории для таких
систем. Эта теория не основывается на факте существования оптимальных элементов. В ней в
качестве основного (искомого) объекта рассматривается не оптимальный элемент, а минимизирующая последовательность (м. п.) обычных допустимых управлений. Различные аспекты
теории субоптимального управления, в том числе и с поточечными фазовыми ограничениями,
в случае управляемых распределенных систем рассматривались ранее в [4], [6]{[10].
В данной работе рассматривается так называемая параметрическая задача субоптимального
управления [4], [6], [7], [9], [10], т. е. семейство зависящих от параметра задач субоптимального
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований
(проекты ЄЄ 01-01-00979, 04-01-00460) и конкурсного центра фундаментального естествознания при
Санкт-Петербургском государственном университете (проект Є Е02-1.0-173).
40
управления. Этот параметр является функциональным и аддитивно входит в поточечное фазовое ограничение задачи. Изучение параметрических задач в соответствии с общей идеологией
метода возмущений (напр., [11], с. 263) дает возможность получать информацию \в целом" о
семействе и, как следствие, во многих важных частных случаях о каждой конкретной задаче
отдельно.
В свою очередь, изучение параметрических задач субоптимального управления естественным образом подводит к целесообразности изучения в качестве м. п. так называемых минимизирующих приближенных решений (м. п. р) в смысле Дж. Варги [2]. Oни характеризуются, в
частности, тем, что их элементы удовлетворяют ограничениям лишь \в пределе" и порождаемая
именно таким понятием м. п. функция значений в самой общей ситуации является полунепрерывной снизу1 . Данное обстоятельство позволяет применить к исследованию оптимизационных
задач аппарат негладкого анализа, а именно, анализа нормалей (проксимальных нормалей,
нормалей Фреше) к замкнутым множествам в банаховых пространствах и обобщенного дифференцирования негладких (полунепрерывных снизу) функций в банаховых пространствах (напр.,
[12]{[14]).
Библиография по теории оптимального управления системами Гурса{Дарбу насчитывает
десятки работ (напр., [15], [16]). При этом задачи с поточечными фазовыми ограничениями рассматривались, по-видимому, лишь в монографии [16] и только с точки зрения классических
условий оптимальности. Применяемый в данной работе подход [4], [6], [7], [9], [10] позволяет
изучить много вопросов теории оптимизации, которые ранее не рассматривались в оптимальном управлении гиперболическими уравнениями и, в частности, системами Гурса{Дарбу. К ним
относятся вопросы, связанные с необходимыми и достаточными условиями для м. п. р., с необходимыми и достаточными условиями регулярности, нормальности задач, с дифференциальными
свойствами функций значений (чувствительность) и др. Из-за ограниченности объема статьи
здесь рассматривается только часть этих вопросов.
1. Постановка задачи
Рассмотрим параметрическую задачу оптимального управления системой Гурса{Дарбу с
поточечным фазовым ограничением
I0 (u) ! inf ; I1 (u) 2 M + q; u 2 D; q 2 C (X ) | параметр;
(Pq )
где D fu 2 Lm1 () : u(x; y) 2 U п. в. в g, U Rm | компакт, [0; a] [0; b], (xj ; yj ),
j = 1; : : : ; l, | фиксированный набор точек, M | множество всех непрерывных неположительPl
ных на компакте X функций, I0 (u) G(z [u](xj ; y j )), I1 (u)(; ) (; ; z [u](; )), z [u] |
j =1
соответствующее управлению u 2 D абсолютно непрерывное решение нелинейного векторного
гиперболического уравнения (z (z1 ; : : : ; zn ) 2 Rn , zx p, zy r)
zxy = f (x; y; z; zx ; zy ; u(x; y)); z (x; 0) = '1 (x); z (0; y) = '2 (y):
(1.1)
Предположим, что функции f : Rn Rn Rn U ! Rn , G : Rn ! R вместе с якобианами rz f ,
rpf , rr f и градиентом rz G измеримы в смысле Лебега по (x; y) и непрерывны по (z; p; r; v);
функция : Rn ! R и градиент rz непрерывны по (x; y; z ); функции '1 : [0; a] ! Rn и
'2 : [0; b] ! Rn липшицевы, причем '1 (0) = '2 (0). Предположим также, что справедлива оценка
jf j + jrz f j + jrp f j + jrr f j N (M ) 8(x; y; z; p; r; v) 2 SMn SMn SMn U;
(1.2)
1 Заметим, что функция значений, порождаемая классическим понятием м. п., элементы которой удовлетворяют ограничениям в точном смысле, таким свойством, вообще говоря, не обладает [9]. Кроме того,
важно отметить, что м. п. р. a) всегда существует, b) позволяет записывать все результаты в терминах
расширенной [1], [2] задачи, если такое расширение вообще возможно, c) адекватно теории численных
методов, d) удобно с прикладной (инженерной) точки зрения (подробности см., напр., в [2]).
41
где SMn fx 2 Rn : jxj < M g, N (M ) | некоторая функция аргумента M > 0, и для любого
управления u 2 D существует единственное абсолютно непрерывное решение z [u] задачи (1.1),
причем
jz[u]j(0)
(1.3)
+ kzx [u]k1; + kzy [u]k1; K 8u 2 D;
где K > 0 | постоянная, не зависящая от управления u 2 D. Здесь и ниже используются
следующие обозначения: k'kp; | норма в пространстве Lnp () суммируемых на с p-й степенью
(существенно ограниченных при p = 1) функций ' : ! Rn ; j'j(0)
| норма в пространстве
Cn () непрерывных на функций ' : ! Rn .
Замечание 1.1. Условия на правую часть f уравнения (1.1), достаточные для выполнимости требований (1.2), (1.3), можно найти, например, в [18].
Введем на множестве D метрику Экланда d(u1 ; u2 ) mesf(x; y) 2 : u1 (x; y) 6= u2 (x; y)g,
превратив его тем самым в полное метрическое пространство. Согласно [2] минимизирующим
приближенным решением (м. п. р.) в задаче (Pq ) называется такая последовательность управлений ui 2 D, i = 1; 2; : : : , что
i
I0 (ui ) (q) + i ; ui 2 Dq" ; i ; "i 0; i ; "i ! 0; i ! 1;
(1.4)
где Dq" fu 2 D : (I1 (u); M + q) "g, (I; M + q) xinf
jx + q ; I j(0)
X , (q ) +0 (q ) 2M
"
"
lim (q) 0 (q), " (q) fuinf
I (u), если Dq 6= ;; +1, если Dq = ;g. При этом функцию
"!+0 "
2Dq" 0
: C (X ) ! R [ f+1g принято называть функцией значений задачи (Pq ). Функция является
полунепрерывной снизу [7].
2. Принцип максимума
Введем обозначения: H (x; y; z; p; r; v; ) = h; f (x; y; z; p; r; v)i, (z; zx ; zy ),
u f ( [u]; u1 (; ); u2 (; )) f (; ; [u1 ](; ); u1 (; )) ; f (; ; [u2 ](; ); u2 (; ));
rz H [u](x; y; ) rz H (x; y; z[u](x; y); zx [u](x; y); zy [u](x; y); u(x; y); );
и т. п., h; i | знак скалярного произведения. Обозначим также через x;y (; ) характеристическую функцию прямоугольника [0; x] [0; y]. Из результатов работы [18] непосредственно вытекает
Лемма 2.1. Для любых двух управлений v; u 2 D справедлива оценка
1
2
jz[v] ; z[u]j(0)
+ kzx [v] ; zx [u]kp; + kzy [v] ; zy [u]kp; C1 ku f ( [u]; u (; ); u (; ))kp; ;
где C1 > 0 зависит лишь от p, 1 p < 1.
Для любого управления u 2 D существует единственное в Ln1 () решение 0 [u] сопряженной
задачи
Z aZ b
Zb
(x; y) =
rz H [u](1 ; 2 ; (1 ; 2))d1 d2 + rpH [u](x; 2 ; (x; 2 ))d2 +
x y
y
Za
l
X
+ rr H [u](1 ; y; (1 ; y))d1 ; rz G(z [u](xj ; y j ))xj ;yj (x; y):
x
j =1
Это решение равномерно ограничено в Ln1 () и равномерно непрерывно в норме Lnp () зависит
от u 2 D при любом 1 p < 1. Сверх того, функционал I0 : D ! R и оператор I1 : D ! C ()
также равномерно непрерывны.
Пусть M () | пространство мер Радона, сосредоточенных на , а kk | полная вариация
меры 2 M ().
42
Лемма 2.2 ([4]). Для любой меры Радона 2 M () и любого управления u 2 D существует
единственное в классе Ln1 () решение 1 [u; ] уравнения
Z aZ b
Zb
(x; y) =
rz H [u](1 ; 2 ; (1 ; 2))d1 d2 + rpH [u](x; 2 ; (x; 2 ))d2 +
x y
y
Zb
Z aZ b
+ rr H [u](1 ; y; (1 ; y))d1 ;
rz (1; 2; z[u](1 ; 2))(d1 d2); (2.1)
y
x
y
причем 2 Ln1 (). Это решение равномерно непрерывно в норме Ln1 () зависит от u 2 D,
2 M () и справедлива оценка k1 [u; ]k1; C2 kk, в которой C2 > 0 не зависит от u 2 D,
2 M ().
k
Теорема 2.1 (принцип максимума для м. п. р.). Пусть (q ) < +1. Если u 2 D , k = 1; 2; :::,
есть м. п. р. в задаче (Pq ), то найдутся сходящаяся к нулю последовательность чисел k 0,
последовательность чисел k0 0 и последовательность сосредоточенных на множестве k f(x; y) 2 X : j(x; y; z[uk ](x; y)) ; q(x; y)j k g неотрицательных атомических мер Радона
k 2 M (), k = 1; 2; : : : , такие, что
uk 2 Dq ; k0 + kk k = 1;
Z
fmax
H (x; y; [uk ](x; y); v; [uk ; k ; k0 ](x; y)) ;
v 2U
k
; H (x; y; [uk ](x; y); uk (x; y); [uk ; k ; k0 ](x; y))gdx dy k ;
(2.2)
(2.3)
где [u; ; ] 0 [u] + 1 [u; ].
0
Замечание 2.1. Из теоремы 2.1 следует, что если управление u0 2 Dq таково, что I0 (u) =
k
k
(q), то оно удовлетворяет обычному принципу максимума (0 0 , , k = 0).
Несколько видоизменяя рассуждения приводимого ниже доказательства теоремы 2.1, можно
показать, что такой же обычный принцип максимума справедлив и для такого управления
u0 2 Dq0 , что I0 (u) = 0 (q).
Приведем кратко схему доказательства принципа максимума [19]. Пусть uk , k = 1; 2; : : : , |
м. п. р. в задаче (Pq ). Рассмотрим вспомогательную задачу
J (u) ! inf ; u 2 D;
(2.4)
где J (u) maxfI0 (u) ; (q), (x; y; z [u](x; y)) ; q(x; y), (x; y) 2 X g. Очевидно, последовательность
uk является одновременно минимизирующей и для задачи (2.4) с нулевой нижней гранью. Пусть
Xk f(xk;j ; yk;j ) : j = 1; : : : ; lk g X | 1=k-сеть в X . Рассмотрим семейство вспомогательных
задач Jk (u) ! inf, u 2 D, где Jk (u) maxfI0 (u) ; (q); (x; y; z [u](x; y)) ; q(x; y), (x; y) 2 Xk g.
В силу леммы 2.1 функционал Jk () непрерывен и ограничен на D и, как нетрудно показать,
пользуясь равномерной ограниченностью и равностепенной непрерывностью семейства fz [u] :
u 2 Dg C (), имеет место предельное соотношение
lim inf J (u) = uinf
J (u) = klim
J (uk ) = 0:
2D
k!1 u2D k
!1
Отсюда следует, что найдется такая последовательность k 0, k = 1; 2; : : : , k ! 0, k ! 1,
что Jk (uk ) uinf
J (u) + k . Поэтому в силу вариационного принципа Экланда [20] существует
2D k
последовательность vk 2 D, элементы которой являются решениями соответствующих задач
p
Jk (u) + k d(vk ; u) ! min; u 2 D;
(2.5)
причем справедливы неравенства
p
d(uk ; vk ) k ; Jk (vk ) Jk (uk ):
(2.6)
43
В отличие от J (u) функционал Jk (u) представляет собой максимум лишь от конечного числа
функционалов. Поэтому необходимые условия оптимальности управления vk в задаче (2.5) устанавливаются подобно тому, как это обычно делается в задачах оптимального управления с конечным числом функциональных ограничений (напр., [21]). Последнее обстоятельство позволяет
говорить о существовании такого вектора k (k0 ; k1 ; : : : ; klk ) 2 Rlk +1 , что
lk
X
k
j 0; j = 0; : : : ; lk ;
kj = 1;
(2.7)
j =0
k
k
k
j (Jk (v ) ; ((xk;j ; yk;j ; z [v ](xk;j ; yk;j )) ; q(xk;j ; yk;j ))); j = 1; : : : ; lk ;
lk
X
H x; y; [vk ](x; y); vk (x; y); k0 0 [vk ](x; y) + kj b[vk ](x; y; xk;j ; yk;j ) ;
j =1
l
k
p
X
k
k
k
k
k
; H x; y; [v ](x; y); w; 0 0[v ](x; y) + j b[v ](x; y; xk;j ; yk;j ) ;2 k
j =1
(2.8)
(2.9)
8w 2 U при п. в. (x; y) 2 ;
где b[u](; ; x; y) | решение уравнения
Z aZ b
Zb
(x; y; x; y ) =
rz H [u](1 ; 2; (1 ; 2 ; x; y))d1 d2 + rp H [u](x; 2 ; (x; 2 ; x; y))d2 +
x y
y
Za
+ rr H [u](1 ; y; (1 ; y; x; y))d1 ; rz (x; y; z [u](x; y))x;y (x; y): (2.10)
x
lk
P
Введем посредством равенства k kj (xk;j ;yk;j ) атомические меры Радона k 2 M (), где
j =1
(x;y) | -мера Дирака, сосредоточенная в точке (x; y).
lk
R
P
Тогда kj b[vk ](x; y; xk;j ; yk;j ) = b[vk ](x; y; x; y)k (dx dy). Обозначая последнюю функцию
j =1
через [vk ; k ] и интегрируя уравнение (2.10) по мере k , выводим
Z aZ b
[vk ; k ](x; y) =
rz H [u](1 ; 2; [vk ; k ](1; 2 ))d1 d2 +
x y
Zb
+ rp H [u](x; 2 ; [vk ; k ](x; 2 ))d2 +
y
Za
Z aZ b
+ rr H [u](1 ; y; [vk ; k ](1 ; y))d1 ;
rz (x; y; z[u](x; y))k (dx dy);
x
x y
k
| решение уравнения (2.1) при u =
= , которое согласно лемме 2.2 единклассе Ln1 (). Следовательно, [vk ; k ](x; y) 1 [vk ; k ](x; y), и соотношение (2.9) мо-
[vk ; k ]
vk , т. е.
ственно в
жет быть переписано в виде
H (x; y; [vk ](x; y); vk (x; y); [vk ; k ; k0 ](x; y)) ;
p
; H (x; y; [vk ](x; y); w; [vk ; k ; k0 ](x; y)) ;2 k 8w 2 U при п. в. (x; y) 2 : (2.11)
С помощью условия близости (2.6) двух управлений uk и vk , а также априорных оценок лемм
2.1, 2.2 соотношение (2.11) может быть переписано в терминах исходного м. п. р. uk , k = 1; 2; : : :
Опуская весьма громоздкие, но достаточно очевидные детали такого переписывания, получаем
соотношение максимума (2.3). Равенство же (2.7) переходит в условие невырожденности набора
множителей Лагранжа (2.2). Используя непрерывность на X функции q, близость управлений
uk и vk и равномерную непрерывность по u 2 D решений z [u], из (2.8) заключаем, что k сосредоточена на множестве k . 44
В заключение этого раздела, как и в [6], введем
k
Определение 2.1. Последовательность u 2 D , k = 1; 2; : : : , назовем стационарной в задаче
(Pq ), если найдутся последовательность неотрицательных чисел k ! 0, k ! 1, uk 2 Dq k , и
ограниченная последовательность пар (k0 ; k ), k0 0, k 2 M () | неотрицательная атомическая мера Радона, сосредоточенная на множестве k , такие, что выполняется неравенство
(2.3) и все предельные точки последовательности пар (k0 ; k ), k = 1; 2; : : : (в -слабом смысле
для второй компоненты), отличны от нуля. Стационарную в задаче (Pq ) последовательность
uk 2 D, k = 1; 2; : : : , назовем нормальной (регулярной, анормальной), если все (существуют, не
существуют) предельные точки любой (хотя бы одной, ни у одной) соответствующей ей последовательности k0 не равны нулю. Задача (Pq ) называется нормальной (регулярной, анормальной),
если все (существуют, не существуют) ее стационарные последовательности нормальны (являющиеся регулярными, являющиеся регулярными).
3. Аппроксимация задачи с фазовыми ограничениями,
липшицевость функции значений
Рассмотрим последовательность семейств оптимизационных задач, зависящих от конечномерного векторного параметра qk (q1k ; : : : ; qlkk ) 2 Rlk , аппроксимирующих исходное семейство
(Pq ):
I0 (u) ! inf ; I k (u) 2 Mk + qk ; u 2 D; qk 2 Rlk | параметр;
(Pqkk )
где Mk fy 2 Rlk : yi 0, i = 1; : : : ; lk g, I k (u) (I1k (u); : : : ; Ilkk (u)),
Iik (u) (xk;i ; yk;i ; z [u](xk;i ; yk;i )); (xk;i ; yk;i ) 2 Xk ;
а 1=k-сеть Xk определена в разделе 2. Как и в случае задачи (Pq ), согласно [2] м. п. р. в задаче
(Pqkk ) называется такая последовательность управлений ui 2 D, i = 1; 2; : : : , что выполняются
соотношения
i
I0 (ui ) k (qk ) + i ; ui 2 Dqk;"k ; i ; "i 0; i ; "i ! 0; i ! 1;
k
k
где Dqk;"k fu 2 D : Ijk (u) qjk + ", j = 1; : : : ; lk g, k (qk ) k;+0 (qk ) "lim
!+0 k;" (q ) k;0 (q );
k;" (qk ) f infk;" I0 (u), Dqk;"k 6= ;; +1, Dqk;"k = ;g. Можно утверждать, что функция значений
u2Dqk
! R, как и функция , полунепрерывна снизу [7].
Лемма 3.1. Пусть (q ) < +1, q 2 C (X ). Тогда существует такая последовательность
векторов qk 2 Rl , k = 1; 2; : : : , что k (qk ) ! (q), k ! 1. В частности, таковой является
последовательность qk (qk1 ; : : : ; qkl ), qki = q(xk;i ; yk;i ), i = 1; : : : ; lk .
k : Rlk
k
k
Доказательство этой аппроксимационной леммы аналогично доказательству леммы 3.1 из
[7] и поэтому опускается. Следует отметить, что данная лемма может быть полезна при конструировании численных методов решения задач с фазовыми ограничениями.
Введем так называемые обычный и сингулярный обобщенные субдифференциалы в смысле
[13] для произвольной полунепрерывной снизу функции : Rn ! R [ f+1g в каждой точке
q 2 dom соответственно по формулам @ (q) D; (q) f : (; ;1) 2 K ((q; (q)) j epi )g,
@ 1 (q) Ds; (q) f : (; 0) 2 K ((q; (q)) j epi )g, где
K ((q; (q)) j epi ) lim sup P ((r; ) j epi )
(r;)!(q;(q))
называется конусом обобщенных нормалей к epi в точке (q; (q)),
P ((r; ) j epi ) f((r; ) ; (s; )) : > 0; (s; ) 2 W ((r; ) j epi )g;
W ((r; ) j epi ) f(s; ) 2 epi : j(r; ) ; (s; )j = ((r; ) j epi )g;
45
((r; ) j epi ) | евклидово расстояние от точки (r; ) до множества epi ([13], с. 45). Покажем,
что справедлива следующая лемма о связи множителей Лагранжа с обобщенными нормалями
в смысле [13].
k
k
k
Лемма 3.2. Пусть k (q ) < 1 и (; ; ) 2 K ((q ; k (q )) j epi k ) | произвольная обобщенная нормаль, причем (; ; ) 6= 0. Тогда существуют последовательность неотрицательных чисел i ! 0, i ! 1, ограниченная последовательность
множителей Лагранжа
i
k;
i
i
i
l
i
k
(0 ; : : : ; lk ) 2 R и последовательность управлений u 2 Dqk , i = 1; 2; : : : , такие, что
jij 6= 0; ij 0; j = 0; : : : ; lk ; ij = 0; если jIjk (ui ) ; qjk j i ; j = 1; : : : ; lk ;
Z
fmax H (x; y; [ui ](x; y); v; [ui ; i ; i0 ](x; y)) ;
v2U
; H (x; y; [ui ](x; y); ui (x; y); [ui ; i ; i0 ](x; y))gdx dy i ;
+
lk
X
j =1
(3.1)
(3.2)
j ej = 0;
lk
P
где i ij (xk;j ;yk;j ) , а (; 1 ; : : : ; lk ) 6= 0 | предельная точка последовательности
j =1
векторов i , i = 1; 2; : : :
k;i ; k;i ) 2
Доказательство. Пусть (r
= epi k , i = 1; 2; : : : , | произвольная последовательность
k
k
точек, сходящаяся к (q ; k (q )). Тогда из полунепрерывности снизу функции k и определения
конуса K ((qk ; k (qk )) j epi k ) ([13], с. 45) следует существование последовательности положительных чисел i и последовательности точек
(qk;i ; k (qk;i )) 2 W ((rk;i ; k;i ) j epi k ) Rlk +1 ; i = 1; 2; : : : ;
(3.3)
qk;i ! qk ; k (qk;i ) ! k (qk ); i ( k;i ; ; k;i ) ! (; ; ); i ! 1;
(3.4)
таких, что
( k;i ; ; k;i ) (rk;i ; k;i ) ; (qk;i ; k (qk;i )), k;i 0. В множестве W ((rk;i ; k;i ) j epi k ) точка
(qk;i ; k (qk;i )) выбирается произвольно. Для дальнейшего доказательства леммы покажем, что
справедлива
i;s
k
Лемма 3.3. Пусть u , s = 1; 2; : : : , | произвольное м. п. р. в смысле (1:4) в задаче (Pq k;i ).
i;s
Тогда существуют последовательность чисел i;s 0, i;s ! 0, s ! 1, ui;s 2 Dqk;
fu 2
k;i
k;i
i;s
i;s
k
i;s
i;s
D : Ij (u) qj + , j = 1; : : : ; lk g, последовательность векторов (0 ; : : : ; lk ) 2 Rlk +1,
s = 1; 2; : : : ,
lk
X
i;s
i;s
k;i
k i;s
i;s
i;s
j = 1; j 0; j = 0; : : : ; lk ; j = 0 при jIj (u ) ; qj j ; j = 1; : : : ; lk ; (3.5)
j =0
такие, что
Z
k;i
fmax H (x; y; [ui;s ](x; y); v; [ui;s ; i;s ; i;s
0 ](x; y)) ;
v2U
k;i
i;s
; H (x; y; [ui;s ](x; y); ui;s (x; y); [ui;s ; i;s ; i;s
0 ](x; y))gdx dy ;
lk
E
D
k;i ; X i;s ej ; q ; q k;i i;s ;
maxlk ; i;s
0
j
q2S P
j =1
46
(3.6)
(3.7)
lk i;s
P
j (xk;j ;yk;j ) , ej ( 0| ; :{z: : ; 0}; 1; 0; : : : ; 0) 2 Rlk , а P > 0 | произвольное достаточно
j =1
j ;1
большое число, например, P = sup jqk;i j + 1.
где i;s i1
В силу включения (3.3) вектор ( k;i ; ; k;i ) является перпендикуляром
([12], с. 66) к epi k в точке (qk;i ; k (qk;i )). Поэтому на основании предложения 2.5.5 из [12] выводим
h( k;i ; ; k;i ); (q0 ; I ) ; (qk;i ; k (qk;i ))i 12 j(q0 ; I ) ; (qk;i ; k (qk;i ))j2 8q0 2 Rlk ; I k (q0 );
откуда после элементарных преобразований получаем
1
1
k;i k (qk;i ) ; h k;i ; qk;i i k;i I ; h k;i ; q0 i + jq0 ; qk;i j2 + (I ; k (qk;i ))2 8q0 2 Rlk ; I k (q0 ):
2
2
i;s
Докажем, что если последовательность u , s = 1; 2; : : : , | м. п. р. в задаче (Pqkk;i ), то последовательность пар (ui;s ; qk;i ), s = 1; 2; : : : , | м. п. р. в задаче
l
(3.8)
I i (u; q0 ) ! inf ; I k (u) ; q0 2 Mk ; (u; q0 ) 2 Db D S Pk ;
Доказательство.
где I i (u; q0 ) k;i I0 (u) ; h k;i ; q0 i + 12 jq0 ; qk;i j2 + 12 (I0 (u) ; k (qk;i ))2 . Прежде всего, наделим
Db метрикой db((u1 ; q1); (u2 ; q2 )) d(u1 ; u2 ) + jq1 ; q2j и введем следующие обозначения: Db t f(u; q0 ) 2 Db : Ijk (u) ; qj0 t, j = 1; : : : ; lk g, bki lim
bi;t , bki;t inf I i (u; q0 ). В соответствии с общим
t!0 k
Dbt
s
0
s
b
определением [2] последовательность пар (u ; q ) 2 D, s = 1; 2; : : : , будет м. п. р. в задаче (3.8),
если найдутся такие последовательности чисел s , "s 0, s , "s ! 0, s ! 1, что
s
I i (us ; q0s ) bki + s ; (us ; q0s ) 2 Db " ; s = 1; 2; : : :
Так как ui;s , s = 1; 2; : : : , | м. п. р. в задаче (Pqkk;i ), то найдутся такие последовательности
i;s
неотрицательных чисел "i;s , i;s ! 0, s ! 1, что ui;s 2 Dqk;"k;i , I0 (ui;s ) k (qk;i ) + i;s . Поэтому
1
I i (ui;s ; qk;i ) = k;i I0 (ui;s ) ; h k;i ; qk;i i + (I0 (ui;s ) ; k (qk;i ))2 2
k;i k (qk;i ) + k;i i;s ; h k;i ; qk;i i + 12 ( i;s )2 : (3.9)
Поскольку нижняя грань bki в задаче (3.8) равна bki = k;i k (qk;i ) ; h k;i ; qk;i i (доказательство
данного факта аналогично доказательству равенства (5.6) в работе [9]), то оценку (3.9) можно
переписать в виде
I i (ui;s ; qk;i ) bki + ei;s ;
(3.10)
где ei;s k;i i;s + 21 ( i;s )2 . Кроме того, из соотношений "i;s ! 0, s ! 1, ui;s 2 Dqk;"k;i и определения множеств Db t следует, что (ui;s ; qk;i ) 2 Db "i;s . Последнее включение в совокупности с оценкой (3.10) доказывает, что последовательность пар (ui;si;s ; qk;i ) действительно является м. п. р. в
задаче (3.8), а для последовательности ri;s bki ; bki;" + ei;s , i = 1; 2; : : : , справедливы соотношения
i;s
i;s
I i (ui;s ; qi;k ) bki;" + ri;s ; (ui;s ; qk;i ) 2 Db " :
Отсюда с помощью вариационного
принципа Экланда [20] выводим существование последовательности (ui;s;1 ; qk;i;s ) 2 Db "i;s , являющейся решением в задаче
p
i;s
I i (u; q0 ) + ri;s db((u; q0 ); (ui;s;1 ; qk;i;s )) ! inf ; (u; q0 ) 2 Db " ;
(3.11)
i;s
47
и такой, что
p
db((ui;s ; qk;i ); (ui;s;1 ; qk;i;s )) ri;s ; I i (ui;s;1 ; qk;i;s ) I i (ui;s ; qk;i ):
(3.12)
При этом из первой оценки (3.12) и леммы 2.1 вытекает, что I0 (ui;s;1 ) ; k (qk;i ) ! 0, s ! 1,
и, как следствие, последовательность ui;s;1 , s = 1; 2; : : : , является м. п. р. и в задаче (Pqkk ) при
qk = qk;i . Из (3.11) можно заключить, что
J (ui;s;1 ; qk;i;s ) inf J (u; q0 ) + ;
Db
p
где J (u; q0 ) maxfI i (u; q0 ) ; I i (ui;s;1 ; qi;k;s ) + + ri;s db((u; q0 ); (ui;s;1 ; qk;i;s )), Ijk (u) ; qj0 ; "i;s ,
j = 1; : : : ; lk g. Снова применяя вариационный принцип Экланда, выводим, что найдется пара
(ui;s;1; ; qk;i;s; ) 2 Db , являющаяся решением в задаче
p
J (u; q0 ) + db((u; q0 ); (ui;s;1; ; qk;i;s; )) ! inf ; (u; q0 ) 2 Db ;
(3.13)
и удовлетворяющая неравенствам
p
db((ui;s;1 ; qk;i;s ); (ui;s;1; ; qk;i;s; )) ; J (ui;s;1; ; qk;i;s; ) J (ui;s;1 ; qk;i;s ):
(3.14)
Для получения необходимых условий оптимальности в последней задаче можно воспользоваться результатами работы [21], в которой достаточно подробно изложен метод получения
условий оптимальности в аналогичной задаче для квазилинейного эллиптического уравнения
(см. задачу для функционала J; в [21], с. 1414). Применяя здесь этот метод, получим следующее заключение. Так как (ui;s;1; ; qk;i;s; ) | решение задачи (3.13), то существуют вектор
1; ; i;s;1; ; : : : ; i;s;1; ) 2 Rlk +1 и достаточно большое число K > 0 такие, что
i;s;1; (i;s;
0
1
lk
1; 0; j = 0; : : : ; l ;
i;s;
k
j
lk
X
1; = 1;
i;s;
j
j =0
i;s;
1
;
i;s;
1
;
k;i;s;
k
i;s;
1
;
k;i;s;
j (J (u
;q
) ; (Ij (u
);q
; "i;s )) = 0; j = 1; : : : ; lk ;
1; k;i ](x; y)) ;
H (x; y; [ui;s;1; ](x; y); ui;s;1; (x; y); [ui;s;1; ; i;s;1; ; i;s;
0
1; k;i ](x; y)) ;H (x; y; [ui;s;1; ](x; y); w; [ui;s;1; ; i;s;1; ; i;s;
0
p i;s p
;2K ( r + ) 8w 2 U при п. в. (x; y) 2 ;
lk
D i;s;1; k;i k;i;s; k;i X
E
1; ej ; q0 ; qk;i;s; 2K (pri;s + p ) 8q0 2 S lk :
0 (; + q
; q ) ; i;s;
j
P
j =1
Переходя в полученном семействе необходимых условий к пределу при ! 0 и учитывая оценки (3.12), (3.14), после весьма громоздких вычислений приходим к выводу о справедливости
леммы 3.3.
Для завершения доказательства леммы 3.2 выберем подпоследовательность si ; i = 1; 2; : : : ,
последовательности s = 1; 2; : : : , так, что
Ij (ui ) qjk + (qjk;i ; qjk ) + i;si ; (qjk;i ; qjk ) + i;si ! 0; j = 1; : : : ; lk ;
i;si ! 0; "i;si ! 0; i i;si ! 0; I0 (ui;si ) ; k (qk ) ! 0; i ! 1;
(3.15)
где введено обозначение ui ui;si . Одновременно без ограничения общности в силу (3.15), (3.4),
(3.7) можем считать, что
i i;si
i
i;s
0 ! 1; j ! j ; j = 1; : : : ; lk ;
48
(3.16)
i
где j | некоторые числа. Заметим, что числа i , i;s
j , j , вообще говоря, зависят от k . Умноi
жая соотношения (3.5){(3.7) леммы 3.3 на , пользуясь соотношениями (3.15) и (3.16), можем
переформулировать лемму 3.3 в форме леммы 3.2. i
Определение 3.1. Последовательность управлений u 2 D , i = 1; 2; : : : , назовем стационарной в задаче (Pqkk ), если найдутся последовательность неотрицательных чисел i ! 0, i ! 1, и
ограниченная последовательность векторов i 2 Rlk , i = 1; 2; : : : , i (i0 ; i1 ; : : : ; ilk ), такие, что
lk i
i
i P
ui 2 Dqk;
(x ;y ) , и все предельные точки
k , выполнены соотношения (3.1), (3.2), где j =1 j k;j k;j
последовательности i , i = 1; 2; : : : , отличны от нуля.
n P
lk
j
lk
lk +1
Введем множества множителей Lk;
qk ; j =1 j e 2 R : = (0 ; 1 ; : : : ; ll ) 2 R , 6= 0,
0 = , существует стационарная в задаче (Pqkk ) последовательность, для которой соответствующая ей, согласно определению стационарной последовательности, последовательность
векторов
o
k;
0
i
, i = 1; 2; : : : , имеет вектор в качестве своей предельной точки , = 0; 1; Mqk Lk;qk0 [ f0g,
Mqk;k1 Lk;qk1 . Непосредственно из леммы 3.2, определения обобщенных субдифференциалов в
смысле [13] и произвола в выборе последовательностей rk;i , k;i , i = 1; 2; : : : , следует
k;1 1
k
k
k
k
1
k
Теорема 3.1. Пусть k (q ) < +1. Тогда @k (q ) = @k (q ) \ Mq k , @ k (q ) = @ k (q ) \
Mqk;k0 , где @k (qk ) и @ 1 k (qk ) являются соответственно обычным и сингулярным обобщенным
субдифференциалами в точке qk [13].
Из данной теоремы и теоремы 2.1 в [13] вытекает
k
k
k
Следствие 3.1. Если в некоторой окрестности Oq k точки q все задачи (Py k ), y 2 Oq k , норk;
0
k;
1
мальны, т. е. Myk = f0g, yk 2 Oqk , причем множества Myk равномерно ограничены постоянной
K в некоторой норме kk (напр., евклидовой jj), то функция значений k является липшицевой
в сопряженной норме на Oqk с той же постоянной K .
Следствием теоремы 3.1, как и в [7], является следующая теорема, доказательство которой
может быть проведено в полном соответствии со схемой доказательства аналогичного результата в ([7], x 4).
Теорема 3.2. Если задача (Pq ) нормальна, то ее функция значений липшицева в окрестности точки q 2 C (X ).
Сформулируем, наконец, два достаточных условия нормальности в задаче (Pq ) (напр., [6]).
Теорема 3.3. Пусть в задаче (Pq ) правая часть f имеет вид f (x; y; z; p; r; v ) f1 (x; y )z +
f2 (x; y)p + f3 (x; y)r + f4 (x; y; v), а функция G выпукла по z . Пусть, кроме того, выполнено одно
из следующих условий : 1) функция выпукла по z , и найдется такое управление u 2 D, что
(x; y; z [u ](x; y)) < q(x; y) 8 (x; y) 2 X ; 2) функция имеет вид (x; y; zi ) 1 (x; y)z +2 (x; y)
и в задаче (Pq ) найдется нестационарная последовательность ui 2 Dq , i = 1; 2; : : : , i ! 0,
i ! 1. Тогда задача (Pq ) нормальна.
4. Иллюстративный пример
Пусть задана оптимизационная задача
I0 (u) z2 [u](1; 1) ! inf ; I1 (u)(x; y) ;z1 [u](x; y) 0; (x; y) 2 [0; 1] [0; 1];
z1xy = (z1x + 1)u(x; y); z2xy = z1 ; u2 (x; y); z (0; y) = z (x; 0) = 0;
z = (z1 ; z2 ); u(x; y) 2 U [;1; +1]; (x; y) 2 [0; 1] [0; 1]:
Можно показать, что в этой задаче не существует измеримого по Лебегу оптимального управления и что значение задачи равно ;1.
49
Принцип максимума для м. п. р. теоремы 2.1 здесь будет иметь вид
Z
max f(i 01 [ui ](x; y) + 11 [ui ; i ](x; y))[(v ; ui (x; y))z1x [ui ](x; y) +
v2[;1;+1]
+ (v ; ui (x; y))] + (i 02 [ui ](x; y) + 12 [ui ; i ](x; y))((ui (x; y))2 ; v2 )gdx dy i ;
где i ! 0, i ! 1, а сопряженные функции 0 [ui ] (01 [ui ]; 02 [ui ]), 1 [ui ; i ] (11 [ui ; i ]; 12 [ui ; i ])
| решения сопряженных систем
Z1
Z 1Z 1
1 (x; y) ; ui (x; 2 )1 (x; 2 )d2 ;
2 (1 ; 2 )d1 d2 = 0; 2 (x; y) = ;1;
y
x y
Z1
Z 1Z 1
Z 1Z 1
i
1 (x; y) ; u (x; 2 )1 (x; 2 )d2 ;
2 (1 ; 2 )d1 d2 =
i (d1 d2 );
y
x y
x y
2 (x; y) = 0;
соответственно. Эти соотношения могут быть переписаны в виде
Z
max f(i 01 [ui ](x; y) + 11 [ui ; i ](x; y))[(v ; ui (x; y))z1x [ui ](x; y) +
v2[;1;+1]
+(v ; ui (x; y))] ; i ((ui (x; y))2 ; v2 )gdx dy i ;
Z1
i
01 [u ](x; y) ; ui (x; 2 )01 (x; 2 )d2 = ;(1 ; x)(1 ; y);
y
Z1
Z 1Z 1
11 [ui ](x; y) ; ui (x; 2 )11 (x; 2 )d2 =
i (d1 d2 );
i + ji j = 1;
y
x y
i
mesf(x; y) 2 : z1 [u ](x; y) ; i g ! 0; i ! 1;
где мера i сосредоточена на множестве i f(x; y) 2 : jz1 [ui ](x; y)j i g, i ! 0, i ! 1.
Элементарный анализ этих соотношений показывает, что последовательность ui 2 D,
i = 1; 2; : : : , будет заведомо им удовлетворять, если
i 01 [ui ](x; y) + 11 [ui ; i ](x; y) ! 0 по мере на ;
jui (x; y)j ! 1 по мере на ; i + ji j = 1;
mesf(x; y) 2 : z1 [ui ](x; y) ; i g ! 0; i ! 1; supp i i :
(4.1)
Одной из подходящих последовательностей пар (i ; i ) будет последовательность, удовлетворяющая соотношениям
i ! 1=2; ji j ! 1=2; i [f(xe; ye) 2 : x xe 1; y ye 1g] ! (1=2)(1 ; x)(1 ; y):
Для нее, очевидно, выполняется первое из соотношений (4.1). При этом, т. к. последовательность ui , i = 1; 2; : : : , должна удовлетворять и остальным соотношениям (4.1), в этом случае с
необходимостью должно быть jz1 [ui ]j(0)
! 0, i ! 1. Поскольку
Z x Z y
z1 [u](x; y) =
exp
u(1 ; 2 )d2 ; 1 d1 ;
0
0
то одной из последовательностей, удовлетворяющей всем требованиям, является, например, последовательность
(
+1; y 2 ( j2;i1 ; 2ji ); x 2 [0; 1]; j = 1; 3; : : : ; 2i ; 1;
ui (x; y) ;1; y 2 ( j2;i1 ; 2ji ); x 2 [0; 1]; j = 2; 4; : : : ; 2i; i = 1; 2; : : :
50
В то же время последовательность
(
+1; x 2 ( j;2i1 ; 2ji ); y 2 [0; 1]; j = 1; 3; : : : ; 2i ; 1;
i
v (x; y) ;1; x 2 ( j;2i1 ; 2ji ); y 2 [0; 1]; j = 2; 4; : : : ; 2i; i = 1; 2; : : : ;
последним требованиям не удовлетворяет, т.к. jz1 [vi ]j(0)
6! 0, i ! 1. При этом обе указанные
последовательности в слабой норме j jw ([2]) сходятся к одному и тому же обобщенному управлению (x; y) (;1 + +1 )=2. Итак, в данном примере разные последовательности управлений
сходятся к одному и тому же обобщенному управлению, но одна из них является м. п. р. и идентифицируется с помощью принципа максимума, а другая таковой не является.
Литература
1. Гамкрелидзе Р.В. Основы оптимального управления. { Тбилиси: Изд-во Тбилисск. ун-та,
1977. { 256 с.
2. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. { М.: Наука, 1977. { 624 с.
3. Янг Л. Лекции по вариационному исчислению и теории оптимального управления. { М.:
Мир, 1974. { 488 с.
4. Сумин М.И. Математическая теория субоптимального управления распределенными системами : Дисс. : : : докт. физ.-матем. наук. Нижний Новгород: Нижегородский гос. ун-т,
2000. { 350 с.
5. Данилова О.А., Матвеев А.С. Нетрадиционные условия существования оптимального управления для системы Гурса{Дарбу // Изв. РАН. Сер. матем. { 1998. { Т. 62. { Є 5. { C. 79{102.
6. Сумин М.И. Субоптимальное управление полулинейными эллиптическими уравнениями с
фазовыми ограничениями. I. Принцип максимума для минимизирующих последовательностей, нормальность // Изв. вузов. Математика. { 2000. { Є 6. { C. 33{44.
7. Сумин М.И. Субоптимальное управление полулинейными эллиптическими уравнениями с
фазовыми ограничениями. II. Чувствительность, типичность регулярного принципа максимума // Изв. вузов. Математика. { 2000. { Є 8. { C. 52{63.
8. Плотников В.И., Сумин М.И. О построении минимизирующих последовательностей в задачах управления системами с распределенными параметрами // Журн. вычисл. матем. и
матем. физ. { 1982. { Т. 22. { Є 1. { С. 49{56.
9. Сумин М.И. Субоптимальное управление системами с распределенными параметрами: минимизирующие последовательности, функция значений // Журн. вычисл. матем. и матем.
физ. { 1997. { Т. 37. { Є 1. { С. 23{41.
10. Сумин М.И. Субоптимальное управление системами с распределенными параметрами:
свойства нормальности, субградиентный двойственный метод // Журн. вычисл. матем. и
матем. физ. { 1997. { Т. 37. { Є 2. { C. 162{178.
11. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. { М.: Наука, 1979.
{ 432 с.
12. Кларк Ф. Оптимизация и негладкий анализ. { М.: Наука, 1988. { 280 с.
13. Мордухович Б.Ш. Методы аппроксимаций в задачах оптимизации и управления. { М.: Наука, 1988. { 360 с.
14. Mordukhovich B.S., Shao Y. Nonsmooth sequential analysis in Asplund spaces // Trans. Amer.
Math. Soc. { 1996. { V. 346. { Є 4. { P. 1235{1280.
15. Плотников В.И., Сумин В.И. Оптимизация объектов с распределенными параметрами, описываемых системами Гурса{Дарбу // Журн. вычисл. матем. и матем. физ. { 1972. { Т. 12.
{ Є 1. { С. 61{77.
16. Условия экстремума и конструктивные методы решения в задачах оптимизации гиперболических систем / По ред. О.В. Васильева. { Новосибирск: Наука, 1993. { 196 с.
51
17. Тихомиров В.М. Выпуклый анализ // Итоги науки и техн. ВИНИТИ. Современ. пробл. матем. Фундаментальные направления. { 1987. { Т. 14. { С. 5{101.
18. Плотников В.И., Сумин В.И. Проблемы устойчивости нелинейных систем Гурса{Дарбу //
Дифференц. уравнения. { 1972. { Т. 8. { Є 5. { С. 845{856.
19. Сумин М.И. О минимизирующих последовательностях в задачах оптимального управления
при ограниченных фазовых координатах // Дифференц. уравнения. { 1986. { Т. 22. { Є 10.
{ С. 1719{1731.
20. Ekeland I. On the variational principle // J. Math. Anal. Appl. { 1974.{ V. 47. { Є 2. { P. 324{353.
21. Сумин М.И. Оптимальное управление объектами, описываемыми квазилинейными эллиптическими уравнениями // Дифференц. уравнения. { 1989. { Т. 25. { Є 8. { С. 1406{1416.
Нижегородский государственный
университет
Поступила
15.10.2002
52
Документ
Категория
Без категории
Просмотров
14
Размер файла
256 Кб
Теги
субоптимальных, поточечной, ограничений, системой, управления, фазовые, дарбу, параметрические, задачи, гурса
1/--страниц
Пожаловаться на содержимое документа