close

Вход

Забыли?

вход по аккаунту

?

1478.Математика в Ярославском университете

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Министерство образования и науки Российской Федерации
Ярославский государственный университет им. П. Г. Демидова
МАТЕМАТИКА
В ЯРОСЛАВСКОМ УНИВЕРСИТЕТЕ
СБОРНИК ОБЗОРНЫХ СТАТЕЙ
К 35-ЛЕТИЮ МАТЕМАТИЧЕСКОГО ФАКУЛЬТЕТА
Ярославль 2011
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 51
ББК В 1я73
М 34
Рекомендовано
Редакционно-издательским советом ЯрГУ
в качестве научного издания. План 2010/2011 учебного года
М 34
Математика в Ярославском университете: сборник обзорных статей: к 35-летию математического факультета / отв. ред.
М. В. Невский / Яросл. гос. ун-т им. П. Г. Демидова. — Ярославль:
ЯрГУ, 2011. — 220 с.
ISBN 978-5-8397-0822-8
В сборнике представлены научные статьи и обзоры сотрудников
математического факультета и факультета информатики и вычислительной техники Ярославского государственного университета
им. П. Г. Демидова. Содержание сборника дает представление о тематике исследований в области математики и ее приложений, ведущихся
в университете.
Ответственный редактор: М. В. Невский, канд. физ.-мат. наук,
доцент
УДК 51
ББК В 1я73
ISBN 978-5-8397-0822-8
c
Ярославский
государственный
университет
им. П. Г. Демидова, 2011
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Содержание
Предисловие . . . . . . . . . . . . . . . . . . . . . . . . .
5
Башкин М. А.
Однородные нерасщепимые супермногообразия нечетной
размерности 4, связанные с комплексной проективной прямой . .
7
Большаков Ю. И.
Некоторые задачи классификации матриц и их приложения . . .
13
Бродский Г. М.
О центроиде и псевдоцентроиде вершинно-взвешенного связного
графа . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
Глызин С. Д., Колесов А. Ю.
Хаотическая буферность . . . . . . . . . . . . . . . . . . .
44
Дурнев В. Г., Зеткина О. В.
Об уравнениях с ограничениями на решения в свободных
полугруппах . . . . . . . . . . . . . . . . . . . . . . . .
66
Злобина М. Ю., Кубышкин Е. П.
Оптимальное управление одной механической системой,
моделирующей движение руки манипулятора . . . . . . . . .
75
Казарин Л. С.
Факторизации и представления групп . . . . . . . . . . . . .
93
Климов В. С.
Деформационный принцип минимума и ветвление экстремалей . 109
Климов В. С., Демьянков Н. А.
О периодических экстремалях липшицевых функционалов . . . 119
Краснов В. А.
Вещественные пересечения двух проективных квадрик . . . . . 131
3
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4
СОДЕРЖАНИЕ
Калинин В. Б., Литвинов В. В.
Исследование температурной неустойчивости при численном
моделировании течений термореактивной среды . . . . . . . . 141
Невский М. В.
Геометрические неравенства для интерполяционных проекторов . 145
Стрелков Н. А.
О некоторых свойствах интерполяционных сплайнов . . . . . . 157
Тимофеев Е. А.
Выбор метрики для непараметрических оценок энтропии . . . . 187
Ухалов А. Ю.
Построение общих нормалей для двух конических поверхностей . 199
Шалашов В. К.
Об алгебраической проблеме узлов . . . . . . . . . . . . . . 205
Яблокова С. И.
Группы гомологий пространств триангуляций двумерного
симплекса . . . . . . . . . . . . . . . . . . . . . . . . . 207
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Предисловие
Математический факультет Ярославского государственного университета им. П. Г. Демидова был образован летом 1976 года. Существовавший до
тех пор физико-математический факультет университета был разделен на
два новых факультета — математический и физический. Время идет неудержимо: в 2011 году математическому факультету исполнилось уже 35 лет. За
период 1976–2011 гг. факультетом подготовлено большое количество высококвалифицированных специалистов, успешно работающих в области математики и информатики как в нашем регионе, так и далеко за его пределами.
Значительных успехов достигла научная работа на факультете. Вклад в научные исследования в области математики и ее приложений внесли многие
сотрудники, аспиранты и студенты математического факультета, работавшие
на нем в этот период.
В 1996 году по инициативе Валерия Георгиевича Дурнева, который был
деканом математического факультета с ноября 1988 года по январь 2009 года,
к 20-летнему юбилею факультета был выпущен сборник обзорных работ "Математика в Ярославском университете". Cборник включил в себя научные и
обзорные статьи по некоторым направлениям и проблемам математики, в
разработку которых внесли существенный вклад сотрудники университета.
Издание было задумано и сделано максимально демократичным: выбор тем,
форм и характеров научных статей и обзоров был предоставлен самим авторам, выразившим желание участвовать в этой работе. Таким образом, c
самого начала не ставилась задача полного описания всех научных исследований, проводившихся на математическом факультете.
Опыт, заложенный в 1996 году, получил дальнейшее развитие в 2001 и
2006 годах, когда к 25-летию и 30-летию математического факультета были
изданы очередные две книги с аналогичными названиями. Таким образом, в
последние 15 лет на факультете сложилась хорошая традиция по публикации
юбилейных сборников указанной тематики.
Настоящий сборник "Математика в Ярославском университете" является четвертым по счету. Он приурочен к 35-летнему юбилею математического
факультета. В сборнике представлены научные статьи и обзоры некоторых
5
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
6
Предисловие
исследований в области математики и ее приложений, выполненные в основном за последние 5 лет на математическом факультете и факультете информатики и вычислительной техники Ярославского государственного университета им. П. Г. Демидова. Сборник содержит 17 статей и обзоров 21 автора по
ряду направлений алгебры, алгебраической геометрии, геометрии, дискретной оптимизации, дифференциальных уравнений, математического анализа,
математического моделирования, методов оптимизации, теории алгоритмов,
теории вероятности, теории графов, теории функций, функционального анализа, численных методов и др. Разнообразие тем опубликованных в сборнике
статей дает определенное представление о широте научных исследований по
математике, ведущихся в университете.
М. Невский,
ответственный редактор,
декан математического факультета
Ярославского государственного университета им. П. Г. Демидова
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 515.1
Однородные нерасщепимые
супермногообразия нечетной размерности 4,
связанные с комплексной
проективной прямой ∗
М. А. Башкин
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: misha@uniyar.ac.ru
Статья содержит результаты классификации однородных
нерасщепимых супермногообразий нечетной размерности 4 над
комплексной проективной прямой. Необходимые сведения по теории супермногообразий можно найти, например, в работах [7, 8,
11, 12].
Библиография: 12 названий.
Изучение однородных комплексных супермногообразий было начато в
1980-х годах Ю. И. Маниным (см. [5]). В 1996 году А. Л. Онищиком (см. [7])
была поставлена следующая задача:
классифицировать с точностью до изоморфизма все однородные комплексные супермногообразия вида (M, O), где
M — заданное компактное комплексное однородное многообразие.
Пусть M = CP1 . Тогда в расщепимом случае классификация известна:
однородные супермногообразия находятся во взаимно однозначном соответствии с невозрастающими наборами n неотрицательных чисел. В нерасщепимом случае классификация значительно сложнее и сводится к некоторым
вычислениям с когомологиями расщепимых однородных супермногообразий
со значениями в касательном пучке.
В. А. Бунегина и А. Л. Онищик полностью исследовали в [6] случай, когда
нечетная размерность супермногообразия n = 2 или 3. Оказалось, что при
Работа выполнена при финансовой поддержке Российского фонда фундаментальных
исследований, грант 07-01-00230.
∗
7
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
8
М. А. Башкин
n = 2 существует только одно нерасщепимое однородное супермногообразие вида (CP1 , O). Это суперквадрика в CP1|2 , которая была построена ранее
независимо П. Грином (P. Green) и В. П. Паламодовым как один из первых примеров нерасщепимых комплексных супермногообразий. При n = 3
существует серия нерасщепимых однородных супермногообразий, параметризованная целым числом k = 0, 2, 3, . . . .
Изучение случая n = 4 было начато в [9], где было построено однопараметрическое семейство нерасщепимых однородных супермногообразий, ретрактом которых является комплексная проективная суперпрямая размерности 1|4. Исследование в случае n = 4 было продолжено в [1], [2], [3] и [4].
Данная работа является продолжением классификации и содержит новые
результаты.
Как известно, любое голоморфное расслоение над CP1 единственным
образом разлагается в прямую сумму расслоений на прямые. Обозначим через Lk голоморфное расслоение на прямые степени k. Рассмотрим
E → CP1 голоморфное векторное расслоение ранга 4, представленное в виде
E = L−k1 ⊕ L−k2 ⊕ L−k3 ⊕ L−k4 , k1 ≥ k2 ≥ k3 ≥ k4 ≥ 0. Обозначим через
1|4
CPk1 k2 k3 k4 расщепимое супермногообразие, определяемое расслоением E.
Покроем CP1 двумя аффинными картами U0 и U1 с локальными координатами x и y = x1 соответственно. Тогда функции перехода супермногообразия
1|4
CPk1 k2 k3 k4 в U0 ∩ U1 имеют вид

y = x−1




 η1 = x−k1 ξ1
η2 = x−k2 ξ2 ,


η3 = x−k3 ξ3



η4 = x−k4 ξ4
где ξi и ηi — базисные сечения расслоения E над U0 и U1 соответственно.
4
L
Обозначим через Tgr =
(Tgr )p градуированный касательный пучок расp=−1
щепимого супермногообразия (M, Ogr ). Рассмотрим подпучок
Aut(2) Ogr = exp((Tgr )2 ⊕ (Tgr )4 )
пучка Aut Ogr (см. [7]). Согласно теореме Грина (см. [10]), множество супермногообразий с заданным ретрактом (M, Ogr ) изоморфно множеству орбит
группы Aut E на множестве H 1 (M, Aut(2) Ogr ). Справедливо
Утверждение 1 (см. [2]). Пусть n ≤ 5, H 0 (M, (Tgr )2 ) = 0 и заданы такие
подпространства Q2p ⊂ Z 1 (U, (Tgr )2p ) (p = 1, 2), что каждый класс когомологий из H 1 (M, (Tgr )2p ) содержит ровно по одному коциклу из Q2p (p = 1, 2).
Тогда любой класс когомологий из H 1 (M, Aut(2) Ogr ) представляется единственным коциклом вида z = exp(u2 + u4 ), где u2 ∈ Q2 , u4 ∈ Q4 .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Однородные нерасщепимые супермногообразия
9
Мы будем говорить далее о задании супермногообразия (M, O)
коциклом u2 + u4 , подразумевая, что (M, O) соответствует коциклу
z = exp(u2 + u4 ). Из предложения 5 работы [2] следует, что при
H 0 (CP1 , (Tgr )2 ) = {0} однородные нерасщепимые супермногообразия могут
существовать только для следующих сигнатур:
(1, 1, 1, 0), (2, 2, 1, 0), (3, 3, 1, 0), (4, 4, 1, 0), (4, 4, 3, 0),
(6, 4, 3, 0), (2, 2, 2, 1), (3, 3, 2, 1), (5, 3, 2, 1), (k + 1, k, 1, 1)k≥1 ,
(k + 1, k, 2, 0)k≥2 ,
(k, k, 2, 0)k≥2 ,
(k + 3, k, 2, 2)k≥2 ,
(k + 1, k, 2, 2)k≥2 , (k, k, 2, 2)k≥2 , (k + 3, k, 3, 1)k≥3 , (k + 1, k, 3, 1)k≥3 ,
(k, k, 3, 1)k≥3 , (k + 3, k, 4, 0)k≥4 , (k + 1, k, 4, 0)k≥4 , (k, k, 4, 0)k≥4 ,
(k2 + k3 + k4 − 2, k2 , k3 , k4 )k3 ≥1 .
В работе [6], предложение 12, дано описание алгебры End E. Приведем
его в более удобных для нас терминах. Эндоморфизм a ∈ End E можно рассматривать как эндоморфизм пучка F-модулей E. В окрестности U0 имеем
a(ξi ) =
n
X
aji (x)ξj , i = 1, . . . , n,
j=1
где A = (aji (x)) — матрица с элементами aji ∈ F(U0 ). Матрица A полностью
определяет эндоморфизм a, причем a ∈ Aut E тогда и только тогда, когда A
обратима в соответствующем кольце матриц.
В [2] доказано следующее утверждение, которое используется для классификации однородных нерасщепимых супермногообразий с точностью до
изоморфизма.
Утверждение 2. Матрица A = (aji (x)) над F(U0 ) соответствует некоторому
a ∈ End E тогда и только тогда, когда aij = 0 при условии ki < kj и aij —
многочлен степени ≤ ki − kj при условии ki ≥ kj .
Приведем результаты классификации однородных нерасщепимых
супермногообразий, связанных с заданным однородным расщепимым
1|4
супермногообразием CPk1 k2 k3 k4 .
Теорема 1. Для следующих сигнатур однородных нерасщепимых супермногообразий не существует:
(1, 1, 1, 0), (3, 3, 1, 0), (4, 4, 1, 0), (4, 4, 3, 0), (6, 4, 3, 0), (3, 3, 2, 1),
(5, 3, 2, 1), (k + 1, k, 2, 0)k>2 , (k, k, 3, 1)k≥3 , (k + 1, k, 3, 1)k≥3 ,
(k + 3, k, 3, 1)k≥3 , (k, k, 4, 0)k≥4 , (k + 1, k, 4, 0)k≥4 , (k + 3, k, 4, 0)k≥4 .
Теорема 2. Для следующих сигнатур существует единственное с точностью
до изоморфизма однородное нерасщепимое супермногообразие, представлен-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
10
М. А. Башкин
ное соответственно коциклом:
(2, 2, 1, 0)
(2, 2, 2, 1)
(3, 2, 2, 0)
(k + 1, k, 1, 1)k>1
(k + 3, k, 2, 2)k≥2
(k + 1, k, 2, 2)k>2
(k, k, 2, 2)k≥4
x−1 ξ1 ξ4 ξ3 ∂ ;
∂ξ3
∂
−1
x ξ1 ξ2 x ;
∂
−2
2x−1 ξ1 ξ3 ∂
x + 3x ξ2 ξ3 ξ1 ∂ξ1 ;
x−1 ξ3 ξ4 ξ1 ∂ ;
∂ξ1
∂
∂
−2
−2
2x−1 ξ3 ξ4 ∂
x + (k + 3)x ξ3 ξ4 ξ1 ∂ξ1 + kx ξ3 ξ4 ξ2 ∂ξ2 ;
∂
∂
−2
−2
2x−1 ξ3 ξ4 ∂
x + (k + 1)x ξ3 ξ4 ξ1 ∂ξ1 + kx ξ3 ξ4 ξ2 ∂ξ2 ;
x−1 ξ3 ξ4 ∂
x.
Теорема 3. Для сигнатуры (2, 2, 2, 2) существуют с точностью до изоморфизма два однородных нерасщепимых супермногообразия, которые могут
быть представлены следующими коциклами:
x−1 ξ1 ξ2 ∂ + x−2 ξ1 ξ2 ξ3 ∂ + x−2 ξ1 ξ2 ξ4 ∂ ,
∂x
∂ξ3
∂ξ4
x−1 ξ1 ξ2 ∂ + x−2 ξ1 ξ2 ξ3 ∂ + x−2 ξ1 ξ2 ξ4 ∂ + x−1 ξ3 ξ4 ∂ +
∂x
∂ξ3
∂ξ4
∂x
∂
−2
−2
+x ξ3 ξ4 ξ1
+ x ξ3 ξ4 ξ2 ∂ .
∂ξ1
∂ξ2
Теорема 4. Для сигнатуры (3, 3, 2, 2) существуют с точностью до изоморфизма три однородных нерасщепимых супермногообразия, которые могут
быть представлены следующими коциклами:
∂ −1
∂
∂
∂
−1
−2
−1
x−1 ξ3 ξ4 ∂ , x−2 ξ1 ξ3 ∂
x + x ξ2 ξ3 x , x ξ3 ξ4 x + x ξ1 ξ3 x + x ξ2 ξ3 x .
∂x
Теорема 5. Для сигнатуры (2, 1, 1, 1) существуют с точностью до изоморфизма восемь однородных нерасщепимых супермногообразий, которые могут
быть представлены следующими коциклами:
x−1 ξ2 ξ3 ξ1 ∂ , x−1 ξ2 ξ3 ξ4 ∂ , x−1 ξ3 ξ4 ξ1 ∂ ,
∂ξ1
∂ξ4
∂ξ1
∂
∂
−1
−1
−1
x ξ2 ξ3 ξ1
+ x ξ2 ξ3 ξ4
, x ξ2 ξ3 ξ1 ∂ + x−1 ξ3 ξ4 ξ2 ∂ ,
∂ξ1
∂ξ4
∂ξ1
∂ξ2
∂
∂
∂
−1
−1
−1
−1
x ξ2 ξ3 ξ4
+ x ξ3 ξ4 ξ1
, x ξ3 ξ4 ξ1
+ x ξ3 ξ4 ξ2 ∂ ,
∂ξ4
∂ξ1
∂ξ1
∂ξ2
x−1 ξ2 ξ3 ξ1 ∂ + x−1 ξ2 ξ4 ξ3 ∂ + x−1 ξ3 ξ4 ξ2 ∂ .
∂ξ1
∂ξ3
∂ξ2
Теорема 6. Для сигнатуры (k2 + k3 + k4 − 2, k2 , k3 , k4 )k3 ≥1 получена классификация в следующих случаях:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Однородные нерасщепимые супермногообразия
(5, 4, 3, 0)
(k, k, 2, 0)k≥2
(k + 2, k, 4, 0)k≥4
(4, 3, 2, 1)
(1, 1, 1, 1)
(k, k, 1, 1)k>2
(2, 2, 1, 1)
11
нет;
нет;
нет;
одно: x−1 ξ2 ξ3 ξ4 ∂ ;
∂ξ1
четыре и одно однопараметрическое семейство:
x−1 ξ2 ξ3 ξ4 ∂ − x−1 ξ1 ξ3 ξ4 ∂ ,
x−1 ξ2 ξ3 ξ4 ∂ ,
∂ξ1
∂ξ1
∂ξ2
x−1 ξ2 ξ3 ξ4 ∂ − x−1 ξ1 ξ3 ξ4 ∂ + x−1 ξ1 ξ2 ξ4 ∂ ,
∂ξ1
∂ξ2
∂ξ3
∂
∂
−1
−1
−1
x ξ2 ξ3 ξ4
− x ξ1 ξ3 ξ4
+ x ξ1 ξ2 ξ4 ∂ −
∂ξ1
∂ξ2
∂ξ3
−1
−x ξ1 ξ2 ξ3 ∂ ,
∂ξ4
t(x−1 ξ2 ξ3 ξ4 ∂ − x−1 ξ1 ξ3 ξ4 ∂ + x−1 ξ1 ξ2 ξ4 ∂ −
∂ξ1
∂ξ2
∂ξ3
∂
∂
−1
−1
−x ξ1 ξ2 ξ3
) + x ξ1 ξ2 ξ3 ξ4 , t ∈ C∗ ;
∂ξ4
∂x
∂
∂
−1
−1
пять: x ξ3 ξ4 ξ1
, x ξ1 ξ3 ξ4
,
∂ξ1
∂ξ2
x−1 ξ3 ξ4 ξ1 ∂ + x−1 ξ3 ξ4 ξ2 ∂ ,
∂ξ1
∂ξ2
∂
−1
−1
x ξ1 ξ3 ξ4
+ x ξ2 ξ3 ξ4 ∂ ,
∂ξ2
∂ξ1
∂
−1
−1
+ x ξ1 ξ3 ξ4 ∂ + x−1 ξ2 ξ3 ξ4 ∂ ;
x ξ3 ξ4 ξ1
∂ξ1
∂ξ2
∂ξ1
∂
∂
−1
−1
девять: x ξ3 ξ4 ξ1
, x ξ2 ξ3 ξ4
,
∂ξ1
∂ξ1
x−2 ξ2 ξ3 ξ1 ∂ − x−1 ξ2 ξ4 ξ1 ∂ ,
∂ξ1
∂ξ1
∂
−1
−1
x ξ2 ξ3 ξ4
+ x ξ1 ξ3 ξ4 ∂ ,
∂ξ1
∂ξ2
∂
−1
−1
+ x ξ2 ξ3 ξ4 ∂ + x−1 ξ1 ξ3 ξ4 ∂ ,
x ξ3 ξ4 ξ1
∂ξ1
∂ξ1
∂ξ2
∂
∂
−2
−1
−1
x ξ2 ξ3 ξ1
− x ξ2 ξ4 ξ1
+ x ξ3 ξ4 ξ1 ∂ ,
∂ξ1
∂ξ1
∂ξ1
∂
∂
−1
−1
−2
− x ξ2 ξ4 ξ1
+ x ξ2 ξ3 ξ4 ∂ ,
x ξ2 ξ3 ξ1
∂ξ1
∂ξ1
∂ξ1
∂
∂
−2
−1
−1
x ξ2 ξ3 ξ1
− x ξ2 ξ4 ξ1
+ x ξ2 ξ3 ξ4 ∂ +
∂ξ1
∂ξ1
∂ξ1
−1
+x ξ1 ξ3 ξ4 ∂ ,
∂ξ2
∂
∂
∂
−2
−1
−1
x ξ2 ξ3 ξ1
− x ξ2 ξ4 ξ1
+ x ξ3 ξ4 ξ1
+
∂ξ1
∂ξ1
∂ξ1
+x−1 ξ2 ξ3 ξ4 ∂ + x−1 ξ1 ξ3 ξ4 ∂ .
∂ξ1
∂ξ2
Литература
[1] Башкин М. А., Онищик А. Л. Однородные нерасщепимые супермногообразия размерности 1|4 над комплексной проективной прямой // Математика в Ярославском университете: Сб. обзорных статей. К 30-летию
математического факультета. Ярославль: ЯрГУ, 2006. С. 17–32.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
12
М. А. Башкин
[2] Башкин М. А., Онищик А. Л. Однородные нерасщепимые супермногообразия над комплексной проективной прямой // Математика, кибернетика, информатика: труды международной научной конференции памяти
А. Ю. Левина. Ярославль: ЯрГУ, 2008. С. 40–57.
[3] Башкин М. А. Однородные и четно-однородные супермногообразия с ре1|4
трактом CPk,k,2,0 при k ≥ 2 // Моделирование и анализ информационных
систем. 2009. Т.16, №3. С. 14–21.
[4] Башкин М. А. Нерасщепимые однородные супермногообразия с ретрак1|4
том CPk,k,2,2 // Тезисы докладов Международной алгебраической конференции, посвященной 70-летию А. В. Яковлева. СПб.: СПбГУ, 2010.
С. 6–8.
[5] Березин Ф. А. Введение в алгебру и анализ с антикоммутирующими
переменными. М.: Изд.-во МГУ, 1983. 208 с.
[6] Бунегина В. А., Онищик А. Л. Однородные супермногообразия, связанные с комплексной проективной прямой // Итоги науки и техники ВИНИТИ. Совр. математика и ее прил. Т. 19: Алгебраическая геометрия-1.
Москва, 1994. С. 133–169.
[7] Онищик А. Л. О комплексных однородных супермногообразиях
// Математика в Ярославском университете: Сб. обзорных статей.
К 20-летию математического факультета. Ярославль: ЯрГУ, 1996.
С. 133–153.
[8] Онищик А. Л. Проблемы классификации комплексных супермногообразий // Математика в Ярославском университете: Сб. обзорных статей. К 25-летию математического факультета. Ярославль: ЯрГУ, 2001.
С. 7–34.
[9] Bunegina V. A., Onishchik A. L. Two families of flag supermanifolds //
Different. Geom. and its Appl. 1994. V. 4. P. 329–360.
[10] Green P. On holomorphic graded manifolds // Proc. Amer. Math. Soc. 1982.
V. 85. P. 587–590.
[11] Onishchik A. L. A Construction of Non-Split Supermanifolds // Annals of
Global Analysis and Geometry. 1998. V. 16. P. 309–333.
[12] Onishchik A. L. Non-Abelian Cohomology and Supermanifolds. SFB 288.
Preprint № 360. Berlin, 1998.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 521.8
Некоторые задачи классификации матриц
и их приложения
Ю. И. Большаков
Ярославский государственный университет им. П. Г.Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: bolsh@uniyar.ac.ru
В статье рассматриваются некоторые задачи классификации матриц над полем F = C или F = R, установлена связь задачи существования H-полярного разложения данной матрицы
X ∈ Fn×n с задачей классификации собственных подпространств
H-самосопряжённой матрицы X ∗ X, вычислены целочисленные
инварианты H-самосопряженной матрицы, определяющие её каноническую форму, рассмотрена задача классификации пар матриц специального вида по естественному отношению эквивалентности.
Библиография: 13 названий.
1. Задача классификации пар матриц
специального вида
Речь пойдёт о следующей задаче классификации матриц. Пусть G0 – группа унипотентных верхних треугольных тёплицевых матриц, т. е. матриц вида:


1 −x1 −x2 −x3 . . . −xn−1
 0 1 −x1 −x2 . . . −xn−2 



 ..
..
..
..
..
.
.

 .
.
.
.
.
.
0 0
0
0 ...
1
с элементами xi ∈ C.
13
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
14
Ю. И. Большаков
Мы будем обозначать эти матрицы символом
T p (1, −x1 , −x2 , −x3 , . . . , −xn−1 ).
Множество X, на котором действует группа, представляет из себя некоторое
подмножество n × n матриц, а именно
X = {H ∈ Cn×n / H ∗ = H, det H 6= 0}.
Группа G0 действует на множестве X по следующему правилу:
(H)T = T t H T̄ , где T ∈ G0 , H ∈ X. Для всякой матрицы H ∈ X мы
определим пару чисел (k, l) следующим образом: для номера k : hij = 0
для всех i + j ≤ k, но существует индекс i, для которого hi,k−i+1 6= 0;
номер l = min{i/hi,k−i+1 6= 0}. Заметим, что k = k(H), l = l(H), но, как
показывает непосредственный подсчет, числа k, l, и hk,l являются инвариантами при действии группы G0 на множестве X, что следует из матричного
соотношения F = T t H T̄ или в скалярной форме:
fpq = hpq −
X
β=1
β=p−1 γ=q−1
γ=q−1
β=p−1
hp−β, q xβ −
X
hp,q−γ x̄γ +
γ=1
X X
β=1
hp−β,q−γ xβ x̄γ .
(1.1)
γ=1
Рассмотрим следующую систему уравнений:
fl,q = 0, q = k + 2 − l, k + 3 − l, . . . , n,
fk+1−l, t = 0, t = n + 2l − k, n + 2l − k + 1, . . . , n.
(1.2)
Из этой системы можно достаточно легко найти следующие параметры:
x1 = x01 , x2 = x02 , . . . , xn−l = x0n−l ,
при следующем ограничении:
k<
n + 3l − 1
.
2
(1.3)
Случаи l = 1 и l = 2 очевидны. Рассмотрим лишь l = 3 и l = 4.
Всякая тёплицева матрица T = T p(1, x1 , x2 , . . . , xn−1 ) может быть однозначно представлена в виде: T = P Q = QP , где
P = T p (1 0 . . . 0 zm zm+1 . . . zn−1 ), Q = T p (1 z1 . . . zm−1 0 . . . 0).
Формула (1.1) может быть переписана (с учётом gp−β,q−γ = 0) в следующем виде:
γ=q−1
β=p−1
fpq = gpq −
X
β=n−l+1
gp−β,q zβ −
X
γ=n−l+1
gp,q−γ z̄γ .
(1.4)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Некоторые задачи классификации матриц и их приложения
15
Формула (1.4) не содержит переменных zj степени два при всех
j ≥ n − l + 1, однако gpq = gpq (z1 , z2 , . . . , zn−l ) = gpq (x01 , x02 , . . . , x0n−l ).
Случай l = 3. Прежде всего заметим, что каноническая форма F содержит элементы fi,j , которые удовлетворяют (1.2). Число m единственным
образом определяется из условий: gk+1,1 = gk+2,1 = . . . , = gm−1,1 = 0, но
gm,1 6= 0.
(3.1) Пусть число m удовлетворяет двойному неравенству
k + 1 ≤ m ≤ n − 2, тогда мы потребуем, чтобы fm,n−1 = 0, fm,n = 0,
0
0
откуда однозначно найдём пару чисел zn−2 = zn−2
и zn−1 = zn−1
соответственно. И каноническая форма F имеет два дополнительных нуля
fm,n−1 = 0, fm,n = 0. Здесь St(F ) = I.
(3.2) Пусть m = n − 1, тогда мы определим число r следующим образом:
gk,2 = gk+1,2 = . . . = gr−1,2 = 0, но gr,2 6= 0. Если число r удовлетворяет
двойному неравенству k ≤ r ≤ n − 2, то мы положим fr,n = 0, fn−1,n = 0 и
0
0
найдём переменные zn−2 = zn−2
и zn−1 = zn−1
соответственно. И каноническая форма F имеет два дополнительных нуля fr,n = 0, и fn−1,n = 0. Здесь
St(F ) = I.
(3.3) Пусть m = r = n − 1, т.е. gi,1 = gj,2 = 0 для k + 1 ≤ i ≤ n − 2;
k ≤ j ≤ n − 2; но gn−1,1 6= 0, gn−1,2 6= 0. Положим fn−1,n−1 = 0 и получим,
что zn−2 = at + b, t ∈ R, a 6= 0, равенство же fn−1,n = 0 дает значение
zn−1 = ct + d; c, d ∈ C, c 6= 0. Может случиться, что fn,n (zn−2 , zn−1 ) = const,
тогда в подобной ситуации каноническая форма имеет два дополнительных
нуля fn−1,n−1 = 0 и fn−1,n = 0. Здесь St(F ) = T p(1, 0, . . . , at, ct), где
a 6= 0, t ∈ R. Если же fn,n (zn−2 , zn−1 ) = ut + v ∈ R, u 6= 0, то ∃! t0 , удовлетворяющий соотношению fn,n = ut0 + v = 0. Тогда каноническая форма F имеет
три дополнительных нуля fn−1,n−1 = 0, fn−1,n = 0 и fn,n = 0. Здесь St(F ) = I.
(3.4) Если m = n − 1, r = n, то возникает ситуация, полностью аналогичная пункту (3.3).
(3.5) Пусть теперь параметр m = n, т. е. gi1 = 0, если k + 1 ≤ i ≤ n − 1,
но gn,1 6= 0. Если r удовлетворяет двойному неравенству k ≤ r ≤ n − 2,
то мы положим последовательно fr,n = 0 и fn,n = 0 и найдем соответ0
и zn−1 = at + b, t ∈ R, a 6= 0. И каноническая
ственно zn−2 = zn−2
форма F имеет два дополнительных нуля fr,n = 0 и fn,n = 0. Здесь
St(F ) = T p(1, 0, . . . , 0, at), a 6= 0, t ∈ R.
(3.6) Пусть m = n, r = n − 1.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
16
Ю. И. Большаков
0
a) Если при этом, |g1,n | 6= |gn−1,2 |, тогда ∃!zn−2 = zn−2
и такой, что имеет
место fn−1,n = 0. Равенство fn,n = 0 дает zn−1 = at + b, t ∈ R, a 6= 0. Тогда
каноническая форма F содержит два дополнительных нуля fn−1,n = 0 и
fn,n = 0. При этом St(F ) = T p(1, 0, . . . , at), t ∈ R, a 6= 0.
0
b) Если же |g1,n | = |gn−1,2 |, то ∃! элемент fn−1,n = fn−1,n
и такой, что
0
|fn−1,n | = dist(0, Imfn−1,n ), и zn−2 = at + b, t ∈ R, a 6= 0. Равенство fn,n = 0
приводит к следующему выражению zn−1 = pτ + qt + s, τ, t ∈ R, p 6= 0.
Каноническая форма F имеет дополнительно как один экстремальный
0
0
элемент fn−1,n = fn−1,n
, обладающий свойством |fn−1,n
| = dist(0, Imfn−1,n ),
так и нулевой элемент fn,n = 0. Здесь St(F ) = T p(1, 0, . . . , 0, pτ + qt, at).
Заметим, что случай m = r = n исключен, поскольку det G 6= 0. Пусть числа
m и r удовлетворяют следующим условиям:
hk+1,1 = hk+2,1 = . . . = hm−1,1 = 0,
hm1 6= 0;
hk2 = hk+1,2 = . . . = hr−1,2 = 0,
hr2 6= 0.
Случай l = 4. Он гораздо сложнее, чем l ≤ 3, рассмотрен подробно в
[1], где существенно были задействованы результаты работы [2].
Дальнейшие исследования освещены в работе [3], где снято ограничение
на невырожденность H, но введено новое на параметр k : k ≥ 2n − 3.
Случай l = 5. k = 2n − 3, l = n − 2. Матрица H имеет вид


0
0
hn−2,n
0 0
hn−1,n−1 hn−1,n  , |hn−2,n | = 1.
, где H ′ =  0
H=
0 H′
hn,n−2 hn,n−1
hnn
5a) |hn−1,n−1 | 6= 1, т. е. hn−1,n−1 6= ±1.
Полагая последовательно fn−1,n = fnn = 0 найдем x1 и x2 из соотношений
fn−1,n = hn−1,n − hn−2,n x̄1 − hn−1,n−1 x1 = 0
fn,n = hnn − hn−1,n x̄1 − hn,n−1 x1 − hn−2,n x̄2 − hn,n−2 x2 + hn−1,n−1 x̄1 x1 = 0.
Именно x1 = x01 =
hn,n−1 hn−2,n −hn−1,n
,
1−h2n−1,n−1
1
x2 = hn−2,n (∆ + it), t ∈ R, где ∆ = (hnn + hn−1,n−1 x01 x̄01 − 2Re(hn,n−1 x01 )).
2


0
0
hn−2,n
0 0
hn−1,n−1
0 ,
, где F ′ =  0
Поэтому F =
0 F′
hn,n−2
0
0
StF = T p(1, 0, −ihn−2,n τ, −x3 , . . . , −xn−1 ), t ∈ R, xm ∈ C, m = 3, . . . , n − 1.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Некоторые задачи классификации матриц и их приложения
17
5b) |hn−1,n−1 | = 1, т.е. hn−1,n−1 = ±1.
Поскольку |hn−2,n |
=
|hn−1,n−1 |, то среди значений функции
0
fn−1,n = hn−1,n − hn−1,n−1 x1 − hn−2,n x̄1 существует единственное fn−1,n
arghn−2,n +arghn−1,n−1
0
2
, найтакое, что dist(0, Imfn−1,n ) = |fn−1,n
|. Полагая s = ei
0
дем вещественные параметры ρ и σ из соотношения fn−1,n = hn−1,n + ρs = iσs
в форме ρ = −Re(shn,n−1 ), σ = −Im(shn,n−1 ),
0
а полный прообраз элемента fn−1,n
при отображении fn−1,n = fn−1,n (x1 )
дает x1 = at + b, где
a=e
i
π+arghn−2,n −arghn−1,n−1
2
n−1,n−1
ρ i arghn−2,n −argh
2
, b=− e
,
2
Полагая fnn = 0, найдём
1
x2 = hn−2,n (∆ + it), t ∈ R, где∆ = (hnn + hn−1,n−1 x1 x̄1 − 2Re(hn,n−1 x1 )).
2


0
0
hn−2,n
0 0
0
 Точка
hn−1,n−1 fn−1,n
, где F ′ =  0
Поэтому F =
0 F′
0
hn,n−2 fn,n−1
0
0
fn−1,n принадлежит прямой, проходящей через 0 в направлении вектора is.
StF = T p(1, −at, −hn−2,n (−tRe(hn,n−1 a) +
hn−1,n−1 2
t + iτ ), −x3 ,
2
. . . , −xn−1 ); t, τ ∈ R, x3 , . . . , xn−1 ∈ C.
Случай l = 6. k = 2n − 3, l = n − 1. Матрица H имеет вид


0
0
0
0 0
, где H ′ =  0 hn−1,n−1 hn−1,n  , hn−1,n−1 = ±1,
H=
0 H′
0 hn,n−1
hnn
полагая fn−1,n = 0, найдем единственное x1 = x01 = hn−1,n−1 hn−1,n и поскольку
fnn не зависит
от
xj с j > 1, поэтому
0 0
,
F =
0 F ′

0
0
0
где F ′ =  0 hn−1,n−1 0  ,
0
0
hn,n
StF = T p(1, 0, −x2 , . . . , −xn−1 ), x2 , x3 , . . . , xn−1 ∈ C.
Случай l = 7. k = 2n − 2, l = n − 1. Матрица H имеет вид
0
hn−1,n
0 0
′
, где H =
, |hn−1,n | = 1;
H=
hn,n−1 hnn
0 H′
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
18
Ю. И. Большаков
полагая fnn = 0, найдем x1 из соотношения fnn = hnn −hn−1,n x̄1−hn,n−1 x
1 = 0.
0 0
, где
Именно, x1 = hn−1,n ( hnn
+ it), t ∈ R. Поэтому F =
2
0 F′
0
hn−1,n
,
F′ =
hn,n−1
0
StF = T p(1, hn−1,n it, −x2 , . . . , −xn−1 ), t ∈ R, x2 , x3 , . . . , xn−1 ∈ C.
0 0
,
Случай l = 8. k = 2n − 1, l = n. Матрица H имеет вид H =
0 hnn
где hnn = ±1. F = H, поэтому
StF = G0 = T p(1, −x1 , . . . , −xn−1 ), x1 , x2 , . . . , xn−1 ∈ C.
Рассмотрим теперь вопрос о единственности канонической формы F матрицы H в пунктах 5 — 8. Инварианты k, l и n разделяют между собой типы
матриц. Если же канонические матрицы F и F̃ имеют один и тот же тип
(k, l, n), то они совпадают.
2. Знаковая характеристика
H-самосопряженной матрицы
Для постановки основной задачи пункта 2 нам потребуется несколько
определений.
Определение 2.1. Пусть H — невырожденная комплексная самосопряженная матрица; т. е. H ∗ = H. Тогда H-сопряженной к матрице A ∈ Cn×n
называется матрица вида A[∗] := H −1 A∗ H.
Определение 2.2. Матрица A ∈ Cn×n называется H-самосопряженной,
если A[∗] = A.
Замечание 2.3. Если матрица A — матрица некоторого линейного оператора, действующего в Cn , а H — матрица полуторалинейной невырожденной
функции на Cn × Cn со значениями в C, то при смене базиса с помощью
матрицы перехода T соответствующая тройка матриц преобразуется по сле′
дующему закону: A′ = T −1 AT, H ′ = T ∗ HT, A′ [∗] := H ′ −1 A′ ∗ H ′ = T −1 A[∗] T,
т. е. матрица A[∗] при смене базиса изменяется по закону преобразования
матрицы оператора.
Пусть λ ∈ C, k ∈ N. Обозначим символами Jk (λ) и Qk соответственно
следующие



 k × k-матрицы
0 0 ... 0 1
λ 1 0 ... 0 0
 0 0 ... 1 0 
 0 λ 1 ... 0 0 






...
... 
...
...
. . .  , Qk = 
2.4. 
 = Jk (λ).
 ...
 0 1 ... 0 0 
 0 0 0 ... λ 1 
1 0 ... 0 0
0 0 0 ... 0 λ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Некоторые задачи классификации матриц и их приложения
19
Теорема 2.5. Пусть A — комплексная n × n H-самосопряженная матрица, тогда существует невырожденная комплексная n × n-матрица T и
такая, что
2.6. A′ := T −1 AT = Jk1 (λ1 ) ⊕ . . . ⊕ Jkα (λα ) ⊕ [Jkα+1 (λα+1 ) ⊕ Jkα+1 (λ̄α+1 )] ⊕
. . . ⊕ [Jkβ (λβ ) ⊕ Jkβ (λ̄β )], где λ1 , . . . , λα — вещественные, λα+1 , . . . , λβ —
невещественные собственные числа матрицы A с положительными вещественными частями,
2.7. H ′ := T ∗ HT = ε1 Qk1 ⊕ . . . ⊕ εα Qkα ⊕ Q2kα+1 ⊕ . . . ⊕ Q2kβ , причем
числа εi = ±1, i = 1, 2, . . . , α. Каноническая форма (A′ , H ′ ) пары (A, H)
определена однозначно с точностью до синхронной перестановки блоков в
паре (A′ , H ′ ).
Доказательство этой теоремы восходит к Вейерштрассу и Кронекеру, его
можно найти, например, в [4], [5] или [6].
2.8. Определение. Набор (ε1 , ε2 , . . . , εα ) из формулы 2.7 с ε = ±1,
i = 1, 2, . . . , α, носит название знаковой характеристики H-самосопряженной матрицы A (или пары (A, H)).
2.9. Замечание. Теорема 2.5 решает следующую задачу классификации.
Пусть G = GL(n, C),
X = {(A, H) ∈ Cn×n × Cn×n /A∗ H = HA, H ∗ = H, det H 6= 0};
где Z ∗ := Z̄ t — сопряженная к Z матрица. Действие G на X определено из
соотношения: ((A, H))ϕ(T ) = (T −1 AT, T ∗ HT ).
Легко видеть, что множество X инвариантно относительно ϕ(T ) для
∀T ∈ GL(n, C). Действие G на X с помощью ϕ не является ни транзитивным,
ни эффективным: пара (In , H) 7→ (In , H ′ ), т. е. первая компонента остается
на месте, а замена T 7→ eit T, t ∈ R задает одно и то же отображение. Орбиты действия группы G = GL(n, C) на множестве X = {(A, H)/A[∗] = A}
могут быть параметризованы парами (A′ , H ′ ), компоненты которых определены из соотношений 2.6 и 2.7 соответственно. Пары (A′ , H ′ ) определены с
точностью до синхронной перестановки блоков в прямой сумме вида 2.6 и
2.7.
Замечание 2.10. В формуле 2.6 собственные числа λs матрицы A могут,
вообще говоря, совпадать. Общее число mk (λk ) жордановых клеток порядка
k с собственным числом λk матрицы A′ может быть вычислено по формуле
2.11 mk (λk ) = rg(A − λk In )k−1 − 2rg(A − λk In )k + rg(A − λk In )k+1 , ([7]) или,
что равносильно, по формуле
2.12. mk (λk ) = 2dim Ker (A − λk In )k − dim Ker(A − λk In )k−1 −
dim Ker (A − λk In )k+1 ([8], §16).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
20
Ю. И. Большаков
3. Целочисленные инварианты
H-самосопряженной матрицы
3.1. Замечание. Числа mk (λk ) в формуле 2.11 являются скалярными
инвариантами матрицы A при действии группы G = GL(n, C) по правилу:
(A)ϕ(T ) = T −1 AT и, следовательно, являются скалярными инвариантами
пары (A, H) при действии той же группы по правилу:
((A, H))ϕ(T ) = (T −1 AT, T ∗ HT ), T ∈ GL(n, C).
Уточним результат, сформулированный в теореме 2.5, в той его части,
которая касается чисел εi = ±1 в формуле 2.7. Строго говоря, сами числа εi
инвариантами пары (A, H) не являются, а вот количество εi = 1 и εi = −1
в каждой размерности и каждом собственном числе λi — инвариант. Этот
результат приведен в теореме 3.6. Для его формулировки введем некоторые
обозначения, при этом будем считать, что пара (A, H) имеет канонический
вид.
Пусть mij — число жордановых клеток размера kij × kij матрицы A, отвечающих вещественному собственному числу λj , из которых m+
ij отвечает
ε = +1, а m−
отвечает
ε
=
−1.
Поэтому
ij
3.2. m+
+
m−
ij
ij = mij , при этом
3.3. λ1 < λ2 < . . . < λp , kij > ki+1,j , i = 1, 2, . . . , sj − 1, j = 1, 2, . . . , p.
Число p — количество всех различных вещественных собственных чисел
матрицы A, sj — число различных размеров жордановых клеток, отвечающих собственному числу λj , j = 1, 2, . . . , p. Из замечания 3.1 следует, что
числа mij — инварианты пары (A, H). Если нам удастся выразить разности
−
3.4. m+
ij − mij := Jij
через совместные
+ 1 инварианты пары (A, H), то из 3.2 и 3.4 получим
mij = 2 (mij + Jij ),
3.5
1
m−
ij = 2 (mij − Jij ), i = 1, 2, . . . , p.
3.6. Теорема. Числа Jij в формуле 3.4 могут быть найдены из следующих выражений:
3.7. Jij = ∆ij + (−1)ki−1,j −kij −1 ∆i−1,j , i = 2, 3, . . . , sj , j = 1, 2, , . . . , p,
3.8. J1j = ∆1j + (−1)k12 +k13 +...+k1j α1 + (−1)k13 +k14 +...+k1j α2 + . . . +
(−1)k1,j−1 +k1,j αj−2 + (−1)k1j αj−1 , где
Sl
X
3.9. αl =
(1 + (−1)ki,l −ki+1,l −1 )∆il , l = 1, 2, . . . , j − 1. Инварианты ∆ij
i=1
пары (A, H) определены из соотношений:
3.10. ∆ij := signH(A − λj )kij −1 − signH(A − λj )kij ,
j = 1, 2, . . . , [
p,
3.11. card ∆ij = s1 + s2 + . . . + sp ≤ n.
i,j
i = 1, 2, . . . , sj ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Некоторые задачи классификации матриц и их приложения
21
Символ sign S означает сигнатуру (разность между числом плюсов и
минусов) соответствующей полуторалинейной функции с матрицей S. Инва−
рианты m+
ij и mij вычисляются по формулам 3.5.
Доказательство теоремы 3.6 содержится в работе [9].
4. Критерий существования H-полярного
разложения матрицы
В работах [10] и [11] доказаны критерии существования H-полярного разложения матрицы X ∈ Fn×n над полем F = R и F = C соответственно,
т. е. найдены необходимые и достаточные условия представления матрицы
X ∈ Fn×n в виде:
X = U A,
(4.1)
где U — H-унитарная, (U [∗] U = I,) A — H-самосопряженная (A[∗] = A).
Операция [∗] определена на Fn×n соотношением: X [∗] = H −1 X ∗ H. Здесь
H ∗ = H, det H 6= 0 — фиксированная эрмитова матрица, X — произвольная
n × n-матрица с элементами из F. Приведем соответствующий результат из
работы [11].
Теорема 4.1. Пусть F = C. Тогда
(i) Для любого отрицательного собственного числа λ матрицы X [∗] X та
часть канонической формы (X [∗] X, H), которая этому λ соответствует,
может быть представлена в виде:
m
(diag (Ai )m
i=1 , diag (Hi )i=1 ),
где для всех i = 1, 2, . . . , m
Q ki
0
Jki (λ)
0
, Hi =
,
Ai =
0 −Qki
0
Jki (λ)
(4.2)
(4.3)
(В матрице Qp все элементы равны нулю, за исключением единиц, расположенных на побочной диагонали матрицы, т. е. qij = δi+j,p+1 ).
(ii) Часть канонической формы (X [∗] X, H), отвечающая нулевому собственному числу, может быть представлена в виде:
m
(diag (Bi )m
i=0 , diag (Hi )i=0 ),
(4.4)
где B0 = Ok0 ×k0 , H0 = Ip0 ⊕ −In0 , p0 + n0 = k0 , а для i = 1, 2, . . . , m пара
(Hi , Bi ) имеет одну из следующих двух форм:
Q ki
0
Jki (0)
0
, Hi =
, ki ≥ 1,
(4.5)
Bi =
0 −Qki
0
Jki (0)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
22
Ю. И. Большаков
или
Bi =
Jki (0)
0
0
Jki −1 (0)
, Hi = εi
Q ki
0
0 −Qki −1
,
(4.6)
где εi = 1 или εi = −1, ki > 1.
(iii) Пусть (ii) имеет место. Обозначим базис, отвечающий нильпотентной части (X [∗] X, H), символом
li
{eij }m,
i=0, j=1 ,
(4.7)
где l0 = k0 , а параметр li суть размер матрицы Bi при i > 1.
В этих обозначениях
Ker X = Span {ei,1 + ei,ki +1 |li = 2ki , i = 1, 2, . . . , m}⊕
0
Span {ei,1 |li = 2ki − 1, i = 1, 2, . . . , m} ⊕ Span {e0,j }kj=1
.
(4.8)
Приведем более эффективный критерий существования H-полярного разложения матрицы X. С этой целью введем понятие цепи нильпотентной матрицы.
p
M
Jmi (0) — нильпонтная матрица, соОпределение 4.1. Пусть A =
i=1
ставленная из жордановых блоков Jmi (0) c m1 ≥ m2 ≥ . . . mp . Всякую её
s
M
подматрицу A0 =
Jmi (0) назовём цепью, если разность mi − mi+1 = 0
i=1
или mi −mi+1 = 1, i = 1, 2, . . . , s−1. Блоки Jmi – звенья цепи, mi — их длины.
Определение 4.2. Цепь A0 , определенную матрицей A, назовем максимальной, если к ней нельзя добавить ни одного звена из A так, чтобы вновь
полученное объединение давало бы вновь цепь.
Очевидно, что всякая нильпотентная матрица A однозначно разбивается
в дизъюнктивное объединение максимальных цепей, т. е. таких, что ни одна
их пара не имеет общих звеньев.
Лемма 4.1. Для того чтобы матричное уравнение X 2 = A с заданной
нильпотентной матрицей A имело бы решение, необходимо и достаточно, чтобы каждая максимальная цепь матрицы A, не содержащая звеньев
длины 1, состояла бы из четного числа звеньев.
Доказательство этой леммы имеется в работе [12].
Теорема 4.2. Пусть H — невырожденная комплексная самосопряженная n × n-матрица и пусть для заданной матрицы X ∈ Cn×n матрица
X [∗] X представляет из себя цепь, состоящую из четного числа нильпотентных звеньев, если цепь не содержит звеньев длины 1, и без ограничения на их количество, если цепь содержит звенья длины 1. При этом
тройка (X [∗] X, H, Ker X) определена целочисленной матрицей K вида (9)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Некоторые задачи классификации матриц и их приложения
23
с натуральными nj = p − j + 1, j = 1, 2, . . . , s. Тогда матрица X допускает H-полярное разложение тогда и только тогда, когда целочисленные
параметры, составляющие матрицу K, удовлетворяют системе
+
+
kt = lt+ + lt−1
+ lt0 ,
(4.9)
−
−
−
kt = lt + lt−1 + lt0 , t = 1, 2, . . . s,
если ns = 1. Здесь l0+ = l0− = 0. Если же ns > 1, то исключением в формуле
(11) будут служить лишь параметры ks+ и ks− , для которых ls+ = ls− = 0.
Доказательство теоремы 4.2. имеется в работе [13].
Литература
[1] Большаков Ю. И., Райхштейн Б. Об одной задаче классификации матриц // Труды третьих колмогоровских чтений. Ярославль: ЯГПУ, 2005.
С. 137 — 145.
[2] Большаков Ю. И. Некоторые свойства функции f = ax + bx̄ + c // Математика и математическое образование. Теория и практика: Межвуз. сб.
научн. тр. Вып. 2. Ярославль: ЯГПУ, 2002. С. 3 — 5.
[3] Большаков Ю. И., Райхштейн Б. З. Классификация некоторых специальных форм матриц // Математика в Ярославском университете: Сб.
обзорных статей к 30-летию математического факультета. Ярославль:
ЯрГУ, 2006. С. 43 — 54.
[4] Мальцев А. И. Основы линейной алгебры. М.: Наука, 1970. C. 400.
[5] Gohberg I., Lancaster P. and Rodman L. Matrices and Indefinite Scalar
Products. OT 8. Birkhäser, Basel, 1983.
[6] Thompson R. S. Pencils of complex and real symmetric and scew matrices //
Linear Algebra and its Applications. 1991. V. 147. P. 323 — 371.
[7] Попов В. Л. Жорданова матрица. // Математическая энциклопедия. М.:
Сов. энциклопедия, 1979. Т. 2. C. 424 — 425.
[8] Федорчук В. В. Курс аналитической геометрии и линейной алгебры. М.:
Изд.-во МГУ, 1990. С. 328.
[9] Большаков Ю. И. О знаковых инвариантах одной из классификаций пар
матриц // Математика, кибернетика, информатика: Труды междунар.
науч. конф. Ярославль, 2008. С. 62 — 67.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
24
Ю. И. Большаков
[10] Большаков Ю. И. Псевдополярное разложение линейного оператора //
Вопросы теории групп и гомологической алгебры. Ярославль: ЯрГУ,
1994. С. 23 — 32.
[11] Bolshakov Yu., Mee C. V. M. van der, Ran A. C. M., Reichstein B. and
L. Rodman. Polar decomposition in finite dimensional indefinite scalar
product spaces: General theory. // Linear Algebra and its Applications. 1997.
V. 261, Issues 1–3. P. 91–141.
[12] Большаков Ю. И. Матричное уравнение X 2 = A // Вопросы теории
групп и гомологической алгебры. Ярославль: ЯрГУ, 1990. С. 21 — 25.
[13] Большаков Ю. И. Критерий существования H-полярного разложения матриц // Труды четвертых Колмогоровских чтений. Ярославль:
ЯГПУ, 2006. С. 113 — 116.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 519.17
О центроиде и псевдоцентроиде
вершинно-взвешенного связного графа
Г. М. Бродский
e-mail: brodskii@gmail.com
Для вершинно-взвешенного связного графа доказываются теоремы, характеризующие в терминах весов ветвей его
центроид, псевдоцентроид, двойственные им объекты и устанавливающие связи обменного центра с ними.
Библиография: 29 названий.
1. Введение
Рассматриваются конечные неориентированные графы без кратных ребер
и петель, используется терминология книги [19].
Восходящее к Жордану [22] понятие центроида дерева принадлежит к
числу самых известных в теории графов. Оно исследовалось и обобщалось
на случай связного (или даже любого) графа многими авторами. Результаты
статьи связаны с одним из таких обобщений, первоначально введенным для
растений [12, 13] (т. е. связных графов, в которых любое ребро принадлежит
не более чем одному простому циклу [11]). В работе [25] для произвольного
дерева определяется телефонный центр и доказывается теорема о его совпадении с центроидом (ошибка в приведенном там доказательстве обнаружена
и исправлена в [18]). Дальнейшее исследование центроида растения, включающее обобщение этой теоремы, осуществлено в [1]. Следующим шагом стало
изучение телефонного центра и центроида связного графа, начатое в [10] и
продолженное в [3, 5, 6, 8, 9].
Результаты настоящей статьи, анонсированные автором в [2], получены
при попытке распространить теоремы о телефонном центре, центроидных
элементах и центроиде на случай вершинно-взвешенного связного графа. В
качестве аналога телефонного центра здесь вводится и изучается обменный
центр, связанный с одной оптимизационной задачей, допускающей прикладную интерпретацию. Выяснение достаточно сложного соотношения между
25
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
26
Г. М. Бродский
обменным центром и центроидом вершинно-взвешенного связного графа потребовало дальнейшего развития техники, использующей веса ветвей, с привлечением соображений двойственности двоякого рода между вершинами и
блоками. Во-первых, наряду со старшими по весу элементами предлагается
рассматривать младшие по весу. Во-вторых, с помощью весов ветвей определяется антитонное отображение частично упорядоченного по включению
множества элементов вершинно-взвешенного связного графа в себя. Оно индуцирует инволютивный антиавтоморфизм его подмножества, элементы которого названы псевдоцентроидными, а старший из них по весу — псевдоцентроидом. Однако если два способа дуализации псевдоцентроида приводят к
одному и тому же понятию копсевдоцентроида, то для центроида появляются
два различных двойственных объекта — коцентроид и антицентроид. В статье получено полное описание в терминах весов ветвей центроида вершинновзвешенного связного графа и четырех родственных ему объектов, указанных выше. Относительно обменного центра вершинно-взвешенного связного
графа доказывается, что он всегда лежит в псевдоцентроиде, в случае единичных весов вершин совпадает с антицентроидом, а для дерева — с центроидом. Среди следствий — существование в любом связном графе блока,
содержащего обменный центр, центроид и медиану.
2. Формулировки основных результатов
Условимся употреблять обозначения: |A| и Ā — число элементов и булеан
конечного множества A; V(G), E(G) и Bl(G) — множества вершин, ребер и
блоков графа G; |G| = | V(G)| — мощность графа G; E(G, u) — множество
ребер графа G, инцидентных вершине u.
Под вершинно-взвешенным (реберно-взвешенным) графом будем понимать пару (G, p) (соответственно (G, q)), где G — граф, а p : V(G) → R
(соответственно q : E(G) → R) — функция, называемая вершинным (реберным) взвешиванием; при этом всегда будет предполагаться, что p принимает только положительные значения, а q — только неотрицательные.
Функции p и q стандартным способом продолжим до (так же обозначенP
ных) функций
p
:
V(G)
→
R
и
q
:
E(G)
→
R,
положив
p(X)
=
u∈X p(u)
P
и q(Y ) = e∈Y q(e) (при X = ∅ и Y = ∅ соответствующие суммы считаются равными 0). Это дает возможность, строя по (G, p) новый граф, вершинами которого являются некоторые непустые подмножества в V(G), считать его вершинно-взвешенным. Вершину u графа (G, q) назовем q-свободной
(q-занятой), если q(E(G, u)) = 0 (соответственно q(E(G, u)) > 0). Кроме того, для произвольных подграфа H графа (G, p) и подграфа K графа (G, q)
положим p(H) = p(V(H)) и q(K) = q(E(K)).
Перенесем на случай вершинно-взвешенного связного графа (G, p) список определений, данных в [10] для связного графа, модифицируя последние
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О центроиде и псевдоцентроиде графа
27
при необходимости, и дополним его новыми определениями. Элементами
графа (G, p) называются его вершины и блоки (при этом каждая вершина графа отождествляется с порожденным ею подграфом). Множество всех
элементов графа (G, p) обозначим через El(G, p). Два элемента называются
сравнимыми, если один из них является подграфом другого. Если два элемента сравнимы и не равны, то они называются инцидентными. Ветвями
элемента x называются компоненты связности графа, получающегося из G
удалением всех ребер элемента x, если они есть, и вершины x в противном
x
случае. Всюду ниже β(x) (соответственно Br(x) = {B1x , . . . , Bβ(x)
}) — количество ветвей (соответственно множество всех ветвей) элемента x и bxi = p(Bix )
(1 6 i 6 β(x)). Для элемента x и числа i ∈ {1, . . . , β(x)} определим элемент
ai (x) следующим образом. Если x — вершина, то ai (x) — блок, инцидентный
вершине x и смежным с ней вершинам ветви Bix . Если x — блок, то ai (x) —
вершина ветви Bix , инцидентная блоку x. Подграф H графа (G, p) назовем
a (v)
миниветвью вершины v ∈ V(G), если v ∈
/ V(H) и H = Bj i для некоторых i ∈ {1, . . . , β(v)} и j ∈ {1, . . . , β(ai (v))}. Пусть µ(v) (соответственно
v
Mb(v) = {M1v , . . . , Mµ(v)
}) — количество миниветвей (соответственно множество всех миниветвей) вершины v и mvj = p(Mjv ) (1 6 j 6 µ(v)). Ветви
элемента x и миниветви вершины v будем всегда занумеровывать так, что
bx1 > bx2 > . . . > bxβ(x) и mv1 > mv2 > . . . > mvµ(v) . Если |G| > 2, то для элемента x и вершины v графа (G, p) положим b(x) = bx1 и m(v) = mv1 . Если
же |G| = 1, так что El(G, p) = {x}, где x — вершина и β(x) = µ(x) = 0,
то полагаем b(x) = m(x) = 0. Ветвь Bix элемента x (миниветвь Mjv вершины v) называется тяжелой (минитяжелой), если bxi = b(x) (соответственно mvj = m(v)). Определим отображение El(G, p) → El(G, p), сопоставив каждому элементу x элемент x∗ , определяемый условием: x∗ = a1 (x),
если x имеет единственную тяжелую ветвь, и x∗ = x в противном случае.
Легко проверяется, что оно оказывается антитонным отображением частично упорядоченного по включению множества El(G, p) в себя. Для любого
E ∈ El(G, p) положим E ∗ = {x∗ | x ∈ E}. Элемент x ∈ El(G, p) назовем центроидным, если b(x) 6 b(y) для всех y ∈ El(G, p). Центроидный элемент x будем называть особенным, если x ∈ V(G) и существует центроидный элемент
y ∈ V(G) \ {x}, и неособенным в противном случае. Центроидный элемент x
назовем уницентроидным, если x является единственным центроидным элементом графа (G, p). Уницентроидный элемент x назовем моноуницентроидным, если x имеет единственную тяжелую ветвь, и полиуницентроидным
в противном случае. Центроидный элемент x будем называть центроидом
вершинно-взвешенного связного графа (G, p) и обозначать через Z(G, p), если p(x) > p(y) для всякого центроидного элемента y ∈ El(G, p). Неособенный центроидный элемент x будем называть антицентроидом вершинноe
взвешенного связного графа (G, p) и обозначать через Z(G,
p), если p(x) 6 p(y)
для всякого неособенного центроидного элемента y ∈ El(G, p). Элемент x
будем называть коцентроидом вершинно-взвешенного связного графа (G, p)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
28
Г. М. Бродский
и обозначать через Z∗ (G, p), если x = z ∗ для элемента z = Z(G, p). Элемент x ∈ El(G, p) назовем псевдоцентроидным, если x∗∗ = x. Псевдоцентроидный элемент x будем называть псевдоцентроидом (копсевдоцентроидом)
вершинно-взвешенного связного графа (G, p) и обозначать через P(G, p) (соответственно P∗ (G, p)), если p(x) > p(y) (соответственно p(x) 6 p(y)) для
всякого псевдоцентроидного элемента y ∈ El(G, p). Ниже будет показано,
что центроид, коцентроид, антицентроид, псевдоцентроид и копсевдоцентроид графа (G, p) определены однозначно. Множества всех центроидных и всех
псевдоцентроидных элементов графа (G, p) обозначим соответственно через
Zel(G, p) и Pel(G, p).
Предполагая, что E(G) 6= ∅, реберное взвешивание q : E(G) → R назовем согласованным с p, если q(E(G, u)) 6 p(u) для всех u ∈ V(G). Множество
всех реберных взвешиваний графа (G, p), согласованных с p, обозначим через
Q(G, p). Если q ∈ Q(G, p), то вершину u назовем полностью q-занятой, если
q(E(G, u)) = p(u). Реберное взвешивание q ◦ ∈ Q(G, p) назовем наибольшим,
если q ◦ (G) > q(G) для всех q ∈ Q(G, p). Число q ◦ (G), не зависящее от выбора наибольшего реберного взвешивания q ◦ ∈ Q(G, p), обозначим через [G, p].
С каждой вершиной v вершинно-взвешенного связного графа (G, p), имеющей µ(v) > 2 миниветвей, свяжем граф (Gv , p), определяемый условиями
V(Gv ) = V(G) \ {v} и E(Gv ) = {{x, y} | x, y ∈ V(Gv ) и в графе G существует
простая (x-y)-цепь, проходящая через v}. Число [Gv , p] назовем обменным
числом вершины v вершинно-взвешенного связного графа (G, p) и обозначим через t(v). В случае µ(v) 6 1 полагаем t(v) = 0. Подграф T(G, p) графа
(G, p), порожденный множеством всех вершин v ∈ V(G), для которых t(v)
максимально, назовем обменным центром вершинно-взвешенного связного
графа (G, p). Из данных выше определений можно получить определения
центроидного элемента и центроида Z(G) связного графа G [10], а также
e
коцентроида Z∗ (G), антицентроида Z(G),
псевдоцентроидного элемента,
псевдоцентроида P(G), копсевдоцентроида P∗ (G) и обменного центра T(G)
связного графа G, снабжая G тривиальным вершинным взвешиванием p, все
значения которого равны 1.
Теорема 2.1. Если (G, p) — вершинно-взвешенный связный граф, то
1) (G, p) имеет не более трех центроидных элементов;
2) (G, p) имеет не более двух псевдоцентроидных элементов;
3) центроид, коцентроид, антицентроид, псевдоцентроид и копсевдоцентроид графа (G, p) определены однозначно;
4) всякий центроидный элемент графа (G, p) является подграфом центроида Z(G, p);
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О центроиде и псевдоцентроиде графа
29
5) любой псевдоцентроидный элемент графа (G, p) сравним как с любым
псевдоцентроидным, так и с любым центроидным элементом графа
(G, p);
6) любой псевдоцентроидный элемент графа (G, p) является певдоцентроидом P(G, p) или копсевдоцентроидом P∗ (G, p);
7) P(G, p)∗ = P∗ (G, p) и P∗ (G, p)∗ = P(G, p);
8) Zel(G, p)∗ = Pel(G, p)∗ = Pel(G, p);
e
9) P∗ (G, p) ⊆ Z(G,
p) ⊆ Z(G, p) ⊆ P(G, p) и P∗ (G, p) ⊆ Z∗ (G, p) ⊆ P(G, p),
причем если | Z(G, p)| = 1, то Z(G, p) = P∗ (G, p), а если | Z(G, p)| > 2, то
Z(G, p) = P(G, p).
Замечание 2.1. Теорема 2.1, в частности, обобщает теорему о центроиде
связного графа [10].
Теорема 2.2. Пусть (G, p) — вершинно-взвешенный связный граф. Тогда
1) если (G, p) имеет моноуницентроидный элемент v мощности |v| = 1 и
элемент v ∗ обозначен через x, то
v 6= x, x∗ = v,
Zel(G, p) = {v}, Pel(G, p) = {v, x},
e
Z(G, p) = Z(G,
p) = P∗ (G, p) = v,
Z∗ (G, p) = P(G, p) = x;
2) если (G, p) имеет моноуницентроидный элемент x мощности |x| > 2 и
элемент x∗ обозначен через v, то
|x| > 3, x 6= v, v ∗ = x,
Zel(G, p) = {x}, Pel(G, p) = {v, x},
e
Z(G, p) = Z(G,
p) = P(G, p) = x,
∗
∗
Z (G, p) = P (G, p) = v;
3) если (G, p) имеет полиуницентроидный элемент x, то
|x| 6= 2, x∗ = x,
Zel(G, p) = Pel(G, p) = {x},
e
Z(G, p) = Z∗ (G, p) = Z(G,
p) = P(G, p) = P∗ (G, p) = x;
4) если (G, p) имеет ровно два центроидных элемента, то существуют вершина v ∈ V(G) и блок x ∈ Bl(G) мощности |x| > 3 такие, что
v ∗ = x, x∗ = v,
Zel(G, p) = Pel(G, p) = {v, x},
Z(G, p) = P(G, p) = x,
e
Z∗ (G, p) = Z(G,
p) = P∗ (G, p) = v;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
30
Г. М. Бродский
5) если (G, p) имеет ровно три центроидных элемента, то существуют две
смежные вершины v, w ∈ V(G) и блок x ∈ Bl(G) мощности |x| = 2
такие, что ребро {v, w} — мост графа G,
V(x) = {v, w}, v ∗ = w∗ = x∗ = x,
Zel(G, p) = {v, w, x},
Pel(G, p) = {x},
e
Z(G, p) = Z∗ (G, p) = Z(G,
p) = P(G, p) = P∗ (G, p) = x.
Следствие 2.1. Если (G, p) является вершинно-взвешенным деревом, то
e
Z(G, p) = Z(G,
p) = P∗ (G, p) и Z∗ (G, p) = P(G, p).
Замечание 2.2. Из утверждения 1) теоремы 2.1 следует, что пятью случаями, выделенными в формулировке теоремы 2.2, исчерпываются все возможные ситуации. То, что каждый из них реализуется даже для связных графов
(с вершинным взвешиванием, тождественно равным 1), подтверждается примерами в части 3. Для распознавания случая, имеющего место для заданного
вершинно-взвешенного связного графа (G, p), можно привлекать содержащиеся в предложении 3.1 характеризации моноуницентроидных (см. (5) ⇔ (6))
и полиуницентроидных (см. (7) ⇔ (8)) элементов, а также две следующие
теоремы.
Теорема 2.3. Для любого вершинно-взвешенного связного графа (G, p) равносильны утверждения:
1) (G, p) имеет ровно два центроидных элемента;
2) (G, p) имеет единственную вершину v, для которой b(v) = p(G)/2;
3) (G, p) имеет вершину v, для которой b(v) = p(G)/2 и |v ∗ | > 3;
4) (G, p) имеет блок x мощности |x| > 3, для которого b(x) = p(G)/2.
Теорема 2.4. Для любого вершинно-взвешенного связного графа (G, p) равносильны утверждения:
1) (G, p) имеет ровно три центроидных элемента;
2) (G, p) имеет две различные вершины v и w, для которых b(v) 6 p(G)/2
и b(w) 6 p(G)/2;
3) (G, p) имеет две различные вершины v и w, для которых
b(v) = b(w) = p(G)/2;
4) (G, p) имеет вершину v, для которой b(v) = p(G)/2 и |v ∗ | = 2;
5) (G, p) имеет блок x мощности |x| = 2, для которого b(x) = p(G)/2;
6) | Z(G, p)| = 2.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О центроиде и псевдоцентроиде графа
31
Замечание 2.3. В части 3 приводится пример дерева G, для которого
P(G) 6= Z(G). Учитывая, что P(G) и Z(G) сравнимы по теореме 2.1, легко проверить, что псевдоцентроид и центроид, рассматриваемые на классе
конечных деревьев, являются теориями центра — близнецами в смысле работы [4] (определение теории центра предлагается и исследуется в [7] с целью
унификации центра, центроида и других понятий подобного рода в случае
деревьев).
Теорема 2.5. Если (G, p) — вершинно-взвешенный связный граф, то его
обменный центр T(G, p) — подграф псевдоцентроида P(G, p).
Теорема 2.6. Если G — связный граф, то его обменный центр T(G) совпаe
дает с антицентроидом Z(G).
Следствие 2.2. Если G — дерево, то его обменный центр T(G) совпадает с
центроидом Z(G).
Замечание 2.4. Следствия 2.1 и 2.2 вместе с примерами из части 3 показыe
вают, что центроид Z(G, p), антицентроид Z(G,
p), копсевдоцентроид P∗ (G, p)
и обменный центр T(G, p) вершинно-взвешенного связного графа (G, p) являются различными обощениями центроида дерева, а псевдоцентроид P(G, p)
и коцентроид Z∗ (G, p) — различными обобщениями псевдоцентроида дерева. Среди других обобщений центроида дерева отметим медиану M(G, p)
вершинно-взвешенного связного графа (G, p) [16] (совпадение медианы M(G)
дерева G с центроидом Z(G) доказано в [23]), а также более близкие к нашему понятия центроида не обязательно связного графа G, ассоциированные с
выпуклостями различных типов в графах [26, 27, 28]. Центроид вершинновзвешенного дерева рассматривался в [14].
Следствие 2.3. В любом связном графе G существует блок, содержащий
обменный центр T(G), центроид Z(G), коцентроид Z∗ (G), псевдоцентроид
P(G), копсевдоцентроид P∗ (G) и медиану M(G).
Замечание 2.5. Следствие 2.3 является аналогом ряда известных результатов. Например, центр связного графа лежит в блоке [21]. Аналогичные
теоремы верны для медианы [6] и s-центра [24].
Замечание 2.6. Известно [15], что для любого графа G существует связный
граф H, центр которого изоморфен G. Таким же свойством обладает медиана [29]. Однако для центроида, четырех родственных ему понятий (коцентроида, антицентроида, псевдоцентроида, копсевдоцентроида) и, следовательно,
обменного центра аналогичные утверждения оказываются неверными. Для
них имеют место очевидные факты, формулируемые иначе. Например, для
графа G существует связный граф H, обменный центр которого изоморфен
G, тогда и только тогда, когда G — блок. Некоторым утешением служит
Теорема 2.7. Для любого графа G существует вершинно-взвешенный связный граф (H, p), обменный центр которого изоморфен G и является подграфом, порожденным множеством всех вершин веса 1.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
32
Г. М. Бродский
3. Доказательства, замечания, примеры
Лемма 3.1. Пусть (G, p) — вершинно-взвешенный связный граф мощности
|G| > 2, v ∈ V(G) и x ∈ Bl(G), причем b(v) 6 p(G)/2. Тогда
1) b(v) 6 b(x);
2) если b(v) = b(x), то
а) x = v ∗ ,
б) b(v) = p(G)/2,
в) если |x| = 2, т. е. V(x) = {v, w}, то b(w) = b(v) и x = w∗ = x∗ ,
г) если |x| > 3, то v = x∗ ,
д) b(v) < b(y) для всех y ∈ Bl(G) \ {x}.
Доказательство. Выберем j так, что v ∈ V(Bjx ). Если некоторая тяжелая
ветвь Biv ⊆ Bjx , то b(x) > bxj > b(v). В противном случае v имеет единственную
тяжелую ветвь и V(x) \ {v} ⊆ V(B1v ). При этом если v и x не инцидентны,
то b(x) > bxj > p(G) − b(v) > b(v). Если же v и x инцидентны, то x = v ∗
и b(x) > bxj = p(G) − b(v) > b(v). Остается заметить, что утверждение б)
следует из равенства b(v) + b(x) = p(G), а утверждения в), г), д) очевидны.
Лемма 3.2. Пусть (G, p) — вершинно-взвешенный связный граф,
v, w ∈ V(G), причем b(v) 6 p(G)/2 и v 6= w. Тогда
1) b(v) 6 b(w);
2) если b(v) = b(w), то
а) v и w смежны,
б) ребро {v, w} — мост графа G (т. е. блок x ∈ Bl(G), инцидентный v
и w, имеет мощность 2),
в) b(v) = b(x) = p(G)/2,
г) x = v ∗ = w∗ = x∗ ,
д) b(v) < b(u) для всех u ∈ V(G) \ {v, w}.
Доказательство. Выберем j так, что v ∈ V(Bjw ). Если некоторая тяжелая ветвь Biv ⊆ Bjw , то b(w) > bw
j > b(v). В противном случае v имеет единственную тяжелую ветвь и w ∈ V(B1v ). При этом если v и w не
смежны, то b(w) > bw
j > p(G) − b(v) > b(v). Если же v и w смежны, то
w
b(w) > bj > p(G) − b(v) > b(v). Пусть теперь b(v) = b(w). Тогда, меняя
ролями вершины v и w, обнаруживаем, что w имеет единственную тяжелую ветвь и v ∈ V(B1w ), так что j = 1 и x = v ∗ = w∗ . Если |x| > 3,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О центроиде и псевдоцентроиде графа
33
то p(G) < b(v) + b(w) 6 p(G), что невозможно. Следовательно, |x| = 2,
b(v)+b(w) = p(G), b(v) = b(w) = p(G)/2 = b(x) и x∗ = x. Остается доказать д).
Действительно, если b(v) = b(u) для некоторой вершины u ∈ V(G) \ {v, w},
то {v, u}, {w, u} ∈ E(G), что противоречит б).
Лемма 3.3. Если (G, p) — вершинно-взвешенный связный граф, x, y ∈ Bl(G),
причем b(x) 6 p(G)/2 и x 6= y, то b(x) < b(y).
Доказательство. Выберем j так, что x ⊆ Bjy . Если некоторая тяжелая ветвь
Bix ⊆ Bjy , то b(y) > byj > b(x). В противном случае x имеет единственную
тяжелую ветвь, y ⊆ B1x и b(y) > byj > p(G) − b(x) > b(x), что и требуется. Лемма 3.4. Пусть (G, p) — вершинно-взвешенный связный граф мощности
|G| > 2, x ∈ Bl(G) и v ∈ V(G), причем b(x) 6 p(G)/2. Тогда
1) b(x) 6 b(v);
2) если b(x) = b(v), то
а) x = v ∗ ,
б) b(x) = p(G)/2,
в) если |x| = 2, т. е. V(x) = {v, w}, то b(w) = b(x) и x = w∗ = x∗ ,
г) если |x| > 3, то v = x∗ ,
д) если существует вершина w ∈ V(G) \ {v}, для которой b(x) = b(v),
то V(x) = {v, w}.
Доказательство. Выберем j так, что V(x) \ {v} ⊆ V(Bjv ). Если некоторая тяжелая ветвь Bix ⊆ Bjv , то b(v) > bvj > b(x) (а при |x| > 3 даже
b(v) > bvj > b(x)). В противном случае x имеет единственную тяжелую ветвь,
v ∈ V(B1x ) и b(v) > bvj > p(G)−b(x) > b(x). Остается учесть леммы 3.1 и 3.2. Лемма 3.5. Для любого вершинно-взвешенного связного графа (G, p) существует x ∈ El(G, p), для которого b(x) 6 p(G)/2.
Доказательство. Предположив противное, выберем вершину v ∈ V(G) так,
что b(v) 6 b(u) для всех u ∈ V(G). Поскольку b(v) > p(G)/2, то v имеет
единственную тяжелую ветвь и v ∗ 6= v. Учитывая, что b(v ∗ ) > p(G)/2, за∗
/ V(B1w ) и
ключаем, что v ∈
/ V(B1v ). Для вершины w = v ∗∗ получаем, что v ∈
b(w) < b(v), что противоречит выбору вершины v.
Лемма 3.6. Пусть (G, p) — вершинно-взвешенный связный граф и x, y —
его центроидные элементы, причем x 6= y. Равносильны утверждения:
1) x и y инцидентны;
2) x∗ = y или y ∗ = x;
3) хотя бы один из центроидных элементов x и y является неособенным.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
34
Г. М. Бродский
Если оба центроидных элемента x и y являются неособенными, то утверждениям 1)–3) равносильно
4) x∗ = y и y ∗ = x.
Доказательство. 1) ⇒ 2). Без ограничения общности можно считать,
что x ∈ V(G) и y ∈ Bl(G). Применяя леммы 3.1–3.5, выводим, что
b(x) = b(y) = p(G)/2 и x∗ = y.
2) ⇒ 3). Предположив, что оба центроидных элемента являются особенными, с учетом лемм 3.1–3.5 видим, что x и y — смежные вершины, что
противоречит 2).
3) ⇒ 1). Ввиду лемм 3.1–3.5.
В случае неособенных центроидных элементов x, y эквивалентность
1) ⇔ 4) также следует из лемм 3.1–3.5.
Из лемм 3.1–3.6 имеем
Следствие 3.1. Центроид, коцентроид и антицентроид вершинно-взвешенного связного графа (G, p) определены однозначно.
Пусть (G, p) — вершинно-взвешенный связный граф. Рассмотрим следующие свойства элемента x ∈ El(G, p):
(1) x является центроидным элементом графа (G, p);
(2) b(x) 6 p(G)/2;
(3) x является уницентроидным элементом графа (G, p);
(4) b(x) < p(G)/2;
(5) x является моноуницентроидным элементом графа (G, p);
(6) x∗ 6= x и b(x) < p(G)/2;
(7) x является полиуницентроидным элементом графа (G, p);
(8) x∗ = x и |x| 6= 2;
(9) x является центроидом графа (G, p);
(10) либо |x| = 1 (т. е. x — вершина) и b(x) < p(G)/2, либо |x| > 2 (т. е.
|G| > 2 и x — блок) и b(x) 6 p(G)/2;
(11) x сравним с некоторым центроидным элементом y ∈ El(G, p);
(12) хотя бы один из элементов x и x∗ является центроидным элементом
графа (G, p);
(13) min(b(x), b(x∗ )) 6 p(G)/2;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О центроиде и псевдоцентроиде графа
35
(14) x сравним с центроидом графа (G, p);
(15) хотя бы один из элементов x и x∗ является центроидом графа (G, p);
(16) x является псевдоцентроидным и центроидным элементом графа (G, p);
(17) x является псевдоцентроидным элементом графа (G, p) и b(x) 6 p(G)/2;
(18) x является неособенным центроидным элементом графа (G, p);
(19) x является псевдоцентроидным, но не является центроидным элементом графа (G, p);
(20) x является псевдоцентроидным элементом графа (G, p) и b(x) > p(G)/2;
(21) x и x∗ являются соответственно псевдоцентроидным и моноуницентроидным элементами графа (G, p);
(22) x = y ∗ для некоторого моноуницентроидного элемента y графа (G, p);
(23) x является псевдоцентроидным элементом графа (G, p);
(24) x является неособенным центроидным элементом графа (G, p) или
x = y ∗ для некоторого моноуницентроидного элемента y графа (G, p);
(25) x является коцентроидом графа (G, p);
(26) выполняется одно из условий:
а) x = y ∗ для некоторого моноуницентроидного элемента y графа
(G, p),
б) x∗ = x,
в) |x| = 1, b(x) = p(G)/2 и |x∗ | > 3;
(27) выполняется одно из условий:
а) x является псевдоцентроидным, но не является центроидным элементом графа (G, p),
б) x является полиуницентроидным элементом графа (G, p),
в) x — неособенный центроидный элемент графа (G, p), |x| 6 2 и
b(x) = p(G)/2.
Предложение 3.1. Для вершинно-взвешенного связного графа (G, p) и
x ∈ El(G, p) имеют место следующие эквивалентности и импликации:
(1) ⇔ (2), (3) ⇔ (4), (5) ⇔ (6), (7) ⇔ (8), (9) ⇔ (10), (11) ⇔ (12) ⇔ (13),
(14) ⇔ (15), (16) ⇔ (17) ⇔ (18), (19) ⇔ (20) ⇔ (21) ⇔ (22), (23) ⇔ (24),
(25) ⇔ (26) ⇔ (27), (5) ⇒ (3) ⇒ (9) ⇒ (16) ⇒ (23) ⇒ (14) ⇒ (11),
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
36
Г. М. Бродский
(16) ⇒ (1) ⇒ (14), (7) ⇒ (3), (25) ⇒ (23), (7) ⇒ (25), (19) ⇒ (25). Если
x ∈ V(G), то условия (11)–(15) равносильны.
Доказательство. Прежде всего отметим, что эквивалентности (1) ⇔ (2),
(3) ⇔ (4), (9) ⇔ (10), (16) ⇔ (18) и импликация (7) ⇒ (8) непосредственно
следуют из лемм 3.1–3.5, а импликации (5) ⇒ (3) ⇒ (9), (16) ⇒ (23), (12) ⇒
(11), (16) ⇒ (1), (7) ⇒ (3), (15) ⇒ (14) ⇒ (11) и (21) ⇒ (22) очевидны.
Кроме того, ввиду уже доказанной эквивалентности (1) ⇔ (2) справедливы
эквивалентности (12) ⇔ (13), (16) ⇔ (17) и (19) ⇔ (20), а из уже доказанной
эквивалентности (3) ⇔ (4) вытекает эквивалентность (5) ⇔ (6).
(1) ⇒ (14). Пусть x ∈ Zel(G, p) и z = Z(G, p). Достаточно, предположив,
что x 6= z, доказать, что x и z инцидентны. Ввиду лемм 3.1–3.5, z является
неособенным центроидным элементом. Остается применить лемму 3.6.
(8) ⇒ (7). При |G| = 1 доказываемое утверждение очевидно. Если |G| > 2,
то x имеет более одной тяжелой ветви и поэтому b(x) 6 p(G)/2. Более того,
поскольку |x| 6= 2, то b(x) < p(G)/2. Остается использовать уже доказанную
импликацию (4) ⇒ (3).
(9) ⇒ (16). Ввиду лемм 3.1–3.5, x является неособенным центроидным
элементом. Остается учесть уже доказанную импликацию (18) ⇒ (16).
(11) ⇒ (12). Достаточно доказать, что если x ∈
/ Zel(G, p) (и, следователь∗
но, x 6= y), то x = y. Действительно, если x ∈ V (G), то y ∈ Bl(G), откуда с
учетом центроидности элемента y и уже доказанной импликации (1) ⇒ (2)
получаем, что x∗ = y. Если же x ∈ Bl(G), то y ∈ V(G), и аналогичное рассуждение с привлечением условия x ∈
/ Zel(G, p) вновь дает, что x∗ = y.
(14) ⇒ (15). Пусть x сравним с центроидом z графа (G, p). Достаточно
рассмотреть случай, когда x 6= z. Используя импликацию (9) ⇒ (10) вместо
(1) ⇒ (2), рассуждаем так же, как в доказательстве импликации (11) ⇒ (12),
и находим, что x∗ = z.
(20) ⇒ (21). Поскольку x∗∗ = x и b(x) > p(G)/2, то x имеет единственную
тяжелую ветвь и x∗ 6= x = x∗∗ . Поэтому x∗ тоже имеет единственную тяжелую ветвь, x = a1 (x∗ ) и b(x) + b(x∗ ) = p(G). Следовательно, b(x∗ ) < p(G)/2 и
остается учесть уже доказанную импликацию (4) ⇒ (3).
(22) ⇒ (20). Принимая во внимание уже доказанную импликацию
(3) ⇒ (4), имеем: x = y ∗ для некоторого y ∈ El(G, p), имеющего единственную тяжелую ветвь и такого, что b(y) < p(G)/2. Тогда b(x) > p(G)/2, x имеет
единственную тяжелую ветвь, x∗ = y и x∗∗ = y ∗ = x.
(23) ⇔ (24). Ввиду уже доказанных эквивалентностей (16) ⇔ (18) и
(19) ⇔ (22).
(23) ⇒ (14). Ввиду уже доказанной импликации (19) ⇒ (22).
(25) ⇒ (26). Пусть z = Z(G, p), тогда x = z ∗ . Если z — моноуницентроидный элемент графа (G, p), то выполняется а). Если z — полиуницентроидный
элемент графа (G, p), то, ввиду уже доказанной импликации (7) ⇒ (8), имеет
место б). Если (G, p) имеет ровно два центроидных элемента, то с помощью
лемм 3.1–3.5 находим, что |z| > 3, |x| = 1, x∗ = z и b(x) = p(G)/2, так что
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О центроиде и псевдоцентроиде графа
37
справедливо в). Наконец, если (G, p) имеет ровно три центроидных элемента,
то |z| = 2 и z ∗ = z, т. е. выполняется б).
(26) ⇒ (27). Ввиду уже доказанных импликаций (22) ⇒ (19), (8) ⇒ (7) и
лемм 3.1–3.5.
(27) ⇒ (25). Ввиду уже доказанных импликаций (19) ⇒ (22), (7) ⇒ (8) и
лемм 3.1–3.5.
(25) ⇒ (23). Ввиду уже доказанных импликаций (25) ⇒ (27), (7) ⇒ (8) и
(18) ⇒ (16).
(7) ⇒ (25), (19) ⇒ (25). Ввиду уже доказанной импликации (27) ⇒ (25).
Если x ∈ V(G), то (11) ⇔ (14) в силу лемм 3.1–3.5.
Замечание 3.1. Эквивалентности (1) ⇔ (2) и (14) ⇔ (13) из предложения 3.1, справедливые, если x — вершина, являются различными обобщениями теоремы 1 из [23], характеризующей центроидные вершины дерева
(в случае дерева вершина является центроидной тогда и только тогда, когда
она сравнима с центроидом [17]).
Доказательство теорем 2.1 и 2.2. Однозначная определенность центроида,
коцентроида и антицентроида графа (G, p) уже известна (см. следствие 3.1).
Утверждение 4) теоремы 2.1 — это импликация (1) ⇒ (14) из предложения 3.1. Теорема 2.2 доказывается прямым применением лемм 3.1–3.5 и предложения 3.1. Остальные утверждения теоремы 2.1 можно либо извлечь из
лемм 3.1–3.5 и предложения 3.1, либо убедиться в их справедливости проверкой в каждом из пяти случаев, указанных в формулировке теоремы 2.2.
Доказательство следствия 2.1. Поскольку каждый элемент x дерева (G, p)
имеет мощность |x| 6 2, то из пяти случаев, выделенных в формулировке
теоремы 2.2, остаются только 1), 3) и 5). Но в каждом из них доказываемые
равенства верны.
Доказательство теорем 2.3 и 2.4. Ввиду лемм 3.1–3.6.
Лемма 3.7. Пусть (G, p) — вершинно-взвешенный полный граф мощности
|G| = n > 2 и V(G) = {v1 , . . . , vn }, причем p1 > p2 > . . . > pn , где pi = p(vi )
(1 6 i 6 n). Тогда [G, p] = min(p(G)/2, p(G) − p1 ).
Доказательство. Прежде всего заметим, что q(E(G, v1 )) 6 p2 + . . . +
pn для любого q ∈ Q(G, p). Положив p′ (v1 ) = min(p1 , p2 + . . . + pn ) и
p′ (vi ) = pi (2 6 i 6 n), приходим к вершинно-взвешенному полному
графу (G, p′ ), для которого [G, p′ ] = [G, p]. Поэтому остается доказать,
что для вершинно-взвешенного полного графа (G, p), удовлетворяющего
условию леммы и такого, что p2 + . . . + pn > p1 , справедливо равенство
[G, p] = p(G)/2. С этой целью выберем наименьшее натуральное m, для которого p1 + . . . + pm > pm+1 + . . . + pn . Отметим, что если n = 2, то m = 1.
Если m = 1, то p1 = p2 + . . . + pn . Рассмотрим вершинно-взвешенный
полный граф (H, p) с V(H) = {u1 , u2 }, где u1 = {v1 } и u2 = {v2 , . . . , vn }.
Поскольку [H, p] = p(H)/2 = p(G)/2, то и [G, p] = p(G)/2.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
38
Г. М. Бродский
Если m > 2 (и, следовательно, n > 3), то строим вершинно-взвешенный
полный граф (K, p) с V (K) = {w1 , w2 , w3 }, где w1 = {v1 , . . . , vm−1 }, w2 = {vm }
и w3 = {vm+1 , . . . , vn }. Определим s ∈ Q(K, p), положив
s(w1 , w2 ) = (p1 + . . . + pm − pm+1 − . . . − pn )/2,
s(w1 , w3 ) = (p1 + . . . + pm−1 − pm + pm+1 + . . . + pn )/2,
s(w2 , w3 ) = (pm + . . . + pn − p1 − . . . − pm−1 )/2.
Поскольку s(K) = p(K)/2 = p(G)/2, то [K, p] = p(G)/2 = [G, p].
Лемма 3.8. Если (G, p) — вершинно-взвешенный связный граф и v ∈ V(G),
то t(v) = min((p(G) − p(v))/2, p(G) − p(v) − m(v)).
Доказательство. При µ(v) 6 1 доказываемое утверждение очевидно. В случае µ(v) > 2 рассмотрим вершинно-взвешенный полный граф (H, p), где
v
V(H) = {M1v , . . . , Mµ(v)
}. Если x, y ∈ V(Gv ), то {x, y} ∈ E(Gv ) тогда и только
тогда, когда x и y принадлежат различным миниветвям вершины v. Поэтому [Gv , p] = [H, p] и доказательство завершается применением леммы 3.7 к
графу (H, p).
Доказательство теоремы 2.5. Согласно теореме 2.1, Z(G, p) ⊆ P(G, p), и достаточно для произвольной вершины v ∈ V(T(G, p)) \ V(Z(G, p)) убедиться в том, что v ∈ V(P(G, p)). Ввиду предложения 3.1, b(v) > p(G)/2 и
b(x) > p(G)/2, где x = v ∗ . Рассмотрим два случая.
1. Пусть |x| = 2. Тогда V(x) = {v, w}, где w = x∗ . Положим
c = p(V(G) \ (V(B1v ) ∪ {v})) и d = p(V(B1v ) \ {w}). Если q ∈ Q(Gv , p) —
наибольшее реберное взвешивание, то всякое ребро e ∈ E(Gv ) с q(e) > 0 соединяет вершину из V(G) \ (V(B1v ) ∪ {v}) с вершиной из V(B1v ). Имеющийся
произвол в выборе q позволяет, конструируя q, в первую очередь стараться
сделать полностью q-занятыми вершины из V(B1v ) \ {w}. При этом может
возникнуть лишь одна из следующих двух ситуаций.
1.1. Вершина w оказалась q-свободной и не все вершины из V(B1v ) \ {w}
полностью q-заняты (т. е. c < d). Тогда, выбрав вершину u ∈ V(B1v ) \ {w},
для которой q(E(Gv , u)) < p(u), рассмотрим
ε = min(p(v), p(u) − q(E(Gv , u))) > 0.
Полагая q ′ (v, u) = ε, получаем возможность так модифицировать
q ∈ Q(Gv , p) до наибольшего реберного взвешивания q ′ ∈ Q(Gw , p), что
q ′ (Gw ) > q(Gv ). Тем самым установлено, что t(w) > t(v), что противоречит
условию v ∈ V(T(G, p)). Следовательно, ситуация 1.1 невозможна.
1.2. Все вершины из V(B1v ) \ {w} оказались полностью q-занятыми (т. е.
c > d). Тогда ветвь вершины w, содержащая v, является единственной тяжелой ветвью, так как ее p-вес равен c+p(v) > c, а p-вес любой другой ветви вершины w (если она есть) не превосходит d. Поэтому w∗ = x, b(v) + b(w) = p(G)
и b(w) < p(G)/2. Применяя предложение 3.1 и теорему 2.2, заключаем, что
w — моноуницентроидный элемент графа (G, p), P(G, p) = x и, следовательно, v ∈ V(P(G, p)).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О центроиде и псевдоцентроиде графа
39
2. Пусть |x| > 3. Тогда единственная тяжелая ветвь элемента x не содержит v (в противном случае p(G) < b(v) + b(x) = p(G), что невозможно) и
w 6= v, где w = x∗ . Положим h = p(V(G)\(V(B1x )∪{v})) и k = p(V(B1x )\{w}).
Если q ∈ Q(Gv , p) — наибольшее реберное взвешивание, то всякое ребро
e ∈ E(Gv ) с q(e) > 0 соединяет вершину из V(G)\(V(B1x )∪{v}) с вершиной из
V(B1x ). Имеющийся произвол в выборе q позволяет, конструируя q, в первую
очередь стараться сделать полностью q-занятыми вершины из V(B1x ) \ {w}.
При этом может возникнуть лишь одна из следующих двух ситуаций.
2.1. Вершина w оказалась q-свободной и не все вершины из V(B1x ) \ {w}
полностью q-заняты (т. е. h < k). Тогда, выбрав вершину u ∈ V(B1x ) \ {w},
для которой q(E(Gv , u)) < p(u), рассмотрим
δ = min(p(v), p(u) − q(E(Gv , u))) > 0.
Полагая q ′ (v, u) = δ, получаем возможность так модифицировать
q ∈ Q(Gv , p) до наибольшего реберного взвешивания q ′ ∈ Q(Gw , p), что
q ′ (Gw ) > q(Gv ). Тем самым установлено, что t(w) > t(v), что противоречит
условию v ∈ V(T(G, p)). Следовательно, ситуация 2.1 невозможна.
2.2. Все вершины из V(B1x ) \ {w} оказались полностью q-занятыми (т. е.
h > k). Тогда ветвь вершины w, содержащая v, является единственной тяжелой ветвью, так как ее p-вес равен h + p(v) > h, а p-вес любой другой ветви вершины w (если она есть) не превосходит k. Поэтому w∗ = x,
b(x) + b(w) = p(G) и b(w) < p(G)/2. Применяя предложение 3.1 и теорему 2.2,
заключаем, что w — моноуницентроидный элемент графа (G, p), P(G, p) = x
и, следовательно, v ∈ V(P(G, p)).
Лемма 3.9. Если G — связный граф, то T(G) ⊆ Z(G).
Доказательство. Сохраняя обозначения, использованные в доказательстве
теоремы 2.5, покажем, что ситуации 1.2 и 2.2 в случае единичных весов вершин невозможны.
1.2. Поскольку c и d — целые числа и 0 6 c − d < 1, то c = d. Но тогда
p(G)/2 < b(v) = c + 1 = b(w) < p(G)/2, чего быть не может.
2.2. Поскольку h и k — целые числа и 0 6 h − k < 1, то h = k. Но тогда
p(G)/2 < b(x) = h + 1 = b(w) < p(G)/2, чего быть не может.
Доказательство теоремы 2.6. Ввиду леммы 3.9, T(G) ⊆ z, где z = Z(G).
e
Для доказательства равенства T(G) = Z(G)
остается вычислить и сравнить
между собой обменные числа всех вершин из V(z). Рассмотрим четыре возможных случая.
e
1. Пусть |z| = 1. Тогда очевидно, что T(G) = z = Z(G).
2. Пусть |z| = 2. Тогда V(z) = {v, w} и, ввиду теоремы 2.2,
b(v) = b(w) = |G|/2 > (|G| − 1)/2. С помощью леммы 3.8 находим, что
e
t(v) = |G| − 1 − |G|/2 = t(w). Поэтому T(G) = z = Z(G).
3. Пусть |z| > 3 и | Zel(G)| = 2. Тогда, ввиду теоремы 2.2, существует
вершина v ∈ V(z), для которой b(v) = b(z) = k, где k = |G|/2 — натуральное
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
40
Г. М. Бродский
число. Заметим, что любая миниветвь вершины v имеет вес, меньший k,
т. е. не превосходящий числа k − 1 < (|G| − 1)/2. С помощью леммы 3.8
находим, что t(v) = (2k − 1)/2. Далее, у каждой вершины u ∈ V(z) \ {v}
есть миниветвь веса k, очевидно являющаяся минитяжелой. Вновь используя
e
лемму 3.8, получаем, что t(u) = 2k − 1 − k < t(v). Значит, T(G) = v = Z(G)
по теореме 2.2.
4. Пусть |z| > 3 и | Zel(G)| = 1. Тогда, ввиду предложения 3.1, b(z) < |G|/2.
Для каждой вершины u ∈ V(z) любая ее миниветвь имеет вес, меньший
|G|/2. Если |G| = 2m — четное, то упомянутые веса миниветвей не превосходят m − 1 < (|G| − 1)/2. Если |G| = 2m − 1 — нечетное, то эти веса
также не превосходят m − 1 = (|G| − 1)/2. Итак, эти веса всегда не превосходят (|G| − 1)/2, откуда с учетом леммы 3.8 и теоремы 2.2 выводим, что
e
t(u) = (|G| − 1)/2 и T(G) = Z(G) = Z(G).
Доказательство следствия 2.2. Поскольку каждый элемент x дерева G имеет мощность |x| 6 2, то из четырех случаев, рассмотренных в доказательстве
теоремы 2.6, остаются только 1 и 2. Но в каждом из них доказываемое равенство выполняется.
Доказательство следствия 2.3. Достаточно заметить, что, ввиду теоремы 3
из [6] и теорем 2.1 и 2.6, P(G) содержит M(G), Z(G), Z∗ (G), P∗ (G), T(G). Доказательство теоремы 2.7. Построим надграф H графа G и снабдим его вершинным взвешиванием p так, чтобы T(H, p) = G и
V(G) = {v ∈ H | p(v) = 1}. Если |G| = 1, то достаточно положить H = G.
Пусть теперь |G| = n > 2 и V(G) = {v1 , . . . , vn }. Определим V(H) и E(H)
как результаты добавления к V(G) и E(G) соответственно n новых вершин
u1 , . . . , un и 2n новых ребер {vi , ui }, {ui , vi (mod n)+1 } (1 6 i 6 n). Кроме
того, положим p(vi ) = 1 и p(ui ) = 2 для всех i (1 6 i 6 n). Ясно, что
V(G) = {v ∈ V(H) | p(v) = 1}. Остается убедиться в том, что T(H, p) = G.
Действительно, H — блок по теореме 3.3 из [19]. Поскольку
m(ui ) = 2 6 (3n − 2)/2 = (p(H) − p(ui ))/2
и
m(vi ) = 2 6 (3n − 1)/2 = (p(H) − p(vi ))/2,
то, ввиду леммы 3.8,
t(vi ) = (p(H) − p(vi ))/2 = (3n − 1)/2 > (3n − 2)/2 = (p(H) − p(ui ))/2 = t(ui )
для всех i (1 6 i 6 n). Окончательно получаем: T(H, p) = G, что завершает
доказательство.
Примеры. Рассмотрим восемь вершинно-взвешенных связных графов,
указывая цифрой вес каждой вершины рядом с ней за исключением тех вершин, для которых полагаем его равным 1:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
41
О центроиде и псевдоцентроиде графа
c
c
vc
c
c
@
@c
c
s
xc
x
@sv
c
c
x s
v w
s
xc
c
(G′′5 , p)
G′5
G4
s
@
G′′3
c
@s
@
@c
s
G′′′
3
s
@x
@s
G′3
G2
s
@x
G1
c
vs x ws
1
2
3
s
Эти графы показывают, в частности, что пять случаев из формулировки
теоремы 2.2 реализуются для связных графов (с весами вершин, равными
1), а случаи 1), 3), 5) — даже для деревьев. Следуя обозначениям из теоремы 2.2, мы указываем на приведенных диаграммах вершины и элементы,
играющие особую роль. При этом для показа отличного от вершины элемента x изображаем вершины из V(x) черными точками. Итак, G1 , G2 , G4
′
′′
иллюстрируют случаи 1), 2), 4); G′3 , G′′3 , G′′′
3 — случай 3), а G5 , G5 — случай 5). Полиуницентроидный элемент x графа G′3 (соответственно G′′3 , G′′′
3)
имеет 0 (соответственно 2, 3) тяжелых ветвей. Подчеркнем, что G1 — дерево, для которого P(G) 6= Z(G). Из теоремы 2.7 видно, что обменный центр
T(G, p) вершинно-взвешенного связного графа (G, p) может быть отличен от
e
Z(G, p), Z∗ (G, p), Z(G,
p), P(G, p) и P∗ (G, p). Граф (G′′5 , p) показывает, что
такая ситуация возможна даже для вершинно-взвешенного дерева.
Литература
[1] Борисова Л. Н. О телефонном центре и центроиде растения // Вопр.
теории групп и гомол. алгебры. Ярославль: ЯрГУ, 1985. С. 152–153.
[2] Бродский Г. М. Об обменном центре, центроиде и псевдоцентроиде графа // Актуальные проблемы математики и информатики: Сб. статей к
20-летию факультета ИВТ / отв. ред. П. Г. Парфенов. Ярославль: ЯрГУ,
2007. С. 20–25.
[3] Бродский Г. М., Бондарчук Л. М. О центроиде связного графа // Моделирование и анализ вычислительных систем. Ярославль: ЯрГУ, 1987.
С. 148.
[4] Бродский Г. М., Гетманенко А. О. О теориях центра — близнецах //
Вопр. теории групп и гомол. алгебры. Ярославль: ЯрГУ, 1994. С. 94–97.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
42
Г. М. Бродский
[5] Бродский Г. М., Иванова Я. В. О центроиде и медиане связного графа //
Параллельные вычислительные системы и процессы. Ярославль: ЯрГУ,
1991. С. 43–49.
[6] Бродский Г. М., Китаева О. Р. О центроиде графа // Вопр. теории групп
и гомол. алгебры. Ярославль: ЯрГУ, 1991. С. 99–103.
[7] Бродский Г. М., Лустгартен Ю. Л., Садова С. В. О теориях центра в
деревьях // Вопр. теории групп и гомол. алгебры. Ярославль: ЯрГУ,
1994. С. 88–93.
[8] Бродский Г. М., Наханов З. В. О телефонном центре, центроиде и псевдоцентроиде вершинно-взвешенного связного графа // Студенческие заметки по информатике и математике: Материалы науч. конф. студентов
и аспирантов факультета ИВТ. / Отв. ред. А. Н. Морозов. Вып. 2. Ярославль: ЯрГУ, 2008. С. 82–85.
[9] Бродский Г. М., Файницкая И. В. О центроиде графа // Вычислительные системы и их модели. Ярославль: ЯрГУ, 1990. С. 119–122.
[10] Бродский Г. М., Хоменко М. Г. О телефонном центре и центроиде связного графа // VII Всесоюз. конф. «Проблемы теоретической кибернетики»: Тезисы докладов. Ч. 1. Иркутск, 1985. С. 33–34.
[11] Диниц Е. А., Карзанов А. В., Ломоносов М. В. О структуре системы
минимальных реберных разрезов графа // Исследования по дискретной
оптимизации. М.: Наука, 1976. С. 290–306.
[12] Зайцев М. А. О каноническом виде и линейном упорядочении некоторых
древовидных графов // Кибернетика. 1978. № 2. С. 120–124.
[13] Зайцев М. А. Теорема о центроиде растения // Науч. тр. Моск. ин-та
стали и сплавов. 1980. № 126. С. 86–89.
[14] Кельманс А. К. О выборе оптимальной вершины в графе // Исследования по дискретной математике. М.: Наука, 1973. С. 151–158.
[15] Копылов Г. Н., Тимофеев Е. А. О центрах и радиусах графов // Успехи
мат. наук. 1977. Т. 32, № 6. С. 226.
[16] Кристофидес Н. Теория графов. Алгоритмический подход. М.: Мир,
1978. 432 с.
[17] Оре О. Теория графов. М.: Наука, 1980. 336 с.
[18] Пономаренко Т. Ю. О телефонном центре дерева // Вопр. теории групп
и гомол. алгебры. Ярославль: ЯрГУ, 1982. С. 142–143.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О центроиде и псевдоцентроиде графа
43
[19] Харари Ф. Теория графов. М.: Мир, 1973. 300 с.
[20] Buckley F., Miller Z., Slater P. J. On graphs containing a given graph as
center // J. Graph Theory. 1981. V. 5, №4. P. 427–434.
[21] Harary F., Norman R. Z. Dissimilarity characteristic theorems for graphs //
Proc. Amer. Math. Soc. 1960. V. 11. P. 332–334.
[22] Jordan C. Sur les assemblages de lignes // J. Reine Angew. Math. 1869.
V. 70. P. 185–190.
[23] Kang A., Ault D. Some properties of a centroid of a free tree // Inform.
Process. Lett. 1975. V. 4, № 1. P. 18–20.
[24] Melter R. A., Tomescu I. Remarks on distances in graphs // An şti. Univ.
Iaşi. Sec. 1a. 1981. V. 27, № 2. P. 407–410.
[25] Mitchell S. L. Another characterization of the centroid of a tree // Discrete
Math. 1978. V. 24, № 3. P. 277–280.
[26] Nieminen J. Distance center and centroid of a median graph // J. Franklin
Inst. 1987. V. 323, № 1. P. 89–94.
[27] Nieminen J. Annihilators in graphs // Result. Math. 1988. V. 13, № 1–2.
P. 140–146.
[28] Piotrowski W. A generalization of branch weight centroids // Zastos mat.
1987. V. 19, №3–4. P. 541–545.
[29] Slater P. J. Medians of arbitrary graphs // J. Graph Theory. 1980. V. 4,
№ 4. P. 389–392.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 517.926
Хаотическая буферность
∗
С. Д. Глызин, А. Ю. Колесов
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: glyzin@uniyar.ac.ru, kolesov@uniyar.ac.ru
Для большого числа нелинейных динамических систем, эволюционирующих во времени, характерна ситуация, при которой
подходящий выбор параметров приводит к тому, что в фазовом пространстве системы сосуществует сколь угодно большое
число однотипных устойчивых режимов (состояний равновесия,
циклов, торов и т. д.). Такую ситуацию будем называть буферностью. Соответствующий феномен естественно называть хаотической буферностью в том случае, когда сосуществуют хаотические аттракторы. В настоящей работе предлагается общая идея, руководствуясь которой, можно получать различные
цепочки связанных осцилляторов с хаотической буферностью. В
качестве конкретных примеров рассматриваются цепочки диффузионно связанных обобщенных кубических уравнений Шредингера и нелинейных телеграфных уравнений. Приводится также
пример системы, имеющей бесконечномерный хаотический аттрактор. Данная работа подготовлена для сборника трудов, выпускаемого к юбилею математического факультета, и содержит краткое изложение статей [1, 2] авторов.
Библиография: 13 названий.
1. Постановка задачи
Как известно, цепочки и решетки связанных генераторов с сосредоточенными параметрами являются полезными физически содержательными моделями, позволяющими выяснить ряд закономерностей развития
пространственно-временного хаоса в сплошных средах [3, 4, 5]. При этом,
Работа выполнена при финансовой поддержке Целевой программы ”Развитие научного
потенциала высшей школы” (проект РНП.2.1.1/5857).
∗
44
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
45
Хаотическая буферность
как правило, в качестве отдельно взятого звена цепочки (парциальной системы) рассматривается генератор, описывающийся системой обыкновенных
дифференциальных уравнений с единственным устойчивым циклом. Например, в работах [3, 4, 5] бралась одна и та же парциальная система
u̇ = u − d|u|2 u,
d = 1 + ic0 ,
c0 ∈ R ,
(1)
где u – комплекснозначная функция, но рассматривались различные отвечающие ей цепочки. А именно, в [3, 4] изучалась цепочка однонаправленно
связанных генераторов (1), т. е. система вида
u̇j + α(uj − uj−1 ) = uj − d|uj |2 uj , j = 1, 2, . . . , α ∈ C ,
(2)
а в [5] – аналогичная цепочка диффузионно связанных генераторов
u̇j = α(uj+1 − 2uj + uj−1 ) + uj − d|uj |2 uj , j = 1, . . . , N , α ∈ C ,
(3)
где u0 = uN , uN +1 = u1 , Re α > 0. Было установлено, что в обоих случаях при
достаточно большом количестве звеньев в соответствующей системе может
наблюдаться хаотическое поведение, обусловленное коллективным взаимодействием парциальных осцилляторов.
Предположим теперь, что в цепочках (2), (3) или в какой-либо аналогичной цепочке каждое звено заменено на генератор с распределенными параметрами, в котором реализуется феномен буферности в простейшем его
варианте, когда речь идет о циклах. В итоге получим систему, имеющую
(при определенных дополнительных условиях) достаточно большое число
сосуществующих хаотических аттракторов. Как будет показано ниже при
рассмотрении конкретных примеров, для того чтобы добиться требуемого
эффекта вовсе не обязательно брать цепочку из большого числа звеньев, как
это обычно делается в случае сосредоточенных осцилляторов. Достаточно
ограничиться некоторым минимально допустимым их количеством.
Приступим к математическому описанию проблемы. В качестве парциальной системы при построении интересующей нас цепочки осцилляторов
возьмем обобщенное кубическое уравнение Шредингера и дополним его граничными условиями 2π-периодичности. В итоге получим краевую задачу
ut + iσ0 uxx = u − d|u|2 u , u(t, x + 2π) ≡ u(t, x) ,
(4)
где u = u(t, x) – комплекснозначная функция, d = 1 + ic0 , а c0 , σ0 – положительные параметры, связанные неравенством
σ0 > 2c0 .
(5)
Приведенную задачу будем рассматривать как эволюционную систему в
фазовом пространстве (Re u, Im u) ∈ E ×E, где E – гильбертово пространство
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
46
С. Д. Глызин, А. Ю. Колесов
2π-периодических функций класса W22 . Подчеркнем, что выбранная таким
способом парциальная система обладает требуемым свойством буферности.
Действительно, как показывает несложная проверка, краевая задача (4) имеет счетное число автомодельных циклов (бегущих волн)
u = exp[i(σ0 n2 − c0 )t + inx] , n = 0, ±1, ±2, . . . ,
(6)
которые являются устойчивыми (в метрике E ×E) при условии (5) и неустойчивыми при выполнении строго противоположного неравенства.
Рассмотрим, далее, цепочку диффузионно связанных осцилляторов (4),
т. е. систему вида
ut + iσ0 uxx + iµΛu = u − d |u|2 ∗ u , u(t, x + 2π) ≡ u(t, x) ,
(7)
где u = colon (u1 , . . . , uN ), |u|2 = colon (|u1 |2 , . . . , |uN |2 ); uj = uj (t, x),
j = 1, . . . , N – комплекснозначные функции; натуральное N ≥ 5 произвольно фиксировано; µ > 0 – малый параметр; ∗ – операция покоординатного
умножения векторов, а матрица связи Λ размера N × N задана равенством


−1 1 0 . . . . . . 0
 1 −2 1 0 . . . 0 


0

1
−2
1
.
.
.
0

Λ=
. . . . . . . . . . . . . . . . . . .


 0 ... 0
1 −2 1 
0 ... ... 0
1 −1
Как будет установлено ниже, при выполнении условия (5) эта система имеет
счетное число устойчивых N -мерных торов, причем при некоторых дополнительных ограничениях на параметр c0 каждый из них является носителем
хаотического аттрактора.
2. Основной результат
Обратимся сначала к отвечающей задаче (7) точечной модели, т. е. к
системе
u̇ + iµΛu = u − d |u|2 ∗ u ,
(8)
и убедимся, что при всех достаточно малых µ > 0 она имеет глобально
экспоненциально устойчивый N -мерный инвариантный тор. С этой целью
сначала сделаем в ней замены uj = ρj exp(iτj ), j = 1, . . ., N , где ρj > 0,
0 ≤ τj ≤ 2π (mod 2π). В результате она преобразуется к виду
ρ̇j = ρj − ρ3j + µ[ρj+1 sin αj − ρj−1 sin αj−1 ] , j = 1, . . . , N ,
(9)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
47
Хаотическая буферность
α̇j =
−c0 (ρ2j+1
−
ρ2j )
ρj−1
ρj+1
ρj
ρj+2
cos αj −
cos αj+1 +
−
cos αj−1 ,
−µ
ρj+1
ρj+1
ρj
ρj
j = 1, . . . , N − 1 ,
(10)
ρN −1
τ̇N = −c0 ρ2N − µ
cos αN −1 − 1 ,
(11)
ρN
где τ0 = τ1 , τN +1 = τN , ρ0 = ρ1 , ρN +1 = ρN , αj = τj+1 − τj .
Нетрудно заметить, что интересующий нас глобально устойчивый инвариантный тор заведомо существует у системы (9) – (11) при µ = 0. Действительно, в этом случае он задается равенствами ρj = 1, j = 1, . . . , N , а
поведение траекторий на нем описывают уравнения α̇j = 0, j = 1, . . . , N − 1,
τ̇N = −c0 . Далее, из общих результатов монографии [6] следует, что указанный тор сохраняется у системы (9) – (11) и при всех малых µ > 0, причем
теперь он имеет вид:
ρj = 1 + µ ψj (α1 , . . . , αN −1 , µ) , j = 1, . . . , N ,
(12)
где достаточно гладкие по совокупности переменных 2π-периодические по
αk , k = 1, . . . , N − 1 функции ψj таковы, что
ψj (α1 , . . . , αN −1 , 0) =
1
(sin αj − sin αj−1 ) , j = 1, . . . , N .
2
(13)
Что же касается движений на данном торе, то они описываются системой
α̇j = µΦj (α1 , . . . , αN −1 , µ) ,
τ̇N = −c0 + µΨ(α1 , . . . , αN −1 , µ) , j = 1, . . . , N − 1 ,
(14)
получающейся из (10), (11) при учете соотношений (12). Отметим еще вытекающие из (13) равенства
Φj |µ=0 = −c0 (sin αj+1 − 2 sin αj + sin αj−1 ) + cos αj−1 − cos αj+1 ,
j = 1, . . . , N − 1 ;
Ψ(α1 , . . . , αN −1 , 0) = c0 sin αN −1 − cos αN −1 + 1 .
(15)
Лемма 1. Найдется такое достаточно малое число µ0 > 0, что
при всех 0 < µ ≤ µ0 краевая задача (7) имеет пространственно однородный
(не зависящий от x) инвариантный тор
uj = exp(iτj )[1 + µ ψj (α1 , . . . , αN −1 , µ)] , j = 1, . . . , N ,
(16)
движения на котором задаются системой (14). Данный тор экспоненциально орбитально устойчив (неустойчив) в метрике фазового пространства E 2N = E × . . . × E при σ0 − 2c0 > 0 (< 0).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
48
С. Д. Глызин, А. Ю. Колесов
В части существования лемма уже доказана, поскольку найденный выше
инвариантный тор (16) системы (8) является одновременно и пространственно однородным тором задачи (7). Для исследования же его свойств устойчивости достаточно положить µ = 0. Действительно, в этом случае рассматриваемый тор представляет собой прямое произведение N независимых циклов
uj = exp(−ic0 t), j = 1, . . . , N , каждый из которых устойчив в своей парциальной системе
∂uj /∂t + iσ0 ∂ 2 uj /∂x2 = uj − d|uj |2 uj , uj (t, x + 2π) ≡ uj (t, x)
при выполнении условия (5) и неустойчив при строгом его нарушении.
Проблему нахождения других аттракторов задачи (7), отличных от однородного тора (16), существенно облегчает так называемый принцип самоподобия [7]. Суть этого принципа заключается в следующем. Выполним в (7)
замену u(t, x) = Tn [v(t, x)], где
Tn [v(t, x)] = v(t, 2σ0 nt + x) exp[i(σ0 n2 t + nx)] ,
(17)
n – произвольное целое число, а затем перейдем к новой пространственной
переменной ϕ = 2σ0 nt + x. В результате для функции v = v(t, ϕ) с точностью
до обозначений получим прежнюю краевую задачу
vt + iσ0 vϕϕ + iµΛv = v − d |v|2 ∗ v , v(t, ϕ + 2π) ≡ v(t, ϕ) .
Иными словами, оператор (17) переводит решение u(t, x) задачи (7) в решение Tn [u(t, x)] той же самой краевой задачи.
Из принципа самоподобия вытекают два важных следствия. Во-первых,
пусть в фазовом пространстве E 2N краевой задачи (7) имеется компактное
множество A, инвариантное относительно ее траекторий
Re u(t, x), Im u(t, x) : Re u = (Re u1 , . . . , Re uN ) , Im u = (Im u1 , . . . , Im uN )
(18)
(как обычно, это означает, что если (Re u, Im u) ∈ A при t = 0, то аналогичное включение справедливо при всех t ∈ R). Тогда, применяя к каждой
траектории (18) из A оператор
fn :
T
Re u(t, x), Im u(t, x) → Re Tn [u(t, x)], Im Tn [u(t, x)] ,
(19)
получим серию множеств
fn (A) , n = 0, ±1, ±2, . . . ,
An = T
(20)
также инвариантных для траекторий задачи (7). Во-вторых, если в предыдущем случае A – аттрактор краевой задачи (7), то ее аттракторами будут и все
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Хаотическая буферность
49
множества (20). Таким образом, если известен какой-либо один из аттракторов A задачи (7), то, «тиражируя» его с помощью оператора (19), получаем
счетное их число.
Возвращаясь к интересующей нас проблеме, в качестве множества A возьмем инвариантный тор (16) задачи (7) и применим к нему описанный выше
принцип самоподобия. В результате приходим к следующему утверждению.
Теорема 1. При выполнении условия (5) существует такое достаточно
малое µ0 > 0, что при каждом 0 < µ ≤ µ0 краевая задача (7) имеет счетное
число экспоненциально орбитально устойчивых инвариантных торов
An : {uj = exp[i(τj +nx)](1+µ ψj (α1 , . . . , αN −1 , µ)) , j = 1, . . . , N } , n ∈ Z ,
(21)
движения на которых описываются системами
α̇j = µΦj (α1 , . . . , αN −1 , µ) ,
τ̇N = σ0 n2 − c0 + µΨ(α1 , . . . , αN −1 , µ) , j = 1, . . . , N − 1 ,
(22)
где, подчеркнем, функции ψj , Φj , Ψ те же, что и в (12), (14).
Убедимся, наконец, что при определенном выборе параметра c0 каждый
тор (21) является носителем хаотического аттрактора. С этой целью рассмотрим отщепляющуюся от (22) систему для αj , j = 1, . . . , N − 1, выполним в
ней замену времени µt → t и отбросим в правых частях получившейся системы слагаемые порядка малости µ и выше. В результате с учетом равенств
(15) она преобразуется к виду
α̇j = −c0 (sin αj+1 −2 sin αj +sin αj−1 )+cos αj−1 −cos αj+1 , j = 1, . . . , N −1 ,
(23)
где α0 = αN = 0.
Вычисления, проделанные с помощью программы Д. С. Глызина [8], показали, что, например, при c0 = 0.6, N = 5 система (23) имеет хаотический
аттрактор с ляпуновскими показателями λ1 ≈ 0.194, λ2 = 0, λ3 ≈ −0.08,
λ4 ≈ −1.507, а при c0 = 0.6, N = 6 – аттрактор с показателями λ1 ≈ 0.247,
λ2 ≈ 0.055, λ3 = 0, λ4 ≈ −0.202, λ5 ≈ −1.579. Аналогичное справедливо и при
других значениях c0 . Более того, как установлено в [9], с ростом N ляпуновская размерность dL хаотического аттрактора системы (23) неограниченно
возрастает примерно по линейному закону. Действительно, при c0 = 0.6 получаются следующие наборы данных:
N = 7 : λ1 = 0.288 , λ2 = 0.096 , λ3 = 0 , λ4 = −0.03 , λ5 = −0.384 ,
λ6 = −1.589 , dL = 4.926 ;
N = 8 : λ1 = 0.305 , λ2 = 0.138 , λ3 = 0.019 , λ4 = 0 , λ5 = −0.163 ,
λ6 = −0.52 , λ7 = −1.597 , dL = 5.574 ;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
50
С. Д. Глызин, А. Ю. Колесов
N = 9 : λ1 = 0.322 , λ2 = 0.164 , λ3 = 0.051 , λ4 = 0 , λ5 = −0.078 ,
λ6 = −0.266 , λ7 = −0.597 , λ8 = −1.616 , dL = 6.324 ;
N = 10 : λ1 = 0.318 , λ2 = 0.19 , λ3 = 0.075 , λ4 = 0 , λ5 = −0.024 ,
λ6 = −0.167 , λ7 = −0.356 , λ8 = −0.656 , λ9 = −1.653 , dL = 7.055 ;
N = 11 : λ1 = 0.32 , λ2 = 0.192 , λ3 = 0.092 , λ4 = 0.013 , λ5 = 0 ,
λ6 = −0.094 , λ7 = −0.229 , λ8 = −0.399 , λ9 = −0.695 ,
λ10 = −1.642 , dL = 7.735 .
Таким образом, справедлива приближенная формула
dL ≃ 0.763N − 0.568.
3. Случай граничных условий Неймана
В этом пункте придадим полученным выше результатам некоторую общность. А именно, проиллюстрируем реализуемость феномена хаотической буферности в рамках краевой задачи
ut + iuxx + iεµΛu = ε[u − d |u|2 ∗ u] , ux |x=0 = ux |x=π = 0 ,
(24)
где ε = 1/σ0 , получающейся из (7) после нормировки времени σ0 t → t и
замены граничных условий.
Наиболее просто динамические свойства краевой задачи (24) выявляются
при дополнительном предположении о малости ε, которое всюду ниже считаем выполненным. Действительно, рассмотрим сначала отвечающую цепочке
(24) парциальную систему, т. е. краевую задачу
ut + iuxx = ε[u − d|u|2 u] , ux |x=0 = ux |x=π = 0
◦
(25)
◦
в фазовом пространстве (Re u, Im u) ∈ E ×E, E = W 22 (0, π), где W 22 – соболевское пространство функций, удовлетворяющих нулевым граничным условиям Неймана. Как установлено в монографии [10], при всех 0 < ε ≪ 1 краевая
задача (25) имеет счетное число экспоненциально орбитально устойчивых
(в метрике E × E) автомодельных циклов
un (t, x, ε) = un (x, ε) exp[iωn (ε)t] , n ≥ 1 , ωn ∈ R ,
(26)
где достаточно гладкие по своим переменным функции un , ωn таковы, что
равномерно по n ≥ 1, x ∈ [0, π]
2
un (x, ε) = √ cos nx + O(ε) , ωn (ε) = n2 − c0 ε + O(ε2 ) .
3
(27)
Циклы (26), (27) играют здесь ту же роль, что и бегущие волны (6) в
случае краевой задачи (7). А именно, как будет показано ниже, устойчивые
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Хаотическая буферность
51
циклы uj = un (t, x, ε), j = 1, . . . , N с одинаковыми номерами n, существующие при µ = 0 в парциальных системах
∂uj /∂t + i ∂ 2 uj /∂x2 = ε[uj − d|uj |2 uj ] , ∂uj /∂x|x=0 = ∂uj /∂x|x=π = 0 ,
при µ > 0 объединяются в устойчивые N -мерные торы. При этом, что самое
главное, количество таких торов счетно и при надлежащем выборе параметра
c0 каждый из них содержит хаотический аттрактор.
Последовательность дальнейших действий аналогична изложенному в
п. 2: сначала устанавливается существование одного инициирующего инвариантного тора, а после этого осуществляется его ”тиражирование” с помощью
некоторого аналога описанного выше принципа самоподобия.
Остановимся сначала на алгоритмической части проблемы. Точнее говоря, убедимся, что система (24) имеет формальное интегральное многообразие
вида
u = ξ cos x + εv1 (x, µ, ξ, ξ) + ε2 v2 (x, µ, ξ, ξ) + . . . ,
(28)
где ξ = colon (ξ1 , . . . , ξN ), ξ = colon (ξ1 , . . . , ξN ), а комплексные параметры ξj ,
j = 1, . . . , N на многообразии эволюционируют во времени по закону
ξ˙ = iξ + ε∆1 (ξ, ξ, µ) + ε2 ∆2 (ξ, ξ, µ) + . . .
(29)
Предполагаем еще, что вектор-функции vk , ∆k , k ≥ 1 удовлетворяют при
любом α ∈ R дополнительным требованиям
vk (x, µ, exp(iα) ξ, exp(−iα) ξ) = exp(iα) vk (x, µ, ξ, ξ) ,
(30)
∆k (exp(iα) ξ, exp(−iα) ξ, µ) = exp(iα) ∆k (ξ, ξ, µ) ,
(31)
а также условию
Z
π
vk (x, µ, ξ, ξ) cos xdx = 0 .
(32)
0
Итак, подставим соотношения (28), (29) в (24) и будем последовательно
приравнивать коэффициенты при одинаковых степенях ε. В результате на
первом шаге для отыскания v1 приходим к краевой задаче
∂v1
∂v1
∂ 2 v1
ξ−
= [ξ − iµΛξ − d ξ ∗ ξ ∗ ξ cos2 x] cos x−
i
ξ +i
2
∂ξ
∂x
∂ξ
(33)
∂v1 ∂v1 −∆1 cos x ,
=
= 0.
∂x x=0
∂x x=π
Ее анализ существенно опирается на тот факт, что фигурирующие в (28)
коэффициенты vk должны удовлетворять равенствам (30). Действительно,
дифференцируя указанные равенства по α и полагая затем α = 0, убеждаемся, что
∂vk
∂vk
ξ−
ξ = vk , k ≥ 1 .
(34)
∂ξ
∂ξ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
52
С. Д. Глызин, А. Ю. Колесов
А отсюда, в свою очередь, следует, что интересующая нас краевая задача
(33) преобразуется к виду
dv1 dv1 2
=
= 0,
iLv1 = ξ − iµΛξ − d ξ ∗ ξ ∗ ξ cos x cos x − ∆1 cos x ,
dx x=0
dx x=π
(35)
где Lv = d2 v/dx2 + v, а переменные ξ, ξ рассматриваются как параметры.
Исследование задачи (35) уже не вызывает затруднений и проводится по
стандартной схеме: сначала из условия ее разрешимости определяем функцию
3
∆1 = ξ − iµΛξ − d ξ ∗ ξ ∗ ξ ,
(36)
4
а затем находим и само решение v1 , для которого с учетом соответствующего
равенства (32) получается формула
v1 = −
id
ξ ∗ ξ ∗ ξ cos 3x .
32
(37)
Подчеркнем, что функции (36), (37) обладают требуемыми свойствами
(30), (31) и, в частности, для v1 справедливо соотношение (34) при k = 1.
Поэтому сделанный выше переход от задачи (33) к (35), носивший условный
характер, оказывается правомерным. Отметим также, что хотя продолжение
алгоритма нахождения коэффициентов рядов (28), (29) не вызывает затруднений, но для наших целей достаточно уже имеющейся информации.
На следующем этапе обратимся к построенной выше системе первого приближения
ξ˙ = iξ + ε∆1 (ξ, ξ, µ)
на многообразии (28) и выполним в ней последовательно замены
ξ exp(−it) → ξ, ξ exp(it) → ξ и εt → t. В результате приходим к системе
3
ξ˙ = ξ − iµΛξ − d ξ ∗ ξ ∗ ξ ,
4
(38)
которая с точностью до нормировок и переобозначений совпадает с (8).
А отсюда и из содержащегося в п. 2 анализа заключаем, что система (38)
имеет глобально устойчивый N -мерный инвариантный тор
2
ξj = √ exp(iτj ) 1 + µ ψj (α1 , . . . , αN −1 , µ) , j = 1, . . . , N ,
3
(39)
где функции ψj те же, что и в (12).
Подведем некоторый итог. Из проделанных построений следует, что равенством
u = ξ cos x + εv1 (x, µ, ξ, ξ) ,
(40)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Хаотическая буферность
53
в котором учтены соотношения (39), задается приближенный (с точностью до
ε2 по невязке) инвариантный тор исходной задачи (24), а система уравнений
на этом торе имеет вид
α̇j = εµΦj (α1 , . . . , αN −1 , µ) ,
τ̇N = 1 − εc0 + εµΨ(α1 , . . . , αN −1 , µ) , j = 1, . . . , N − 1 ,
(41)
где функции Φj , Ψ заимствованы из (14). Существование соответствующего
точного инвариантного тора с главной асимптотикой (39) – (41) вытекает
из общих результатов монографии [11]. А именно, справедливо следующее
утверждение, представляющее собой аналог леммы 1.
Лемма 2. Найдутся такие достаточно малые ε0 , µ0 > 0, что при всех
0 < ε ≤ ε0 , 0 < µ ≤ µ0 краевая задача (24) имеет экспоненциально
орбитально устойчивый N -мерный инвариантный тор
h
2
uj = √ exp(iτj ) (1 + µ ψj (α1 , . . . , αN −1 , µ)) cos x+
3
(42)
i
+εHj (α1 , . . . , αN −1 , ε, µ, x) , j = 1, . . . , N ;
h
i
α̇j = εµ Φj (α1 , . . . , αN −1 , µ) + εGj (α1 , . . . , αN −1 , ε, µ) , j = 1, . . . , N − 1 ;
(43)
τ̇N = 1 − εc0 + εµΨ(α1 , . . . , αN −1 , µ) + ε2 Ω(α1 , . . . , αN −1 , ε, µ) ,
(44)
где все функции достаточно гладко зависят от своих переменных и являются 2π-периодическими по αk , k = 1, . . . , N − 1.
Сформулированная лемма нуждается в некоторых пояснениях. Отметим,
во-первых, что система (24) не меняется при замене exp(iα)u → u, α ∈ R.
Именно поэтому правые части формул (42) оказываются пропорциональными exp(iτj ), а все остальные фигурирующие в (42) – (44) функции зависят не от самих фазовых переменных τj , j = 1, . . . , N , а от их разностей
αk = τk+1 − τk . Во-вторых, при µ = 0 тор (42) – (44) представляет собой
прямое произведение N одинаковых устойчивых циклов uj = u1 (t, x, ε),
j = 1, . . . , N (см. (26), (27) при n = 1), т. е. записывается в виде
uj = u1 (τj , x, ε) , τ̇j = ω1 (ε) , j = 1, . . . , N .
(45)
Тем самым, становится понятной причина его устойчивости при малых µ > 0,
а также проясняется происхождение множителя µ в правых частях системы
(43).
Инвариантный тор, доставляемый леммой 2, является искомым инициирующим тором. Процедура же его ”тиражирования” в данном случае такова.
Пусть u = u(t, x, ε) – произвольное решение краевой задачи (24). Продолжим
его по переменной x сначала на отрезок [−π, 0] четным образом, а затем на
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
54
С. Д. Глызин, А. Ю. Колесов
всю ось по периодичности с периодом 2π. Тогда, как легко видеть, при любом
натуральном n функция u(n2 t, nx, ε/n2 ) также будет решением задачи (24).
Применяя, далее, эту процедуру при каждом n ко всем решениям, лежащим
на торе (42) – (44), получим счетное число N -мерных инвариантных торов.
Таким образом, приходим к следующему утверждению.
Теорема 2. При всех достаточно малых независимых ε , µ > 0 краевая
задача (24) имеет счетное число экспоненциально орбитально устойчивых
N -мерных инвариантных торов
h
2
uj = √ exp(iτj ) (1 + µ ψj (α1 , . . . , αN −1 , µ)) cos nx+
3
i
ε
ε
+ 2 Hj (α1 , . . . , αN −1 , 2 , µ, nx) , j = 1, . . . , N ;
n
n
(46)
i
h
ε
ε
α̇j = εµ Φj (α1 , . . . , αN −1 , µ) + 2 Gj (α1 , . . . , αN −1 , 2 , µ) , j = 1, . . . , N − 1 ;
n
n
(47)
τ̇N = n2 − εc0 + εµΨ(α1 , . . . , αN −1 , µ) +
ε
ε2
Ω(α1 , . . . , αN −1 , 2 , µ) ,
2
n
n
(48)
где n = 1, 2, . . . , а функции ψj , Hj , Φj , Gj , Ψ, Ω взяты из (42) – (44).
Причина, по которой все торы (46) – (48) оказываются устойчивыми, та
же самая, что и в случае тора (42) – (43). Действительно, при µ = 0 эти торы
принимают аналогичный (45) вид
uj = un (τj , x, ε) , τ̇j = ωn (ε) , j = 1, . . . , N ,
где функции un , ωn , n ≥ 1 заимствованы из (26). Далее, как показано в [10],
циклы (26) краевой задачи (25) обладают свойством равномерной устойчивости, т. е. существует такая независящая от ε и n ≥ 1 постоянная γ0 > 0, что
все характеристические показатели этих циклов (за исключением, естественно, простых нулевых) лежат в комплексной полуплоскости {λ : Re λ ≤ −γ0 ε}.
И наконец, опираясь на развитую в [10] методику, можно показать, что свойство равномерной устойчивости, имеющее место для торов (46) – (48) при
µ = 0, сохраняется и при всех достаточно малых µ > 0.
Из проделанного анализа следует, что краевая задача (24) обладает интересующим нас свойством хаотической буферности. Для того чтобы убедиться
в этом, обратимся к системе (47), выполним в ней замену εµt → t и отбросим
асимптотически малые (равномерно по n ≥ 1) слагаемые. В итоге она примет вид (23). Таким образом, остается сослаться на результаты численного
счета, упомянутые в п. 2.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
55
Хаотическая буферность
4. Случай однонаправленно связанных
осцилляторов
Разобранные выше примеры представляют собой цепочки диффузионно связанных генераторов. Однако феномен хаотической буферности может
наблюдаться и при другом характере связи. В качестве примера приведем
систему из трех обобщенных кубических уравнений Шредингера, однонаправленно связанных в кольцо. Точнее говоря, рассмотрим цепочку
∂ uk
∂ 2 uk
+ iσ0
+ ε[iuk−1 + d |uk |2 uk ] = 0 ,
∂t
∂x2
(49)
uk |x=0 = uk |x=π = 0 , k = 1, 2, 3 ,
(50)
где uk = uk (t, x) – комплекснозначные функции, причем u0 (t, x) ≡ u3 (t, x).
Считаем, что ε > 0 – малый параметр, d = 1 + ic0 , а c0 ∈ R и σ0 > 0 –
некоторые постоянные порядка единицы. В качестве фазового пространства
(пространства начальных условий Re uk (0, x), Im uk (0, x), k = 1, 2, 3) задачи
◦
◦
(49), (50) возьмем E 6 = E × . . . × E, где E = W 22 (0, π), а через W 22 в данном случае обозначено соответствующее соболевское пространство функций,
удовлетворяющих граничным условиям (50).
Для отыскания возможных автоколебательных режимов системы (49),
(50) воспользуемся изложенной в [11, 12] методикой. А именно, подставим в
нее асимптотические ряды по целым степеням ε:
uk = uk,0 (t, τ, x) + εuk,1 (t, τ, x) + . . . , k = 1, 2, 3 ,
(51)
где τ = εt, uk,j , j ≥ 0 – формальные тригонометрические ряды переменной
t, причем
∞
X
uk,0 =
exp(iσ0 n2 t)zn, k (τ ) sin nx , k = 1, 2, 3 ,
(52)
n=1
а zn, k , n ≥ 1, k = 1, 2, 3 – некоторые пока произвольные (подлежащие определению в последующем) комплексные амплитуды колебаний. Приравнивая,
далее, в (49), (50) коэффициенты при ε, для uk,1 приходим к линейным неоднородным краевым задачам вида
∂ 2 uk,1
∂ uk,1
+ iσ0
= gk (t, τ, x) , uk,1 |x=0 = uk,1 |x=π = 0 ,
∂t
∂x2
(53)
где gk = −∂uk,0 /∂τ − [iuk−1,0 + d|uk,0 |2 uk,0 ], а переменная τ рассматривается
как параметр.
Отметим, что получившиеся задачи (53) разрешимы в классе формальных тригонометрических рядов в том и только том случае, когда в их правых
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
56
С. Д. Глызин, А. Ю. Колесов
частях gk отсутствуют гармоники вида exp(iσ0 n2 t) sin nx, n ≥ 1. Поэтому приравняем коэффициенты при упомянутых гармониках к нулю. В результате
для определения√фигурирующих в (51), (52) комплексных амплитуд zn, k после нормировок 3 zn, k /2 → zn, k приходим к счетной системе обыкновенных
дифференциальных уравнений
żn, k
h
∞
i
4X
= −izn, k−1 − d |zn, k | +
|zm, k |2 zn, k , n ≥ 1 , k = 1, 2, 3 ,
3 m=1
2
(54)
m6=n
где zn, 0 = zn, 3 , n ≥ 1, а точка – дифференцирование по τ .
Получившуюся систему (54) будем рассматривать в дальнейшем как самостоятельный объект исследования. Точнее говоря, поставим вопрос об аттракторах этой системы в фазовом пространстве Z (над полем действительных чисел), состоящем из бесконечномерных векторов
z = (z1, 1 , z 1, 1 , z1, 2 , z 1, 2 , z1, 3 , z 1, 3 , . . . , zn, 1 , z n, 1 , zn, 2 , z n, 2 , zn, 3 , z n, 3 , . . .)
(55)
с комплексными координатами, для которых конечна норма
||z|| =
∞ X
3
X
n=1 k=1
|zn, k |2
1/2
(56)
(в этом случае построенная по вектору (55) функция (52) принадлежит пространству L2 (0, π) по переменной x). Заметим, что поскольку система (54)
порождает эволюционное уравнение в пространстве Z с ограниченной и гладкой по Фреше правой частью, то локальная однозначная разрешимость для
нее задачи Коши с произвольным начальным условием из Z вытекает из
результатов монографии [13].
В первую очередь будем интересоваться существованием у системы (54)
так называемых одномодовых аттракторов. В связи с этим фиксируем произвольно натуральное n и обозначим через Ωn ее инвариантное множество,
задающееся равенством:
Ωn = { z ∈ Z : zm, k = 0 , k = 1, 2, 3 при всех m 6= n;
(zn, 1 , zn, 2 , zn, 3 ) = (v1 , v2 , v3 ) ∈ Ω },
(57)
где Ω – некоторый аттрактор шестимерной системы
v̇k = −ivk−1 − d |vk |2 vk , k = 1, 2, 3 ,
(58)
в которой v0 = v3 . Подчеркнем, что в силу диссипативности системы (58)
совокупность ее возможных аттракторов Ω заведомо не пуста.
Перейдем к вопросу об устойчивости одномодовых инвариантных множеств (57) по ”дополнительным” направлениям zm, k , m 6= n.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
57
Хаотическая буферность
Проводя линеаризацию системы (54) на произвольной траектории
{zm, k = 0, zn, k = vk (τ ), k = 1, 2, 3} из Ωn , получаем счетное число одинаковых шестимерных линейных систем
4
(59)
ḣk = −ihk−1 − d |vk (τ )|2 hk , k = 1, 2, 3 ,
3
где hk = zm, k , m 6= n. Таким образом, вся счетная совокупность инвариантных множеств Ωn , n ≥ 1 устойчива или неустойчива одновременно и в случае
устойчивости эти множества будем называть одномодовыми аттракторами.
Простейшими одномодовыми инвариантными множествами являются так
называемые автомодельные циклы
{z ∈ Z : zm, k = 0 при m 6= n , zn, k = vk0 exp(iω0 τ ) , k = 1, 2, 3, }, n ≥ 1 ,
(60)
где
√ √ 1
1
3
3
0
0
v1 = −
+i
−i
ξ0 , v2 = −
ξ0 ,
2
2√
2
2
4
v30 = ξ0 , ξ0 = 12/2 , ω0 = 1/2 − c0 ξ02 .
Что же касается устойчивости этих циклов, то здесь справедливо следующее
утверждение.
Теорема 3. Автомодельные циклы (60) системы (54) экспоненциально орбитально устойчивы при условии c0 ∈ (c− , c+ ), где
√
√
√
√
c− = 12 3 − 5 23 ≈ −3.19455 , c+ = 12 3 + 5 23 ≈ 44.7638 ,
(61)
и неустойчивы в случае c0 ∈ R \ [c− , c+ ].
Для доказательства заметим, что циклам (60) отвечает система (59) с
постоянной матрицей, собственные значения которой всегда имеют отрицательные действительные части. Таким образом, проблема сводится к исследованию устойчивости автомодельного цикла
vk = vk0 exp(iω0 τ ) , k = 1, 2, 3
(62)
вспомогательной системы (58). При анализе последней удобно перейти к полярным координатам vk = ξk exp(iϕk ), ξk > 0, 0 ≤ ϕk ≤ 2π, k = 1, 2, 3, поскольку от получающейся в итоге шестимерной системы для ξk , ϕk , k = 1, 2, 3
отщепляется пятимерная система для ξj , j = 1, 2, 3, ψ1 = ϕ3 −ϕ1 , ψ2 = ϕ1 −ϕ2 ,
имеющая вид
ξ˙1 = ξ3 sin ψ1 − ξ 3 ,
1
ξ˙2 = ξ1 sin ψ2 − ξ23 ,
ξ˙3 = −ξ2 sin(ψ1 + ψ2 ) − ξ33 ,
ξ3
ψ̇1 = c0 (ξ12 − ξ32 ) +
cos ψ1 −
ξ1
ξ1
ψ̇2 = c0 (ξ22 − ξ12 ) +
cos ψ2 −
ξ2
ξ2
cos(ψ1 + ψ2 ) ,
ξ3
ξ3
cos ψ1 .
ξ1
(63)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
58
С. Д. Глызин, А. Ю. Колесов
Остается добавить, что циклу (62) в системе (63) соответствует положение
равновесия
√
4
(64)
O = (ξ10 , ξ20 , ξ30 , ψ10 , ψ20 ) : ξ10 = ξ20 = ξ30 = 12/2 , ψ10 = ψ20 = 2π/3
с требуемыми в теореме свойствами устойчивости.
Дальнейший анализ системы (54) проведем сначала для случая c0 ≥ 0. Из
установленной выше теоремы следует, что при 0 ≤ c0 < c+ она имеет счетное
число устойчивых автомодельных циклов (60), а при последующем увеличении параметра c0 все эти циклы теряют устойчивость. На вопрос же о том,
что происходит в ней при c0 > c+ , позволяет ответить численное интегрирование вспомогательной системы (63). Было обнаружено, что при увеличении
параметра c0 в упомянутой системе наблюдаются следующие фазовые перестройки.
+
1) При 0 ≤ c0 < c+
0,1 , где c0,1 = c+ (см. (61)), система (63) имеет единственное экспоненциально устойчивое состояние равновесия (64), которое при
прохождении c0 через критическое значение c+
0,1 мягко теряет устойчивость
с последующим рождением устойчивого предельного цикла C0 .
+
+
2) При c+
0,1 < c0 < c0,2 , где c0,2 ≈ 48.57, цикл C0 , о котором говорилось
чуть выше, является единственным аттрактором рассматриваемой системы.
3) При c0 = c+
0,2 происходит бифуркация удвоения периода: цикл C0 становится неустойчивым и от него ответвляется устойчивый цикл C1 условно
двойного по отношению к C0 периода. Этот цикл сохраняет устойчивость
+
+
на интервале c+
0,2 < c < c0,4 , где c0,4 ≈ 54.42, а при прохождении c0 через
значение c+
0,4 теряет ее жестко (т. е. не порождает других аттракторов при
c0 > c+
).
0,4
4) Первый хаотический аттрактор возникает нелокально при c0 = c+
0,3 ,
+
+
+
где c0,3 ≈ 54.37, и на интервале c0,3 < c0 < c0,4 сосуществует с устойчивым
циклом C1 .
Приведенные факты иллюстрирует показанный на рис. 1 график старшего ляпуновского показателя λmax = λmax (c0 ) аттрактора системы (63), построенный на отрезке 50 ≤ c0 ≤ 70 по точкам с шагом h по параметру c0 , равным
+
0.05 (в случае c+
0,3 < c0 < c0,4 этот показатель вычислялся, естественно, для
хаотического аттрактора). Из вида данного графика можно заключить, что
показатель λmax (c0 ) с увеличением c0 растет, хотя и немонотонно, и при всех
c0 ≥ 54.7 заведомо отделен от нуля (последний вывод сделан на основе контрольных просчетов, выполненных при
c0 ∈ [54.7, 55.2], [54.803, 54.807], [54.8037, 54.8039], [54.9, 55.1]
с шагами h по c0 , равными соответственно 0.0025, 0.0001, 0.00002 и 0.001).
Возвращаясь к исходной системе (54), заметим следующее. Любому аттрактору Ω0 системы (63) соответствует аттрактор Ω системы (58) на единицу большей размерности, а значит, и счетное число одномодовых инвариантных множеств (57) системы (54). Напомним, далее, что за устойчивость
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
59
Хаотическая буферность
Рис. 1.
Рис. 2.
всей совокупности этих множеств отвечает одна и та же линейная система
(см. (59))
4
(65)
ḣk = −ihk−1 − d ξk2 (τ )hk , k = 1, 2, 3 ,
3
где h0 = h3 , а (ξ1 (τ ), ξ2 (τ ), ξ3 (τ )) – произвольная траектория из Ω0 .
Как показывает численный анализ, при всех рассмотренных выше значениях параметра c0 старший ляпуновский показатель λ∗max (c0 ) системы (65)
оказывается отрицательным (см. рис. 2, где представлен его график, построенный на промежутке 50 ≤ c0 ≤ 70 по точкам с шагом h = 0.05). Таким
образом, по крайней мере при 54.7 ≤ c0 ≤ 70 исходная система (54) имеет
счетное число одномодовых хаотических аттракторов (57), а значит, в ней
реализуется требуемый феномен хаотической буферности.
Перейдем теперь к случаю c0 < 0. Здесь у вспомогательной системы (63)
удалось выявить следующие фазовые перестройки.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
60
С. Д. Глызин, А. Ю. Колесов
−
1) При c−
0,1 < c0 < 0, где c0,1 = c− (см. (61)), как и в предыдущем случае,
система (63) имеет единственное устойчивое состояние равновесия (64).
−
−
2) При c−
0,2 < c0 < c0,1 , где c0,2 ≈ −9.84, аттрактором системы (63) является
устойчивый цикл, ответвившийся от состояния равновесия (64) при c0 = c−
0,1 .
−
3) При c0 = c0,2 упомянутый выше цикл претерпевает первую бифуркацию
удвоения, при c0 = c−
0,3 ≈ −10.56 – вторую и т. д. В результате при c0 ≈ −10.95
по фейгенбаумовскому сценарию возникает первый хаотический аттрактор.
4) При последующем уменьшении c0 порядок и хаос многократно сменяют друг друга. В частности, здесь имеется так называемая зона ”дышащего”
хаоса −52.48 ≤ c0 ≤ −11, в которой существует достаточно большое (возможно, счетное) число ”окон” периодичности, т. е. промежутков, в которых
хаос сменяется устойчивым циклом. Стабильный же хаос, когда старший ляпуновский показатель положителен и отделен от нуля, наступает при всех
c0 ≤ −52.6.
Наглядное представление о перечисленных выше особенностях динамики
дают графики старшего ляпуновского показателя λmax = λmax (c0 ) аттрактора
системы (63) и старшего ляпуновского показателя λ∗max = λ∗max (c0 ) системы
(65), показанные на рис. 3 и 4 соответственно (построение данных графиков
проводилось на отрезке −70 ≤ c0 ≤ −40 по точкам с шагом 0.05). Из их
вида следует, что при достаточно больших по модулю отрицательных значениях параметра c0 одномодовые хаотические инвариантные множества (57)
у системы (54) хотя и существуют, но неустойчивы.
Рис. 3.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
61
Хаотическая буферность
Рис. 4.
5. Существование бесконечномерного
хаотического аттрактора
Просуммируем полученные в предыдущем пункте результаты. Нетрудно увидеть,
что при достаточно большом R > 0 выполняется неравенство
V̇ (z) ||z||=R < 0, где V (z) = ||z||2 , || ∗ || – норма (56), V̇ (z) – производная в силу системы (54). А это означает, что наша система является диссипативной,
и, следовательно, мы можем определить для нее максимальный аттрактор
Amax по формуле
\
Amax =
ϕt (U) , U = {z ∈ Z : ||z|| < R} ,
(66)
t>0
где ϕt – фазовый поток, порожденный системой (54) в пространстве Z. Подчеркнем, что множество (66) заведомо некомпактно, поскольку содержит
счетное число инвариантных одномодовых подмножеств (57). Напомним, далее, что при достаточно больших c0 все эти подмножества в свою очередь
оказываются аттракторами, причем хаотическими, т. е. наблюдается интересующий нас феномен хаотической буферности.
Для того чтобы разобраться со структурой множества (66) в случае отрицательных и достаточно больших по модулю значений c0 , обратимся к
конечномерным системам
N
h
i
4X
żn, k = −izn, k−1 − (1 + ic0 ) |zn, k |2 +
|zm, k |2 zn, k , 1 ≤ n ≤ N , k = 1, 2, 3 ,
3 m=1
m6=n
(67)
получающимся из (54) при zm, k = 0, m ≥ N + 1. Численный анализ, выполненный при c0 = −93, показывает, что системы (67) имеют хаотические
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
62
С. Д. Глызин, А. Ю. Колесов
аттракторы ΣN , ляпуновские размерности LN которых с ростом N растут
примерно по линейному закону:
L2 ≈ 10.98 , L3 ≈ 16.2 , L4 ≈ 21.37 , L5 ≈ 26.197 , L6 ≈ 30.58 , L7 ≈ 34.12 ,
L8 ≈ 37.63 , L9 ≈ 41.257 , L10 ≈ 44.46 , L11 ≈ 48.179 , L12 ≈ 51.333
и т. д. Далее, для количества lN положительных характеристических показателей аттрактора ΣN начиная с номера N = 5 справедливо равенство
+
упомянутых показателей при N → ∞ имеет
lN = N + 2, а сумма SN
−
+
предел S ≈ 1.6. Для сравнения заметим, что сумма SN
всех отрицательных показателей аттрактора ΣN по модулю неограниченно растет, причем
−
lim SN
/N = S − , где S − ≈ −0.6. Добавим еще, что в исходной системе
N →∞
(54) аттракторам ΣN отвечают неустойчивые конечномодовые инвариантные
множества AN , для которых zm, k = 0, m ≥ N + 1 (точнее говоря, каждое AN
неустойчиво уже в рамках системы (67) с номером N + 1).
Перечисленные факты свидетельствуют в пользу гипотезы о том, что
аттрактор (66) при c0 = −93 является хаотическим и бесконечномерным.
Действительно, его старший ляпуновский показатель λmax = lim λN,max , где
N →∞
λN,max – старшие показатели инвариантных множеств AN , положителен и
примерно равен 0.68 (значения λN,max практически совпадают начиная с номера N = 3). Что же касается всех положительных ляпуновских показателей
аттрактора Amax , то их количество счетно, а сумма конечна и равна введенной выше величине S + .
Для пояснения свойства
бесконечномерности заметим, что справедливо
S
AN ⊂ Amax . А отсюда, в свою очередь, следует, что
очевидное включение
N ≥2
Amax не может содержать конечномерных подмножеств, также являющихся
аттракторами.
Заключение
Остановимся еще раз на общей идее конструирования цепочек осцилляторов с хаотической буферностью. Предположим, что в качестве парциальной
системы выбрано некоторое эволюционное уравнение
v̇ = f (v, λ)
(68)
в вещественном банаховом пространстве V , правая часть которого зависит от
вспомогательного параметра λ произвольной природы, принимающего значения в множестве Σ. Предположим, далее, что в уравнении (68) реализуется
феномен буферности: сосуществуют различные устойчивые циклы
v = v(m) (τ ) , τ = ω(m) t , ω(m) > 0 , v(m) (τ + 2π) ≡ v(m) (τ ) , m = 1, . . . , m0 ,
(69)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
63
Хаотическая буферность
количество m0 = m0 (λ) которых может быть сделано сколь угодно большим
за счет подходящего выбора λ ∈ Σ. И наконец, рассмотрим, к примеру, цепочку диффузионно связанных осцилляторов (68), т. е. систему вида
v̇j = f (vj , λ) + µA(vj+1 − 2vj + vj−1 ) , j = 1, . . . , N ,
(70)
где 0 < µ ≪ 1, v0 = v1 , vN +1 = vN , A : V → V – ограниченный линейный
оператор.
При µ = 0 система (70) имеет, очевидно, устойчивые N -мерные инвариантные торы
vj = v(m) (τj ) , τ̇j = ω(m) , j = 1, . . . , N ,
составленные из одинаковых циклов (69). В случае малых µ > 0 эти торы,
естественно, сохраняются, а так как они близки к резонансным, то движения
на них описываются некоторыми системами для разностей фаз αj = τj+1 −τj ,
подобными системе (23). Как показано выше на конкретных примерах, все
эти системы могут одновременно иметь хаотические аттракторы и, более того, количество m0 = m0 (λ) самих инвариантных резонансных торов (носителей хаоса) за счет выбора λ ∈ Σ может быть сделано сколь угодно большим
или даже счетным. А это как раз и означает, что в системе (70) возможна
хаотическая буферность.
Ситуация, с которой сталкиваемся в случае цепочек осцилляторов (7) и
(24), может показаться излишне идеализированной, поскольку соответствующие им парциальные системы имеют счетное число устойчивых циклов.
Однако данное свойство вовсе не является необходимым для реализации феномена хаотической буферности. Для того чтобы убедиться в этом, в качестве
парциальной системы возьмем простейшее нелинейное телеграфное уравнение с граничными условиями Неймана, т. е. краевую задачу
utt − εut + u − a2 uxx + u2 ut − bu3 = 0 , ux |x=0 = ux |x=π = 0 ,
(71)
где 0 < ε ≪ 1; a, b = const > 0.
Из содержащихся в [10] результатов вытекает существование для каждого натурального m0 такого достаточно малого ε0 > 0, что при всех 0 < ε ≤ ε0
краевая задача (71) имеет экспоненциально орбитально устойчивые (в мет◦
рике фазового пространства (u, ut ) ∈ W 22 (0, π) × W21 (0, π)) циклы
u=
√
ε um (τ, x, ε) , dτ /dt = ωm 1 + εδm (ε) , m = 1, 2, . . . , m0 .
(72)
√
Здесь ωm = 1 + a2 m2 , а достаточно гладкие по своим переменным функции
δm (ε), um (τ, x, ε), um (τ + 2π, x, ε) ≡ um (τ, x, ε) удовлетворяют равенствам
4
um (τ, x, 0) = √ cos τ cos mx , δm (0) = −3b/(2ωm ) .
3
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
64
С. Д. Глызин, А. Ю. Колесов
Таким образом, в краевой задаче (71) наблюдается явление буферности, но
количество сосуществующих устойчивых циклов (72) здесь заведомо конечно
(как следует из [10], оно имеет порядок ε−1 при ε → 0).
Рассмотрим, далее, цепочку связанных осцилляторов (71), т. е. систему
вида
L(uj ) = εµ(uj+1 − 2uj + uj−1 ) , ∂uj /∂x|x=0,x=π = 0 ,
(73)
где j = 1, . . . , N , через L(u) обозначена левая часть уравнения из (71),
u0 = u1 , uN +1 = uN , а µ > 0 – вспомогательный малый параметр. Используя развитую выше технику, можно показать, что устойчивые циклы (72)
с одинаковыми номерами m, существующие при µ = 0 в соответствующих
парциальных системах, при µ > 0 объединяются в устойчивые N -мерные торы, а поведение решений на этих торах в первом приближении описывается
системами
α̇j = −cm (sin αj+1 − 2 sin αj + sin αj−1 ) + cos αj−1 − cos αj+1 , j = 1, . . . , N − 1 ,
(74)
где α0 = αN = 0, cm = 3b/(2ωm ).
Обращаем внимание, что поскольку нас интересует феномен хаотической
буферности, то номер m в (74), в принципе, должен принимать любые сколь
угодно большие значения. Поэтому рассмотрим сразу предельный случай
m = ∞, в котором получается система
α̇j = cos αj−1 − cos αj+1 , j = 1, . . . , N − 1 .
(75)
Данная система оказывается консервативной, так как не меняется при заменах t → −t, αj → −αj и, что самое главное, при каждом N ≥ 5 она имеет хаотические движения. Например, при N = 5 посредством численного анализа
в ней удалось обнаружить хаотические режимы с ляпуновскими показателями λ0 , 0, 0, −λ0 , где λ0 > 0 в зависимости от выбора начальных условий
может принимать различные значения: 0.135, 0.16, 0.176, 0.252, 0.258, 0.272
и т. д.
При переходе от системы (75) к исходной системе (74) некоторые из упомянутых выше хаотических движений ”выживают”. В частности, система
(74) при N = 5 имеет хаотические аттракторы при любом cm ≤ 0.02. А
это, в свою очередь, означает, что в цепочке осцилляторов (73) наблюдается
феномен хаотической буферности.
Литература
[1] Глызин С. Д., Колесов А. Ю., Розов Н. Х. Хаотическая буферность в
цепочках связанных осцилляторов // Дифференциальные уравнения.
2005. Т. 41, № 1. С. 41 – 49.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Хаотическая буферность
65
[2] Глызин С. Д., Колесов А. Ю., Розов Н. Х. Об одной математической
модели хаотической буферности // ДАН. 2007. Т. 412, № 5. С. 604 – 609.
[3] Гапонов-Грехов А. В., Рабинович М. И., Старобинец И. М. Динамическая модель пространственного развития турбулентности // Письма в
ЖЭТФ. 1984. Т. 39, № 12. С. 561 – 564.
[4] Анищенко В. С. Сложные колебания в простых системах. М.: Наука,
1990. 312 с.
[5] Гапонов-Грехов А. В., Рабинович М. И. Автоструктуры. Хаотическая
динамика ансамблей // Нелинейные волны. Структуры и бифуркации.
М.: Наука, 1987. С. 7 – 44.
[6] Митропольский Ю. А., Лыкова О. Б. Интегральные многообразия в
нелинейной механике. М.: Наука, 1973. 512 с.
[7] Колесов А. Ю., Розов Н. Х. Двухчастотные автоволновые процессы в
комплексном уравнении Гинзбурга-Ландау // ТМФ. 2003. Т. 143, № 3.
С. 353 – 373.
[8] Глызин Д. С. Свидетельство о государственной регистрации программы
для ЭВМ № 2008611464. Пакет программ для анализа динамических
систем "Tracer". Заявка № 2008610548 от 14.02.2008 г. Зарегистрировано
в Реестре программ для ЭВМ 24.03.2008 г.
[9] Глызин С. Д. Численное обоснование гипотезы Ландау-Колесова о природе турбулентности // Математические модели в биологии и медицине.
Вильнюс, 1989. Вып. 3. С. 31 – 36.
[10] Колесов А. Ю., Мищенко Е. Ф., Розов Н. Х. Асимптотические методы исследования периодических решений нелинейных гиперболических
уравнений. // Тр. МИАН им. В. А. Стеклова. 1998. Т. 222. C. 3 – 191.
[11] Колесов А. Ю., Розов Н. Х. Инвариантные торы нелинейных волновых
уравнений. М.: Физматлит, 2004. 408 с.
[12] Мищенко Е. Ф., Садовничий В. А., Колесов А. Ю., Розов Н. Х. Автоволновые процессы в нелинейных средах с диффузией. М.: Физматлит,
2005. 432 с.
[13] Далецкий Ю. Л., Крейн М. Г. Устойчивость решений дифференциальных уравнений в банаховом пространстве. М.: Наука, 1970. 536 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 510.53+512.53+512.54
Об уравнениях с ограничениями на решения
в свободных полугруппах
В. Г. Дурнев, О. В. Зеткина
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: durnev@univ.uniyar.ac.ru
В статье доказывается алгоритмическая неразрешимость
проблемы совместности для уравнений с некоторыми ограничениями на решения в свободной полугруппе.
Библиография: 23 названия.
Обозначим через Πn свободную полугруппу с пустым словом в качестве
нейтрального элемента (свободный моноид) ранга n со свободными образующими a1 , ..., an , а через Fn – свободную группу с теми же свободными
образующими. Вместо a1 и a2 будем писать a и b соответственно.
В 60-е годы прошлого века А. А. Марков предложил использовать системы уравнений в свободной полугруппе Πn в качестве подхода к отрицательному решению 10-й проблемы Д. Гильберта. Заметим, что при n ≥ 2 система
уравнений
m
& w i = ui
i=1
равносильна одному уравнению
w 1 a1 w 2 a1 . . . a 1 w m w 1 a2 w 2 a2 . . . a2 w m =
u1 a 1 u2 a 1 . . . a 1 um u1 a 2 u2 a 2 . . . a 2 um .
Системы уравнений в свободных полугруппах также называются системами
уравнений в словах. Первые результаты в исследовании систем уравнений в
словах были получены А. А. Марковым (не опубликовано) и Ю. И. Хмелевским [18] в конце 1960-х годов.
В эти же годы было начато изучение систем уравнений в словах и длинах,
т. е. систем вида
m
& w i = ui &
i=1
&
{i,j} ∈ A
|xi | = |xj |,
где через |x| = |y| обозначен предикат «длины слов x и y равны».
66
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
67
Об уравнениях в словах
Первые результаты в исследовании систем уравнений в словах и длинах
были получены в начале 1970-х годов в работах Ю. В. Матиясевича [16] и
Н. К. Косовского [6], [7], [8].
Для слова w в алфавите Σ и буквы α этого алфавита через |w|α будем
обозначать число вхождений буквы α в слово w. В 1972-1973 годах первый из
авторов стал рассматривать системы уравнений в словах и длинах с дополнительным предикатом |x|a = |y|a – «проекции слов x и y на выделенную букву
a равны». В работе [3], вышедшей из печати в 1974 году, он, в частности,
доказал, что
можно указать такое однопараметрическое семейство систем уравнений в свободной полугруппе Π2 ,
w ( x, x1 , . . . , xn , a, b ) = v ( x, x1 , . . . , xn , a, b ) &
& (|xi | = |xj | & |xi |a = |xj |a )
{i,j} ∈ A
с неизвестными x1 , ..., xn , с константами a и b и с параметром x, где A
– некоторое подмножество множества {{t, s} | 1 ≤ t, s ≤ n}, что невозможен алгоритм, позволяющий для произвольного натурального числа m
определить, имеет ли решение система уравнений
w ( am , x1 , . . . , xn , a, b ) = v ( am , x1 , . . . , xn , a, b ) &
& (|xi | = |xj | & |xi |a = |xj |a ).
{i,j} ∈ A
В этой же работе отмечалось, что аналогичный результат остается верным, если предикат |x| = |y| & |x|a = |y|a заменить предикатом
|x|b = |y|b & |x|a = |y|a .
Аналогичный результат содержался в опубликованной в 1988 году работе
J. R. Buchi и S. Senger [19].
В 1976 году Г. С. Маканин получил в теории уравнений в словах фундаментальный результат, который был опубликован в 1977 году в работах
[10] и [11], – он построил алгоритм, позволяющий по произвольной системе
уравнений в свободной полугруппе Πn определить, имеет ли она решение.
Несколько позже в работе [12] Г. С. Маканин построил алгоритм, позволяющий по произвольной системе уравнений в свободной группе Fn определить,
имеет ли она решение.
После фундаментальных результатов Г. С. Маканина особый интерес стал
представлять вопрос о существовании аналогичных алгоритмов для уравнений в свободных полугруппах и группах с различными "не слишком сложными"и "достаточно естественными"ограничениями на решения.
В работе [2] была доказана алгоритмическая неразрешимость позитивной ∃∀∃3 -теории любой конечно порожденной нециклической свободной полугруппы. Вопрос о разрешимости позитивной теории свободной полугруппы
счетного ранга в кандидатской диссертации первого автора был легко сведен
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
68
В. Г. Дурнев, О. В. Зеткина
к следующей проблеме существует ли алгоритм, позволяющий для произвольного уравнения
w ( x 1 , . . . , x n , a1 , . . . , a m ) = u ( x 1 , . . . , x n , a1 , . . . , a m )
в свободной полугруппе счетного ранга определить, имеет ли оно такое
решение g1 , . . ., gn , что
g1 ∈ Πm1 , g2 ∈ Πm2 , . . . , gn ∈ Πmn ,
где m1 ≤ m2 ≤ . . . ≤ mn , Πmi — свободная полугруппа c образующими
a1 , . . ., ami . Ю. М. Важенин и Б. В. Розенблат [1], используя результат
Г. С. Маканина, доказали, что для решения последней задачи алгоритм существует, это позволило им установить разрешимость позитивной теории свободной полугруппы счетного ранга.
Вопрос о разрешимости позитивной теории свободной группы был сведен
Ю.И. Мерзляковым [17] к следующей проблеме
существует ли алгоритм, позволяющий для произвольного уравнения
w ( x 1 , . . . , x n , a1 , . . . , a m ) = 1
в свободной группе счетного ранга определить, имеет ли оно такое решение
g1 , . . ., gn , что
g 1 ∈ F m1 , g 2 ∈ F m2 , . . . , g n ∈ F mn ,
где m1 ≤ m2 ≤ . . . ≤ mn , Fmi — свободная группа c образующими a1 , . . .,
am i .
Г. С. Маканин [13] построил искомый алгоритм и доказал разрешимость
позитивной теории свободной группы.
Обобщая эти ситуации, Г. С. Маканин поставил в "Коуровской
тетради"[9] следующую проблему для уравнений в свободных группах
9.25. Указать алгоритм, который по уравнению
w ( x 1 , . . . , x m , a1 , . . . , a n ) = 1
в свободной группе Fn и списку конечно порожденных подгрупп H1 ,..., Hm
группы Fn позволял бы узнать, существует ли решение этого уравнения с
условием
x1 ∈ H 1 , . . . , xm ∈ H m .
Первые положительные результаты в направлении решения этой проблемы получил А. Ш. Малхасян [14].
К. Шульц [23] рассмотрел аналогичную проблему для уравнений в свободных полугруппах с регулярными ограничениями на решения и доказал,
что существует алгоритм, который по уравнению
w ( x 1 , . . . , x m , a1 , . . . , a n ) = u ( x 1 , . . . , x m , a1 , . . . , an )
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Об уравнениях в словах
69
в свободной полугруппе Πn и списку регулярных подмножеств (языков)
H1 ,..., Hm полугруппы Πn позволяет узнать, существует ли решение этого
уравнения с условием
x1 ∈ H 1 , . . . , xm ∈ H m .
Так как каждая конечно порожденная подполугруппа свободной полугруппы
Πn является регулярным подмножеством (языком), то решенная К. Шульцем
проблема для уравнений с ограничениями на решения в свободных полугруппах является естественным аналогом проблемы Г. С. Маканина.
V. Diekert [21], [22] построил алгоритм, позволяющий по произвольному
уравнению
w ( x 1 , . . . , x m , a1 , . . . , an ) = 1
в свободной группе Fn и списку регулярных подмножеств (языков)
H1 ,..., Hm группы Fn узнать, существует ли решение этого уравнения с
условием
x1 ∈ H 1 , . . . , xm ∈ H m .
Так как конечно порожденные подгруппы являются регулярными подмножествамм, то тем самым решена и проблема Г. С. Маканина.
Сказанное дает основания считать, что представляет интерес дальнейшее
исследование различных обобщений проблемы Г. С. Маканина для свободных
групп и полугрупп, получающихся путем ослабления ограничений, налагаемых на подгруппы (подполугруппы, языки) H1 ,..., Hm .
В силу теоремы К. Шульца для получения алгоритмически неразрешимых проблем для уравнений в свободных полугруппах с подполугрупповыми ограничениями на решения необходимо рассматривать, в первую очередь,
бесконечно порожденные свободные подполугруппы, среди которых имеются
как нерегулярные, так и регулярные языки, например, подполугруппа, порожденная всевозможными словами вида abn a (n = 1, 2, ...), свободно ими
порождается и является регулярным языком.
В литературе по формальным языкам и грамматикам достаточно часто
встречается рекурсивный язык L1 в алфавите {a, b}, который состоит из всех
слов w в алфавите {a, b}, для которых |w|a = |w|b . Пользуясь известным
критерием свободности для подполугрупп свободной полугруппы, легко доказать, что L1 – свободная подполугруппа счетного ранга. Конечно, рекурсивный язык L1 не является регулярным, однако с точки зрения сложности
разрешимости для него алгоритмических проблем он скорее "ближе"к регулярным языкам, чем к произвольным рекурсивным.
Поэтому представляют интерес, на наш взгляд, следующие две теоремы.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
70
В. Г. Дурнев, О. В. Зеткина
Теорема 1. Можно указать такое однопараметрическое семейство уравнений с ограничениями на решения в свободной полугруппе Π2 ,
w ( x, x1 , . . . , xn , a, b ) = v ( x, x1 , . . . , xn , a, b ) &
& |xi | = |xj | & |x1 |b = |x2 |b
{i,j} ∈ A
с неизвестными x1 , ..., xn , с константами a и b и с параметром x, где A
– некоторое подмножество множества M (n) = {{t, s} | 1 ≤ t, s ≤ n}, что
невозможен алгоритм, позволяющий для произвольного натурального числа m определить, имеет ли решение уравнение с ограничениями на решения
w ( am , x1 , . . . , xn , a, b ) = v ( am , x1 , . . . , xn , a, b ) &
& |xi | = |xj | & |x1 |b = |x2 |b .
{i,j} ∈ A
Теорема 2. Можно указать такое однопараметрическое семейство уравнений с ограничениями на решения в свободной полугруппе Π2 ,
w ( x, x1 , . . . , xn , a, b ) = v ( x, x1 , . . . , xn , a, b ) &
&
{i,j} ∈ A
|xi | = |xj | & x1 ∈ L1
с неизвестными x1 , ..., xn , с константами a и b и с параметром x, где A
– некоторое подмножество множества M (n) = {{t, s} | 1 ≤ t, s ≤ n}, что
невозможен алгоритм, позволяющий для произвольного натурального числа m определить, имеет ли решение уравнение с ограничениями на решения
w ( am , x1 , . . . , xn , a, b ) = v ( am , x1 , . . . , xn , a, b ) &
& |xi | = |xj | & x1 ∈ L1 .
{i,j} ∈ A
Доказательство. Прежде всего покажем, что в позитивной ∃-теории полугруппы Π2 с использованием предиката |x| = |y| равенства длин выразим
ряд вспомогательных предикатов.
Пусть α – это буква a или b.
Nα ( x ) ⇋ ( x α = α x ).
Если X – элемент полугруппы Π2 , то формула Nα ( X ) истинна на полугруппе Π2 тогда и только тогда, когда X – степень буквы α.
Рассмотрим предикат R(x, y) истинный тогда и только тогда, когда найдется такое неотрицательное число t, что x = at , а y = bt .
Справедлива эквивалентность
R ( x, y ) ⇐⇒ xa = a x & yb = b y & |x| = |y|.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
71
Об уравнениях в словах
Введем необходимый для дальнейшего предикат делимости D(x, y), истинный тогда и только тогда, когда найдутся такие неотрицательные
целые числа s и t, что x = as , y = at и s делит t. Считается, конечно, что 0
делит 0.
Справедлива эквивалентность
D(x, y) ⇐⇒ ((xa = a x & ya = a y) &
((xx = x & yy = y) ∨ ((∃v)(∃u)(av = x & u(vb) = (vb)u & |u| = |y|)))).
Введем основной для дальнейшего предикат M ( x, y, z ) истинный тогда
и только тогда, когда найдутся такие натуральные числа s, t и r, что
x = as , y = at , z = ar и st = r.
Имеют место эквивалентности:
M ( x, y, z ) ⇐⇒
((xa = a x & ya = a y) &
( ∃ v )( ∃ u )( ∃ w)(u(bx) = (bx)u & R(y, v) & w = vz &
|u| = |w| & |u|b = |w|b )),
M ( x, y, z ) ⇐⇒
((xa = a x & ya = a y) &
( ∃ v )( ∃ u )( ∃ w)( ∃ p)( ∃ q)(u(bx) = (bx)u & R(y, v) & p = vz &
|u| = |p| & R(z, w) & q = uyw & q ∈ L1 )).
Воспользуемся следующим вариантом непосредственного следствия фундаментальной теоремы Ю.В. Матиясевича [15] о диофантовости рекурсивно
перечислимых множеств: для произвольного рекурсивно перечислимого множества А натуральных чисел можно построить такую формулу ΦA (x1 )
вида
s
(∃ x2 ) . . . (∃ xm ) Ψ,
где Ψ = & ϕi
i=1
и каждая формула ϕi имеет один из следующих видов:
xl + xj = xt , xj = xl , xl xj = xt , xj = c,
где c — натуральное число, что для произвольного натурального числа n
имеем:
n ∈ А тогда и только тогда, когда формула ΦA (n) истинна на множестве натуральных чисел.
Воспользовавшись хорошо известной эквивалентностью
xy = z
⇐⇒
(x + y)2 = x2 + 2z + y 2 ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
72
В. Г. Дурнев, О. В. Зеткина
можно считать, что в формулу ΦA (x1 ) подформулы вида xl xj = xt входят
лишь при l = j, т. е. они имеют вид x2l = xt .
Воспользуемся следующим утверждением, принадлежащим Дж. Робинсон [19],
если m, n и L – натуральные числа, m ≤ n и L > n2 , то
(L + m) | L2 − n тогда и только тогда, когда n = m2 .
Условие L > n2 можно заменить следующим условием
(n + 1) | L & (n + 2) | L.
Это позволяет в формуле ΦA (x1 ) заменить подформулу
p
& x2li = xti
i=1
на подформулу
2
U = Y &Z =
p
X
i=1
xti & (Z + 1) | Y & (Z + 2) | Y &
p
p
i=1
i=1
& xti = xli + ui & & (Y + xli ) | (U − xti ).
Поэтому можно считать, что в формуле ΦA (x1 ) лишь одна подформула ϕi
имеет вид x2l = xt , а все остальные подформулы ϕi имеют один из следующих видов:
xl + xj = xt , xj = xl , xl | xj , xj = c,
где c – натуральное число.
(1)
По формуле ΦA (x1 ) построим формулу ΦA (x1 ) следующим образом:
m
(1)
ΦA (x1 ) ⇋ ( ∃ x2 ) . . . ( ∃ xm ) ( Ψ1 & ( & Na ( xi ))),
i=2
где Ψ1 получается из Ψ заменой каждой подформулы ϕi вида xl + xj = xk
на xl xj = xk , вида xl | xj – на D ( xl , xj ), вида xj = xk – на xj = xk , вида
xj = c – на xj = ac1 и вида x2l = xk – на M ( xl , xl , xk ). Напомним, что
подформула последнего вида лишь одна и только в нее, причем лишь один
раз, входит предикат |x|b = |y|b или предикат x ∈ L1 .
(1)
Подходящим образом переименовав переменные в формуле ΦA ( x1 ), мо(1)
жем считать, что в формулу ΦA ( x ) входят лишь переменные x, x1 , ..., xn .
(1)
Удалим из формулы ΦA ( x ) конъюнкцию & и дизъюнкцию ∨, приведем
полученную формулу к виду
w ( x, x1 , . . . , xn , a, b ) = v ( x, x1 , . . . , xn , a, b ) &
& |xi | = |xj | & |x1 |b = |x2 |b
{i,j} ∈ A
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
73
Об уравнениях в словах
или виду
w ( x, x1 , . . . , xn , a, b ) = v ( x, x1 , . . . , xn , a, b ) &
&
{i,j} ∈ A
|xi | = |xj | & x1 ∈ L1 .
(2)
Полученную формулу обозначим через ΦA ( x ).
(2)
Тогда: k ∈ A тогда и только тогда, когда формула ΦA ( ak ) истинна на
полугруппе Π2 .
Для завершения доказательства теорем достаточно взять в качестве A
рекурсивно перечислимое, но нерекурсивное множество.
Литература
[1] Важенин Ю. М., Розенблат Б. В. Разрешимость позитивной теории свободной счетнопорожденной полугруппы // Мат. сборник. 1981. Т. 116,
№ 1. С. 120 – 127.
[2] Дурнев В. Г. Позитивная теория свободной полугруппы// ДАН СССР.
1973. Т. 211, № 4. С. 772 – 774.
[3] Дурнев В. Г. Об уравнениях на свободных полугруппах и группах// Мат.
заметки. 1974. Т. 16, № 5. С. 717 – 724.
[4] Дурнев В. Г. О позитивных формулах на свободных полугруппах// Сиб.
мат. журн. 1974. Т. 25, № 5. С. 1131 – 1137.
[5] Дурнев В. Г. Неразрешимость позитивной ∀∃3 -теории свободной полугруппы// Сиб. мат. журн. 1995. Т. 36, № 5. С. 1067 – 1080.
[6] Косовский Н. К. Некоторые свойства решений уравнений в свободной
полугруппе // Записки науч. семинаров Ленингр. отд. Мат. ин-та. АН
СССР. Л. 1972. Т. 32. С. 21 – 28.
[7] Косовский Н. К. О множествах, представимых в виде решений уравнений в словах и длинах // II Всесоюзная конф. по мат. логике: Тезисы
кратких сообщений. М., 1972. С. 23.
[8] Косовский Н. К. О решении систем, состоящих одновременно из уравнений в словах и неравенств в длинах слов// Записки науч. семинаров
Ленингр. отд. Мат. ин-та. АН СССР. Л. 1973. Т. 33. С. 24 – 29.
[9] Коуровская тетрадь. 11-е изд., доп. Новосибирск, 1990.
[10] Маканин Г. С. Проблема разрешимости уравнений в свободной полугруппе// ДАН СССР. 1977. Т. 233, № 2. С. 287 – 290.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
74
В. Г. Дурнев, О. В. Зеткина
[11] Маканин Г. С. Проблема разрешимости уравнений в свободной полугруппе// Мат. сб. 1977. Т. 103 (145), № 2 (6). С. 147 – 236.
[12] Маканин Г. С. Уравнения в свободной группе // Изв. АН СССР. Сер.
Математическая. 1982. Т. 46, вып. 6. С. 1199 – 1274.
[13] Маканин Г. С. Разрешимость универсальной и позитивной теорий свободной группы // Изв. АН СССР. Сер. Математическая. 1984. Т. 48,
вып. 4. С. 735 – 749.
[14] Малхасян А. Ш. О разрешимости в подгруппах уравнений в свободной
группе // Прикладная математика: сб. 1986. Вып. 2. С. 42 – 47.
[15] Матиясевич Ю. В. Диофантовость перечислимых множеств // ДАН
СССР. 1970. Т. 130, № 3. С. 495 – 498.
[16] Матиясевич Ю. В. Связь систем уравнений в словах и длинах с 10-й
проблемой Гильберта // Исследования по конструктивной математике
и математической логике: Записки науч. семинаров Ленингр. отд. Мат.
ин-та. АН СССР. Л. 1968. Т. 8. С. 132 – 143.
[17] Мерзляков Ю. И. Позитивные формулы на свободных группах // Алгебра и логика. 1966. Т. 5, № 4. С. 25 – 42.
[18] Хмелевский Ю. И. Уравнения в свободной полугруппе. М.: Наука, 1971.
(Тр. Мат. ин-та им. В. А. Стеклова. Т. 107.)
[19] Buchi J. R., Senger S. Definability in the existential theory of concatenation
// Z. math. Log. und Grundl. Math. 1988. V. 34, № 4. P. 337 – 342.
[20] Buchi J. R., Senger S. Coding in the existential theory of concatenation //
Arch. Math. Logik. 1986/87. Bd. 26. P. 101 – 106.
[21] Diekert V., Gutierrez C., Hagenah C. The existential theory of equations with
rational constraints in free groups is PSPACE-complete / A. Ferreira and
H. Reichel (ed.) // Proc. 18-th Annual Symposium on Theoretical Aspects
of Computer Science (STACS’01). Dresden (Germany), 2001; 2010 in Leture
Notes in Computer Science. P. 170 – 182. Springer-Verlag, 2001.
[22] Diekert V., Gutierrez C., Hagenah C. The existential theory of equations with
rational constraints in free groups is PSPACE-complete // Informatiion and
Computation. 2005. V. 202. P. 105 – 140.
[23] Schulz K. U. Makanin’s Algprithm for Word Equations - Two Improvements
and a Generalization // Lecture Notes in Computer Science. 1990. V. 572.
P. 85 – 150.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 531.38
Оптимальное управление одной
механической системой, моделирующей
движение руки манипулятора
М. Ю. Злобина, Е. П. Кубышкин
ОАО «Славнефть-ЯНОС»
Московский пр-т, 130, 150023 Ярославль, Россия
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: garnim@mail.ru, kubysh@uniyar.ac.ru
Работа посвящена построению оптимальных управлений
поворотом механической системы, состоящей из двух твердых
тел, соединенных упругим стержнем, на заданный угол вокруг
оси, проходящей через центр масс одного из твердых тел. Решена задача оптимального управления поворотом системы на
заданный угол с полным гашением колебаний упругого стержня
при минимуме функционала энергии от управляющего момента
и задача быстродействия.
Библиография: 7 названий.
1. Постановка задачи. Рассматривается механическая система, состоящая из твердого тела (назовем его основанием) и жестко связанного с
ним упругого стержня постоянного сечения и равномерно распределенной
по длине массой. На другом конце стержня жестко закреплено второе твердое тело (в дальнейшем — груз). Центры масс O1 и O2 основания и груза
соответственно расположены на касательных, проведенных к центральной
оси стержня в точках заделки. Поместим в центр масс O1 две правые прямоугольные системы координат O1 X1 Y1 Z1 и O1 X2 Y2 Z2 , расположив их таким
образом, чтобы центральная ось стержня находилась в плоскостях O1 X1 Y1
и O1 X2 Y2 . Оси O1 Z1 и O1 Z2 совпадают. Система O1 X1 Y1 Z1 связана с инерциальным пространством, а система O1 X2 Y2 Z2 – с твердым телом. При этом
ось O1 X2 проходит вдоль касательной к оси стержня в точке заделки. Механическая система может совершать вращательные движения вокруг оси
75
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
76
М. Ю. Злобина, Е. П. Кубышкин
O1 Z1 , относительно которой приложен момент внешних сил M ′ (t′ ). Рассматриваемая система служит механической моделью манипуляционного робота,
переносящего груз, рука которого обладает упругими свойствами.
Свяжем с твердым телом еще одну систему координат OX ′ Y ′ Z ′ , поместив ее начало в точку заделки стержня и направив оси параллельно осям
системы O1 X2 Y2 Z2 . Cчитая упругие смещения стержня малыми и перпендикулярными оси OX ′ , положение механической системы можно охарактеризовать углом поворота θ(t′ ) (между осями O1 X1 и O1 X2 ) и величиной y ′ (x′ , t′ )
поперечной деформации стержня в точке x′ в момент времени t′ (рис. 1).
Рис. 1.
Введем следующие обозачения: l – длина стержня; m′ – погонная масса
стержня; m′2 – масса груза; a′1 и a′2 – расстояния от точек заделки стержня
до соответствующих центров масс основания и груза; J1′ – момент инерции
основания относительно оси O1 Z1 ; J2′ – момент инерции груза относительно
оси, проходящей через O2 параллельно оси O1 Z1 ; EI – жесткость поперечного сечения стержня; x′ – координата точки стержня, отсчитываемая от точки
O вдоль оси OX ′ . В работе [1] в рамках линейной теории тонких прямолинейных стержней [2] получена начально-краевая задача, которая является
математической моделью рассматриваемой механической системы. В безрамерных переменных она имеет вид:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальное управление механической системой
J θ̈ +
Z
77
1
(x + a1 )ytt (x, t)dx + m2 (1 + a1 + a2 )ytt (1, t)+
0
+[m2 a2 (1 + a1 + a2 ) + J2 ]yxtt (1, t) = M (t),
(1)
ytt + yxxxx = −(x + a1 )θ̈,
(2)
y(0, t) = yx (0, t) = 0,
(3)
yxx (1, t) = −J2 (yxtt (1, t) + θ̈) − m2 a2 ytt (1, t) + a2 yxtt (1, t) + θ̈(1 + a1 + a2 ) ,
(4)
yxxx (1, t) = m2 ytt (1, t) + a2 yxtt (1, t) + θ̈(1 + a1 + a2 ) ,
θ(0) = θ0 ,
θ̇(0) = θ̇0 ,
где
J = J1 +
Z
y(x, 0) = y0 (x),
yt (x, 0) = ẏ0 (x),
(5)
(6)
1
(x + a1 )2 dx + m2 (1 + a1 + a2 )2 + J2 .
0
Начально-краевая задача (1)–(6) приведена в безразмерных переменных
x = x′ /l, t = bt′ , b2 = EI/(m′ l4 ), y(x, t) = y ′ (x′ , t′ )/l, M (t) = M ′ (t′ )/(m′ l3 b2 ),
m2 = m′2 /(m′ l), aj = a′j /l, Jj = Jj′ /(m′ l3 ) (j = 1, 2). Весом стержня и груза
при выводе начально-краевой задачи (1)–(6) пренебрегаем.
Ниже рассматриваются следующие задачи оптимального управления.
Задача 1. Определить момент управления M (t) ∈ L2 (0, T ), переводящий
рассматриваемую механическую систему в силу краевой задачи (1)–(5) из
начального состояния (6) в конечное в заданный момент времени T
θ(T ) = θT ,
θ̇(T ) = θ̇T ,
y(x, T ) = yT (x),
yt (x, T ) = ẏT (x)
(7)
и минимизирующий функционал
Φ(M ) = kM (t)k2L2 (0,T ) /2.
(8)
Задача 2. (Задача быстродействия) Определить момент управления
M (t) ∈ L2 (0, T ), Φ(M ) 6 L < ∞, переводящий рассматриваемую механическую систему в силу краевой задачи (1)–(5) из (6) в (7) за минимальное
время Т.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
78
М. Ю. Злобина, Е. П. Кубышкин
2. Построение решения начально-краевой задачи (1)–(6). Выразим ytt (x, t) из (2) и подставим в уравнение (1). В результате имеем
Z 1
Z 1
2
θ̈ J −
(x + a1 ) dx −
(x + a1 )yxxxx (x, t)dx + m2 (1 + a1 + a2 )ytt (1, t)+
0
0
+[m2 a2 (1 + a1 + a2 ) + J2 ]yxtt (1, t) = M (t).
(9)
Вычислив входящий в (9) интеграл по частям с учетом краевых условий (4),
(5), получим для θ следующее дифференциальное уравнение
J1 θ̈ + a1 yxxx (0, t) − yxx (0, t) = M (t).
Это позволяет выписать для определения y(x, t) следующие две эквивалентные начально-краевые задачи:
Z 1
−1
ytt − J (x + a1 )
(x1 + a1 )ytt (x1 , t)dx1 + m2 (1 + a1 + a2 )ytt (1, t)+
0
+[J2 + m2 a2 (1 + a1 + a2 )]yxtt (1, t) + yxxxx = −J −1 (x + a1 )M (t),
(10)
y(0, t) = yx (0, t) = 0,
Z
−1
1
(x1 + a1 )ytt (x1 , t)dx1 −
yxx (1, t) = J [J2 + m2 a2 (1 + a1 + a2 )]
0
2
2
−1
J(J2 + m2 a2 ) − [J2 + m2 a2 (1 + a1 + a2 )] yxtt (1, t)−
−J
−1
−J m2 Ja2 − (1 + a1 + a2 )[J2 + m2 a2 (1 + a1 + a2 )] ytt (1, t)−
−J −1 [J2 + m2 a2 (1 + a1 + a2 )]M (t),
yxxx (1, t) = −J
−1
m2 (1 + a1 + a2 )
Z
(12)
1
(x1 + a1 )ytt (x1 , t)dx1 +
0
+J −1 m2 [J − m2 (1 + a1 + a2 )2 ]ytt (1, t)+
−1
+J m2 Ja2 − (1 + a1 + a2 )[J2 + m2 a2 (1 + a1 + a2 )] yxtt (1, t)+
+J −1 m2 (1 + a1 + a2 )M (t),
y(x, 0) = y0 (x),
(11)
yt (x, 0) = ẏ0 (x)
(13)
(14)
и
ytt + yxxxx − J1−1 (x + a1 )(a1 yxxx (0) − yxx (0)) = −J1−1 (x + a1 )M (t),
(15)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальное управление механической системой
y(0, t) = yx (0, t) = 0,
79
(16)
yxx (1, t) − J1−1 [J2 + m2 a2 (1 + a1 + a2 )](a1 yxxx (0, t) − yxx (0, t)) =
= −(J2 + m2 a22 )yxtt (1, t) − m2 a2 ytt (1, t) − J1−1 [J2 + m2 a2 (1 + a1 + a2 )]M (t),
(17)
yxxx (1, t) + J1−1 m2 (1 + a1 + a2 )(a1 yxxx (0, t) − yxx (0, t)) =
= m2 ytt (1, t) + m2 a2 yxtt (1, t) + J1−1 m2 (1 + a1 + a2 )M (t),
y(x, 0) = y0 (x),
yt (x, 0) = ẏ0 (x).
(18)
(19)
Положим сначала M (t) ≡ 0. Определяя решение y(x, t) в виде
y(x, t) = v(x)s(t), подставим его в начально-краевую задачу (15)–(19). В результате получим для определения v(x) спектральную краевую задачу
v IV (x) − J1−1 (x + a1 )(a1 v ′′′ (0) − v ′′ (0)) = λv(x),
(20)
v(0) = v ′ (0) = 0,
(21)
v ′′ (1)−J1−1 [J2 +a2 m2 (1+a1 +a2 )](a1 v ′′′ (0)−v ′′ (0)) = λ[(J2 +a22 m2 )v ′ (1)+a2 m2 v(1)],
(22)
v ′′′ (1) + J1−1 m2 (1 + a1 + a2 )(a1 v ′′′ (0) − v ′′ (0)) = −λm2 (v(1) + a2 v ′ (1)),
(23)
a для s(t) – следующее уравнение
s̈(t) + λs(t) = 0.
Спектральная краевая задача (20)–(23) подробно изучалась в работе [3],
где были построены полная система однократных собственных значений
0 < λ1 < λ2 < . . . < λn < . . . и соответствующих им собственных функций vn (x)(n = 1, 2, ...). При этом (λn = βn4 ), где βn — положительный корень
уравнения
J1 β −4 − J1 J2 m2 + (((J1 − 2(J2 + (a22 − a21 )m2 ))β −4 + J1 J2 m2 ) cos β+
+(β −7 + 2a1 m2 β −5 + (m2 (J2 − J1 ) + a1 (a1 + 2J2 + 2a22 m2 ))β −3 +
+(J1 J2 + m2 (a22 J1 + a21 J2 ))β −1 ) sin β)chβ+
+((−β −7 + 2a1 m2 β −5 + (m2 (J1 − J2 ) + a1 (a1 − 2J2 − 2a22 m2 ))β −3 +
+(J1 J2 + m2 (a22 J1 + a21 J2 ))β −1 ) cos β+
+2((a1 + m2 )β −6 + a21 (J2 + a22 m2 )β −3 + a1 J2 m2 β −2 ) sin β) sh β = 0,
(24)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
80
М. Ю. Злобина, Е. П. Кубышкин
vn (x) = vn∗ (x)/hvn∗ (x), vn∗ (x)i1/2 .
(25)
Здесь
vn∗ (x) = An ch(βn x) + Bn sh(βn x) + Cn cos(βn x) + Dn sin(βn x)−
−(J1 β 2 )−1 (x + a1 )(a1 β(Bn − Dn ) − An + Cn ),
An = βn [2a1 βn (m2 + a1 (1 − βn2 m2 a2 )) − J1 βn3 m2 ] sin βn + J1 βn3 m2 sh βn +
+ [2a1 (−1 + βn2 m2 (a1 + a2 )) − J1 βn2 (−1 + βn2 m2 a2 )] cos βn +
+ J1 βn2 (1 + βn2 m2 a2 )chβn ,
Bn = [2βn m2 + (1 + βn2 m2 a2 )(2a1 βn + J1 βn3 )] sin βn − βn3 J1 (1 + a2 βn2 m2 ) sh βn +
+ [2βn2 m2 (a1 + a2 ) − 2 + βn4 J1 m2 ] cos βn − βn4 J1 m2 chβn ,
Cn = −βn − J1 βn3 m2 sin βn + [2a1 βn (m2 + a1 (1 + βn2 m2 a2 )) + J1 βn3 m2 ] sh βn +
+ J1 βn2 (1 − βn2 m2 a2 ) cos βn + [2a1 (1 + βn2 m2 (a1 + a2 ))+
+ J1 βn2 (1 + βn2 m2 a2 )]chβn ,
Dn = − βn3 J1 (1 − a2 βn2 m2 ) sin βn + [2βn m2 + (1 + βn2 m2 a2 )(2a1 βn − J1 βn3 )] sh βn +
+ βn4 J1 m2 cos βn + [2βn2 m2 (a1 + a2 ) + 2 − βn4 J1 m2 ]chβn .
а скалярное произведение h·, ·i имеет вид
Z
h
vk′′ (x)vl′′ (x)dx = λk (vk , vl ) + mvk (1)vl (1) + (J2 + a22 m)vk′ (1)vl′ (1)+
0
1
+a2 m(vk′ (1)vl (1) + vk (1)vl′ (1)) −
(x + a1 , vk )(x + a1 , vl )+
J
+m(1 + a1 + a2 )((x + a1 , vk )vl (1) + (x + a1 , vl )vk (1))+
+(J2 + ma2 (1 + a1 + a2 ))((x + a1 , vk )vl′ (1) + (x + a1 , vl )vk′ (1))+
+m2 (1 + a1 + a2 )2 vk (1)vl (1) + (J2 + ma2 (1 + a1 + a2 ))2 vk′ (1)vl′ (1)+
i
+m(J2 + ma2 (1 + a1 + a2 ))(1 + a1 + a2 )(vk (1)vl′ (1) + vl (1)vk′ (1)) = λk hvk , vl i.
1
(26)
Между функциями vn (x) выполнены следующие условия ортогональности
hvk , vl i = δkl ,
(27)
где δkl — символ Кронекера.
Для того чтобы получить выражения (24) и (26), заметим, что функция
(25) (индекс опустим) является общим решением уравнения (20). Подставив
теперь (25) в краевые условия (21)–(23), получим для определения A, B, C, D
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальное управление механической системой
следующую систему линейных уравнений

(1 + a1 (J1 β 2 )−1 )A − a21 (J1 β)−1 B + (1 − a1 (J1 β 2 )−1 )C + a21 (J1 β)−1 D





(J1 β 2 )−1 A + (β − a1 (J1 β)−1 )B − (J1 β 2 )−1 C + (β + a1 (J1 β)−1 )D





(chβ(1 + β 2 a2 m2 ) + β 3 sh β(J2 + a22 m2 ))A+





+ (sh β(1 + β 2 a2 m2 ) + β 3 chβ(J2 + a22 m2 ))B+



 + (cos β(−1 + β 2 a m ) − β 3 sin β(J + a2 m ))C+
2 2
2
2 2
2
3
2

+ (sin β(−1 + β a2 m2 ) + β cos β(J2 + a2 m2 ))D





(sh β(1 + β 2 a2 m2 ) + βm2 chβ)A+




+ (chβ(1 + β 2 a2 m2 ) + βm2 sh β)B+





+ (sin β(1 − β 2 a2 m2 ) + βm2 cos β)C+




+ (cos β(−1 + β 2 a2 m2 ) + βm2 sin β)D
81
= 0,
= 0,
= 0,
= 0.
Эта система имеет нетривиальное решение, если ее определитель равен
нулю. Этот факт дает характеристическое уравнение (24). Для получения
выражения (26) рассмотрим начально-краевую задачу (10)–(14). Определяя
y(x, t) = v(x)s(t), получим для определения v(x) следующую спектральную
краевую задачу
hZ 1
1
IV
(x1 + a1 )v(x1 )dx1 +
v (x) = λ v(x) − (x + a1 )
J
0
i
′
(28)
+m2 (1 + a1 + a2 )v(1) + [J2 + m2 a2 (1 + a1 + a2 )]v (1) ,
v(0) = v ′ (0) = 0,
(29)
v (1) = λ (J2 + a22 m2 )v ′ (1) + m2 a2 v(1)−
hZ 1
−1
−J (J2 + m2 a2 (1 + a1 + a2 ))
(x1 + a1 )v(x1 )dx1 +
′′
0
i
+m2 a2 (1 + a1 + a2 )v(1) + [J2 + m2 a2 (1 + a1 + a2 )]v (1) ,
′′′
v (1) = λ −m2 (v(1) + a2 v ′ (1))−
hZ 1
−1
−J (m2 (1 + a1 + a2 ))
(x1 + a1 )v(x1 )dx1 +
0
i
′
+m2 (1 + a1 + a2 )v(1) + [J2 + m2 a2 (1 + a1 + a2 )]v (1) ,
′
(30)
(31)
эквивалентную (20)–(23). Пусть vk (x) и vl (x) — собственные функции спектральной краевой задачи (28)-(31), отвечающие собственным значениям λk
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
82
М. Ю. Злобина, Е. П. Кубышкин
и λl (k 6= l) соответственно. Подставим теперь vk (x) и λk в (28). Полученное
равенство умножим на vl (x) и проинтегрируем по отрезку [0,1]. В результате
имеем
Z 1
Z 1
IV
vk (x)vl (x)dx = λk
vk (x)vl (x)dx−
0
0
Z
hZ 1
1 1
(x + a1 )vm (x)dx
(x1 + a1 )v(x1 )dx1 +
−
J 0
0
i
′
(32)
+m2 (1 + a1 + a2 )v(1) + [J2 + m2 a2 (1 + a1 + a2 )]v (1) ,
Вычисляя интеграл в левой части (32) по частям, с учетом краевых условий (29)–(31) будем иметь
Z 1
vk′′ (x)vl′′ (x)dx = λk hvk , vl i.
(33)
0
Поменяв vk (x) и vl (x) местами, получим
Z 1
vl′′ (x)vk′′ (x)dx = λl hvk , vl i.
(34)
0
При λk 6= λl , вычтя из (33) выражение (34), имеем равенство (27).
Перейдем теперь непосредственно к построению решения начальнокраевой задачи (10)–(14). Отметим, что начально-краевая задача (10)–(14)
в силу краевых условий (12)–(13), содержащих производную по времени, может иметь лишь обобщенное решение. Для его определения введем некоторые
функциональные пространства. В дальнейшем
QT = {(x, t), 0 < x < 1, 0 < t < T }.
Обозначим через H(0, 1) гильбертово пространство функций y(x), полученное замыканием в норме ky(x)kH = hy(x), y(x)i1/2 линейной оболочки
функций vn (x)(n = 1, 2, ...). Согласно (26), для y(x) ∈ H(0, 1) ky(x)k ≥ 0,
ky(x)k = 0 ⇐⇒ y(x) = 0, т. е. (26) удовлетворяет всем условиям скалярного
произведения для v(x), w(x) ∈ H(0, 1). Очевидно, что H(0, 1) ⊂ L2 (0, 1).
Обозначим через H1 (0, 1) гильбертово пространство функций y(x), полученное замыканием в норме
1/2
ky(x)kH1 = (y(x), y(x))H1
((u(x), v(x))H1 = (u′ (x), v ′ (x))L2 (0,1) )
линейной оболочки функций vn (x)(n
=
1, 2, ...). Очевидно, что
1
H1 (0, 1) ⊂ W2 (0, 1).
Обозначим через H2 (0, 1) гильбертово пространство функций y(x), полученное замыканием в норме
1/2
ky(x)kH2 = (y(x), y(x))H2
((u(x), v(x))H2 = (u′′ (x), v ′′ (x))L2 (0,1) )
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
83
Оптимальное управление механической системой
линейной оболочки функций vn (x) (n = 1, 2, ...). Очевидно, что
H2 (0, 1) ⊂ W22 (0, 1).
Через H(QT ) обозначим гильбертово пространство функций y(x, t), полу1/2
ченное замыканием в норме ky(x, t)kH(QT ) = (y(x, t), y(x, t))H(QT ) , где
(u(x, t), v(x, t))H(QT ) =
Z
T
0
hu(x, t), v(x, t)idt,
пространства функций y(x, t) ∈ C 1,0 (QT ). Очевидно, что H(QT ) ⊂ L2 (QT ).
Через H2 (QT ) обозначим гильбертово пространство функций y(x, t), полу1/2
ченное замыканием в норме ky(x, t)kH2 (QT ) = (y(x, t), y(x, t))H2 (QT ) , где
(u(x, t), v(x, t))H2 (QT ) = (uxx (x, t), vxx (x, t))L2 (QT ) + (ut (x, t), vt (x, t))H(QT ) ,
множества функций y(x, t) ∈ C 2,1 (QT ), y(0, t) = yx (0, t) = 0.
Умножим уравнение (10) на функцию
v(x, t) ∈ H2 (QT ),
(35)
v(x, T ) ≡ 0
и проинтегрируем по (x, t) ∈ QT . В результате будем иметь равенство
ZTZ1
1
ytt (x, t)v(x, t)dxdt −
J
0 0
( ZTZ1
(x + a1 )v(x, t)dx
(x1 + a1 )ytt (x1 , t)dx1 dt+
0
0 0
+m2 (1 + a1 + a2 )
Z1
ZT Z1
(x + a1 )v(x, t)ytt (1, t)dxdt+
0 0
+[J2 + m2 a2 (1 + a1 + a2 )]
ZTZ1
)
(x + a1 )v(x, t)yxtt (1, t)dxdt +
0 0
+
ZTZ1
1
v(x, t)yxxxx (x, t)dxdt = −
J
0 0
ZTZ1
(x + a1 )v(x, t)M (t)dxdt.
(36)
0 0
Вычисляя интегралы, входящие в (36), по частям с учетом краевых и
начальных условий (11)–(14) и условия (35), получим выражение
ZT 0
1
hyt (x, t), vt (x, t)i − (yxx (x, t), vxx (x, t))L2 (0,1) − hx + a1 , v(x, t)iM (t) dt+
J1
+hẏ0 (x), v(x, 0)i = 0.
(37)
Пусть
y0 (x) ∈ H2 (0, 1),
ẏ0 (x) ∈ H1 (0, 1).
(38)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
84
М. Ю. Злобина, Е. П. Кубышкин
Под обобщенным решением начально-краевой задачи (10)–(14), определенным в области Q(T ), с начальными условиями (38) будем понимать функцию y(x, t) ∈ H2 (QT ), удовлетворяющую интегральному соотношению (37)
для любой функции v(x, t) вида (35).
Отметим следующее. Согласно (33)–(34) функции vn (x) образуют в
H2 (0, 1) ортогональный базис. При этом для любой функции vn (x) ∈ H2 (0, 1)
справедливо равенство
ωn2 hvn (x), v(x)i = (vn′′ (x), v ′′ (x))L2 = (vn (x), v(x))H2
Представим
y0 (x) =
∞
X
ωn−1 a0n vn (x),
n=1
ẏ0 (x) =
∞
X
b0n vn (x),
n=1
∞
X
x + a1 =
dn vn (x),
n=1
a0n = ωn−1 (y0 (x), vn (x))H2 , ky0 (x)k2H2 =
b0n = hẏ0 (x), vn (x)i, kẏ0 (x)k2H =
∞
X
∞
X
n=1
b20n ,
a20n ,
(39)
(40)
n=1
dn = hx + a1 , vn (x)i, kx + a1 k2H =
∞
X
d2n .
(41)
n=1
Утверждение 1. Обобщенное решение y(x, t) ∈ H1 (QT ) начальнокраевой задачи (10)–(14) при начальных условиях (38) существует, единственно и представимо в виде
y(x, t) =
∞
X
vn (x) a0n ωn−1 cos(ωn t) + b0n ωn−1 sin(ωn t)−
n=1
−J1−1 dn
Zt
0
ωn−1 sin(ωn (t − τ ))M (τ )dτ ,
(42)
где a0n , b0n , dn определены в (39)–(41). При этом справедлива оценка
ky(x, t)kH1 (QT ) ≤ C ky0 (x)k2H2 + kẏ0 (x)k2H1 + kx + a1 k2H kM (t)k2L2 (0,T ) , (43)
где C > 0 – некоторая постоянная.
Из неравенства (43) следует корректность поставленной задачи. Доказательство утверждения 1 достаточно громоздкое, поэтому изложим лишь схему доказательства, которая является стандартной (см., например, [4]). Сначала доказывается единственность решения. Затем необходимо показать, что
любой конечный отрезок ряда (42) удовлетворяет соотношению (36) при соответствующих начальных условиях. В заключение доказывается фундаментальность ряда (42) в H1 (QT ), из которой c учетом неравенства Фридрихса
kẏ0 (x)k2H ≤ C kẏ0 (x)k2H1 [5] следует оценка (43).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
85
Оптимальное управление механической системой
Построим теперь обобщенное решение уравнения (1), удовлетворяющее
начальным условиям (7). Пусть функция
p(t) ∈ W21 (0, T ),
(44)
p(T ) = 0.
Умножим уравнение (1) на p(t) и проинтегрируем по t ∈ [0, T ]
J
ZT
θ̈(t)p(t)dt +
0
ZT Z1
0
(x + a1 )ytt (x, t)dx + m2 (1 + a1 + a2 )ytt (1, t)+
0
+[m2 a2 (1 + a1 + a2 ) + J2 ]yxtt (1, t) p(t)dt =
ZT
M (t)p(t)dt,
(45)
0
Вычисляя интегралы, входящие в (45) по частям, получим равенство
ZT J θ̇(t)ṗ(t) +
0
J
hx + a1 , yt (x, t)iṗ(t) dt + J θ̇0 p(0)+
J1
J
+ hx + a1 , ẏ0 (x)ip(0) +
J1
ZT
M (t)p(t)dt = 0.
(46)
0
Под обобщенным решением уравнения (1) будем понимать функцию
θ(t) ∈ W21 (0, T ) θ(0) = θ0 , удовлетворяющую интегральному равенству (46)
для любой функции p(t) вида (44).
Легко видеть, что искомым решением уравнения (1) будет функция
θ(t) = θ0 + θ̇0 t +
J1−1
hx + a1 , ẏ0 (x)it −
Zt
0
J −1
Zt
hx + a1 , yt1 (x, t1 )idt1 +
(t − t1 )M (t1 )dt1 =
0
= θ0 + θ̇0 t +
J1−1
hx + a1 , ẏ0 (x)it − hx + a1 , y(x, t)i + hx + a1 , y0 (x)i +
Zt
(47)
+J −1 (t − t1 )M (t1 )dt1 .
0
3. Построение оптимального управления. Считая
yT (x) ∈ H2 (0, 1),
ẏT (x) ∈ H1 (0, 1),
(48)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
86
М. Ю. Злобина, Е. П. Кубышкин
на основании (42), (47) задачу 1 переформулируем как гладкую экстремальную задачу с ограничениями типа равенств следующим образом: найти минимум функционала (8) при ограничениях
θ̇T = θ̇0 +
J1−1
θT = θ0 + θ̇0 T +
hx + a1 , ẏ0 (x)i − hx + a1 , ẏT (x)i + J
J1−1
−1
ZT
M (τ )dτ,
(49)
0
hx + a1 , ẏ0 (x)iT − hx + a1 , ẏT (x)i + hx + a1 , y0 (x, 0)i +
ZT
−1
+J
(T − τ )M (τ )dτ,
(50)
0
aT n =
ωn−1
a0n cos(ωn T ) + b0n sin(ωn T ) −
J1−1 dn
ZT
0
bT n = −a0n sin(ωn T ) + b0n cos(ωn T ) −
J1−1 dn
ZT
sin(ωn (T − τ ))M (τ )dτ ,
(51)
cos(ωn (T − τ ))M (τ )dτ,
(52)
0
aT n = ωn−1 (yT (x), vn (x))H1 ,
bT n = hẏT (x), vn (x)i (n = 1, 2, ...).
Обозначая kn (t) = ωn−1 sin(ωn t), перепишем равенства (49)–(52) с учетом (39)–
(41) в следующем виде
ZT
M (t)dt = (1, M (t))L2 (0,T ) = A0 (T ) = J(θ̇T − θ̇0 ) +
0
ZT
JJ1−1
∞
X
n=1
dn (bT n − b0n ),
(53)
(T − t)M (t)dt = (T − t, M (t))L2 (0,T ) = A1 (T ) =
0
= J(θT − θ0 − θ̇0 T ) + JJ1−1
∞
X
n=1
dn (aT n − a0n ωn−1 − b0n T ).
(54)
(dn ωn kn (T − t), M (t))L2 (0,T ) = A2n+1 (T ) = J1 (a0n k̇n (T ) + b0n ωn kn (T ) − aT n ωn ),
(55)
(dn k̇n (T − t), M (t))L2 (0,T ) = A2n (T ) = J1 (−a0n ωn kn (T ) + b0n k̇n (T ) − bT n ).
(56)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальное управление механической системой
87
Отметим, что согласно (39)–(41) и (48) имеем
∞
X
n=1
A2n (T ) < ∞.
(57)
Справедливо следующее
Утверждение 2. Величины
dn 6= 0 (n = 1, 2, . . .).
(58)
Для доказательства этого утверждения воспользуемся равенством
ωn2 dn = −(a1 vn′′′ (0) − vn′′ (0)),
(59)
которое получается, если уравнение (20) умножить на x + a1 и проинтегрировать по отрезку [0, 1] с учетом краевых условий (22), (23). Предположим, что
dn = 0 для некоторого n. Тогда из (59) следует равенство a1 vn′′′ (0) − vn′′ (0) = 0.
Учитывая это в (25) и используя краевые условия (21), получим, что
An + Cn = 0,
Bn + Dn = 0.
(60)
Подставив найденные в (25) выражения для An и Cn в (60), получим равенство
2a1 (chβn + cos βn ) + 2a1 βn2 m2 (a1 + a2 )(chβn − cos βn )+
2a1 βn (m2 + a1 )(sh βn − sin βn ) + βn2 m2 a1 a2 (sh βn + sin βn ) = 0
(61)
Т. к. при положительных βn выполнены неравенства sh βn + sin βn > 0,
chβn + cos βn > 0, sh βn − sin βn > 0 и chβn − cos βn > 0, левая часть (61)
строго больше нуля. Это означает неверность предположения, что dn = 0
для некоторого n.
Отметим, что условие (58) является необходимым для управляемости рассматриваемой механической системы.
Отметим также следующее. При β → ∞ левая часть уравнения (24) стремится к выражению cos β + O(β −1 ). В связи с этим βn ∼ π(2n + 1)/2 при
n → ∞, а функции vn (x) стремятся к балочным функциям, соответствующим условиям защемления с обоих концов. С учетом этого на основании (59)
замечаем, что при n → ∞
dn ∼ O(n−1 );
an0 , anT ∼ O(n−3 );
bn0 , bnT ∼ O(n−2 )
(62)
Для построения оптимального управления M ∗ (t) введем в рассмотрение
систему функций
ϕ0 (t) ≡ 1, ϕ1 (t) = T − t,
ϕ2j (t) = dj k̇j (T − t), ϕ2j+1 (t) = dj ωj kj (T − t) (j = 1, 2, ...).
(63)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
88
М. Ю. Злобина, Е. П. Кубышкин
Обозначим через G2 (0, T ) подпространство L2 (0, T ), являющееся замкнутой линейной оболочкой системы функций (63). Система функций (63) не
ортогональна в L2 (0, T ). Построим по (63) ортонормированную в L2 (0, T )
систему функций ψn (t), используя для этого ортогонализацию Шмидта [6].
Положим:
ψ̄0 (t) = ϕ0 (t),
ψ̄1 (t) = ϕ1 (t) − α10 ψ0 (t),
...
ψ̄n (t) = ϕn (t) −
n−1
X
ψ0 (t) = ψ̄0 (t)/η0 ,
ψ1 (t) = ψ̄1 (t)/η1 ,
...
(64)
αnj ψj (t), ψn (t) = ψ̄n (t)/ηn ,
j=0
ηn = ψ̄n (t)L2 (0,T ) .
αnj = (ϕn (t), ψj (t))L2 (0,T ) ,
Наряду с (64) определим величины βn (T ) следующим образом:
β0 (T ) = A0 (T )/η0 ,
β1 (T ) = (A1 (T ) − αnj β0 (T ))/η1 ,
...,
βn (T ) = (An (T ) −
n−1
X
(65)
αnj βj (T ))/ηn .
j=0
Функции ψn (t) образуют ортонормированный базис в G2 (0, T ). Отсюда и
из (63) следует, что равенства (53)–(56) эквивалентны равенствам
(M (t), ψn (t))L2 (0,T ) = βn (T ) (n = 0, 1, ...).
P
2
При этом из (57), (62) следует, что Θ(T ) = ∞
n=0 βn (T ) < ∞.
Утверждение 3. Решение задачи 1 дается формулой
∗
M (t) =
∞
X
βn (T )ψn (t).
(66)
(67)
n=0
Доказательство повторяет доказательство аналогичного утверждения из
[7]. Обозначим через M2 (0, T ) множество функций M (t) ∈ L2 (0, T ), удовлетворяющих условиям (53)–(56). Представим пространство L2 (0, T ) в виде
прямой суммы L2 (0, T ) = G2 (0, T ) ⊕ Q2 (0, T ), где Q2 (0, T ) – ортогональное дополнение к G2 (0, T ). Отсюда следует, что любую функцию M (t), принадлежащую выпуклому множеству M2 (0, T ), можно представить в виде
M (t) = M ∗ (t) + Q(t), где M ∗ (t) ∈ H2 (0, T ), Q(t) ∈ Q2 (0, T ). Cогласно (66),
(M (t), ψn (t))L2 (0,T ) = (M ∗ (t), ψn (t))L2 (0,T ) + (Q(t), ψn (t))L2 (0,T ) = βn (T )
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
89
Оптимальное управление механической системой
Рис. 2. a1 = 0, 1; J1 = 0, 3; a2 = 0, 025;
Рис. 3. a1 = 0, 1; J1 = 0, 3; a2 = 0, 1;
m2 = 0, 703125; J2 = 0, 000293
m2 = 45; J2 = 0, 3
Но т. к. (Q(t), ψn (t))L2 (0,T ) = 0, то M ∗ (t) задается формулой (67). Отсюда
inf
M ∈M2 (0,T )
kM (t)k2L2 (0,T ) = kM ∗ (t)k2L2 (0,T ) +
inf
Q∈Q2 (0,T )
kQ(t)k2L2 (0,T ) = kM ∗ (t)k2L2 (0,T ) .
Утверждение доказано.
Рассмотрим решение задачи 2. Согласно структуре функций (65) и условию (66), функция Θ(T ) непрерывна и
lim Θ(T ) = ∞,
T →0
lim Θ(T ) = 0.
T →∞
(68)
Обозначим через T ∗ первый положительный корень уравнения Θ(T ) = L.
Существование такого корня следует из (68).
Утверждение 4. Решение задачи 2 дает пара (T ∗ , M ∗ (t)), где M ∗ (t) дается формулой (67) при T = T ∗ .
4. Пример. Рассмотрим следующую механическую систему: твердое тело
(основание) – куб со стороной h = 1, 5·10−1 м; второе твердое тело (груз) – куб,
длина стороны которого h2 изменяется; стержень наследственно вязкоупругий, имеет длину l = 7, 5·10−1 м и квадратное сечение со стороной h1 = 10−2 м;
параметры материала следующие: ρ = 7, 8·103 кг/м3 , E = 2·1011 Н/м2 (сталь).
На рис. 2–3 приведены первые пять собственных функций спектральной
краевой задачи (20)–(23), соответствующие h2 = 0, 375·10−1 м и h2 = 1, 5·10−1
м.
На рис. 4–15 приведены графики функций M ∗ (t), дающих решение заπ
дачи 1 в случае поворота тела из положения равновесия на угол θT =
2
с полным гашением колебаний стержня за время T = 0, 05 с, T = 0, 1 с,
T = 0, 2 с при длине стороны груза h2 = 0, 375 · 10−1 м, h2 = 0, 75 · 10−1 м,
h2 = 1, 5 · 10−1 м. Графики приведены в безразмерных величинах.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
90
М. Ю. Злобина, Е. П. Кубышкин
Рис. 4. T = 0, 05c; h2 = 0
Рис. 5. T = 0, 05c; h2 = 0, 375 · 10−1 м
Рис. 6. T = 0, 05c; h2 = 0, 75 · 10−1 м
Рис. 7. T = 0, 05c; h2 = 1, 5 · 10−1 м
Рис. 8. T = 0, 1c; h2 = 0
Рис. 9. T = 0, 1c; h2 = 0, 375 · 10−1 м
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальное управление механической системой
91
Рис. 10. T = 0, 1c; h2 = 0, 75 · 10−1 м
Рис. 11. T = 0, 1c; h2 = 1, 5 · 10−1 м
Рис. 12. T = 0, 2c; h2 = 0
Рис. 13. T = 0, 2c; h2 = 0, 375 · 10−1 м
Рис. 14. T = 0, 2c; h2 = 0, 75 · 10−1 м
Рис. 15. T = 0, 2c; h2 = 1, 5 · 10−1 м
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
92
М. Ю. Злобина, Е. П. Кубышкин
Литература
[1] Кубышкин Е. П. Уравнения движения одной механической системы, моделирующей динамику манипуляционного робота// Математика, кибернетика, информатика: труды международной научной конференции памяти А. Ю. Левина. Ярославль: ЯрГУ, 2008. С. 100 – 103.
[2] Ландау Л. Д., Лифшиц Е. М. Теория упругости. М.: Наука, 1987. 248 с.
[3] Войтицкий В. И., Злобина М. Ю., Кубышкин Е. П. О спектральной задаче, возникающей в механике манипуляционных роботов // Моделирование и анализ информационных систем. 2009. Т. 16, № 3. С. 22 – 28.
[4] Михайлов В. П. Дифференциальные уравнения в частных производных:
Учеб. пособие для вузов. Изд. 2-е, перераб. и доп. М.: Наука. Физматлит,
1983. 424 с.
[5] Михлин, С. Г. Вариационные методы в математической физике. М.: Наука. Физматлит, 1970. 512 с.
[6] Рисс Ф., Секефальви-Надь Б. Лекции по функциональному анализу. М.:
Мир, 1979. 587 с.
[7] Кубышкин Е. П. Оптимальное управление поворотом твердого тела с
гибким стержнем // Прикладная математика и механика. 1992. Т. 56,
вып. 1. С. 240–249.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 512.54
Факторизации и представления групп
∗
Л. С. Казарин
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail:kazarin@uniyar.ac.ru
Обзор посвящен работам, касающимся факторизаций конечных и бесконечных групп, обыкновенных представлений конечных групп и приложений теории конечных групп, выполненным
в 2001 – 2010 годах на кафедре алгебры и математической логики
ЯрГУ.
Библиография: 39 названий.
1. Введение
Настоящий обзор посвящен работам в области теории групп, выполненным большей частью в 2001 – 2010 годах на кафедре алгебры и математической логики автором, его коллегами и учениками. Он является продолжением
предыдущих статей автора [1], [2]. Основные темы:
1. Группы с факторизацией и строение группы.
2. Представления и характеры конечных групп.
3. Приложения конечных групп.
К настоящему времени опубликованы обзоры [4],[5] и [3]-[6], касающиеся групп с факторизацией и нильпотентных алгебр, содержащие достаточную библиографию и ссылки на недавно полученные результаты. Поэтому
некоторые интересные темы затронуты вскользь. К сожалению, большинство указанных источников не всегда доступно читателю из России. Поэтому
некоторые из тем обсуждаются и в данном обзоре. В то же время использование указанных источников позволяет уменьшить количество ссылок на
оригинальные работы.
Работа выполнена при поддержке РФФИ грант 10-01-00324 и Немецкого математического общества.
∗
93
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
94
Л. С. Казарин
2. Группы с факторизацией и строение группы
1. Факторизации конечных групп. Согласно известной pα -лемме
Бернсайда, группа G, имеющая класс сопряженных элементов размера, равного степени простого числа, не может быть простой. Отсюда сразу вытекает
разрешимость групп порядка pα q β , где p и q — простые числа. Естественно,
что в этом случае G = CG (x)P , где x — представитель указанного класса, а P
— силовская p-подгруппа G. Если конечная группа G = AB — произведение
абелевой группы A и группы B, то Z(B) содержится в разрешимой нормальной подгруппе группы G (см. [6]). Отметим, что доказательство этого
не зависит от классификации конечных простых неабелевых групп в случае,
когда порядки A и B взаимно просты. Следующий результат [7], являющийся
обобщением классических теорем Бернсайда, Кегеля и Виланда, использует
классификацию простых неабелевых групп:
Теорема 2.1 Пусть конечная группа G = AB является произведением
нильпотентной группы A и группы B. Тогда Z(B) содержится в разрешимой
нормальной подгруппе группы G.
Другое обобщение получено в работах [8], [9]. Напомним, что группа X
называется π-разложимой (π — некоторое множество простых чисел, a π ′ —
его дополнение во множестве всех простых чисел), если она представима в
виде X = Oπ (X)×Oπ′ (X). Например, любая конечная нильпотентная группа
будет π-разложимой для любого подмножества π множества простых чисел.
Теорема 2.2 Пусть конечная группа G = AB является произведением
π-разложимых групп A и B. Если π содержит только нечетные числа, то
Oπ (A)Oπ (B) — холлова π-подгруппа группы G.
Строение конечных групп, у которых для любого элемента, лежащего в
некоторой силовской p-подгруппе P , число с ним сопряженных — степень
простого числа, установлено в работах [10] и [11]. Тем самым, найдено усиление результата Р. Бэра (см. [6]). Другой результат из [10] дает описание
конечных групп, все подгруппы Шмидта которых субнормальны. Наконец,
в ([6], Теорема 9.6) доказана разрешимость конечной группы, у которой нормализатор любой циклической примарной подгруппы имеет нильпотентное
добавление. Как правило, для доказательства разрешимости конечной группы, представимой в виде произведения подгрупп с заданными свойствами, в
настоящее время используется классификация конечных простых групп. В
случае, когда соответствующий минимальный контрпример“ оказывается
”
расширением простой группы с помощью ее группы автоморфизмов, можно
воспользоваться описанием максимальных факторизаций таких групп, полученной в [12]. Однако и сведение к такой ситуации, и ее использование часто
являются весьма нетривиальными задачами.
2. Факторизации бесконечных групп. Следует отметить, что для бесконечных групп не так уж много результатов, являющихся столь же общими,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Факторизации и представления групп
95
как и теорема Н. Ито, утверждающая двуступенную разрешимость группы
G = AB, представимой в виде произведения двух абелевых подгрупп. Совсем
недавно Я. Сысак и Б. Амберг ([6], Теорема 7.3) установили разрешимость
бесконечной группы G = AB, являющейся произведением групп A и B, каждая из которых имеет циклическую подгруппу индекса, не превосходящего
2. В этом случае хотя бы одна из групп A или B обязана быть группой диедра. Будем говорить, что группа X является группой диедрального типа, если
она содержит подгруппу Y индекса 2, для которой для некоторой инволюции
τ ∈ X \Y выполнено τ yτ = y −1 для любого y ∈ Y . Следующая теорема из [13]
является дуальной к указанной ситуации. Напомним, что группа Черникова
— группа с условием минимальности для подгрупп.
Теорема 2.3 Пусть группа G = AB является произведением групп Черникова A и B, имеющих абелевы подгруппы индекса не выше двух A0 и B0
соответственно. Если A является группой диедрального типа, то G — разрешимая группа Черникова.
Отметим, что условие периодичности или какое-либо дополнительное
условие на группу не накладывается. В доказательстве важную роль играют
результаты, полученные автором, о произведении конечных групп с нильпотентными подгруппами индекса, не превосходящего двух. Другой результат
близкого типа – следующая теорема.
Теорема 2.4 Пусть группа G = AB является произведением двух локально конечных групп диедра A и B. Тогда G-разрешимая группа.
В доказательстве теоремы нельзя было использовать индукционные соображения. Удивительным образом, теорема 3.2 оказалась полезной для решения задачи, предложенной авторам В. Д. Мазуровым. Будем говорить,
что группа G является насыщенной группами диедра, если любая конечная
подгруппа группы G содержится в конечной группе диедра. Периодические
группы, насыщенные группами диедра, были описаны при дополнительных
условиях А. К. Шлепкиным и А. Г. Рубашкиным в [14]. С помощью теоремы
3.2 получена следующая
Теорема 2.5 Пусть G является периодической группой, насыщенной
группами диедра. Тогда G — локально конечная группа диедра.
3. Графы, связанные с группами. Различного типа графы в последнее время часто встречаются во многих контекстах, связанных с выяснением
строения группы. Особой популярностью пользуется граф Грюнберга – Кегеля GK(G). Содержательный обзор исследований, посвященных этим графам
и близким к ним можно найти в [15]. Граф GK(G) конечной группы G имеет
своими вершинами множество π(G) всех простых делителей порядка группы. При этом вершины p и q связаны ребром в графе GK(G), если G имеет
элемент порядка pq.
Граф Γsol (G) конечной группы G, введенный С. Абе и Н. Йиори (см. [15]),
имеет то же множество вершин, что и GK(G), но в этом графе две вершины p
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
96
Л. С. Казарин
и q соединены ребром, если в G имеется разрешимая подгруппа, порядок которой делится на pq. Абе и Йиори доказали, что простая неабелева группа G
всегда имеет связный граф Γsol (G) и описали все простые группы, у которых
граф Γsol (G) имеет полный подграф на вершинах, являющихся нечетными
простыми делителями. В [16] авторы описали простые неабелевы группы G, у
которых граф Γsol (G) содержит полный подграф уже на вершинах, отличных
от 2 и 3. Неожиданный результат из [16] следующий:
Теорема 2.6 Пусть G — конечная простая неабелева группа, p — наибольший простой делитель ее порядка. Тогда найдется такая вершина q ∈
π(G) \ {p}, что она не соединена с p в графе Γsol (G).
Отсюда вытекает много критериев непростоты и разрешимости конечной
группы. Например, пусть P — силовская p-подгруппа группы G, где p — наибольший простой делитель ее порядка. Если для всякого q ∈ π(G) найдется
силовская q-подгруппа Q группы G, перестановочная с P , то группа G будет p-разрешимой. Используя результат из [17], авторы получили следующее
описание конечных простых неабелевых групп, у которых дополнительный
граф для графа Γsol (G) не имеет треугольников.
Теорема 2.7 Пусть G — конечная простая неабелева группа, у которой
дополнительный граф к графу Γsol (G) не имеет треугольников. Тогда G изоморфна одной из следующих групп.
1. Lεn (q), где либо n ≤ 4, или n ≤ 7, q = 2, или 5 ≤ n ≤ 6, q4 = 5;
3
2
′
2. P Sp4 (q), P Ω+
8 (2), D4 (2), F4 (2) , G2 (3), или Sp6 (2);
3. M11 , M12 , M22 , HS, M cL, J2 или An , n ≤ 10.
Здесь q4 — наибольший простой делитель числа q 2 + 1, ε = ± — знак,
−
L+
n (q) = Ln (q) и Ln (q) = Un (q).
Другой класс графов изучался в работе [18]. У графа ΓA (G) вершинами являются все простые делители порядка группы G. Две вершины p и q
в графе образуют ребро, если существует такая силовская p-подгруппа P
группы G, что q делит |NG (P ) : P CG (P )|. Основной результат, полезный для
конструирования некоторых (нормализаторно-замкнутых) формаций групп.
Теорема 2.8 Пусть G — конечная почти простая неабелева группа. Тогда
граф ΓA (G) связен.
Группа G называется почти простой, если L ≤ G ≤ Aut(L), где L —
простая неабелева группа.
Ответ на вопрос В. С. Монахова (14. 63 из Коуровской тетради“) о стро”
ении конечной группы, у которой нормализаторы всех силовских подгрупп
2-нильпотентны, получен в диссертации А. А. Волочкова (2006 г.), см. также
[19].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Факторизации и представления групп
97
3. Представления конечных групп
Характер χ группы G называется монолитическим, если G/ker(χ) имеет
единственную минимальную нормальную подгруппу. В кандидатской диссертации И. А. Сагирова (2001 г.) рассматривались конечные группы, имеющие
ровно две степени неприводимых характеров, и группы, имеющие две степени неприводимых монолитических характеров. Тем самым получен ответ на
вопрос Я. Г. Берковича. Сагировым изучен также класс групп, являющийся
аналогом 2-групп Судзуки и найдены все неприводимые представления и характеры этих групп. Следует заметить, что первоначально эти группы уже
появлялись в работе японского математика А. А. Ханаки (1996 г). Интересный результат получен им в обобщении классического критерия разрешимости Такеты. Именно, конечная группа G разрешима, если степень любого ее
немономиального характера является простым числом.
Согласно знаменитой теореме Брауэра – Фаулера [24], конечная простая
неабелева группа G всегда имеет собственную подгруппу порядка не меньше,
чем |G|1/3 . В работе [20] установлено, что любая конечная простая неабелева группа G имеет неприводимый характер степени, большей |G|1/3 . Кроме
того, если G отлична от знакопеременной группы или группы Матье M22 ,
всегда найдутся такие неприводимые характеры χ1 , χ2 , χ3 группы G, что |G|
делит χ1 (1)χ2 (1)χ3 (1). Сагиров доказал, что для группы An , где 14 ≤ n ≤ 30,
это свойство также выполнено. Позднее С. В. Поляков довел границу до
14 ≤ n ≤ 97. Похоже, что утверждение верно и для всех простых знакопеременных групп, за исключением n = 7 и n = 13.
Следующая серия вопросов связана с работой Юджина Вигнера [21]. Вигнер называет группу G просто приводимой (SR-группой), если выполнены
два условия:
1) любой элемент группы G сопряжен со своим обратным;
2) для любых двух неприводимых представлений φ и ψ их тензорное представление имеет в разложении по неприводимым представлениям группы G
кратности, не превосходящие единицы.
В числе других результатов им было получено следующее удивительное
неравенство:
X
X
|CG (g)|2 ≥
ζ(g)3 ,
g∈G
g∈G
где ζ(g) — число корней квадратных из g в группе G. При этом равенство
выполнено в точности, когда G является SR-группой.
С. П. Струнковым поставлен естественный вопрос: верно ли, что конечные
SR-группы разрешимы?
В работе [22], изучая минимальный контрпример, авторы свели проблему
к ситуации, когда все композиционные простые неабелевы факторы группы
принадлежат множеству {A5 , A6 } знакопеременных групп. Последний труд-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
98
Л. С. Казарин
ный случай был исключен в [23]. При этом оказалось, что достаточно рассматривать лишь тензорные квадраты неприводимых представлений, отказавшись от условия 1) Вигнера. Соответствующие группы названы в [22]
ASR-группами. В результате исследования минимальный контрпример удалось исключить. Тем самым, получена следующая теорема:
Теорема 3.1 Пусть G — конечная ASR-группа. Тогда G разрешима.
На самом деле, теорема также верна, если вместо тензорных квадратов
представлений рассматривать тензорные произведения неприводимого представления и его контраградиентного представления. В частности, конечные
SR-группы оказались разрешимы. Теорема 3.1 дает также продвижение в
решении задачи Я. Саксла (9.56 из Коуровской тетради“). В кандидатской
”
диссертации Янишевского (2006 г.) найдены все конечные несверхразрешимые группы порядка, меньшего 2000. Чанковым доказана следующая замечательная теорема, сводящая изучение сверхразрешимых SR-групп к изучению
2-групп.
Теорема 3.2 Пусть G — конечная сверхразрешимая SR-группа, S — ее
силовская 2-подгруппа. Тогда O(G) — абелева группа и G = O(G)S. При этом
Φ(S) нормальна в G и G/Φ(S) — прямое произведение групп диедрального
типа.
Группы порядка 2, разумеется, также можно считать группами диедрального типа. Среди других результатов, вошедших в кандидатскую диссертацию Чанкова (2010 г.), отметим следующее наблюдение. Среди всех 2-групп
порядка не выше 28 класса нильпотентности 2 (их около 32000) всего лишь
70 не являются ASR-группами. Наконец, группа нечетного порядка может
быть ASR-группой, только когда она абелева.
Используя неравенство Вигнера, автор совместно с Б. Амбергом (работа
публикуется в журнале Proceeedings of the AMS) доказал следующий аналог
теоремы Брауэра – Фаулера:
Теорема 3.3 Пусть G — конечная простая неабелева группа и τ — любая ее инволюция. Если |G| > 2|CG (τ )|3 , то G имеет собственную подгруппу
порядка, большего |G|1/2 . При этом если |G| > |CG (τ )|3 , то |G| < k(G)3 , где
k(G) – число классов сопряженных элементов G.
Классификация конечных простых групп здесь не использовалась. С применением одного результата Янишевского (опирающегося на классификацию
конечных простых групп) получается, что в любой простой неабелевой группе G порядок централизатора любой инволюции не меньше, чем |G|1/3 . Особое удивление вызывает то обстоятельство, что теорема Брауэра – Фаулера
была доказана много позже статьи Вигнера.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
99
Факторизации и представления групп
4. Приложения конечных групп
1. Рекуррентные последовательности в конечных алгебрах и
умножение матриц. Классическая алгебраическая модель линейной рекуррентной последовательности выглядит следующим образом (см. [26], [25]).
Пусть M – модуль над кольцом R. Тогда последовательность
u = {u(0), u(1), . . . , } элементов из M – линейная рекуррентная последовательность, если существуют число m ≥ 1 и элементы c0 , c1 , . . . cm−1 из R
такие, что
u(i + m) = cm−1 u(i + m − 1) + · · · + c1 u(i + 1) + c0 u(i),
i ≥ 0.
В частности, можно рассматривать последовательности с элементами из
кольца R. Хорошо известно, что на последовательность
u(n) = {u(n − 1), u(n − 2), . . . u(n − m)}
длины m можно смотреть как на результат линейного преобразования, примененного к последовательности
u(n−1) = {u(n − 2), u(n − 3), . . . u(n − m − 1)}
с матрицей H, определяемой коэффициентами cm−1 , . . . , c0 , известной как
сопровождающая матрица преобразования. В принципе, не обязательно получать последовательность u(n) из последовательности u(n−1) . Можно сразу получить u(n+m) , умножив u(n−1) на Am . Естественно, что в этом случае
потребуется заранее вычислить матрицу Am = U , что иногда оказывается
более целесообразным. Таким образом, в общем случае полезно иметь способ быстрого вычисления подходящей матрицы, не обязательно являющейся
степенью некоторой присоединенной матрицы.
Свойства матриц A и U в значительной степени определяют свойства
соответствующей рекуррентной последовательности. Например, мультипликативный порядок матрицы A определяет период соответствующей линейной рекуррентной последовательности. Для обеспечения большого периода
необходимо иметь матрицу, имеющую наибольший возможный мультипликативный порядок.
Вообще говоря, использование колец для построения рекуррентной последовательности не является необходимым. Можно использовать и другие
алгебраические системы, в которых определены операции сложения и умножения элементов. Так, А. А. Нечаевым построена теория рекуррентных последовательностей над кольцом Галуа.
В общем случае последовательность u = {u(0), u(1), . . . , } элементов,
принадлежащих некоторой конечной алгебраической системе A, определяемая отрезком u(0) = (u(o), u(1), . . . , u(r − 1)), подвергается преобразованию
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
100
Л. С. Казарин
H : Ar → Ar , так что очередной отрезок u(k) = H(u(k−1) ) = H k (u(0) ). Наиболее важный параметр – период последовательности, определяется размером
|A|, параметром r и порядком преобразования H. Предполагается, что преобразование H выбрано обратимым. Наиболее простая, очевидная граница
для периода p = p(H, A, r) такова p ≤ |A|r . Для случая A = GF (q) и H –
линейное преобразование векторного пространства размерности r над GF (q)
порядка q r − 1 эта оценка практически достигается.
В большинстве других конструкций (в том числе и для колец Галуа) эта
граница далека от идеальной, но полученные последовательности обладают
важными дополнительными свойствами. Например, они менее уязвимы для
алгоритма Берлекэмпа – Месси, восстанавливающего закон, по которому изменяются знаки последовательности.
В совместной (еще не опубликованной) работе с В. М. Сидельниковым
мы рассматривали последовательности вида
Y = A1 ⊗ B1 + A2 ⊗ B2 + · · · + Ak ⊗ Bk ,
где Ai ∈ Ms (q), Bi ∈ Mt (q) – матрицы размеров s × s и t × t соответственно,
1 ≤ i ≤ k.
Основной результат в этом направлении представляет следующая
Теорема 4.1 Пусть G = GLn (q) и n = st. Тогда существуют такие
s × s-матрицы A1 , A2 , . . . , At и t × t-матрицы B1 , B2 . . . , Bt , что матрица
Y =
t
X
i=1
Ai ⊗ Bi
qn − 1
.
(q s − 1, t)
Следующий случай является практически важным.
Теорема 4.2 Пусть G = GLn (q) и n = st. Если q четно, а n – степень
двойки, то существуют такие s × s-матрицы A1 , A2 , . . . , At и t P
× t-матрицы
t
B1 , B2 . . . , Bt с коэффициентами из GF (q), что матрица Y =
i=1 Ai ⊗ Bi
n
имеет мультипликативный порядок q −1. При этом количество необходимых
арифметических операций для этого вычисления составляет O(ts2 ).
Другие результаты близкого типа получены для коммутативных однопорожденных алгебр матриц. Вот типичный результат.
Теорема 4.3 Пусть n = st, где s и t взаимно просты. Тогда существуют
такие матрицы A ∈ GLs (q) и B ∈ GLt (q) над полем GF (q), что алгебра
A1 ≃ GF (q)[< A ⊗ B >] имеет размерность n и изоморфна полю GF (q n ).
Отметим, что коммутативные подалгебры групповых алгебр представляют особый интерес для нужд криптографии. Кроме того, матрицы, имеющие
большой мультипликативный порядок, интересные сами по себе, нужны и
для построения некоторых прикладных алгоритмов. В случае, когда размер
имеет мультипликативный порядок
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Факторизации и представления групп
101
матрицы является составным числом, иногда удается получить выигрыш в
умножении матрицы большого мультипликативного порядка на вектор (соответственно на матрицу), представив данную матрицу в виде суммы кронекеровских произведений матриц меньшего порядка.
Вот открытые вопросы, связанные с таким представлением.
1. Пусть m и n – взаимно простые числа и M -невырожденная матрица
с элементами из некоторого поля F (как правило, конечного). Каково наименьшее число r пар матриц (A1 , B1P
), (A2 , B2 ) . . . (Ar , Br ), таких, что матрицу
M можно представить в виде M = ri=1 Ai ⊗ Bi , где Ai – m × m, а Bi – n × nматрицы.
2. Близкий вопрос, но в другой формулировке. Пусть β и γ — примитивные элементы полей GF (pt ) = F1 и GF (ps ) = F2 , а α – примитивный элемент
поля GF (pst ). Если s и t взаимно просты, то элемент λ = βγ из поля F ,
содержащего F1 и F2 , не будет примитивным в F , но любой примитивный
элемент δ из поля F будет многочленом от λ. Число ненулевых коэффициентов этого многочлена будем называть весом Хэмминга δ относительно λ.
Вопрос: всегда ли существует примитивный элемент, вес Хэмминга которого
относительно λ небольшой (скажем, меньше, чем min{s, t})?
3. Даже если мы научились решать предыдущие вопросы, не очень ясно,
как действовать в случае, когда матрица M имеет размер n × n, где n – простое число. Имеется несколько возможностей аппроксимаций“ матрицами
”
меньших размеров. Но нет обоснований лучшего выбора.
В качестве исходного материала для построения рекуррентных последовательностей можно использовать почтикольца, порожденные эндоморфизмами экстраспециальной 2-группы. Напомним, что группа G называется экстраспециальной p-группой, если G/G′ – элементарная абелева p-группа, а ее
коммутант G′ имеет порядок p и совпадает с ее центром. Имеется всего две
неизоморфные неабелевы 2-группы порядка 8 – экстраспециальные 2-группы
диедра и кватернионов.
Есть два естественных способа обеспечить большой период рекуррентной
последовательности над заданной алгебраической системой:
а) Иметь в своем распоряжении систему с достаточно большим числом
элементов (знаков) последовательности.
б) Строить последовательность достаточно большого ранга.
Автором совместно с Е. С. Гариповой в [27] доказано, что почтикольца, порожденные эндоморфизмами экстраспециальной 2-группы, имеют большое
количество элементов (порядок). В частности, доказана
Теорема 4.4 Почтикольцо экстраспециальной 2-группы G порядка 22n+1
2
2n
2
имеет порядок, делящийся на 24n +2n и делящий 22 +4n .
Весьма вероятно, что верхняя оценка более правильно оценивает размер
указанных почтиколец. Во всяком случае, верхняя граница достигается в
случаях n = 1 и n = 2.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
102
Л. С. Казарин
Естественно рассмотреть наиболее простой случай последовательности
ранга один, т. е. последовательности вида
u(i + 1) = ci u(i),
где ci , u(i) содержатся в почтикольце E(G), порожденном эндоморфизмами
экстраспециальной 2-группы G. Следующие две теоремы получены совместно с В. М. Сидельниковым.
Теорема 4.5 Наибольший порядок рекуррентной последовательности
ранга 1 над почтикольцом экстраспециальной 2-группы G порядка 22n+1 равен 2(22n − 1).
В общем случае получена следующая оценка.
Теорема 4.6 Наибольший период рекуррентной последовательности ранга m над почтикольцом экстраспециальной 2-группы G порядка 22n+1 не превосходит (22mn − 1)2 .
В экспериментальной работе А. В. Сбоева, находящейся в печати, рассмотрены рекуррентные последовательности над почтикольцом группы диедра порядка 8 рангов не выше 5. Максимальный период в этих случаях
отличался от предсказанной границы в 3 – 4 раза. Таким образом, теоретическая оценка оказалась несколько завышенной, но существенно выше оценки
для случая рекурренты над конечным полем сопоставимого размера. Отметим, что свойства полученных рекуррентных последовательностей изучены
недостаточно, однако полученная последовательность оказывается во всех
исследованных случаях менее предсказуема, чем классическая последовательность над конечным полем, что делает этот объект весьма привлекательным. Например, во всех построенных примерах необходимо было проанализировать в среднем после анализа 8 ее периодов. Несколько неожиданным
оказалось несовпадение левой“ и правой“ рекуррент для последовательно”
”
стей над почтикольцом.
Отметим одно интересное свойство булевых функций, которое будет справедливым, если следующая гипотеза о порядке почтикольца экстраспециальной 2-группы окажется верной.
Проблема. Верно ли, что порядок почтикольца, порожденного эндомор2n
2
физмами экстраспециальной 2-группы порядка 22n+1 , будет равен 22 +4n ?
Если это утверждение будет доказано, то множество всех булевых функций n переменных можно охарактеризовать как идеал почтикольца, порожденного отображениями из экстраспециальной 2-группы в ее центр. Отметим,
что для решения задачи существенным является описание орбит группы автоморфизмов экстраспециальной 2-группы на множестве ее эндоморфизмов.
2. Функции на группах и дискретное преобразование Фурье
Цифровая свертка – одна из наиболее популярных процедур в обработке дискретных сигналов. Одно из обобщений принадлежит С. Д. Берману
и И. И. Грушко [28], см. также [29] и [30]. Оно состоит в следующем. Для
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
103
Факторизации и представления групп
заданной длины n обрабатываемых сигналов выбирается группа G порядка n с элементами {g1 , g2 , . . . , gn }. Сигналу
= (x1 , x2 , . . . , xn ), где xi ∈ C,
Px
n
ставится в соответствие элемент a(x) =
i=1 xi gi групповой алгебры CG.
Теоретико-групповая
свертка сигналов x и y суть произведение элеменPn
тов a(x) и a(y) = i=1 yi gi . Прямое вычисление теоретико-групповой свертки
требует O(n2 ) умножений и O(n2 ) сложений комплексных чисел. Для быстрого вычисления теоретико-групповой свертки строится матрица S(G), по
которой находятся G-спектры сворачиваемых сигналов.
Построение матрицы S(G) (а она может использоваться много раз) проводится следующим образом. Пусть D1 , D2 , . . . Dk — все попарно неэквивалентные матричные представления группы G, k = k(G) – число классов сопряженных элементов группы G и n1 , n2 , . . . , nk – степени этих представлений,
Dr (g) = (drij (g)) – соответствующие матрицы для g ∈ G, i, j = 1, 2, . . . , nr ,
r = 1, 2, . . . , k. Зафиксируем некоторую линейную нумерацию функций
√ r
nr dij на группе G. Тогда (s, l)-й элемент матрицы S(G) равен значению
s-й функции на l-м элементе группы G(s, l = 1, 2, . . . n).
Вектор X = S(G)x′ (x = (x1 , x2 , . . . , xn )) называется G-спектром сигнала
x, а штрих — операция транспонирования. Если G является абелевой группой, то n1 = n2 = · · · = nk = 1 и матрица S(G) – таблица (неприводимых)
характеров группы G. Если G – циклическая группа, то S(G) – матрица
дискретного преобразования Фурье, а если G – элементарная абелева группа, то S(G) – матрица Адамара (обе интенсивно используются в дискретной
обработке сигналов). Подавляющее большинство практически используемых
ортогональных преобразований укладывается в эту схему.
Быстрое вычисление G-свертки z = x ∗ y состоит в замене ее непосредственного вычисления следующими операциями:
1) Вычисление G-спектров X = S(G)x′ и Y = S(G)y ′ .
2) Вычисление G- спектра Z свертки z по векторам X и Y .
3) Вычисление обратного преобразования z = S(G)−1 Z.
Существенным является то обстоятельство, что система функций
√ r
nr dij (g) (i, j = 1, 2, . . . , nr , r = 1, 2 . . . , k) является полной системой ортонормированных функций на группе G:
X√
g∈G
√
nr drij (g) ns
dslm (g)
= nδim δjl δrs ,
k
X
n2i = n.
i=1
Здесь черта над выражением – комплексное сопряжение, а δ – символ
Кронекера.
Если G – M -группа, т. е. группа, у которой все неприводимые (обыкновенные представления) мономиальны, то G-спектр для любой последовательности вычисляется за линейное (от порядка группы) время. Однако сложность
вычисления операции 2) оказывается сильно зависит от распределения степе-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
104
Л. С. Казарин
ней неприводимых характеров. Если
самый простой алгоритм,
Pk использовать
3
то она составляет O(L), где L = i=1 ni .
Например, для экстраспециальной 2-группы порядка n получается величина O(n3/2 ).
Вопрос: Как найти все неабелевы M -группы G, для которых сумма кубов
неприводимых представлений существенно ниже |G| log2 |G|?
Замечательным образом, группы диедра могут быть использованы для
вычисления быстрого преобразования Фурье и свертки в рамках развиваемой теории. В этом случае имеется возможность обойтись без умножений
комплексных чисел для случая свертки вещественных сигналов. Соответствующее преобразование носит название преобразование Хартли. Однако
с этих позиций оно даже не обсуждалось. При переходе к конечному полю
также появляются аналоги косинусного преобразования и некоторые другие
преобразования, основанные на теоретико-групповом подходе. Здесь терра
”
инкогнита“. Некоторые конструкции использовались автором (см. [32]) для
построения схем безопасных вычислений. Например, в случае, когда необходимо поручить противнику“ выполнить некоторое вычисления, но так,
”
чтобы после выполнения у него не было возможности воспользоваться результатами. Естественное представление диедральной группы порядка 2n
матрицами размера n × n использовано автором и В. М. Сидельниковым
для построения быстрых вычислений циркулянтов [31].
3. Сферические дизайны и группы Сидельникова. Сферическим
t-дизайном в N -мерном евклидовом пространстве RN называется такое конечное непустое множество X точек единичной сферы
SN −1 = {x = (x1 , . . . , xN ) ∈ RN | x21 + . . . x2N = 1},
что
1
|SN −1 |
Z
f (x)dx =
SN −1
1 X
f (x)
|X| x∈X
для всех многочленов степени не выше t. Сведения о сферических дизайнах можно найти в [37] и [39].
Пусть Hom(k) – пространство всех однородных многочленов N переменных степени k над R и Harm(k) пространство всех однородных гармонических многочленов степени k, т. е. многочленов y = y(x), удовлетворяющих
∂2y
∂2y
∂2y
уравнению ∂x
2 + ∂x2 + · · · + ∂x2 = 0.
1
2
N
Теорема 4.7 (см. [39]) Пусть G – конечная подгруппа группы O(N ) ортогональных преобразований пространства RN и ρk – представления G на
Harm(k). Если все представления ρi для i = 1, 2, . . . k неприводимы, то для
всякого x ∈ SN −1 множество X = {gx|g ∈ G} ⊂ SN −1 является сферическим
2t-дизайном.
В. М. Сидельниковым построено семейство ортогональных групп Θn , позволившее найти 7-дизайны. Строение групп данного семейства установлено
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Факторизации и представления групп
105
мной ([35]). Отметим, что существенную роль сыграло наличие в каждой
из указанных групп самоцентрализующейся экстраспециальной нормальной
подгруппы. Кроме того, множество X = {gx|g ∈ G} ⊂ SN −1 , фигурирующее в заключении теоремы, не что иное, как орбитный код. Наконец, группы Σ1,p , являющиеся аналогами групп Θn , оказываются хорошо знакомыми
подгруппами групп, порожденных нормированными матрицами преобразования Фурье длины p и матрицей регулярного представления циклической
группы простого порядка. Аналогичная задача для группы кватернионов,
проделанная недавно мною и моими коллегами (см. [36]), привела к построению 8-мерной ортогональной группы и неплохому орбитному коду. Работа
по отождествлению данной группы с некоторой разрешимой была возложена
на компьютерную программу.
Экстраспециальная 2-группа удивительно часто появляется в различных
прикладных задачах. Вот небольшой пример.
Квантовый код L размерности K — это произвольное K-мерное подпроn
странство 2n -мерного унитарного пространства V = C2 . Оператор ошибок,
действующий на пространстве V , имеет вид
U = σ1 ⊗ σ2 · · · ⊗ σn ,
где σi пробегает множество операторов Паули (размера 2 × 2). Говорят, что
оператор U порожден не более, чем d − 1 ошибками, если в указанном произведении не более d − 1 сомножителей принимают значения, отличные от
±I.
Определение. Код L имеет минимальное расстояние не меньше d, если
и только если для любых двух ортогональных векторов u, w ∈ L и любого
оператора ошибок U веса не более d − 1 выполнено:
hu|U |wi = 0.
В работе [33] построен аналог кода Рида – Маллера с помощью подгрупп
экстраспециальной 2-группы.
Литература
[1] Казарин Л. С. Исследования по теории групп в Ярославском университете // Математика в Ярославском университете. Ярославль: ЯрГУ,
1996, С. 93 – 106.
[2] Казарин Л. С. Конечные группы с факторизацией, нильпотентные алгебры и характеры конечных групп // Математика в Ярославском университете. Ярославль: ЯрГУ, 2001, С. 133 – 144.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
106
Л. С. Казарин
[3] Amberg B., Kazarin L. S. Nilpotent p-algebras and factorized p-groups //
Groups St. Andrews, 2005. London Math. Soc. Lecture Note Ser. № 339.
Cambridge, 2006. P. 130 – 147.
[4] Казарин Л. С. Нильпотентные алгебры и их применения // Группы и
графы. Труды Ин.-та математики и механики УрО РАН. Т. 13, № 1.
Екатеринбург, 2007. С. 102 – 114.
[5] Казарин Л. С. Конечные группы с факторизацией // Труды Ин.-та математики. Т. 16, № 1. Минск, 2008. С. 40 – 46.
[6] Amberg B., Kazarin L. S. Factorizations of groups and related topics //
Science in China: A Mathematics. 2009. V. 52, № 2. P. 217 – 230.
[7] Amberg B., Kazarin L. S. On the product of a nilpotent group and a group
with non-trivial center // J. Algebra. 2007. V. 315. P. 69 – 95.
[8] Kazarin L. S., Martinez-Pastor A., Perez-Ramos M. D. On the product of a
π-group and a π-decomposable group // J. Algebra. 2007. V. 315. P. 640 –
653.
[9] Kazarin L. S., Martinez-Pastor A., Perez-Ramos M. D. On the product of
two π-decomposable group // Publ. Math. 2009. V. 53. P. 439 – 456.
[10] Berkovich Ya. G., Kazarin L. S. Indices of elements and normal struc-ture
of a finite group // J. Algebra. 2005. V. 283. P. 564 – 583.
[11] Camina A. R., Camina R. D. Implications of conjugacy class size // J. Group
Theory. 1998. V. 1. P. 257 – 269.
[12] Liebeck M. W., Praeger C. E., Saxl Y. The maximal factorization of the finite
simple groups and their automorphism groups, Providence, RI: Memoirs of
the AMS. 1990. V. 86, № 432.
[13] Amberg B., Kazarin L.S. On the product of two Chernikov groups // Israel
J. Math. 2010. V. 175. P. 363 – 389.
[14] Шлепкин А.К., Рубашкин А.Г. Об одном классе периодических групп //
Алгебра и логика. 2005. Т. 44, № 1. С. 114 – 125.
[15] Кондратьев А.С. Граф Грюнберга-Кегеля конечной группы и его приложения // Алгебра и линейная оптимизация: Труды межд. семинара,
посвященного 90-летию со дня рождения С. Н. Черникова. Екатеринбург, 2002. С. 141 – 158.
[16] Amberg B., Carocca A., Kazarin L. S. Criteria for the solubility and nonsimplicity of finite groups // J. Algebra. 2005 V. 285. P. 58 – 72.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Факторизации и представления групп
107
[17] Vasiliev A. V., Vdovin E. P. An adjacency criterion for the prime graph of a
finite simple group // Algebra and logic. 2005. V. 44. P. 381 – 406.
[18] Kazarin L. S., Martinez-Pastor A., Perez-Ramos M. D. On the Sylow graph
of a group and Sylow normalizers // URL: http://arxiv.org/abs/0912.2839
[19] Казарин Л. С., Волочков А. А. Группы с заданными нормализаторами подгрупп // Математика в Ярославском университете. Ярославль:
ЯрГУ, 2006. С. 243 – 255.
[20] Казарин Л. С., Сагиров И. А. О степенях неприводимых характеров
конечных простых групп // Труды Ин.-та математики и механики УрО
РАН. Т. 7, № 2. Екатеринбург, 2001. С. 113 – 123.
[21] Wigner E. P. On representations of finite groups // Amer. J. Math. 1941.
V. 63. P. 57 – 63.
[22] Казарин Л. С., Янишевский В. В. О конечных просто приводимых группах // Алгебра и анализ. 2007. Т. 19, № 6. С. 86 – 117.
[23] Казарин Л. С., Чанков Е. И. Конечные просто приводимые группы разрешимы // Математический сборник. 2010. Т. 201, № 5, С. 27 – 40.
[24] Brauer R., Fowler K. A. On groups of even order // Ann. Math. 1955. V. 62.
P. 565 – 583.
[25] Кузьмин А. С. , Куракин В. Л., Марков В. Т., Михалев А. В., Нечаев
А. А. Линейные рекуррентные последовательности и их приложения //
Московский ун.-т и развитие криптографии в России: материалы конференции в МГУ, МЦНМО. М., 2003. C.122 – 173.
[26] Kurakin V. L., Mikhalev A. V., Nechaev A. A., Tsypyshev V. N. Linear and
polylinear recurring sequences over abelian groups and modules // J. Math.
Sciences. 2000. V. 102, № 6. P. 4598 – 4625.
[27] Гарипова Е. С., Казарин Л. С. О конечных почтикольцах, порожденных
эндоморфизмами экстраспециальной 2-группы // Дискретная математика. 2010. Т. 22, вып. 1. C. 104 – 114.
[28] Берман С. Д., Грушко И. И. К теории обработки дискретных сигналов
// Проблемы передачи информации. 1983. Т. 19, № 24. C. 43 – 49.
[29] Вишневецкий А. Л. Быстрое теоретико-групповое преобразование //
Проблемы передачи информации. 1990. Т. 26, № 21. C. 104 – 107.
[30] Жаров О. А., Казарин Л. С. К теории групповой свертки // Проблемы
передачи информации. 1993. Т. 29. С. 104 – 106.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
108
Л. С. Казарин
[31] Сидельников В. М., Казарин Л. С. О групповой алгебре группы диедра и
сложности умножений матриц второго порядка // Труды по дискретной
математике. 2008. Т. 11. C. 109 – 118.
[32] Казарин Л. С. Задача о внешнем вычислителе // Материалы Всероссийской научной конференции. Ярославль, 2003. C. 29 – 39.
[33] Казарин Л. С., Сидельников В. М. Об одном подходе к построению
квантовых кодов // Труды по дискретной математике. 2004. № 8.
C. 128 – 138.
[34] Сидельников В. М., Казарин Л. С. Новый способ построения схем распределения ключей // Доклады РАН. Математика. 2007. Т. 14, № 5.
C. 1 – 4.
[35] Казарин Л. С. О группах, предложенных Сидельниковым // Матем.
сборник. 1998. Т. 189, № 7. C. 131 – 144.
[36] Dorofeev A. Yu., Kazarin L. S., Sidelnikov V. M., Tuzhilin M. E. Matrix
groups related to the quaternion group and spherical orbit codes // Designes,
Codes and Cryptography. 2005. V. 37, № 3. P. 391 – 404.
[37] Delsarte P., Goethas J. M., Seidel J. J. Spherical codes and designs //
Geometriae Dedicata. 1977. V. 6. P. 263 – 288.
[38] Нерешенные вопросы теории групп. Коуровская тетрадь. 15-е изд. //
Новосибирск: Новосибирский гос. ун-т, 2002.
[39] Bannai E. On some spherical t-designs // J. Comb. Theory, Ser. A. 1979.
V. 26. P. 157–161.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 517.946
Деформационный принцип минимума
и ветвление экстремалей
В. С. Климов
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: Klimov@uniyar.ac.ru
Изучаются критические точки функционалов, определённых
на замкнутых подмножествах банахова многообразия. Приводятся условия корректности задачи минимизации функционала.
Устанавливается деформационный принцип минимума и обсуждаются его приложения к задаче о ветвлении экстремалей.
Библиография: 10 названий.
1. Исходные определения. Ниже X и X ∗ – действительное банахово
пространство и сопряжённое к нему соответственно; hx∗ , xi – значение функционала x∗ на элементе x из X; σ(X, X ∗ ) и σ(X ∗ , X) – слабые топологии на
пространствах X и X ∗ , порождаемые билинейной формой h·, ·i; Λ(C, Y ) – совокупность отображений из множества C ⊂ X в банахово пространство Y ,
удовлетворяющих локальному условию Липшица, т. е. F ∈ Λ(C, Y ), если для
каждого x из C существуют его окрестность V и константа k такие, что
kF (x1 ) − F (x2 )k ≤ kkx1 − x2 k
(xi ∈ C ∩ V , i = 1, 2) ;
Λ(C) = Λ(C, R) – класс действительных на C функций, удовлетворяющих
локальному условию Липшица; B = {x ∈ X, kxk ≤ 1} – единичный шар
в пространстве X , B(x, r) = x + rB (x ∈ X, r ≥ 0) ; A0 , ∂A , A – внутренность, граница и замыкание множества A, Cv(X) – совокупность непустых
выпуклых замкнутых подмножеств пространства X.
Пусть x ∈ C ⊂ X. Вектор v из X называется [1, 2] гиперкасательной к
множеству C в точке x, если при некотором ε > 0
y + tw ∈ C
∀y ∈ C ∩ B(x, ε), w ∈ B(v, ε), t ∈ (0, ε).
Если существует хотя бы одна гиперкасательная к C в точке x, то множество
KC (x) всех таких гиперкасательных является выпуклым открытым конусом
109
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
110
В. С. Климов
в пространстве X [2]. Нормальным конусом к множеству C в точке x называют множество
NC (x) = {x∗ ∈ X ∗ , hx∗ , zi ≤ 0 ∀z ∈ KC (x)}.
Если f ∈ Λ(C), x ∈ C 0 , то равенство
f 0 (x; v) =
f (y + tv) − f (y)
y→x,t→+0
t
lim
определяет сублинейный функционал f 0 (x; ·) : X → R [1]. Справедливо [3]
соотношение
f 0 (x; v) = lim 0 f 0 (z; v).
(1)
z→x,z∈C
Предел в правой части (1) существует и для x из C ∩ C 0 . В этом случае примем (1) в качестве определения сублинейного функционала f 0 (x; ·) : X → R.
Несколько иное, но эквивалентное приведенному выше определение функционала f 0 (x; ·) использовалось в [4].
Множество ∂f (x) = {x∗ ∈ X ∗ , hx∗ , vi ≤ f 0 (x; v) ∀v ∈ X} называют субдифференциалом Кларка функционала f в точке x. Оно совпадает с субдифференциалом Кларка сублинейного функционала v → f 0 (x; v) в точке 0. В силу известных свойств сублинейных функционалов (см., например, [1] ) ∂f (x) – выпуклое и компактное в σ(X ∗ , X) топологии множество,
f 0 (x; v) = max {hx∗ , vi, x∗ ∈ ∂f (x)}.
Остановимся на некоторых обобщениях введённых выше понятий. Пусть
M и N – многообразия класса C k (k ≥ 1), моделируемые банаховыми пространствами X и Y , C ⊂ M . Будем говорить, что отображение F : C → N
принадлежит классу Λ(C, N ), если для любого x ∈ C существуют карты
(U, ϕ) в x и (V, ψ) в y = F (x) такие, что F (U ∩ C) ⊂ V и отображение
ψ ◦ F ◦ ϕ−1 : ϕ(U ∩ C) → Y – локально липшицево. Отображения класса
Λ(C, N ) будем называть локально липшицевыми. Положим Λ(C, R) = Λ(C).
Введём аналог конуса гиперкасательных для множества Q ⊂ M . Через
Tx далее обозначается касательное в точке x ∈ M к многообразию M пространство Tx M [5, 6]. Каждая карта (U, ϕ) в точке x индуцирует каноническое
отображение ϕ∗x : Tx → X. Если x ∈ Q ∩ U , то ϕ(x) ∈ ϕ(Q ∩ U ) ⊂ X. Введём
конус Kϕ(Q∩U ) (ϕ(x)) гиперкасательных к множеству ϕ(Q ∩ U ) в точке ϕ(x) и
положим
KQ (x) = (ϕ∗x )−1 Kϕ(Q∩U ) (ϕ(x)).
(2)
Стандартным образом [5–7] проверяется независимость правой части (2)
от выбора содержащей x карты (U, ϕ). Равенство (2) определяет конус
KQ (x) ⊂ Tx гиперкасательных к множеству Q в точке x. Считаем далее
множество Q таким, что KQ (x) 6= ∅ ∀x ∈ Q. Это требование обеспечивает
включение ϕ(x) ∈ (ϕ(Q ∩ U ))0 .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Деформационный принцип минимума
111
Пусть f ∈ Λ(Q), x ∈ Q, (U, ϕ) – карта многообразия M в точке x. Положим
∂f (x) = {x∗ ∈ Tx ∗ , x∗ = l ◦ ϕ∗x , l ∈ ∂(f ◦ ϕ−1 )(ϕ(x))}.
Множество ∂f (x) ⊂ Tx ∗ называют обобщённым градиентом функционала f в
точке x [7]. Сопоставим точке x сублинейный функционал f 0 (x; ·) : Tx → R,
полагая f 0 (x; v) = sup{hx∗ , vi, x∗ ∈ ∂f (x)}. Если
f ∈ Λ(Q), x(·) : (t0 , t1 ) → Q
– отображение класса C 1 , то для верхней правой производной D∗ f (x(t))
функции f ◦ x : (t0 , t1 ) → R в точке t справедлива [1, 3, 4, 7] оценка
D∗ f (x(t)) ≤ f 0 (x(t), x′ (t)) .
(3)
Напомним некоторые определения. Пусть Ω – топологическое пространство, Z – банахово пространство, E = Ω×Z. Функция k·k : E → R называется
структурой Финслера [8, 9], если для каждого b из Ω функция v → k(b, v)k –
норма k · kb на Z и для любых b0 ∈ Ω и k > 1 существует такая окрестность
U точки b0 , что k −1 kvkb0 ≤ kvkb ≤ kkvkb0
∀ b ∈ U, v ∈ Z.
Если не оговорено противное, всюду далее M – связное паракомпактное
многообразие класса C k
(k ≥ 2), моделируемое банаховым пространством X, T M = ∪ Tx (x ∈ M ) – касательное расслоение, наделённое структурой многообразия класса C k−1 , p : T M → M – отображение, определённое
равенством p(x, v) = x (x ∈ M, v ∈ Tx ) [5,6]. На касательном расслоении
T M может быть определена структура Финслера [8]. В частности, существует функция k · k : T M → R, обладающая свойствами:
1) при любом x из M функция v → k(x, v)k – норма на Tx ;
2) для каждого x из M существуют его окрестность O и отображение
Φ : O × X → p−1 (O) такие, что суперпозиция k · k ◦ Φ представляет структуру
Финслера на O × X.
Считая фиксированной структуру Финслера на T M , определим длину
пути w : [t0 , t1 ] −→ M класса C 1 равенством
Z t1
′
L(w) = kw (t)kw(t) dt .
t0
Далее множество Q предполагается линейно связным, поэтому для любых
точек x, y из Q существует путь w класса C 1 , соединяющий эти точки в
том смысле, что w(t0 ) = x, w(t1 ) = y, w(t) ∈ Q ∀t ∈ [t0 , t1 ] . Равенство
ρ(x, y) = inf{L(w)}, где инфимум берётся по всем таким путям, определяет в Q метрику, согласованную с исходной топологией на пространстве
M [8]. Пространство Q считаем полным относительно метрики ρ . Ниже
ρ(x, A) = inf{ρ(x, y), y ∈ A} – расстояние от точки x ∈ Q до множества
A ⊂ Q, Θ(A1 , A2 ) = sup{ρ(x, A2 ), x ∈ A1 } – уклонение множества A1 ⊂ Q от
множества A2 ⊂ Q.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
112
В. С. Климов
Структура Финслера на T M индуцирует норму k·k и топологию σ(Tx ∗ , Tx )
на сопряжённом к Tx пространстве Tx ∗ . Если f – функционал класса
Λ(Q), x ∈ Q, то ∂f (x) – выпуклое и компактное в σ(Tx ∗ , Tx )-топологии множество. Точке x ∈ Q сопоставим нормальный конус NQ (x) к множеству Q,
определяемый соотношением NQ (x) = {x∗ ∈ Tx ∗ , hx∗ , zi ≤ 0 ∀z ∈ KQ (x)}.
Множество NQ (x) выпукло и замкнуто в σ(Tx ∗ , Tx ) топологии. Функционал
v ∗ → kv ∗ k (v ∗ ∈ Tx ∗ ) полунепрерывен снизу относительно слабой топологии σ(Tx ∗ , Tx ), поэтому множество ∂f (x) + NQ (x) ⊂ Tx ∗ содержит элемент с
наименьшей нормой; полное доказательство этого факта приведено в [3].
В последующих построениях существенную роль играет функция
∆f (x) = min{kx∗ + y ∗ k, x∗ ∈ ∂f (x), y ∗ ∈ NQ (x)} .
Элемент x из Q назовём экстремалью (критической точкой) функционала
f , если ∆f (x) = 0, что равносильно включению 0 ∈ ∂f (x)+NQ (x) . Множество
экстремалей функционала f обозначим символом Ef . Элементы из Q \ Ef
назовём регулярными точками функционала f .Число ∆f (x) характеризует
степень регулярности точки x. Положим
Qb = {x ∈ Q, f (x) ≤ b}, f −1 (c) = {x ∈ Q, f (x) = c}, Ef c = f −1 (c) ∩ Ef .
Если Ef c 6= ∅, то число с назовём критическим значением функционала f ;
если же Ef c = ∅, то с – регулярное значение функционала f .
2. Корректность задачи минимизации. Векторным полем на множестве A ⊂ M назовём отображение v , ставящее в соответствие каждой точке
x из A элемент v(x) из Tx . Через L(A) обозначим совокупность таких векторных полей на A, для которых отображение x → (x, v(x)) принадлежит классу
Λ(A, T M ). Векторные поля из L(A) будем называть локально липшицевыми.
Положим Bx = {v ∈ Tx , kvkx ≤ 1}.
Предложение 1 [3]. Пусть f ∈ Λ(Q), A ⊂ Q, 0 < η < ∆f (x) и
постоянная η не зависит от x из A. Тогда существует векторное поле v
класса L(A), удовлетворяющее соотношениям
v(x) ∈ KQ (x) ∩ Bx , f 0 (x; v(x)) < −η
∀x ∈ A.
(4)
Обозначим через Λ0 (Q) часть класса Λ(Q), состоящую из функционалов,
удовлетворяюших условию
C0 ) всякая последовательность элементов xn ∈ Q , для которой последовательность f (xn ) ограничена, а ∆f (xn ) → 0, содержит сходящуюся подпоследовательность.
В случае Q = M условия подобного типа использовались многими авторами (см., например, [7, 8]). Отметим некоторые следствия условия C0 ).
Очевидно, что если xn → x в метрике ρ и ∆f (xn ) → 0, то x – экстремаль
функционала f.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
113
Деформационный принцип минимума
Лемма 1. Пусть
f ∈ Λ0 (Q),
−∞ < a ≤ b < ∞,
Qa,b = {x ∈ Q, a ≤ f (x) ≤ b}.
Тогда множество Ef ∩ Qa,b есть компакт. В частности, для любого c из R
компактно множество Ef c .
Доказательство. Лемма есть очевидное следствие условия C0 ) и замкнутости множества Qa,b .
Из леммы 1 вытекает замкнутость множества K f = f (Ef ) критических
значений функционала f класса Λ0 (Q) и открытость множества его регулярных значений.
Лемма 2. Пусть функционал f класса Λ0 (Q) ограничен на замкнутом
множестве A ⊂ Q и A∩Ef = ∅. Тогда найдётся такое η > 0, что ∆f (x) > η
для всех x из A, в частности, существует векторное поле v класса L(A),
удовлетворяющее соотношениям (4).
Доказательство. В предположении противного существует последовательность xn из A, для которой ∆f (xn ) → 0. Последовательность f (xn )
ограничена. Так как f ∈ Λ0 (Q), то xn содержит сходящуюся подпоследовательность. Предел этой подпоследовательности принадлежит A ∩ Ef , что
противоречит условию A ∩ Ef = ∅. Теперь лемма 2 вытекает из предложения
1. Лемма доказана.
Лемма 3. Пусть f ∈ Λ0 (Q), функционал f ограничен на замкнутом
множестве A ⊂ Q и A ∩ Ef – непустое множество. Тогда существуют
векторное поле v класса L(A\Ef ) и неубывающая функция h : (0, ∞) → (0, ∞)
такие, что
v(x) ∈ KQ (x) ∩ Bx ,
f 0 (x; v(x)) ≤ −h(ρ(x, A ∩ Ef )) ∀x ∈ A \ Ef .
(5)
Доказательство. Положим α0 = 1, β0 = ∞, αn = 2−n , βn = 3αn
(n = 1, 2, ...). Построим систему функций ϕn (n = 0, 1, ...) класса Λ(R), удовлетворяющих условиям
◦
1 ϕn (t) ≥ 0,
∞
X
n=0
ϕn (t) = 1∀t ∈ (0, ∞) ;
2◦
{t, ϕn (t) > 0} = (γn , δn ) ,
где α0 < γ0 , δ0 = ∞, αn < γn < δn < βn (n = 1, 2, ...). Система промежутков
(γn , δn ) образует открытое покрытие луча (0, ∞) кратности 2. Действительно,
в силу условия 10 для любой точки t из (0, ∞) существует такой номер n, что
ϕn (t) > 0. Это неравенство влечёт за собой включение t ∈ (γn , δn ).
Положим An = {x ∈ A, αn ≤ ρ(x, A ∩ Ef ) ≤ βn } (n = 0, 1, ...). Функционал
f ограничен на замкнутом множестве An и An ∩ Ef = ∅. В силу леммы 2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
114
В. С. Климов
существуют константа ηn > 0 и векторное поле vn класса L(An ), удовлетворяющие соотношениям
vn (x) ∈ KQ (x) ∩ Bx ,
f 0 (x; vn (x)) < −ηn
∀x ∈ An .
(6)
Будем считать, что vn (x) = 0 для x из A \ An . При любом способе продолжения поля vn на A \ An векторное поле ϕn (ρ(x, A ∩ Ef )) vn (x) принадлежит
классу L(A \ Ef ); оно обращается в 0, если ρ(x, A ∩ Ef ) ∈
/ (γn , δn ).
Рассмотрим векторное поле
v(x) =
∞
X
n=0
ϕn (ρ(x, A ∩ Ef )) vn (x)
(x ∈ A \ Ef ) .
Без труда проверяется включение v ∈ L(A \ Ef ). Соотношения (6) влекут за собой выполнение свойств (5) при подходящем выборе функции
h : (0, ∞) → (0, ∞). Лемма доказана.
Изучим задачу минимизации
f (x) → inf,
x ∈ Q.
(7)
Необходимым условием её разрешимости является ограниченность снизу
функционала f . Для функционала f класса Λ0 (Q) ограниченность снизу и достаточна. Действительно, согласно теореме 3 работы [3] число
a = inf{f (x), x ∈ Q} есть критическое значение функционала f ; в частности, существует такой элемент x из Q, что f (x) = a. Задачу (7) называют
корректной, если 1) a = inf{f (x), x ∈ Q} > −∞ и Qa 6= ∅; 2) любая минимизирующая функционал f последовательность xn сходится к множеству
Qa , т. е. если xn ∈ Q, f (xn ) → a, то ρ(xn , Qa ) → 0 при n → ∞.
Теорема 1. Пусть
f ∈ Λ0 (Q),
a=
inf{f (x) , x ∈ Q} > −∞
и K f ∩ (a, b] = ∅ при некотором b > a. Тогда задача (7) корректна и справедливо неравенство
f (x) ≥ a + h1 (ρ(x, Qa ))
(8)
с некоторой положительной неубывающей на (0, ∞) функцией h1 .
Доказательство. Первое условие корректности выполнено очевидным
образом. Для проверки второго достаточно установить неравенство (8).
Пусть r > 0, Vr = {x ∈ Q, ρ(x, Qa ) ≥ r} . Если Vr ∩ Qb = ∅, то
f (x) > b ∀x ∈ Vr . В противном случае A = Vr ∩ Qb – непустое множество,
A ∩ Ef = ∅. Если Ar = {x ∈ Q, ρ(x, A) < r} , то согласно теореме 1 из [3]
inf{f (y), y ∈ Ar } ≤ inf{f (z), z ∈ A} − δ(r) , где δ(r) > 0 . В частности,
f (z) ≥ a + δ(r) ∀z ∈ A. Следовательно, при любом положительном r имеем
inf{f (z), z ∈ Q, ρ(z, Qa ) ≥ r} ≥ min{b, a + δ(r)} > a . Последнее неравенство
влечёт за собой неравенство (8) с подходящей функцией h1 .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Деформационный принцип минимума
115
Пусть xn ∈ Q, f (xn ) → a. Из (8) следует, что h1 (ρ(xn , Qa )) → 0, поэтому
ρ(xn , Qa ) → 0 при n → ∞. Теорема доказана.
Множество P ⊂ Q реализует локальный минимум функционала
f : Q → R, если f (y) ≥ f (x) (x ∈ P, y ∈ W ), где W – некоторая окрестность множества P . Из определения ясно, что f принимает на P постоянное
значение f (P ).
Теорема 2. Пусть множество Ef c реализует локальный минимум
функционала f класса Λ0 (Q). Если c – единственное критическое значение
f , то f (z) ≥ c ∀z ∈ Q.
Доказательство. В предположении противного существует такой элемент x0 из Q, для которого f (x0 ) < c. Отсюда вытекает, что Ef c 6= Qc . В силу
теоремы 5 работы [3] функционал f имеет большее, чем c, критическое значение. Это противоречит единственности критического значения функционала
f . Теорема доказана.
3. Деформации функционалов. Пусть fλ : Q → R – семейство функционалов, зависящих от параметра λ (λ ∈ J = [α, β], −∞ < α < β < ∞).
Назовём семейство fλ (λ ∈ J) деформацией класса Λ0 (Q) функционала fα
в функционал fβ , если fλ ∈ Λ0 (Q) при каждом λ из J и выполнены условия
D1 ) функционал f (x, λ) = fλ (x) непрерывен по λ равномерно относительно x из каждого ограниченного множества Ω ⊂ Q;
D2 ) при каждом λ из J функционал fλ имеет единственное критическое
значение c(λ), причём c(λ) непрерывно зависит от λ, а многозначное отображение
λ → E(λ) = {x ∈ Q, 0 ∈ ∂f (x) + NQ (x), fλ (x) = c(λ)}
полунепрерывно сверху по λ на отрезке J .
Условие D1 ) эквивалентно требованию
lim sup |f (x, λ) − f (x, µ)| = 0
λ→µ x∈Ω
для каждого ограниченного множества Ω ⊂ Q и каждого числа µ из J. При
любом λ из J множество E(λ) экстремалей функционала fλ есть компакт. Это
вытекает из леммы 1 и единственности критического значения функционала
fλ . Если P – непустое подмножество Q, r – положительное число, то далее
B(P, r) = {x ∈ Q, ρ(x, P ) ≤ r}, S(P, r) = {x ∈ Q, ρ(x, P ) = r}.
Теорема 3. (Деформационный принцип минимума) Пусть
fλ (α ≤ λ ≤ β)
– деформация класса Λ0 (Q) функционала fα в функционал fβ . Если множество E(α) реализует локальный минимум функционала fα , то при любом λ
из J множество E(λ) реализует абсолютный минимум функционала fλ .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
116
В. С. Климов
Доказательство. Не нарушая общности, считаем ниже, что c(λ) ≡ 0.
В условиях доказываемой теоремы 0 – единственное критическое значение
функционала fλ (λ ∈ J), а множество E(α) реализует локальный минимум
fα . Согласно теореме 2 fα (z) ≥ 0 ∀z ∈ Q. Обозначим через J0 множество
таких λ из J, что fλ (z) ≥ 0 ∀z ∈ Q. Как нетрудно видеть, J0 – непустое
замкнутое подмножество отрезка J.
Пусть µ ∈ J0 . Из неравенства (8), применённого к функционалу f = fµ ,
вытекает оценка fµ (x) ≥ h1 (ρ(x, E(µ))) с некоторой положительной на (0, ∞)
функцией h1 . Фиксируем r > 0. Множество B(E(µ), r) ограничено; согласно
условию D1 ) найдётся такое δ1 > 0, что из соотношений |λ − µ| < δ1 , λ ∈ J
следует неравенство
|fλ (x) − fµ (x)| ≤
h1 (r)
∀x ∈ B(E(µ), r),
3
влекущее за собой оценки
fλ (x) ≥ −
h1 (r)
2h1 (r)
∀x ∈ B(E(µ), r), fλ (x) ≥
∀x ∈ S(E(µ), r) .
3
3
(9)
По условию fλ (E(λ)) = 0. Найдутся числа s > 0 и δ > 0 (δ < δ1 ) такие,
что
h1 (r)
|fλ (x)| ≤
∀x ∈ B(E(λ), s), λ ∈ (µ − δ, µ + δ) ∩ J
(10).
3
Положим A = {x ∈ Q, |fλ (x)| ≤ h1 (r)}. Множество A замкнуто, функционал
fλ ограничен на A. Применяя лемму 3 в случае f = fλ , можно построить
векторное поле vλ класса L(A \ E(λ)), обладающее свойствами
vλ (x) ∈ KQ (x) ∩ Bx , fλ0 (x; vλ (x)) ≤ − h(ρ(x, E(λ))),
(11)
где h – положительная неубывающая на (0, ∞) функция. Обозначим через
x(t; z) решение задачи Коши
x′ = vλ (x),
x(0) = z.
(12)
Установим неравенство fλ (z) ≥ 0 для z из B(E(λ), s). В предположении
противного fλ (z) < 0 для некоторого z из B(E(λ), s). Из (11),(12) вытекает
тогда, что fλ (x(t; z)) ≤ fλ (z) < 0; поэтому ρ(x(t; z), E(λ)) ≥ ε, где ε – некоторое положительное число. Так как функция h в неравенстве (11) возрастает,
то последовательно получаем
fλ0 (x(t; z); vλ (x(t; z))) ≤ −h(ρ(x(t; z), E(λ))) ≤ −h(ε),
D∗ fλ (x(t; z)) ≤ −h(ε) .
(13)
Поскольку fλ (x(t; z)) < 0, то траектория x = x(t; z) не пересекается с множеством S(E(µ), r), на котором согласно (9) функционал fλ не меньше h1 (r)/3.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Деформационный принцип минимума
117
Следовательно, x(t; z) ∈ B(E(µ), r) ∀t ≥ 0. Снова обращаясь к (9), получаем,
что fλ (x(t; z)) ≥ −h1 (r)/3, т. е. функционал fλ ограничен снизу на траектории x = x(t; z). Но это противоречит (13).
Таким образом, fλ (z) ≥ 0 ∀z ∈ B(E(λ), s), т. е. E(λ) реализует локальный
минимум функционала fλ . В силу теоремы 2 fλ (z) ≥ 0 ∀z ∈ Q, т.е. λ ∈ J0 .
Проведённые рассуждения показывают, что J0 и замкнутое, и открытое
(в относительной топологии) подмножество отрезка J. Следовательно,
J0 = J. Теорема доказана.
Утверждения, близкие к теореме 3, доказывались Н. А. Бобылёвым,
А. Д. Иоффе и др. (cм., например, [9, 10] и приведённую там литературу).
Основные отличия теоремы 3 от этих результатов связаны с тем, что в теореме 3 множество E(λ) не сводится к единственной точке; существенно то,
что в ней идёт речь о глобальном минимуме; наконец, используемый в данной статье вариант условия Пале-Смейла, вообще говоря, не совпадает с его
аналогами из [9, 10].
Применим теорему 3 к задаче о точках ветвления экстремалей. Как и
выше, E(λ)– множество экстремалей функционала fλ . Оно совпадает с множеством решений включения 0 ∈ ∂fλ (x) + NQ (x). Пусть x(λ) ∈ E(λ) ∀λ ∈ J
и x : J → Q – непрерывная функция. Точку µ из J назовём правильной,
если найдётся такое ε > 0, что при λ из (µ − ε, µ + ε) ∩ J пересечение
E(λ) ∩ B(x(λ), ε) = x(λ). Число λ0 , не являющееся правильной точкой, назовём точкой ветвления экстремалей функционала fλ . Таким образом, λ0
есть точка ветвления, если найдутся последовательности
λn → λ0 , xn 6= x(λn ), xn ∈ E(λn ), xn → x(λ0 ) .
Теорема 4. Пусть fλ : Q → R – семейство функционалов, зависящих
от параметра λ (λ ∈ J = [α, β], −∞ < α < β < ∞), fλ ∈ Λ0 (Q) при всех
λ из J и выполнено условие D1 ). Пусть x(λ) ∈ E(λ) ∀λ ∈ J и x : J → Q –
непрерывная функция. Пусть x(α) реализует локальный минимум функционала fα , а x(β) не является точкой минимума функционала fβ . Тогда промежуток J содержит хотя бы одну точку ветвления включения
0 ∈ ∂fλ (x) + NQ (x).
Теорема 4 вытекает из теоремы 3.
Литература
[1] Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988.
[2] Rockafellar R. T. Generalized directional derivatives and subgradients of
nonconvex functions // Canadian Journal of Mathematics. 1980. V. 32, № 2.
P. 257 – 280.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
118
В. С. Климов
[3] Климов В. С. Минимаксные критические значения негладких функционалов // Сиб. мат. журнал. 1992. Т. 33, № 3. С. 91 – 100.
[4] Дмитрук А. В., Милютин А. А., Осмоловский Н. П. Теорема Люстерника
и теория экстремума // УМН. 1980. Т. 35, № 6. C. 11 – 46.
[5] Борисович Ю. Г., Звягин В. Г., Сапронов Ю. И. Нелинейные фредгольмовы отображения и теория Лере - Шаудера // УМН. 1977. Т. 32, № 4.
С. 3 – 54.
[6] Ленг С. Введение в теорию дифференцируемых многообразий. М.: Мир,
1967.
[7] Заславский Л. Я. О критических точках липшицевых функций на гладких многообразиях // Сиб. мат. журнал. 1981. Т. 22, № 1. С. 87 – 93.
[8] Palais R. S. Lusternik-Schnirelman theory on Banach manifolds // Topology.
1966. V. 5, Iss. 2. V5. P. 115 – 132.
[9] Бобылёв Н. А., Емельянов С. В., Коровин С. К. Геометрические методы
в вариационных задачах. М.: Магистр, 1998.
[10] Ioffe A., Schwartzman E.. Metric critical point theory. // J. Math. Pures
Appl. 1996. V. 75. P. 125 – 153.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 517.946
О периодических экстремалях
липшицевых функционалов
В. С. Климов, Н. А. Демьянков
Ярославский гусударственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: Klimov@uniyar.ac.ru; praetoriax@gmail.com
Обсуждаются перспективы применения методов вариационного исчисления в целом для исследования периодических экстремалей липшицевых интегральных функционалов. Удаётся
установить, что в естественных предположениях выполнено некоторое условие компактности (вариант условия ПалеСмейла). Анонсируется ряд результатов о рассматриваемых
вариационных задачах: корректность задачи о минимизации,
негладкий аналог теоремы о перевале, существование двух и более периодических экстремалей.
Библиография: 15 названий.
1. Об одном условии компактности. Всюду далее X и X ∗ – действительное банахово пространство и сопряжённое к нему соответственно; hx∗ , xi
– значение функционала x∗ на элементе x из X; σ(X, X ∗ ) и σ(X ∗ , X) – слабые топологии на пространствах X и X ∗ , порождаемые формой h·, ·i; Λ(C)
– класс действительных на множестве C ⊂ X функций, удовлетворяющих
локальному условию Липшица; B = {x ∈ X, kxk ≤ 1} – единичный шар
в пространстве X , B(x, r) = x + rB (x ∈ X, r ≥ 0) ; A0 , ∂A , A – внутренность, граница и замыкание множества A, Cv(X) – совокупность непустых
выпуклых замкнутых подмножеств пространства X.
Пусть x ∈ C ⊂ X. Вектор v из X называется [1, 2] гиперкасательной к
множеству C в точке x, если при некотором ε > 0
y + tw ∈ C
∀y ∈ C ∩ B(x, ε), w ∈ B(v, ε), t ∈ (0, ε).
Если существует хотя бы одна гиперкасательная к C в точке x, то множество
KC (x) всех таких гиперкасательных является выпуклым открытым конусом
в пространстве X [2]. Нормальным конусом к множеству C в точке x называют множество
NC (x) = {x∗ ∈ X ∗ , hx∗ , zi ≤ 0 ∀z ∈ KC (x)}.
119
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
120
В. С. Климов, Н. А. Демьянков
Если h ∈ Λ(C), x ∈ C 0 , то равенство
h0 (x; v) =
h(y + tv) − h(y)
y→x,t→+0
t
lim
определяет сублинейный функционал h0 (x; ·) : X → R [1]. Говорят, что функция h регулярна в x, если:
1) для каждого v из X существует обычная производная по направлению
h′ (x; v) = lim
t→+0
h(x + tv) − h(x)
;
t
2) h′ (x; v) = h◦ (x; v)∀v ∈ X.
Требование x ∈ C 0 можно ослабить. Справедливо [3] соотношение
h0 (x; v) =
lim
z→x,z∈C 0
h0 (z; v).
(1)
Предел в правой части (1) существует и для x из C ∩ C 0 . В этом случае примем (1) в качестве определения сублинейного функционала h0 (x; ·) : X → R.
Несколько иное, но эквивалентное приведенному выше определение функционала h0 (x; ·) использовалось в [4].
Множество ∂h(x) = {x∗ ∈ X ∗ , hx∗ , vi ≤ h0 (x; v) ∀v ∈ X} называют субдифференциалом Кларка функции h в точке x. В силу известных свойств
сублинейных функционалов (см., например, [1]) множество ∂h(x) выпукло и
компактно в σ(X ∗ , X) топологии, причем h0 (x; v) = max {hx∗ , vi, x∗ ∈ ∂h(x)}.
Ниже Q – собственное подмножество пространства X и KQ (x) 6= ∅∀x ∈ Q.
Это требование гарантирует включение Q ⊂ Q◦ .
Пусть f ∈ Λ(Q), x ∈ Q. Точке x соответствуют субдифференциал Кларка
∂f (x) и нормальный конус NQ (x). Множество ∂f (x) + NQ (x) принадлежит
классу Cv(X ∗ ) и содержит элемент с наименьшей нормой [3]. Важную роль
для дальнейшего играет функция
∆f (x) = min{kx∗ + y ∗ k, x∗ ∈ ∂f (x), y ∗ ∈ NQ (x)} .
Элемент x из Q назовём экстремалью (критической точкой) функционала
f , если ∆f (x) = 0, что равносильно включению 0 ∈ ∂f (x)+NQ (x) . Множество
экстремалей функционала f обозначим символом Ef . Элементы из Q \ Ef
назовём регулярными точками функционала f .Число ∆f (x) характеризует
степень регулярности точки x. Положим
Qb = {x ∈ Q, f (x) ≤ b}, f −1 (c) = {x ∈ Q, f (x) = c}, Efc = f −1 (c) ∩ Ef .
Если Efc 6= ∅, то число с назовём критическим значением функционала f ;
если же Efc = ∅, то с – регулярное значение функционала f .
Обозначим через Λ0 (Q) часть класса Λ(Q), состоящую из функционалов,
удовлетворяющих условию
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О периодических экстремалях липшицевых функционалов
121
C0 ) всякая последовательность элементов xn ∈ Q , для которой последовательность f (xn ) ограничена, а ∆f (xn ) → 0, содержит сходящуюся подпоследовательность.
Условия подобного типа использовались многими авторами (см., например, [4 – 7] и приведённую там литературу); иногда их именуют условиями
Пале-Смейла. Ограничимся далее случаем, когда X – рефлексивное и сепарабельное банахово пространство над полем R действительных чисел. Ниже
символы → и ⇀ означают сильную и слабую сходимости соответственно в
пространствах X и X ∗ .
Определённые дополнительные ограничения будут связаны с множеством
Q ⊂ X и функционалом f . Для их формулировки нам потребуются специальные классы многозначных отображений и липшицевых функционалов.
Введём условие геометрического характера на множество Q :
C1 ) если xn ∈ Q, x∗n ∈ NQ (xn ), xn ⇀ x, x∗n ⇀ x∗ ,то x ∈ Q и
lim hx∗n , xn i ≥ hx∗ , xi .
(2)
n→∞
Условие C1 ) выполнено для выпуклого замкнутого множества Q. Предположения иного характера, обеспечивающие это условие, указываются в лемме 1.
Многозначное отображение Γ : V → Cv(X ∗ ) называют псевдомонотонным, если оно ограничено и удовлетворяет следующему условию: для произвольной последовательности (xn , x∗n ), обладающей свойствами
x∗n ∈ Γ(xn ),
xn ⇀ x,
x∗n ⇀ x∗ ,
справедливы соотношения
x∗ ∈ Γ(x),
lim hxn , x∗n i ≤ hx, x∗ i ,
n→∞
lim hxn , x∗n i = hx, x∗ i .
n→∞
Иные определения псевдомонотонного оператора можно найти в [9 – 14].
Будем считать теперь, что множество Q определено равенством
Q = {x ∈ X, g(x) ≤ 0} ,
(3)
в котором g – функционал класса Λ(X), удовлетворяющий условиям:
g1) оператор Γ(x) = ∂g(x) (x ∈ X) псевдомонотонен;
g2) множество {x ∈ X, g(x) = 0} непусто; если g(x) = 0, kxk ≤ R,
∗
y ∈ Γ(x), то ky ∗ k > β(R) > 0, постоянная β зависит только от R, функционал g регулярен в точке x, т. е. g 0 (x; v) = g ′ (x; v)∀v ∈ X .
В указанных предположениях функционал g слабо полунепрерывен снизу
на пространстве X [9, 14], поэтому множество Q слабо замкнуто в X. Имеют
место равенства
Q0 = {x ∈ X, g(x) < 0},
∂Q = {x ∈ X, g(x) = 0} ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
122
В. С. Климов, Н. А. Демьянков
(x ∈ Q0 ) ,
[
KQ (x) = {v ∈ X : g ◦ (x, v) < 0, NQ (x) =
λ∂g(x) (x ∈ ∂Q) .
KQ (x) = X ,
NQ (x) = {0}
λ≥0
Лемма 1. Пусть множество Q определено равенством (3). Тогда Q удовлетворяет условию C1 ).
Доказательство. Достаточно установить (2) для последовательностей
xn из ∂Q, x∗n из NQ (xn ), слабо сходящихся к элементам x, x∗ соответственно. Очевидно, что x∗n = λn zn∗ , где λn ≥ 0, zn∗ ∈ ∂g(xn ). Поскольку (в силу
регулярности нулевого значения функционала g) справедливо неравенство
kzn∗ k ≥ β0 > 0, то λn – ограниченная последовательность. Не нарушая общности, можно считать, что λn → λ ≥ 0, а последовательность hxn , x∗n i сходится.
Если λ = 0, то x∗n → 0, x∗ = 0 и (2) очевидно. Если же λ > 0, то последо∗ −1
вательность zn∗ = x∗n λ−1
n слабо сходится к x λ . В силу псевдомонотонности
оператора Γ = ∂g имеем
lim hzn∗ , xn i ≥
n→∞
1 ∗
hx , xi ,
λ
что и приводит к (2). Лемма доказана.
Обозначим через Λ1 (Q) часть класса Λ(Q), состоящую из функционалов
f , удовлетворяющих условиям
f1 ) |f (x1 ) − f (x2 )| ≤ L(r)kx1 − x2 k , где xi ∈ Q, kxi k ≤ r, (i = 1, 2),
L(·) : (0, ∞) → (0, ∞) – возрастающая функция;
f2 ) если xn ∈ Q, x∗n ∈ ∂f (xn ) и
xn ⇀ x,
x∗n ⇀ x∗ ,
lim hx∗n , xn i ≤ hx∗ , xi ,
n→∞
то xn → x .
Результаты работ [7, 11 – 13] показывают, что функционалы вариационного исчисления на пространстве Соболева в естественных предположениях принадлежат классу Λ1 . Полезно заметить, что сужение функционала f
класса Λ1 (X) на множество Q принадлежит классу Λ1 (Q).
Для проверки условия C0 ) оказывается полезным более обозримое условие
f 3) : всякая последовательность xn из Q, для которой f (xn ) = O(1), и
∆f (xn ) → 0, ограничена в пространстве X.
Условие f 3) выполнено, если, например, f : Q → R – растущий функционал, т. е. множество Qb = {x ∈ Q, f (x) ≤ b} ограничено при любом
b < ∞. Примеры функционалов f, g, удовлетворяющих сформулированным
выше условиям, рассматриваются в следующем пункте.
Лемма 2. Пусть выполнены условия C1 ), f1 ) − f3 ). Тогда функционал f
принадлежит классу Λ0 (Q).
Доказательство. Пусть xn ∈ Q, f (xn ) = O(1), ∆f (xn ) → 0 . В силу условия f3 ) последовательность xn ограничена. Поскольку ∆f (xn ) → 0,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О периодических экстремалях липшицевых функционалов
123
то существуют последовательности x∗n ∈ ∂f (xn ), yn∗ ∈ NQ (xn ), для которых
kx∗n + yn∗ k → 0. Последовательности xn , x∗n ограничены, поэтому можно считать, что xn ⇀ x, x∗n ⇀ x∗ , yn∗ ⇀ −x∗ . Согласно условию C1 )
lim hx∗n , xn i = lim h−yn∗ , xn i ≤ hx∗ , xi .
n→∞
n→∞
Так как f ∈ Λ1 (Q), то xn → x. Лемма доказана.
Из лемм 1, 2 очевидным образом вытекает следующее утверждение.
Теорема 1. Пусть множество Q определено равенством (2), а функционалы g, f удовлетворяют условия g1), g2) и f 1) − f 3) соответственно.
Тогда функционал f принадлежит классу Λ0 (Q).
2. Специальные свойства функционалов вариационного исчисления. В
этом пункте приводятся примеры функционалов, удовлетворяющих cформулированным выше условиям. Пусть T — компактное хаусдорфово пространство, m — натуральное число, Rm – m – мерное арифметическое пространp
ство со скалярным произведением (u|v) и евклидовой нормой |u| = (u|u),
E = C(T, Rm ) – пространство непрерывных на компакте T m− мерных
вектор-функций с нормой
kxkE = max |x(t)| .
t∈T
Рассмотрим на пространстве E скалярную функцию h, определяемую равенством
h(x) = max G(t, x(t)) ,
t∈T
где G(t, η) : T ×Rm → R – непрерывная по совокупности переменных и непрерывно дифференцируемая по η действительнозначная функция.
Предложение 1. Функция h принадлежит классу Λ(E) и обладает
свойствами:
1◦ функция h регулярна в каждой точке x пространства E и имеет
место равенство
h◦ (x, v) = h′ (x, v) = max(Gη (t, x(t)|v(t)) ,
t∈Tx
в котором Tx = {t ∈ T, G(t, x(t)) = h(x)}, v ∈ E;
2◦ субдифференциал Кларка ∂h(x) функции h в точке x содержит те и
только те линейные функционалы x∗ , которые допускают представление
Z
∗
hx , v)i = (Gη (t, x(t))|v(t))dµ .
T
где µ — регулярная борелевская мера на T , имеющая единичную норму и
сосредоточенная на множестве Tx ;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
124
В. С. Климов, Н. А. Демьянков
3◦ функция h◦ полунепрерывна сверху по совокупности переменных, т. е.
если xi → x, vi → v в метрике пространства E, то
lim h◦ (xi , vi ) ≤ h◦ (x, v) .
i→∞
Предложение 1 вытекает из результатов, приведённых в ([1], глава 2) и
([15], гл. 4).
Пусть ω — фиксированное положительное число. Идентифицируем непрерывную и ω – периодическую вектор-функцию со значениями в пространстве
Rm с элементом пространства E = C(T, Rm ), где T есть окружность длины
ω. Каждой регулярной неотрицательной борелевской мере µ на окружности
T можно сопоставить линейный неотрицательный функционал на пространстве C(T ). Как хорошо известно, верно и обратное. Если мера µ совпадает
с лебеговой мерой на окружности (инвариантной относительно поворотов и
нормированной условием µ(T ) = ω), то для интеграла от функции z по этой
мере будет использоваться стандартное обозначение
Z
z(t) dt .
T
Далее E1 = Lp (T, Rk (1 ≤ p ≤ ∞) – пространство Рисса измеримых относительно меры Лебега функций u(t) со значениями в Rk . Как обычно, q
p
– двойственный к p показатель; в частности, q =
, если 1 < p < ∞.
p−1
Билинейная форма
Z
∗
hz , zi = (z ∗ (t)|z(t)) dt
T
задаёт двойственность между пространствами E1
E1∗ = Lq (T, Rk ).
Рассмотрим интегральный функционал
Z
ϕ(x, u) =
Φ(t, x(t), u(t)) dt
=
Lp (T, Rk )
и
(4)
T
при следующих предположениях относительно интегранта Φ.
Φ1 ) Интегрант Φ : T × (Rm × Rk ) → R и его производная
Φη : T × (Rm × Rk ) → Rm суть каратеодориевские функции, т. е. непрерывны по (η, ζ)) ∈ Rm × Rk почти при всех t из T и измеримы по t при всех
(η, ζ) ∈ Rm × Rk ; Φ(·, 0, 0) ∈ L1 (T ).
Φ2 ) При любых (t, η) из T × Rm функция Φ(t, η, ·) : Rk → R строго выпукла, в частности, имеет смысл субдифференциал ∂ζ Φ(t, η, ζ) этой функции по
переменной ζ в точке ζ.
Φ3 ) Справедливы неравенства
|Φη (t, η, ζ)| + |ζ ∗ |q ≤ c(|η|)(1 + |ζ|p ) + r(t) ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О периодических экстремалях липшицевых функционалов
125
Φ(t, 0, ζ) ≥ c0 (|η|)|ζ|p − r0 (t) ,
в которых (t, η, ζ) ∈ T × Rm × Rk , ζ ∗ ∈ ∂ζ Φ(t, η, ζ), функции r(·), r0 (·) принадлежат L1 (T ), c(·), c0 (·) – непрерывные и положительные на луче R+ = [0, ∞)
функции.
Из условий Φ1 ) − Φ3 ) легко следует, что определяемая равенством (4)
функция ϕ принадлежит классу Λ(E × E1 ). Она имеет гладко-выпуклую
структуру: ϕ – гладкая функция по первому аргументу, ϕ – выпуклая (и
даже строго выпуклая) функция по второму аргументу.
Предложение 2. Пусть интегрант Φ удовлетворяет условиям Φ1 ) −
Φ3 ). Тогда
1◦ функция ϕ регулярна в каждой точке (x, u) пространства E × E1 и
Z
◦
ϕ (x, u; y, v) = ((Φη (t, x(t), u(t))|y(t)) + (Φζ (t, x(t), u(t))|v(t)) dt ;
T
2◦ субдифференциал Кларка ∂ϕ функции ϕ в точке (x, u) содержит те
и только те линейные функционалы l, которые допускают представление
Z
l(y, v) = ((Φη (t, x(t), u(t))|y(t)) + (w(t)|v(t))) dt ,
(5)
T
где w(t) ∈ Φζ (t, x(t), u(t)) п.в. и w(·) – измеримая функция;
3◦ если xn ∈ E, un ∈ E1 , wn ∈ E1∗ , wn (t) ∈ Φζ (t, xn (t), un (t)) п.в., причем
xn → x,
un ⇀ u,
wn ⇀ w,
lim hun , wn i ≤ hu, wi ,
n→∞
то un → u и w ∈ ∂ζ Φ(t, x(t), u(t)).
Доказательство предложения 2 опускается. Первые два утверждения
представляют переформулировку известных результатов. Для их справедливости не требуется строгая выпуклость интегранта Φ по аргументу ζ. Однако
при доказательстве третьего утверждения условие Φ2 ) приходится использовать в полном объёме.
Предложения 1, 2 позволяют достаточно просто установить свойства
функционалов вариационного исчисления на пространствах дифференцируемых функций. Пусть Wp1 (I) (1 < p < ∞) – пространство Соболева векторфункций x на интервале I = (0, ω) cо значениями в пространстве Rm , имеющих в I суммируемые в степени p обобщённые производные x′ первого порядка. Пространство Wp1 (I) с нормой
kxkp,1 = kx; Lp k + kx′ ; Lp k
сеперабельно и рефлексивно; оно компактно вложено в пространство
C([0, ω]; Rm ) (при обычном отождествлении эквивалентных функций). Это
позволяет корректно определить значение функции x ∈ Wp1 (I) в любой точке
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
126
В. С. Климов, Н. А. Демьянков
t отрезка [0, ω]. В частности, можно ввести представляющее для нас основной
интерес пространство V ⊂ Wp1 (I), полагая
V = {x ∈ Wp1 (I), x(0) = x(ω)} ;
иначе говоря, V – это подпространство Wp1 (I), состоящее из функций, удовлетворяющих условию периодичности. Каждый элемент пространства V
можно идентифицировать с функцией из введённого ранее пространства
E = C(T, Rm ); обозначим через j оператор вложения пространства V в пространство E. Пространство V с нормой (6) сепарабельно и рефлексивно; оператор вложения j : V → E усиленно непрерывен. Это означает следующее:
если последовательность xn ∈ V слабо сходится к x, то xn сходится к x и
в метрике пространства E. Оператор дифференцирования x → x′ действует
и непрерывен из пространства V в пространство E1 = Lp (T, Rm ); здесь и в
дальнейшем числа k, m совпадают.
Применим предложения 1, 2 для изучения функционалов f, g : V → R,
определяемых равенствами
Z ω
g(x) = max G(t, x(t)), f (x) =
Φ(t, x(t), x′ (t))
(6).
t∈[0,ω]
0
Очевидно, что g(x) = h(jx), f (x) = ϕ(jx, x′ ). Таким образом, функционалы
g, f представляют суперпозиции рассмотренных ранее функционалов h и ϕ
с линейными операторами вложения и дифференцирования. Справедлива
следующая лемма.
Лемма 3. Пусть G(t, η) : T × Rm → R – непрерывная по совокупности
переменных и непрерывно дифференцируемая по η действительнозначная
функция. Пусть выполнены предположения:
I) множество {x ∈ V : g(x) = 0} непусто;
II) если G(t, η) = 0 при некоторых t, η, то Gη (t, η) 6= 0.
Тогда функция g : V → R удовлетворяет условиям g1), g2).
Доказательство. Установим псевдомонотонность отображения
Γ = ∂g. Включение g ∈ Λ(V ) следует из равенства g(x) = h(jx) и
предложения 1. Столь же очевидны равенства
g ◦ (x; v) = g ′ (x; v) = h◦ (jx, jv) = h′ (jx, jv)
для любых x, v из пространства V . Если последовательность xn сходится в
топологии σ(V, V ∗ ) к элементу x, то последовательность jxn сходится к jx
в сильной топологии пространства E (усиленная непрерывность оператора
вложения). Это влечёт за собой соотношения
lim g ◦ (xn ; x − xn ) = lim h◦ (jxn ; j(x − xn )) = 0 ,
n→∞
n→∞
(7)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О периодических экстремалях липшицевых функционалов
127
lim g ◦ (xn ; v − xn ) = lim h◦ (jxn ; j(v − xn )) ≤ h◦ (jx; j(v − x)) =
n→∞
n→∞
= g ◦ (x; v − x) ∀v ∈ V .
(8)
Равенство (7) следует из равномерной сходимости последовательности jxn
к элементу jx. Оценка (8) вытекает из полунепрерывности сверху функции
h0 – cвойство 30 функционала h. Соотношения (7), (8) означают, что многозначное отображение Γ = ∂g удовлетворяет условию (α0 ) работы [14] и,
следовательно, псевдомонотонно.
Проверка условия g2 ) опускается. Её основу составляет условие II на
функцию G, а также сформулированный в предложении 1 способ описания
субдифференциала Кларка ∂h функционала h. Лемма доказана.
Лемма 4. Если интегрант Φ : T × Rm × Rm удовлетворяет условиям
Φ) − Φ3 ) при k = m, то функционал f (v) = ϕ(jv, v ′ ) принадлежит классу
Λ1 (V ).
Доказательство близко к доказательству леммы 9 работы [13].
Леммы 3, 4 приводят к достаточно обозримым способам проверки условий
g1 ), g2 ), f1 ), f2 ). Как легко установить, если множество
{G ≤ 0} = {(t, η) ∈ T × Rm : G(t, η) ≤ 0}
ограничено в пространстве T ×Rm , то условие f3 ) также вытекает из условий
Φ1 ) − Φ3 ). Предположение об ограниченности множества {G ≤ 0} достаточно
жёстко, однако в ряде случаев оно вполне естественно. Не претендуя на обзор
способов проверки условия f3 ), отметим лишь, что оно заведомо выполнено,
если интегрант Φ на множестве {G ≤ 0} удовлетворяет условию роста
Φ(t, η, ζ) ≥ δ(|ζ|p + |η|) − r(t) ,
в котором δ – положительная постоянная, а r ∈ L1 (T ).
3. Периодические экстремали и вариационные неравенства. Наметим пути
применения изложенных выше результатов к исследованию периодических
экстремалей интегральных функционалов. Сохраняются обозначения, принятые в предшествующих пунктах. В частности, будем считать, что функционалы f, g определены на пространстве V равенствами (6), функции G, Φ
удовлетворяют условиям лемм 3, 4 соответственно, множество Q задаётся равенством (3). Предполагается также, что функционал f удовлетворяет условию f3 ). Указанные предположение гарантируют включение f ∈ Λ0 (Q).
Условие f ∈ Λ0 (Q) позволяет получить ряд результатов о существовании
одного и более критических значений функционала f . Начнём с изучения
задачи на минимум
Z ω
f (x) =
Φ(t, x(t), x′ (t)) dt → min ,
(9)
0
x ∈ V,
G(t, x(t)) ≤ 0 .
(10)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
128
В. С. Климов, Н. А. Демьянков
Необходимым условием её разрешимости является ограниченность снизу
функционала f на множестве Q. В расcматриваемом случае ограниченность
снизу и достаточна, более того, в данной ситуации удаётся установить не
только разрешимость задачи (9) – (10), но и её корректность. Справедлив
cледующий признак корректности.
Теорема 2. Пусть a = inf{f (x), x ∈ Q} > −∞. Тогда множество Qa
непусто, a – критическое значение функционала f и любая минимизирующая f последовательность xn сходится к множеству Qa , т. е.
lim d(xn , Qa ) = lim inf kxn − yk = 0 .
n→∞
n→∞ y∈Qa
Доказательство. Теорема 2 вытекает из предположения f ∈ Λ0 (Q) и
результатов общего характера (см., например, [3, 14]).
Теорема 2, в частности, справедлива, если при некотором действительном
b множество Qb = {x ∈ Q, f (x) ≤ b} ограничено и непусто. При определённых
предположениях можно установить существование промежуточных критических значений функционала f , отличных от точной нижней грани его значений, которая (в принципе) может и не быть конечной. Множество N ⊂ Q реализует локальный минимум функционала f , если f (y) ≥ f (x) (x ∈ N, y ∈ W ),
где W – относительная окрестность множества N. Из определения ясно, что
f принимает на множестве N постоянное значение f (N).
Теорема 3. Пусть Q – линейно связное множество, c ∈ R, Efc 6= ∅
и Efc – реализует локальный минимум функционала f . Если f (x∗ ) < c для
некоторого x∗ из множества Q, то f имеет большее, чем c, критическое
значение.
Теорема 3 следует из теоремы 5 работы [3].
Она, в определённом смысле, близка к известным в нелинейном анализе
теоремам о перевале. Большее, чем c, критическое значение d может быть
определено с помощью конструкций, основанных на принципе минимума
максимумов. При дополнительных ограничениях можно установить существование не менее трёх критических значений функционала f .
Теорема 4. Пусть выполнены условия теоремы 3 и множество Qb ограничено при некотором b > c. Тогда функционал f имеет не менее трёх
различных критических значений.
Доказательство. К двум критическим значениям c, d (c < d) добавляется третье, равное a – минимуму функции на f на множестве Q. Существование минимального значения вытекает из ограниченности множества
Qb . Поскольку a ≤ f (x∗ ) < c < d, то a, c, d – три различных критических
значения функционала f . Теорема доказана.
Коснёмся вопроса о гладкости экстремалей. Включение x ∈ Ef эквивалентно соотношениям
x ∈ V,
0 ∈ ∂f (x) + λ∂g(x),
λ ≥ 0,
λg(x) = 0 .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О периодических экстремалях липшицевых функционалов
129
Остановимся на расшифровке включения 0 ∈ ∂f (x) + λ∂g(x). Учитывая приведённое выше описание субдифференциалов Кларка функций h, ϕ, получаем, что это включение означает следующее: функция x удовлетворяет интегральному тождеству
Z
Z
′
((Ψ0 (t)|v(t)) + (Ψ(t)|v (t))) dt + λ (Gη (t, x(t)|v(t))dµ(t) = 0,
(11)
T
T
в котором Ψ( t) = Φη (t, x(t), x′ (t)), v – произвольная функция из V , Ψ(t) – измеримое сечение многозначного отображения t → ∂ζ Φ(t, x(t), x′ (t), µ – вероятностная регулярная борелевская мера на T , сосредоточенная на множестве
Tx = {t ∈ T, G(t, x(t)) = 0}. Соотношение (11) эквивалентно равенству
Ψ′ = Ψ0 + λGη (·, x(·))
dµ
,
dt
(12) ,
понимаемому в смысле теории распределений. Степень гладкости функции x
зависит и от свойств функций Φ, G, и от меры µ. Даже в случае бесконечное
число раз дифференцируемых функций Φ, G экстремаль x может и не быть
гладкой функцией. Если мера µ абсолютно непрерывна относительно меры
Лебега, а функция Φ дифференцируема и по аргументу ζ, то (12) влечёт за
собой классическое уравнение Эйлера – Лагранжа
d
d
Φζ (t, x(t), x′ (t)) = Φη (t, x(t), x′ (t)) + λGη (t, x(t)) µ(t) .
dt
dt
Это позволяет рассматривать соотношения (11), (12) как обобщённые уравнения Эйлера– Лагранжа.
Литература
[1] Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988.
[2] Rockafellar R. T. Generalized directional derivatives and subgradients of
nonconvex functions // Canadian Journal of Mathematics. 1980. V. 32, № 2.
P. 257 – 280.
[3] Климов В. С. Минимаксные критические значения негладких
функционалов // Сиб. мат. журнал. 1992. Т. 33, № 3. С. 91 – 100.
[4] Дмитрук А. В., Милютин А. А., Осмоловский Н. П. Теорема Люстерника
и теория экстремума // УМН. 1980. Т. 35, № 6. С. 11 – 46.
[5] Заславский Л. Я. О критических точках липшицевых функций на гладких многообразиях // Сиб. мат. журнал. 1981. Т. 22, № 1. С. 87 – 93.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
130
В. С. Климов, Н. А. Демьянков
[6] Palais R. S. Lusternik-Schnirelman theory on Banach manifolds // Topology.
1966. V. 5, Iss. 2. P. 115 – 132.
[7] Бобылёв Н. А., Емельянов С. В., Коровин С. К. Геометрические методы
в вариационных задачах. М.: Магистр, 1998.
[8] Ioffe A., Schwartzman E. Metric critical point theory. // J. Math. Pures
Appl. 1996. V. 75. P. 125 – 153.
[9] Лионс Ж. Л. Некоторые методы решения нелинейных краевых задач.
М.: Мир, 1972.
[10] Browder F. E. Pseudo-monotone operators and the direct method of
variation // Arch. Ration. mech. and Anal. 1970. V. 38, № 4. P. 268 – 277.
[11] Скрыпник И. В. Нелинейные эллиптические уравнения высшего порядка. Киев: Наукова думка, 1973.
[12] Gossez J. P. Surjectivity Results for Pseudo-Monotone Mappings in
Complementary System // Jorn. of Math. Anal. and Appl. 1976. V. 53.
P. 484 – 494.
[13] Климов В. С. Бесконечномерная версия теории Морса для липшицевых
функционалов // Мат. сб. 2002. Т. 193, № 6. P. 105 – 122.
[14] Климов В. С. Топологических характеристики многозначных отображений и липшицевых функционалов // Изв. РАН. Cер. Математическая.
2008. Т. 72, вып. 4. P. 97 – 120.
[15] Иоффе А. Д., Тихомиров В. М. Теория экстремальных задач. М.: Наука,
1974.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 512.7
Вещественные пересечения двух
проективных квадрик
В. А. Краснов
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: krasnov@uniyar.ac.ru, vakras@yandex.ru
В работе рассматриваются неособые пересечения двух
вещественных проективных квадрик. Такие многообразия мы для
краткости называем вещественными биквадриками. В данном
обзоре излагаются результаты для биквадрик размерности не
больше четырех.
Библиография: 9 названий.
Введение
Сначала приведем несколько обозначений и определений. Пусть V ⊂ Pn
— комплексное проективное алгебраическое многообразие, заданное системой
уравнений
q1 (X0 , . . . , Xn ) = 0, q2 (X0 , . . . , Xn ) = 0,
(1)
где q1 (X0 , . . . , Xn ) = q1 (X), q2 (X0 , . . . , Xn ) = q2 (X) — ненулевые, непропорциональные квадратичные формы с комплексным коэффициентами, X0 , . . . , Xn
— однородные координаты в Pn . Такое многообразие будем называть биквадрикой. Биквадрике V однозначно соответствует пучок квадрик в Pn
λ1 q1 (X) + λ2 q2 (X) = 0,
(2)
который определяет прямую L в пространстве квадрик PN , где
N=
(n + 1)(n + 2)
− 1.
2
Переменные λ1 , λ2 являются однородными координатами прямой L. Таким образом, множество биквадрик содержится в многообразии Грассмана
G(2, N ), которое обозначим также через G.
131
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
132
В. А. Краснов
Заметим, что биквадрика V , заданная системой уравнений (1), неособая
тогда и только тогда, когда уравнение
det(λ1 M1 + λ2 M2 ) = 0,
(3)
где M1 , M2 — матрицы коэффициентов квадратичных форм q1 (X), q2 (X),
не имеет кратных корней на комплексной проективной прямой P1 . Через
G∗ ⊂ G обозначим множество неособых биквадрик. Тогда гиперповерхность
∆ = G \ G∗ называется дискриминантной гиперповерхностью. Если p ∈ G∗ ,
то через Vp обозначаем соответствующую неособую биквадрику. Заметим, что
комплексным биквадрикам посвящена диссертация М. Рида (см. [7]). Теория
трехмерных комплексных биквадрик связана с исследованиями о квадратичном комплексе прямых, классическим объектом алгебраической геометрии
(см. подробности в [2]).
Через RG, RG∗ обозначим множества вещественных точек из G, G∗ соответственно. Если p ∈ RG∗ , то комплексная биквадрика Vp может быть задана
системой уравнений (1) с вещественными коэффициентами. Тогда на комплексной биквадрике Vp определена инволюция комплексного сопряжения
τ : Vp → Vp . Пара (Vp , τ ) называется вещественной биквадрикой, мы будем
ее также обозначать через Vp , так как инволюция τ : Vp → Vp однозначно восстанавливается из инволюции комплексного сопряжения τ : Pn → Pn и
вложения Vp ֒→ Pn . Множество вещественных точек биквадрики Vp обозначается через RVp и называется вещественной частью биквадрики Vp , заметим,
что RVp равно множеству неподвижных точек Vpτ инволюции τ : Vp → Vp .
Множество RG∗ обозначаем через B n или через B, оно является несвязным в евклидовой топологии. Компоненты связности топологического пространства B n называются жесткими изотопическими классами неособых
вещественных биквадрик в Pn (см. аналогичное определение для кривых в
[8]). Жесткие изотопические классы вещественных биквадрик давно описаны
(см. [3]), [1], [6]). В первом параграфе мы сформулируем соответствующую
теорему.
Естественно возникает следующая задача о вещественных биквадриках:
описать топологический тип вещественный части RV биквадрики V в зависимости от ее жесткого изотопического класса. Для одномерных и двумерных биквадрик эта задача легко решается. Но для трехмерных и четырехмерных триквадрик полностью ее решить трудно. Таким биквадрикам посвящены мои работы [4], [5]. Заметим, что для двулистного накрытия W ⊂ S n
биквадрики RV , индуцированного двулистным накрытием S n → RPn , аналогичная задача частично решена в работах [9], [6]. Многообразие W определяется системой уравнений (1), если решения рассматривать на сфере
X01 + . . . + Xn2 = 1.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вещественные пересечения двух проективных квадрик
133
1. Жесткая изотопическая классификация
вещественных биквадрик
Пусть k — натуральное число, тогда разложение k в сумму нечетного
количества натуральных чисел
k = k1 + . . . + k2s−1 ,
где s > 0, называется нечетным разбиением числа k. Два разбиения
k = k1 + . . . + k2s−1 ,
k = k ′1 + . . . + k ′2s−1
называются эквивалентными, если второе разбиение можно получить из первого с помощью одной из следующих операций: циклической перестановки,
изменения порядка слагаемых на противоположный (то есть обращение разбиения), циклической перестановки с последующим обращением. Класс эквивалентности нечетного разбиения k = k1 + . . . + k2s−1 обозначим через
(k1 , . . . , k2s−1 ). Множество классов эквивалентности нечетных разбиений числа k обозначим через Rk , причем R0 по определению состоит из одного элемента, обозначаемого через (0).
Теперь мы опишем отображение
[
Rk ,
π0 (B n ) →
k
где через π0 (B ) обозначено множество компонент пространства B n , то есть
множество жестких изотопических классов биквадрик.
Если p ∈ G, то через Vp , Lp обозначаем соответствующую биквадрику
в Pn и прямую в пространстве квадрик PN . Через Λ ⊂ PN обозначим множество особых комплексных квадрик в пространстве квадрик PN , оно называется дискриминантной гиперповерхностью. Пусть p ∈ B n , тогда через
k(p) обозначим количество точек пересечения вещественной прямой RLp с
вещественной дискриминантной гиперповерхностью RΛ. Число k(p) равно
количеству особых вещественных квадрик в пучке (2), то есть количеству
вещественных решений на проективной прямой уравнения (3).
Заметим, что выполняется сравнение k(p) ≡ n + 1 mod 2 и неравенство
k(p) 6 n + 1. Если k ∈ {0, . . . , n + 1} то через Bk обозначим множество точек
p ∈ B, для которых выполняется равенство k(p) = k. Множество Bk состоит
из целых компонент связности пространства B.
Далее мы объясняем, как точке p ∈ Bk , где k > 1, сопоставляется класс
эквивалентности нечетного разбиения числа k. Пусть вещественная биквадрика Vp задается системой уравнений (1). Рассмотрим окружность S 1 ⊂ R2 ,
заданную уравнением λ21 + λ22 = 1. На этой окружности определена целочисленная функция σp (λ), равная сигнатуре квадратичной формы
n
λ1 q1 (X) + λ2 q2 (X).
(4)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
134
В. А. Краснов
Функция σp (λ) имеет 2k точек разрыва, причем при переходе через каждую
точку разрыва значения функции изменяются на ±2.
Точку разрыва функции σp (λ) назовем "положительной", если при переходе через нее в положительном направлении (против часовой стрелки)
значения функции σp (λ) увеличиваются на 2, в противном случае точка разрыва называется "отрицательной". Соответствующее нечетное разбиение
k = k1 + . . . + k2s−1
состоит из количеств последовательно идущих положительных точек разрыва функции σp (λ), которые возникают при обходе окружности в положительном направлении. Таким образом, точке p ∈ Bk сопоставляется класс
эквивалентности нечетного разбиения (k1 , . . . , k2s−1 ). Единственный элемент
из множества R0 сопоставляется жесткому изотопическому классу B(0), состоящему из биквадрик Vp , для которых вещественная прямая RLp не пересекается с вещественной дискриминантной гиперповерхностью RΛ, то есть
уравнение (3) не имеет вещественных решений. Множество компонент связности пространства B n , то есть множество жестких изотопических классов
биквадрик, обозначим через π0 (B n ).
Справедлива следующая (см. [3], приложение А)
Теорема 1.1. Построенное отображение
[
π0 (B n ) →
Rk ,
k
где 0 6 k 6 n + 1 и k ≡ n + 1 mod 2, является биекцией.
Через B n (k1 , . . . , k2s−1 ) или просто через B(k1 , . . . , k2s−1 ) мы обозначаем
компоненту связности пространства B n , отвечающую классу эквивалентности нечетного разбиения (k1 , . . . , k2s−1 ). Эту компоненту будем обозначать и
через B(k1 , . . . , k2s−1 ), если это не приводит к противоречию. Также обозначаем через B n (0) или B(0) компоненту связности, отвечающую элементу (0).
2. Одномерные и двумерные биквадрики
В одномерном случае биквадрики образуют четыре жестких изотопических класса: B 3 (0), B 3 (2), B 3 (4), B 3 (1, 1, 2). Так как неособое полное пересечение двух комплексных квадрик в P3 является кривой рода 0, то множество
вещественных точек может, в принципе, состоять из одной или двух топологических окружностей или быть пустым. Все эти случаи нетрудно реализовать. С помощью рассмотрения примеров устанавливается
Предложение 2.1. Справедливы следующие утверждения
1) если p ∈ B 3 (0) ∪ B 3 (1, 1, 2), то кривая RVp состоит из двух топологических окружностей;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вещественные пересечения двух проективных квадрик
135
2) если p ∈ B 3 (2), то RVp состоит из одной топологической окружности;
3) если p ∈ B 3 (4), то множество RVp пустое.
Существуют следующие жесткие изотопические классы неособых двумерных вещественных биквадрик
B 4 (1), B 4 (3), B 4 (1, 1, 1), B 4 (5), B 4 (1, 1, 3), B 4 (1, 2, 2), B 4 (1, 1, 1, 1, 1).
В работе [3] показано, что эти жесткие изотопические классы определяются топологическими типами вещественных частей биквадрик (см. [3],
приложение A). Действительно, существует семь различных топологических
типов вещественных частей неособых двумерных биквадрик. Чтобы описать
их, обозначим через gS 2 связную компактную неориентируемую топологическую поверхность, полученную из сферы S 2 заменой g дисков на листы
Мебиуса, а через T 2 — двумерный тор. Тогда нетрудно построить неособые
вещественные двумерные биквадрики, вещественные части которых гомеоморфны топологическим поверхностям:
6S
2
, 4S 2 , 2S 2 , T 2 , S 2 ⊔ S 2 , S 2 ,
или вещественная часть является пустым множеством. К сожалению, в работе [3] не указано соответствие между этими топологическим типами и верхними жесткими изотопическими классами. Оказывается, что имеет место (см.
[5])
Предложение 2.2 Справедливы следующие утверждения:
1) если p ∈ B 4 (1), то поверхность RVp гомеоморфна 2S 2 ;
2) если p ∈ B 4 (3), то поверхность RVp гомеоморфна S 2 ;
3) если p ∈ B 4 (1, 1, 1), то поверхность RVp гомеоморфна 4S 2 ;
4) если p ∈ B 4 (5), то множество RVp пустое;
5) если p ∈ B 4 (1, 1, 3), то поверхность RVp гомеоморфна S 2 ⊔ S 2 ;
6) если p ∈ B 4 (1, 2, 2), то поверхность RVp гомеоморфна T 2 ;
7) если p ∈ B 4 (1, 1, 1, 1, 1), то поверхность RVp гомеоморфна 6S 2 .
3. Трехмерные биквадрики
Возможны следующие жесткие изотопические классы вещественных
трехмерных биквадрик
B 5 (0), B 5 (2), B 5 (4), B 5 (6), B 5 (1, 1, 2),
B 5 (1, 1, 4), B 5 (1, 2, 3), B 5 (2, 2, 2), B 5 (1, 1, 1, 1, 2).
Далее мы приведем теорему, в которой для каждого изотопического класса указывается соответствующий топологический тип вещественной части
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
136
В. А. Краснов
биквадрики, принадлежащей данному жесткому изотопическому классу. Но
прежде мы определим пять гладких трехмерных многообразий M0 , M1 , M2 ,
M3′ , M3′′ , которые участвуют в формулировке теоремы.
В трехмерном проективном пространстве P3 = P(C4 ) зафиксируем неособую вещественную двумерную квадрику K, множество вещественных точек
которой RK является гиперболоидом. На квадрике K возьмем неособую вещественную кривую D ⊂ K бистепени (2, 3). Раздуем эту кривую, тогда
получим вещественное трехмерное многообразие Vb , на котором собственный
b квадрики K можно стянуть вдоль второго семейства прямых.
прообраз K
Полученное вещественное алгебраическое многообразие обозначим через V
(оно будет вещественной биквадрикой). Вещественная кривая (D, τ ) имеет
род 2, для нее возможны случаи:
(0) Множество вещественных точек RD состоит из одной компоненты
связности, которая разбивает топологическую поверхность D на две половинки. В этом случае многообразие RV обозначим через M0 .
(1) Множество вещественных точек RD состоит из одной компоненты
связности, которая не разбивает топологическую поверхность D на две половинки. В этом случае многообразие RV обозначим через M1 .
(2) Множество вещественных точек RD состоит из двух компонент связности. В этом случае многообразие RV обозначим через M2 .
(3′ ) Множество вещественных точек RD состоит из трех компонент связности, каждая из которых не гомологична нулю на гиперболоиде RK. В этом
случае многообразие RV обозначим через M3′ .
(3′′ ) Множество вещественных точек RD состоит из трех компонент связности, одна из которых не гомологична нулю на гиперболоиде RK, а две
другие гомологичны нулю. В этом случае многообразие RV обозначим через
M3′′ .
Таким образом, если рассматривать только вещественные части, то многообразия M0 , M1 , M2 , M3′ , M3′′ получаются следующей конструкцией. В
трехмерном проективном пространстве RP3 раздувается кривая RD, а затем
b гиперболоида RK вдоль собственных
стягивается собственный прообраз RK
прообразов прямых на RK, индекс пересечения которых с кривой RD не
равен нулю со значениями в поле F2 .
Но если нас интересуют только гладкие многообразия M0 , M1 , M2 , M3′ ,
M3′′ , то можно раздувать вместо кривой RD гладкую кривую Γ, гладко изотопную кривой RD на гиперболоиде RK, причем можно брать кривую Γ
наиболее просто устроенную. Далее указаны возможные варианты выбора
кривой Γ. Для построения многообразия M0 нужно взять связную гладкую
ориентированную кривую Γ, которая с ориентированными прямыми первого
семейства на гиперболоиде RK имеет индекс пересечения 2, а с ориентированными прямыми второго семейства индекс пересечения равен 1 или 3
(предполагается, что гиперболоид RK также ориентирован в соответствии
с ориентациями прямых). Для построения многообразия M1 можно взять в
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вещественные пересечения двух проективных квадрик
137
качестве кривой Γ прямую из первого семейства на гиперболоиде RK. Для
построения многообразия M2 можно взять в качестве кривой Γ объединение прямой из первого семейства и гладкого овала на гиперболоиде. Для
построения многообразия M3′ можно взять в качестве кривой Γ объединение
трех прямых из первого семейства. Для построения многообразия M3′′ можно
взять в качестве кривой Γ объединение прямой из первого семейства и двух
овалов, не образующих гнездо.
Теорема 3.1. Справедливы следующие утверждения:
1) Если p ∈ B 5 (0), то многообразие RVp диффеоморфно многообразию
M0 .
2) Если p ∈ B 5 (2), то многообразие RVp диффеоморфно многообразию
M1 .
3) Если p ∈ B 5 (4), то многообразие RVp диффеоморфно трехмерной сфере
S 3.
4) Если p ∈ B 5 (6), то многообразие RVp пустое.
5) Если p ∈ B 5 (1, 1, 2), то многообразие RVp диффеоморфно многообразию
M2 .
6) Если p ∈ B 5 (1, 1, 4), то многообразие RVp диффеоморфно несвязному
объединению двух трехмерных сфер S 3 ⊔ S 3 .
7) Если p ∈ B 5 (1, 2, 3), то многообразие RVp диффеоморфно произведению
S 1 × S 2.
8) Если p ∈ B 5 (2, 2, 2), то многообразие RVp диффеоморфно многообразию
′
M3 .
9) Если p ∈ B 5 (1, 1, 1, 1, 2), то многообразие RVp диффеоморфно M3′′ .
Заметим, что многообразия M0 , M1 , M2 , M3′ , M3′′ , участвующие в формулировке этой теоремы, описаны с помощью конструкций алгебраической геометрии. Желательно, сделать это с помощью топологических конструкций.
Для трех из этих многообразий M0 , M1 , M3′ соответствующие топологические
конструкции найдены.
Предложение 3.2. Справедливы следующие утверждения:
1) Многообразие M0 диффеоморфно фактормногообразию
SO(3)/{1, g},
где {1, g} — группа второго порядка, действующая на многообразии SO(3) по
правилу: инволюция g : SO(3) → SO(3) умножает на −1 два первых столбца
матрицы из SO(3).
2) Многообразие M1 диффеоморфно многообразию S 1 × S 2 .
3) Многообразие M3′ диффеоморфно произведению S 1 × S 1 × S 1 .
Для многообразий M2 , M3′′ аналогичные топологические конструкции еще
не найдены.
Следующее предложение показывает, что только два жестких изотопических класса имеют одинаковые топологические типы.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
138
В. А. Краснов
Предложение 3.3. Пусть вещественные биквадрики Vp , Vp′ принадлежат разным жестким изотопическим классам. Тогда многообразия RVp , RVp′
диффеоморфны, если и только если p ∈ B 5 (2), p′ ∈ B 5 (1, 2, 3) или, наоборот,
p′ ∈ B 5 (2), p ∈ B 5 (1, 2, 3).
4. Четырехмерные биквадрики
Далее мы рассматриваем вещественные четырхмерные биквадрики, они
имеют следующие жесткие изотопические классы:
B 6 (1), B 6 (3), B 6 (1, 1, 1), B 6 (5), B 6 (1, 2, 2), B 6 (1, 1, 3),
B 6 (1, 1, 1, 1, 1), B 6 (7), B 6 (1, 1, 5), B 6 (1, 2, 4), B 6 (1, 3, 3), B 6 (2, 2, 3),
B 6 (1, 1, 1, 1, 3), B 6 (1, 1, 1, 2, 2), B 6 (1, 1, 2, 1, 2), B 6 (1, 1, 1, 1, 1, 1, 1).
В работе [5] доказана
Теорема 4.1. Многообразие RVp ориентируемое тогда и только тогда,
когда
p ∈ B 6 (5) ∪ B 6 (7) ∪ B 6 (1, 1, 5) ∪ B 6 (1, 2, 4) ∪ B 6 (1, 3, 3),
причем справедливы утверждения:
1) если p ∈ B 6 (5), то многообразие RVp диффеоморфно сфере S 4 ;
2) если p ∈ B 6 (7), то многообразие RVp — пустое множество;
3) если p ∈ B 6 (1, 1, 5), то многообразие RVp диффеоморфно несвязному
объединению двух сфер S 4 ⊔ S 4 ;
4) если p ∈ B 6 (1, 2, 4), то многообразие RVp диффеоморфно произведению
сфер S 1 × S 3 ;
5) если p ∈ B 6 (1, 3, 3), то многообразие RVp диффеоморфно произведению
сфер S 2 × S 2 .
Утверждения 1) – 5) этой теоремы, фактически, являются не очень сложными, старыми известными результатами, но утверждение о том, что нет
других ориентируемых биквадрик, является главным в этой теореме.
Установить топологический тип многообразия RVp при
p∈
/ B 6 (5) ∪ B 6 (7) ∪ B 6 (1, 1, 5) ∪ B 6 (1, 2, 4) ∪ B 6 (1, 3, 3)
пока не удалось, но вычислены размерности F2 -пространств когомологий
H r (RVp , F2 ), где F2 — поле из двух элементов. Далее размерности этих пространств будем обозначать через hr (RVp ). В работе [5] доказана Теорема 4.2.
Если p ∈
/ B 6 (5)∪B 6 (7)∪B 6 (1, 1, 5)∪B 6 (1, 2, 4)∪B 6 (1, 3, 3), то многообразие RVp
связное и справедливы следующие утверждения:
1) если p ∈ B 6 (1) ∪ B 6 (1, 2, 2), то выполняются равенства
h1 (RVp ) = h3 (RVp ) = 1,
h2 (RVp ) = 2;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вещественные пересечения двух проективных квадрик
139
2) если p ∈ B 6 (3), то выполняются равенства
h1 (RVp ) = h3 (RVp ) = 1,
h2 (RVp ) = 0;
3) если p ∈ B 6 (2, 2, 3) ∪ B 6 (1, 1, 1, 2, 2), то выполняются равенства
h1 (RVp ) = h3 (RVp ) = 2,
h2 (RVp ) = 2;
4) если p ∈ B 6 (1, 1, 1) ∪ B 6 (1, 1, 2, 1, 2), то выполняются равенства
h1 (RVp ) = h3 (RVp ) = 1,
h2 (RVp ) = 4;
5) если p ∈ B 6 (1, 1, 1, 1, 1), то выполняются равенства
h1 (RVp ) = h3 (RVp ) = 1,
h2 (RVp ) = 6;
6) если p ∈ B 6 (1, 1, 3), то выполняются равенства
h1 (RVp ) = h3 (RVp ) = 2,
h2 (RVp ) = 0;
7) если p ∈ B 6 (1, 1, 1, 1, 3), то выполняются равенства
h1 (RVp ) = h3 (RVp ) = 3,
h2 (RVp ) = 0;
8) если p ∈ B 6 (1, 1, 1, 1, 1, 1, 1), то выполняются равенства
h1 (RVp ) = h3 (RVp ) = 1,
h2 (RVp ) = 8.
Наконец, используя теоремы 4.1, 4.2 в [5] доказана
Теорема 4.3. Жесткий изотопический класс неособой вещественной четырехмерной биквадрики однозначно определяется топологическим типом ее
вещественной части.
Литература
[1] Аграчев А. А., Гамкрелидзе Р. В. Квадратичные отображения и гладкие
вектор-функции: эйлеровы характеристики множеств уровня // Итоги
науки и техники. ВИНИТИ. Современные проблемы математики. Новейшие достижения. T. 35. М., 1989. С. 179-239.
[2] Гриффитс Ф., Харрис, Дж. Принципы алгебраической геометрии. Т. 2.
М.: Мир, 1982.
[3] Degtyarev A., Itenberg I., Kharlamov V. Real Enriques surfaces // Lecture
Notes in Math. V. 1746. Springer, 2000.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
140
В. А. Краснов
[4] Краснов В. А. Вещественнные трехмерные биквадрики // Изв. РАН.
Сер. Математическая. 2010. Т. 74, вып. 4. C. 119-144.
[5] Краснов В.А. Вещественнные четырехмерные биквадрики // Изв. РАН.
Сер. Матемамическая (в печати).
[6] Lopez de Medrano S. Topology of the intersection of quadrics in Rn //
Lecture Notes in Math. V. 746. Springer, 2000. P. 280 – 292.
[7] Reid M. The complete intersection of two or more quadrics // Cambridge
Ph.D. thesis. 1972. Jun. //
URL: http://www.warwick.ac.uk/∼masada/3folds/qu.pdf.
[8] Рохлин В. А. Комплексные топологические характеристики вещественных алгебраических кривых // Успехи математических наук. 1978. Т. 33,
№ 5. С. 77 – 89.
[9] Wall C. T. C. Stability, pencils and polytopes // Bull. London Math. Soc.
1980. V. 12. P. 401 – 421.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 532.135
Исследование температурной
неустойчивости при численном
моделировании течений
термореактивной среды
В. Б. Калинин, В. В. Литвинов
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: vladimirlitvinov@yandex.ru
В работе рассматривается численное моделирование течения термореактивной массы на поверхности вращающихся валков. Используется нелинейная реологическая модель. В функции
диссипации уравнения энергии присутствует слагаемое, описывающее выделение тепла вследствие химической реакции. В
работе приводятся расчеты, обнаруживающие температурную
неустойчивость («тепловой взрыв») при некоторых значениях
характеристик среды.
Библиография: 5 названий.
В работе рассматривается численное моделирование плоского установившегося неизотермического течения термореактивного полимера между вращающимися валками. Исходная система уравнений включает в себя уравнение сохранения импульса и энергии. Реологическая модель учитывает
аномально-вязкие свойства. Особенностью задачи является наличие в функции диссипации слагаемого, описывающего выделяющееся в результате химической реакции тепло, величина которого растет экспоненциально с температурой. Используя известное решение данной задачи с обычной функцией диссипации, приведенное в [1], авторы провели численный анализ влияния дополнительного слагаемого на устойчивость процесса к "тепловому
взрыву".
Исходная система уравнений, с целью упростить задание граничных условий, записывается в биполярной системе координат в приближении пограничного слоя [2]. После ряда преобразований и используя естественные граничные условия: материал прилипает к поверхности валка; известна температура материала при входе в область деформации, а на границе с поверхностью валков полимер принимает температуру поверхности валков; давление
141
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
142
В. Б. Калинин, В. В. Литвинов
на входе и выходе в область деформации обращается в ноль
P = 0,
T = T1 ,
T = T2 ,
T = T0 (α)
u = V1 , v = 0
(α = α1 );
u = V2 , v = 0
(α = α2 );
(β = β+ , α1 ≤ α ≤ α2 ) P = 0,
β = β− ,
где α1 , α2 — границы области деформации — поверхности валков; β+ — координата входа в область деформации; Γ− (α, β− ) — неизвестная граница выхода. Поскольку рассматривается погранслойное приближение, то в качестве
Γ− (α, β− ) возьмем просто β = β− , при α1 ≤ α ≤ α2 , а требование обращения
в ноль касательных и нормальных напряжений на границе Γ− (α, β) преобразуется к виду:
P = 0,
∂P
=0
∂ρ
(β = β− ,
α1 ≤ α ≤ α2 ).
Это условие замыкает систему, которая принимает вид
m
Z α
∂P
t + C(β)
µ−m dt + V2 ,
u(α, β) = h
∂β
Z αα2
1
∂
v(α, β) =
(hu)dα,
m = m(T (α)),
h α2 ∂β
(1)
(2)
где u(α, β), v(α, β) — продольная и поперечная компоненты скорости, а
h2 = gαα = gββ = a2 /(chα − cos β)2 — метрический тензор биполярной состемы координат.
Решение ищется в узлах равномерной сетки (αi , βi ), по каждой из
переменных. Тогда уравнение энергии для некоторого фиксированного j
(β = const) запишется следующим образом:
¯ j
j
ρCv
λ ∂ 2T j
j ∂T
j ∂T
−
u
+v
+ Φ(uj , T j ) = 0,
2
2
h ∂α
h
∂β
∂α
n(T j )+1
u j E
j
j
j ∂
Φ(u , T ) = µ(T ) .
(3)
+ k0 exp
∂α v RT j
¯ j /∂β вычисляется как разделенная разность назад, Φ(uj , T j ) —
Здесь ∂T
функция диссипации. Из общей теории разностных схем [3] легко получить
решение дифференциального уравнения (3), сходящегося к решению задачи
как O(∆β). В рассматриваемой задаче использовался метод прогонки. Однако для точного решения (3), необходимо знать распределение скоростей
на том же самом слое по β. Для решения этой задачи предлагается следующий алгоритм. С учетом распределения температуры при фиксированном
β (j = const, j ≥ 2) вычисляются uj , v j и Φ(uj , T j ). Затем рассчитывается
новое распределение температуры на этом же слое по j, которое обозначим
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Температурная неустойчивость при течении
143
T1j . Далее, используя новое распределение температуры на j-м слое T1j , вычисляем uj1 , v1j , решая систему (1), а затем (2) и (3). После чего опять решаем
(3) и вычисляем T2 , и так далее. Получаем последовательности {Tnj }, {ujn },
{vnj }.
Поскольку именно температура представляет особый интерес при исследовании температурной неустойчивости, то условием выхода из цикла можно
принять соотношение (4)
X
2
j
Tnj [i] − Tn−1
[i] < ε.
(4)
n
Вычислив распределение скоростей и температуры на j-м слое, по известной
температуре решаем систему (1) уже на j + 1-м слое, затем — (2) и (3), и
процедура повторяется. После расчета компонент скорости (2), (3) и (4) и
температуры на последнем слое при β = β− проверяется условие обращения
в ноль давления |P (β− )| < ε2 . Если с заданной точностью это условие не
выполняется, координата выхода β− изменяется и расчет начинается с начала
β = β+ .
Разработанная математическая модель процесса позволяет производить
детальный анализ процесса, исследовать зависимость поля температур, поля
скоростей, энергосиловых характеристик, а также определять для данного
класса полимеров технологические режимы, близкие к критическим.
В качестве примера рассмотрим моделирование попадания раскаленной
частицы в область деформации. Одним из граничных условий при расчете процесса в области деформации является распределение температуры по
сечению входящего в зазор полимера: T = T (α, β) (α1 ≤ α ≤ α2 , β = β+ ).
Предположим, что некоторая часть полимера имеет температуру, превышающую среднюю температуру входящей массы. Если это превышение невелико
и раскаленная частица достаточно мала, то это локальное превышение температуры рассеется вследствие теплопроводности. Однако если превышение
значительно или частица имеет достаточно большие размеры, то в функции
диссипации уравнения теплопроводности начнет играть главную роль слагаемое, описывающее тепловыделение вследствие химической реакции, величина которого тем больше, чем больше температура. Это в свою очередь
приведет к еще большему выделению тепла, вследствие чего температура в
этом локальном участке будет лавинообразно нарастать, что в конечном итоге приведет к температурной неустойчивости — «тепловому взрыву». Целью
проведенных расчетов является, во-первых, выяснить качественную картину влияния температуры достаточно большой раскаленной частицы того же
материала на картину распределения температуры в обасти деформации;
во-вторых, оценить количественно влияние температуры раскаленной частицы на устойчивость процесса к «тепловому взрыву»; в-третьих, исследовать
влияние местонахождения раскаленной частицы на картину температурного
поля в области деформации.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
144
В. Б. Калинин, В. В. Литвинов
Реологические характеристики, а также зависимости коэфициентов от
температуры являются типичными для данного класса полимеров [5], а
кинетические и теплофизические характеристики взяты из работы [5]:
λ = 3 · 104 ккал/см.сек.град., Cv = 0.29 кал/г.град., E = 34000 кал/моль,
k0 = 6.35 · 1018 кал/см3 сек, R = 27.5 см., V1 = V2 = 23.0, 2h0 = 0.2, n1 = 0.003,
β+ = 0.7, µ0 = 1.78 кГ.сек/см2 , b = 0.03, n0 = 0.2. Расчеты проводились на
сетке размерностью 400 × 2000.
Расчеты по данному алгоритму показали, что при достаточном размере
крупной раскаленной частицы, занимающей четвертую часть по толщине от
входящей массы полимера, происходит самовозгорание, начиная с температуры 100◦ C. Проводились расчеты при температуре раскаленной частицы 100,
200, 300, 400, 500◦ C. Расчеты по данной методике согласуются для реальных
значений коэффициентов не только качественно, но и количественно. Причем
существенным оказались не только температуры раскаленной частицы, но и
ее местоположение. Так, расчет, проведенный при температуре раскаленной
частицы T = 100◦ C, которая находилась на поверхности валка, показал: в
данном случае лавинообразного нарастания температуры не происходит, что,
очевидно, объясняется оттоком тепла к более холодному валку.
Зависимость максимальных приростов температуры в области деформации от предэкспоненциального множителя при фиксированных остальных
параметрах показало, что K0 = 0.284 · 1015 ккал/см3 сек является критическим.
Литература
[1] Бекин Н. Г., Литвинов В. В., Петрушанский В. Ю. Течение аномально вязкой жидкости между двумя вращающимися цилиндрами // Изв.
АН СССР. Механика жидкости и газа. 1976. № 2. C. 18 – 24.
[2] Хапель Дж., Бреннер Г. Гидродинамика при малых числах Рейнольдса.
М.: Мир, 1976. С. 59 – 65.
[3] Бахвалов Н.С. Численные методы. М.: Наука, 1975. С. 552, 618.
[4] Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа. М.: Наука, 1976. С. 103 – 106.
[5] Гольдшлегер У. И., Барзыкин В. В., Ивлева Т. П. Зажигание конденсированных ВВ накаленной сферической частицы // Физика горения и
взрыва. 1973. Т. 9, № 5. С. 733 – 740.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 517.51+514.17
Геометрические неравенства
для интерполяционных проекторов
М. В. Невский
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: mnevsk@uniyar.ac.ru
Даётся обзор результатов, полученных автором, по полиномиальной интерполяции функций n переменных и смежным вопросам. В частности, приводятся оценки норм интерполяционных проекторов через геометрические характеристики
множеств, а также свойства осевых диаметров n-мерного симплекса.
Библиография: 17 названий.
1. Введение
В настоящей статье даётся обзор некоторых результатов автора, полученных большей частью в период с 2006 по 2010 гг. Эти результаты касаются полиномиальной интерполяции действительных функций n переменных и
смежных вопросов. Особое внимание уделяется оценкам норм интерполяционных проекторов через геометрические характеристики множеств. Основной является интерполяция с помощью многочленов степени ≤ 1, или линейная интерполяция. На базе оценок, полученных для линейных интерполяционных проекторов, оказывается возможным доказать оценки для проекторов
при интерполяции более общего вида.
Изложенные ниже результаты автора опубликованы в статьях
[1 – 5, 7 – 10] и представлены на шести международных научных конференциях. Поскольку число утверждений, цитируемых в обзоре, весьма
значительно, автор посчитал уместным использовать описательный стиль
изложения, не выделяя в тексте теоремы явным образом.
В обзор не включены полученные в тот же период результаты о константах, стоящих в неравенствах для эквивалентных норм алгебраических
многочленов (по этому поводу см. [6]).
145
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
146
М. В. Невский
Пусть n ∈ N, Qn := [0, 1]n , C(Qn ) — пространство непрерывных функций
f : Qn → R с нормой
kf kC(Qn ) := max |f (x)|.
x∈Qn
Ниже Π1 (Rn ) есть совокупность многочленов от n переменных общей степени
≤ 1. Для симплекса S ⊂ Rn через vol(S) обозначим его объём, чеpез σS —
pезультат гомотетии S относительно центpа тяжести с коэффициентом σ.
Если S является невырожденным, положим
ξ(S) := min {σ ≥ 1 : Qn ⊂ σS} .
Включение Qn ⊂ S эквивалентно равенству ξ(S) = 1. Введём в рассмотрение
величину ξn := min ξ(S).
S⊂Qn
(j)
(j)
Обозначим через x(j) = x1 , . . . , xn , j = 1, . . . , n + 1, вершины невырожденного n-мерного симплекса S. Пусть
 (1)

(1)
x1
. . . xn
1
 x(2) . . . x(2) 1 
n


A :=  1.

.
.
.
..
..
..
.. 

(n+1)
x1
(n+1)
. . . xn
1
и ∆ := det(A), тогда vol(S) = |∆|/n!. Обозначим через ∆j (x) опpеделитель, который получается из ∆ заменой j-й строки на строку
(x1 , . . . ,xn , 1). Многочлены λj (x) := ∆j (x)/∆ ∈ Π1 (Rn ) обладают свойством
λj x(k) = δjk . Их коэффициенты составляют столбцы A−1 . Для x ∈ Rn числа λj (x) являются барицентрическими координатами x относительно S.
Далее полагаем λj (x) = l1j x1 + . . . + lnj xn + ln+1,j .
Интерполяционный проектор P : C(Qn ) → Π1 (Rn ) по
набору уз
лов x(j) ∈ Qn определяется с помощью равенств P f x(j) = f x(j) ,
j = 1, . . . , n + 1. Аналогом интерполяционной формулы Лагранжа является представление
n+1
X
P f (x) =
f x(j) λj (x).
(1.1)
j=1
Из (1.1) следует, что норма P как оператора из C(Qn ) в C(Qn ) равна
kP k := max
x∈Qn
n+1
X
j=1
|λj (x)| =
max
x∈ver(Qn )
n+1
X
j=1
|λj (x)|.
(1.2)
Здесь и далее ver(Qn ) обозначает множество вершин Qn . Правое равенство
из (1.2) обосновано в [1]. Обозначим через θn минимальную величину kP k
при условии, что все соответствующие P узлы интерполяции принадлежат
Qn . Пpоектоp, ноpма котоpого pавна θn , назовём минимальным.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Геометрические неравенства для проекторов
147
Запись L(n) ≈ M (n) в дальнейшем означает, что существуют положительные c1 , c2 , не зависящие от n, такие, что c1 L(n) ≤ M (n) ≤ c2 L(n). Натуральное k назовём адамаровым (или числом Адамара), если существует
матрица Адамара порядка k.
2. Соотношения для θn и ξn
Пусть P : C(Qn ) → Π1 (Rn ) — интерполяционный проектор, S ⊂ Qn —
симплекс с вершинами в его узлах. Для 1 ≤ µ ≤ n точку x ∈ ver(Qn ) будем называть
µ-веpшиной Qn относительно S, если выполняется pавенство
P
kP k =
|λj (x)| и сpеди чисел λj (x) имеется pовно µ отpицательных. В [5]
доказано, что
1
1
n+1
1+
(kP k − 1) + 1 ≤ ξ(S) ≤
(kP k − 1) + 1.
(2.1)
2
n
2
Правое неравенство в (2.1) обращается в равенство тогда и только тогда,
когда существует 1-вершина Qn относительно S (см. [8, 9]).
Из (2.1) следует, что для любого n
1
1
n+1
(θn − 1) + 1.
(2.2)
1+
(θn − 1) + 1 ≤ ξn ≤
2
n
2
Если норма проектора P удовлетворяет соотношению
ξn =
n+1
(kP k − 1) + 1,
2
то P является минимальным.
Хотя бы для некоторых n (например, для n = 1, 2, 3, 7) правое неравенство в (2.2) обращается в равенство. При любом таком n величина ξ(S) принимает своё минимальное значение ξn на симплексе с вершинами в узлах
минимального проектора. Как доказано в [8], строгое неравенство справа в
(2.2) выполняется по крайней мере для n ≥ 57. Вопрос о точной границе
таких n остаётся открытым.
Известные
автору точные значения θn исчерпываются величинами
√
√ θ1 = 1,
θ2 = 2 5/5 + 1, θ3 = 2, θ7 = 5/2. Им соответствуют ξ1 = 1, ξ2 = 3 5/5 + 1,
ξ3 = 3, ξ7 = 7.
Полное описание минимальных проекторов P и соответствующих симплексов S для n = 1, 2, 3 дано в [2]; оно состоит в следующем. Два симплекса
будем называть эквивалентными, если они являются подобными с коэффициентом 1.
В одномерном случае S = [0, 1].
Если n = 2, то S эквивалентен
симплексу с вершинами (1, τ ),
√ (τ, 1), (0, 0). Здесь τ = 3 − 5 /2 есть минимальный корень уравнения
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
148
М. В. Невский
t2 − 3t + 1 = 0. Число τ связано с золотым сечением отрезка [0, 1], так
как τ /(1 − τ ) = (1 − τ )/1. Норма соответствующего проектора P равна
θ2 = 1.8944 . . . , а для симплекса S верно ξ(S) = ξ2 = 2.3416 . . . Интересно, что
равенства kP k = θ2 и ξ(S) = ξ2 дают новые характеризации классического
золотого сечения.
В трёхмерной ситуации любой S с условием ξ(S) = ξ3 = 3 эквивалентен
одному из двух симплексов: правильному тетраэдру с вершинами (0, 1, 1),
(1, 0, 1), (1, 1, 0), (0, 0, 0) или тетраэдру с вершинами (0, 1/2, 1), (1, 1/2, 1),
(1/2, 1, 0), (1/2, 0, 0). Для каждого из них kP k = θ3 = 2.
В [8] показано, что если n+1 — число Адамара, то ξn = n. В этом случае в
Qn можно вписать правильный симплекс так, что вершины симплекса будут
находиться в вершинах куба. Для любого такого S верно ξ(S) = ξn = n.
При n = 7 соответствующий проектор является минимальным, его норма
равна θ7 = 5/2. В настоящий момент автор не располагает доказательством
того, что аналогичный проектор минимален для любого n > 7, если n + 1 —
адамарово.
Оценкам чисел θn и ξn для n ∈ N посвящены работы [2, 3, 8]. В [2,3] доказано, что
√
√
n−1
4 e√
1
−1
n+2+1 .
(2.3)
≤ θn ≤ min n + 1,
< Ψn
e
vn
3
Здесь
1 2
n (n)
(t
−
1)
2n n!
— стандаpтизованный многочлен Лежандpа степени n, vn — максимальный
объём n-мерного симплекса, принадлежащего Qn .
Известно, что Ψn (1) = 1, Ψn (t) монотонно возpастает пpи t > 1; эти факты следуют и из (2.4). Чеpез Ψ−1
n обозначена функция, обpатная к Ψn на
полуоси [1, ∞). Наличие Ψ−1
в
нижней
оценке для θn связано со следующим
n
утверждением, установленным в [1] (оно интересно и само по себе). Для u ≥ 1
положим
(
)
n
n
X
X
En,u := x ∈ Rn : |1 −
xi | +
|xi | ≤ u ,
Ψn (t) :=
i=1
тогда
i=1
n 2
1 X n
Ψn (u)
mesn (En,u ) = n
(u − 1)n−i (u + 1)i =
.
2 n! i=0 i
n!
(2.4)
3 (n + 1)(n+1)/2
(n + 1)(n+1)/2
·
<
v
≤
.
n
4
2n n!
2n n!
(2.5)
Как следует из (2.3), веpхние гpаницы для vn позволяют получить оценки
чисел θn снизу. Для доказательства точных по поpядку веpхних оценок θn в
[3] пpименялись неpавенства
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Геометрические неравенства для проекторов
149
Равенство справа имеет место тогда и только тогда, когда число
n + 1 — адамарово. Правая оценка в (2.5) принадлежит Адамару
(J. Hadamard, 1893); левое неравенство доказано Клементсом и Линдстрёмом
(G. F. Clements, B. Lindström, 1965) (см. [14]).
Для некоторых n неравенства (2.3) могут быть уточнены. Именно, если n — чётное,
то θn > n/e. Если n > 1 таково, что n ≡ 1(mod 4), то
√
θn > n/(e n − 1). Правая оценка из (2.3) допускает уточнение для n ≤ 7
и тех n > 1,√пpи которых число n + 1 является адамаровым; в последнем
случае θn ≤ n + 1. Из доказанных автором оценок простого вида, справедливых при любом n, отметим двойное неравенство
√
1√
n < θn < 3 n.
4
(2.6)
Некоторые более точные оценки чисел θn для n ≤ 20 приведены в статье автора и Хлестковой [7]. Они были получены с помощью компьютера
при рассмотрении проекторов, соответствующих симплексам максимального
объёма в Qn .
Для чисел ξn в [8] получена двусторонняя оценка
n ≤ ξn ≤ n + 2.
(2.7)
Оценка сверху может быть несколько улучшена; в частности, справедливо
ξn < n + 1 (последний результат не опубликован).
Неравенства (2.6), (2.7) устанавливают точный порядок роста величин θn
и ξn по n. Именно, имеют место соотношения
θn ≈ n1/2 ,
ξn ≈ n.
(2.8)
Вопрос о наилучших константах в неравенствах, составляющих (2.8), остаётся открытым (за исключением неравенства ξn ≥ n с точной константой 1
в правой части).
3. Норма ортогонального проектора и θn
R
Введём в C(Qn ) скалярное произведение (f, g) := Qn f (x)g(x) dx. Обозначим через H ортогональный проектор из C(Qn ) на Π1 (Rn ). В [4] доказано,
что норма H как оператора из C(Qn ) в C(Qn ) равна
Z X
n
3n + 1 (3.1)
kHk = 6 xi −
dx.
6 Qn
i=1
С помощью (3.1) нетpудно найти пеpвые значения kHk. Если n = 1, то
kHk = 5/3 = 1.66(6). Если n = 2, то kHk = 233/108 = 2.157(407). Значение
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
150
М. В. Невский
kHk для n = 3, pавное 1795/648 = 2.770 . . . , пpоще вычисляется с пpименением пpиводимой ниже формулы (3.6). Как видно, для n = 1, 2, 3 выполняется
неравенство θn < kHk.
Из (3.1)
и неpавенства Коши следует, что для любого n веpно
√
kHk ≤ 3n + 1. Вместе с тем оказывается, что kHk ≥ Cn1/2 . Последнее
неравенство доказано в [4] двумя способами: с помощью эйлеровых чисел и
с помощью центральных B-сплайнов. Коротко опишем эти методы.
Пусть k — натуpальное, k ≤ n. Эйлеровым числом An,k называется количество перестановок порядка n, имеющих ровно k − 1 снижений, то есть
инверсий соседних компонент перестановки. К введению этих чисел имеются
и дpугие интересные подходы (см. [12, 13]).
Отметим важные для нас комбинаторные и геометрические свойства эйлеровых чисел. Для k = 1, . . . , n положим
(
)
n
X
Tn,k := x ∈ Qn : k − 1 ≤
xi ≤ k .
i=1
Справедливы формулы:
An,k
n+1
=
(k − j)n ,
(−1)
j
j=0
k−1
X
j
vol(Tn,k ) =
n
X
An,k
,
n!
An,k = n!,
(3.2)
(3.3)
(3.4)
k=1
An,k = (n − k + 1)An−1,k−1 + kAn−1,k .
(3.5)
Равенство (3.2) получено в [12]. Как отмечено в [13], соотношение (3.3)
установлено Лапласом (M. de Laplace, 1886); короткое доказательство принадлежит Стенли (R. P. Stanley, 1977). В связи с установлением некотоpых
свойств B-сплайнов геометpические постpоения, ведущие к (3.3), pассматpивались также Соммеpфельдом (A. Sommerfeld, 1904), см. [11]. Равенство (3.4)
следует
P из исходного определения An,k через перестановки или из (3.3), так
как k vol(Tn,k ) = vol(Qn ) = 1. Для эффективного вычисления эйлеpовых
чисел может использоваться pекуррентное соотношение (3.5); пpи k > n надо взять An,k = 0.
Теперь приведём свойства этих чисел, доказанные в [4]. Для u ∈ R определим
(
)
n
X
Gn,u := x ∈ Qn :
xi = u , s(n, u) := mesn−1 (Gn,u ).
i=1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
151
Геометрические неравенства для проекторов
Если j = 1, . . . , n − 1, то верно равенство s(n, j) =
m = [n/2]. Для n = 2m положим
Yn :=
m
X
√
nAn−1,j /(n − 1)!. Пусть
jAn,m+j .
j=1
Если же n = 2m + 1, то обозначим
m+1
X
1
1
An,m+j .
j−
Yn := An,m+1 +
4
2
j=2
Тогда существует не зависящее от n число γ ≥ 2, для которого
√
n
1
An,m+1
Yn
> √ ,
>
.
n!
n!
12γ
γ n
Кроме того, верно kHk ≥ 12Yn /n! − 7. Поэтому kHk ≥ C · n1/2 .
Пусть
n
Z∞ 2
sin u
cos(2tu) du
Bn (t) :=
π
u
0
— так называемый центральный B-сплайн порядка n. Это чётная
кусочно-полиномиальная функция степени n − 1, принадлежащая
C n−2 (R). Носитель Bn есть (−n/2,
R n/2), причём для |t| < n/2 выполняется Bn (t) > 0. Справедливо R Bn (t) dt = 1. Для приложений могут
использоваться равенства (в первом из них 00+ := 1/2):
n
n−1
X
n
1
k n
t+ −k
Bn (t) =
(−1)
;
(n − 1)! k=0
k
2
+
[n/2−|t|]
n−1
X
n
1
k n
(−1)
− |t| − k
Bn (t) =
,
k
(n − 1)! k=0
2
|t| ≤
n
.
2
Свойства и история B-сплайнов приводятся в [11]. Там отмечено, что первым, кто выявил связь B-сплайнов с сечениями n-мерного куба, был Соммерфельд (A. Sommerfeld, 1904). Им установлены соотношения
r
s(n, t + n/2)
6
2
√
· e−6t /n .
Bn (t) =
, Bn (t) ∼
=
πn
n
Запись an ∼
= bn означает, что lim an /bn = 1.
n→∞
Автор показал, что для любого n
Zn/2 t −
kHk = 6
−n/2
Z∞ 1 t −
Bn (t) dt = 6
6
−∞
1 Bn (t) dt.
6
(3.6)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
152
М. В. Невский
Пусть
Jn :=
Z∞
tBn (t) dt.
0
С применением свойств B-сплайнов в [4] доказано, что Jn ≥ C1 n1/2 и
kHk ≥ 12Jn − 1. Отсюда имеем, как и выше, kHk ≥ const · n1/2 .
Таким образом, верно соотношение kHk ≈ n1/2 . Привлекая (2.8), получаем, что ноpмы ортогонального и минимального интеpполяционного пpоектоpов эквивалентны. Другими словами, существуют C2 , C3 > 0, не зависящие от n, со следующим свойством. Найдётся такой набоp узлов, пpинадлежащих Qn , что для соответствующего интеpполяционного пpоектоpа P и
оpтогонального пpоектоpа H
C2 kP k ≤ kHk ≤ C3 kP k.
Как отмечено в [3], в качестве подходящих узлов можно взять вершины симплекса максимального объёма в Qn . Для интерполяционного проектора P по
этим узлам выполняется kP k ≈ n1/2 .
Точные константы из неравенств, составляющих эквивалентности
kHk ≈ n1/2 и kHk ≈ θn , автору не известны.
4. Свойства осевых диаметров симплекса
Пусть S — невырожденный симплекс в Rn . Через di (S) обозначим максимальную длину отрезка, содержащегося в S и параллельного оси xi . Величину di (S) будем называть i-м осевым диаметром S. Термин осевой, или
аксиальный, диаметр (axial diameter) для выпуклых тел был введён Скоттом
[16, 17]. Положим
d(S) := max di (S).
1≤i≤n
В [9] автором были доказаны следующие утверждения. Для любого
i = 1, . . . , n
n+1
1
1X
|lij |
(4.1)
=
di (S)
2 j=1
(по поводу определения lij см. п. 1). В симплексе S существует ровно один
отрезок длины di (S), параллельный оси xi . Середина этого отрезка совпадает
n+1
P
mij x(j) , где
с точкой
j=1
mij :=
|lij |
.
n+1
P
|lik |
k=1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Геометрические неравенства для проекторов
153
Рассматриваемый отрезок располагается в S таким образом, что каждая
(n − 1)-мерная грань S содержит по крайней мере один из его концов. Сумма размерностей двух минимальных по включению граней S, содержащих
концы этого отрезка, не превосходит n − 1. Справедливо соотношение
n
X
i=1
1
≤ ξ(S).
di (S)
(4.2)
Если Qn 6⊂ S, то равенство в (4.2) имеет место тогда и только тогда, когда
max (−λ1 (x)) = . . . =
x∈ver(Qn )
max (−λn+1 (x)) .
x∈ver(Qn )
(4.3)
Автору удалось показать, что левая часть (4.2) равна минимальному
σ > 0, для которого результат некоторого параллельного переноса симплекса σS содержит Qn . Доказательство последнего утверждения предполагается
изложить в отдельной статье.
Сформулиpованные свойства осевых диаметров симплекса имеют интересные пpиложения. Например, из (4.2) легко следует, что если Qn ⊂ S, то
d(S) ≥ n. Это означает, что в случае Qn ⊂ S для некоторого i симплекс
S содержит отрезок длины n, параллельный оси xi . С помощью указанных
свойств могут быть легко установлены некоторые утверждения, полученные
ранее различными авторами (см. [9]). В качестве примера отметим следующий результат Лассака [15]: если S — симплекс максимального объёма в Qn ,
то d1 (S) = . . . = dn (S) = 1.
В заключение этого пункта приведём следствие соотношений (4.2) и (2.1).
Пусть P : C(Qn ) → Π1 (Rn ) — интерполяционный проектор и S — симплекс с
вершинами в его узлах. Тогда верно неравенство
n
X
i=1
1
n+1
≤
(kP k − 1) + 1.
di (S)
2
(4.4)
Равенство в (4.4) имеет место тогда и только тогда, когда существует 1-вершина Qn относительно S и выполняется (4.3).
5. Интерполяция общего вида
Пусть Ω — замкнутое ограниченное подмножество Rn , C(Ω) — пространство непрерывных функций f : Ω → R с нормой
kf kC(Ω) := max |f (x)|.
x∈Ω
Зафиксируем натуральное d ≥ n + 1. Пусть ϕ1 (x), . . . , ϕd (x) — линейно
независимые функции, представляющие собой мономы. Предположим, что
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
154
М. В. Невский
ϕ1 (x) ≡ 1, ϕ2 (x) = x1 , ϕn+1 (x) = xn . Положим Π := lin(ϕ1 , . . . , ϕd ). Отметим варианты Π = Πk (Rn ) — пространство многочленов общей степени ≤ k
(k ∈ N) и Π = Πα (Rn ) — пространство многочленов степени ≤ αi по xi
(α ∈ Nn ).
Набор узлов x(1) , . . . , x(d) ∈ Ω является допустимым для интерполяции
функций из C(Ω) с помощью многочленов из Π, если (d × d)-матрица


ϕ1 x(1) ϕ2 x(1) . . . ϕd x(1)






..
..
..
..


.
.
.
.




(d)
(d)
(d)
ϕ1 x
ϕ2 x
. . . ϕd x
является невырожденной. Пусть P : C(Ω) → Π — интерполяционный проектор по допустимому набору узлов, kP kΩ — норма P как оператора из C(Ω)
в C(Ω) (для согласования с предыдущим считаем kP k := kP kQn ). Введём в
рассмотрение отображение F : Rn → Rd−1 , определяемое равенством
y = F (x) := (ϕ2 (x), . . . , ϕd (x)) = (x1 , . . . , xn , ϕn+1 (x), . . . , ϕd (x)).
Пусть S — (d − 1)-мерный симплекс с вершинами y (j) := F x(j) . Для невырожденного (d − 1)-мерного параллелепипеда D, рёбра которого задаются
линейно независимыми векторами w1 , . . . , wd−1 , через ai (D) обозначим длину wi . Под δiD (U ) понимается максимальная длина отрезка, принадлежащего
множеству U ⊂ Rd−1 и параллельного wi . Ниже считаем U := conv(T (Ω)).
С помощью результатов работы [5] в статье [10] доказано, что для любого интерполяционного проектора P : C(Ω) → Π и любого невырожденного
параллелепипеда D ⊂ U
d−1
X
ai (D)
d
≤ (kP kΩ − 1) + 1.
D
2
δ (S)
i=1 i
(5.1)
Если Ω = Qn , Π = Π1 (Rn ) , то d = n + 1, F (x) = x и U = Qn . Взяв в (5.1)
D = Qn , получим ai (D) = 1, δiD (S) = di (S). Поэтому в этой ситуации (5.1)
совпадает с (4.4).
В заключение приведём оценку для минимальной нормы интерполяционного проектора из C(Ω) на Π при условии, что все узлы интерполяции
принадлежат Ω. Обозначим эту величину через θn (Π; Ω); для согласования с
предыдущим считаем θn := θn (Π1 (Rn ) ; Qn ) . В [10] установлено, что
d−1
X
ai (D)
d
max
≤ (θn (Π; Ω) − 1) + 1.
D
D⊂U
2
δ (U )
i=1 i
(5.2)
Максимум в левой части (5.2) взят по совокупности невырожденных (d − 1)мерных параллелепипедов D ⊂ U.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Геометрические неравенства для проекторов
155
Литература
[1] Невский М. B. Оценки для минимальной нормы проектора при линейной интерполяции по вершинам n-мерного куба // Моделирование и
анализ инфоpмационных систем. 2003. Т. 10, № 1. C. 9 – 19.
[2] Невский М. B. Геометрические методы в задаче о минимальном проекторе // Моделирование и анализ инфоpмационных систем. 2006. Т. 13,
№ 2. C. 16 – 29.
[3] Невский М. B. Минимальные проекторы и максимальные симплексы
// Моделирование и анализ инфоpмационных систем. 2007. Т. 14, № 1.
C. 3 – 10.
[4] Невский М. B. Ортогональное проектирование и минимальная линейная интерполяция на n-мерном кубе // Моделирование и анализ инфоpмационных систем. 2007. Т. 14, № 3. C. 8 – 28.
[5] Невский М. B. Неравенства для норм интерполяционных проекторов //
Моделирование и анализ инфоpмационных систем. 2008. Т. 15, № 3.
C. 28 – 37.
[6] Невский М. B. О константах эквивалентности для некоторых норм на
пространствах алгебраических многочленов // Моделирование и анализ инфоpмационных систем. 2008. Т. 15, № 4. C. 65 – 80.
[7] Невский М. B. К вопросу о минимальной линейной интерполяции //
Современные проблемы математики и информатики. Вып. 9. ЯрГУ:
Ярославль, 2008. С. 31 – 37.
[8] Невский М. B. Об одном соотношении для минимальной нормы интерполяционного проектора // Моделирование и анализ инфоpмационных
систем. 2009. Т. 16, № 1. C. 24 – 43.
[9] Невский М. B. Об одном свойстве n-мерного симплекса // Мат. заметки.
2010. Т. 87, № 4. C. 580 – 593.
[10] Невский М. B. Геометрические оценки в полиномиальной интерполяции // Моделирование и анализ инфоpмационных систем. 2011. Т. 18,
№ 1. C. 21 – 27.
[11] Butzer P. L., Schmidt M., Stark E. L. Observations on the history of
central B-splines // Archive for History of Exact Sciences. 1988. V. 39, № 2.
P. 137 – 156.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
156
М. В. Невский
[12] Comtet L. Permutations by number of rises; Eulerian numbers // Advanced
Combinatorics: The Art of Finite and Infinite Expansions. Dordrecht,
Netherlands: Reidel. 1974. P. 51, 240 – 246.
[13] Ehrenborg R., Readdy M., Steingrimsson E. Mixed volumes and slices
of the cube // Journal of Combinatorial Theory. Series A. 1998. V. 81.
P. 121 – 126.
[14] Hudelson M., Klee V., Larman D. Largest j-simplices in d-cubes: some
relatives of the Hadamard maximum determinant problem // Linear
Algebra Appl. 1996. V. 241 – 243. P. 519 – 598.
[15] Lassak M. Parallelotopes of maximum volume in a simplex // Discrete
Comput. Geom. 1999. V. 21. P. 449 – 462.
[16] Scott P. R. Lattices and convex sets in space // Quart. J. Math. Oxford.
1985. V. 36, № 2. P. 359 – 362.
[17] Scott, P. R. Properties of axial diameters // Bull. Austral. Math. Soc. 1989.
V. 39. P. 329 – 333.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 517.5
О некоторых свойствах
интерполяционных сплайнов
Н. А. Стрелков
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: strelkov@uniyar.ac.ru
Основное внимание уделяется получению шкалы неравенств
с точными константами для интерполяционных сплайнов произвольного порядка. Приводится также полное описание множеств суперсходимости для этих сплайнов. Попутно установлены некоторые свойства интерполяционных сплайнов, представляющие самостоятельный интерес.
Библиография: 7 названий.
1. Обозначения и определения
Пусть Rh — равномерная сетка на действительной прямой R, состоящая
из узлов xk = kh, k ∈ Z. В дальнейшем (там, где это не может привести
к недоразумениям) одно и то же обозначение f будет использоваться как
для последовательности {fk }k∈Z , так и для такой функции f ∈ C(R), что
f (xk ) = fk для всех k ∈ Z (из контекста всегда будет понятно, о чем именно
идет речь).
Пусть n ∈ Z+ = {n ∈ Z : n ≥ 0} и Sn (x) = Sn (x, f, Rh ) — интерполяционный сплайн порядка n (для f ), определяемый следующими условиями:
1) если k ∈ Z, то на каждом из интервалов (kh+(n−1)h/2, kh+(n+1)h/2)
сплайн Sn — алгебраический полином степени n;
2) Sn (kh) = fk для всех k ∈ Z;
3) Sn ∈ C n−1 (R).
Конечно, если n = 0, то последнее из этих трех условий отсутствует.
157
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
158
Н. А. Стрелков
Замечание 1.1.Сразу отметим, что на протяжении всей работы мы не будем
заботиться о поведении кусочно-полиномиальных функций на границах областей полиномиальности; значения на этих границах либо доопределяются
по непрерывности (если это возможно), либо вовсе не определены (например,
сплайны S0 не определены в точках (k + 1/2)h, k ∈ Z).
Нетрудно показать (см., например, [1], гл. 3, § 1), что если n ≥ 2, то для
любой последовательности f существует бесконечно много интерполяционных сплайнов n-го порядка. Однако если разности порядка n от f ограничены, то существует единственный интерполяционный сплайн Sn (x, f, Rh ),
имеющий ограниченную n-ю производную (см. [1], теорема 3.2.1).
Среди всех таких сплайнов особое место занимают B-сплайн Mn (x/h) и
фундаментальный сплайн sn (x/h), где Mn и sn — кусочно-полиномиальные
функции класса C n−1 (R) с ограниченными n-ми производными, причем на
каждом из интервалов (k + (n − 1)/2, k + (n + 1)/2) (k ∈ Z) обе эти функции — алгебраические полиномы степени n. Каждая из этих двух функций
однозначно определяется следующими условиями:
Z
suppMn = [−(n + 1)/2, (n + 1)/2],
Mn (x)dx = 1;
R
sn (k) =
δk0
=
1, k = 0,
0, k =
6 0
для всех k ∈ Z.
Что касается функции Mn , то будет использоваться следующее представление B-сплайна, использующее усеченную степенную функцию (см., например, [1]):
1
Mn (x) = ∆n+1 (x − (n + 1)/2)n+ ,
(1.1)
n!
где
s
t , если t > 0,
s
t+ =
0, если t < 0,
∆g(x) = g(x + 1) − g(x).
На протяжении всей работы для целой и дробной частей действительного
числа x будут использоваться стандартные обозначения
[x] = max{m ∈ Z : m ≤ x}, {x} = x − [x];
кроме того, символом dn будет обозначаться величина
dn = (n + 1)/2 − [(n + 1)/2],
т. е. dn равно 1/2 или 0 в зависимости от четности или нечетности n.
(1.2)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О некоторых свойствах интерполяционных сплайнов
159
Докажем утверждение, устанавливающее связь между базисными сплайнами Mn и многочленами Qn , имеющими следующий вид:
n
k
1 X kX
j n+1
Qn (x, z) =
(x + k − j)n .
z
(−1)
n! k=0 j=0
j
Лемма 1.1. Если 0 < x < 1, то
X
z k Mn (x − (n + 1)/2 + k) = Qn (x, z)
(1.3)
(1.4)
k∈Z
для всех z.
Доказательство. Используя (1.1), получаем, что
X
k∈Z
z k Mn (x − (n + 1)/2 + k) =
1 X k n+1
z ∆ (x + k − n − 1)n+ =
n! k∈Z
n+1
1 X kX
j n+1
=
(x + k − j)n+ =
z
(−1)
n! k∈Z j=0
j
n
k
1 X kX
j n+1
(x + k − j)n = Qn (x, z).
z
(−1)
=
n! k=0 j=0
j
При доказательстве были приняты во внимание следующие обстоятельства:
1) если k < j, то (x + k − j)n+ = 0;
2) если k > n, то
n+1
X
(−1)
j=0
j
n+1
(x + k − j)n+ = ∆n+1 (x + k − n − 1)n = 0.
j
Лемма доказана.
Замечание 1.2. Нетрудно показать, что если n ≥ 1, то (1.4) справедливо для
всех x ∈ [0, 1] (например, достаточно привлечь соображения непрерывности).
Полагая в (1.4) x = 1 − dn (см. замечание 1.2), получаем, что
X
z k Mn (1 − dn − (n + 1)/2 + k) = Qn (1 − dn , z).
k∈Z
Если теперь учесть соотношение dn = [n/2] − (n − 1)/2 и выполнить замену переменной суммирования j = k − [n/2], то последнее равенство примет
следующий вид:
X
z j+[n/2] Mn (j) = Qn (1 − dn , z).
j∈Z
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
160
Н. А. Стрелков
Поэтому если определить полином Pn равенством
Pn (z) = Qn (1 − dn , z),
где Qn имеет вид (1.3), то
X
z j Mn (j) = z −[n/2] Pn (z).
(1.5)
(1.6)
j∈Z
Нетрудно убедиться в том, что степень полинома Pn равна 2[n/2]. Действительно, равенство нулю коэффициента при z n для нечетных n следует из
того, что этот коэффициент (для n = 2m + 1) имеет следующий вид:
2m+1
X
1
1
j 2m + 2
(2m + 2 − j)2m+1 =
(−1)
∆2m+2 g(0) = 0,
j
(2m + 1)! j=0
(2m + 1)!
где g(x) = x2m+1 . Поэтому (см. (1.3), (1.5))
2[n/2]
k
1 X kX
j n+1
(1 − dn + k − j)n .
z
(−1)
Pn (z) =
j
n! k=0
j=0
(1.7)
Очевидно, что P0 (z) = P1 (z) = 1. Если же n ≥ 2, то в §2 главы III монографии
[1] показано, что все корни многочлена Pn отрицательны и различны, причем
интервалу (−1, 0) принадлежат ровно [n/2] из этих корней z1 , . . . , z[n/2] , в то
время как остальные корни лежат на (−∞, −1) и имеют вид 1/z1 , . . . , 1/z[n/2] .
Кроме того, в дальнейшем будут использоваться функции
∞
1 X
Gn (x, z) =
(x + k)n z k ,
n! k=0
(1.8)
связанные с многочленами Qn равенством
Qn (x, z) = (1 − z)n+1 Gn (x, z), |z| < 1.
(1.9)
Последнее соотношение проще всего доказать следующим образом: в правой
части (1.9) разложить (1 − z)n+1 по степеням z, перемножить возникающие
ряды по правилу Коши и учесть то обстоятельство, что разность порядка
n + 1 от многочлена степени n равна нулю.
Установим еще одно свойство многочленов Qn .
Лемма 1.2. Для всех x, z ∈ R выполняется равенство
1
z n Qn (x, ) = Qn (1 − x, z).
z
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О некоторых свойствах интерполяционных сплайнов
161
Доказательство. Из (1.3) следует, что
n
k
1 X n−k X
1
j n+1
z
(−1)
(x + k − j)n =
z Qn (x, ) =
z
n! k=0
j
j=0
n
n−i
1 X iX
n+1
j
=
(x + n − i − j)n =
z
(−1)
n+1−j
n! i=0 j=0
n
n+1
1 X i X
s n+1
=−
(1 − x + i − s)n .
z
(−1)
n! i=0 s=i+1
s
n
Поэтому
n
n+1
1
1 X iX
s n+1
Qn (1 − x, z) − z Qn (x, ) =
(1 − x + i − s)n = 0,
z
(−1)
z
n! i=0 s=0
s
n
поскольку внутренняя сумма есть разность порядка n+1 от полинома степени
n. Лемма доказана.
Перейдем к получению представлений для фундаментальных сплайнов
sn . Если
X (n)
sn (x) =
ak Mn (x − k)
(1.10)
k∈Z
— разложение фундаментального сплайна по базисным, то образы Фурье sbn
cn сплайнов sn и Mn связаны соотношением
иM
cn (ξ)Ψ(ξ),
sbn (ξ) = M
где 2π-периодическая функция Ψ определена равенством
X (n)
Ψ(ξ) =
ak e−ikξ .
k∈Z
Условие sn (j) = δj0 для всех j ∈ Z приобретает вид
Z
1
sbn (ξ)eijξ dξ = δj0 , j ∈ Z,
2π R
или, что то же самое,
Z π
X
1
eijξ
sbn (ξ + 2πp)dξ = δj0 , j ∈ Z.
2π −π
p∈Z
Поэтому
X
p∈Z
sbn (ξ + 2πp) = 1.
(1.11)
(1.12)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
162
Н. А. Стрелков
Используя представление (1.11) и учитывая 2π-периодичность функции Ψ,
из последнего тождества получаем, что
)−1
(
X
cn (ξ + 2πp)
.
M
Ψ(ξ) =
p∈Z
Если применить формулу суммирования Пуассона (см., например, [2]) и равенство (1.6), то
X
X
cn (ξ + 2πp) =
M
Mn (p)e−ipξ = ei[n/2]ξ Pn (e−iξ ),
p∈Z
p∈Z
откуда
Ψ(ξ) =
e−i[n/2]ξ
.
Pn (e−iξ )
Поскольку Pn (z) 6= 0 на окружности |z| = 1, то функция 1/Pn (z) аналитична в некотором кольце, содержащем эту окружность. Следовательно, в
этом кольце ее можно разложить в ряд Лорана
X
1
=
αk z k ,
Pn (z) k∈Z
где
1
αk =
2πi
Поэтому
Z
dz
k+1 P (z)
n
|z|=1 z
.
X
−1 X
Ψ(ξ) = ei[n/2]ξ Pn (e−iξ )
=
αk e−i(k+[n/2])ξ =
αk−[n/2] e−ikξ ,
k∈Z
k∈Z
то есть (см. (1.12))
(n)
ak
= αk−[n/2]
1
=
2πi
Z
|z|=1
z [n/2]−k−1 dz
.
Pn (z)
(1.13)
Используя очевидную четность сплайнов Mn и sn , легко установить, что
(n)
(n)
ak = a−k для всех k ∈ Z; поэтому из (1.13) сразу следует, что
Z
1
z [n/2]+k−1 dz
(n)
ak =
, k ∈ Z.
(1.14)
2πi |z|=1
Pn (z)
В дальнейшем в зависимости от ситуации удобно будет использовать оба
представления (1.13) и (1.14). В частности, если воспользоваться равенством
(1.13) для k < 0 и равенством (1.14) для k ≥ 0, то
Z
z [n/2]+|k|−1 dz
1
(n)
, k ∈ Z.
(1.15)
ak =
2πi |z|=1
Pn (z)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О некоторых свойствах интерполяционных сплайнов
163
Вычисляя интеграл в правой части (1.15) с помощью теоремы о вычетах,
(n)
получаем, что коэффициенты ak в разложении (1.10) имеют следующий
вид:
(0)
(1)
1) ak = ak = δk0 для всех k ∈ Z; другими словами, если n = 0 или n = 1,
то sn (x) = Mn (x);
2) если n ≥ 2, то
[n/2]
(n)
ak
=
X zr[n/2]−1+|k|
,
′ (z )
P
r
n
r=1
где z1 , . . . , z[n/2] — различные нули полинома Pn вида (1.7), принадлежащие
интервалу (−1, 0). Отметим, что точно такое же представление коэффици(n)
ентов ak следует из равенств (3.2.25) и (3.2.28) монографии [1], где использовался совершенно другой подход, связанный с нахождением ограниченных
решений специальных разностных уравнений.
Докажем утверждение, описывающее поведение фундаментальных
сплайнов sn в терминах полиномов Qn вида (1.3). Удобно ввести обозначение
Rn (z) = zPn (z),
(1.16)
где многочлен Pn определен равенством (1.7). Тогда Rn — алгебраический
полином степени 2[n/2] + 1, нули которого zr (r = −[n/2], . . . , [n/2]) таковы,
что z0 = 0, z−r = 1/zr для всех r = 1, . . . , [n/2], где z1 , . . . , z[n/2] — различные
нули многочлена Pn , принадлежащие интервалу (−1, 0).
Лемма 1.3. Имеет место равенство
[n/2]
sn (x) =
X zr[|x|+dn ] Qn (1 − {|x| + dn }, zr )
, x ∈ R,
′ (z )
R
r
n
r=0
где [t] и {t} — соответственно целая и дробная части t ∈ R.
(1.17)
Доказательство. Используя очевидную четность сплайнов sn и Mn , из (1.10)
и (1.14) получаем, что
sn (x) = sn (|x|) =
X
k∈Z
(n)
ak Mn (|x| − k) =
где
(n)
ak
1
=
2πi
Z
|z|=1
X
k∈Z
(n)
ak Mn (k − |x|),
z [n/2]+k−1 dz
.
Pn (z)
Нетрудно убедиться в том, что
k − |x| = 1 − {|x| + dn } − (n + 1)/2 + k + [n/2] − [|x| + dn ].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
164
Н. А. Стрелков
Поэтому с помощью леммы 1.1 получаем, что
X (n)
sn (x) =
ak Mn (1 − {|x| + dn } − (n + 1)/2 + k + [n/2] − [|x| + dn ]) =
=
X
k∈Z
k∈Z
(n)
ak−[n/2]+[|x|+dn ] Mn (1
− {|x| + dn } − (n + 1)/2 + k) =
X 1 Z
z k+[|x|+dn ]−1 dz
Mn (1 − {|x| + dn } − (n + 1)/2 + k) =
=
2πi |z|=1
Pn (z)
k∈Z
Z
z [|x|+dn ] Qn (1 − {|x| + dn }, z)dz
1
.
=
2πi |z|=1
zPn (z)
Осталось проинтегрировать по окружности |z| = 1 рациональную функцию,
знаменателем которой является полином zPn (z) = Rn (z), имеющий в круге
|z| < 1 простые нули z0 , . . . , z[n/2] . Применяя теорему о вычетах, получаем
равенство (1.17). Лемма доказана.
Замечание 1.3. Из (1.17) сразу следует существование таких констант C > 0
и q ∈ (0, 1) (зависящих только от n), что для любого m = 0, . . . , n и для всех
x ∈ R справедливо неравенство
|x|
|s(m)
n (x)| ≤ Cq ;
при этом скорость убывания фундаментальных сплайнов при n ≥ 2 характеризуется величиной
q = max |zr |.
1≤r≤[n/2]
В заключение этого параграфа отметим, что если разности порядка n от f
ограничены, то единственный интерполяционный сплайн Sn (x) = Sn (x, f, Rh )
с ограниченной n-й производной описывается равенством
X
Sn (xh) =
fk sn (x − k), x ∈ R,
(1.18)
k∈Z
где sn — фундаментальный сплайн (1.17). Именно сплайны вида (1.18) и
будут являться объектами ближайшего изучения.
Замечание 1.4. Можно показать, что пространство сплайнов на равномерной сетке шага h имеет среднюю размерность, равную 1/h (по этому поводу
см. [3]). Точно такое же значение средней размерности при несколько другом
ее определении получено в [4 – 5].
2. Интегральные представления
В этом параграфе будут получены некоторые соотношения, ключевую
bn и An , выполроль в которых играют кусочно-полиномиальные функции A
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О некоторых свойствах интерполяционных сплайнов
165
няющие роль ядер в интегральных представлениях сплайнов и их погрешностей. Точные константы, которые будут вычислены в следующих параграфах, равны некоторым нормам производных этих функций.
bn : R2 → R. Пусть
Начнем с определения функции A
gbn (x, t) =
1
(t − x)n sign(t − x), x, t ∈ R.
2n!
(2.1)
Заметим сразу, что
(−1)n+1 D1n+1 gbn (x, t) = D2n+1 gbn (x, t) = δ(x − t), x, t ∈ R
(здесь и далее символом Dj обозначается частная производная по j-му аргументу).
Пусть для всех x, t ∈ R
X
bn (x, t) =
A
gbn (i, t)sn (x − i).
(2.2)
i∈Z
bn (·, t) —
Другими словами, для любого фиксированного t ∈ R функция A
интерполяционный сплайн n-го порядка (с шагом h = 1) вида (1.18), совпадающий с функцией gbn (·, t) во всех целых точках, то есть
bn (k, t) = gbn (k, t), k ∈ Z.
A
bn сразу следует, что
Из определения функции A
X
bn (x, t) =
δ(i − t)sn (x − i)
D2n+1 A
i∈Z
и
Z
R
bn (x, t)f (th)dt =
D2n+1 A
X
i∈Z
f (ih)sn (x − i) = Sn (xh, f, Rh ) = Sn (xh).
Если определить функцию An : R2 → R равенством
bn (x, t) − gbn (x, t),
An (x, t) = A
(2.3)
то справедливы следующие интегральные представления сплайна Sn и его
погрешности:
Z
bn (x, t)f (th)dt,
Sn (xh) =
D2n+1 A
(2.4)
R
Sn (xh) − f (xh) =
для всех x ∈ R.
Z
D2n+1 An (x, t)f (th)dt
R
(2.5)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
166
Н. А. Стрелков
bn и An представляют собой кусочные полиномы степени n по
Функции A
каждой из переменных. При этом если областями полиномиальности функbn являются единичные квадраты, на которые разбивают плоскость R2
ции A
семейства прямых x = (n + 1)/2 + i, i ∈ Z и t = j, j ∈ Z, то для построения
разбиения плоскости R2 , порождающего области полиномиальности функции An , необходимо к этим двум семействам прямых добавить прямую t = x.
Что касается гладкости этих функций, то для всех k, j, таких, что
bn (x, t) кусочно0 ≤ k ≤ n, 0 ≤ j ≤ n, производные вида D1k D2j A
полиномиальны (степени n − k по x и n − j по t) для всех (x, t) ∈ R2 . То
же самое относится и к производным функции An , но лишь в полуплоскостях t < x и t > x (при вычислении любой производной вида D1k D2j An (x, t),
где k + j = n + 1, возникает δ-функция, сосредоточенная на прямой t = x).
Установим некоторые свойства функции An , а также получим ее описание
в терминах полиномов Qn вида (1.3).
Лемма 2.1. Если (x, t) ∈ R2 , m ∈ Z, то
An (x, t) = An (x + m, t + m),
(2.6)
An (x, t) = (−1)n+1 An (−x, −t),
(2.7)
An (x, t) = (−1)
n+1
An (t − dn , x − dn ).
(2.8)
Доказательство. Если принять во внимание очевидным образом следующие
из (2.1) равенства
gbn (x + y, t + y) = gbn (x, t), y ∈ R,
(2.9)
gbn (−x, −t) = (−1)n+1 gbn (x, t),
а также учесть четность фундаментального сплайна sn , то с помощью
вполне естественной замены переменной суммирования соотношения (2.6)–
(2.7) очень просто следуют из (2.2)–(2.3).
Несколько сложнее обстоит дело с равенством (2.8). В этом случае заметим, что если зафиксировать i ∈ Z, то функция gbn (i, t) может трактоваться
как принадлежащий C n−1 (R) сплайн n-го порядка с интервалами полиномиальности (j, j + 1), j ∈ Z. Поэтому
X
gbn (i, t) =
gbn (i, j + dn )sn (t − j − dn )
j∈Z
и
bn (x, t) =
A
X
i∈Z
gbn (i, t)sn (x − i) =
X
i,j∈Z
gbn (i, j + dn )sn (t − j − dn )sn (x − i). (2.10)
Используя (2.9) и очевидное равенство
gbn (x, t) = (−1)n+1 gbn (t, x),
(2.11)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О некоторых свойствах интерполяционных сплайнов
167
из (2.10) получаем, что
bn (t − dn , x − dn ) =
(−1)n+1 A
X
gbn (i, j + dn )sn (x − j − 2dn )sn (t − i − dn ) =
= (−1)n+1
=
X
i,j∈Z
=
X
i,k∈Z
i,j∈Z
gbn (j + dn , i)sn (x − j − 2dn )sn (t − i − dn ) =
bn (x, t).
gbn (k, i + dn )sn (t − i − dn )sn (x − k) = A
Последнее равенство вместе с (2.3), (2.9) и (2.11) приводит к соотношению
(2.8). Лемма доказана.
Следующее утверждение дает конструктивное описание функции An в
терминах полиномов Qn и Rn , определенных равенствами (1.3) и (1.16) (напомним, что z0 , . . . , z[n/2] — нули многочлена Rn , принадлежащие полуинтервалу (−1, 0]).
Лемма 2.2. Если t < x, то
[n/2]
X zr[x+dn ]−[t] Qn ({t}, zr )Qn (1 − {x + dn }, zr )
;
An (x, t) =
(1 − zr )n+1 Rn′ (zr )
r=0
(2.12)
если t > x, то
[n/2]
An (x, t) = (−1)
n+1
X zr[t]−[x−dn ] Qn ({x − dn }, zr )Qn (1 − {t}, zr )
.
(1 − zr )n+1 Rn′ (zr )
r=0
(2.13)
Доказательство. Прежде всего получим еще одно представление функции
An , определенной равенством (2.3). Для этого заметим, что сплайн n-го порядка, интерполирующий алгебраический полином степени n, совпадает с
эти полиномом. Поэтому функция An не изменится, если в ее определении
заменить функцию gbn на функцию gen , имеющую следующий вид:
другими словами,
gen (x, t) = gbn (x, t) +
An (x, t) =
X
i∈Z
Легко видеть, что
1
(t − x)n ;
2n!
gen (i, t)sn (x − i) − gen (x, t).
1
gen (x, t) = (t − x)n+ =
n!
0,
(t−x)n
,
n!
если t < x,
если t > x.
(2.14)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
168
Н. А. Стрелков
Поэтому если t < x, то с помощью соотношений (2.14), (1.17), (1.8) и (1.9)
получаем
1 X
(t − i)n+ sn (x − i) =
An (x, t) =
n! j∈Z
[t]
∞
1 X
1 X
n
(t − i) sn (x − i) =
(t − [t] + k)n sn (x − [t] + k) =
=
n! i=−∞
n! k=0
∞
[n/2]
X zr
1 X
=
({t} + k)n
n! k=0
r=0
[x−[t]+k+dn ]
Qn (1 − {x − [t] + k + dn }, zr )
=
Rn′ (zr )
[n/2]
=
X zr[x+dn ]−[t] Qn ({t}, zr )Qn (1 − {x + dn }, zr )
;
n+1 R′ (z )
(1
−
z
)
r
r
n
r=0
тем самым (2.12) доказано. Если же t > x, то следует в только что доказанном равенстве (2.12) заменить x на t − dn , а t на x − dn и воспользоваться
соотношением (2.8), что немедленно приведет к равенству (2.13). Лемма доказана.
Из (2.12)–(2.13) следует существование такой константы C > 0 (зависящей только от n), что если 0 ≤ k ≤ n, 0 ≤ j ≤ n, то для любых x, t ∈ R,
таких, что x 6= t, справедливо неравенство
где
|D1k D2j An (x, t)| ≤ Cq |t−x| ,
q=
max |zr |
1≤r≤[n/2]
(2.15)
(2.16)
(отметим, что 0 < q < 1).
bn следует, что если x 6= t и k + j ≥ n + 1,
Из определения функций An и A
k j b
k j
bn на
то D1 D2 An (x, t) = D1 D2 An (x, t). Кроме того, у производных функции A
прямой t = x нет особенностей. Поэтому из (2.15) получаем, что существует
такая константа C > 0, зависящая только от n, что если 0 ≤ k ≤ n, 0 ≤ j ≤ n
и k + j ≥ n + 1, то для любых x, t ∈ R справедливо неравенство
bn (x, t)| ≤ Cq |t−x| ,
(2.17)
|D1k D2j A
где q ∈ (0, 1) имеет вид (2.16) (конечно, подразумевается, что n ≥ 2; для
n = 0 и n = 1 оценки (2.15) и (2.17) очевидны, поскольку в этом случае
bn равны нулю вне полосы |t − x| ≤ (n + 1)/2).
функции An и A
3. Точные равномерные оценки
bn и
Соотношения (2.4)–(2.5) и установленные выше свойства функций A
An позволяют доказать следующие два утверждения, дающие точные оценки
норм производных сплайна Sn и его погрешности.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О некоторых свойствах интерполяционных сплайнов
169
В дальнейшем для p ∈ [1, ∞] будут использоваться нормы
kf kp = kf kLp (R) .
Теорема 3.1. Пусть p ∈ [1, ∞], а целые m и j таковы, что 0 ≤ m < j ≤ n + 1.
Если kf (j) kp < ∞, то
kSn(m) − f (m) k∞ ≤ C(m, j, p, n)hj−m−1/p kf (j) kp .
(3.1)
Постоянные C(m, j, p, n) в оценке (3.1) имеют вид
C(m, j, p, n) = kFm,j,p,n kL∞ (0,1/2) ,
где
Fm,j,p,n (x) = kD1m D2n+1−j An (x, ·)kq , q =
p
.
p−1
(3.2)
Константы C(m, j, p, n) уменьшить нельзя.
Доказательство. Если в правой части равенства (2.5) выполнить j-кратное
интегрирование по частям (при этом внеинтегральные члены исчезают в силу
оценки (2.15)), а затем полученное равенство m раз продифференцировать
по x, то результатом будет соотношение
Z
(m)
(m)
j j−m
Sn (xh) − f (xh) = (−1) h
(3.3)
D1m D2n+1−j An (x, t)f (j) (th)dt
R
Заметим, что производные D1m D2n+1−j An (x, t) в правой части (3.3) не имеют особенностей; более того, эти производные кусочно-полиномиальны, поскольку m + n + 1 − j ≤ n и An — кусочно-полиномиальная функция класса
C n−1 (R2 ). Оценка (3.1) сразу следует из неравенства Гельдера, равенства
kf (j) (·h)kp = h−1/p kf (j) kp ,
а также 1-периодичности и четности функции Fm,j,p,n (которые вытекают из
свойств (2.6) и (2.7) функции An ). Кроме того, Fm,j,p,n непрерывна на отрезке
[0, 1/2], поскольку при вычислении kD1m D2n+1−j An (x, ·)kq для q < ∞ возникает
равномерно сходящийся на [0, 1/2] ряд, члены которого непрерывны на этом
отрезке.
Покажем, что оценка (3.1) неулучшаема. Пусть p > 1. Так как
Fm,j,p,n ∈ C([0, 1/2]), то существует такая точка x
e=x
em,j,p,n ∈ [0, 1/2], что
Fm,j,p,n (e
x) = kFm,j,p,n kL∞ (0,1/2) .
Если теперь fe = fem,j,p,n такова, что
q−1
fe(j) (th) = D1m D2n+1−j An (e
x, t) signD1m D2n+1−j An (e
x, t), t ∈ R,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
170
Н. А. Стрелков
а Sen — сплайн, интерполирующий fe, то следствием соотношения (3.3) является равенство
Z
m n+1−j
q
(m)
(m)
j j−m
e
e
D1 D2
Sn (e
xh) − f (e
xh) = (−1) h
An (e
x, t) dt.
R
Поскольку p(q − 1) = q, то
откуда
kfe(j) kp = h1/p
Z
R
|fe(j) (th)|p dt
1/p
= h1/p kD1m D2n+1−j An (e
x, ·)kq/p
q ,
Sen(m) (e
xh) − fe(m) (e
xh) = (−1)j hj−m−1/p kD1m D2n+1−j An (e
x, ·)kq kfe(j) kp .
Поэтому
kSen(m) − fe(m) k∞ ≥ C(m, j, p, n)hj−m−1/p kfe(j) kp ,
что доказывает невозможность уменьшения константы C(m, j, p, n). Подобные рассуждения доказывают неулучшаемость оценки (3.1) и для p = 1. В
этом случае для экстремальной функции fe, удовлетворяющей условию
fe(j) (th) = δ(t − e
t),
(m)
следует рассмотреть поведение разности fe(m) (e
xh) − Sen (e
xh), где принадлежащая полосе [0, 1/2] × R точка (e
x, e
t) такова, что
m n+1−j
D1 D2
An (e
x, e
t) = kD1m D2n+1−j An kL∞ ([0,1/2]×R) .
Теорема доказана.
Для вычисления точных констант C(m, j, p, n) в (3.1) необходимо знать
поведение функции An в полосе 0 < x < 1/2, t ∈ R. Следующее утверждение
дает описание функции An в более широкой полосе −dn < x < 1 − dn , t ∈ R в
терминах полиномов Qn вида (1.3) (напомним, что dn = (n+1)/2−[(n+1)/2]).
Лемма 3.1. Пусть k ∈ Z, x ∈ (−dn , 1 − dn ), t ∈ (0, 1). Тогда
[n/2]
An (x, k + t) =
X z −k Qn (t, zr )Qn (1 − dn − x, zr )
r
,
n+1 R′ (z )
(1
−
z
)
r
r
n
r=0
(3.4)
если t + k < x;
[n/2]
An (x, k + t) = (−1)
если t + k > x.
n+1
X z k+2dn Qn (1 − t, zr )Qn (dn + x, zr )
r
,
(1 − zr )n+1 Rn′ (zr )
r=0
(3.5)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О некоторых свойствах интерполяционных сплайнов
171
Доказательство. Нетрудно проверить, что если k, x, t удовлетворяют условиям леммы, то
[k +t] = k, {k +t} = t, [x+dn ] = 0, [x−dn ] = −2dn , {x+dn } = {x−dn } = x+dn .
Поэтому из (2.12)–(2.13) сразу следуют представления (3.4)–(3.5). Лемма доказана.
Полученные в лемме 3.1 представления функции An позволяют описать
поведение производных этой функции. Для этого прежде всего заметим, что
из (1.8)–(1.9) следует, что
D1i Qn (x, z) = (1 − z)i Qn−i (x, z), i = 0, . . . , n.
(3.6)
Действительно, поскольку Qn — полином, то достаточно убедиться в справедливости (3.6) для |z| < 1. В этом случае соотношение (3.6) легко получается
из (1.9) и очевидным образом следующего из (1.8) равенства
D1i Gn (x, z) = Gn−i (x, z), i = 0, . . . , n.
Используя (3.6), после дифференцирования равенств (3.4) и (3.5) получаем, что если k ∈ Z, x ∈ (−dn , 1 − dn ), t ∈ (0, 1), m = 0, . . . , n, j = 1, . . . , n + 1,
то
[n/2]
D1m D2n+1−j An (x, k
+ t) = (−1)
m
X z −k Qj−1 (t, zr )Qn−m (1 − dn − x, zr )
r
, (3.7)
(1 − zr )j−m Rn′ (zr )
r=0
если t + k < x;
[n/2]
D1m D2n+1−j An (x, k+t)
= (−1)
j
X z k+2dn Qj−1 (1 − t, zr )Qn−m (dn + x, zr )
r
, (3.8)
j−m R′ (z )
(1
−
z
)
r
r
n
r=0
если t + k > x.
Теорема 3.2. Пусть p ∈ [1, ∞], а целые m и j таковы, что 0 ≤ j ≤ m ≤ n.
Если kf (j) kp < ∞, то
kSn(m) k∞ ≤ C(m, j, p, n)hj−m−1/p kf (j) kp .
(3.9)
Постоянные C(m, j, p, n) в оценке (3.9) имеют вид
C(m, j, p, n) = kFm,j,p,n kL∞ (0,1/2) ,
где
bn (x, ·)kq , q =
Fm,j,p,n (x) = kD1m D2n+1−j A
Константы C(m, j, p, n) уменьшить нельзя.
p
.
p−1
(3.10)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
172
Н. А. Стрелков
Доказательство. Если равенство (2.4) m раз продифференцировать по x, а
затем в правой части полученного соотношения j раз проинтегрировать по
частям и учесть оценку (2.17), то результатом будет соотношение
Sn(m) (xh)
j j−m
= (−1) h
Z
R
bn (x, t)f (j) (th)dt.
D1m D2n+1−j A
(3.11)
bn (x, t) в правой части (3.11)
Заметим, что если j > 0, то функция D1m D2n+1−j A
кусочно-полиномиальна (степени n − m по x и j − 1 по t); если же j = 0,
то возникает линейная комбинация δ-функций, сосредоточенных на прямых
t = s, s ∈ Z, коэффициенты которой кусочно-полиномиальны по x. Осталось
применительно к равенству (3.11) провести те же рассуждения, которые привели к доказательству теоремы 2.1 с помощью представления (3.3). Кроме
того, необходимо учесть то обстоятельство, что поскольку m+n+1−j ≥ n+1,
bn (x, t) = D1m D2n+1−j An (x, t) на всей плоскости R2 за исключето D1m D2n+1−j A
нием прямой t = x. Теорема доказана.
m n+1−j b
Что касается поведения производных D1 D2
An (x, t), то из определеb
ния функций An и An следует, что если x 6= t и m ≥ j, то
bn (x, t) = D1m D2n+1−j An (x, t).
D1m D2n+1−j A
Поэтому в каждом из квадратов вида
x ∈ (−dn , 1 − dn ), t ∈ (k, k + 1), k ∈ Z,
(3.12)
bn (x, t)
не пересекающихся с прямой x = t, поведение полинома D1m D2n+1−j A
bn . При
при j > 0 описывается соотношениями (3.7)–(3.8) с заменой An на A
этом если какой-то квадрат вида (3.12) пересекается с прямой x = t (а такое
возможно лишь при k = −1 и k = 0 для четных n и при k = 0 для нечетных
bn (x, t) допускает любую из двух
n), то в этом квадрате полином D1m D2n+1−j A
форм записи (как (3.7), так и (3.8)).
Замечание 3.1. Если j = 0, то оценка (3.9) содержательна лишь в случае
p = ∞, поскольку если p ∈ [1, ∞), то C(m, 0, p, n) = ∞ для всех m ≤ n. Это
bn (x, t) возникает линейная
объясняется тем, что при вычислении D1m D2n+1 A
комбинация δ-функций, сосредоточенных на прямых t = k, k ∈ Z с зависящими от x кусочно-полиномиальными коэффициентами. Более точно, если
0 ≤ m ≤ n, то
bn (x, t)
D1m D2n+1 A
=
Xh
k∈Z
bn (x, ·)
D1m D2n A
i
(k)δ(t − k),
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О некоторых свойствах интерполяционных сплайнов
h
bn (x, ·)
D1m D2n A
173
i
bn (x, ·)
где
(k) — скачок кусочно-постоянной функции D1m D2n A
в точке t = k. Поэтому если x ∈ (0, 1/2), то из (3.7)–(3.8) следует, что
bn (x, t) =
D1m D2n+1 A
[n/2]
0
X (z −k − z −k+1 )Qn−m (1 − dn − x, zr )
X
r
r
= (−1)
δ(t − k)−
1−m R′ (z )
(1
−
z
)
r
r
n
k=−∞ r=0
m
∞ [n/2]
X (z k+2dn − z k−1+2dn )Qn−m (dn + x, zr )
X
r
r
δ(t − k) =
−
(1
− zr )1−m Rn′ (zr )
k=1 r=0
[n/2]
0
X (1 − zr )m X
m
=
(−1)
zr−k Qn−m (1 − dn − x, zr )δ(t − k)+
′
Rn (zr )
r=0
k=−∞
∞
X
k−1+2dn
+
zr
Qn−m (dn + x, zr )δ(t − k) .
k=1
Следовательно, если x ∈ (0, 1/2), то
m n+1 b
Fm,0,∞,n (x) = D1 D2 An (x, ·) =
1
(1 − zr )m k
+
Q
(1
−
d
−
x,
z
)
z
=
n−m
n
r
r
′ (z )
R
r
n
r=0
k=0
[n/2]
X (1 − zr )m k+2d
n
Qn−m (dn + x, zr )
zr
+ ′
Rn (zr )
r=0
∞ [n/2]
X
X
(3.13)
для всех m = 0, . . . , n.
В частности, поскольку Q0 (x, z) = 1, Q1 (x, z) = x + z(1 − x), то
X
∞ [n/2]
n
X
X (1 − zr )n k [n/2]
(1
−
z
)
r
k+2d
n
zr + zr
Fn,0,∞,n (x) =
′
′
R (zr )
R (zr )
k=0
n
r=0
r=0
n
∞ [n/2]
X
X (1 − zr )n−1 k
+
Fn−1,0,∞,n (x) =
z
{1
−
d
−
x
+
z
(d
+
x)}
n
r
n
R′ (zr ) r
k=0
r=0
n
[n/2]
X (1 − zr )n−1 k+2d
n
{d
+
x
+
z
(1
−
d
−
x)}
z
+ n
r
n
r
′ (z )
R
r
n
r=0
(3.13)
Замечание 3.2. Если в оценке (3.9) m = n или m = n − 1, то при определении оптимальных констант C(m, j, p, n) отпадает необходимость вычисления
равномерной нормы функции Fm,j,p,n . Действительно, Fn,j,p,n (x) не зависит
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
174
Н. А. Стрелков
(n−1)
от x ∈ (0, 1/2), а если m = n − 1, то Sn
— непрерывная кусочно-линейная
функция, откуда немедленно следует, что
kSn(n−1) k∞ = sup Sn(n−1) (dn + k) .
k∈Z
Используя последнее равенство, нетрудно показать, что
C(n − 1, j, p, n) = Fn−1,j,p,n (dn ), 0 ≤ j ≤ n − 1.
4. Неравенства с дискретными нормами
Перейдем теперь к выводу соотношений, которые устанавливают связь
m-й производной сплайна Sn с j–ми разностями интерполируемой функции
(здесь 0 ≤ j ≤ m ≤ n).
В этом параграфе будут использоваться дискретные аналоги норм пространства Lp (R) следующего вида:
(
)1/p
X
p
kf kp,h = h
|fk |
, 1 ≤ p < ∞,
k∈Z
kf k∞,h = sup |fk |.
k∈Z
Кроме того, символом ∂ будет обозначаться разностный оператор, определяемый равенством
∂fk = (fk+1 − fk )/h.
Напомним, что в §1 были определены многочлены Qn вида
n
k
1 X kX
j n+1
(x + k − j)n ,
z
(−1)
Qn (x, z) =
n! k=0 j=0
j
а также алгебраические многочлены Rn степени 2[n/2] + 1, определяемые
равенством
Rn (z) = zQn (1 − dn , z),
где dn = (n + 1)/2 − [(n + 1)/2]. Отметим, что Rn имеет на полуинтервале
(−1, 0] ровно [n/2] + 1 различных корней z0 , z1 , . . . , z[n/2] , причем z0 = 0.
Имеет место следующее утверждение, являющееся дискретным аналогом
теоремы 3.2.
Теорема 4.1. Пусть p ∈ [1, ∞], а целые m и j таковы, что 0 ≤ j ≤ m ≤ n.
Тогда если k∂ j f kp,h < ∞, то
kSn(m) k∞ ≤ D(m, j, p, n)hj−m−1/p k∂ j f kp,h .
(4.1)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
175
О некоторых свойствах интерполяционных сплайнов
Постоянные D(m, j, p, n) в оценке (4.1) имеют следующий вид:
D(m, j, 1, n) =
sup sup |F (n, m, j, k, x)| ,
x∈(0,1/2) k∈Z
D(m, j, p, n) =
sup
x∈(0,1/2)
(
где
X
k∈Z
|F (n, m, j, k, x)|q
)1/q
, p > 1, q = p/(p − 1),
[n/2]
F (n, m, j, k, x) = (−1)
m−j
X z −k (1 − zr )m−j Qn−m (1 − x − dn , zr )
r
,
′ (z )
R
r
n
r=0
(4.2)
если k ≤ 0;
[n/2]
F (n, m, j, k, x) =
X z 2dn −1+k+j (1 − zr )m−j Qn−m (x + dn , zr )
r
,
Rn′ (zr )
r=0
(4.3)
если k ≥ 1. Константы D(m, j, p, n) уменьшить нельзя.
Доказательство. Можно было бы действовать по той же схеме, которая применялась при доказательстве теорем 3.1 и 3.2. Проще, однако, поступить следующим образом.
Прежде всего покажем, что если F (n, m, j, k, x) имеют вид (4.2)–(4.3), то
для всех x ∈ (0, 1/2) выполняется равенство
X
F (n, m, j, k, x)∂ j fk .
(4.4)
Sn(m) (xh) = hj−m
k∈Z
Для этого заметим, что из (4.2)–(4.3) следует, что
Z
(−1)m−j
z −k (1 − z)m−j Qn−m (1 − x − dn , z)dz
F (n, m, j, k, x) =
,
2πi
Rn (z)
|z|=1
если k ≤ 0;
1
F (n, m, j, k, x) =
2πi
Z
|z|=1
z 2dn −1+k+j (1 − z)m−j Qn−m (x + dn , z)dz
,
Rn (z)
(4.5)
(4.6)
если k ≥ 1. Чтобы доказать эти соотношения, достаточно для вычисления
интегралов в правых частях равенств (4.5)–(4.6) применить теорему о вычетах и воспользоваться тем, что подынтегральные функции в круге |z| < 1
имеют простые полюсы, расположенные в нулях полинома Rn .
Выполним в (4.5) замену переменной интегрирования z = 1/w и заметим,
что если z пробегает единичную окружность по часовой стрелке, то w пробегает ту же окружность, но в противоположном направлении. Кроме того,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
176
Н. А. Стрелков
используя лемму 1.2, а также свойства многочлена Rn , нетрудно показать,
что
Qn−m (1 − x − dn , 1/w) = wm−n Qn−m (x + dn , w),
Rn (1/w) = w−1−2dn −n Rn (w).
Поэтому
Z
z −k (1 − z)m−j Qn−m (1 − x − dn , z)dz
(−1)m−j
=
2πi
Rn (z)
|z|=1
Z
1
w2dn −1+k+j (1 − w)m−j Qn−m (x + dn , w)dw
=
.
2πi |w|=1
Rn (w)
Следовательно, если x ∈ (0, 1/2), то для всех k ∈ Z выполняется равенство
1
F (n, m, j, k, x) =
2πi
Z
|z|=1
z 2dn −1+k+j (1 − z)m−j Qn−m (x + dn , z)dz
.
Rn (z)
(4.7)
Из (4.2)–(4.3) следует существование таких констант γ ∈ (0, 1) и C > 0, что
|F (n, m, j, k, x)| ≤ Cγ |k|
(4.8)
для всех x ∈ (0, 1/2) (если n ≥ 2, то в качестве γ можно взять
max1≤r≤[n/2] |zr |). Поэтому из (4.7) получаем, что
j
XX
j−l j
F (n, m, j, k − l, x)fk =
(−1)
F (n, m, j, k, x)∂ fk = h
l
k∈Z l=0
k∈Z
Z
j h−j X
z 2dn −1+k (1 − z)m−j Qn−m (x + dn , z) X j
(−z)j−l dz =
=
fk
l
2πi k∈Z
R
(z)
n
|z|=1
l=0
Z
−j X
2dn −1+k
m
h
z
(1 − z) Qn−m (x + dn , z)dz
=
=
fk
2πi k∈Z
Rn (z)
|z|=1
Z
h−j X
z 2dn −1+k D1m Qn (x + dn , z)dz
=
fk
2πi k∈Z
Rn (z)
|z|=1
(4.9)
m
m
(здесь было использовано равенство (1−z) Qn−m (x, z) = D1 Qn (x, z), которое
следует из (3.6)). Применяя (1.4), получаем, что
X
j
Qn (x + dn , z) =
=
X
p∈Z
−j
X
q∈Z
z q Mn (x + dn − (n + 1)/2 + q) =
z −k−p−2dn +[n/2]+1 Mn (x − k − p)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О некоторых свойствах интерполяционных сплайнов
177
(здесь использовалось легко проверяемое равенство (n+1)/2 = [n/2]−dn +1).
Поэтому (см. (1.10), (1.13))
Z
Z
1 X
z k+2dn −1 Qn (dn + x, z)dz
z −p+[n/2] dz
1
=
Mn (x − k − p) =
2πi |z|=1
Rn (z)
2πi p∈Z |z|=1 Rn (z)
X
=
a(n)
p Mn (x − k − p) = sn (x − k).
p∈Z
С учетом последнего равенства из (4.9) получаем, что
X
X
m−j (m)
fk s(m)
Sn (xh).
F (n, m, j, k, x)∂ j fk = h−j
n (x − k) = h
k∈Z
k∈Z
Тем самым равенство (4.4) доказано.
Если теперь продолжить функцию F (n, m, j, k, ·) с (0, 1/2) на (−1/2, 1/2)
с помощью равенства
F (n, m, j, k, −x) = (−1)m−j F (n, m, j, −k − j, x),
(4.10)
а затем с (−1/2, 1/2) на R посредством соотношения
F (n, m, j, k, x + 1) = F (n, m, j, k + 1, x)
(4.11)
и сохранить за продолженной функцией прежнее обозначение, то легко убедиться в том, что равенство (4.4) будет выполняться для всех x ∈ R. Для
получения оценки (4.1) (точно так же, как и при доказательстве теорем 3.1
и 3.2) осталось воспользоваться неравенством Гельдера, равенством
(
X
∂ j fk p
k∈Z
)1/p
= h−1/p k∂ j f kp,h ,
а также свойствами (4.10) и (4.11) функции F (n, m, j, k, ·).
Покажем, что оценка (4.1) неулучшаема. Пусть p > 1. Нетрудно видеть,
что существует такая точка x
e=x
em,j,p,n ∈ [0, 1/2], что
D(m, j, p, n) =
sup
x∈(0,1/2)
(
X
k∈Z
|F (n, m, j, k, x
e)|q
)1/q
(это следует из того, что для фиксированного k ∈ Z функция F (n, m, j, k, ·)
на [0, 1/2] является полиномом степени n − m, а возникающий ряд благодаря оценке (4.8) равномерно сходится на этом отрезке). Если теперь fe —
зависящая от m, j, p, n последовательность, такая, что
e)|q−1 signF (n, m, j, k, x
e)
∂ j fek = |F (n, m, j, k, x
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
178
Н. А. Стрелков
для всех k ∈ Z, а Sen — сплайн, интерполирующий fe, то следствием соотношения (4.4) является равенство
Sen(m) (e
xh) = hj−m
Поскольку p(q − 1) = q, то
откуда
k∂ j fekp,h =
Поэтому
(
h
X
k∈Z
|∂ j fek |p
)1/p
X
k∈Z
|F (n, m, j, k, x
e)|q .
= h1/p
(
X
k∈Z
|F (n, m, j, k, x
e)|
q
)1/p
,
Sen(m) (e
xh) = hj−m−1/p D(m, j, p, n)k∂ j fekp,h .
kSen(m) k∞ ≥ D(m, j, p, n)hj−m−1/p k∂ j fekp,h ,
что доказывает невозможность уменьшения константы D(m, j, p, n). Подобные рассуждения доказывают неулучшаемость оценки (4.1) и для p = 1.
В этом случае для экстремальной последовательности fe, удовлетворяющей
условию
(
1, k = e
k,
je
∂ fk =
e
0, k 6= k,
(m)
следует рассмотреть поведение Sen (e
xh), где e
k∈Zиx
e ∈ [0, 1/2] таковы, что
k, x
e) = sup sup |F (n, m, j, k, x)| = D(m, j, 1, n).
F (n, m, j, e
x∈(0,1/2) k∈Z
Теорема доказана.
5. Точные оценки погрешности
на множествах суперсходимости
В теореме 3.1 были получены равномерные оценки производных погрешности Sn − f при условии, что f (j) ∈ Lp (R), где j ≤ n + 1. Нетрудно показать,
что при j = n + 1 наступает насыщение: попытка дальнейшего увеличения j
не приводит к повышению порядка скорости сходимости. В этом параграфе
будут получены оценки погрешности с точными константами для j = n + 2;
их отличие от (3.1) состоит в том, что оцениваться будут не равномерные нормы производных погрешности Sn −f , а значения этих погрешностей в точках
некоторых дискретных множеств, называемых в дальнейшем множествами
суперсходимости.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
179
О некоторых свойствах интерполяционных сплайнов
Для любого n ∈ Z+ построим такую функцию Vn : R2 → R и такой
(k)
набор точек ξn,j , что для любого k = 0, 1, . . . , n и для всех j ∈ Z выполнены
следующие условия:
(k)
(k)
D1k D2 Vn (ξn,j , t) = D1k An (ξn,j , t)
для всех t ∈ R;
(5.1)
(k)
lim D1k Vn (ξn,j , t) = 0.
|t|→∞
Прежде всего заметим, что если t < x, то из (2.14) следует равенство
An (x, t) =
где
n
z+
=
Покажем, что если t > x, то
1 X
(t − i)n+ sn (x − i).
n! i∈Z
An (x, t) = −
где
n
z−
=
zn,
0,
если z > 0,
если z < 0.
1 X
(t − i)n− sn (x − i),
n! i∈Z
0,
zn,
(5.2)
(5.3)
если z > 0,
если z < 0.
Действительно, если t > x, то с учетом равенств (2.7) и (5.2), а также четности фундаментального сплайна sn получаем, что
An (x, t) = (−1)n+1 An (−x, −t) =
(−1)n+1 X
(−t − i)n+ sn (−x − i) =
n!
i∈Z
(−1)n+1 X
(−t + j)n+ sn (x − j).
=
n!
i∈Z
(5.4)
n
Если теперь использовать легко проверяемое соотношение z+
= (−1)n (−z)n− ,
то из (5.4) следует равенство (5.3).
Определим функцию Vn в полуплоскостях t < x и t > x следующим
образом:
(
P
n+1
1
если t < x,
i∈Z (t − i)+ sn (x − i),
(n+1)!
P
(5.5)
Vn (x, t) =
n+1
1
− (n+1)! i∈Z (t − i)− sn (x − i), если t > x.
Из (5.3)–(5.5) следует, что в каждой из этих двух полуплоскостей выполняется равенство
D2 Vn (x, t) = An (x, t).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
180
Н. А. Стрелков
Кроме того, рассуждения, аналогичные применявшимся при доказательстве
леммы 2.2, приводят к справедливости следующего утверждения.
Лемма 5.1. Если t < x, то
[n/2]
X zr[x+dn ]−[t] Qn+1 ({t}, zr )Qn (1 − {x + dn }, zr )
;
Vn (x, t) =
(1 − zr )n+2 Rn′ (zr )
r=0
(5.6)
если t > x, то
[n/2]
X zr[t]−[x−dn ] Qn ({x − dn }, zr )Qn+1 (1 − {t}, zr )
.
Vn (x, t) = (−1)
(1 − zr )n+2 Rn′ (zr )
r=0
n
(5.7)
Из (5.6)–(5.7) следует существование такой константы C > 0 (зависящей
только от n), что если 0 ≤ m ≤ n, то для любых x, t ∈ R, таких, что x 6= t,
справедливо неравенство
|D1m Vn (x, t)| ≤ Cq |t−x| ,
(5.8)
где
q=
max |zr |
1≤r≤[n/2]
(конечно, подразумевается, что n ≥ 2; для случаев n = 0 и n = 1 оценка (5.8)
очевидна в силу компактности носителя функции Vn ).
Наконец, следствием представления (5.5) являются равенства
Vn (x + k, t + k) = Vn (x, t), k ∈ Z
(5.9)
Vn (−x, −t) = (−1)n Vn (x, t).
(5.10)
и
(k)
Для выполнения условия (5.1) осталось найти такой набор ξn,j , что для
(k)
(k)
каждого k = 0, 1, . . . , n функция D1k Vn (ξn,j , t) непрерывна в точке t = ξn,j .
С учетом соотношения
n+1
n+1
z+
+ z−
= z n+1
это условие приводит к равенству
)
(
X
(x − i)n+1 s(k)
n (x − i)
i∈Z
= 0.
(k)
x=ξn,j
Если определить функцию Fn : R2 → R равенством
X
Fn (x, t) =
(t − i)n+1 sn (x − i),
i∈Z
(5.11)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О некоторых свойствах интерполяционных сплайнов
181
то (5.11) можно переписать в следующем виде:
(k)
(k)
D1k Fn (ξn,j , ξn,j ) = 0, k = 0, . . . , n.
Поскольку
X
(5.12)
ij sn (x − i) = xj
i∈Z
для любого j = 0, . . . , n и всех x ∈ R, то
X
[in+1 − (i − t)n+1 ] − in+1 sn (x − i) =
Fn (x, t) = (−1)n
= (−1)n
(
i∈Z
xn+1 − (x − t)n+1 −
X
i∈Z
Из последнего равенства следует, что
(
Fn (x, x) = (−1)n
xn+1 −
)
in+1 sn (x − i) .
X
i∈Z
)
in+1 sn (x − i) ;
кроме того, для любого k = 0, . . . , n справедливо соотношение
dk
{Fn (x, x)} .
dxk
D1k Fn (x, x) =
Поэтому если ввести обозначение
ϕn (x) = (−1)n Fn (x, x),
(k)
то условие (5.12) эквивалентно тому, что ξn,j являются нулями k-й производной функции ϕn (k = 0, . . . , n), то есть
(k)
ϕ(k)
n (ξn,j ) = 0,
где функция ϕn допускает каждое из следующих представлений:
X
(x − i)n+1 sn (x − i),
ϕn (x) = (−1)n
(5.13)
i∈Z
ϕn (x) = xn+1 −
X
i∈Z
in+1 sn (x − i).
(5.14)
Для множеств нулей производных функции ϕn удобно ввести следующее обозначение:
n o
(k)
, n ∈ Z+ , k = 0, . . . , n.
Ξ(k)
=
ξn,j
n
j∈Z
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
182
Н. А. Стрелков
(k)
Другими словами, Ξn есть множество нулей k-й производной функции ϕn .
Следующее утверждение дает полное описание таких множеств в терминах
нулей классических многочленов Бернулли Bn (x), определяемых производящей функцией
∞
X
tn
tetx
=
.
B
(x)
n
et − 1 n=0
n!
(k)
Лемма 5.1. Для всех n ∈ Z+ , k = 0, . . . , n множества Ξn имеют следующий
вид:
1
Z, r ≥ 1, s = 0, . . . , r − 1,
(2s)
2
Ξ2r =
Z,
s = r ≥ 0;
(2s+1)
= ±µr−s + Z, r ≥ 1, s = 0, . . . , r − 1;
Z,
r ≥ 0, s = 0,
(2s)
Ξ2r+1 =
1
±
µ
+
Z,
r
≥ 1, s = 1, . . . , r;
r−s+1
2 1
Z,
r ≥ 1, s = 0, . . . , r − 1,
(2s+1)
2
Ξ2r+1 =
1
+ Z, s = r ≥ 0,
2
Ξ2r
(5.15)
где µk ∈ (0, 1/2) таковы, что пара точек 1/2 ± µk — нули полинома Бернулли
B2k (x).
Доказательство. Из (5.13)–(5.14) следует, что ϕn — 1-периодическая функция класса C n−1 (R) (если n = 0, то условие гладкости отсутствует), равная
нулю во всех целых точках, причем на каждом из отрезков
[(n − 1)/2 + j, (n + 1)/2 + j] (j ∈ Z)
эта функция представляет собой алгебраический многочлен степени n + 1 со
старшим коэффициентом 1. Поэтому для нахождения всех нулей производных функции ϕn достаточно найти эти нули на любом отрезке единичной
длины; в качестве такого отрезка удобно выбрать [−dn , 1 − dn ], то есть отрезок [−1/2, 1/2], если n четно, и [0, 1], если n нечетно. Пусть для любого
r ∈ Z+ сужения функций ϕ2r и ϕ2r+1 на эти отрезки имеют следующий вид:
ϕ2r (x) = W2r+1 (x) = x2r+1 + . . . , x ∈ [−1/2, 1/2],
ϕ2r+1 (x) = W2r+2 (x) = x2r+2 + . . . , x ∈ [0, 1].
(5.16)
Из условий периодичности и гладкости для ϕn следует, что
(k)
(k)
W2r+1 (−1/2) = W2r+1 (1/2), k = 0, . . . , 2r − 1,
(k)
(k)
W2r+2 (0) = W2r+2 (1), k = 0, . . . , 2r.
Поэтому полиномы W2r+1 (x + 1/2) − W2r+1 (x − 1/2) и W2r+2 (x + 1) − W2r+2 (x)
имеют в точке x = 0 нули кратностей 2r и 2r + 1 соответственно. Следовательно,
W2r+1 (x + 1/2) − W2r+1 (x − 1/2) = (2r + 1)x2r ,
(5.17)
W2r+2 (x + 1) − W2r+2 (x) = (2r + 2)x2r+1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О некоторых свойствах интерполяционных сплайнов
183
(здесь используется тот факт, что старшие коэффициенты многочленов Wn
равны единице). Так как W2r+1 (0) = W2r+2 (0) = 0, то соотношения (5.17)
позволяют получить следующее представление полиномов Wn :
W2r+1 (x − 1/2) = B2r+1 (x), W2r+2 (x) = B2r+2 (x) − B2r+2 .
(5.18)
Здесь Bn (x) — классические многочлены Бернулли, Bn = Bn (0) — числа
Бернулли (см., например, [6]).
Поскольку Bn′ (x) = nBn−1 (x), то из (5.16) и (5.18) следует, что
(2r + 1)!
B2r+1−k (x + 1/2), k = 0, . . . , 2r, x ∈ [−1/2, 1/2],
(2r + 1 − k)!
ϕ2r+1 (x) = B2r+2 (x) − B2r+2 , x ∈ [0, 1],
(2r + 2)!
(k)
ϕ2r+1 (x) =
B2r+2−k (x), k = 1, . . . , 2r + 1, x ∈ [0, 1],
(2r + 2 − k)!
(5.19)
и задача нахождения нулей производных функций ϕ2r и ϕ2r+1 на отрезках
[−1/2, 1/2] и [0, 1] сводится к изучению поведения многочленов Бернулли на
отрезке [0, 1]. Перечислим интересующие нас свойства этих полиномов.
1. Для любого r ≥ 1 разности B2r (x) − B2r обращаются в нуль лишь в
двух точках отрезка [0, 1]: x = 0 и x = 1.
2. Для любого r ≥ 1 многочлен B2r имеет на отрезке [0, 1] ровно два нуля
вида x = 1/2 ± µr , где 0 < µr < 1/2.
3. Поскольку B1 (x) = x − 1/2, то единственным нулем полинома B1 является точка x = 1/2.
4. Для любого r ≥ 1 многочлен B2r+1 имеет на отрезке [0, 1] ровно три
нуля: x = 0, x = 1/2 и x = 1.
Используя эти свойства и 1-периодичность функций ϕn , из (5.19) по(k)
лучаем равенства (5.15), полностью описывающие все корни функций ϕn
(n ∈ Z+ , k = 0, . . . , n). Лемма доказана.
Следствием этой леммы и описанных выше свойств функции Vn вида (5.5)
является утверждение, устанавливающее точные равномерные оценки производных погрешности сплайна Sn на дискретных множествах, каждое из
которых порождается некоторым сдвигом целочисленной решетки Z.
Теорема 5.1. Пусть p ∈ [1, ∞], kf (n+2) kp < ∞, а m и α удовлетворяют одному
из следующих условий:
1) n = 2r, r ≥ 1, m = 0, α = 1/2;
2) n ≥ 1, m = n, α = n/2 − [n/2];
3) n ≥ 3, m = n − 2k, 1 ≤ k ≤ [(n − 1)/2], α = 0 или α = 1/2;
4) n ≥ 2, m = n−2k +1, 1 ≤ k ≤ [n/2], α = n/2−[n/2]±µk , где µk ∈ (0, 1/2)
таковы, что 1/2 ± µk — корни многочлены Бернулли B2k .
Тогда
(k)
ϕ2r (x) =
sup |Sn(m) ((α + i)h) − f (m) ((α + i)h)| ≤ G(m, α, p, n)hn+2−m−1/p kf (n+2) kp , (5.20)
i∈Z
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
184
Н. А. Стрелков
где
G(m, α, p, n) = kD1m Vn (α, ·)kq , q =
p
.
p−1
(5.21)
Константы G(m, α, p, n) уменьшить нельзя.
Доказательство. Прежде всего заметим, что условия, накладываемые в формулировке теоремы, продиктованы результатами леммы 5.1 относительно нулей производных функции ϕn . Эти условия, по сути дела, являются другим
описанием множеств Ξkn . Единственное исключение состоит в том, что в теореме не описан тривиальный случай m = 0, α = 0 (несмотря на то что среди
нулей функции ϕ соответствующее множество присутствует).
Полагая в равенстве (3.3) x = α + i, j = n + 1, получаем, что если i ∈ Z,
то
Z
(m)
n+1 n+1−m
(Sn − f ) ((α + i)h) = (−1) h
D1m An (α + i, t)f (n+1) (th)dt. (5.22)
R
Если теперь воспользоваться соотношением (5.1), то после интегрирования
по частям в правой части (5.22) приходим к равенству
Z
(m)
n n+2−m
D1m Vn (α + i, t)f (n+2) (th)dt. (5.23)
(Sn − f ) ((α + i)h) = (−1) h
R
Применяя неравенство Гельдера и равенство
kf (n+2) (·h)kp = h−1/p kf (n+2) kp ,
из (5.23) получаем, что
(Sn − f )(m) ((α + i)h) ≤ hn+2−m−1/p kD1m Vn (α + i, ·)kq kf (n+2) kp
(5.24)
для всех i ∈ Z. Используя (5.9), легко проверить, что
kD1m Vn (α + i, ·)kq = kD1m Vn (α, ·)kq , i ∈ Z.
(5.25)
Из (5.24) и (5.25) сразу следует неравенство (5.20).
Неулучшаемость полученных оценок проверяется примерно так же, что
и при доказательстве теоремы 3.1. При этом в случае p > 1 экстремальные
функции fe = fem,α,p,n удовлетворяют условию
fe(n+2) (th) = |D1m Vn (α, t)|q−1 signD1m Vn (α, t), t ∈ R.
Если же p = 1, то
где
fe(n+2) (th) = δ(t − e
t),
m
D1 Vn (α, e
t) = kD1m Vn (α, ·)k∞ .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О некоторых свойствах интерполяционных сплайнов
185
Теорема доказана.
Следующее утверждение дает описание функции Vn в полосе
−dn < x < 1 − dn , t ∈ R в терминах полиномов Qn вида (1.3). Доказательство этого утверждения использует представление (5.6)–(5.7) и
проводится с помощью точно таких же рассуждений, которые привели к
доказательству леммы 3.1.
Лемма 5.2. Пусть k ∈ Z, x ∈ (−dn , 1 − dn ), t ∈ (0, 1). Тогда
[n/2]
Vn (x, k + t) =
X z −k Qn+1 (t, zr )Qn (1 − dn − x, zr )
r
,
(1 − zr )n+2 Rn′ (zr )
r=0
(5.26)
если t + k < x;
[n/2]
Vn (x, k + t) = (−1)
n
X z k+2dn Qn+1 (1 − t, zr )Qn (dn + x, zr )
r
,
n+2 R′ (z )
(1
−
z
)
r
r
n
r=0
(5.27)
если t + k > x.
Производные D1m Vn , от которых зависят константы вида (5.21), могут
быть получены дифференцированием равенств (5.26) и (5.27). Используя
соображения, аналогичные применявшимся при выводе соотношений (3.7)–
(3.8), получаем, что если k ∈ Z, x ∈ (−dn , 1 − dn ), t ∈ (0, 1), m = 0, . . . , n,
то
[n/2] −k
X z Qn+1 (t, zr )Qn−m (1 − dn − x, zr )
r
m
m
,
D1 Vn (x, k + t) = (−1)
(1 − zr )n+2−m Rn′ (zr )
r=0
если t + k < x;
[n/2]
D1m Vn (x, k
+ t) = (−1)
n
X z k+2dn Qn+1 (1 − t, zr )Qn−m (dn + x, zr )
r
,
(1 − zr )n+2−m Rn′ (zr )
r=0
если t + k > x.
В заключение отметим, что случай n = 3, p = ∞ детально проанализирован в работе [7].
Литература
[1] Стечкин С. Б., Субботин Ю. Н. Сплайны в вычислительной математике.
М.: Наука, 1976.
[2] Иосида К. Функциональный анализ. М.: Мир, 1971.
[3] Стрелков Н. А. Эрмитовы поперечники, средняя размерность и кратные
укладки // Мат. сб. 1996. Т. 187, № 1. C. 121 – 142.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
186
Н. А. Стрелков
[4] Динь Зунг, Магарил–Ильяев Г. Г. Задачи типа Бернштейна и Фавара
и средняя ε–размерность некоторых классов функций // ДАН СССР.
1979. Т. 249, № 4. C. 783 – 786.
[5] Магарил-Ильяев Г. Г. Средняя размерность, поперечники и оптимальное восстановление соболевских классов функций на прямой // Мат. сб.
1991. Т. 182, № 11. С. 1635 – 1656.
[6] Бурбаки Н. Функции действительного переменного. М.: Наука, 1965.
[7] Strelkov N. A. Exact constants for cubic interpolation spline inequalities
// International Conference "Wavelets and Splines"(3 – 8 July, 2003, St.
Petersburg, Russia). Proceedings. St. Petersburg University Press, 2005.
P. 103 – 117.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 519.72
Выбор метрики для непараметрических
оценок энтропии ∗
Е. А. Тимофеев
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: TimofeevEA@gmail.com
Рассматривается задача непараметрического оценивания
энтропии (на символ) по экспериментальным данным из информационного источника с конечным алфавитом. В статье описан класс метрик, использование которых повышает эффективность оценок энтропии. Для симметричной меры Бернулли эта
эффективность доказывается.
Библиография: 15 названий.
Введение
В настоящей статье рассматривается задача выбора метрики для повышения эффективности непараметрической оценки размерностей из работы [4].
Оценивание размерностей по экспериментальным данным наталкивается
на следующие трудности выбора:
1) в каком пространстве лежат экспериментальные данные?
2) какую размерность оценивать?
Рассмотрим эти трудности.
Работа проводилась при финансовой поддержке Федерального агентства по науке и
инновациям, ФЦП "Научные и научно-педагогические кадры инновационной России на
2009 – 2013 годы".
∗
187
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
188
Е. А. Тимофеев
Выбор пространства. Самым естественным подходом здесь является
следующий. Экспериментальные данные представляем как значения некоторого измерительного прибора и число этих значений считаем конечным и
принадлежащим известному множеству A. Тогда пространство всех экспериментальных данных Ω = AN – это пространство правосторонних последовательностей, N = {1, 2, . . . }. Точку из Ω будем обозначать как x = (x1 , x2 , . . .),
xi ∈ A.
При таком представлении идеализируется только измерительный прибор,
который должен выдавать одно и то же значение в каждой точке.
Топология на пространстве Ω = AN задается естественным образом. Базой
открытых множеств являются цилиндры
Cs (x) = {y ∈ Ω : y1 = x1 , . . . , ys = xs )}.
Будем считать, что C0 (x) = Ω.
Топологическое пространство Ω является довольно сложным и недостаточно изученным. Оно существенно отличается от евклидовых пространств,
так, например, все открытые множества в Ω являются замкнутыми.
Подчеркнем, что такой подход используется в определении символических динамических систем.
Будем дополнительно предполагать, что на пространстве Ω задана также и некоторая мера µ. Для простоты будем считать, что соответствующая
сигма-алгебра совпадает с топологией, т. е. мера является борелевской.
Введение меры делает возможным представлять экспериментальные данные как случайную точку в пространстве Ω, распределенную по мере µ.
Выбор размерности. Для определения размерности нужно задать метрику. Выбору метрики на пространстве последовательностей будет посвящен
раздел 3. Далее в этом параграфе будем считать, что Ω – компактное метрическое пространство с метрикой ρ и мерой µ. Для простоты будем считать,
что diam Ω 6 1 и что мера µ – вероятностная, т. е. µ(Ω) = 1.
Первый подход к определению размерности – локальные размерности в
точке. Напомним, что нижней и верхней локальными размерностями меры
µ в точке x называются величины
log µ(B(x, r))
,
log r
r→0
dµ (x) = lim
log µ(B(x, r))
.
r→0
log r
dµ (x) = lim
Если dµ (x) = dµ (x) = dµ (x), то величина dµ (x) называется локальной размерностью меры µ в точке x. Через B(x, r) обозначается шар радиуса r с
центром в точке x.
Недостатки такого подхода очевидны: верхний и нижний пределы могут
не совпадать, локальная размерность может зависеть от точки. Отметим,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Выбор метрики для непараметрических оценок энтропии
189
что все эти возможности реализуются в пространстве последовательностей с
мерой Бернулли и метрикой
ρ0 (x, y) = θ− min{k:xk 6=yk } ,
(1)
где θ > 1.
Одним из выходов из этой трудности является сужение класса рассматриваемых мер и метрик. Меру µ будем называть точно размерностной (exact
dimensional) (см., напр., [13, c. 44]), если для µ-почти всех точек x ∈ Ω существует и постоянна dµ (x).
Для пространства последовательностей с эргодической стационарной мерой µ теорема Шеннона – Макмиллана – Бреймана [3, п. 2.10] утверждает,
что для µ-почти всех точек x ∈ Ω существует
1
ln µα (Cn (x)) = −h.
n→∞ n
lim
Величина h и является энтропией. Таким образом, в пространстве последовательностей с метрикой (1) мера µ является точно размерностной.
Второй недостаток такого такого определения размерности – невозможность его оценивания по экспериментальным данным. Поэтому в определение
размерности добавляют еще усреднение по пространству. Так, например, HPспектром размерностей меры µ (Hentschel, Procaccia) называется [13, c. 182]
семейство пар
R
1
limr→0+ log1 r log Ω µ(B(x, r))q−1 dµ(x),
HP q (µ) = q−1
(2)
R
1
HP q (µ) = q−1
limr→0+ log1 r log Ω µ(B(x, r))q−1 dµ(x).
Верхний и нижний пределы здесь также могут не совпадать, и достаточно
общие условия, при которых они совпадают, не известны.
Энтропию можно рассматривать как частный случай этих размерностей
при q = 1 и метрике (1), а из теоремы Шеннона – Макмиллана – Бреймана
получаем, что для пространства последовательностей с эргодической стационарной мерой µ эти пределы совпадают и пропорциональны энтропии.
1. Постановка задачи
Задача оценивания энтропии будет рассматриваться в следующей постановке.
Далее Ω = AN будет обозначать пространство правосторонних последовательностей (A – конечный алфавит).
Пусть даны n + 1 независимых случайных величин ξ0 , . . . , ξn , принимающих значения в Ω и одинаково распределенных по мере µ. Будем считать,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
190
Е. А. Тимофеев
что µ – борелевская эргодическая стационарная (инвариантная относительно
сдвига) вероятностная мера.
Требуется оценить энтропию меры µ. Напомним, (см., напр., [3]) что энтропия (энтропия на символ) определяется как
1
E ln µ(Cn (ξ)),
n→∞ n
h = − lim
(3)
Подчеркнем, что натуральное основание логарифма выбрано для того, чтобы
не ставить дополнительные множители в исследуемой оценке.
В [4] предложены и исследованы статистики для нахождения размерностей мер в метрических пространствах. Для пространства последовательностей Ω с метрикой ρ эти статистики определяются следующим образом:
ηn(k) (ρ) = k rn(k) (ρ) − rn(k+1) (ρ) ,
rn(k) (ρ)
n
X
1
(k)
=−
ln min ρ(ξi , ξj ) .
i:i6=j
(n + 1) j=0
(4)
(5)
где min(k) {X1 , . . . , XN } = Xk , если X1 ≤ X2 ≤ · · · ≤ XN .
Отметим, что для упрощения вычислений, случайные величины ξ0 ,
. . . , ξn считаются бесконечными последовательностями. Нетрудно показать
(см. [10]), что достаточно использовать только O(ln n) первых символов этих
последовательностей, если мера удовлетворяет следующему условию
∃α > 0 : µ(Cn (ω)) = O(e−nα ), для µ − почти всех ω ∈ Ω.
(6)
Описанию результатов, полученных для этих статистик, и посвящена настоящая работа.
2. Непараметрические оценки энтропии
Большинство непараметрических оценок энтропии h основано либо на
алгоритме сжатия Лемпеля – Зива, либо на методе ближайших соседей (см.
обзор в [4]), и эти оценки имеют вид
log n
b
hn =
,
Rn
где Rn – некоторая величина, вычисляемая по экспериментальным данным.
Для таких оценок доказывается сходимость почти всюду (наиболее общие
результаты получены в [12], [10]), но такие оценки очень трудно применять
в прикладных задачах, поскольку log2 n 6 30 − 40, а скорость сходимости
таких оценок O(1/ log n).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Выбор метрики для непараметрических оценок энтропии
191
Подчеркнем, что для теоретического исследования оценок такого вида
более удобно изучать обратную величину b
h−1
n , поэтому далее в работе будут
рассматриваться только оценки величины 1/h – обратной к энтропии.
В работе [4] вместо деления на log n предлагается рассмотреть разности
между средними логарифмами расстояний до k-й и k + 1-й ближайших точек
(см. (4)). При таком подходе сходимость доказывается при трудно проверяемых условиях, но скорость сходимости получается степенной – O(n−c ), где c –
некоторая константа. Для задачи оценивания размерностей эти условия выполнены для абсолютно непрерывных мер (относительно лебеговской). Для
задачи оценивания энтропии в работе [10] была проведена вычислительная
проверка для нескольких одномерных динамических систем с известной энтропией. Проверка показала, что эта оценка имеет точность 0.01 для n = 104 .
В экспериментах применялась метрика (1).
Эти результаты позволяли надеяться, что скорость сходимости будет степенной. Кроме того, в [10] было показано, что дисперсия оценки равна O(n−1 )
(при фиксированных k и метрике (1)). Однако в [11] найдено смещение для
симметричной меры Бернулли, которое оказалось периодической функцией с
периодом пропорциональным log n (см. формулу (16) для более общего класса метрик). Хорошее согласование результатов эксперимента в [10] с теоретическими значениями энтропии объясняется тем, что для небольших значений
энтропии (h < 3) это смещение настолько мало, что его нельзя заметить в
вычислительном эксперименте. Так, например, для A = {0, 1} амплитуда
смещения меньше, чем 10−6 .
В работе [5] для метрики (1) и меры Бернулли, а в [6] для марковской
меры показано, что смещение равно O(1) для тех мер, у которых логарифмы
вероятностей перехода соизмеримы. Для остальных марковских мер оценка
является асимптотически несмещенной. Таким образом, смещение является
разрывной функцией от параметров марковской меры и похожей на функцию
Римана, равную 0 в иррациональных точках и 1/q в рациональной точке p/q.
Наличие смещения для метрики (1) и некоторых марковских мер приводит к следующему вопросу: можно ли убрать смещение, заменив метрику?
В следующем разделе описывается довольно широкий класс допустимых
метрик.
3. Слабые метрики
Для того чтобы по статистикам (5), (4) оценить энтропию, нужно взять ρ
билипшицево эквивалентной метрике (1). При этом достаточно, чтобы ρ была
слабой метрикой (weak или near [8]), т. е. чтобы неравенство треугольника
выполнялось только с некоторой константой.
Из теоремы 1 и предложения 8 из [4] получаем
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
192
Е. А. Тимофеев
Утверждение 1 Пусть ρ – слабая метрика билипшицево эквивалентная метрике (1), тогда для k = O(nc ), где c < 1,
(k)
ln θ
Ern (ρ)
=
.
n→∞
ln n
h
lim
В качестве слабой метрики ρ будем рассматривать следующую
ρ(ax, by) =
θ−1 ρ(x, y),
a = b;
−1
λ (ρ(x, y)), a =
6 b;
(7)
где λ(t) – неубывающая неотрицательная функция на отрезке [0, 1] такая,
что λ(1) = 1 и λ(λ0 ) = 0 для некоторого λ0 > 0.
Нетрудно проверить, что
λ0 ρ0 (x, y) 6 ρ(x, y) 6 θρ0 (x, y).
(8)
Одним из примеров служит метрика
ρ1 (x, y) = (θ − 1)
∞
X
k=1
(1 − δxk ,yk ) θ−k ,
(9)
у которой λ(t) = θt − θ + 1.
Вторым рассматриваемым примером будет слабая метрика, у которой
λ(t) =
0 6 t 6 θ−1 ;
θt−1
, θ−1 6 t 6 1.
θ−1
0,
(10)
4. Симметричная мера Бернулли
Чтобы показать основные трудности и возникающие преимущества при
рассмотрении новых метрик, рассмотрим случай |A| = 2 и µ – мера Бернулли
с равновероятными символами.
Обозначим через
F (r) = µ(B(x, r)).
(11)
Ясно, что для меры Бернулли с равновероятными символами F не зависит
от x и удовлетворяет уравнению
1
1
F (r) = F (θr) + F (λ(r)).
2
2
(12)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Выбор метрики для непараметрических оценок энтропии
193
4.1. Нахождение смещения
Для нахождения смещения статистик нужно (см. [4]) найти асимптотику
величины
Z 1
n!
(k)
ln F −1 (t) tk−1 (1 − t)n−k−1 dt.
(13)
Ern (ρ1 ) = −
(k − 1)!(n − k)! 0
Наиболее важным свойством функции F , на котором будет основано вычисление [6], это ее подобие:
1
F (r) = F (θr),
2
0 ≤ r ≤ λ0 .
Введем вспомогательную функцию g(x), положив
F −1 (t) = tlog2 θ e−g(− ln t) .
(14)
Условие подобия функции F переписывается следующим образом:
g(x + ln 2) = g(x),
x > − ln F (θ − 1).
Таким образом, функция g(x) является периодической, начиная с некоторого значения. Обозначим через gb(x) периодическую часть функции g(x) и
разложим ее в ряд Фурье
gb(x) =
∞
X
gm e2πimx/ ln 2 .
(15)
m=−∞
Подставляя это разложение в (13), получим (см. [6])
Eηn(k) (ρ1 )
∞
X
2πmiΓ k + 2πmi
ln θ
ln 2
=
gm
+
n−2πmi/ ln 2 + O(n−1 ).
ln 2 m=−∞
ln 2Γ(k)
(16)
m6=0
Для того чтобы убрать смещение, величины gm , m 6= 0, должны быть
нулевыми, т. е. функция F (r) должна быть степенной.
Таким образом, получаем следующую задачу: как подобрать параметры
метрики (7), чтобы функция функция F (r) была степенной?
4.2. Метрика (9)
Для метрики (9) функция F (r) является функцией распределения случайной величины, которая обычно называется бесконечной сверткой Бернулли и изучается с 1930-х годов. Начальное изучение функции F (r) связано с
вопросами гармонического анализа [2, 12.11], [1, 14.20].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
194
Е. А. Тимофеев
F (r) = r (0 ≤ r 6 1) при θ = 2 и смещение оценки (4) для метрики (9)
равно O(n−1 ).
А. Винтнер [15] нашел еще ряд значений θ, при которых функция F (r)
является степенной в положительной
окрестности 0. Это значения θ = 21/k
√
при k ≥ 1. Например, при θ = 2 функция F (r) задается как
F (x) =















√
(1+ 2)2 2
√
x,
2 2
√
1+
√ 2x
2
1−
−
0 6 x ≤ −1 +
1
√
,
2 2
√
(1+ 2)2
√
(1
2 2
−1 +
− x)2 , 2 −
√
√
√
2;
26x62−
√
2;
2 6 x 6 1.
Основная часть исследований по функции F (r) связана с изучением более
слабого свойства гладкости — абсолютной непрерывности. Хотя эти результаты и не нужны в настоящей работе, приведем их небольшой обзор, который
покажет сложность задачи изучения функции F (r) (подробнее см. [14]).
П. Эрдеш [7] показал, что F (r) является сингулярной, если 1 < θ < 2 является PV-числом (Pisot-Vijayaraghavan). Более того, преобразование Фурье
функции F (r) не стремится к 0 при t → ∞.
Напомним, что PV-числом называется такое алгебраическое целое число
θ > 1, у которого все сопряженные числа по модулю меньше 1 (сопряженные
числа — это остальные корни минимального многочлена). Примеры таких
чисел — решения уравнений x2 − x − 1 = 0 или x3 − x − 1 = 0.
А. Гарсиа [9] нашел новые примеры алгебраических чисел 1 < θ < 2, для
которых функция F (r) абсолютно непрерывна. Найденные им числа являются корнями в интервале (1, 2) минимальных полиномов с коэффициентами −2, 0, 2. Примерами таких многочленов являются x3 − x − 2, x3 − 2x − 2,
x4 − x3 − 2.
Б. Соломяк [14] доказал, что функция F (r) абсолютно непрерывна и имеет плотность из L2 для почти всех θ ∈ (1, 2).
Для наглядности покажем график изменения амплитуды функции g(x) –
величины
∞
X
|gm |2 .
m=−∞
m6=0
Функция F (r) строилась как аттрактор итерационной системы функций
по отображениям
x
x θ−1
S1 (x) = , S2 (x) = +
,
θ
θ
θ
а по ней находилась функция g(x) по формуле (14). Строилось 220 точек и
2000 интервалов для задания F (r).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Выбор метрики для непараметрических оценок энтропии
195
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0.5
0.55
0.6
0.65
0.7
0.75
0.8
0.85
Рис. 1. Нормированная амплитуда функции g(x) в зависимости от параметра
θ−1 ∈ [0.5, 0.8] (при θ = ∞ амплитуда равна 1)
Как
√видно из графика нулевые амплитуды достигаются только при θ = 2
и θ = 2 (остальные значения не попали на график). Отметим, что небольшой пик при θ = 0.755 соответствует обратному значению наименьшего PVчисла – корня уравнения x3 − x − 1 = 0.
4.3. Самоподобная функция без перекрытия
Функция F (r), рассмотренная в предыдущем разделе, является самоподобной функцией с перекрытием. Более изученными являются самоподобные функции с так называемым "условием открытых множеств"(open set
condition). Для уравнения (12) это условие состоит в том, что λ(θ−1 ) = 0.
Для такой функции уравнение (12) принимает вид
1
F (θr),
0 6 r 6 θ−1 ;
2
F (r) =
1
+ 21 F (λ(r)), θ−1 6 r 6 1.
2
Рассмотрим, например, слабую метрику ρ2 .
Из этих графиков видно, что функция F (x) является гладкой только при
θ = 2. Отметим, что, подбирая функцию λ(t), можно добиться того, чтобы
функция F (x) являлась степенной при любом θ.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
196
Е. А. Тимофеев
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Рис. 2. Графики функции F (x) при θ−1 = 0.1, 0.2, . . . , 0.9
5. Оценки энтропии
Исходными данными для построения оценок являются n + 1 слов ξ0 , . . . ,
ξn , каждое из которых состоит из m символов алфавита A.
Рассматриваемыми метриками будут метрики (9) и (10).
Для того чтобы работать со словами, а не с бесконечными последовательностями, вместо метрики ρ будем использовать ее усечение
ρ(0) (x, y) = 1; θ−1 ρ(m−1) (x, y),
a = b;
ρ(m) (ax, by) =
−1 (m−1)
λ (ρ
(x, y)), a =
6 b.
(17)
Нетрудно проверить, что
(m)
ρ1 (x, y) − ρ1 (x, y) 6 θ−m ;
(m)
ρ2 (x, y) − ρ2 (x, y) 6 max{θ−1 , 1 − θ−1 }m .
(18)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Выбор метрики для непараметрических оценок энтропии
197
Итак, параметр m нужно выбрать так, чтобы при вычислении по формуле (5) с заменой метрики на ее усечение, точность не влияла на порядок
сортировки
(m)
ρ (ξi , ξj ) − ρ(m) (ξi , ξl ) > θ−m ∀i, j 6= i, l 6= i, j.
(19)
Оценками обратной энтропии будут служить две величины
(k)
(k)
(m)
(m)
ηn (ρ1 ) ηn (ρ2 )
,
.
ln θ
ln θ
Параметр k = 1, 2, 3. Таким образом, получаем 6 оценок (при заданном
параметре θ).
Если все эти оценки существенно отличаются, то для каждой метрики
можно подобрать параметр θ, минимизируя функцию
n
1 X (k) (m) 2
η (ρ ) .
n ln2 θ l=k l
(20)
Литература
[1] Бари Н. К. Тригонометрические ряды. М. : ГИФМЛ, 1961.
[2] Зигмунд А. Тригонометрические ряды. М. : Мир, 1965.
[3] Мартин Н., Ингленд Дж. Математическая теория энтропии. М. : Мир,
1988.
[4] Тимофеев Е. А. Статистически оцениваемые инварианты мер // Алгебра
и анализ. 2005. Т. 17, № 3. С. 204 – 236.
[5] Тимофеев Е. А. Асимптотика смещения оценки энтропии для мер Бернулли // Моделирование и анализ информационных систем. 2009. Т. 16,
№ 4. С. 96 – 108.
[6] Тимофеев Е. А. Смещение непараметрической оценки энтропии для
марковской меры // Записки научных семинаров ПОМИ. 2010. Т. 377.
С. 134 – 158.
[7] Erdös P. On a Family of Symmetric Bernoulli Convolutions // American
Journal of Mathematics. 1939. V. 61, № 4. P. 974 – 976.
[8] Deza M., Deza E. Encyclopedia of Distances. Springer, 2009.
[9] Garsia A. M. Arithmetic Properties of Bernoulli Convolutions // Trans. of
AMS. 1962. V. 102, № 3. P. 409 – 432.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
198
Е. А. Тимофеев
[10] Kaltchenko A., Timofeeva N. Entropy Estimators with Almost Sure
Convergence and an O(n−1 ) Variance // Advances in Mathematics of
Communications. 2008. V. 2, № 1. P. 1 – 13.
[11] Kaltchenko A., Timofeeva N. Rate of convergence of the nearest neighbor
entropy estimator // AEU - International Journal of Electronics and
Communications. 2010. V. 64, № 1. P. 75 – 79.
[12] Kontoyiannis I., Suhov Yu. M. Prefixes and the entropy rate for long-range
sources // Probability Statistics and Optimization. N. Y.: Wiley, 1994.
[13] Pesin Ya. Dimension Theory in Dynamical Systems: Contemporary Views
and Applications. Chicago : The University of Chicago Press, 1997.
P
[14] Solomyak B. On the Random Series
±λn (an Erdos Problem) //
The Annals of Mathematics 2nd Ser. 1995. V. 142, № 3. P. 611 – 625.
[15] Wintner A. On Convergent Poisson Convolutions // American Journal of
Mathematics. 1935. V. 57, № 4. P. 827 – 838.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 514.123.2
Построение общих нормалей
для двух конических поверхностей
А. Ю. Ухалов
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: alex-uhalov@yandex.ru
В работе исследуется задача об отыскании общих нормалей
к двум круговым конусам.
Библиография: 1 название.
Умение построить прямую, являющуюся нормалью одновременно для
двух поверхностей, может быть полезно при решении большого числа прикладных задач. Это позволяет, например, выяснить, в каком положении друг
относительно друга находятся поверхности, найти расстояние между поверхностями и т. п. В настоящей работе приводится решение этой задачи для двух
круговых конусов в R3 .
Под конусом мы понимаем поверхность второго порядка в R3 , каноническое уравнение которой имеет вид z 2 = c2 (x2 +y 2 ). Мы не исключаем и случая
вырождения, когда конус превращается в цилиндр – поверхность второго порядка в R3 с каноническим уравнением x2 + y 2 = r2 .
Повсюду далее вектор – это элемент евклидова пространства R3 , ( ·, ·)
обозначает скалярное произведение векторов, а | · | – длину вектора.
Как оказывается, для отыскания всех общих нормалей к двум конусам достаточно знать положение осей конусов и углы между образующими конусов
и их осями. Положение вершин конусов знать не требуется.
Будем предполагать, что оси конусов – прямые, параметрические уравнения которых имеют вид
x = αt + β,
(1)
x = γt + δ,
(2)
где x = (x1 , x2 , x3 )T , α = (α1 , α2 , α3 )T , β = (β1 , β2 , β3 )T , γ = (γ1 , γ2 , γ3 )T ,
δ = (δ1 , δ2 , δ3 )T – векторы в R3 , t ∈ R – параметр соответствующей прямой.
Направляющие векторы прямых мы будем считать нормированными, то есть
будем предполагать, что
(α, α) = 1,
(γ, γ) = 1.
199
(3)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
200
А. Ю. Ухалов
Пусть для конуса с осью (1) угол между образующей и осью равен ϕ
(0 ≤ ϕ < π/2), а для конуса с осью (2) угол между образующей и осью
равен ψ (0 ≤ ψ < π/2). Равенство угла нулю означает, что вместо конуса в
данном случае рассматривается цилиндр.
Сразу заметим, что имеются частные случаи, когда отыскание общих нормалей для двух конусов не представляет трудностей. Это случаи, когда оси
конусов:
1) совпадают,
2) параллельны, но не совпадают,
3) пересекаются в одной точке.
В случае 1) существование общих нормалей зависит только от угла между образующими конусов. В этом случае общих нормалей либо вообще не
существует, либо все нормали для обоих конусов общие. В случаях 2) и 3)
общие нормали к коническим поверхностям (если они существуют) лежат
в плоскости, определяемой осями. В этих ситуациях либо может существовать бесконечное число общих нормалей, либо таких нормалей нет совсем.
Нахождение нормалей сводится к построению общих перпендикуляров к прямым на плоскости. Эти случаи мы рассматривать не будем. Далее мы везде
предполагаем, что ситуации 1) – 3) не имеют места.
Нормаль к круговому конусу обладает следующими свойствами:
1) нормаль пересекается с осью конуса и 2) угол между нормалью и осью
конуса равен некоторой определенной величине, зависящей от угла между
образующей конуса и его осью.
Если оба конуса вырождаются в цилиндры, то общей нормалью для этих
цилиндров будет общий перпендикуляр к осям этих цилиндров. Рассматриваемая задача является обобщением задачи об общем перпендикуляре: для
двух прямых требуется построить прямую, пересекающую эти прямые под
некоторым определенным углом.
Для отыскания прямой, нормальной к двум конусам одновременно, достаточно найти точки на осях конусов, через которые проходит искомая прямая.
Будем искать уравнение общей нормали к двум конусам в виде
x = at + αt1 + β,
(4)
где a = (a1 , a2 , a3 )T – направляющий вектор искомой прямой, t1 – значение
параметра прямой (1), при котором прямая (1) пересекается c прямой (4).
Вектор a мы также будем считать нормированным, то есть будем считать,
что (a, a) = 1.
Прямая (4) пересекает ось второго конуса в некоторой точке. Пусть t2 –
значение параметра прямой (2), а l0 – значение параметра прямой (4), при которых эти прямые проходят через точку их пересечения. Тогда справедливо
соотношение
al0 + αt1 + β = γt2 + δ.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
201
Построение общих нормалей
Геометрический смысл величины l0 – расстояние между точками пересечения искомой прямой (4) с осями конусов (1) и (2) и, следовательно, l0 > 0.
Равенство l0 = 0 выполняться не может, так как это означало бы, что прямые
(1) и (2) пересекаются, а этот случай мы не рассматриваем.
Нам известно, что искомая нормаль пересекает каждую из осей конусов
под некоторым, вполне определенным углом. Это условие нам удобно записать следующим образом:
(a, α) = k,
(a, γ) = p,
где k – косинус угла между векторами a и α, p – косинус угла между векторами a и γ. Для каждой пары конусов значения k и p могут быть выбраны
следующим образом
k = ± sin ϕ, p = ± sin ψ.
Далее доказывается, что при фиксированных k и p может существовать не
более одной прямой, которая являлась бы нормалью для обоих конусов одновременно.
Таким образом, для определения параметров прямой (4) мы получили
систему уравнений

al0 + αt1 + β = γt2 + δ,



 (a, α) = k,
(5)

(a, γ) = p,



(a, a) = 1
относительно неизвестных a, t1 , t2 , l0 .
Умножая скалярно первое уравнение системы (5) сначала на вектор α, а
затем на вектор γ, получим систему
(
(α, γ)t2 − t1 = kl0 + (α, β) − (α, δ),
(6)
t2 − (α, γ)t1 = pl0 − (γ, δ) + (γ, β).
При выводе системы (6) учтены второе и третье уравнения системы (5), а
также равенства (3). Систему (6) можно рассматривать как систему линейных уравнений относительно t1 и t2 . Коэффициенты при t1 и t2 известны, а
в правых частях уравнений системы неизвестной является только величина
l0 . Определитель системы (6) равен
∆ = 1 − (α, γ)2 .
При сделанных выше предположениях относительно осей конусов векторы
α и γ не коллинеарны и, следовательно, ∆ > 0. Из системы (6) получаем
следующие выражения для t1 и t2
t 1 = C 1 l 0 + D1 ,
t 2 = C 2 l 0 + D2 ,
(7)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
202
А. Ю. Ухалов
где
1
[p(α, γ) − k],
∆
1
C2 = [p − k(α, γ)],
∆
1
D1 = [(α, δ − β) − (α, γ)(γ, δ − β)],
∆
1
D2 = [(α, γ)(α, δ − β) − (γ, δ − β)].
∆
Отметим, что константы C1 , C2 , D1 , D2 зависят только от известных величин.
Запишем первое из уравнений системы (5) в координатах, подставив вместо
t1 и t2 их выражения (7). Получим равенства
C1 =
ai l0 = (γi C2 − αi C1 )l0 + γi D2 − αi D1 + δi − βi
(i = 1, 2, 3).
Возвeдя обе части каждого из этих равенств в квадрат и просуммировав полученные равенства по i, получаем для определения l0 квадратное уравнение
l02
3
X
=
[(γi C2 − αi C1 )l0 + γi D2 − αi D1 + δi − βi ]2 .
(8)
i=1
Не определенные пока величины ai (i = 1, 2, 3) в это уравнение не входят,
так как в силу последнего уравнения системы (5)
3
X
a2i l02 = l02 .
i=1
Если в (8) подставить вместо Ci , Di их выражения через исходные параметры, уравнение (8) можно представить в виде
Al02 = B,
(9)
где
A = 1 − (α, γ)2 − k 2 − p2 + 2(α, γ)kp,
B = |δ − β|2 1 − (α, γ)2 − (α, g)2 − (γ, g)2 + 2(α, γ)(α, g)(γ, g) .
В выражении для B введено обозначение g = (δ − β)/|δ − β|. Можно утверждать, что |δ − β| > 0, так как оси конусов не пересекаются.
Разрешимость уравнения (9) относительно l0 является критерием существования общей нормали для конусов при выбранных значениях k и p. Если
l0 найдено, то можно по формулам (7) найти значения t1 и t2 и из уравнений
(1) и (2) определить координаты точек пересечения прямых (1) и (2) с прямой (4). Зная координаты двух различных точек, лежащих на прямой, легко
найти вектор a – направляющий вектор прямой (4) и, тем самым, построить
искомую прямую.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Построение общих нормалей
203
Покажем, что B > 0.
Пусть d1 , d2 , d3 – векторы в R3 , выходящие из одной точки. Обозначим
V [d1 , d2 , d3 ] объем параллелепипеда, построенного на этих векторах. Известна
формула (см., например, [1]):
V 2 [d1 , d2 , d3 ] = |d1 |2 |d2 |2 |d3 |2 (1 − cos2 θ1 − cos2 θ2 − cos2 θ3 +
+ 2 cos θ1 cos θ2 cos θ3 ),
где θ1 , θ2 , θ3 – углы между векторами d1 и d2 , d1 и d3 , d2 и d3 соответственно.
Везде далее при использовании обозначения V [·, ·, ·] подразумевается, что
соответствующие векторы приведены к общему началу.
Длины векторов α, β, g равны единице, а косинусы углов между этими
векторами есть скалярные произведения (α, γ), (α, g) и (γ, g). Очевидно
B = |δ − β|2 V 2 [α, γ, g] = V 2 [α, γ, δ − β].
Равенство V 2 [α, γ, g] = 0 возможно в том и только том случае, если векторы
α, β, g компланарны. В нашем случае эти векторы не являются компланарными, так как оси конусов не лежат в одной плоскости. Cледовательно,
B > 0.
При фиксированном положении осей (1) и (2) за счет выбора углов ϕ
и ψ легко построить примеры конусов, для которых коэффициент A из (9)
окажется больше нуля, меньше нуля или будет равняться нулю. Пусть, √
на2
2
пример, (α, γ) = 0. В этом случае A = 1 − k − p . Положив k = p = 1/ 2,
получим A = 0. Изменяя значения k и p, можно добиться выполнения неравенств A < 0 или A > 0.
Очевидно, уравнение (9) имеет решение в том и только том случае, когда
A > 0. Нас интересуют только положительные решения уравнения (9), так
что при A > 0 выражение для l0 имеет вид
r
B
.
l0 =
A
Таким образом, для данных значений k и p при A > 0 для конусов существует
единственная общая нормаль. При A ≤ 0 общей нормали для двух конусов не
существует. Учитывая неоднозначность выбора знаков k и p, можно сделать
вывод, что два конуса могут иметь не более четырех общих нормалей.
Уравнение (9) для определения l0 можно было получить и из чисто геометрических соображений. Пусть u вектор, начало которого – произвольная
точка на прямой (1), а конец – произвольная точка на прямой (2). Легко
убедиться, что
V [α, γ, u] = V [α, γ, δ − β].
Вектор l0 a соединяет точки на прямых (1) и (2). Для неизвестных пока l0 и
a имеем
V [α, γ, l0 a] = V [α, γ, δ − β]
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
204
А. Ю. Ухалов
или
l0 V [α, γ, a] = |δ − β|V [α, γ, g].
Если возвести в квадрат обе части последнего равенства, получим уравнение
(9), причем
A = V 2 [α, γ, a] = 1 − (α, γ)2 − k 2 − p2 + 2(α, γ)kp.
(10)
Нам удается найти l0 благодаря тому, что A выражается через известные
величины k и p. Требование A > 0 в сущности означает, что выражение
для квадрата объема должно быть положительным. Это условие накладывает ограничения на значения углов ϕ и ψ, при которых существует общая
нормаль для двух конусов.
В заключение сделаем два замечания относительно свойств общих нормалей, вытекающих из вышеизложенного.
1) При любом положении осей конусов (по-прежнему предполагается, что
эти оси не совпадают, не параллельны и не пересекаются) углы образующих
конусов с их осями ϕ и ψ всегда можно выбрать так, чтобы у конусов существовали четыре общие нормали (для этого углы должны быть взяты достаточно малыми) или чтобы общие нормали для конусов не существовали (для
этого углы нужно взять достаточно близкими к π/2).
2) В уравнении (9) коэффициент B зависит только от взаимного расположения осей конусов и не зависит от величин k и p (то есть не зависит от углов
ϕ и ψ). Коэффициент A непрерывно зависит от k и p. При фиксированных
осях, непрерывно изменяя углы образующих (и, следовательно, непрерывно
изменяя k и p), можно добиться того, что A → +0, l0 → +∞. Геометрически
этому соответствует удаление одной или обеих точек пересечения нормали с
осями конусов в бесконечность.
Литература
[1] Александров П. С. Лекции по аналитической геометрии, пополненные
необходимыми сведениями из алгебры. М.: Наука, 1968.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 519.4
Об алгебраической проблеме узлов
В. К. Шалашов
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
В работе получено описание всех приводимых кос.
Библиография: 2 названия.
Каждый ориентированный узел или зацепление могут быть представлены
как замыкание β̂ косы β ∈ Bn , где Bn — группа кос на n нитях, для некоторого n. Косы β ∈ Bn , γ ∈ Bm называются замкнуто-эквивалентными, если β̂
и γ̂ эквивалентны как ориентированные узлы. Согласно хорошо известному
результату А. А. Маркова (см., например, [1]) две косы β и γ замкнутоэквивалентны тогда и только тогда, когда существует последовательность
преобразований, при которых коса β ∈ Bn переходит в сопряженную к ней в
±1
Bn , или в косу βσn±1 ∈ Bn+1 , либо в косу β ′ ∈ Bn−1 , где β = β ′ σn−1
.
′
′
Если β ∈ Bn сопряжена косе β σn−1 для некоторой β ∈ Bn−1 , то говорят,
что коса β явялется плюс-приводимой и является минус-приводимой, если
−1
они сопряжена косе β ′′ σn−1
для некоторой косы β ′′ ∈ Bn−1 .
Теорема 1 ([2]). Пусть β ∈ Bn и β = ∆n−2s P , где
∆n = σ1 . . . σn−1 σ1 . . . σn−2 . . . σ1 σ2 σ1 ,
s ∈ Z+ , а P ∈ πn , где πn — полугруппа всех положительных слов из Bn ,
причем P содержит ∆n . Предположим, что {P1 , . . . , Pm } — множество всех
кос, полученных из P с помощью соотношений в полугруппе πn и всех циклических сдвигов. Тогда коса β является плюс-приводимой, если и только
если найдется число i, 1 ≤ i ≤ m, для которого в πn выполняется равенство
Pi = (σn−1 . . . σ2 σ12 σ2 . . . σn−1 )s φn (Pi ),
где φn (Pi ) — коса, полученная из Pi удалением нити с номером n.
Теорема 2 ([2]). Пусть β ∈ Bn и β = ∆n−2s P , где s ∈ N , а P — положительная коса, содержащая ∆n . Предположим, что {P1 , . . . , Pm } — множество
всех кос, полученных из ∆2n P с помощью соотношений в полугруппе πn и
всех циклических сдвигов. Тогда коса β явялется минус-приводимой, если и
только если в полугруппе πn выполняется равенство
Pi σn−1 = (σn−1 . . . σ2 σ12 σ2 . . . σn−1 )s+1 φn (Pi )
205
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
206
В. К. Шалашов
для некоторого i, 1 ≤ i ≤ m.
Две положительные косы P и Q равны на круге в полугруппе πn (P = Q),
если одну из них можно перевести в другую, используя определяющие соотношения полугруппы πn и преобразования вида AB 7→ BA. Через ∆n обозначается коса σ1 . . . σn−1 σ1 . . . σn−2 . . . σ1 σ2 σ1 .
Для n ≥ 3, s ∈ Z+ , и произвольного слова w из πn−1 введем следующие
обозначения:
τ (n, s, w) = (σn−1 . . . σ2 σ12 σ2 . . . σn−1 )s wσn−1 ,
[
T (n, s, w) = {P ∈ πn | P = τ (n, s, w)},
T (n, s) =
T (n, s, w),
w∈πn−1
R+ (n, s) = {∆n−2s P | P ∈ T (n, s)},
R+ (n)
[
R+ (n, s).
s∈Z+
Для n ≥ 3, s ∈ N+ , s ≥ 2, и произвольного слова w из πn−1 введем следующие
обозначения:
λ(n, s, w) = (σn−1 . . . σ2 σ12 σ2 . . . σn−1 )s wσn−2 . . . σ2 σ12 σ2 . . . σn−2 σn−1 ,
[
∆(n, s, w) = {P ∈ πn | P = λ(n, s, w)},
L(n, s) =
∆(n, s, w),
w∈πn−1
R− (n, s) = {∆n−2s P | ∆2 P ∈ L(n, s − 1)},
R− (n) =
[
s∈N
R− (n, s).
Коса β ∈ Bn называется приводимой (см. [1]), если она является плюсприводимой или минус-приводимой. Справедливо следующее утверждение.
Теорема 3 ([2]). Множество всех плюс-приводимых кос на n нитях совпадает с множеством R+ (n).
Множество всех минус-приводимых кос на n нитях совпадает с множеством R− (n).
Множество всех приводимых кос совпадает с множеством R+ (n) ∪ R− (n),
причем R+ (n) ∩ R− (n) = ∅.
Литература
[1] Joan S. Birman. Braids, Links, Mapping Class Groups. Princeton: Princeton
University Press, 1974.
[2] Шалашов В. К. Приводимые косы. Ярославль: ЯрГУ, 2007.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 515:142
Группы гомологий пространств
триангуляций двумерного симплекса
С. И. Яблокова
Ярославский государственный университет им. П. Г. Демидова
ул. Советская, 14, 150000 Ярославль, Россия
e-mail: yabl@univ.uniyar.ac.ru
В статье дается обзор результатов, полученных автором
за последние годы и касающихся вопросов вычисления групп гомологий пространств триангуляций симплекса.
Библиография: 11 названий.
1. Введение
Рассмотрим двумерный симплекс σ 2 = D0 D1 D2 , граница которого подразделена не более чем N новыми точками. Триангуляции с границы симплекса
продолжаются на внутренность двумя различными способами: либо без добавления новых точек разбиения, либо с добавлением единственной новой
точки разбиения в барицентре симплекса, которая и соединяется с точками
разбиения границы. Для каждого способа продолжения триангуляций с границы симплекса на его внутренность строится пространство триангуляций и
изучаются его группы гомологий.
В данной статье дается обзор результатов, полученных автором в работах
[1–9].
207
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
208
С. И. Яблокова
2. Группы гомологий пространства
квазибарицентрических триангуляций
двумерного симплекса
Квазибарицентрическими (или почти барицентрическими) будем называть триангуляции симплекса, получаемые таким продолжением триангуляций с его границы на внутренность, когда в барицентре симплекса добавляется единственная новая точка разбиения, которая и соединяется с
точками разбиения границы. Пространство квазибарицентрических триангуляций двумерного симплекса, имеющих не более чем N точек разбиения границы, представляет собой клеточный комплекс, обозначаемый
в дальнейшем W0 (∇N ). Структура этого комплекса подробно описана в
2
работах [1–3]. Показано, что комплекс W0 (∇N ) содержит Cn+2
n-мерных клеn
ток ∇p,q,s (p, q, s ≥ 0, p + q + s = n) для всех 0 ≤ n ≤ N. Клетка ∇np,q,s
соответствует триангуляциям симплекса, при которых его ребра подразделены не более чем p, q и s точками разбиения соответственно.
Отображение
π : T r(p, q, s) 7→ ∇np,q,s ,
ставящее в соответствие триангуляциям симплекса σ 2 соответствующие подразделения его границы, является взаимно однозначным, так как при выбранном способе разбиения симплекса триангуляции с границы симплекса
на его внутренность продолжаются однозначно.
В работе [5] вычисляются группы гомологий клеточного комплекса
LN
W0 (∇N ). С этой целью рассматривается цепной комплекс C =
n=0 Cn ,
N
соответствующий клеточному комплексу W0 (∇ ). Базис группы n-мерных
цепей Cn образуют n-мерные клетки, а оператор границы Cn+1 7→ Cn задает2
2
ся в этих базисах матрицей инцидентности n E размера Cn+2
× Cn+3
. В левом
n
указателе (входе) матрицы E выписываются все n-мерные клетки, а в верхнем — все (n+1)-мерные клетки комплекса W0 (∇N ), каждая с раз и навсегда
выбранной ориентацией; на пересечении i-й строки и j-го столбца ставится
коэффициент инцидентности j-й (n + 1)-мерной клетки с i-й n-мерной [5].
Далее матрицы инцидентности следует привести к канонической форме, изменяя базисы группы Cn , n = 0, 1, . . . , N, при помощи элементарных преобразований. При этом изменение базиса группы Cn влечет за собой согласованные между собой элементарные преобразования системы строк матрицы n E
и системы столбцов матрицы n−1 E. Поэтому следует одновременно рассматривать две последовательные матрицы инцидентности n−1 E и n E, проводя
в них согласованные элементарные преобразования систем столбцов и строк
соответственно.
Рассматриваются следующие элементарные преобразования столбцов
матрицы n−1 E:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Группы гомологий пространств триангуляций
209
1) перестановка i-го и j-го столбцов;
2) изменение знака всех элементов i-го столбца;
3) прибавление к i-му столбцу j-го столбца.
В матрице n E при этом будут происходить соответствующие согласованные преобразования:
1) перестановка i-й и j-й строк;
2) изменение знака всех элементов i-й строки;
3) вычитание i-й строки из j-й.
С помощью этих преобразований каждую из матриц инцидентности n E
(n = 0, 1, . . . , N − 1) можно привести к каноническому виду, когда отличные
от нуля числа стоят только на главной диагонали. Поскольку изменяться
должны все матрицы инцидентности, причем согласованно, то рассуждения
проводятся по индукции, начиная с n = 2. Матрицы инцидентности n E и
n+1
E клеточного комплекса W0 (∇N ) строятся в предположении, что n четно
(n = 2k). Последнее предположение не ограничивает общности, так как в
этом случае n + 1 нечетно.
Порядок, в котором расставляются n-клетки клеточного комплекса
W0 (∇N ) в базисе группы Cn , можно выбрать так, чтобы матрица n E приняла клеточный вид с ненулевыми клетками, стоящими только на главной
диагонали или рядом с ней.
Первыми в базисе группы Cn стоят клетки ∇nn,0,0 , ∇n0,n,0 , ∇n0,0,n , следующие в указанном порядке и образующие блок n An . Далее следует блок (группа клеток) n An−1 , содержащий клетки ∇nn−p,p,0 и ∇np,n−p,0 (1 ≤ p ≤ k), взятые
в следующем порядке
∇nn−1,1,0 , ∇n1,n−1,0 , ∇nn−2,2,0 , ∇n2,n−2,0 , . . . , ∇nk+1,k−1,0 , ∇nk−1,k+1,0 , ∇nk,k,0 ;
(2.1)
а также последовательности клеток вида ∇nn−p,0,p и ∇np,0,n−p (1 ≤ p ≤ k), и
∇n0,n−p,p и ∇n0,p,n−p (1 ≤ p ≤ k) с аналогичной (2.1) последовательностью вхождения клеток. Под блоком n Ap понимаем группу n-мерных клеток комплекса
W0 (∇N ), содержащую все клетки вида ∇nr1 ,r2 ,r3 , r1 + r2 + r3 = n, r1 , r2 , r3 > 0,
где один из индексов r1 , r2 , r3 равен p. Эти блоки располагаются в порядке
убывания индекса p. Внутри каждого блока клетки также разбиваются на
группы (подблоки), определяемые значениями двух индексов p и q, p ≥ q;
а именно, подблок (p, q, s) есть последовательность n-мерных клеток
∇np,q,s , ∇np,s,q , ∇nq,p,s , ∇ns,p,q , ∇nq,s,p , ∇ns,q,p ,
(2.2)
p + q + s = n, p ≥ q ≥ s. Подблоки
располагаются
в порядке убывания
n−p+1
индекса q = n − p − 1, n − p − 2, . . . ,
.
2
Аналогично строится базис в группе Cn+1 .
Такому разбиению базисов на блоки соответствует разбиение матрицы инцидентности n E на прямоугольные клетки n Au,v ; при этом клетка n Au,v стоит
на пересечении строк, отвечающих блоку n Au , и столбцов, отвечающих блоку
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
210
С. И. Яблокова
N
Av . Поскольку n-мерные грани клетки ∇n+1
p+1,q,s комплекса W0 (∇ ) имеют
вид ∇np,q,s , ∇np+1,q−1,s и ∇np+1,q,s−1 , то ненулевые элементы в матрице n E могут
получаться только в клетках вида n Au,u+1 и n Au,u , причем в каждом столбце
матрицы может быть не более трех ненулевых элементов. Поэтому клеточная
матрица n E имеет "ленточный"вид : ненулевые клетки стоят только на главной диагонали, начинающейся в левом верхнем углу матрицы и состоящей
из клеток вида n Au,u+1 u = n, n − 1, . . . , и на лежащей выше ее параллели,
состоящей из клеток n Au,u u = n, n − 1, · · · :


n
An,n+1
n


An−1,n


n
n


n
An−2,n−1 An−2,n−2
E=
(2.3)
,
n
n


A
A
n−3,n−2
n−3,n−3


...
...
n+1
причем n An−2t,n+1−2t = O (t = 0, 1, . . . ). Общий размер матрицы n E есть
2
2
Cn+2
× Cn+3
.
Коэффициенты инцидентности ℓ-мерной клетки ∇ℓp,q,s клеточного комплекса W0 (∇N ) с ее (ℓ − 1)-мерными гранями вычисляются по следующим
формулам (см. [3]):
(
(−1)q+s+1 , при четном p
[ ∇ℓp,q,s : ∇ℓ−1
]
=
p−1,q,s
0,
при нечетном p;
(
(−1)s+1 , при четном q
:
]=
0,
при нечетном q;
(
−1, при четном s
[ ∇ℓp,q,s : ∇ℓ−1
p,q,s−1 ] =
0,
при нечетном s.
[ ∇ℓp,q,s
∇ℓ−1
p,q−1,s
Следовательно, все ненулевые элементы матрицы n E равны ±1.
Все сказанное о клеточной структуре матрицы n E в полной мере отно2
2
сится к матрице n+1 E размера Cn+3
× Cn+4
, имеющей следующий вид:

 n+1
Bn+1,n+2
n+1


Bn,n+1


n+1
n+1 0


Bn−1,n
Bn−1,n−1
 , (2.4)

n+1
n+1 0


B
B
n−2,n−1
n−2,n−2 

...
...
причем n+1 Bn+1,n+2 = −E3 , n+1 Bn−2t,n+1−2t = O (t = 1, 2, . . . ).
Проводятся элементарные преобразования матрицы n E по столбцам (одновременно матрица n+1 E преобразуется по строкам), в результате матрица
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
211
Группы гомологий пространств триангуляций
n
E принимает следующий клеточный вид:

O
n

Ãn−1,n


O n An−2,n−2

n 0

An−3,n−2 O


O





где

n
A0n−4,n−4
n 0
An−5,n−4






,


O

... 
O

...
а матрица n+1 E — вид:

Bn+1,n+2

B̃n,n+1


Bn−1,n Bn−1,n−1


O
O


Bn−3,n−2 Bn−3,n−3


O
O

...
...







B̃i,i = 





−1
−1
−1

0
...
0
..
.
0






.





(2.5)






,




(2.6)
В [5] подробно описан вид клеток n Au,v и n+1 Bu,v = Bu,v и получены ранги
матриц инцидентности n E :

n2 + 4n



, если n четно
4
rang n E =

n2 + 4n + 7


, если n нечетно.
4
Группа гомологий Hn есть прямая сумма pn свободных циклических
групп Z и групп конечных порядков Znci (i = 1, . . . , ρn ), где pn — n-мерное
число Бетти, а cn1 , cn2 , . . . , cnρn — n-мерные коэффициенты кручения.
Поскольку ранги матриц n E посчитаны, то можно вычислить числа Бетти
pn комплекса W0 (∇N ) для всех n (0 ≤ n ≤ N ) по формулам:
p0 = 1,
p1 = α1 − rang 1 E,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
212
С. И. Яблокова
pn = αn − rang n E − rang
n−1
E
(n = 2, 3, . . . , N − 1),
где αn — число n-мерных клеток комплекса W0 (∇N ). В результате получаем
pn = 0
для всех (1 ≤ n ≤ N −1). Т. е. группы гомологий Hn (W0 (∇N )) при 0 < n < N
не содержат свободных абелевых групп.
Далее вычисляются коэффициенты кручения. Все матрицы инцидентности с помощью согласованных преобразований приводятся к канонической
форме с ±1 и 0 на главной диагонали, откуда следует, что подгруппы кручения в группах гомологий тривиальны. С учетом того, что pn = 0, для
0 < n < N − 1 получаем следующую теорему.
Теорема. Группы гомологий Hn клеточного комплекса W0 (∇N ) тривиальны при 0 < n < N.
3. Группы гомологий пространства
триангуляций симплекса, все вершины
которых лежат на его границе
В случае, когда триангуляции с границы симплекса σ 2 продолжаются
на его внутренность без добавления новых точек разбиения, отождествление множества разбиений ребер симплекса не более чем p, q и s (p, q, s ≥ 0,
p + q + s = n) точками соответственно (разбиение типа (p, q, s) ) с полиэдром
∇np,q,s , также дает естественное отображение
π : T r(p, q, s) 7→ ∇np,q,s ,
ставящее в соответствие триангуляциям симплекса σ 2 соответствующие подразделения его границы. Однако в этом случае отображение π не является
взаимно однозначным.
Будем считать, что каждому способу продолжения триангуляций с границы симплекса на его внутренность соответствует клетка (n-слой) ∇np,q,s , т. е.
рассмотрим конечное накрытие каждого полиэдра ∇np,q,s , число слоев которого соответствует количеству способов продолжения триангуляции с границы
на внутренность симплекса. Пространство таких триангуляций представляет собой клеточный комплекс W1 (∇N ), который строится аналогично комплексу W0 (∇N ). Разница состоит в том, что вместо каждой клетки ∇np,q,0
(∇np,0,q , ∇n0,p,q ), p + q = n, комплекса W0 (∇N ) комплекс W1 (∇N ) содержит Cnp
n-клеток (n-слоев), а вместо каждой клетки ∇np,q,s (p, q, s > 0, p + q + s = n)
комплекса W0 (∇N ) комплекс W1 (∇N ) содержит
p−1
Cn−1
+
q−1
Cn−1
+
s−1
Cn−1
+
q
p
X
X
i=1 j=1
p−i
s−1
Cp−i+j−1
Cq+s+i−j−1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Группы гомологий пространств триангуляций
213
n-клеток (n-слоев). В дальнейшем будем говорить, что данные n-клетки
(n- слои) входят в блок типа ∇np,q,s . Структура комплекса W1 (∇N ) подробно
описана в работах [4, 7, 8].
Для вычисления групп гомологий клеточного
комплекса W1 (∇N ) опять
L
воспользуемся цепным комплексом C =
n Cn , соответствующим данному
клеточному комплексу и построим матрицы инцидентности n E, задающие
оператор границы Cn+1 7→ Cn . Порядок вхождения n-мерных клеток ∇np,q,s в
базисе группы Cn оставим таким же, как в случае комплекса W0 (∇N ), т. е.
блоки n Au,v расставлены в том же порядке. Однако изменились размеры этих
блоков, поэтому упорядочим n-клетки внутри каждого блока.
Каждый блок ∇np,q,0 (∇np,0,q , ∇n0,p,q ), p + q = n, состоит из k(p,q,0) = Cnp
n-клеток комплекса W1 (∇N ). Упорядочим n-клетки внутри каждого блока,
исходя из следующих соображений.
В [4] было показано, что каждому способу продолжения триангуляции с
границы симплекса σ 2 на его внутренность без добавления новых точек разбиения (т. е. каждой n-клетке комплекса W1 (∇N ), принадлежащей данному
блоку) однозначно отвечает набор весов точек разбиения его ребер. (Весом
точки разбиения называем количество отрезков, выходящих из этой точки и
не лежащих на ребрах симплекса σ 2 .) В случае, когда точки разбиения находятся только на двух ребрах симплекса, сумма весов точек разбиения одного
из ребер должна быть максимальна, т. е. равна n.
Если обозначить u1 , u2 , . . . , up веса точек разбиения ребра D0 D1 ,
v1 , v2 , . . . , vq — веса точек разбиения ребра D1 D2 , то в блоке ∇np,q,0 разместим n-клетки в следующем порядке.
Первый подблок n-клеток, входящий в группу Cn , состоит из клеток комплекса W1 (∇N ), соответствующих наборам весов:
(1)
(n − p + 1, 1, . . . , 1; v1 , . . . , vq(1) ; 0),
(2)
(1, n − p + 1, 1, . . . , 1; v1 , . . . , vq(2) ; 0),
....................................
(p)
(1, 1, . . . , n − p + 1; v1 , . . . , vq(p) ; 0),
(1)
(u1 , . . . , u(1)
p ; n − q + 1, 1, . . . , 1; 0),
(2)
(u1 , . . . , u(2)
p ; 1, n − q + 1, 1, . . . , 1; 0),
....................................
(q)
(u1 , . . . , u(q)
p ; 1, 1, . . . , n − q + 1; 0),
следующих в указанном порядке.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
214
С. И. Яблокова
Следующий подблок состоит из n-клеток, соответствующих наборам весов:
(1)
(n − p, 2, 1, . . . , 1; ṽ1 , . . . , ṽq(1) ; 0),
(2)
(n − p, 1, 2, 1, . . . , 1; ṽ1 , . . . , ṽq(2) ; 0),
....................................
(p−1)
(n − p, 1, . . . , 1, 2; ṽ1
, . . . , ṽq(p−1) ; 0),
(p)
(2, n − p, 1, . . . , 1; ṽ1 , . . . , ṽq(p) ; 0),
....................................
(p2 −p)
(1, 1, . . . , 2, n − p; ṽ1
, . . . , ṽq(p
2 −p)
; 0),
(1)
(ũ1 , . . . , ũ(1)
p ; n − q, 2, 1, . . . , 1; 0),
(2)
(ũ1 , . . . , ũ(2)
p ; n − q, 1, 2, 1, . . . , 1; 0),
....................................
(q 2 −q)
2
(ũ1
, . . . , ũp(q −q) ; 1, 1, . . . , 2, n − q; 0),
следующих в указанном порядке.
Далее продолжаем формировать подблоки n-клеток аналогично, т. е.
уменьшаем на 1 вес u1 , фиксируем набор u2 , u3 , . . . , up такой, что u1 + u2 +
· · ·+up = n, u1 ≥ u2 ≥ · · · ≥ up , и рассматриваем всевозможные перестановки
этих весов. Затем аналогичную процедуру применяем к весам v1 , v2 , . . . , vq .
Последний подблок n-клеток в блоке ∇np,q,0 соотвествует наборам весов,
начинающихся с u1 = ⌊ n+1
⌋.
p
Аналогично определяется вторая группа (n + 1)-клеток в базисе группы
Cn+1 .
Остальные блоки n-клеток (соответственно (n + 1)-клеток) в базисе группы Cn (Cn+1 ) имеют тип ∇np,q,s (∇n+1
p,q,s ), где p, q, s > 0.
Упорядочим вхождение блоков ∇np,q,s в базис группы Cn .
Определение 3.1. Надблоком первого порядка Alp назовем группу блоков
l-клеток комплекса W1 (∇N ), содержащую все блоки ∇lr1 ,r2 ,r3 , r1 + r2 + r3 = l,
r1 , r2 , r3 > 0, где один из индексов r1 , r2 , r3 равен p.
Эти надблоки будем располагать в порядке убывания индекса p. Каждый из надблоков Alp разобьем на надблоки второго порядка, определяемые
значениями индексов p и q, p ≥ q.
Определение 3.2. Надблоком второго порядка назовем последовательность блоков l-клеток из Alp типов
∇lp,q,s , ∇lp,s,q , ∇lq,p,s , ∇ls,p,q , ∇lq,s,p , ∇ls,q,p ,
p + q + s = l, p ≥ q ≥ s, следующих в указанном порядке.
Надблоки второго порядка будем располагать в порядке убывания индекса q.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Группы гомологий пространств триангуляций
215
Поскольку каждый блок типа ∇np,q,s (p + q + s = n, p, q, s > 0) состоит из
k(p,q,s) =
p−1
Cn−1
+
q−1
Cn−1
+
s−1
Cn−1
+
q
p
X
X
p−i
s−1
Cp−i+j−1
Cq+s+i−j−1
i=1 j=1
n-клеток, то разобьем его на подблоки, упорядочивая входящие в этот блок
n-клетки.
Сначала разделим блок ∇np,q,s на две части. К первой отнесем n-клетки
комплекса W1 (∇N ), соответствующие триангуляциям симплекса σ 2 , определяемые такими наборами весов точек разбиения ребер симплекса, что сумма
весов точек разбиения одного из его ребер максимальна. В этой части соp−1
q−1
s−1
держится Cn−1
+ Cn−1
+ Cn−1
n-клеток комплекса W1 (∇N ), соответствующих
триангуляциям симплекса σ 2 без внутреннего подсимплекса τ 2 , вершины которого принадлежат трем ребрам σ 2 .
Ко второй части отнесем n-клетки, соответствующие триангуляциям симплекса σ 2 с внутренним подсимплексом τ 2 .
В первой из выделенных двух частей упорядочим входящие в нее
n-клетки, разбив их на подблоки аналогично тому, как это было сделано
для блоков типа ∇np,q,0 с той только разницей, что следует добавить третью
последовательность весов t1 , t2 , . . . , ts точек разбиения ребра D2 D0 , которая
будет изменяться так же, как и последовательности весов первых двух ребер.
Например, первый подблок состоит из n-клеток, соответствующих следующим наборам весов:
(1)
(1)
(n − p + 1, 1, . . . , 1; v1 , . . . , vq(1) ; t1 , . . . , t(1)
s ),
.............................................
(p)
(p)
(1, 1, . . . , n − p + 1; v1 , . . . , vq(p) ; t1 , . . . , t(p)
s ),
(1)
(p+1)
(u1 , . . . , u(1)
p ; n − q + 1, 1, . . . , 1; t1
, . . . , t(p+1)
),
s
.............................................
(q)
(p+q)
(u1 , . . . , u(q)
p ; 1, 1, . . . , n − q + 1; t1
(q+1)
(u1
(p+1)
, . . . , u(q+1)
; v1
p
, . . . , t(p+q)
),
s
, . . . , vq(p+1) ; n − s + 1, 1, . . . , 1),
......................................................
(q+s)
(u1
(p+s)
, . . . , u(q+s)
; v1
p
, . . . , vq(p+s) ; 1, 1, . . . , n − s + 1).
Упорядочивание n-клеток второй части связано с расположением вершин внутреннего подсимплекса τ 2 на ребрах σ 2 . В первый подблок входят
n-клетки, соответствующие таким триангуляциям σ 2 , в которых вершинами
τ 2 являются первые точки разбиения ребер D0 D1 и D1 D2 , а третья вершина
пробегает последовательно точки разбиения ребра D2 D0 ; при этом изменение весов точек разбиения трех подсимплексов σ 2 , два ребра которых лежат
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
216
С. И. Яблокова
на ребрах σ 2 , подчиняется тому же правилу, которое мы использовали для
триангуляций без внутреннего подсимплекса τ 2 .
Во второй подблок входят n-клетки, соответствующие таким триангуляциям симплекса σ 2 , в которых вершинами τ 2 являются: первая точка разбиения ребра D0 D1 , вторая точка разбиения ребра D1 D2 , а третья вершина
пробегает последовательно точки разбиения ребра D2 D0 и т. д.
После того как в качестве вершин τ 2 будут использованы все точки разбиения ребра D1 D2 , сдвигаем его вершину на ребре D0 D1 во вторую точку
разбиения этого ребра и повторяем процесс выделения подблоков и т. д.
Последний подблок состоит из n-клеток, соответствующих таким триангуляциям симплекса σ 2 , в которых двумя вершинами τ 2 являются последние
точки разбиения ребер D0 D1 и D1 D2 .
Аналогично строится базис в группе Cn+1 .
В [9] были построены матрицы инцидентности n E для малых n (n ≤ 5).
Размеры этих матриц быстро растут: 4 E — матрица размера 66 × 168, 5 E —
размера 168 × 416. К примеру 4 E имеет следующий клеточный вид:


0 J1 J2
 0

J3 J4


 0

J
J
5
6




G1
K1
M1




G
K
M
2
2
2




G3
K3
M3




G
K
M
4
4
4



,
G5
K5
M5




G
K
M
6
6
6




L
L
P
1
3
1




L2
L5
P2




L
L
P
4
6
3



N1
R1 R3 



N2
R2 R5 
N3
R4 R6
где клетки имеют следующие размеры:
Ji (i = 1, . . . , 6) — 1 × 5; Gi (i = 1, . . . , 6) — 4 × 5; Li (i = 1, . . . , 6) — 6 × 10;
Ki (i = 1, . . . , 6) — 4 × 10; Mi (i = 1, . . . , 6) — 4 × 11; Ni (i = 1, 2, 3) — 7 × 11;
Pi (i = 1, 2, 3) — 6 × 14; Ri (i = 1, . . . , 6) — 7 × 14.
В результате согласованных преобразований матриц инцидентности 0 E,
1
E, 2 E, 3 E, 4 E, 5 E, комплекса W1 (∇N ) были получены ранги этих матриц и
их канонический вид. Показано, что числа Бетти равны:
p1 = 0,
p2 = 0,
p3 = 1,
p4 = 0,
p5 = 0.
Кроме того, при приведении рассмотренных матриц к каноническому виду в
них не появилось ненулевых элементов, отличных от ±1, т. е. коэффициенты
кручения отсутствуют.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Группы гомологий пространств триангуляций
217
Полученный результат сформулируем в виде следующего утверждения.
Теорема. Пусть W1 (∇N ) — клеточный комплекс, представляющий собой
пространство триангуляций двумерного симплекса σ 2 с не более чем N новыми точками разбиения границы, соответствующее случаю, когда триангуляции продолжаются с границы симплекса на его внутренность без
добавления новых точек разбиения. Тогда группы гомологий Hn этого комплекса при n = 1, 2, 4, 5 тривиальны, а при n = 0, 3 представляют собой
бесконечную свободную циклическую группу.
Литература
[1] Яблокова С. И. Модель пространства почти барицентрических триангуляций двумерного симплекса. Предварительные построения // Вопросы теории групп и гомологической алгебры. Ярославль: ЯрГУ, 1991.
С. 111 – 122.
[2] Яблокова С. И. Модель пространства почти барицентрических триангуляций двумерного симплекса. О склейке // Качественные и приближенные методы исследования операторных уравнений. Ярославль: ЯрГУ,
1991. С. 98 – 110.
[3] Яблокова С. И. Модель пространства почти барицентрических триангуляций двумерного симплекса. Ориентация и склейка // Вопросы теории
групп и гомологической алгебры. Ярославль: ЯрГУ, 1992. С. 83 – 102.
[4] Яблокова С. И. Триангуляции двумерного симплекса, все вершины которых лежат на его границе // Вопросы теории групп и гомологической
алгебры. Ярославль: ЯрГУ, 1994. С. 69 – 87.
[5] Яблокова С. И. Группы гомологий пространства квазибарицентрических
триангуляций двумерного симплекса // Вопросы теории групп и гомологической алгебры. Ярославль: ЯрГУ, 2003. С. 270 – 298.
[6] Яблокова С. И. О группах гомологий некоторых пространств триангуляций двумерного симплекса // Современные проблемы математики, физики и физико-математического образования. Ярославль: ЯГПУ, 2003.
С. 8–10.
[7] Yablokova S. I. The polyhedron of boundary subdivisions // Вопросы теории групп и гомологической алгебры. Ярославль: ЯрГУ, 1998.
С. 267 – 273.
[8] Yablokova S. I. The space of triangulations of the 2-simplex without interior
vertices // Вопросы теории групп и гомологической алгебры. Ярославль:
ЯрГУ, 1998. С. 275 – 283.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
218
С. И. Яблокова
[9] Яблокова С. И. О группах гомологий пространства триангуляций двумерного симплекса, все вершины которых лежат на его границе //
Математика, кибернетика, информатика: труды международной научной конференции памяти А. Ю. Левина. Ярославль: ЯрГУ, 2008.
C. 183 – 196.
[10] Ефремович В. А., Чернавский А. В. Элементы топологии. Ярославль:
ЯрГУ, 1997.
[11] Хилтон П., Уайли С. Теория гомологий. Москва: Мир, 1966.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Научное издание
Математика
в Ярославском университете
Сборник обзорных статей
К 35-летию математического факультета
Редактор, корректор М. В. Никулина
Компьютерная верстка А. Ю. Ухалов
Подписано в печать 29.09.2011. Формат 60×84 1/8.
Бумага тип. Усл. печ. л. 25,56. Уч.-изд. л. 12,0
Тираж 55 экз. Заказ
Оригинал-макет подготовлен
редакционно-издательским отделом
Ярославского государственного университета им. П. Г. Демидова.
150000, г. Ярославль, ул. Советская, 14.
Отпечатано на ризографе.
ООО «Ремдер» ЛР ИД № 06151 от 26.10.2001.
Ярославль, пр. Октября, 94, оф. 37.
тел. (4852) 73-35-03, 58-03-48, факс 58-03-49.
Документ
Категория
Без категории
Просмотров
34
Размер файла
2 383 Кб
Теги
университета, ярославской, 1478, математика
1/--страниц
Пожаловаться на содержимое документа