close

Вход

Забыли?

вход по аккаунту

?

270.Вестник Томского государственного университета. Управление, вычислительная техника и информатика №3 2012

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО
МИНИСТЕРСТВО
ОБРАЗОВАНИЯ УНИВЕРСИТЕТА
И НАУКИ РФ
Управление, вычислительная техника и информатика
2012
№ 3(20)
ВЕСТНИК
ТОМСКОГО
ГОСУДАРСТВЕННОГО
УНИВЕРСИТЕТА
УПРАВЛЕНИЕ,
ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА
И ИНФОРМАТИКА
TOMSK STATE UNIVERSITY
JOURNAL OF CONTROL AND COMPUTER SCIENCE
Научный журнал
2012
№ 3(20)
Свидетельство о регистрации: ПИ № ФС 77-29497
от 27 сентября 2007 г.
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2
В.В. Домбровский, Т.Ю. Объедко
РЕДАКЦИОННАЯ КОЛЛЕГИЯ ЖУРНАЛА
«ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА.
УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА»
Горцев А.М., д-р техн. наук, проф. (председатель); Смагин В.И., д-р техн. наук, проф.
(зам. председателя); Лопухова С.В., канд. физ.-мат. наук, доц. (отв. секретарь); Агибалов Г.П.,
д-р техн. наук, проф.; Дмитриев Ю.Г., д-р физ.-мат. наук, проф.; Домбровский В.В.,
д-р техн. наук, проф.; Змеев О.А., д-р физ.-мат. наук, проф.; Евтушенко Н.В., д-р техн. наук, проф.; Конев В.В., д-р физ.-мат. наук, проф.; Костюк Ю.Л., д-р техн. наук, проф.; Кошкин Г.М., д-р физ.-мат. наук, проф.; Матросова А.Ю., д-р техн. наук, проф.; Назаров А.А.,
д-р техн. наук, проф.; Параев Ю.И., д-р техн. наук, проф.; Поддубный В.В., д-р техн.
наук, проф.; Сущенко С.П., д-р техн. наук, проф.; Тарасенко Ф.П., д-р техн. наук, проф.;
Хорошевский В.Г. , д-р техн. наук, проф., член-корр. РАН; Enzo Orsingher, Prof., University
of Rome (Italy); Paolo Prinetto, Prof., Polytechnic Institute Turine (Italy); Yervant Zorian, PhD,
Vice President & Chief Scientist, Virage Logic Corp., Fremont, CA (USA).
Научный журнал «Вестник Томского государственного университета. Управление, вычислительная техника и информатика» был выделен в самостоятельное периодическое издание из общенаучного журнала «Вестник Томского государственного университета» в
2007 г. Журнал зарегистрирован в Федеральной службе по надзору в сфере массовых коммуникаций, связи и охраны культурного наследия (свидетельство о регистрации ПИ № ФС
77-29497 от 27 сентября 2007 г.), ему присвоен международный стандартный номер сериального издания (ISSN 1998-8605). С 2010 г. журнал входит в Перечень ВАК. Журнал выходит ежеквартально и распространяется по подписке, его подписной индекс 44031 в объединённом каталоге «Пресса России».
В журнале «Вестник ТГУ. УВТиИ» публикуются результаты теоретических и прикладных исследований вузов, научно-исследовательских, проектных и производственных организаций в области управления, вычислительной техники и информатики в технических,
экономических и социальных системах.
Тематика публикаций журнала:
• УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
• МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
• ОБРАБОТКА ИНФОРМАЦИИ
• ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
• ДИСКРЕТНЫЕ ФУНКЦИИ И АВТОМАТЫ
• ПРОЕКТИРОВАНИЕ И ДИАГНОСТИКА ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
Правила оформления статей приведены на сайте: http://vestnik.tsu.ru/informatics/
Адрес редакции:
634050, г. Томск, пр. Ленина, д.36, корп. 2, к. 201
Электронный адрес: http://vestnik.tsu.ru
Контактный тел./факс: (3822) 529-599
E-mail: vestnik_uvti@mail.tsu.ru
ООО «Издательство научно-технической литературы»
634050, Томск, пл. Новособорная, 1, тел. (3822) 533-335
Редактор Т.С. Портнова
Верстка Д.В. Фортеса
Изд. лиц. ИД № 04000 от 12.02.2001. Подписано к печати 10.09.2012.
Формат 70 × 100 1/16. Бумага офсетная. Печать офсетная. Гарнитура «Таймс».
Усл. п. л. 11,77. Уч.-изд. л. 13,18. Тираж 300 экз. Заказ № 43.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
СОДЕРЖАНИЕ
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
Домбровский В.В., Объедко Т.Ю. Управление с прогнозированием взаимосвязанными гибридными системами с марковскими скачками при ограничениях......................5
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Демиденко Н.Д. Моделирование статических и динамических режимов в трубчатых печах................................................................................................................................13
ОБРАБОТКА ИНФОРМАЦИИ
Аверина Т.А. Алгоритм анализа систем управления ансамблем траекторий с учетом случайного изменения структуры и скачков ...............................................................22
Горцев А.М., Соловьев А.А. Совместная плотность вероятностей длительности
интервалов MAP-потока событий и условия его рекуррентности ....................................32
Дмитриев Ю.Г., Курицина С.В. Об использовании дополнительной информации в
статистическом оценивании параметров детерминационного анализа ............................42
Дмитриев Ю.Г. Об оценках вероятностей при наличии данных с пропусками ...................50
Кошкин Г.М., Глухова И.Ю. Непараметрическая идентификация нелинейных
ARX-процессов......................................................................................................................55
Малинковский Ю.В., Боярович Ю.С. Инвариантность стационарного распределения состояний открытой сети массового обслуживания с временно неактивными заявками.......................................................................................................................62
Медведев Г.А. О временной структуре доходности. 3. Однофакторная модель Даффи – Кана................................................................................................................................71
Моисеев А.Н., Моисеева С.П. Исследование входящего потока для GRID-системы
с адаптируемым выделением вычислительных ресурсов ..................................................81
Наумов А.А., Авдеенко Т.В. К эффективности интеграционных кластеров........................88
Поддубный В.В., Романович О.В. Комбинаторно-аналитический метод максимизации негладкой точной нижней границы множества вогнутых гладких функций, зависящих от параметра ...............................................................................................96
Михеев П.А., Сущенко С.П. Анализ быстродействия беспроводной ЛВС........................108
ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
Бабанов А.М., Скачкова А.С. Синонимия в ERM-модели и проблемы обеспечения
непротиворечивости и пополнения ERM-схем.................................................................121
ПРОЕКТИРОВАНИЕ И ДИАГНОСТИКА ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
Matrosova A.Yu., Nikolaeva E.A., Ostanin S.A., Singh V. Robust PDFs testing of
combinational circuits based on covering BDDs...................................................................129
Melnikov A.V. Observability estimation of a state variable when the LOS technique is
applied...................................................................................................................................139
СВЕДЕНИЯ ОБ АВТОРАХ ......................................................................................................145
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
TOMSK STATE UNIVERSITY
2012
Journal of Control and Computer Science
No. 3(20)
CONTENTS
CONTROL OF DYNAMICAL SYSTEMS
Dombrovskii V.V., Obyedko T.Yu. Model predictive control of interconnected hybrid
systems with Markov jumps under constraints..........................................................................5
MATHEMATICAL MODELLING
Demidenko N.D. Modeling of static and dynamic regimes in tube furnaces................................13
DATА PROCESSING
Averina T.A. Algorithm for analysis of ensemble paths control systems subjected to the
random change of structure and jumps....................................................................................22
Gortzev A.M., Soloviev A.A. The joint density of probability intervals MAP of the flow
of events and conditions of its recurrence ...............................................................................32
Dmitriev Yu.G., Kuritsina S.V. On the use of an additional information in statistical estimate parameter of determinate analysis ................................................................................42
Dmitriev Yu.G. On estimates of the probabilities with missing data ...........................................50
Koshkin G.M., Glukhova I.Yu. Nonparametric identification of nonlinear ARX – processes ........................................................................................................................................55
Malinkovsky Yu.V., Bojarovich Ju.S. Stationary distribution invariance of an open
queueing network with temporarily non-active customers ......................................................62
Medvedev G.A. On term structure of yield rates. 3. The Duffie – Kan one-factor model ............71
Moiseev A.N., Moiseeva S.P. Investigation of input flow for the GRID-system with
adaptive providing of computing resources.............................................................................81
Naumov A.A., Avdeenko T.V. To effectiveness of cluster integration........................................88
Poddubny V.V., Romanovich O.V. Combinatorial-analytical method for maximizing of
nonsmooth greatest lower boundary of the set of smooth concave functions depending
on the parameter ......................................................................................................................96
Mikheev P.A., Sushchenko S.P. Wireless LAN performance analysis......................................108
INFORMATICS AND PROGRAMMING
Babanov A.M., Skachkova A.S. ERM-model’s synonymy and problems of scheme consistency and completeness ensuring ......................................................................................121
DESIGNING AND DIAGNOSTICS OF COMPUTER SYSTEMS
Matrosova A.Yu., Nikolaeva E.A., Ostanin S.A., Singh V. Robust PDFs testing of
combinational circuits based on covering BDDs...................................................................129
Melnikov A.V. Observability estimation of a state variable when the LOS technique is
applied...................................................................................................................................139
BRIEF INFORMATION ABOUT THE AUTHORS ..................................................................145
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
УДК 519.865.5
В.В. Домбровский, Т.Ю. Объедко
УПРАВЛЕНИЕ С ПРОГНОЗИРОВАНИЕМ
ВЗАИМОСВЯЗАННЫМИ ГИБРИДНЫМИ СИСТЕМАМИ
С МАРКОВСКИМИ СКАЧКАМИ ПРИ ОГРАНИЧЕНИЯХ
В работе рассматривается задача синтеза оптимальных стратегий управления с прогнозирующей моделью для гибридных систем, состоящих из подсистем, с учетом ограничений на управляющие переменные. Параметры каждой из подсистем изменяются в соответствии с эволюцией марковских цепей, состояния которых взаимосвязаны между собой.
Ключевые слова: управление с прогнозирующей моделью, взаимосвязанные
гибридные системы, векторная односвязная цепь Маркова, ограничения.
Широкий класс реальных систем имеет непрерывно-дискретную природу. Динамика таких систем описывается уравнениями, включающими непрерывные переменные, в то время как структура системы (параметры) изменяется в соответствии с эволюцией переменных, принимающих дискретный набор значений из некоторого множества. Динамические системы, имеющие такую непрерывнодискретную природу, называются гибридными системами [1, 2].
В [3, 4] рассматриваются задачи управления линейными гибридными системами, структура которых зависит от состояния однородной марковской цепи.
В этих работах не учитываются ограничения на управляющие переменные, в то
время как на практике такие ограничения часто присутствуют.
Эффективным подходом к синтезу стратегий управления при ограничениях
является метод управления с прогнозирующей моделью [5]. В [6−8] рассматривается задача управления с прогнозированием для гибридных систем, параметры
которых изменяются в соответствии с эволюцией одномерной марковской цепи, с
учетом ограничений на управления. Важной областью приложений таких систем
является финансовая инженерия, где подобные модели используются для описания инвестиционного портфеля на финансовом рынке с переключающимися режимами [8].
Современные системы управления, как правило, состоят из взаимодействующих подсистем неоднородной непрерывно-дискретной природы. В частности, инвестиционный портфель представляет собой сложную систему и может содержать
рисковые финансовые активы разных классов, динамика доходностей которых
меняется скачкообразно в соответствии с эволюцией состояний взаимосвязанных
марковских цепей, характеризующих, например, поведение различных секторов
экономики [9].
В данной работе получены уравнения синтеза оптимальных стратегий управления с прогнозирующей моделью для гибридных систем, состоящих из подсис-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Домбровский, Т.Ю. Объедко
6
тем, с учетом явных ограничений на управляющие переменные. При этом параметры каждой из подсистем изменяются в соответствии с эволюцией марковских
цепей, состояния которых взаимосвязаны между собой.
1. Постановка задачи
Пусть система состоит из совокупности подсистем, состояния которых описываются уравнениями
x ( q ) (k + 1) = A( q ) x ( q ) (k ) + B ( q ) [α( q ) (k + 1), k + 1]u ( q ) (k ), q = 1, 2,...s,
(1)
где x(q)(k) – nx( q ) -мерный вектор состояния q-й подсистемой, u(q)(k) – nu( q ) -мерный
вектор управления q-й подсистемой; A(q), B(q)[α(q)(k),k] – матрицы соответствующих размерностей; α(q)(k) – скалярная однородная цепь Маркова с конечным множеством состояний {1, 2,…,νq}. Таким образом, каждая из подсистем может находиться в νq состояниях, определяемых скалярным случайным процессом с дискретным множеством значений (состояний).
Между подсистемами существует взаимосвязь: состояние цепи α(q)(k) q-й подсистемы (q = 1,2,…,s) в k-й момент времени зависит от состояний цепей α(r)(k−1)
(r = 1,2,…,s) в момент времени k−1. Таким образом, динамика системы в целом
зависит от дискретного векторного случайного процесса α(k) = [α(1)(k),α(2)(k),
…,α(s)(k)]T с конечным множеством состояний {q, jq} (q = 1,2,…,s; jq = 1,2,…,νq) и
дискретным временем. Случайный процесс α(k) представляет собой векторную
односвязную цепь Маркова.
Для векторной цепи вероятности перехода за один шаг определяются в виде
Pi1 ,...,is ; j1 ,..., js = P {α1 (k + 1) = α1 j1 ,..., α s (k + 1) = α sjs α1 (k ) = α1i1 ,..., α s (k ) = α sis } ,
∑
j1 ,..., js
Pi1 ,...,is ; j1 ,..., js = 1
с начальным распределением
p j1 ,..., js = P {α1 (0) = j1 ,..., α s (0) = js } , ( j1 = 1, ν1 ;...; js = 1, ν s ),
∑
j1 ,..., js
p j1 ,..., js = 1.
Предполагается, что состояние векторной марковской цепи в момент времени
k доступно наблюдению.
На управляющие воздействия каждой из подсистем накладываются ограничения:
(q)
(q)
umin
(k ) ≤ S ( q ) (k )u ( q ) (k ) ≤ umax
(k ), q = 1, 2,..., s,
(2)
(q)
где S (k) – матрицы соответствующих размерностей.
Необходимо определить закон управления системой, состоящей из подсистем
вида (1), при ограничениях (2) из условия минимума критерия со скользящим горизонтом управления
s
m
J (k + m / k ) = M {∑∑ ( x ( q ) (k + i ))T R1( q ) (k , i ) x( q ) (k + i ) − R2( q ) (k , i ) x ( q ) (k + i ) +
q =1 i =1
+ (u
(q)
}
(k + i − 1/ k ))T R ( q ) (k , i − 1)u ( q ) (k + i − 1/ k ) x ( q ) (k ), α(k ) ,
(3)
где u ( q ) (k + l / k ), l = 0,1,..., (m − 1) – последовательность прогнозирующих управлений q-й подсистемой, u(q)(k) = u(q)(k/k), M{a/b} – оператор условного математи-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Управление с прогнозированием взаимосвязанными гибридными системами
7
ческого ожидания, R1( q ) (k , i ) ≥ 0, R2( q ) (k , i ) ≥ 0, R ( q ) (k , i ) > 0 – весовые матрицы
соответствующих размерностей, m – горизонт прогноза, k – текущий момент времени.
2. Синтез стратегий управления с прогнозированием
Для решения сформулированной задачи используем методологию управления
с прогнозирующей моделью. Данный подход позволяет получить стратегии
управления с обратной связью с учетом ограничений на управляющие воздействия.
Стратегии управления с прогнозированием определяются по следующему правилу. На каждом шаге k минимизируем функционал (3) по последовательности
прогнозирующих управлений u(q)(k/k), …,u(q)((k+m−1)/k), q = 1,2,...,s, зависящих от
состояния подсистемы в момент времени k, при ограничениях (2). В качестве
управления в момент времени k берем u(q)(k) = u(q)(k/k). Тем самым получаем
управление q-й подсистемой u(q)(k) как функцию состояний x(q)(k) и α(k), т.е.
управление с обратной связью. Чтобы получить управление u(q)(k+1) на следующем шаге, процедура повторяется для следующего момента k + 1 и т.д.
Если цепи Маркова α(q)(k) (q = 1,…,s) независимы между собой (состояния
подсистем не зависят от состояний других подсистем), то есть представляют собой однородные скалярные цепи Маркова, то каждая из них допускает следующее
представление в пространстве состояний [10]:
θ( q ) (k + 1) = P ( q ) θ ( q ) (k ) + υ( q ) (k + 1),
(q)
(q)
(q)
T
(4)
(q)
где θ (k) = [δ(α (k),1),…,δ(α (k),νq)] , δ(α (k),j) – функция Кронекера
(j = 1,…νq); P(q) – матрица переходных вероятностей для q-й цепи; υ(q)(k) – мартингал-разность.
Обобщим соотношение (4) для скалярных цепей на случай векторных однородных цепей Маркова.
Введем мультииндексы i = (i1,i2,…,is), j = (j1,j2,…,js). Тогда матрицу вероятностей перехода за один шаг векторной цепи Маркова можно представить в виде
P = (Pij), где
Pij = Pi1 ,...,is ; j1 ,..., js ;(i1 = 1, ν1 ;...; is = 1, ν s ; j1 = 1, ν1 ;...; js = 1, ν s ).
Матрица P обладает свойством
∑ Pij = 1, ∀i.
j
Введем вектор θ(k) = [δ(α(k),1),…,δ(α(k),ν)]T, ν = ν1×ν2×...×νs. Значение вектора
θ(k) соответствует комбинации состояний одномерных цепей Маркова.
Тогда для многомерной цепи можно записать представление в пространстве
состояний, аналогичное (4):
θ(k + 1) = Pθ(k ) + υ(k + 1).
(5)
Мартингал-разность υ(k) имеет следующие условные характеристики [10]:
M {υ(k + 1) / θ(k )} = 0,
(6)
C (k + 1) = M { υ(k + 1) υT (k + 1) / θ(k )} = diag{Pθ(k )} − Pdiag{θ(k )}PT .
(7)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Домбровский, Т.Ю. Объедко
8
С учетом (5) уравнения для подсистем (1) можно представить в следующем
виде:
x ( q ) (k + 1) = A( q ) x ( q ) (k ) + B ( q ) [θ(k + 1), k + 1]u ( q ) (k ), q = 1, 2,...s,
(8)
ν
B ( q ) [θ(k ), k ] = ∑ θi (k ) Bi ( q ) (k ) .
где
(9)
i =1
Здесь θi(k), i = 1,2, …,ν, – компоненты вектора θ(k), {Bi(q)}, i = 1,…,ν, – множество
значений матрицы B(q)[α(k),k].
Критерий (3) примет вид
s
m
J ((k + m) / k ) = M {∑∑ ( x ( q ) (k + i ))T R1( q ) (k , i ) x( q ) (k + i ) − R2( q ) (k , i ) x( q ) (k + i ) +
q =1 i =1
}
+(u ( q ) ((k + i − 1) / k ))T R ( q ) (k , i − 1)u ( q ) ((k + i − 1) / k ) x ( q ) (k ),θ(k ) .
(10)
Теорема. Векторы прогнозирующих управлений
(
U ( q ) (k ) = ⎡ u ( q ) (k / k )
⎣⎢
) , ( u (q) ((k + 1) / k ) )
T
T
(
,…, u ( q ) ((k + m − 1) / k )
T T
)
⎤ , q = 1, 2,..., s,
⎦⎥
минимизирующие критерий (3) при ограничениях вида (2), на каждом шаге k определяются из решения задачи квадратичного программирования с критерием вида
Y ((k + m) / k ) = ⎡⎣ 2 xT (k )G (k ) − F (k ) ⎤⎦ U (k ) + U T (k ) H (k )U (k )
(11)
при ограничениях
(q)
U min
(k ) ≤ S
(q)
(q)
(k )U ( q ) (k ) ≤ U max
(k ).
(12)
Оптимальное управление для q-й подсистемы равно
u ( q ) (k ) = ⎡⎢ I n ( q )
⎣ u
0n ( q ) ⎤⎥ U ( q ) (k ),
⎦
u
0n ( q )
u
(13)
где I n ( q ) – единичная матрица размерности nu ( q ) , 0n ( q ) – квадратная нулевая матu
u
рица размерности nu ( q ) ,
(
U (k ) = ⎡ U (1) (k )
⎢⎣
S
(q)
) , (U (2) (k ) )
T
T
(
, …, U ( s ) ( k )
T T
)
⎤ ,
⎥⎦
(k ) = diag( S ( q ) (k ),..., S ( q ) ( k + m − 1)),
(q)
(q)
(q)
U min
(k ) = [(umin
(k ))T ,..., (umin
(k + m − 1))T ]T ,
(q)
(q)
(q)
U max
(k ) = [(umax
(k ))T ,..., (umax
(k + m − 1))T ]T ,
H(k), G(k), F(k) – блочные матрицы вида
H (k ) = diag H (1) (k ), H (2) (k ),..., H ( s ) (k ) ,
(
)
(14)
G (k ) = ⎡⎣G (1) (k ) G (2) (k )
G ( s ) (k ) ⎤⎦ ,
F (k ) = ⎡⎣ F (1) (k ) F (2) (k )
F ( s ) (k ) ⎤⎦ ,
(15)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Управление с прогнозированием взаимосвязанными гибридными системами
⎡ H ( q ) (k ) H ( q ) (k )
12
⎢ 11
(q)
⎢
H (k ) H ( q ) (k )
22
H ( q ) (k ) = ⎢ 21
⎢
⎢ H ( q ) (k ) H ( q ) (k )
⎣
m1
H ( q ) (k ) ⎤
1m
⎥
H ( q ) (k ) ⎥
2m
⎥ , q = 1, 2,..., s ;
⎥
H ( q ) (k ) ⎥⎦
mm
m2
G ( q ) (k ) = ⎡⎣G1( q ) (k ) G2( q ) (k )
Gm( q ) (k ) ⎤⎦ ,
F ( q ) (k ) = ⎡⎣ F1( q ) (k ) F2( q ) (k )
Fm( q ) (k ) ⎤⎦ ,
9
(16)
(17)
блоки которых равны
H tt( q ) (k ) = R ( q ) (k , t − 1) +
ν
ν
(
+ ∑∑ B (jq ) (k + t )
ν
j =1 r =1
ν t
)
T
)
T
⎡ E P t −l C ( k + l ) P t −l
⎢⎣ r
(
)
T
⎡ E P f θ(k )θT (k ) P t
⎣⎢ r
j =1 r =1 l =1
ν
⎡ E Pt θ(k )θT (k ) Pt
⎢⎣ r
(
+ ∑∑∑ B (jq ) (k + t )
ν
( )
T
H tf( q ) (k ) = ∑∑ B (jq ) (k + t )
j =1 r =1
ν ν t
(
+ ∑∑∑ B (jq ) (k + t )
j =1 r =1 l =1
Gt( q ) (k ) =
(
E Tj ⎤Q ( q ) (m − t ) Br( q ) (k + t ) +
⎥⎦
)
T
( )
)
T
T
(
⎡ E P f −l C ( k + l ) P t −l
⎢⎣ r
E Tj ⎤Q ( q ) (m − t ) Br( q ) (k + t );
⎥⎦
(18)
E Tj ⎤Q ( q ) (m − f ) Br( q ) (k + f ) +
⎦⎥
)
T
E Tj ⎤
⎥⎦
(( A ) )
(q) T
f −t
×
×Q ( q ) (m − f ) Br( q ) (k + f ), f > t ;
(19)
( ( Α( q ) ) )
(20)
t T
ν
Q ( q ) (m − t )∑ E j P t θ(k ) B (jq ) (k + t );
m
j =1
(
(21)
Q ( q ) (t − 1) A( q ) + R1( q ) (k , m − t ), (t = 1, m);
(22)
j =t
(
Q ( q ) (t ) = A( q )
)
T
j −t ν
) ∑ Er Pt θ(k ) Br(q) (k + t );
Ft( q ) (k ) = ∑ R2( q ) (k , j ) A( q )
r =1
Q ( q ) (0) = R1( q ) (k , m).
(23)
Доказательство теоремы. Критерий (10) можно представить в следующем
виде:
s
J (k + m / k ) = ∑ M {( X
(q)
q =1
−∆ (2q ) (k
+ 1) X
(q)
(k + 1) + (U
(q)
(k + 1))T ∆1( q ) (k + 1) X ( q ) (k + 1) −
T
(k )) ∆
(q)
(k )U
(q)
(k ) / x
(q)
}
(24)
(k ),θ(k )
при X ( q ) (k + 1) = Ψ ( q ) x ( q ) (k ) + Φ ( q ) [Ξ (k + 1), k + 1]U ( q ) (k ),
(25)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Домбровский, Т.Ю. Объедко
10
где
⎡ x ( q ) (k + 1) ⎤
⎡
⎤
u ( q ) (k / k )
⎡ θ(k + 1) ⎤
⎢ (q)
⎥
⎢ (q)
⎥
⎢ θ(k + 2) ⎥
x (k + 2) ⎥
u ((k + 1) / k ) ⎥
X ( q ) (k + 1) = ⎢
, U ( q ) (k ) = ⎢
, Ξ(k + 1) = ⎢
⎥,
⎢
⎥
⎢
⎥
...
...
⎢ ... ⎥
⎢ (q)
⎥
⎢ (q)
⎥
⎢⎣θ(k + m) ⎥⎦
⎣ x ( k + m) ⎦
⎣u ((k + m − 1) / k ) ⎦
(
Ψ ( q ) = ⎡ A( q )
⎢⎣
) , ( ( A(q) )2 )
T
T
(
,..., ( A( q ) )m
T T
)
⎤ ,
⎥⎦
Φ ( q ) [Ξ(k +1), k +1] =
⎡
B ( q ) [θ(k +1), k +1]
0n( q ) ×n( q )
x
u
⎢
⎢ A ( q ) B ( q ) [θ(k +1), k +1]
B ( q ) [θ(k + 2), k + 2]
=⎢
...
...
⎢
⎢ ( q ) m−1 ( q )
( q ) m− 2 ( q )
⎣( A ) B [θ(k +1), k +1] ( A ) B [θ(k + 2), k + 2]
⎤
⎥
⎥
...
0n( q ) ×n( q )
x
u
⎥,
...
...
⎥
⎥
... B ( q ) [θ(k + m), k + m]⎦
...
0n( q ) ×n( q )
x
u
(
)
∆1( q ) (k + 1) = diag ( R1( q ) (k ,1), R1( q ) (k , 2),..., R1( q ) (k , m) ) ,
∆ ( q ) (k ) = diag R ( q ) (k , 0), R ( q ) (k ,1),..., R ( q ) ( k , m − 1) ,
∆ (2q ) (k + 1) = ⎡⎣ R2( q ) (k ,1) R2( q ) (k , 2) ... R2( q ) (k , m) ⎤⎦ .
Приведем (25) к виду
T
J (k + m / k ) = M { X (k + 1)∆1 (k + 1) X (k + 1) − ∆ 2 (k + 1) X (k + 1) +
+U T (k )∆(k )U (k ) / x(k ),θ(k )};
(26)
X (k + 1) = Ψx(k ) + Φ[Ξ (k + 1), k + 1]U (k ),
(27)
где
X (k ) = [( X (1) (k ))T , ( X (2) (k ))T ,..., ( X ( s ) (k ))T ]T ,
x(k ) = [( x (1) (k ))T , ( x (2) (k ))T ,..., ( x ( s ) (k ))T ]T ,
∆ (k + 1) = diag(∆ (1) , ∆ (2) ,..., ∆ ( s ) ),
∆1 (k + 1) = diag(∆1(1) , ∆1(2) ,..., ∆1( s ) ),
(2)
(s)
⎤
∆ 2 (k + 1) = ⎡⎣ ∆ (1)
2 , ∆ 2 ,..., ∆ 2 ⎦ ,
U (k ) = [(U (1) (k ))T , (U (2) (k ))T ,..., (U ( s ) (k ))T ]T ,
(
Ψ = ⎡ Ψ (1)
⎢⎣
(
)
T
(
,..., Ψ ( s )
T T
)
⎤ ,
⎥⎦
)
Φ[Ξ(k ), k ] = diag Φ (1) [Ξ (1) (k ), k ],..., Φ ( s ) [Ξ ( s ) (k ), k ] .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Управление с прогнозированием взаимосвязанными гибридными системами
11
С учетом (27) представим (26) в следующем виде:
J ((k + m) / k ) = xT (k )ΨT ∆1 (k + 1)Ψx(k ) +
+ ⎡⎣ 2 xT (k )ΨT ∆1 (k + 1) − ∆ 2 (k + 1) ⎤⎦ M {Φ [ Ξ (k + 1), k + 1] x(k ),θ(k )}U (k ) +
(28)
}
{
+U T (k ) ⎡⎣ M ΦT [ Ξ(k + 1), k + 1] ∆1 (k + 1)Φ [ Ξ (k + 1), k + 1] x(k ), θ(k ) + ∆ (k ) ⎤⎦ U (k ).
Определим матрицы:
{
H (k ) = M ΦT [ Ξ(k + 1), k + 1] ∆1 (k + 1)Φ [ Ξ (k + 1), k + 1] x(k ), θ(k )} + ∆ (k ),
G (k ) = ΨT ∆1 (k + 1) M {Φ [ Ξ (k + 1), k + 1] x(k ),θ(k )} ,
F (k ) = ∆ 2 (k + 1) M {Φ [ Ξ(k + 1), k + 1] x(k ),θ(k )} .
Матрицы H(k), G(k), F(k) можно представить в блочном виде:
(
)
H (k ) = diag H (1) (k ), H (2) (k ),..., H ( s ) (k ) ,
G (k ) = ⎡⎣G (1) (k ) G (2) (k )
G ( s ) (k ) ⎤⎦ , F (k ) = ⎡⎣ F (1) (k ) F (2) (k )
F ( s ) (k ) ⎤⎦ ,
H ( q ) (k ) = ⎡⎣ H ij( q ) ⎤⎦ , i, j = 1, 2,..., m,
где
G ( q ) (k ) = ⎡⎣G1( q ) (k ) G2( q ) (k )
Gm( q ) (k ) ⎤⎦ ,
F ( q ) (k ) = ⎡⎣ F1( q ) (k ) F2( q ) (k )
Fm( q ) (k ) ⎤⎦ ,
q = 1, 2,..., s.
Используя представление матриц B(q)[α(k),k] в виде (9), получим, что блоки
матриц H(q)(k), G(q)(k), F(q)(k) удовлетворяют уравнениям (18) – (23).
Таким образом, имеем задачу минимизации критерия (28) при ограничениях
(2), которая эквивалентна задаче квадратичного программирования с критерием
Y ((k + m) / k ) = ⎡⎣ 2 xT (k )G (k ) − F (k ) ⎤⎦ U (k ) + U T (k ) H (k )U (k )
при ограничениях (12).
Заключение
Предложен метод синтеза стратегий прогнозирующего управления для гибридных взаимосвязанных систем с марковскими скачками. Данный подход позволяет в явном виде учесть ограничения на управления. Алгоритм синтеза прогнозирующей стратегии включает решение последовательности задач квадратичного
программирования.
ЛИТЕРАТУРА
1. Пакшин П.В. Дискретные системы со случайными параметрами и структурой. М: Физматлит, 1994.
2. Bemporad A., Di Cairano S. Model-predictive control os discrete hybrid stochastic automata
// IEEE Transactions on Automatic Control. 2011. V. 56. No. 6. P. 1307−1321.
3. Costa O.L.V., Paulo W.L. Generalized coupled algebraic riccati equations for discrete-time
Markov jump with multiplicative noise systems // European J. Control. 2008. No. 5.
P. 391−408.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
12
В.В. Домбровский, Т.Ю. Объедко
4. Dragan V., Morozan T. The Linear quadratic optimization problems for a class of linear stochastic systems with multiplicative white noise and Markovian jumping // IEEE Transactions
on Automatic Control. 2004. V. 49. No. 5. P. 665−675.
5. Rawlings J. Tutorial: Model predictive control technology // Proc. Amer. Control Conf. San
Diego. California. June 1999. P. 662−676.
6. Bernardini D., Bemporad A. Scenario-based model predictive control of stochastic
constrained linear systems // Proc. 48th IEEE Conf. Decision and Control. Shanghai. P.R.
China. December 2009. P. 6333−6338.
7. Blackmore L., Bektassov A, Ono M., Williams B.C. Robust optimal predictive control of jump
Markov linear systems using particles // Hybrid systems: Comput. and Control / A. Bemporad, A. Bicchi, G. Buttazzo, Eds. New York: Springer-Verlag, 2007. V. 4416, Lecture Notes
in Computer Science. P. 104−117.
8. Домбровский В.В., Объедко Т.Ю. Управление с прогнозированием системами с марковскими скачками при ограничениях и применение к оптимизации инвестиционного
портфеля // Автоматика и телемеханика. 2011. № 5. С. 96−112.
9. Billio M., Pelizzon L. Value-at-Risk:a multivariate switching regime approach // J. Empirical
Finance. 2000. No. 7. P. 531−554.
10. Elliott R.J., Aggoun L., Moore J.B. Hidden Markov Models: Estimation and Control. Berlin:
Springer-Verlag, 1995.
Домбровский Владимир Валентинович
Объедко Татьяна Юрьевна
Томский государственный университет
E-mail: dombrovs@ef.tsu.ru; tani4kin@mail.ru
Поступила в редакцию 27 апреля 2012 г.
Dombrovskii Vladimir V., Obyedko Tatyana Y. (Tomsk State University). Model predictive control of interconnected hybrid systems with Markov jumps under constraints.
Keywords: model predictive control, hybrid systems, interconnected hybrid systems, vector simple connected Markov chain, constraints.
Modern control systems are generally composed of interacting subsystems with both continuous and discrete dynamics. In particular, the investment portfolio is a complex system, which can
be consisted of risky financial assets of different classes, where the dynamics of returns varies
discontinuously in accordance with the evolution of interrelated states of Markov chains describing, for example, the behavior of the various sectors of economy.
In this paper we consider complex Markov jump linear system composed of interconnected
subsystems. The parameters of each subsystem change in accordance with the evolution of the
simple connected Markov chains whose states are interrelated. We use model predictive control
approach to solve the problem. The open-loop feedback control strategy is derived taking into account explicit constraints on the input variables. Predictive strategies computation includes the
decision of the sequence of quadratic programming tasks.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
УДК 62.52; 532.546; 519.9
Н.Д. Демиденко
МОДЕЛИРОВАНИЕ СТАТИЧЕСКИХ И ДИНАМИЧЕСКИХ РЕЖИМОВ
В ТРУБЧАТЫХ ПЕЧАХ
В статье предлагаются математические модели для стационарных и динамических режимов технологических печей как объектов с распределенными
параметрами. Сформулированы и решены соответствующие краевые задачи.
Для стационарных режимов получена система уравнений, связывающая
концентрацию горючего вещества и скорость дымовых газов. Проанализированы потери на излучение при горении капель топлива различного диаметра. Проведены расчеты для промышленных объектов.
Ключевые слова: математическое моделирование, краевые задачи, стационарные и динамические режимы трубчатых печей, численные методы.
Использование органического жидкого топлива является основным источником энергии большого числа различных теплотехнических процессов.
В качестве объекта исследования выбрана трубчатая печь, широко распространенная в нефтехимических производствах [1]. Трубчатая печь является аппаратом, предназначенным для передачи нагреваемому продукту тепла, выделяющегося при сжигании топлива непосредственно в этом же аппарате [2]. Она имеет
камеры радиации и конвекции. В камере радиации (топочная камера), где сжигается топливо, размещена радиантная поверхность (экран), поглощающая тепло в
основном за счет радиации. В камере конвекции расположены трубы, воспринимающие тепло главным образом путем конвекции при соприкосновении дымовых
газов с поверхностью нагрева. Сырье проходит последовательно через конвекционные трубы и поглощает тепло. Обычно радиантная поверхность воспринимает
большую часть тепла, выделяемого при сгорании дымовых газов до 1000−2000 К.
Конвекционная поверхность использует тепло дымовых газов и обеспечивает их
охлаждение до температуры, при которой величина коэффициента полезного действия аппарата будет экономически оправданной.
Рассмотрим механизм процесса передачи тепла, протекающего в печи, состоящей из двух камер с настильным пламенем. В топочную камеру этой печи
при помощи форсунки вводится распыленное топливо, а также необходимый для
горения нагретый или холодный воздух. Высокая степень дисперсности топлива
обеспечивает его интенсивное перемешивание с воздухом и более эффективное
горение. Соприкосновение факела с поверхностью стены обусловливает повышение ее температуры; излучение происходит не только от факела, но и от раскаленной стены. Тепло, выделенное при сгорании топлива, расходуется на повышение температуры дымовых газов и частиц горящего топлива; последние раскаляются и образуют светящийся факел.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
14
Н.Д. Демиденко
Имеются некоторые расхождения в математических методах анализа, используемых разными авторами, но для стационарного сферического горения используется единый подход. В целях упрощения анализ проводится при следующих
предположениях [3]:
1. Жидкая капля имеет сферическую форму.
2. Влиянием конвекции пренебрегают, пламя рассматривают как сферическую
поверхность, концентрическую с каплей.
3. Пламя считают разновидностью диффузионного пламени, которое образуется в результате реакции между парами горючего и воздухом, которые реагируют в
стехиометрическом соотношении.
4. Рассматривают стационарное состояние при постоянном диаметре капли,
хотя реально диаметр жидкой капли уменьшается по мере горения, однако это
изменение происходит медленно по сравнению с изменение скорости диффузии и
прочими факторами.
5. Температура капли одинакова по всему объему.
6. Давление в течение всего процесса горения считается постоянным.
7. Влияние излучения рассматривают отдельно.
1. Уравнения нестационарного горения
При исследовании процесса горения капель жидкого топлива в воздухе в основном представляет интерес распределение концентраций компонентов в камере
печи при статических и динамических режимах работы. Исходя из одномерности
движения потоков, математическая модель нестационарного горения может быть
представлена следующими уравнениями [3]:
1. Уравнение неразрывности
∂ρ
+ div ( ρu ) = 0 ,
(1)
∂t
где ρ – массовая плотность смеси; u – скорость движения.
Для покомпонентной модели процесса горения уравнение (1) можно записать
в виде
∂ ( ρx ) ∂ ( ρxu )
ρx
+
=−
.
(2)
∂t
∂l
τ
Здесь l – линейный размер; x – концентрация горючего вещества в смеси
( 0 ≤ x ≤ 1 ); τ – время сгорания.
2. Уравнение движения в виде
∂u
∂u
∂P
ρ ⎛⎜ + u ⎞⎟ +
=0.
(3)
∂
t
∂
l
⎝
⎠ ∂l
3. Уравнение сохранения энергии
∂S
∂S
ρx
q − Q (Tп ) + K1 (Tc − Tп ) ,
ρTп ⎛⎜
+ u ⎞⎟ =
(4)
∂l ⎠ τ
⎝ ∂t
где q – теплота сгорания топлива; Q (Tп ) – потери на излучение; S – энтропия,
причем S = Cv ln ( P / ρ γ ) ( γ = 1, 0 − 1, 4 , так как для жидкостей различие между Сv
и С p незначительно); Tc – температура сырья (нефтепродукта в радиантных тру-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование статических и динамических режимов в трубчатых печах
15
бопроводах печи); K1 – коэффициент теплопередачи для рабочего потока; Tп –
температура продуктов сгорания.
4. Уравнение теплообмена между нагреваемым сырьем и нагревательным газом
∂Tc
∂T
(5)
− w c = K 2 (Tп − Tc ) − Q (Tп ) ,
∂t
∂l
где K 2 – коэффициент теплопередачи для стенки печи.
Уравнения (1) – (5) представляют собой математическую модель теплового
процесса печи.
Дополним систему (1) – (5) уравнением состояния
P
= RTп ,
(6)
ρ
где R – газовая постоянная.
2. Стационарная модель процесса горения
В этом случае уравнения (1) – (5) могут быть значительно упрощены. При
∂
∂
d
= 0 (первое слагаемое в левых частях уравнений (1) – (4)) и
→ , так
этом
∂t
∂l
dl
как остается лишь одна независимая переменная. Уравнение (1) может быть проинтегрировано, что приводит к простой форме уравнения неразрывности:
d
ρx
ρu = M − const,
( ρux ) = − .
τ
dl
Уравнение сохранения количества движения может быть преобразовано в интегральную форму для случая плоского установившегося одномерного течения:
du dP
ρu
+
=0,
dl dl
которое имеет интеграл ρu 2 + P = Π , где П = const.
Тогда уравнение сохранения энергии представим в виде (без учета теплопередачи с сырьем)
P
d ln γ
ρx
ρ
CvTп u
q − Q (Tп ) .
=
dl
τ
Перепишем систему, полученную с учетом первого уравнения этой системы:
dx
x
= − , Mu + P = Π ,
dl
uτ
(7)
RQ (Tп )
γuP ⎤
d ⎡u2
R
x
q−
.
⎢ +
⎥=
dl ⎣ 2 M ( γ − 1) ⎦ Cv ( γ − 1) τ u
Cv M ( γ − 1)
Система (7), состоящая из обыкновенных дифференциальных уравнений, теперь может быть разрешена относительно скорости движения смеси и концентрации горючего вещества в смеси по длине камеры сгорания. Это решение может
быть использовано для получения других параметров печи, которые зависят от
x и u.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.Д. Демиденко
16
3. Пример решения стационарной задачи
Для определения x и u как функций длины в камере сгорания можно сформулировать задачу Коши, задавая значения x и u на входе в камеру сгорания:
dx
x
=− ,
dl
uτ
du R ⎡ Mqx − τuQ (T ) ⎤
=
, 0 ≤ l ≤ L;
dl Cv ⎢⎣ u τ ( γP − Mu ) ⎥⎦
x ( 0 ) = α1 ,
u ( 0) = α2 .
Для решения системы дифференциальных уравнений применим программу
пошагового интегрирования, выполненного методом Кутты – Мерсона.
Проведены расчеты горения капель различного диаметра для задачи Коши с
начальными условиями
x ( 0 ) = 0,346,
u ( 0 ) = 1, 0 м / с.
Капли диаметром 0,01 мм имеют время сгорания τ = 0,00011 с и потери
на излучение Q = 0, 00001498 Дж/с ; диаметром 0,1 мм – τ = 0,011 с и
Q = 0, 001498 Дж/с ; диаметром 1 мм – τ = 0,07 с и соответственно потери на излучение Q = 0,1498 Дж/с ; диаметром 2 мм – время сгорания τ = 2,3 с и
Q = 0, 27818 Дж/с . В задаче использовались и постоянные величины: давление –
P = 101000 Па, теплота сгорания – q = 26000000 Дж/кг (с учетом диссоциации
продуктов сгорания), массовый расход – М = 114 кг, γ = CP / Cv = 1,1 . На рис. 1 и 2
представлены результаты расчетов.
U, м/с
1
3
5
х
0,34
4
2
3
0,32
2
2
3
1
1
0
2
4
6
l, м
Рис. 1. Изменение скорости горения смеси
по длине печи: 1 – диаметр капли 1 мм, 2 –
2 мм, 3 – меньше 1 мм
0
2
4
6
8
l, м
Рис. 2. Изменение концентрации горючего
вещества по длине печи: 1 – горение капель
диаметром 1 мм, 2 – 2 мм, 3 – горение капель диаметром менее 1 мм
Результаты проведенных расчетов показывают, что скорость горения и концентрации горючего вещества по длине печи, как и потери тепла на излучение,
существенно зависят от размеров капель топлива. Наилучшие параметры горения
имеют капли диаметром 1 мм, причем по скорости горения для этих капель наблюдается локальный максимум.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование статических и динамических режимов в трубчатых печах
17
4. Расчет потерь на излучение при горении капель топлива
различного диаметра
Для теплового расчета трубчатых печей с чисто факельным сжиганием топлива широко применяется метод А.В. Белоконя [1], дающий наилучшую сходимость
с экспериментальными данными. За последнее время с целью интенсификации в
трубчатых печах теплоотдачи излучением созданы новые типы печей с вторичными излучателями в виде стен из беспламенных панельных горелок и излучающих стен с настильным пламенем. В этих печах теплоотдача экранным поверхностям от вторичных излучателей весьма значительна и соизмерима с теплоотдачей
излучением от факела и газовой среды.
Для рассматриваемой модели необходимо учитывать потери на излучение. Величина Q (Tп ) определяется следующим образом (обратным излучением с поверхности капли из-за низкой температуры поверхности пренебрегают):
Q (Tп ) = 4εпр σT24 πrк2 ,
где εпр – приведенная степень частоты; σ – коэффициент излучения (постоянная
Стефана – Больцмана) равный 5, 67 ⋅10−8
Вт
2
м ⋅К4
; Т 2 – изменение температуры в
δ
– радиус капли.
2
При Q (Tп ) ≠ 0 считается, что величина радиуса зоны горения r2 не изменяет-
зоне горения; rк =
rк Nu
αδ ⎞
ся. Причем для чисел Нуссельта Nu > 2 ⎛⎜ Nu =
,
⎟ можно записать r2 =
Nu − 2
λ ⎠
⎝
где α = const ; λ – теплопроводность парогазовой смеси.
С учетом излучения это условие должно выполниться строже, так как в результате увеличения тепловыделения в зоне горения в окружающую среду будет
отводиться больше тепла излучением и теплопроводностью. Здесь не будем учитывать изменение температуры T2 в зоне горения из-за влияния излучения. Такой
подход допустим, когда эта температура фактически определяется условиями разложения продуктов сгорания.
Лучистый теплообмен для рассматриваемого случая можно определить по
формуле
−1
εпр
2
⎡⎛ 1
1⎤
⎞⎛ rк ⎞
= ⎢⎜ − 1⎟⎜ ⎟ + ⎥ ,
⎠⎝ r2 ⎠ εк ⎥⎦
⎢⎣⎝ ε 2
где ε 2 – степень черноты зоны горения; εк – степень черноты поверхности капли.
Для капель диаметром 0,01; 0,1; 1 и 2 мм были проведены расчеты, результаты
которых сведены в таблицу:
δ,м
rк ,м
−3
0,01·10
0,1·10−3
10−3
2·10−3
−6
5·10
5·10−5
rк2 ,м 2
−11
2,5·10
2,5·10−9
2,5·10−7
10−6
Nu
εпр
Q (T ) , Дж/с
2,0
2,0
2,9
0,95
0,95
0,01
14,98·10−6
14,98·10−4
13,8·10−2
27,82·10−2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.Д. Демиденко
18
Количество тепла, необходимого для горения (испарения капли), подводится к
капле посредством теплопередачи. T2 = 2500 K (с учетом диссоциации CO 2 и
Вт
; εк = 0,95 (для углеводородных топлив); ε 2 = 0, 001
м⋅К
(оценочно для зоны горения паров углеводородных топлив при рассматриваемых
условиях).
H 2 O ); λ = 8,1 ⋅10−2
5. Анализ режима работы печи без потерь на излучение
Рассмотрим модель без учета потерь на излучение, т.е. Q (Tп ) = 0 , и оценим
влияние концентрации смеси x на скорость ее горения:
d ⎛ u2
γPu
⎜ +
dl ⎝ 2 ( γ − 1) M
⎞
R
x
q.
⎟=
⎠ Cv ( γ − 1) u τ
Подставив первое уравнение из (8) во второе получим
dx
x
=− ,
dl
uτ
(8)
d ⎛ u2
γPu
⎜ +
dl ⎝ 2 ( γ − 1) M
⎞
R
dx
q .
⎟=−
1
C
γ
−
dl
(
)
v
⎠
Проинтегрировав это дифференциальное уравнение, найдем
u2
γPu
R
+
=−
qx.
2 ( γ − 1) M
Cv ( γ − 1)
(9)
Преобразуем выражение (9), получим
Cv ( γ − 1) Mu 2 + 2Cv γPu + 2 RMqx = 0.
Дискриминант полученного квадратного уравнения
D = Cv2 γ 2 P 2 − 2Cv ( γ − 1) M 2 Rqx ,
если D < 0 , то решений уравнения нет (два мнимых корня); если D = 0 , то существует одно решение (два совпадающих корня); если D > 0 , имеем два решения
(два действительных корня).
U, м/с
Таким образом,
−Cv γP ± D
0,6
u1,2 =
.
Cv M ( γ − 1)
На рис. 3 показано влияние концентрации
капель жидкого горючего на скорость распространения пламени на начальной стадии
процесса. Видим, что по мере увеличения x
0,2
скорость распространения пламени уменьшается при x > 9 % и убывает при более низких x. При очень малых и очень больших
концентрациях горючего влияние размеров
х
0
0,4
0,08
капель по существу отсутствует. При увеличении
количества сконденсированного гоРис. 3. Влияние концентрации капель
жидкого горючего на скорость рас- рючего полная концентрация, при которой
пространения пламени на начальной достигается максимальная скорость распростадии процесса
странения пламени, сдвигается в стороны
0,4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование статических и динамических режимов в трубчатых печах
19
больших значений концентрации горючего, а значение максимальной скорости
распространения пламени уменьшается. Влияние концентрации жидких капель на
скорость горения идентично влиянию концентрации жидких капель на скорость
распространения пламени, причем этот эффект выражен тем сильнее, чем выше
скорость распространения пламени. Это, в свою очередь, показывает, что в случае
высокой скорости распространения пламени жидкие капли размером 1 мкм не успевают полностью испариться перед фронтом пламени.
6. Расчет динамических режимов трубчатых печей
Рассмотрим следующую тепломассообменную задачу для процессов в трубчатой печи. Для этого приведем систему (1) – (6) к следующему виду:
⎧ ∂ρ
∂ρ
∂u
−ρ ,
⎪ = −u
∂l
∂l
⎪ ∂t
∂x x
⎪ ∂x
⎪ ∂t = −u ∂l − τ ,
⎪
∂T
RT ∂ρ
∂u
⎪ ∂u
−R п − п
,
⎨ = −u
∂
∂
∂
ρ ∂l
t
l
l
⎪
⎪∂Tп
∂T
xq Q (Tп )
∂u
= (1 − γ ) Tп
−u п +
−
+ K1 (Tc − Tп ) ,
⎪
t
l
l
C
Cv ρ
∂
∂
∂
vτ
⎪
∂T
⎪ ∂Tc
= − w c + K 2 (Tп − Tc ) − Q (Tп ) .
⎪⎩
∂t
∂l
Дополним систему (10) начальными и граничными условиями
Нач. усл.
ρ ( l , 0 ) = ϕ1 ( l ) ,
x ( l , 0 ) = ϕ2 ( l ) ,
u ( l , 0 ) = ϕ3 ( l ) ,
Tп ( l , 0 ) = ϕ4 ( l ) ,
Tc ( l , 0 ) = ϕ5 ( l ) ,
(10)
Гран. усл.
ρ ( 0, t ) = ψ1 ( t ) ,
x ( 0, t ) = ψ 2 ( t ) ,
u ( 0, t ) = ψ 3 ( t ) ,
Tп ( 0, t ) = ψ 4 ( t ) ,
Tc ( 0, t ) = ψ5 ( t ) .
(11)
Здесь температура сырья задается в точке l = L , так как сырье подается сверху
в печь, и таким образом имеем противоточный технологический процесс.
На рис. 4−7 приведены результаты расчетов динамических характеристик технологических процессов в трубчатой печи. При этом использована программа
COMSOL Multiphysics, предназначенная для решения широкого круга задач,
формулируемых системами дифференциальных уравнений с частными производными.
Кривые разгона на выходе печи получены при возмущении на ±20 % с шагом
5 % на входе печи по температуре сырья (рис. 5, 6) и по температуре дымовых газов (рис. 4, 7).
Начальные значения температуры сырья 270 °С и температуры дымовых газов
– 530 °С. Кривые разгона для плотности, скорости, температуры потока дымовых
газов и температуры сырья используются при решении задач локальной автоматики промышленных установок [1].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.Д. Демиденко
20
ρ,
кг/м3
u, м/с
Т = 636 °С
Тс = 324 °С
520
3
480
2,8
440
2,6
400
2,4
360
0
2,2
Т = 424 °С
200
400
600
800 1000 t, c
Рис. 4. Кривые разгона по плотности потока
в зависимости от температуры потока (от
424 до 636 °С)
Тп, °С
200
400
600
800 1000 t, c
Рис. 5. Кривые разгона по скорости потока
дымовых газов в зависимости от температуры сырья (от 216 до 324 °С)
428
400
Тп = 636 °С
426
380
424
360
422
340
420
320
0
0
Тс, °С
Тс = 216 °С
300
Тс = 216 °С
418
Тс = 324 °С
200
400
416
600
800 1000
t, c
Рис. 6. Кривые разгона по температуре дымовых газов в зависимости от температуры
сырья (от 216 до 324 °С)
0
Тп = 424 °С
200
400
600
800 1000
t, c
Рис. 7. Кривые разгона по температуре сырья в зависимости от температуры потока
газов (от 424 до 636 °С)
Заключение
Приведенная математическая модель процесса горения в технологических печах является основной для проектирования оптимальных режимов промышленных установок. Расчет статических и динамических характеристик управляемого
процесса позволяет определить основные параметры оптимальных процессов
управления. Без знания динамических характеристик невозможно управление
технологическими процессами в реальных условиях. Возможность получения параметров нестационарных режимов позволяет в режиме реального времени с высокой степенью эффективности избавиться от вредного влияния возмущений.
Эффективность данного подхода проиллюстрирована на процессах тепломассообмена в промышленных объектах.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование статических и динамических режимов в трубчатых печах
21
ЛИТЕРАТУРА
1. Скобло А.И., Трегубова И.А., Молоканов Ю.К. Процессы и аппараты нефтеперерабатывающей и нефтехимической промышленности. М.: Химия, 1982. 584 с.
2. Демиденко Н.Д., Потапов В.И., Шокин Ю.И. Моделирование и оптимизация систем с
распределенными параметрами. Новосибирск: Наука, 2006. 551 с.
3. Варшавский Г.А. Горение капли жидкого топлива (диффузионная теория) // Бюро новой
техники НКАП. М.: Гостехиздат, 1945. № 6. С. 87−106.
Демиденко Николай Данилович
Специальное конструкторско-технологическое бюро
«Наука» СО РАН, Красноярск
E-mail: tpya74@mail.ru
Поступила в редакцию 4 апреля 2012 г.
Demidenko Nikoly D. (Special Designing and Technological Bureau «Nauka» KSC SB RAS,
Krasnoyarsk). Modeling of static and dynamic regimes in tube furnaces.
Keywords: mathematical modeling, boundary value problems, stationary and dynamic regimes of
tube furnaces, numerical methods.
There are suggested mathematical models for steady-state and dynamic modes of process
furnaces as the objects with distributed parameters. The corresponding boundary value problems
are formulated and solved. For stationary modes, it is suggested the system of equations
describing the concentration of combustible material and the rate of furnace gases. The radiation
losses by burning fuel droplets of different diameters are analyzed. The calculations for industrial
facilities are performed.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
ОБРАБОТКА ИНФОРМАЦИИ
УДК 519.676
Т.А. Аверина
АЛГОРИТМ АНАЛИЗА СИСТЕМ УПРАВЛЕНИЯ АНСАМБЛЕМ
ТРАЕКТОРИЙ С УЧЕТОМ СЛУЧАЙНОГО ИЗМЕНЕНИЯ
СТРУКТУРЫ И СКАЧКОВ
Рассматривается задача анализа нелинейных систем управления ансамблем
траекторий с учетом случайного изменения структуры системы и скачков
(случайных импульсных воздействий). Для решения рассматриваемой задачи предлагается алгоритм статистического моделирования.
Ключевые слова: система со случайной структурой, метод Монте-Карло.
Под системами со случайной (переменной) структурой понимаются динамические системы, поведение которых на случайных интервалах времени характеризуется различными структурами и описывается различными уравнениями [1]. К системам с переменной структурой относятся:
- системы поиска, захвата и сопровождения сигнала;
- системы, имеющие срыв управления или слежения;
- системы с периодическим случайным повторением процессов поиска, захвата, срыва управления;
- системы управления, в которых связи между функциональными элементами
меняются в зависимости от состояния (системы с переменной структурой управляющего устройства);
- системы с возможными нарушениями, в которых возможен случайный отказ
функционирования некоторых цепей в случайные моменты времени.
В настоящей работе рассматривается задача анализа многомерных нелинейных систем управления ансамблем траекторий [2, 3] при импульсных воздействиях и случайном изменении структуры. Для решения этой задачи применяется метод статистического моделирования, который позволяет оценивать вероятностные
характеристики выходных процессов, в том числе и плотность вероятности.
1. Постановка задачи анализа нелинейных систем
управления ансамблем траекторий
Рассмотрим процесс (y(t), s(t))T, где s(t) – дискретный случайный процесс с конечным множеством состояний {1, 2,…,S}; S – число структур, а y (t ) – d-мерный
случайный процесс, описываемый при условии s (t ) = l системой обыкновенных
дифференциальных уравнений (ОДУ):
dy (t )
= f (l ) (t , y (t )), y (t0 ) = y0 ∈ Ω ⊂ R n ,
dt
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Алгоритм анализа систем управления ансамблем траекторий
23
где t ∈ [t0 , T ] ; f (l ) (t , y ) – вектор-функции размера d; l – номер структуры системы, множество Ω ограничено, оно характеризует неопределенность задания начальных данных [3].
Вероятность перехода дискретного случайного процесса s(t) удовлетворяет
следующим условиям [1]:
P{s (t + ∆t ) = r | s (t ) = l , y (t ) = y} = ν lr (t , y )∆t + o(∆t ) ,
P{s (t + ∆t ) = l | s (t ) = l , y (t ) = y} = 1 − ν ll (t , y )∆t + o(∆t ) ,
s (t0 ) = s0 ,
l , r = 1, 2,..., S ,
l≠r,
где функция νlr (t , y ) : [t0 , T ] × R d → [0, ∞] называется интенсивностью перехода,
при этом
νll (t , y ) =
S
∑
r =1≠ l
νlr (t , y ) .
Это условие обеспечивает при любом фиксированном y ∈ R d отсутствие нескольких переключений процесса s(t) за малый интервал времени ∆t . Предполагается, что в моменты переключения траектории процесса y(t) могут быть как непрерывными (случай точного восстановления реализаций), так и иметь разрывы
[1]. В последнем случае дополнительно задаются законы, определяющие величину скачка в момент смены структуры. Например, в качестве такой характеристики
удобно взять ψ lr (t , y | y ) (условную плотность вероятности смены вектора состояния из положения y в положение y, при переходе из l-й структуры в r-ю в
момент переключения t) или плотность вероятности ψ lr (t , θ) величины скачка
θ = y − y . При точном восстановлении реализаций
ψ lr (t , y | y ) = ψ lr (t , y − y ) = δ( y − y ) .
Систему, описываемую соотношениями (1) и (2), можно рассматривать как
стохастическую мультиструктурную систему с распределенными переходами
(при отсутствии случайных возмущений, действующих на объект управления).
Наиболее полной вероятностной характеристикой расширенного вектора состояния является упорядоченная совокупность взвешенных плотностей распределения p*(l ) (t , y ) вектора состояния (здесь и в дальнейшем * означает, что отсутствует нормировка), удовлетворяющих следующему условию:
S
∑ ∫
l =1
R
p*(l ) (t , y )dy = 1,
t ∈ [t0 , T ] .
(3)
d
Взвешенные плотности распределения удовлетворяют системе обобщенных
уравнений Фоккера – Планка – Колмогорова [1]. Вероятность того, что в момент
времени t структура системы имеет номер l, т.е. s(t) = l, задается выражением
P (l ) (t ) =
∫
R
p*(l ) (t , y )dy,
l = 1, 2..., S ,
d
(l )
а плотность вероятности p (t , y ) вектора состояния при условии s(t) = l связана с
p*(l ) (t , y ) следующим соотношением:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.А. Аверина
24
p*(l ) (t , y ) = P (l ) (t ) p (l ) (t , y ), l = 1, 2,..., S .
Для безусловной плотности вероятности p(t, y) вектора состояния выполняется
S
p(t , y ) = ∑ p*(l ) (t , y )
l =1
S
p(t , y ) = ∑ P (l ) (t ) p*(l ) (t , y ) .
или
l =1
Задача анализа систем управления ансамблем траекторий состоит в нахождении ненормированных плотностей распределения p*(l ) (t , y ) вектора состояния
по заданным функциям f (l ) (t , y ) , интенсивностям νlr (t , y ) , законам поведения
траектории в момент смены структуры (плотностям ψ lr (t , θ) ) и ненормированным
плотностям распределения p0*(l ) (t , y ), l , r = 1, 2,..., S .
Наряду с нахождением функций p*(l ) (t , y ) можно рассматривать задачу нахождения маргинальных плотностей вероятности и моментных характеристик вектора состояния, а также задачу определения вероятностных характеристик времени перехода из одной структуры в другую [1–5]. Некоторые вероятностные характеристики и их оценки приведены в 3-м разделе статьи.
2. Анализ систем управления ансамблем траекторий
методом статистического моделирования
Опишем статистический алгоритм решения задачи анализа систем управления
ансамблем траекторий. Статистический алгоритм должен в себя включать: численное решение ОДУ (1) некоторым численным методом [6], а также моделирование моментов смены структуры, номера новой структуры и величины скачка
(при разрыве траекторий). В рассматриваемом случае распределение моментов
смены структуры определяется интенсивностями переходов (2). Так как интенсивности переходов зависят от вектора состояния, то моделирование моментов
смены структуры будет осуществляться по методу максимального сечения [7].
Применение этого метода требует выполнения условий
_
νlr (t , y ) ≤ νlr = const , i = 1, 2,..., S , i ≠ l ,
на всем интервале интегрирования [t0 , T ] .
Алгоритм моделирования траекторий процесса ( y (t ), s (t ))T :
0) k: = 0; моделируем ( y0 , s0 )T согласно заданным ненормированным плотностям распределения p0*(l ) (t , y ), l = 1, 2,..., S ;
1) l := sk ; моделируем возможный момент выхода из l-й структуры
_
_
tk +1 = tk + τ , где τ – случайная величина с плотностью p( x) = νl exp(− νl x) ,
νl =
S
∑ νli , (по формуле
i =1≠ l
τ=−
ln α
, где α – равномерно распределенная на инνl
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Алгоритм анализа систем управления ансамблем траекторий
25
тервале (0,1) случайная величина, которая моделируется с помощью датчика
псевдослучайных чисел, например RAND [8]); если tk +1 > T , то tk +1 := T ;
2) моделируем номер r (возможный номер новой структуры) с вероятностью
pr = νlr / νl , r≠l, r = 1,2,…,S;
3) решаем уравнение (1) для l-й структуры на интервале [tk , tk +1 ] численным
методом с шагом h и находим yk +1 – вектор состояния системы в момент tk +1 , при
этом шаг должен быть согласован с интенсивностью перехода, например
h ≤ 0,1/ νl ;
4) k : = k + 1;
5) проверяем условие смены структуры: моделируем равномерно распреде_
ленную на интервале (0,1) случайную величину α1 : если α1 ≤ νlr (tk , yk ) / νlr , то
переходим к п. 6, иначе переходим к п. 7;
6) меняем номер структуры на r-й: sk := r ; если задано условие разрыва траектории при переходе из l-й структуры в r-ю, то моделируется новая случайная
величина yk согласно плотности ψ lr (t , y | yk ) или величина скачка θ согласно
плотности ψ lr (t , θ) , тогда yk := yk + θ ;
7) если tk < T , то переходим к п. 1, иначе процесс моделирования завершается.
3. Вероятностные характеристики решения и их статистические оценки
При решении задач со случайной структурой возникает потребность в вычислении вероятностных характеристик решения [1]. Некоторые из них мы приведем
ниже.
1. Вероятность l-й структуры (или вероятности состояния, l = 1,…,S)
P (l ) (t ) = P( s (t ) = l ),
S
∑ P(l ) (t ) = 1 .
l =1
2. Плотность условного распределения y(t) при s(t) = l
p (l ) (t , y ) = p( y (t ) | s (t ) = l ),
∫
p (l ) (t , y )dy = 1 .
Rn
3. Взвешенная плотность условного распределения y(t) при s(t) = l
p*(l ) (t , y ) = p( y (t ), s (t ) = l ) = p (l ) (t , y ) P (l ) (t ) .
4. Плотность вероятности y(t)
S
S
S
l =1
l =1
l =1
p(t , y ) = ∑ p(t , y (t ) | s (t ) = l )P( s (t ) = l ) = ∑ p (l ) (t , y )P (l ) (t ) = ∑ p*(l ) (t , y ).
5. Условные начальные моменты k-го порядка при s(t) = l ( k = k1 + ... + kd )
k
ω(kl ) (t ) = ω(kl ),...,k (t ) = E ( y1k1 ⋅⋅⋅ yd d )(l ) (t ) =
1
d
∫
R
k
y1k1 ⋅⋅⋅ yd d p (l ) (t , y )dy .
d
6. Взвешенные условные начальные моменты k-го порядка при s(t) = l
k
k1
*( l )
l)
d *( l )
ω*(
(t ) =
k (t ) = ωk ,..., k (t ) = E ( y1 ⋅⋅⋅ yd )
1
d
∫
R
d
k
y1k1 ⋅⋅⋅ ydd p*(l ) (t , y )dy .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.А. Аверина
26
7. Безусловные начальные моменты k-го порядка
k
ωk (t ) = ωk1 ,...,kd (t ) = E ( y1k1 ⋅⋅⋅ yd d )(t ) =
∫
k
y1k1 ⋅⋅⋅ yd d p(t , y )dy =
Rd
S
S
l =1
l =1
l)
= ∑ ω(kl ) (t )P (l ) (t ) = ∑ ω*(
k (t ).
8. Условный центральный второй момент при s(t) = l
Θ(l ) (t ) =
∫ (y − m
(l )
(t ))( y − m(l ) (t ))T p (l ) (t , y )dy, m(l ) (t ) =
Rd
∫
yp (l ) (t , y )dy .
Rd
9. Взвешенный условный центральный второй момент при s(t) = l
Θ*(l ) (t ) =
*( l )
∫ (y − m
(t ))( y − m*(l ) (t ))T p*(l ) (t , y )dy, m*(l ) (t ) =
Rd
∫
yp*(l ) (t , y )dy .
Rd
10. Безусловный центральный второй момент
Θ(t ) =
T
∫ ( y − m(t ))( y − m(t ))
R
p(t , y )dy, m(t ) =
d
∫
R
yp (t , y )dy .
d
Пусть N – объем выборки (общее число моделируемых траекторий); N k(l ) –
число траекторий, находящихся в l-м состоянии в момент времени
tk
S
(l )
( ∑ N k(l ) = N для всех tk ); yink
обозначает i-ю компоненту численного решения
l =1
yk в момент времени tk , на n-й траектории в l-й структуре; yink обозначает i-ю
компоненту численного решения yk в момент времени tk , на n-й траектории.
Нас будут интересовать следующие вероятностные характеристики решения в
момент времени tk :
1. Безусловные:
a) вектор математического ожидания m(tk ) , компоненты которого обозначим
mik = mi (tk ) =
∫
R
yi p(tk , y )dy ; i = 1,..., d ;
d
b) матрица вторых моментов
Φ (tk ) =
∫
R
yyT p(tk , y )dy
с компонентами
d
Φ ij (tk ) = Φ ijk ; i, j = 1,..., d ;
c) матрица центральных вторых моментов Θ(tk ) = Φ (tk ) − m(tk )mT (tk ) с компонентами Θij (tk ) = Θijk ; i, j = 1,..., d .
Их статистические оценки имеют вид
N
_
mik =
∑ yink
n =1
N
N
_
, Φ ijk =
∑ yink y jnk
n =1
N
N
_
, Θijk =
_
_
∑ ( yink − mik )( y jnk − m jk )
n =1
N −1
2. Условные:
m(l ) (tk ) , Φ (l ) (tk ) , Θ(l ) (tk ) = Φ (l ) (tk ) − m(l ) (tk )(m(l ) )T (tk ) .
.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Алгоритм анализа систем управления ансамблем траекторий
27
Их статистические оценки имеют вид
N k( l )
mik(l ) =
∑
n =1
(l )
yink
N k(l )
N k( l )
(l )
, Φ ijk
=
N
( l ) (l )
y jnk
∑ yink
(l )
=
, Θijk
n =1
N k(l )
(l )
− mik(l ) )( y jnk − m(jkl ) )
∑ ( yink
n =1
N k(l ) − 1
.
3. Взвешенные:
m*(l ) (tk ) , Φ*(l ) (tk ) , Θ*(l ) (tk ) = Φ*(l ) (tk ) − m*(l ) (tk )(m*(l ) )T (tk ) .
Их статистические оценки имеют вид
N k( l )
mik*(l ) =
∑
n =1
(l )
yink
N
N k( l )
l)
, Φ*(
ijk =
(l ) (l )
y jnk
∑ yink
n =1
N
N
l)
, Θ*(
ijk =
(l )
− mik*(l ) )( y jnk − m*(jkl ) )
∑ ( yink
n =1
N −1
.
Замечание [9]. Пусть x1 ,..., xN – выборка независимых одинаково распределенных случайных величин, с функцией распределения F(x), математическим
ожиданием m, центральным вторым моментом μ 2 (дисперсией), центральным
четвертым моментом μ 4 . Тогда статистические оценки математического ожидания x и центрального второго момента m2
1 N
1 N
x
,
m
=
∑ i 2 N ∑ ( xi − x )2
N i =1
i =1
имеют следующие математические ожидания и дисперсии:
μ
N −1
E ( x ) = m, E ( x − m) 2 = 2 , E (m2 ) =
μ2 ,
N
N
x=
μ 4 − μ 22 2(μ 4 − 2μ 22 ) μ 4 − 3μ 22
−
+
.
N
N2
N3
Согласно этому замечанию, можно найти первые два момента рассматриваемых выше оценок вероятностных характеристик решения систем со случайной
структурой.
4. Вероятности нахождения системы в l-й структуре в момент времени
tk оцениваются по формуле
E (m22 ) − ( E (m2 )) 2 =
Pk(l ) =
N k(l )
.
N
5. Гистограмма маргинальной плотности условного распределения p (l ) (tk , yi )
строится следующим образом:
a) [ai , bi ] – область изменения yi (tk ) равномерно разбивается на q частей с
шагом h =
bi − ai
; обозначим δ j – j-й интервал области, j = 1,…,q;
q
b) моделируем n = 1,…,N траекторий и в момент tk на каждой траектории для
(l )
i-й компоненты решения, находящейся в l-й структуре, считаем сколько yink
по-
q
пало в j-й интервал; полученное значение обозначим N (jkl ) ( ∑ j =1 N (jkl ) = N k(l ) );
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.А. Аверина
28
с) в качестве приближенного значения для p (l ) (tk , yi ) на интервале δ j берется
величина p j =
N (jkl )
NhPk(l )
.
6. Гистограмма маргинальной плотности распределения p(tk , yi ) строится
следующим образом:
a) [ai , bi ] – область изменения yi (tk ) равномерно разбивается на q частей с
шагом h =
bi − ai
; обозначим δ j – j-й интервал области, j = 1,…,q;
q
b) моделируем n = 1,…,N траекторий и в момент tk на каждой траектории для
i-й компоненты решения считаем сколько yink попало в j-й интервал; полученное
q
значение обозначим N jk ( ∑ N jk = N );
j =1
с) в качестве приближенного значения для p (tk , yi ) – плотности распределения yi (tk ) на интервале δ j – берется величина p j =
N jk
.
Nh
При вычислении математического ожидания некоторого функционала от решения рассматриваемых задач построенным статистическим алгоритмом важной
является проблема оптимального (согласованного) выбора параметров статистического алгоритма: шага численного метода h и размера выборки N. При вычислении гистограммы решения также возникает проблема оптимального выбора параметров статистического алгоритма: шага численного метода h, размера выборки
N и шага гистограммы hg . Используя методику доказательства, рассмотренную в
[10], для решения задачи условной оптимизации статистического алгоритма,
можно доказать, что минимум трудоемкости вычисления гистограммы достигается при ng ≈ γ −1 , N ≈ γ −3 , h ≈ γ1/ p , где γ – требуемая точность вычислений гистограммы в норме пространства L2 ([a, b]) , ng – число узлов гистограммы, p – порядок сходимости выбранного численного метода решения ОДУ.
4. Расчет модельной задачи анализа системы стабилизации
малого искусственного спутника
Актуальными являются разработки и применения малых искусственных спутников стандарта CubeSat (нано-спутников и пико-спутников). В качестве примеров можно привести международную систему Disaster Monitoring Constellation,
позволяющую производить мониторинг катастроф по всему миру; норвежский
спутник nCube, отслеживающий перемещение кораблей по территориальным водам Норвегии; проект AAUSAT, предназначенный для получения детальных изображений Земли; спутник UWE-1 (Вюрцбургский университет), позволяющий
анализировать использование технологий TCP/IP для телеметрических и телекомандных данных с учетом проблем задержек и помех; японский проект XI, созданный для демонстрации и тестирования систем спутниковой платформы с ис-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Алгоритм анализа систем управления ансамблем траекторий
29
пользованием готовых элементов, включая проверку аппаратуры спутника в условиях реального орбитального полета.
Возмущенное движение спутника, находящегося под действием гравитационного и управляющего моментов, в плоскости орбиты описывается следующими
уравнениями:
d θ(τ)
dq(τ)
= q(τ),
= −3Ω 2β sin θ(τ) cos(θ(τ)) + Lv(τ),
dτ
dτ
где θ – угол отклонения оси спутника по отношению к радиус-вектору центра
масс, q – угловая скорость вращения вокруг центра масс, Ω – угловая скорость
обращения спутника по круговой орбите, L и β – константы, зависящие от конструкции спутника, v – управление [11]. В [12] показано, что при малых колебаниях
спутника с учетом возможного отказа управляющего устройства его движение
приближенно описывается уравнениями
dy1 (t )
dy2 (t )
= y2 (t ),
= − y1 (t ) + (2 − k )u (t ), k = 1, 2,
dt
dt
где t = τ / α , y1 = θ / γ , y2 = q / δ . Числа α, γ, δ выбраны таким образом, что
αδ
3Ω 2βαγ
= 1,
= 1,
γ
δ
αL
= 1, t ∈ [0,1].
δ
Случай k = 1 соответствует режиму нормального функционирования, а случай
k = 2 – режиму отказа, т.е. срыву стабилизации. Соотношения для определения
оптимального управления получены в [12]. Управляющее воздействие
u (t ) = −0, 2(1 − tg1 − 2 tg 2 1) cos t − 0, 2(3 + 3 tg1 + 2 tg 2 1) sin t
в среднем обеспечивает минимальный расход энергии, а также стабилизацию
спутника в момент времени t = 1, т.е. математические ожидания величин y1 (1) и
y2 (1) равны нулю. Пусть начальные значения y10 и y20 являются независимыми
случайными величинами, имеющими усеченное нормальное распределение с параметрами
m10 = −0,3, D10 = 1, m20 = 0,1, D20 = 1.
Интенсивности отказа и восстановления заданы функциями ν12 (t ) = 0, 2 и
ν 21 (t ) = 0,1 , соответственно. В начальный момент времени система функционирует нормально с вероятностью P0(1) = 0,95 .
В качестве конкретного численного примера была рассмотрена задача нахождения вероятностей работы системы в режимах нормального функционирования и
срыва стабилизации, маргинальных плотностей вероятности, математических
ожиданий и вторых начальных моментов координат вектора состояния.
Задача была посчитана приведенным выше алгоритмом статистического моделирования. При решении задачи построенным алгоритмом использовался обобщенный одностадийный метод типа Розенброка [6] с шагом h = 0, 01 ; число моделируемых траекторий N = 106 ; для построения гистограммы отрезок [−4, 4] изменения координат вектора состояния равномерно разбивался на 100 частей
( ng = 100 ). Оценки функционалов от решения и гистограммы вычислялись одно-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
30
Т.А. Аверина
временно. Время счета составило 3 мин (для расчетов использовался РС с процессором Intel Celeron 2ГГц и 256 МБ оперативной памяти). Погрешность оценок
функционалов от решения составляет O(h). Выбранные параметры задачи
( N = 106 , h = 10−2 , ng = 102 ) являются оптимальными параметрами для получения
наилучшей оценки гистограммы при выбранном шаге h = 10−2 и гарантируют погрешность вычисления гистограммы в норме пространства L2 ([−∞, ∞]) порядка
O(h). Дальнейшее уменьшение шага гистограммы или шага численного метода
точность вычисления гистограммы не увеличивает. Дополнительные расчеты
проводились при h = 10−2 и ng = 5 ⋅102 , а также при h = 10−3 и ng = 5 ⋅102 . Погрешность гистограммы не уменьшается, хотя время вычислений увеличивается
(при h = 10−3 в 10 раз).
Заключение
Рассмотренная математическая модель позволяет описывать сложные системы
управления, подверженные импульсным воздействиям, имеющие различные режимы функционирования и неопределенность в задании начальных данных. Построенным алгоритмом статистического моделирования была посчитана модельная задача анализа системы стабилизации малого искусственного спутника, находящегося под действием гравитационного и управляющего моментов, с учетом
возможного отказа управляющего устройства. Точность оценок вероятностных
характеристик решения, полученных методом статистического моделирования,
зависит от шага интегрирования h, числа моделируемых траекторий N и шага гистограммы hg . Проведенные численные расчеты показали, что построенный алгоритм позволяет с высокой точностью вычислять вероятностные характеристики
решения.
ЛИТЕРАТУРА
1. Казаков И.Е., Артемьев В.М., Бухалев В.А. Анализ систем случайной структуры. М.:
Физматлит, 1993. 272 с.
2. Овсянников Д.А. Математические методы управления пучками. Л.: Изд-во ЛГУ, 1980.
228 с.
3. Пантнлеев А.В., Руденко Е.А., Бортаковский А.С. Нелинейные системы управления:
описание, анализ и синтез. М.: Вузовская книга, 2008. 312 с.
4. Аверина Т.А. Статистический алгоритм моделирования динамических систем с переменной структурой // Сиб. журн. вычисл. матем. 2002. Т. 5. № 1. С. 1–10.
5. Averina Т.А. Algorithm for statistical simulation of two types of random-structure systems //
Russ. J. Numer. Anal. Modelling. 2001. V. 16. No. 6. P. 467–482.
6. Artemiev S.S., Averina Т.А. Numerical analysis systems of ordinary and stochastic differential
equations. Utrecht: VSP, 1997. 176 p.
7. Михайлов Г.А., Аверина Т.А. Алгоритм «максимального сечения» в методе МонтеКарло // ДАН. 2009. Т. 428. № 2. С. 163–165.
8. Михайлов Г.А., Ермаков С.М. Курс статистического моделирования. М.: Наука, 1976.
320 с.
9. Крамер Г. Математические методы статистики. М.: Мир, 1975. 648 с.
10. Михайлов Г.А. Весовые методы Монте-Карло. Новосибирск: Изд-во СО РАН, 2000.
248 с.
11. Гурман В.И. Вырожденные задачи оптимального управления. М.: Наука, 1977. 250 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Алгоритм анализа систем управления ансамблем траекторий
31
12. Rybakov K.A., Sotskova I.L., Yudin M.A. Synthesis of optimal control algorithms for small
satellite subject to the possible failure of control unit // Theoretical questions of computers
and software. M.: MIREA, 2006. P. 98–103.
Аверина Татьяна Александровна
Институт вычислительной математики и математической геофизики СО РАН,
Новосибирский государственный университет,
E-mail: ata@osmf.sscc.ru
Поступила в редакцию 22 мая 2012 г.
Averina Tatyana A. (Institute of Computation Mathematics and Mathematical Geophysics SB
RAS, Novosibirsk State University). Algorithm for analysis of ensemble paths control systems
subjected to the random change of structure and jumps.
Keywords: systems with a random structure, Monte Carlo method.
We consider the problem of analysis of ensemble path control systems subjected to the random change of structure and jumps. If S is the number of structures in the system, s (t ) is a discrete random process with a finite set of values {1, 2,…,S}, then state vector of the system y (t ) is
a n–dimensional random process described under the condition s (t ) = l by the following ordinary
differential equations:
dy (t )
= f (l ) (t , y (t )), y (t0 ) = y0 ∈ Ω ⊂ R n , t ∈ [t0 , T ]
dt
where; f (l ) (t , y ) is the vector function of the dimension n; l is a number of structures of the system. The transition probability of the discrete random process s(t) satisfies the following conditions:
P{s (t + ∆t ) = r | s (t ) = l , y (t ) = y} = ν lr (t , y )∆t + o(∆t ) ,
P{s (t + ∆t ) = l | s (t ) = l , y (t ) = y} = 1 − ν ll (t , y )∆t + o(∆t ) ,
s (t0 ) = s0 ,
l , r = 1, 2,..., S ,
l ≠ r ; νll (t , y ) =
S
∑
r =1≠ l
ν lr (t , y ) .
Statistical algorithm was constructed for solving the problem of analysis of ensemble path
control systems subjected to the random change of structure and jumps. Developed algorithm is
applied to analysis of the satellite stabilization system.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
УДК 519.21
А.М. Горцев, А.А. Соловьев
СОВМЕСТНАЯ ПЛОТНОСТЬ ВЕРОЯТНОСТЕЙ
ДЛИТЕЛЬНОСТИ ИНТЕРВАЛОВ MAP-ПОТОКА СОБЫТИЙ
И УСЛОВИЯ ЕГО РЕКУРРЕНТНОСТИ
Изучается обобщенный синхронный поток событий (далее MAP-поток), являющийся одной из адекватных математических моделей информационных
потоков заявок (событий), функционирующих в современных информационных сетях интегрального обслуживания (ИСИО). Приводятся явные выражения плотности вероятностей длительности интервала между моментами
наступления соседних событий потока и совместной плотности вероятностей длительности двух соседних интервалов. Формулируются условия рекуррентности потока событий.
Ключевые слова: MAP-поток событий, плотность вероятностей, совместная плотность вероятностей, рекуррентность потока событий.
Математические модели теории массового обслуживания широко применяются при описании реальных физических, технических и других процессов и систем.
В связи с бурным развитием компьютерной техники и информационных технологий появилась еще одна важная сфера приложений теории массового обслуживания – проектирование и создание информационно-вычислительных сетей, компьютерных сетей связи, спутниковых сетей, телекоммуникационных сетей и т.п.
Усложнение структуры информационно-телекоммуникационных систем, интеграция различных систем связи, разнообразие программного и аппаратного обеспечения, протоколов передачи данных привели в конце 80-х – начале 90-х годов
прошлого века к созданию цифровых сетей интегрального обслуживания (Integrated Services Digital Networks – ISDN). Данные сети характеризуются тем, что по
единым аппаратным средствам совместно передаются самые разнообразные виды
информации – большие массивы данных, речь и видео в цифровой форме, факсимиле и т.д. При этом теория построения математических моделей функционирования информационно-телекоммуникационных систем, существовавшая до середины 80-х годов прошлого века, во многом становится непригодной для анализа
информационных процессов, протекающих в ISDN. В связи с этим в это же время
была предпринята успешная попытка создания адекватных математических моделей информационных потоков в телекоммуникационных системах так называемых дважды стохастических потоков событий.
На практике параметры, определяющие входной поток событий, известны либо частично, либо вообще неизвестны, либо (что ещё больше ухудшает ситуацию)
они изменяются со временем, при этом изменения часто носят случайный характер, последнее приводит к рассмотрению дважды стохастических потоков событий. По-видимому, одна из первых работ в этом направлении была опубликована
в [1], где дважды стохастический поток определяется как поток, интенсивность
которого есть случайный процесс. Дважды стохастические потоки можно разделить на два класса: к первому классу относятся потоки, интенсивность которых
есть непрерывный случайный процесс; ко второму – потоки, интенсивность кото-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Совместная плотность вероятностей длительности интервалов MAP-потока событий
33
рых есть кусочно-постоянный случайный процесс с конечным числом состояний.
Подчеркнем, что потоки второго класса впервые введены в рассмотрение практически одновременно в 1979 г. в [2–4]. В [2, 3] введенные потоки названы
MC (Markov chain)-потоками; в [4] – MVP (Markov versatile processes)-потоками.
Последние начиная с конца 80-х годов, особенно с появлением статьи [5], носят
название MAP (Markovian Arrival Process)-потоков событий. Отметим, что MAPпотоки событий наиболее характерны для реальных телекоммуникационных сетей [6]. В свою очередь, в зависимости от того, каким образом происходит переход из состояния в состояние, MC-потоки можно разделить на три типа: 1) синхронные потоки событий [7, 8]; 2) асинхронные потоки событий [9, 10]; 3) полусинхронные потоки событий [11]. Здесь указаны ссылки, в которых авторы впервые рассматривали MC-потоки событий в соответствии с приведенной классификацией. Наиболее общая литература по рассматриваемым типам MC-потоков событий приведена в [12]. В [13] введены в рассмотрение MAP-потоки событий
первого порядка (собственно MAP-потоки, введенные в [5]) и MAP-потоки событий второго порядка (суперпозиция (простая сумма) двух MAP-потоков первого
порядка, отличающихся друг от друга исходными параметрами). В [13] показывается, что синхронный MC-поток является частным случаем MAP-потока первого
порядка, асинхронный и полусинхронный MC-потоки являются частным случаем
MAP-потока второго порядка.
Режим функционирования системы массового обслуживания непосредственно
зависит от параметров MC(MAP)-потока и состояний, в которых находится поток.
Если система обслуживания функционирует в условиях полной (все параметры
потока априорно неизвестны) либо частичной (часть параметров потока априорно
неизвестна) неопределенности, то возникает задача оценки параметров потока по
наблюдениям за потоком (по наблюдениям за моментами наступления событий)
[8, 14, 15]. Что касается состояний MC(MAP)-потока событий, то даже тогда, когда поток функционирует в условиях отсутствия априорной неопределенности
(параметры потока полностью известны), сказать о том, в каком состоянии находится поток в тот или иной момент времени без наблюдений за потоком, возможно только на основании априорных данных. В этом случае возникает задача оценки состояний потока событий (задача фильтрации интенсивности потока) по наблюдениям за моментами наступления событий [7, 9–12, 16, 17].
Для решения задачи оценивания (тем или иным статистическим методом) параметров потока в первую очередь необходимо знание вероятностных свойств потока. В настоящей статье рассматривается MAP-поток событий первого порядка
(далее MAP-поток, либо просто поток), находятся явные виды плотности вероятностей значений длительности интервала между моментами наступления соседних событий потока и совместной плотности вероятностей значений длительности двух соседних интервалов.
1. Постановка задачи
Рассматривается MAP-поток с интенсивностью, представляющей собой кусочно-постоянный случайный процесс λ(t) c двумя состояниями: λ(t) = λ1 либо
λ(t) = λ 2 ( λ1 > λ 2 ). Длительность пребывания процесса λ(t) в i-м состоянии
есть случайная величина с экспоненциальной функцией распределения
Fi (t ) = 1 − e − λi t , i = 1, 2. В момент окончания i-го состояния процесса λ(t) возмож-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
34
А.М. Горцев, А.А. Соловьев
ны следующие ситуации, каждая из которых протекает мгновенно: 1) процесс λ(t)
переходит из i-го состояния в i-е и наступает событие потока в i-м состоянии; совместная вероятность этой ситуации P (λi → λ i ,1) = P1 (λ i | λ i ), i = 1, 2; 2) процесс
λ(t) переходит из i-го состояния в j-е и наступает событие потока; совместная вероятность этой ситуации есть P (λi → λ j ,1) = P1 (λ i | λ j ) , i, j = 1, 2; i ≠ j; 3) процесс
λ(t) переходит из i-го состояния в j-е и событие потока не наступает; совместная
вероятность этой ситуации есть P (λi → λ j , 0) = P0 (λ j | λ i ) , i, j = 1, 2; i ≠ j. При
этом P0 (λ j | λ i ) + P1 (λ j | λ i ) + P1 (λ i | λ i ) = 1 , i, j = 1, 2; i ≠ j. Блочная матрица инфинитезимальных характеристик процесса λ(t) при этом примет вид
−λ1
λ1 P0 (λ 2 | λ1 ) λ1 P1 (λ1 | λ1 ) λ1 P1 (λ 2 | λ1 )
D=
= D0 | D1 .
λ 2 P0 (λ1 | λ 2 )
−λ 2
λ 2 P1 (λ1 | λ 2 ) λ 2 P1 (λ 2 | λ 2 )
Элементами матрицы D1 являются интенсивности переходов процесса λ(t) из
состояния в состояние с наступлением события. Недиагональные элементы матрицы D0 – интенсивности переходов из состояния в состояния без наступления
события. Диагональные элементы матрицы D0 – интенсивности выхода процесса
λ(t) из своих состояний, взятые с противоположным знаком. В сделанных предположениях λ(t) – марковский процесс. Заметим, что в приведенном определении
MAP-потока в явном виде не оговаривается, в каком состоянии процесса λ(t) наступает событие потока при переходе λ(t) из первого (второго) состояния во второе (в первое). В связи с этим, во-первых, отметим, что в реальных потоках событий, моделями которых являются MAP-потоки, событие потока (в момент окончания того или иного состояния процесса λ(t)) наступает с полной определенностью в первом либо во втором состояниях процесса λ(t), т.е. установлена причинно-следственная связь: первично наступление события потока, вторичен переход
процесса λ(t) из состояния в состояние либо наоборот. Во-вторых, в задачах расчета характеристик потока, например среднего числа событий, наступивших в
единицу времени в том или ином состоянии процесса λ(t), в задачах оценки параметров MAP-потока событий данное обстоятельство необходимо учитывать, иначе расчеты во многих случаях будут некорректными. В настоящей статье, при получении аналитических результатов, данное обстоятельство является несущественным, так как наступление события и переход процесса λ(t) из i-го состояния в
j-е, i, j = 1,2; i ≠ j, происходят мгновенно. Вариант возникающей ситуации приведен на рис. 1, где 1, 2 – состояния случайного процесса λ(t); t1, t2 ,…– моменты наступления событий. Если положить P0 (λ 2 | λ1 ) = P0 (λ1 | λ 2 ) = 0 , то имеет место
синхронный поток событий [15].
Рис. 1. Формирование МАР-потока событий
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Совместная плотность вероятностей длительности интервалов MAP-потока событий
35
Процесс λ(t) является принципиально ненаблюдаемым (скрытый марковский
процесс), а наблюдаемыми являются только временные моменты наступления событий потока t1, t2 ,… . Рассматривается установившийся (стационарный) режим
функционирования потока событий. В силу предпосылок последовательность моментов наступления событий t1, t2 ,…, tk,… образуют вложенную цепь Маркова,
т.е. MAP-поток обладает марковским свойством, если его эволюцию рассматривать с момента tk (момент наступления события), k = 1,2,… . Обозначим τk = tk+1 –
tk, k = 1,2,…, – значение длительности k-го интервала между соседними событиями потока. Так как рассматривается стационарный режим, то плотность вероятностей значений длительности k-го интервала p( τ k ) = p( τ ), τ ≥ 0, для любого k.
В силу этого момент времени tk без потери общности можно положить равным
нулю, или, что то же самое, момент наступления события есть τ = 0. Пусть теперь
(tk, tk+1), (tk+1, tk+2) – два смежных интервала с соответствующими значениями длительностей: τk = tk+1 – tk, τk+1 = tk+2 – tk+1; их расположение на временной оси, в силу
стационарности потока, произвольно. Тогда можно положить k = 1 и рассмотреть
соседние интервалы (t1, t2), (t2, t3) с соответствующими значениями длительностей: τ1 = t2– t1, τ2 = t3– t2; τ1 ≥ 0, τ2 ≥ 0. При этом τ1 = 0 соответствует моменту t1
наступления события потока; τ2 = 0 соответствует моменту t2 наступления следующего события потока. Соответствующая совместная плотность вероятностей
при этом есть p(τ1, τ2), τ1 ≥ 0, τ2 ≥ 0.
Задача заключается в нахождении явного вида p(τ) и явного вида p(τ1, τ2), а
также в установлении условий рекуррентности MAP-потока событий.
2. Вывод плотности вероятностей p(τ)
Введем в рассмотрение вероятности pij(τ) того, что на интервале (0,τ) нет событий потока и в момент времени τ имеет место λ(τ) = λj при условии, что в момент
времени τ = 0 значение процесса λ(0) = λi, i, j = 1, 2. Тогда для вероятностей pij(τ)
справедливы следующие системы дифференциальных уравнений:
′ ( τ ) = −λ1 p11 ( τ ) + λ 2 P0 (λ1 | λ 2 ) p12 ( τ ), p12
′ ( τ ) = λ1 P0 (λ 2 | λ1 ) p11 ( τ ) − λ 2 p12 ( τ );
p11
′ ( τ ) = −λ 2 p22 ( τ ) + λ1 P0 (λ 2 | λ1 ) p21 ( τ ), p21
′ ( τ ) = λ 2 P0 (λ1 | λ 2 ) p22 ( τ ) − λ1 p21 ( τ ),
p22
с граничными условиями: p11(0) = 1, p12(0) = 0; p22(0) = 1, p21(0) = 0, решая которые
находим
λ P (λ | λ )
1
⎡ (λ 2 − z1 )e − z1τ − (λ 2 − z2 )e− z2 τ ⎤ , p12 ( τ ) = 1 0 2 1 e − z1τ − e− z2 τ ,
p11 ( τ ) =
⎦
z2 − z1 ⎣
z2 − z1
(
p21 ( τ ) =
)
λ 2 P0 (λ1 | λ 2 ) − z1τ
1
⎡(λ1 − z1 )e − z1τ − (λ1 − z2 )e− z2 τ ⎤ ,
− e− z2 τ , p22 ( τ ) =
e
⎦
z2 − z1 ⎣
z2 − z1
(
z`1` =
)
1⎡
λ1 + λ 2 − (λ1 − λ 2 ) 2 − 4λ1λ 2 P0 (λ 2 | λ1 ) P0 (λ1 | λ 2 ) ⎤⎥ ,
⎦
2 ⎢⎣
1⎡
λ1 + λ 2 + (λ1 − λ 2 ) 2 − 4λ1λ 2 P0 (λ 2 | λ1 ) P0 (λ1 | λ 2 ) ⎤⎥ ; 0 < z1 < z2 .
(1)
⎦
2 ⎣⎢
В соответствии с определением MAP-потока введем вероятность
p11 ( τ )λ1∆τP1 (λ1 | λ1 ) + ο(∆τ ) – совместную вероятность того, что без наступлений
событий потока процесс λ(τ) перешел на интервале (0,τ) из первого состояния в
первое и на полуинтервале [τ,τ+∆τ) произошло окончание первого состояния проz2 =
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.М. Горцев, А.А. Соловьев
36
цесса λ(τ) и процесс λ(τ) на полуинтервале [τ,τ+∆τ) перешел из первого состояния
в первое с наступлением события потока. Аналогичные совместные вероятности
примут вид
p12 ( τ )λ 2 ∆τP1 (λ1 | λ 2 ) + ο(∆τ ); p12 ( τ )λ 2 ∆τP1 (λ 2 | λ 2 ) + ο(∆τ );
p11 ( τ )λ1∆τP1 (λ 2 | λ1 ) + ο(∆τ ); p21 ( τ )λ1∆τP1 (λ1 | λ1 ) + ο(∆τ );
p22 ( τ )λ 2 ∆τP1 (λ1 | λ 2 ) + ο(∆τ ); p22 ( τ )λ 2 ∆τP1 (λ 2 | λ 2 ) + ο(∆τ );
p21 ( τ )λ1∆τP1 (λ 2 | λ1 ) + ο(∆τ ) .
Соответствующие плотности вероятностей выпишутся в виде
(1)
(2)
p11
( τ ) = λ1 P1 (λ1 | λ1 ) p11 ( τ ); p11
( τ ) = λ 2 P1 (λ1 | λ 2 ) p12 ( τ );
(1)
(2)
p12
( τ ) = λ 2 P1 (λ 2 | λ 2 ) p12 ( τ ); p12
( τ ) = λ1 P1 (λ 2 | λ1 ) p11 ( τ );
p(211 )( τ ) = λ1 P1 (λ1 | λ1 ) p21 ( τ ); p(212 () τ ) = λ 2 P1 (λ1 | λ 2 ) p22 ( τ );
p(221 )( τ ) = λ 2 P1 (λ 2 | λ 2 ) p22 ( τ ); p(222 )( τ ) = λ1 P1 (λ 2 | λ1 ) p21 ( τ ) .
Тогда плотности вероятностей pij ( τ ) того, что без наступления событий пото-
ка на интервале (0,τ) и наступления события в момент времени τ процесс λ(τ) перейдет на этом интервале из состояния i в состояние j (i,j = 1,2), запишутся для
разных i и j как
p11 ( τ ) = λ1 P1 (λ1 | λ1 ) p11 ( τ ) + λ 2 P1 (λ1 | λ 2 ) p12 ( τ );
p12 ( τ ) = λ 2 P1 (λ 2 | λ 2 ) p12 ( τ ) + λ1 P1 (λ 2 | λ1 ) p11 ( τ );
p21 ( τ ) = λ1 P1 (λ1 | λ1 ) p21 ( τ ) + λ 2 P1 (λ1 | λ 2 ) p22 ( τ );
p22 ( τ ) = λ 2 P1 (λ 2 | λ 2 ) p22 ( τ ) + λ1 P1 (λ 2 | λ1 ) p21 ( τ ).
(2)
Подставляя (1) в (2), получаем явный вид плотностей вероятностей pij ( τ ),
i, j = 1, 2.
Введем в рассмотрение вероятность πi(0) – условную стационарную вероятность того, что процесс λ(τ) в момент времени τ = 0 находится в i-м состоянии при
условии, что в момент времени τ = 0 событие потока наступило, i = 1,2 (π1(0) +
π2(0) = 1). Тогда, так как моменты наступления событий образуют вложенную
цепь Маркова, справедливы следующие уравнения для вероятностей πi(0):
π1 (0) = p11π1 (0) + p21π2 (0), π2 (0) = p12 π1 (0) + p22 π2 (0),
(3)
где pij – переходная вероятность того, что за время, которое пройдет от момента
τ = 0 до наступления следующего события потока, процесс λ(τ) перейдет из i-го
состояния в j-е (i = 1,2). При этом вероятности pij определяются в виде
∞
∞
∞
p11 = ∫ p11 ( τ )dτ = λ1 P1 (λ1 | λ1 ) ∫ p11 ( τ )dτ +λ 2 P1 (λ1 | λ 2 ) ∫ p12 ( τ )dτ ;
0
∞
0
∞
0
∞
p12 = ∫ p12 ( τ )dτ = λ 2 P1 (λ 2 | λ 2 ) ∫ p12 ( τ )dτ +λ1 P1 (λ 2 | λ1 ) ∫ p11 ( τ )dτ ;
0
∞
0
∞
0
∞
p21 = ∫ p21 ( τ )dτ = λ1 P1 (λ1 | λ1 ) ∫ p21 ( τ )dτ +λ 2 P1 (λ1 | λ 2 ) ∫ p22 ( τ )dτ ;
0
∞
0
∞
0
∞
p22 = ∫ p22 ( τ )dτ = λ 2 P1 (λ 2 | λ 2 ) ∫ p22 ( τ )dτ +λ1 P1 (λ 2 | λ1 ) ∫ p21 ( τ )dτ ,
0
0
0
(4)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Совместная плотность вероятностей длительности интервалов MAP-потока событий
37
где pij ( τ ) определены в (2), pij ( τ ) – в (1). Подставляя (1) в (4), находим
p11 = a[ P1 (λ1 | λ1 ) + P1 (λ1 | λ 2 ) P0 (λ 2 | λ1 )] ; p12 = a[ P1 (λ 2 | λ1 ) + P1 (λ 2 | λ 2 ) P0 (λ 2 | λ1 )];
p21 = a[ P1 (λ1 | λ 2 ) + P1 (λ1 | λ1 ) P0 (λ1 | λ 2 )]; p22 = a[ P1 (λ 2 | λ 2 ) + P1 (λ 2 | λ1 ) P0 (λ1 | λ 2 )];
a = 1/[1 − P0 (λ1 | λ 2 ) P0 (λ 2 | λ1 )].
(5)
Подставляя (5) в (3), получаем
P1 (λ1 | λ 2 ) + P1 (λ1 | λ1 ) P0 (λ1 | λ 2 )
π1 (0) =
,
P1 (λ1 | λ 2 ) + P1 (λ 2 | λ1 ) + P1 (λ1 | λ1 ) P0 (λ1 | λ 2 ) + P1 (λ 2 | λ 2 ) P0 (λ 2 | λ1 )
π2 (0) =
P1 (λ 2 | λ1 ) + P1 (λ 2 | λ 2 ) P0 (λ 2 | λ1 )
. (6)
P1 (λ1 | λ 2 ) + P1 (λ 2 | λ1 ) + P1 (λ1 | λ1 ) P0 (λ1 | λ 2 ) + P1 (λ 2 | λ 2 ) P0 (λ 2 | λ1 )
Плотность вероятностей p(τ) при этом примет вид
2
2
i =1
j =1
p( τ ) = ∑ πi (0)∑ pij ( τ ), τ ≥ 0 .
(7)
Подставляя в (7) сначала (2), затем (1) и (6) и проделывая при этом необходимые преобразования, получаем явный вид плотности вероятностей p(τ):
p( τ ) = γz1e − z1τ + (1 − γ ) z2 e− z2 τ , τ ≥ 0;
1
{ z2 − λ1 π1 (0)[1 − P0 (λ 2 | λ1 )] − λ 2 π2 (0)[1 − P0 (λ1 | λ 2 )]} ,
z2 − z1
где z1, z2 определены в (1); π1(0), π2(0) – в (6). Положив в (8)
P0 (λ 2 | λ1 ) = P0 (λ1 | λ 2 ) = 0 , P1 (λ 2 | λ1 ) = p ,
γ=
(8)
P1 (λ1 | λ1 ) = 1 − p , P1 (λ1 | λ 2 ) = q , P1 (λ 2 | λ 2 ) = 1 − q ,
получаем плотность вероятностей p(τ) для синхронного потока [18].
3. Вывод совместной плотности вероятностей p(τ1, τ2)
В силу того, что последовательность моментов наступления событий MAPпотока образует вложенную цепь Маркова, совместная плотность вероятностей
p(τ1, τ2) примет вид
2
2
2
i =1
j =1
k =1
p( τ1 , τ 2 ) = ∑ πi (0)∑ pij ( τ1 )∑ p jk ( τ 2 ), τ1 ≥ 0, τ 2 ≥ 0,
(9)
где pij ( τ1 ) , p jk ( τ 2 ) определены в (2); при этом в выражениях для pij ( τ ) , i = 1,2,
нужно произвести замену τ на τ1 и τ на τ2. Тогда подставляя в (9) сначала pij ( τ1 ) ,
pij ( τ 2 ) , определенные в (2), затем pij ( τ1 ) , pij ( τ 2 ) , определенные в (1) для τ = τ1 и
τ = τ2, затем πi(0), определенные в (6), i = 1,2, и проделывая необходимые преобразования, находим
P (λ | λ ) P (λ | λ ) − P1 (λ1 | λ 2 ) P1 (λ 2 | λ1 )
p( τ1 , τ 2 ) = p ( τ1 ) p( τ 2 ) + γ (1 − γ ) 1 1 1 1 2 2
×
1 − P0 (λ1 | λ 2 ) P0 (λ 2 | λ1 )
(
× z1e − z1τ1 − z2 e− z2 τ1
)( z1e− z τ
1 2
)
− z2 e − z1τ2 , τ1 ≥ 0, τ2 ≥ 0,
где p(τ1), p(τ2), γ определены в (8) для τ = τ1 и τ = τ2.
(10)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.М. Горцев, А.А. Соловьев
38
Таким образом, в общем случае MAP-поток событий является коррелированным потоком.
Нетрудно получить вероятностные характеристики потока, такие, как математическое ожидание длительности интервала между соседними событиями, дисперсию и ковариацию:
2
Mτ =
⎡ γ 1− γ ⎤ ⎡ γ 1− γ ⎤
γ 1− γ
, Dτ = 2 ⎢ 2 + 2 ⎥ − ⎢ +
+
,
z2 ⎥⎦
z1
z2
z2 ⎦ ⎣ z1
⎣ z1
cov( τ1 , τ 2 ) = γ (1 − γ )
z2 − z1 P1 (λ1 | λ1 ) P1 (λ 2 | λ 2 ) − P1 (λ1 | λ 2 ) P1 (λ 2 | λ1 )
.
1 − P0 (λ1 | λ 2 ) P0 (λ 2 | λ1 )
z1 z2
В рассматриваемом потоке присутствуют события четырех типов: 1) события,
наступившие при переходе процесса λ(τ) из первого состояния в первое, 2) события, наступившие при переходе процесса λ(τ) из первого состояния во второе,
3) события, наступившие при переходе процесса λ(τ) из второго состояния в первое, 4) события, наступившие при переходе процесса λ(τ) из второго состояния
во второе. Типы событий являются неразличимыми. Обозначим qj – стационарную вероятность того, что наступившее событие потока есть событие j-го типа,
j = 1, 2, 3, 4. Тогда, используя вышеприведенные результаты, нетрудно получить
явные выражения для qj:
q1 = bP1 (λ1 | λ1 )[ 1 − P1 (λ 2 | λ 2 )] , q2 = bP1 (λ 2 | λ1 )[ 1 − P1 (λ 2 | λ 2 )] ,
q3 = bP1 (λ1 | λ 2 )[ 1 − P1 (λ1 | λ1 )] , q4 = bP1 (λ 2 | λ 2 )[ 1 − P1 (λ1 | λ1 )] ,
b = [ P1 (λ1 | λ 2 ) + P1 (λ 2 | λ1 ) + P1 (λ1 | λ1 ) P0 (λ1 | λ 2 ) + P1 (λ 2 | λ 2 ) P0 (λ 2 | λ1 )]−1 .
Отметим, что
π1(0) = q1 + q3, π2(0) = q2 + q4.
Полагая в (10)
P0 (λ 2 | λ1 ) = P0 (λ1 | λ 2 ) = 0 , P1 (λ 2 | λ1 ) = p ,
P1 (λ1 | λ1 ) = 1 − p , P1 (λ1 | λ 2 ) = q , P1 (λ 2 | λ 2 ) = 1 − q ,
получаем совместную плотность вероятностей p(τ1, τ2) для синхронного потока
[15].
4. Условия рекуррентности MAP-потока событий
Рассмотрим частные случаи, при которых MAP-поток событий становится рекуррентным потоком.
Используя выражение (8) для γ и выражение (6), можно показать, что
1 − P0 (λ1 | λ 2 ) P0 (λ 2 | λ1 )
γ( 1 − γ ) =
×
( z2 − z1 ) 2
λ1[1 − P0 (λ 2 | λ1 )] − λ 2 [1 − P0 (λ1 | λ 2 )]
×
×
P1 (λ1 | λ 2 ) + P1 (λ 2 | λ1 ) + P1 (λ1 | λ1 ) P0 (λ1 | λ 2 ) + P1 (λ 2 | λ 2 ) P0 (λ 2 | λ1 )
× {λ1π1 (0)[1 − P1 (λ1 | λ1 )] − λ 2 π2 (0)[1 − P1 (λ 2 | λ 2 )]} .
(11)
Из (11) вытекает
1) если λ1[1 − P0 (λ 2 | λ1 )] − λ 2 [1 − P0 (λ1 | λ 2 )] = 0 , то совместная плотность (10)
факторизуется: p(τ1,τ2) = p(τ1)p(τ2); при этом из (1) следует, что
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Совместная плотность вероятностей длительности интервалов MAP-потока событий
39
z1 = λ1[1 − P0 (λ 2 | λ1 )] либо z1 = λ 2 [1 − P0 (λ1 | λ 2 )] , из (8) следует γ = 1, и тогда
p( τi ) = z1e − z1τi , τi ≥ 0, i = 1,2, то есть p( τ ) = z1e − z1τ , τ ≥ 0;
2) если λ1π1 (0)[1 − P1 (λ1 | λ1 )] − λ 2 π2 (0)[1 − P1 (λ 2 | λ 2 )] = 0 , то совместная плотность (10) факторизуется: p(τ1,τ2) = p(τ1)p(τ2); при этом из (1) следует, что
P (λ | λ ) + P1 (λ1 | λ1 ) P0 (λ1 | λ 2 )
z1 = λ1 1 1 2
1 − P1 (λ 2 | λ 2 )
либо
z1 = λ 2
P1 (λ 2 | λ1 ) + P1 (λ 2 | λ 2 ) P0 (λ 2 | λ1 )
,
1 − P1 (λ1 | λ1 )
(12)
из (8) следует γ = 1, и тогда
p( τi ) = z1e − z1τi , τi ≥ 0, i = 1,2,
p( τ ) = z1e − z1τ , τ ≥ 0;
то есть
Из (10) следует третье условие факторизации совестной плотности вероятности p(τ1,τ2): P1 (λ1 | λ1 ) P1 (λ 2 | λ 2 ) − P1 (λ1 | λ 2 ) P1 (λ 2 | λ1 ) = 0 . Тогда
γ=
1
[ z2 − λ1 P1( λ1 | λ1 ) − λ 2 P1( λ 2 | λ 2 )] ,
z2 − z1
1− γ =
и, следовательно,
то есть
1
[λ1 P1( λ1 | λ1 ) + λ 2 P1( λ 2 | λ 2 ) − z1 ]
z2 − z1
p( τi ) = γz1e − z1τi + (1 − γ ) z2 e− z2 τi , τi ≥ 0, i = 1,2,
p( τ ) = γz1e − z1τ + (1 − γ ) z2 e− z2 τ , τ ≥ 0.
Если выполняется одно из вышеприведенных условий, то тогда MAP-поток
событий будет рекуррентным потоком. Действительно, пусть p(τ1,…, τk, τk+1) – совместная плотность вероятностей τ1,…, τk, τk+1, где τk = τk+1 – τk, k = 1,2,… . Для k = 2
имеет место p(τ1,τ2) = p(τ1)p(τ2). Сделаем предположение математической индукции: p(τ1,…, τk) = p(τ1)… p(τk). Так как моменты наступления событий t1, t2,…, tk,
tk+1 образуют вложенную цепь Маркова, то MAP-поток событий обладает марковским свойством в моменты наступления событий. Тогда p(τ1,…, τk, τk+1) = p(τ1,…,
τk) p(τk+1 | τ 1,…, τk) = p(τ1,…, τk) p(τk+1 | τk), где p(τk+1 | τk) = p(τk , τk+1)/p(τk). Так как для
двух соседних интервалов (tk+1, tk), (tk+2, tk+1), k = 1,2,…, местоположение которых
на временной оси произвольно, справедливо p(τk , τk+1) = p(τk ) p(τk+1), то получаем
p(τk+1 | τk) = p(τk+1), что доказывает факторизацию совместной плотности вероятности p(τ1,…, τk, τk+1).
При нижеследующем обсуждении условий реккурентности необходимо использование результатов, приведенных в [19].
Для первого условия факторизации апостериорная вероятность w(λ1| t)
первого состояния процесса λ(t) (несмотря на то, что поток рекуррентный и плотность p(τ) экспоненциальная) зависит от предыстории, т.е. зависит от моментов
наступлений событий t1,…, tk. Если здесь ввести дополнительное ограничение:
λ1 P1( λ1 | λ1 ) − λ 2 P1( λ 2 | λ 2 ) = 0 , то вероятность w(λ1| t) не будет зависеть от предыстории, а будет зависеть только от её значения в момент наступления события
потока, т.е. от w(λ1| tk+0) = P1(λ1| λ2)/[1– P0(λ1| λ2)], k = 1,2,…; так что при дополни-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
40
А.М. Горцев, А.А. Соловьев
тельном ограничении имеется некоторая близость MAP-потока событий к простейшему потоку.
Для второго условия факторизации апостериорная вероятность w(λ1| t)
также будет зависеть от моментов наступления событий t1,…, tk, несмотря на то,
что поток рекуррентный и плотность p(τ) экспоненциальная. Если ввести два
дополнительных условия: 1) P1(λ2| λ1)[1– P1(λ2| λ2)] – P1(λ1| λ2)[1– P1(λ1| λ1)] = 0,
2) P1(λ1| λ1)P1(λ2| λ2) – P1(λ1| λ2)P1(λ2| λ1) = 0, то тогда апостериорная вероятность
w(λ1| t) = π1, где π1 = P1(λ1| λ1)/[ P1(λ1| λ1) + P1(λ2| λ1)], π1 – априорная стационарная
вероятность первого состояния процесса λ(t). То есть для этой ситуации
апостериорная вероятность w(λ1| t) вообще не зависит от моментов наступления
событий, так что здесь имеет место наибольшая близость MAP-потока
событий к простейшему потоку. При этом в (12) z1 = λ1[1 − P0 (λ 2 | λ1 )] либо
z1 = λ 2 [1 − P0 (λ1 | λ 2 )] .
Для третьего условия факторизации апостериорная вероятность w(λ1| t) не зависит от предыстории, а зависит только от её значения в момент наступления события потока, то есть от w(λ1| tk+0) = π1(0) = P1(λ1| λ1)/[ P1(λ1| λ1) + P1(λ2| λ1)],
k = 1,2,…, так что для этой ситуации имеется некоторая близость MAP-потока событий к простейшему потоку.
Заключение
Полученные результаты делают возможным решение задачи оценки неизвестных параметров, задающих MAP-поток событий.
В общем случае коррелированного MAP-потока для оценки неизвестных параметров можно использовать метод моментов; для частных случаев, когда MAPпоток становится рекуррентным, – метод максимального правдоподобия.
ЛИТЕРАТУРА
1. Kingman J.F.C. On doubly stochastic Poisson process // Proc. of Cambridge Phylosophical
Society. 1964. V. 60. No. 4. P. 923–930.
2. Башарин Г.П., Кокотушкин В.А., Наумов В.А. О методе эквивалентных замен расчета
фрагментов сетей связи // Изв. АН СССР. Техн. кибернетика. 1979. № 6. С. 92–99.
3. Башарин Г.П., Кокотушкин В.А., Наумов В.А. О методе эквивалентных замен расчета
фрагментов сетей связи // Изв. АН СССР. Техн. кибернетика. 1980. № 1. С. 55–61.
4. Neuts M.F. A versatile Markov point process // J. Appl. Probab. 1979. V. 16. P. 764–779.
5. Lucantoni D.M. New results on the single server queue with a batch markovian arrival process // Communications in Statistics Stochastic Models. 1991. V. 7. P. 1–46.
6. Дудин А.Н., Клименок В.И. Системы массового обслуживания с коррелированными потоками. Минск: Изд-во БГУ, 2000. 175с.
7. Нежельская Л.А. Нелинейная оптимальная фильтрация дважды стахостического потока с инициативными событиями // Тез. докл. научно-технич. конф. «Микросистема –
91». Суздаль. М.: Всесоюзное общество информатики и вычислительной техники,
1991. С. 26–28.
8. Горцев А.М., Нежельская Л.А. Оценка параметров синхронного MC-потока событий //
Сети связи и сети ЭВМ: тез. докл. Восьмой Белорусской зимней школы-семинара по
теории массового обслуживания. Минск: Изд-во БГУ, 1992. С. 33.
9. Горцев А.М., Нежельская Л.А. Оптимизация параметров адаптера при наблюдении за
MC-потоком // Стохастические и детерминированные модели сложных систем. Новосибирск: Изд-во ВЦ СО АН СССР, 1988. С. 20–32.
10. Горцев А.М., Нежельская Л.А. Оптимальная нелинейная фильтрация марковского потока событий с переключениями // Техника средств связи. Сер. Системы связи. 1989.
Вып. 7. С. 46–54.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Совместная плотность вероятностей длительности интервалов MAP-потока событий
41
11. Нежельская Л.А. Алгоритм оценивания состояний полусинхронного потока событий с
учетом мертвого времени // Массовое обслуживание: потоки, системы, сети: материалы Четырнадцатой Белорусской зимней школы-семинара по теории массового обслуживания. Минск: Изд-во БГУ, 1998. С. 18−21.
12. Горцев А.М., Калягин А.А., Нежельская Л.А. Оптимальная оценка состояний обобщенного полусинхронного потока событий // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 2 (11). С. 66–81.
13. Горцев А.М., Нежельская Л.А. О связи MC-потоков и MAP-потоков событий // Вестник
Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 1 (14). С. 13–21.
14. Васильева Л.А., Горцев А.М. Оценивание длительности мертвого времени асинхронного дважды стохастического потока событий в условиях его неполной наблюдаемости //
Автоматика и телемеханика. 2003. № 12. С. 69–79.
15. Бушланов И.В.., Горцев А.М., Нежельская Л.А. Оценка параметров синхронного дважды стохастического потока событий // Автоматика и телемеханика. 2008. № 9.
С. 76−93.
16. Горцев А.М., Шмырин И.С. Оптимальная оценка состояний дважды стохастического
потока событий при наличии ошибок в измерениях моментов времени // Автоматика и
телемеханика. 1999. № 1. С. 52–66.
17. Бушланов И.В., Горцев А.М. Оптимальная оценка состояний синхронного дважды стохастического потока событий // Автоматика и телемеханика. 2004. № 9. С. 40–51.
18. Горцев А.М., Нежельская Л.А. Оценивание параметров синхронного дважды стохастического потока событий методом моментов // Вестник ТГУ. Приложение. 2002. № 1(I).
C. 24−29.
19. Горцев А.М., Нежельская Л.А., Соловьев А.А. Оптимальная оценка состояний обобщенного синхронного потока // Новые информационные технологии в исследовании
сложных структур: тез. докл. Восьмой Российской конференции с международным
участием. Томск: Изд-во НТЛ, 2010. С. 31.
Горцев Александр Михайлович
Соловьев Александр Александрович
Томский государственный университет
E-mail: amg@fpmk.tsu.ru; sisal@mail.ru
Поступила в редакцию 23 апреля 2012 г.
Gortzev Alexander M., Soloviev Alexander A. (Tomsk state University). The joint density of
probability intervals MAP of the flow of events and conditions of its recurrence.
Keywords: MAP-flow of events, the density of probabilities, the joint density of probabilities, recurrence flow of events.
There is considered a MAP-flow of events with the intensity, which is a piecewise-constant
stationary random process λ(t) with two states λ(t) = λ1 or λ2 (λ1 > λ2). The duration of stay of the
process of λ(t) in the i-th state is distributed according to the exponential law with parameters λi,
i = 1,2. At the end of the i-th state of the process λ(t) one of the following situation is possible:
1) the process λ(t) moves from i-th state to j-th and the event of the flow arrives; the joint probability of this situation – P1(λi| λj), i, j = 1,2; 2) the process λ(t) moves from the i-th state to the
j-th and event MAP-flow does not occur; the joint probability of this situation is P0(λi | λj),
(i, j = 1,2; i≠j). Since the occurrence and transition of the process λ(t) from state to state takes
place instantly, to obtain the analytical results of the article it is irrelevant in which state an event
occurs .
There is solved the problem of finding of explicit form of the density of probability p(τ) of
interval between two events in MAP-flow and an explicit form of p (τ1,τ2) – joint probability density of the duration of two adjacent intervals.
The conditions of recurrence of MAP flow of events are obtained.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
УДК 519.2 (311.2)
Ю.Г. Дмитриев, С.В. Курицина
ОБ ИСПОЛЬЗОВАНИИ ДОПОЛНИТЕЛЬНОЙ ИНФОРМАЦИИ
В СТАТИСТИЧЕСКОМ ОЦЕНИВАНИИ ПАРАМЕТРОВ
ДЕТЕРМИНАЦИОННОГО АНАЛИЗА
Рассматривается задача оценивания параметров детерминационного анализа
в предположении, что имеется некоторая дополнительная информация о
распределении признаков. Строятся различные оценки с использованием
этой информации и изучаются их свойства. Анализируется влияние учета
информации на качество оценивания, приводятся примеры применения оценок в анализе реальных данных.
Ключевые слова: детерминационный анализ, интенсивность, емкость, дополнительная информация, статистические оценки, таблица сопряженности.
Одним из методов анализа социально-экономических данных является детерминационный анализ (ДА), предложенный С.В. Чесноковым [1]. Этот метод служит для поиска и интерпретации взаимосвязей между переменными (признаками)
или группами переменных на основе эмпирических материалов обследований и
представляет собой вариант исчисления эмпирических условных частот (долей),
которые содержатся в таблицах сопряженности. При этом устанавливаются ситуации, в которых по конкретным значениям одних индикаторов можно с известной определенностью предсказывать значения других. Важными характеристиками ДА являются интенсивность и емкость, вычисляемые по данным таблицы сопряженности выделенных признаков и представляющие собой оценки условных
долей. Точность вычислений этих характеристик можно повысить, если наряду с
исходными данными использовать имеющуюся дополнительную информацию об
исследуемой генеральной совокупности. В данной работе дополнительная информация выступает в виде знания долей (или числа) объектов генеральной совокупности с заданными значениями, как изучаемых, так и других признаков. Предлагается подход к учету такого вида информации при построении статистических
оценок долей, интенсивности и емкости, анализируется выигрыш в точности оценивания, приводятся примеры практического применения.
1. Оценки интенсивности и емкости
с учетом дополнительной информации
Приведем основные понятия ДА. Пусть у объектов некоторой совокупности
выделены два признаками X и Y. Среди множества значений признака Х имеется
значение a , а у признака Y – значение b. Согласно [1], правило как детерминация
– это условное суждение вида: «Если а, то b» (или сокращенно a → b ) вместе с
двумя своими характеристиками – точностью и полнотой, которые характеризуются соответственно интенсивностью и ёмкостью детерминации, являющимися
условными долями:
N ( a, b)
N ( a, b)
, C ( a → b) =
.
(1)
I ( a → b) =
N (a)
N (b)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Об использовании дополнительной информации в статистическом оценивании параметров 43
Здесь N (a, b) – количество объектов генеральной совокупности, у которых одновременно X = a и Y = b, N (a) – количество объектов с X = a, N (b) – количество
объектов с Y = b. Интенсивность выражает точность детерминации, а ёмкость – ее
полноту. Интенсивность и ёмкость обычно подсчитываются по таблице сопряженности выделенных признаков, построенной на основании случайной выборки
объема n.
Рассмотрим задачу статистического оценивания характеристик (1) в терминах
событий А = {X = a}, B = {Y = b}, AВ = {X = a, Y = b} и соответствующих вероятностей P(A), P(В) и P(AB). Тогда интенсивность и емкость детерминации a → b ,
которую обозначим как A → B , примут вид
I ( A → B ) = P ( B A) =
P ( AB )
P ( AB)
, С ( A → B) = P ( А В) =
.
P ( A)
P( В)
(2)
Пусть случайной выборке объема n соответствуют эмпирические вероятности
Pn ( A) =
1 n
1 n
1 n
I i ( A) , Pn ( В) = ∑ I i ( В) , Pn ( AВ ) = ∑ I i ( AВ) ,
∑
n i =1
n i =1
n i =1
где I (⋅) − индикаторная функция соответствующего события. Подставив эти эмпирические вероятности в (2), получим статистические оценки функции интенсивности и емкости в виде
P ( AB )
P ( AB )
, Gn = n
.
(3)
Jn = n
Pn ( A)
Pn ( В )
В объектах, попавших в выборку, могут быть и другие наблюдаемые признаки.
Пусть признак Z один из них. Рассмотрим событие С = {Z = c}, для которого известна вероятность Р(С). Другими словами, известна доля объектов генеральной
совокупности, у которых Z имеет заданное значение c. Используем эту информацию для построения оценок вероятностей других событий и характеристик (2).
Рассмотрим оценки, основанные на использовании формулы полной вероятности
[2]:
P ( BС )
P ( BС )
Pˆn ( B ) = Pn ( B | C ) P (С ) + Pn ( B | C ) P (С ) = n
P (С ) + n
Р (С ) ,
Pn (С )
Рn (С )
(4)
где C – событие противоположное событию С. Применив формулу (4) для оценивания вероятности P(A), методом подстановки получим оценки характеристик
(2), с учетом имеющейся информации. Анализ свойств получающихся оценок и
их сравнение с оценками (3) проведем на примере оценивания интенсивности детерминации. Далее предполагается, что объем генеральной совокупности достаточно большой по сравнению с объемом выборки, так что поправкой на бесповторность можно пренебречь, и асимптотические соотношения выполняются.
Метод подстановки приводит к следующей оценке интенсивности с учетом
дополнительной информации:
Pˆ ( AB)
Jˆn = J ( Pˆn ( AB), Pˆn ( A) ) = n
=
Pˆ ( A)
n
Pn ( ABC )
P ( ABC )
P (C ) + n
P (C )
Pn (C )
Pn (C )
Pn ( AC )
P ( AC )
P (C ) + n
P (C )
Pn (C )
Pn (C )
.
(5)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.Г. Дмитриев, С.В. Курицина
44
Исследуем асимптотическое поведение данной оценки. Поскольку при увеличении n оценки вероятностей сходятся по вероятности к истинным значениям, то
можно провести разложение Jˆn в окрестности истинных вероятностей по формуле Тейлора с остатком в форме Лагранжа. Имеем
P ( AB )
1
P( AB )
Jˆn =
Pn ( ABC ) − P ( ABC ) + Pn ( ABC ) − P( ABC ) − 2
+
( Pn ( AC ) −
P( A) P ( A)
P ( A)
(
)
− P ( AC ) + Pn ( AC ) − P ( AC ) ) +
+
1 ⎡ P ( ABC ) − P ( AB ) P(C ) ⎤
−
⎥ ( Pn (C ) − P (C ) ) +
P ( A) ⎢⎣
P (C ) (1 − P(C ) )
⎦
P ( AB ) ⎡ P( AC ) − P( A) P(C ) ⎤
⎢
⎥ ( Pn (C ) − P (C ) ) + Rn .
P 2 ( A) ⎣ P (C ) (1 − P (C ) ) ⎦
(6)
Обозначим главную часть в (6) через Jˆ g . Анализ показывает, что математическое
ожидание и дисперсия главной части удовлетворяют соотношениям
M {Jˆ } = J , nD{Jˆ } = σ2 =
g
=
g
P ( AB) ⎛ P( AB ) ⎞
1
⎡ P ( ABC ) − P( AB) P(C )
−
⎜ 1 − P ( A) ⎟ − P (C ) 1 − P (C ) ⎢
2
P ( A)
(
)
P ( A) ⎝
⎠
⎣
2
⎤
− 2
( P( AC ) − P( A) P(C ) ) ⎥ .
P ( A)
⎦
P ( AB )
Рассмотрим выражение
(
)
(
(7)
)
n Jˆn − J = n Jˆ g − J + nRn .
В силу центральной предельной теоремы последовательность
n Jˆ − J ~ N 0, σ2 ,
(
g
)
(
2
)
т.е. имеет асимптотически нормальное распределение с нулевым математическим
ожиданием и дисперсией, определяемыми формулой (7).
Последовательность n ⋅ Rn слабо сходится к нулю в силу теоремы непрерывности (см. [3, гл. 6]). Следовательно, последовательность n ( Jˆ − J ) имеет асимn
птотически нормальное распределение с нулевым математическим ожиданием и
дисперсией σ22 . Аналогично показывается, что оценка интенсивности без учета
информации
(см.
(3))
является
асимптотически
нормальной,
т.е.
(
)
n ⋅ ( J n − J ) ~ N 0, σ12 с дисперсией
σ12 =
P( AB ) ⎛ P ( AB ) ⎞
⎜1 − P( A) ⎟ .
P 2 ( A) ⎝
⎠
(8)
Сравнение двух выражений (7) и (8) показывает, что учет дополнительной информации в оценивании приводит к уменьшению асимптотической дисперсии
оценки на величину
δ=
2
1
⎡ P ( ABC ) − P( AB ) P (C ) P( AB)
⎤ . (9)
−
P
(
AC
)
−
P
(
A
)
P
(
C
)
(
)
⎥⎦
P(C ) ⋅ (1 − P (C ) ) ⎢⎣
P ( A)
P 2 ( A)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Об использовании дополнительной информации в статистическом оценивании параметров 45
Из (9) следует, что при независимости событий А, В и С уменьшения асимптотической дисперсии нет, так как δ = 0 . Выигрыш в точности можно характеризовать
отношением асимптотических дисперсий, т.е. величиной
W1 =
σ12
[ P( A)( P ( ABC ) − P ( AB) P(C )) − P( AB)( P( AC ) − P( A) P(C )]2
. (10)
=
1
−
σ22
P ( A) P (C ) P (C ) P ( AB)( P( A) − P( AB))
Формула (10) показывает, что чем W1 ближе к нулю, тем сильнее влияние учета
дополнительной информации на точность оценивания интенсивности, и чем ближе к единице, тем слабее это влияние. При независимости событий А и С величина W1 = 1 и выигрыша в точности оценивания нет.
Из формул (7) – (10), в частности, следуют выражения для асимптотической
дисперсии и характеристик выигрышей в точности для оценки (4). Для этого нужно предположить, что событие A всегда наступает (является достоверным событием). В этом случае, полагая P(A) = 1, P(AB) = P(B), P(AC) = P(C), P(ABC) = P(BC),
получим
σ22 = P( B)(1 − P ( B )) −
[ P( BC ) − P( B) P(C )]2
[ P( BC ) − P( B) P(C )]2
, δ1 =
; (11)
P (C ) (1 − P (C ) )
P (C ) (1 − P (C ) )
[ P( BC ) − P( B) P(C )]2
V1 = 1 −
.
P (C ) (1 − P(C ) ) P ( B ) (1 − P ( B) )
(12)
Данные соотношения применяются для анализа точности оценок вероятностей и
других событий.
Аналогичным образом анализируются свойства статистической оценки для
ёмкости детерминации
P( AB )
G = C ( A → B) = P ( A B) =
.
P( B)
Статистическая оценка без учета дополнительной информации дается формулой
(3), а с учетом информации формулой
Pˆ ( AB )
=
Gˆ n = Gn ( Pˆn ( AB ), Pˆn ( B ) ) = n
Pˆ ( B )
n
Pn ( ABC )
P ( ABC )
P (C ) + n
P (C )
Pn (C )
Pn (C )
Pn ( BC )
P ( BC )
P (C ) + n
P (C )
Pn (C )
Pn (C )
.
(13)
Рассуждениями, аналогичными вышеприведенным, можно показать, что асимптотические свойства оценок (3) и (13) следующие:
(
)
(
)
n Gn − G ~ N 0, σ12 ,
(
)
(
)
n ⋅ Gn* − G ~ N 0, σ22 ,
где асимптотические дисперсии имеют вид
σ12 =
P ( AB ) ⎛ P ( AB ) ⎞
⎜1 − P( B) ⎟ ,
P 2 ( B) ⎝
⎠
(14)
2
σ22
=
σ12
⎡ P ( ABC ) − P( AB ) P(C ) P( AB)( P( BC ) − P( B) P(C )) ⎤
1
−
−
⎢
⎥ . (15)
P (C ) P (C ) ⎣
P( B)
P 2 ( B)
⎦
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.Г. Дмитриев, С.В. Курицина
46
Второе слагаемое в (15) характеризует величину, на которую уменьшается асимптотическая дисперсия при учете имеющейся информации по сравнению с (14).
Отношение асимптотических дисперсий оценок ёмкости с учетом дополнительной информации и без её учета характеризуется величиной
σ2
[ P ( B)( P ( ABC ) − P ( AB) P(C )) − P( AB)( P( BC ) − P( B) P(C ))]2
W2 = 12 = 1 −
. (16)
P( B ) P (C ) P (C ) P( AB)( P( B) − P( AB))
σ2
Формула (16) показывает, что чем W2 ближе к нулю, тем сильнее влияние учета
дополнительной информации на точность оценивания ёмкости, а чем ближе к
единице, тем слабее это влияние. В случае независимости событий В и С, а также
независимости А, В, С, величина W2 = 1 и выигрыша в точности оценивания нет.
2. Анализ данных социологического опроса
Пусть исследователя интересует предпочтение населения к тому или иному
кандидату перед предстоящими выборами. Производится опрос населения, и по
результатам опроса делаются выводы и заключения. Респондент – это объект наблюдения. Выделим два признака: Х – пол респондента (значение X = a – респондент мужчина, X = a – респондент женщина), Y – фамилия кандидата. Пусть
интерес представляет кандидат b. Детерминация a → b – это высказывание «если
респондент мужчина, то он проголосует за кандидата b»; данному высказыванию
приписывается интенсивность I (a → b) , отражающая его точность, или истинность. Емкость С (a → b) измеряет долю случаев реализации голосования за b, которая объясняется высказыванием «из a следует b», тем самым она отражает полноту этой детерминации. Интенсивность и емкость выражаются через вероятности P(A) = P{X = a}, P(B) = P{Y = b}, P(AB) = P{X = a,Y = b} по формуле (2).
Приведем пример расчетов для реальных данных. В поселении №1 опрошено
319 респондентов и по результатам опроса составлена таблица сопряженности двух
признаков (табл. 1). Кроме того, априори известно общее число избирателей поселения − 6380 человек, среди них мужчин – 3780, а женщин – 2600 человек. Таким
образом, доля избирателей мужчин составляет 3780/6380 = 0,5925, а женщин соответственно 0,4075. Это знание используем далее в обработке данных.
Таблица 1
Таблица сопряженности 2 × 2 по переменным X и Y
(объем выборки – 319 человек)
Y
y=b
38
152
y=b
x=a
90
39
x=a
X
Из табл. 1 следует, что
Pn ( B ) = 129 ≈ 0, 4044 , Pn ( B ) = 190 ,
319
319
128
191
≈ 0, 4013 , Pn ( A) =
Pn ( A) =
,
319
319
Pn ( AB ) = 90 ≈ 0, 2821 ;
319
(17)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Об использовании дополнительной информации в статистическом оценивании параметров 47
Jn =
Pn ( AB ) 90
P ( AB) 90
=
≈ 0, 7029 , Gn = n
=
≈ 0, 6977 .
Pn ( A) 128
Pn ( В ) 129
(18)
Таким образом, за кандидата b проголосовало 40,44 % от общего числа опрошенных респондентов. Эту величину можно уточнить, если учесть имеющуюся
информацию о долях избирателей мужчин и женщин в поселении. Если исходить
из общих формул, то в нашем случае это означает, что признак Z совпадает с
признаком X (C = A), P(A) = 0,5925, поэтому P(С) = P(А) = 0,5925. Данную информацию учтем с помощью формулы (4), полагая в ней С = А и принимая во
внимание вычисленные выше оценки вероятностей. Получим уточненную оценку
Pˆn ( B ) ≈ 0, 4998 = 49,98 % , которая отличается от значения Pn ( B ) на 9,54 % в
большую сторону. Заметим, что для оценивания интенсивности знание о долях
избирателей по полу ничего не дает, поскольку при С = А из (5) следует, что
Jˆn = J n и W1 = 1.
Для вычисления показателей выигрыша в точности нужно воспользоваться соотношениями (11) и (12). Однако в них не все вероятности известны, что делает
невозможным вычисление характеристик точности на практике. В реальности эти
характеристики можно оценить по имеющимся данным. Рассмотрим два способа
оценивания и сравним их результаты. Первый способ основан на использовании
значений (17), что приводит к оценкам характеристик
δn1 = 0, 0597 и Vn1 = 0, 7517 .
(19)
Второй способ основан на оценках вероятностей, построенных с учетом информации. Вычисления по имеющимся данным приводят к следующим значениям:
P ( AB )
Pˆn ( AB ) = n
P ( A) ≈ 0, 4166 , Pˆn ( A) = P ( A) ≈ 0,5925 , Gˆ n ≈ 0,8335 . (20)
Pn ( A)
δˆ n1 = 0.0601 , Vˆn1 = 0, 7595 , Wˆn 2 = 0, 7264 .
(21)
Сравнение результатов (17)−(21) показывает, что значения оценок вероятностей и
емкости без учета информации заметно отличаются от значений оценок вероятностей и емкости с учетом информации. Однако при этом значения оценок характеристик точности практически совпадают. Значения величин Vn1 , Vˆn1 , Wˆn 2 говорят
о том, что учет знания долей избирателей по полу при оценивании вероятностей
позволяет уменьшить объем выборки на 24−25 % для достижения одинаковой
точности с обычными оценками, а при оценивании емкости − на 27 %.
Пусть признак Z означает возраст респондента и значение с есть возрастной
интервал (18–34) лет. Известно, что доля избирателей рассматриваемого поселения в таком возрастом интервале равна 0,35, т.е. число таких избирателей равно
2233 и P(С) = P{Z = c} = 0,35. Рассмотрим таблицу сопряженности для трех признаков X, Y, Z в следующем виде:
Таблица 2
Таблица сопряженности 2 × 2 по переменным X, Y, Z (n = 319)
c
c
34
56
ab
ab
Z
26
12
ab
16
23
ab
13
139
XY
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.Г. Дмитриев, С.В. Курицина
48
Применим приведенные выше формулы для расчета оценок вероятностей, емкости и интенсивности с учетом информации о доли избирателей по возрасту
(пометим их волной и рядом с оценкой дадим ее точность). Имеем
Pn ( B ) ≈ 0, 4199 = 41,99 % ; Vn1 = 0,99918 ;
Pn ( A) ≈ 0, 4281 ; Vn1 = 0,99919; Pn ( AB ) ≈ 0, 2919 ;
J n ≈ 0,5105 ; Wn1 = 0,99999 ; Gn ≈ 0, 6953 ; Wn 2 = 0,99999 .
(22)
Из полученных вычислений следует, что влияние возрастной структуры совокупности на точность оценивания очень слабое, однако интенсивность уменьшилась,
а емкость практически не изменилась. Оценки вероятностей изменили свои значения, что дает возможность строить другие доверительные интервалам с одинаковой вероятностью доверия.
Детерминация c → b − это высказывание «если возраст респондента в интервале (18−34) лет, то он проголосует за кандидата b». Интенсивность и емкость
этой детерминации по данным табл. 2 равны соответственно
J n (c → b ) =
Gn (c → b) =
Pn (CB)
Pn (C )
Pn (CB )
Pn ( B)
=
50
≈ 0,5618 ,
89
=
50
≈ 0,3876 .
129
(23)
Учет информации о долях избирателей по возрасту приводит к следующему:
Jn =
Pn (CB )
Pn (C )
= J n (c → b) , Gn (c → b) = 0, 4683 .
Таким образом, интенсивность не изменилась, а емкость изменилась в сторону
увеличения.
Заключение
В работе показано, каким образом можно привлекать знания (дополнительную
информацию) о долях объектов генеральной совокупности по признакам и их
значениям для повышения точности оценивания различных характеристик. Рассмотренный пример, основанный на реальных данных, позволил увидеть возможности подхода к построению оценок. Подход допускает обобщение на большее
число значений признаков, чем рассмотрено в работе. Таблицы сопряженности
могут быть гораздо большей размерности. Показано, что существенное повышение точности не всегда происходит. Формулы, характеризующие точность оценивания, дают возможность подбирать признаки, их комбинацию, конкретные значения признаков, которые приводят к существенному повышению точности при
фиксированном объеме наблюдений или сокращению объема выборки при заданной точности. Показано, что сокращение объема данных может быть существенным. Асимптотическая нормальность оценок с учетом информации позволяет
строить доверительные интервалы, которые могут быть значительно уже по сравнению с обычными оценками. Детерминационный анализ можно осуществлять по
модифицированной таблице сопряженности, заменив обычные эмпирические частоты на их модификацию с учетом информации.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Об использовании дополнительной информации в статистическом оценивании параметров 49
ЛИТЕРАТУРА
1. Чесноков С.В. Детерминационный анализ социально-экономических данных. М: Наука,
1982. 214 с.
2. Тарима С.С. Использование дополнительной информации при оценке вероятностей и
интерпретации натурного эксперимента: дис. … канд. техн. наук, Томск: TГУ, 2002.
149 с.
3. Боровков A.A. Математическая статистика. М: Наука, 2007. 704 с.
Дмитриев Юрий Глебович
Курицина Светлана Валерьевна
Томский государственный университет
E-mail: dmit@mail.tsu.ru, sniksa1174@vtomske.ru
Поступила в редакцию 4 июня 2012 г.
Dmitriev Yury G., Kuritsina Svetlana V. (Tomsk State University). On the use of an additional
information in statistical estimate parameter of determinate analysis.
Keywords: determinate analysis, intensity, capacity, additional information, statistical estimate,
contingency table.
A problem of estimating of parameter of determinate analysis is considered under assumption
that certain additional information concerning features is available. Different estimators of parameter using an additional information are proposed, and their properties are studied. The impact
of using of additional information on the accuracy of the estimators is studied, examples of using
in the analysis of real data are given.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
УДК 519.2
Ю.Г. Дмитриев
ОБ ОЦЕНКАХ ВЕРОЯТНОСТЕЙ ПРИ НАЛИЧИИ ДАННЫХ
С ПРОПУСКАМИ
Рассматривается задача статистической вероятностей событий на основе
комплектных и некомплектных наблюдений. Предлагаются оценки с привлечением дополнительной информации, содержащейся в некомплектных
наблюдениях, а также имеющейся априори, исследуются свойства оценок.
Ключевые слова: комплектные и некомплектные наблюдения, дополнительная информация, статистическая оценка, таблица сопряженности.
Объекты наблюдений в социологических [1], экономических и маркетинговых
исследованиях [2] характеризуются многомерным вектором признаков, которые
могут быть как непрерывными, так и дискретными переменными. В процессе наблюдения объектов случаются пропуски в компонентах вектора признаков, что
приводит к некомплектным наблюдениям и ставит вопрос об их использовании в
анализе данных. Довольно часто их просто исключают из рассмотрения. В других
случаях пытаются заполнить пропуски, используя различные приемы, и увеличить число комплектных наблюдений. Главной задачей выборочного метода является статистическое оценивание долей объектов с заданными значениями признаков и анализ соотношения этих долей в соответствии с целями исследования.
В этой связи проблема оценки долей при наличии пропусков представляет важную научную и практическую задачу. В статистической практике известны методы статистического анализа данных с пропусками [3,4]. Кроме некомплектных
наблюдений исследователь дополнительно может располагать априорной информацией о долях объектов в генеральной совокупности с заданными значениями
признаков.
В связи с этим представляет интерес разработка методов статистического анализа данных и построения оценок с одновременным использованием всей имеющейся информации, как априорной, так и эмпирической, содержащейся в некомплектных наблюдениях. Рассмотрение этой задачи на примере оценивания вероятности событий по наблюдениям многомерного вектора категориальных признаков приводится в данной работе.
Практическое применение указанных оценок возникает в выборочных обследованиях некоторых совокупностей, когда требуется оценить долю объектов с заданным значением некоторого признака в случае известной доли объектов с заданным значением другого признака. Так, например, при выявлении предпочтений избирателей некоторой территории к тому или иному кандидату или партии
проводятся выборочные опросы людей и оцениваются доли избирателей, которые
будут голосовать за конкретного кандидата или партию. При этом о населении
территории всегда имеется разнообразная статистическая информация (половая,
возрастная, национальная, образовательная структура населения и т.д.), которую
можно использовать в оценивании долей с целью повышения точности оценок
или сокращения объема наблюдений при заданной точности оценивания.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Об оценках вероятностей при наличии данных с пропусками
51
1. Постановка задачи
Пусть объекты характеризуются r-мерным вектором (X1,…,Xr), компоненты
которого принимают конечное число значений. Из генеральной совокупности методом случайной выборки отобраны объекты, составлена матрица данных и результаты измерений сведены в таблицу сопряженности признаков. В некоторых
компонентах вектора часть измерений отсутствует. Будем считать эти пропуски
случайными. Наблюдения вектора признаков, в которых пропусков нет, назовем
комплектными, в противном случае − некомплектными. Компоненты Xl принимают значения alml , l = 1,..., r ; ml = 1,..., sr с вероятностями P ( Alml ) = P{ X l = alml } .
Нас будут интересовать как вероятности событий Alml = { X l = alml } , так и других
всевозможных событий, связанных с ними. В работе интересующее нас событие
будем обозначать через A, опуская для простоты сопутствующие индексы. Полную группу событий также будем обозначать единообразно H = (H1,…,Hk) . Разбиения множеств могут быть различными как по составу событий, так и по их
числу. В частности, это может быть разбиение, связанное с конкретным признаком, например Xr, тогда H j = Arj , j = 1,..., sr , P ( H j ) = P ( Arj ), k = sr . Разбиения могу быть по паре признаков и т.д. Эмпирическими вероятностями (относительными
частотами) событий являются
Pn ( Alml ) =
1 n
∑ Ii ( Alml ) ,
n i =1
где I (⋅) − индикаторная функция соответствующего события, n – объем выборки.
Рассмотрим задачу оценивания P(A), используя наряду с комплектными и некомплектные наблюдения с целью повышения точности оценки.
2. Структура несмещенной оценки
Пусть имеется случайная выборка объема n, по которой необходимо оценить
вероятность некоторого события P(A) при условии, что известны вероятности
P(Hj), j = 1,…, k, где совокупность событий H = (H1,…,Hk) образует полную группу событий. Данную информацию можно использовать в структуре оценки P ( A) ,
применяя формулы полной вероятности и условной вероятности [5]. Рассмотрим
следующую оценку:
k P ( AH )
⎧
n
j
⎪
∑ P ( H ) P( H j ), если Pn ( H j ) ≠ 0, j = 1,..., k ,
⎪
j =1 n
j
⎪k − s
*
Pn ( A) = ⎨ Pn ( AH j )
P( H j ) , если Pn ( H j ) ≠ 0, j = 1,..., k − s, 0 ≤ s ≤ k − 2,
⎪∑
⎪ j =1 Pn ( H j )
⎪ P ( A), если P( H ) = 0, s = k − 2.
j
⎩ n
(1)
1 n
∑ Ii ( AH j ) , Pn ( A), Pn ( H j ) – эмпирические вероятности (доn i =1
ли), построенные по исходным данным, s – число событий из H, для которых
Pn ( H j ) = 0 , 0 ≤ s ≤ k − 2 , P1 ,..., Pk − s – пересчитанные (нормированные) вероят-
Здесь Pn ( AH j ) =
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.Г. Дмитриев
52
ности после исключения из полной группы событий тех H j , для которых
Pn ( H j ) = 0 .
Покажем, что оценка (1) является несмещенной. Для k = 2 математическое
ожидание
⎧⎪ P ( AH1 )
⎫⎪
P ( AH 2 )
EPn* ( A) = E ⎨ n
P ( H1 ) + n
P( H 2 ) ⎬ =
Pn ( H 2 )
⎩⎪ Pn ( H1 )
⎭⎪
n
⎪⎧ P ( AH1 )
⎪⎫
= P ( H1 )∑ E ⎨ n
| i ⎬ P{nPn ( H1 ) = i} +
⎪ nPn ( H1 ) = i ⎭⎪
i =0 ⎩
n
⎪⎧ P ( AH 2 )
⎪⎫
+ P ( H 2 )∑ E ⎨ n
| i ⎬ P{nPn ( H 2 ) = i} =
⎪ nPn ( H 2 ) = i ⎭⎪
i =0 ⎩
n −1
= P ( H1 )[ P ( A)( P{Pn ( H1 ) = 0} + P{Pn ( H1 ) = 1} + ∑ P( A | H1 )P{nPn ( H1 ) = i}] +
i =1
n −1
+ P ( H 2 )[ P ( A)( P{Pn ( H 2 ) = 0} + P{Pn ( H 2 ) = 1} + ∑ P ( A | H 2 )P{nPn ( H 2 ) = i}] =
i =1
= P ( H1 ) P ( A)( P{Pn ( H1 ) = 0} + P{Pn ( H1 ) = 1}) + P( AH1 )(1 − ( P{Pn ( H1 ) = 0} +
+ P{Pn ( H1 ) = 1})) + P ( H 2 ) P ( A)( P{Pn ( H 2 ) = 0} + P{Pn ( H 2 ) = 1}) +
+ P ( AH 2 )(1 − ( P{Pn ( H 2 ) = 0} + P{Pn ( H 2 ) = 1})) = P ( A) .
(2)
Равенство в (2) вытекает из того, что
P ( H1 ) + P ( H 2 ) = 1 и P{Pn ( H1 ) = 0} = P{Pn ( H 2 ) = 1} .
Выполняя подобные рассуждения для значений k > 2 и учитывая (2), устанавливаем несмещенность оценки (1). Данная оценка имеет конечную дисперсию. В зависимости от типа выборки (повторная или бесповторная) дисперсии имеют разные
выражения, в силу громоздкости выражений они здесь не приводятся.
3. Асимптотическая нормальность оценок
Рассмотрим асимптотические свойства оценки (1) для повторной выборки. Поскольку эмпирические вероятности с ростом объема выборки стремятся по вероятности к своим истинным значениям, асимптотические свойства оценка будут
определяться поведением величины
k
Pn ( AH j )
j =1
Pn ( H j )
Qn∗ = ∑
P ( H j ), Pn ( H j ) ≠ 0, j = 1,..., k .
(3)
Разложим эту величину в окрестности истинных вероятностей по формуле Тейлора с остаточным членом Rn∗ в форме Лагранжа. В результате имеем
k
Qn∗ = P ( A) + ∑ [ P ( AH j ) − Pn ( AH j )) − P ( A | H j )( P ( H j ) − Pn ( H j )] + Rn∗ .
j =1
(4)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Об оценках вероятностей при наличии данных с пропусками
53
Главная часть в (4) имеет математическое ожидание равное P(A) и дисперсию
σ2A /n, где
k
σ2A = P ( A)(1 − P ( A) − (∑ P 2 ( A | H j )P ( H j ) − P 2 ( A)).
(5)
j =1
На основании теоремы непрерывности (см. [6, гл. 6]) последовательность
n Rn∗ слабо сходится к нулю при n → ∞ . Отсюда, в силу центральной предельной теоремы имеем
lim P{ n[ Pn* ( A) − P ( A)] < z} = N ( z , (0, σ2A )), z ∈ (−∞, +∞) ,
n →∞
где N ( z , (0, σ2A )) − нормальный закон распределения с нулевым математическим
ожиданием и дисперсией (5).
Пусть исходная выборка объема n = n1 + n2 состоит из n1 комплектных наблюдений и n2 некомплектных, причем событие А наблюдается только в комплектных
наблюдениях, а события Hj во всех наблюдениях и вероятности P(Hj) неизвестны.
В этом случае оценку для P(A) возьмем в виде
k
⎧
∑ Pn1 ( A | H j ) Pn ( H j ), если Pn1 ( H j ) ≠ 0, j = 1,..., k ,
⎪
j =1
⎪
⎪
(6)
Pˆn ( A) = ⎨ k − s
P ( A | H j ) Pn ( H j ) , если Pn1 ( H j ) ≠ 0, j = 1,..., k − s,
0 ≤ s ≤ k − 2,
⎪ ∑ n1
⎪ j =1
⎪⎩ Pn ( A), если Pn ( H j ) = 0, s = k − 2.
1
1
Для повторной выборки при n → ∞ асимптотические свойства оценки (6) определяются величиной
k
Qˆ n = ∑ Pn1 ( A | H j ) Pn ( H j ), Pn1 ( H j ) ≠ 0, j = 1,..., k .
j =1
Разложение этой величины в окрестности истинных вероятностей по формуле
Тейлора с остаточным членом Rn в форме Лагранжа приводит к выражению
k
Qˆ n = P ( A) + ∑ ( P( AH j ) − Pn1 ( AH j )) − P ( A | H j ) ×
j =1
×[( P( H j ) − Pn1 ( H j )) − ( P ( H j ) − Pn ( H j ))] + Rn .
В этом выражении главная часть имеет математическое ожидание равное P(A) и
дисперсию σˆ 2A /n1, где
σˆ 2A = [ P ( A)(1 − P( A) −
k
n2
(∑ P 2 ( A | H j )P ( H j ) − P 2 ( A))].
n1 + n2 j =1
(7)
Пусть соотношение между объемом выборки и объемом некомплектных наблюдений задается пропорцией n2 = tn, 0< t <1, которая соблюдается при увеличении n. Тогда отношение n2 /(n1 + n2 ) в пределе заменяется в (7) на t. В силу теоремы непрерывности (см. [6, гл. 6]) последовательность
nR слабо сходится к
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.Г. Дмитриев
54
нулю при n → ∞ . Следовательно, на основании центральной предельной теоремы имеем
lim P{ n[ Pˆ ( A) − P( A)] < z} = N ( z , (0, σˆ 2 )), z ∈ (−∞, +∞).
n →∞
n
A
Сравнение предельных дисперсий (5) и (7) асимптотически нормальных оценок
(1) и (6) показывает, что замена вероятностей P(Hj) на оценки Pn(Hj), построенные
по выборке, приводит к снижению точности, а величина уменьшения определяется коэффициентом пропорциональности t.
Заключение
Построены оценки для вероятностей событий с использованием априорной
информации и с учетом информации, содержащейся в некомплектных наблюдениях категориальных данных в выборочных исследованиях. Установлена асимптотическая нормальность оценок, получены асимптотические дисперсии оценок,
которые показываю, как влияет учет дополнительной информации на точность
оценок (уменьшение их дисперсий). Эти результаты позволяют строить доверительные интервалы неизвестных вероятностей с меньшей шириной по сравнению
с обычными эмпирическими оценками при тех же доверительных вероятностях.
Полученные оценки могут применяться в оценивании различных функционалов
от распределений (дисперсий оценок, условных распределений) методом подстановки.
ЛИТЕРАТУРА
1. Ядов В.А. Стратегия социологического исследования. М.: Омега-Л, 2007. 567 с.
2. Котлер Ф. Основы маркетинга: пер. с англ. М.: РосИнтер, 1996. 698 с.
3. Литтл Дж.А., Рубин Д.Б. Статистический анализ данных с пропусками. М.: Финансы и
статистика, 1991. 430 с.
4. Чурилова А.А. Корректировка неответов // Материалы семинара «Несплошные статистические исследования». Нижний Новгород, 2000. С. 27.
5. Тарима С.С. Использование дополнительной информации при оценке вероятностей и
интерпретации натурного эксперимента: дис. ... канд. техн. наук. Томск: ТГУ, 2001.
149 с.
6. Боровков A.A. Математическая статистика. М: Наука, 2007. 704 с.
Дмитриев Юрий Глебович
Томский государственный университет
E-mail: dmit@mail.tsu.ru
Поступила в редакцию 3 июля 2012 г.
Dmitriev Yury G. (Tomsk State University). On estimates of the probabilities with missing
data.
Keywords: complete and incomplete observations, additional information, statistical estimate,
contingency table.
A problem of estimating of the probabilities with missing data is considered under assumption
that certain additional information concerning probabilities is available. Different estimators of
the probabilities using an additional information are proposed, and their properties are studied.
The impact of using of additional information on the accuracy of the estimators is studied.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
УДК 519.25
Г.М. Кошкин, И.Ю. Глухова
НЕПАРАМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ НЕЛИНЕЙНЫХ
ARX-ПРОЦЕССОВ
Рассматриваются ядерные оценки условного среднего и функции чувствительности нелинейных ARX-процессов. Находятся главные части среднеквадратических ошибок оценок базовых функционалов и их производных.
Ключевые слова: ядерные оценки, условное среднее, функция чувствительности, нелинейный ARX-процесс.
Рассматривается скалярная последовательность (Yt )t =...−1,0,1,... , генерируемая
нелинейным ARX(m,p,d)-процессом:
Yt = Ψ (Yt −i1 ,..., Yt −im , X t1− j1 ,..., X t1− jr ,..., X tp− j ,..., X tp− j ) + ξt = Ψ (Yt ,m , X t , s ) + ξt , (1)
k
1
где Yt ,m = (Yt −i1 ,...,Yt −im ) , X t ,s = ( X t1− j1 ,..., X t1− jr ,..., X tp− j ,..., X tp− j ) – экзогенные пере1
k
менные, d = max(r ,..., k ) , 1≤ i1 < ...< im << n , 0 ≤ j1 < ...< jr << n,...,0 ≤ j1 < ...< jk << n –
известные подпоследовательности натурального ряда чисел, s = r+…+k, ξt – последовательность независимых одинаково распределенных (с положительной на
R1 плотностью распределения) случайных величин с нулевым математическим
ожиданием, единичной дисперсией, нулевым третьим и конечным четвёртым моментами, Ψ (Yt ,m , X t , s ) – неизвестная непериодическая ограниченная функция.
В данной работе предполагается, что выполняются условия, при которых процесс (Yt )t =...−1,0,1,... удовлетворяет условию сильного перемешивания (с.п.) с коэффициентом с.п. [1,2]
α(τ) ≈ e−δτ , δ > 0, τ → ∞ .
(2)
Модели типа (1) находят широкое применение при анализе экономических
систем и финансовых временных рядов.
1. Постановка задачи
Пусть Y1 , Y2 ,...Yn – наблюдения, порожденные процессом (1), L = max(m, d ) .
В качестве модели структуры Ψ в (1) возьмем условное математическое
ожидание
R ( y, x) = E (Yt | Yt , m = y, X t , s = x) = E (Yt | y, x) , ( y, x) ∈ R m + s .
Пусть a( y, x) = ∫ qf (q, y, x)dq – базовый функционал, где f (q,y,x) – неизвестная плотность распределения случайного вектора (Yt , Yt ,m , X t , s ) в стационарном
режиме.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.М. Кошкин, И.Ю. Глухова
56
В связи с тем, что
∫ f (q, y, x)dq = p( y, x) , где p(y,x) – плотность распределения
вектора (Yt ,m , X t , s ) , условное математическое ожидание можно представить
в виде
b( y , x ) =
a ( y, x)
= Yt f (Yt | y, x)dYt ,
p( y, x) ∫
(3)
В качестве непараметрической оценки функционала a( y, x) в точке (y, x)
возьмём статистику
an ( y, x) =
n
1
Yi
∑
n − L i = L +1
⎛ y − Yi , m ⎞
Km ⎜
⎟
y
⎝ h
⎠
1
m
∏ hj
⎛ x − X i,s ⎞
Ks ⎜
⎟,
x
⎝ h
⎠
1
r
k
j =1
j =1
∏ h1 j ...∏ hpj
j =1
где h y = (h1 , h2 ,...hm ), h x = (h1x , h2x ,...h px ) , h1x = (h11 ,...h1r ) ,..., h px = (h p1 ,..., h pk )
(4)
–
соответствующие параметры размытости, положительные числа, а K m и K s –
m-мерное и s-мерное ядра.
Таким образом, ядерная оценка подстановки условного функционала b(y,x) в
точке (y,x), а следовательно, и функции Ψ в (1) задаются отношением вида
n
∑ Yi
i = L +1
bn ( y, x) = Ψ n, L ( y, x) =
1
m
∏ hj
⎛ y − Yi ,m ⎞
Km ⎜
⎟
y
⎝ h
⎠
j =1
n
1
i = L +1
∏ hj
∑
m
1
r
k
∏ h1 j ...∏ hpj
j =1
⎛ y − Yi ,m ⎞
Km ⎜
⎟
y
⎝ h
⎠
j =1
⎛ x − X i,s ⎞
Ks ⎜
⎟
x
⎝ h
⎠
j =1
1
r
k
j =1
j =1
∏ h1 j ...∏ hpj
⎛ x − X i,s ⎞
Ks ⎜
⎟
x
⎝ h
⎠
.
(5)
На практике часто необходимо исследовать влияние каждого из факторов модели на выходную переменную. Для этого можно использовать функции чувствительности [3]. Введем обозначения (y,x) = z,
(6)
Z t = (Yt ,m , X t , s ) = (Yt −im , Y1,t −im −1 ,..., Yt −i1 , X t − js , X t − js −1 ,..., X t − j1 ) ;
h = (h1 , h2 ,...hm , h11 ,...h1r ,..., h p1 ,...h pk ) = (h1 , h2 ,..hm , h11 ,...h1r ,..., h p1 ,...h pk ) .
Функция чувствительности по j-му входу имеет вид
∂b( z )
∂ a( z )
T j ( z) =
=
,
∂z j
∂z j p ( z )
(7)
(8)
и, следовательно, нам необходимо оценить частные производные
a ( j ) ( y, x) = a ( j ) ( z ) =
a ( j ) n ( y, x) = a ( j ) n ( z ) =
∂a ( z )
, j = 1, m + s :
∂z j
n
1
∑
n − L i = L +1
1
m+s
h j ∏ hk
k =1
⎛ z − Zi
K m+ s( j ) ⎜
⎝ h
⎞
⎟.
⎠
(9)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Непараметрическая идентификация нелинейных ARX-процессов
57
Оценки функции чувствительности и условного функционала принимают вид
⎡ n
⎛ z − Zi
⎢ ∑ Yi K m + s ( j ) ⎜
1 ⎢
⎝ h
T jn ( z ) = ⎢ i = L +1n
z − Zi ⎞
hj
⎢ ∑ K m + s ⎛⎜
⎟
⎢⎣ i = L +1
⎝ h ⎠
bn(z) =
⎞
⎟
⎠
n
z−Z
⎛ z − Zi ⎞ n
∑ K ( j ) ⎛⎜ i
hn ⎟⎠i = L +1 m + s ⎝ h
∑ Yi K m+ s ⎜⎝
− i = L +1
n
⎛ z − Zi ⎞
h ⎟⎠
∑ Yi K m + s ⎜⎝
i = L +1
⎛ n
( j ) ⎛ z − Zi ⎞ ⎞
⎜ ∑ Km+s ⎜
⎟⎟
⎝ h ⎠⎠
⎝ i = L +1
n
⎛ z − Zi
Km+ s ⎜
⎝ h
i = L +1
∑
2
⎞⎤
⎟⎥
⎠⎥
⎥ ;(10)
⎥
⎦⎥
⎞
⎟.
⎠
(11)
2. Асимптотические свойства оценок функционалов и их производных
Пусть
ai + ( z ) = ∫ y i f ( y, z )dy , a +1(1+τ),tk ( z , s ) = ∫
где
R2
υt q p f1(1+τ) (υ, z , q, s )d υdq ,
(12)
f1(1+τ) – 2(m+s+1)-мерная плотность распределения выборочных величин
( Z1 , Z1+τ ) , τ ≥ 1 . Тот факт, что ( Z j ) удовлетворяет условию с.п. с коэффициентом
с.п. α(τ) , обозначим через ( Z j ) ∈ S (α ) .
Определение 1. Функция K(u) принадлежит классу одномерных нормированных ядер A( r ) , r = 0,1, если
K (⋅) ∈ A( r ) ,
если
и
∫K
K(u)
(r )
(r )
∫ K (u )du = 1 . Функция K (⋅) ∈ Aν ,
ν
удовлетворяет условиям
∫ u K (u ) du < ∞,
(u ) du < ∞ ,
T j = ∫ u j K (u )du = 0, j = 1,..., ν − 1, Tν ≠ 0, K(u) = K(−u).
Определение 2. Функция H (⋅) : R m + s → R1 принадлежит классу N ν , m + s ( z )
( H (⋅) ∈ N ν ,m + s ( z ) ), если она и все ее частные производные (до ν -го порядка
включительно) непрерывны в точке z. Функция H (⋅) ∈ N ν ,m + s ( R ) , если указанные
свойства H (⋅) выполняются для всех z ∈ R m + s .
В дальнейшем для всех факторов будем использовать один и тот же параметр
размытости hn , а в качестве многомерных ядер возьмем произведение одномерных ядер соответствующей размерности.
Лемма 1 (асимптотическая несмещённость an ( z ) ). Если функция a(z) непрерывна в точке z, sup a + ( z ) = sup ∫ y f ( y, z )dy < ∞ , K (u ) ∈ A , последовательность
x
x
чисел (hn ) ↓ 0 , то
lim Ean ( z ) = 0 .
n →∞
Лемма 2 (асимптотическая несмещённость a ( j ) n ( z ) ). Если функция a ( j ) n ( z )
абсолютно непрерывна по z j , j = 1, m + s , на R1 , sup a + ( z ) = sup ∫ y f ( y, z )dy < ∞ ,
x
sup a
x
( j)
(r )
( z ) < ∞ , K (u ) ∈ A , r = 0,1 ,
x
lim K (u ) = 0 , последовательность чисел
u →∞
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.М. Кошкин, И.Ю. Глухова
58
(hn ) ↓ 0 , то
lim Ea ( j ) n ( z ) = 0 .
n →∞
( qj )
Лемма 3 (ковариация оценок atn( rj ) ( z ) и akn
( z ) ). Пусть θ принимает значения
t и k, γ принимает значения r и q и выполняются следующие условия:
1) процесс ( Z t )t =...−1,0,1,... удовлетворяет условию с.п. с коэффициентом с.п.
∞
α ( τ) ,
2)
3)
λ
∫ [ α ( τ) ]
d τ < ∞ для некоторого λ ;
0
a +2θ ( z ) ∈ N 0 ( z ) , aθ (⋅) ∈ N 0 ( R ) , at + k (⋅) ∈ N 0 ( R ) ;
1−λ
sup a +2θ ( z ) < ∞ , sup aθ+ (⋅) < ∞ , sup at++ k (⋅) < ∞ ;
z
z
z
1−λ
(γ)
(γ)
4) K (⋅) ∈ Α
, sup K
(u ) < ∞ , sup K (u ) < ∞ ;
u∈R1
u∈R1
5) для монотонно невозрастающей последовательности (hn ) имеет место
⎛
1
hn + ⎜⎜
( m + s )( λ+1) + r + q
⎝ nhn
⎞
⎟⎟ ↓ 0 .
⎠
(13)
Тогда
( qj )
cov(atn( rj ) ( z ), akn
( z ))
≤
24
nhn ( m + s )( λ+1) + r + q
⎛ +
⎞
+
⎜⎜ a 2t ( z )a 2 k ( z ) ⎟⎟
⎝ 1−λ
⎠
1−λ
1−λ
2 ∞
2
2
⎛
⎞
×⎜ ∫ K m( r+)s (u ) 1−λ du ∫ K m( q+)s (u ) 1−λ du ⎟
⎜ m+ s
⎟
⎝R
⎠
R m+ s
λ
∫ [α(τ)]
0
1−λ
2
×
⎛
⎞
1
d τ+ o ⎜⎜
⎟ . (14)
( m+ s )( λ+1)+r +q ⎟
⎝ (nhn
⎠
Если при этом
6) λ < 1/2;
7) sup ai+(i +τ),tk ( z , s ) < C , a +2θ (⋅) ∈ Ν 0 ( x) , a +2θ ( z ) < ∞ , то при n → ∞
z,s
( qj )
cov(atn( rj ) ( z ), akn
( z )) −
1−λ
a ( z )t + p
nhn
m+ s + r + q
1−λ
∫K
(r )
(
(u ) K ( q ) (u )du ∫ K 2 (u )du
При t = k имеем частный случай:
at + p ( z )
Datn( rj ) ( z ) ≈
a ( z ) ∫ ( K ( r ) (u )) 2 du
m + s + 2 r 2t
nhn
)
m+ s −1
( ∫ K 2 (u)du )
⎛
⎞
1
= o ⎜⎜ m+ s+r +q ⎟⎟ .
⎝ nhn
⎠
m + s −1
.
(15)
Теорема 1 (СКО оптимальных оценок функционалов atn( rj ) ( z ) , r = 0,1). Если
выполнены условия леммы 1, леммы 2, условия 1) – 4) и 6), 7) леммы 3 при γ = r,
θ = t = p и дополнительно ωt(νr ) ( z ) ≠ 0 , то при n → ∞
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Непараметрическая идентификация нелинейных ARX-процессов
59
htn ( rj ) o = arg min u 2 (atn( rj ) ( z )) ≈
htn( rj ) > 0
1
⎡⎡
⎤
2
(m + s + 2r )a2 n ( z ) ⎥
⎡⎣ K ( r ) (u ) ⎤⎦ du
≈ ⎢⎢
∫
2
⎢⎢
⎥
( rj )
⎢⎢ 2ν (n-L) ⎣⎡ ωk ν ( z ) ⎦⎤ ⎦⎥
⎣⎣
u 2 (atn( rj ) ( z ) |h
tn
( rj )
= htn( rj ) o
2
⎡ a ( z)
⎡⎣ K ( r ) (u ) ⎤⎦ du
× ⎢ 2n
∫
ν
−
2
(
n
L
)
⎣
(
⎤ m + s + 2(ν+ r )
m + s −1
2
⎥
;
K
(
u
)
du
∫
⎥
⎦⎥
)
(16)
) = u 2 (atn( rj )o ( z )) ≈ (m + s + 2ν + 2r ) ×
( ∫ K 2 (u)du )
2ν
m + s −1 ⎤ m + s + 2( ν+ r )
⎥
⎦
m+ s + 2r
⎡ ⎡ ω( rj ) ( z ) ⎤ 2 ⎤ m + 2(ν+ r )
⎦ ⎥
⎢ ⎣ kν
=
⎢ m + s + 2r ⎥
⎢⎣
⎥⎦
2ν
⎛ −
⎞
= O ⎜ n m + s + 2(ν+ r ) ⎟ .
(17)
⎜
⎟
⎝
⎠
Доказательства лемм и теоремы данного раздела используют ряд моментов
книги [4] и ввиду громоздкости не приводятся. Асимптотические свойства ядерных оценок условного среднего и функции чувствительности нелинейных ARXпроцессов будут изучены в следующей статье.
3. Моделирование
Для исследования зависимости индекса промышленного производства РФ (Y)
от инвестиций в основной капитал ( X 1 ), курса доллара ( X 2 ) и экспорта ( X 3 )
воспользуемся (1) с p = 3, m = 1, r = 1:
Yn = Ψ (Yn −1 , X n1 −1 , X n1 , X n2 , X n3 ) + ξ n .
(18)
Моделирование проводилось по реальным данным за период с сентября 1994
по март 2004 г., доступным на официальном сайте Госкомстата РФ www.gks.ru.
В соответствии с (5) имеем следующую оценку для Yn :
n
⎛ z − Zi ⎞
Y n = ∑ Yi K5 ⎜
⎟
⎝ h ⎠
i =2
где Z n =
(Yn −1 , X n1 −1 , X n1 , X n2 , X n3 )
n
∑ K5 ⎛⎜⎝
i =2
z − Zi
h
⎞
⎟,
⎠
, h = (h1 , h2 ,...h5 ) , K ( u ) =
1
−
u2
2
e
. Параметр
2π
размытости для каждой переменной вычисляется отдельно по формуле
hi = Co σi n −1/ 9 , i = 1,5 ,
n −1
⎛ z − Zi ⎞
Сo = arg min Yn −1 − ∑ Yi K5 ⎜
⎟
0 <C <∞
⎝ h ⎠
i =2
n −1
∑ K5 ⎛⎜⎝
i=2
z − Zi ⎞
⎟,
h ⎠
(19)
где σi2 – выборочная дисперсия i-го фактора.
При решении задачи идентификации получили, что параметр размытости
hi = 1,1σi n −1/ 9, i = 1,5 .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.М. Кошкин, И.Ю. Глухова
60
Непараметрический алгоритм идентификации сравнивался с параметрическим
МНК-алгоритмом с помощью относительной и среднегодовой ошибок:
An =
1 n −1 Yi − Y i
1 12 Y − Y i
, A(t ) = ∑ i
, t = 1994,..., 2004.
∑
n − 1 i = 2 Yi
12 i =1 Yi
где Yi – истинные значения, а Y i – их оценки.
Рис. 1. Среднегодовая ошибка идентификации A(t )
Ошибку 1998 года можно объяснить дефолтом экономики РФ, который произошёл в августе 1998 г. При решении задачи прогнозирования ИПП РФ на 1 месяц воспользуемся модификацией (1) вида
Yn +1 = Ψ (Yn , X 1, n −1 , X 1,n , X 2,n , X 3,n ) + ξ n ,
Как и при решении задачи идентификации, использовались гауссовские ядра.
В этом случае параметр размытости равен
hi = 0,9σi n −1/ 9, i = 1,5 .
Относительные ошибки прогнозирования и идентификации
Вид задачи
Идентификация
Прогнозирование
Параметрический подход
0,0414
0,045
Непараметрический подход
0,0448
0,05
Заключение
Работоспособность предложенных алгоритмов проверена на экспериментальных данных. Показано, что непараметрические алгоритмы идентификации и прогноза практически не проигрывают алгоритмам оценивания по МНК. При этом
непараметрический подход обладает адаптивными свойствами и позволяет идентифицировать сложные нелинейные структуры.
ЛИТЕРАТУРА
1. Masry E., Tjostheim D. Nonparametric estimation and identification of nonlinear ARCH time
series // Econometric Theory. 1995. V. 11. No. 2. С. 258−289.
2. Китаева А.В., Кошкин Г.М. Полурекуррентная непараметрическая идентификация в
широком смысле нелинейной гетероскедастической авторегрессии // Автоматика и телемеханика. 2010. № 2. С. 92−111.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Непараметрическая идентификация нелинейных ARX-процессов
61
3. Пащенко Ф.Ф. Функция чувствительности и ее применение при выборе оптимальной
модели // Системы управления. М.: Наука, 1973. С.72–78.
4. Кошкин Г.М., Пивен И.Г. Непараметрическая идентификация стохастических систем.
Хабаровск: РАН. Дальневосточное отделение, 2009. 336 с.
Кошкин Геннадий Михайлович
Глухова Ирина Юрьевна
Томский государственный университет
E-mail: kgm@mail.tsu.ru; win32_86@mail.ru
Поступила в редакцию 14 июня 2012 г.
Koshkin Gennady M., Glukhova Irina Yu. (Tomsk State University). Nonparametric identification of nonlinear ARX – processes.
Keywords: kernel estimation, conditional mean, sensitivity function, nonlinear ARX-processes.
Kernel estimates of conditional mean and sensitivity function for a nonlinear ARX-processes
are considered. The principal parts of mean square errors for the estimators of the basic functionals and their derivatives are found.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
УДК 519.2
Ю.В. Малинковский, Ю.С. Боярович
ИНВАРИАНТНОСТЬ СТАЦИОНАРНОГО РАСПРЕДЕЛЕНИЯ
СОСТОЯНИЙ ОТКРЫТОЙ СЕТИ МАССОВОГО ОБСЛУЖИВАНИЯ
С ВРЕМЕННО НЕАКТИВНЫМИ ЗАЯВКАМИ
Исследовано стационарное функционирование открытой сети массового обслуживания с временно неактивными заявками. Неактивные заявки находятся в очередях узлов и не обслуживаются. Предусматривается возможность
перехода заявки из обычного состояния в неактивное и обратно. Установлена инвариантность стационарного распределения состояний сети по отношению к функциональной форме распределений длительностей обслуживания заявок при фиксированных первых моментах.
Ключевые слова: открытая сеть массового обслуживания, временно неактивные заявки, инвариантность стационарного распределения вероятностей состояний.
В теории массового обслуживания достаточно актуальной является проблема
исследования надежности обслуживающих узлов. Обслуживающий узел может
полностью или частично выходить из строя. В то же время могут терять свои качественные характеристики и поступающие в узел заявки.
В настоящее время большой интерес для исследователей представляют сети
массового обслуживания с временно неактивными заявками. Заявки в таких сетях
делятся на два класса. Первые могут обслуживаться узлами, вторые являются неактивными и не обслуживаются, скапливаясь в очередях узлов. Поступающие в
сеть потоки информационных сигналов позволяют заявкам менять свое состояние: из неактивного переходить в состояние, когда они снова становятся пригодными для обслуживания, и наоборот. Как правило, основной интерес представляют характеристики стационарного функционирования таких сетей, в частности
вид стационарного распределения вероятностей состояний.
Неактивные заявки можно интерпретировать как заявки, имеющие некоторый
дефект, в результате которого они становятся непригодными для обслуживания.
Действительно, при передаче данных в информационно-телекоммуникационных
сетях может возникнуть ситуация, когда пересылаемая заявка становится непригодной для обслуживания в результате какой-либо поломки или сбоя в процессе
ее пересылки. Таким образом, результаты исследования стационарного функционирования сетей массового обслуживания с временно неактивными заявками могут представлять интерес с прикладной точки зрения.
В работе [1] Г. Цициашвилли и М. Осиповой представлено исследование открытой сети массового обслуживания с неактивными заявками. Установлен вид
стационарного распределения вероятностей состояний в предположении, что длительности обслуживания заявок распределены по экспоненциальному закону.
В работах [2, 3] приведено исследование стационарного функционирования сетей,
обобщающих модель из [1] на случай циркулирования заявок и сигналов различных типов и поступления в сеть потоков неактивных заявок.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Инвариантность стационарного распределения состояний
63
Классическая сеть Джексона исследуется в предположении, что длительность
обслуживания заявки имеет показательное распределение. Однако на практике закон распределения длительности обслуживания заявки чаще всего отличается от
показательного. Поэтому существует актуальная проблема разработки аналитического аппарата для исследования сетей массового обслуживания с произвольными
функциями распределения времени обслуживания, привлекающая все большее
внимание исследователей [4–7].
В настоящей работе представлено исследование открытой сети массового обслуживания с временно неактивными заявками. Предполагается, что длительности обслуживания заявок распределены по произвольному закону. Устанавливается инвариантность стационарного распределения вероятностей состояний по
отношению к функциональной форме распределений длительностей обслуживания заявок при фиксированных первых моментах.
1. Инвариантность стационарного распределения состояний
открытой сети с временно неактивными заявками
Рассматривается открытая сеть массового обслуживания с множеством узлов
J = {1,…,N}. Все заявки в сети подразделяются на обыкновенные, которые могут
получать обслуживание, и временно неактивные. В узлы сети извне поступают
независимые пуассоновские потоки заявок с интенсивностями λi и информационных сигналов с интенсивностями υi и φi, i∈J. Поступивший в i-й узел с интенсивностью υi информационный сигнал уменьшает количество обыкновенных заявок
на единицу и увеличивает на единицу количество неактивных заявок; в случае отсутствия в i-м узле обыкновенных заявок сигнал покидает сеть, i∈J. Поступивший
в i-й узел с интенсивностью φi информационный сигнал уменьшает на единицу
количество неактивных заявок, увеличивая на единицу число обыкновенных заявок; в случае отсутствия в i-м узле неактивных заявок сигнал покидает сеть, i∈J.
Обслуживания информационные сигналы не требуют. Обслуженная в i-м узле заявка мгновенно с вероятностью pi,j переходит в j-й узел, а с вероятностью pi,0 по⎛ N
⎞
кидает сеть ⎜ ∑ pi , j + pi ,0 = 1, i, j ∈ J ⎟ . Не ограничивая общности, договоримся
⎜
⎟
⎝ j =1
⎠
считать pi,i = 0, i∈J.
Состояние сети в момент времени t характеризуется вектором
z(t) = ((n1(t), n1′(t)),…, (nN(t), nN′(t))),
где (ni(t), ni′(t)) – состояние i-го узла в момент времени t, i∈J. Здесь ni(t) и ni′(t) –
число обыкновенных и соответственно неактивных заявок в i-м узле в момент
времени t, а общее число заявок в i-м узле равно ni(t)+ni′(t), i∈J. z(t) обладает счетным пространством состояний Z = {((n1,n1′),…,(nN,nN′))| ni, ni′≥0, i∈J}.
Нумерация обыкновенных заявок в очереди каждого узла осуществляется от
«хвоста» очереди к прибору, то есть если в i-м узле находится ni обыкновенных
заявок, то заявка, которая обслуживается, имеет номер ni, i∈J, а последняя заявка
в очереди имеет номер 1. Неактивные заявки в очереди i-го узла нумеруются следующим образом: заявка, последняя ставшая неактивной, имеет номер ni′, i∈J.
Поступающий в узел i∈J сигнал υi воздействует на обыкновенную заявку, имеющую номер 1, которая становится неактивной заявкой под номером ni′+1. Сигнал
φi воздействует на неактивную заявку, имеющую номер ni′, i∈J, которая становится обыкновенной заявкой под номером 1. Дисциплина обслуживания – LSFS-PR.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.В. Малинковский, Ю.С. Боярович
64
Поступающая в узел i∈J заявка начинает сразу обслуживаться и получает номер
ni+1, а вытесненная заявка сохраняет номер ni и становится первой в очереди на
дообслуживание. Предполагается, что в начальный момент времени временно неактивные заявки в сети отсутствуют.
В работе [1] рассмотрен случай, когда времена обслуживания заявок распределены по показательному закону, а дисциплина обслуживания – FIFO. В указанной
работе установлено, что при выполнении условий
εi < μi , i ∈ J ;
(1)
εi υi < μi ϕi , i ∈ J ,
(2)
процесс z(t) эргодичен, а стационарное распределение вероятностей состояний
процесса имеет вид
p((n1 , n '1 ),..., (nN , n ' N )) = p1 (n1 , n '1 )... pN (nN , n ' N ) ,
(3)
n
n'
⎛ε ⎞ i⎛ευ ⎞ i
где
pi (ni , n 'i ) = ⎜ i ⎟ ⎜ i i ⎟ , i ∈ J ,
(4)
⎝ μi ⎠ ⎝ μi ϕi ⎠
– стационарное распределение вероятностей состояний i-го узла, i∈J. (εi, i∈J) –
единственное положительное решение системы уравнений трафика
ε i = λ i + ∑ ε j p j ,i , i ∈ J .
(5)
j∈J
Рассмотрим теперь случай, когда длительность обслуживания заявки в i-м узле –
случайная величина с произвольной функцией распределения Bi (ni + n 'i , xi ,ni + n 'i ) и
1
, i∈J. Тогда в общем случае процесс z(t) не являμi
ется марковским, поэтому рассмотрим кусочно-линейный марковский процесс
ζ(t) = ( z(t),ξ(t)), добавляя к z(t) непрерывную компоненту ξ(t) = (ξ1(t),…,ξN(t)).
Здесь ξi (t ) = (ξi ,1 (t ),..., ξi , ni + n 'i (t )) , где ξi,k(t) – время, оставшееся до окончания об-
математическим ожиданием
служивания заявки, стоящей в момент времени t на k-й позиции в i-м узле, i∈J.
Введем обозначения
F ( z , x) = F ( z , x1,1 ,..., x1, n1 + n '1 ; x2,1 ,..., x2, n2 + n '2 ; xN ,1 ,..., xN ,nN + n 'N ) =
= lim P{z (t ) = z , ξi ,1 (t ) < xi ,1 ,..., ξi ,ni + n 'i (t ) < xi ,ni + n 'i , i ∈ J ) .
t →∞
(6)
Функции F(z, x) будем называть стационарными функциями распределения
вероятностей состояний кусочно-линейного процесса ζ(t) = (z(t),ξ(t)), поскольку
при каждом фиксированном z функция F(z, x) в части непрерывных компонент
представляет собой функцию распределения.
Теорема. При выполнении условий (1) и (2) процесс ζ(t) эргодичен, а стационарные функции распределения вероятностей состояний F(z, x) определяются по
формулам
F ( z , x) = p1 (n1 , n '1 )... pN (nN , n ' N ) ×
N
×∏
i =1
n +n'
μi i i
ni + n 'i xi , s
∏ ∫ (1 − Bi (s, u ))du ,
s =1
0
z∈Z ,
(7)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Инвариантность стационарного распределения состояний
n
65
n'
⎛ε ⎞ i⎛ευ ⎞ i
pi (ni , n 'i ) = ⎜ i ⎟ ⎜ i i ⎟ ,
(8)
⎝ μi ⎠ ⎝ μi ϕi ⎠
здесь εi – единственное положительное решение системы уравнений трафика (5),
i∈J.
Доказательство: Обозначим ei∈Z – вектор, все координаты которого нулевые,
кроме (ni, ni′) = (1, 0), ei′∈Z – вектор, все координаты которого нулевые, кроме
(ni, ni′) = (0, 1), i∈J.
Рассмотрим процесс ζ(t). При выполнении условий (1) и (2) в марковском случае процесс z(t) эргодичен, тогда эргодичен при выполнении условий (1) и (2) и
процесс ζ(t), поскольку получается из z(t) добавлением непрерывных компонент.
Строгое доказательство этого факта может быть проведено, если учесть, что
процесс ζ(t) является регенерирующим. Действительно, функционирование сети
схематично можно представить как чередование периодов, когда сеть находится в
состоянии «0» (в каждом узле сети нет заявок – вектор z(t) является нулевым), и
периодов занятости сети (в противном случае). Момент перехода сети в свободное состояние является моментом регенерации. Далее доказательство сводится к
применению предельной теоремы Смита для регенерирующих процессов [7].
Изменения состояния кусочно-линейного процесса ζ(t) за счет поступления
заявок или информационных сигналов будем называть спонтанными изменениями.
Пусть h мало. Рассмотрим вероятность события
(9)
P{z (t + h) = z , ξi ,1 (t + h) < xi ,1 ,..., ξi ,ni + n 'i (t + h) < xi , ni + n 'i , i ∈ J }.
где
Это событие может произойти следующими взаимоисключающими способами:
1. С момента t за время h не произошло ни одного спонтанного изменения и
обслуживание ни в одном узле не закончилось. Вероятность этого равна
P{z (t ) = z , ξi ,1 (t ) < xi ,1 ,..., hI ni >0 ≤ ξi ,ni + n 'i (t ) < xi ,ni + n 'i + hI ni >0 , i ∈ J } ×
N
×(1 − ∑ (λi + υi I ni > 0 + ϕi I n 'i >0 )h + o(h)) .
(10)
i =1
Здесь IA – индикаторная функция множества A.
2. За время h в i-й узел поступила заявка, других спонтанных изменений не
произошло, обслуживание ни в одном узле не закончилось, i∈J.
P{z (t ) = z − ei , ξ k ,1 (t ) < xk ,1 ,..., hI nk >0 ≤ξ k ,nk +n 'k (t ) < xk ,nk +n'k + hI nk >0 , k ∈ J , k ≠ i,
ξi ,1 (t ) < xi ,1 ,..., hI ni >1 ≤ξi ,ni +n'i −1 (t ) < xi ,ni +n 'i −1 + hI ni >1}×
×(λi h + o(h)) Bi (ni + n 'i ,xi ,ni +n 'i +θh) I ni >0 ,0 <θ<1.
(11)
3. За время h в j-ом узле заявка была обслужена, после чего она мгновенно перешла в i-й узел, спонтанных изменений не произошло, i, j∈J.
P{z (t ) = z − ei + e j , ξ k ,1 (t ) < xk ,1 ,..., hI nk > 0 ≤
≤ ξ k ,nk + n 'k (t ) < xk , nk + n 'k + hI nk > 0 , k ∈ J , k ≠ i, k ≠ j ,
ξ j ,1 (t ) < x j ,1 ,..., ξ j ,n j + n ' j (t ) < x j ,n j + n ' j , ξ j , n j + n ' j +1 (t ) < h,
ξi ,1 (t ) < xi ,1 ,..., hI ni >1 ≤ ξi ,ni + n 'i −1 (t ) < xi , ni + n 'i −1 + hI ni >1} ×
× Bi (ni + n 'i ,xi ,ni + n 'i + θh) p j ,i I ni > 0 , 0 < θ < 1 .
(12)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.В. Малинковский, Ю.С. Боярович
66
4. За время h в i-м узле была обслужена заявка, после чего она мгновенно покинула сеть, спонтанных изменений не произошло, i∈J.
P{z (t ) = z + ei , ξ k ,1 (t ) < xk ,1 ,..., hI nk > 0 ≤ ξ k ,nk + n 'k (t ) < xk , nk + n 'k + hI nk > 0 , k ∈ J , k ≠ i,
ξi ,1 (t ) < xi ,1 ,..., ξi , ni + n 'i +1 (t ) < h} pi ,0 .
(13)
5. За время h в i-й узел поступил сигнал интенсивности υi, уменьшивший количество обыкновенных заявок на единицу, а количество неактивных заявок на
единицу увеличивший, других спонтанных изменений не произошло, обслуживание ни в одном узле не закончилось, i∈J.
P{z (t ) = z + ei − e 'i , ξ k ,1 (t ) < xk ,1 ,..., hI nk > 0 ≤ ξ k ,nk + n 'k (t ) < xk , nk + n 'k + hI nk > 0 , k ∈ J , k ≠ i,
ξi ,1 (t ) < xi ,1 ,..., h ≤ ξi ,ni + n 'i (t ) < xi ,ni + n 'i + h} × (υi h + o(h)) I n 'i > 0 .
(14)
6. За время h в i-й узел поступил сигнал интенсивности φi, уменьшивший количество неактивных заявок на единицу, а количество обыкновенных заявок на
единицу увеличивший, других спонтанных изменений не произошло, обслуживание ни в одном узле не закончилось, i∈J.
P{z (t ) = z − ei + e 'i , ξ k ,1 (t ) < xk ,1 ,..., hI nk > 0 ≤ ξ k ,nk + n 'k (t ) < xk , nk + n 'k + hI nk > 0 , k ∈ J , k ≠ i,
ξi ,1 (t ) < xi ,1 ,..., hI ni >1 ≤ ξi ,ni + n 'i (t ) < xi , ni + n 'i + hI ni >1} × (ϕi h + o(h)) I ni > 0 .
(15)
7. И, наконец, за время h происходит не менее двух изменений состояния сети.
Вероятность этого есть o(h).
В силу вышесказанного имеем
P{z (t + h) = z , ξi ,1 (t + h) < xi ,1 ,..., ξi ,ni + n 'i (t + h) < xi ,ni + n 'i , i ∈ J } =
= P{z (t ) = z , ξi ,1 (t ) < xi ,1 ,..., hI ni > 0 ≤ ξi , ni + n 'i (t ) < xi ,ni + n 'i + hI ni > 0 , i ∈ J } ×
N
×(1 − ∑ (λi + υi I ni > 0 + ϕi I n 'i > 0 )h + o(h)) +
i =1
N
+ ∑ P{z (t ) = z − ei , ξ k ,1 (t ) < xk ,1 ,..., hI nk > 0 ≤ ξk ,nk + n 'k (t ) < xk , nk + n 'k + hI nk > 0 , k ∈ J , k ≠ i,
i =1
ξi ,1 (t ) < xi ,1 ,..., hI ni >1 ≤ ξi ,ni + n 'i −1 (t ) < xi , ni + n 'i −1 + hI ni >1} ×
×(λ i h + o(h)) Bi (ni + n 'i ,xi ,ni + n 'i + θh) I ni > 0 +
N
N
+ ∑∑ P{z (t ) = z − ei + e j , ξ k ,1 (t ) < xk ,1 ,..., hI nk > 0 ≤ ξ k ,nk + n 'k (t ) < xk ,nk + n 'k + hI nk > 0 ,
i =1 j =1
k ∈ J , k ≠ i, k ≠ j ,
ξ j ,1 (t ) < x j ,1 ,..., ξ j ,n j + n ' j (t ) < x j ,n j + n ' j , ξ j , n j + n ' j +1 (t ) < h,
ξi ,1 (t ) < xi ,1 ,..., hI ni >1 ≤ ξi ,ni + n 'i −1 (t ) < xi , ni + n 'i −1 + hI ni >1} ×
× Bi (ni + n 'i ,xi , ni + n 'i + θh) p j ,i I ni > 0 +
N
(16)
+ ∑ P{z (t ) = z + ei , ξ k ,1 (t ) < xk ,1 ,..., hI nk > 0 ≤ ξ k , nk + n 'k (t ) < xk ,nk + n 'k + hI nk > 0 , k ∈ J , k ≠ i,
i =1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Инвариантность стационарного распределения состояний
67
ξi ,1 (t ) < xi ,1 ,..., ξi ,ni + n 'i +1 (t ) < h} pi ,0 +
N
+ ∑ P{z (t ) = z + ei − e 'i , ξ k ,1 (t ) < xk ,1 ,..., hI nk >0 ≤ξ k ,nk +n 'k (t ) < xk ,nk +n'k + hI nk >0 , k ∈ J , k ≠ i,
i =1
ξi ,1 (t ) < xi ,1 ,..., h ≤ ξi , ni + n 'i (t ) < xi ,ni + n 'i + h} × (υi h + o(h)) I n 'i > 0 +
N
+ ∑ P{z (t ) = z − ei + e 'i , ξ k ,1 (t ) < xk ,1 ,..., hI nk >0 ≤ξ k ,nk +n 'k (t ) < xk ,nk +n'k + hI nk >0 , k ∈ J , k ≠ i,
i =1
ξi ,1 (t ) < xi ,1 ,..., hI ni >1 ≤ ξi ,ni + n 'i (t ) < xi , ni + n 'i + hI ni >1} × (ϕi h + o(h)) I ni > 0 + o(h) .
Далее каждую вероятность, входящую в вышеприведенные уравнения, выразим через функции следующего вида:
Ft ( z , x) = P{z (t ) = z , ξi ,1 (t ) < xi ,1 ,..., ξi ,ni + n 'i (t ) < xi ,ni + n 'i , i ∈ J } .
Рассматривая Ft(z, x) как сложные функции от h и предполагая, что у них существуют частные производные первого порядка по переменным t и xi ,ni + n 'i , i∈J,
запишем разложения этих функций в ряд Тейлора с остаточным членом в форме
Пеано, с учетом того, что
P{z (t ) = z , ξi ,1 (t ) < xi ,1 ,..., h ≤ ξi , ni + n 'i (t ) < xi ,ni + n 'i + h, i ∈ J } =
N
= Ft ( z , xi ,1 ,..., xi , ni + n 'i + h, i ∈ J ) − ∑ Ft ( z , xi ,1 ,..., xi , ni + n 'i + h,
(17)
k =1
i ∈ J , i ≠ k ; xk ,1 ,..., xk , nk + n 'k −1 , h) + ... + Ft ( z , xi ,1 ,..., xi , ni + n 'i −1 , h, i ∈ J ) .
Очевидно, что те функции Ft(z, x), у которых в качестве аргументов будет
встречаться h не менее двух раз, при разложении в ряд Тейлора будут давать o(h).
Поэтому
P{z (t ) = z , ξi ,1 (t ) < xi ,1 ,..., h ≤ ξi , ni + n 'i (t ) < xi ,ni + n 'i + h, i ∈ J } =
N
∂Ft ( z , xi ,1 ,..., xi ,ni + n 'i , i ∈ J )
i =1
∂xi , ni + n 'i
= Ft ( z , xi ,1 ,..., xi , ni + n 'i + h, i ∈ J ) + ∑
N
∂Ft ( z , xl ,1 ,..., xl ,nl + n 'l , l ∈ J , l ≠ i, xi ,1 ,..., xi , ni + n 'i −1 , 0)
i =1
∂xi ,ni + n 'i
−∑
h−
h + o( h) .
(18)
Выражения вида Bi (ni + n 'i , xi ,ni + n 'i + θ) также раскладываем в ряд Тейлора как
функцию переменной θ.
Устремляя t к бесконечности и учитывая, что в этом случае частная производная Ft(z, x) по переменной t стремится к нулю, получаем следующую систему
уравнений:
N ⎛
⎞
∂F ( z , x) ⎛ ∂F ( z , x) ⎞
F ( z , x) = F ( z, x) + h∑ ⎜
−⎜
⎟
⎟I ni >0 −
⎜ ∂x
⎟
⎟
i , ni + n 'i ⎠ x
i =1 ⎜ ∂xi , ni + n 'i
⎝
i , ni + n 'i = 0 ⎠
⎝
⎛ N
⎞
− ⎜ ∑ (λ i + υi I ni > 0 + ϕi I n 'i > 0 )h + o(h)) ⎟ F ( z , x) +
⎝ i =1
⎠
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.В. Малинковский, Ю.С. Боярович
68
N
+ ∑ F ( z − ei , x) Bi (ni + n 'i , xi ,ni + n 'i )(λ i h + o(h))I ni > 0 +
i =1
⎛ ∂F ( z + e j − ei , x) ⎞
⎟
p j ,i Bi (ni + n 'i , xi ,ni + n 'i ) ⎜
I ni > 0 +
⎜ ∂x j ,n + n ' +1 ⎟
j =1 i =1, i ≠ j
j
j
⎝
⎠ x j ,n j + n ' j =0
N
+ h∑
N
∑
N ⎛
∂F ( z + ei , x) ⎞
pi ,0 +
+ h∑ ⎜
⎟⎟
⎜
i =1 ⎝ ∂xi , ni + n 'i +1 ⎠ x
i , ni + n 'i +1 = 0
N
∑ F ( z + ei − e 'i , x)(υi h + o(h))I n ' >0 +
i
i =1
N
+ ∑ F ( z − ei + e 'i , x)(ϕi h + o(h))I ni > 0 + o(h) .
(19)
i =1
Вычтем из обеих частей F(z, x), после чего оставшуюся ненулевой правую
часть разделим на h и устремим h к нулю. Таким образом, для F(z, x) справедлива
следующая система дифференциально-разностных уравнений:
N
F ( z , x)∑ (λ i + υi I ni > 0 + ϕi I n 'i > 0 ) =
i =1
⎞
N ⎛
∂F ( z , x ) ⎛ ∂F ( z , x) ⎞
⎟I
= ∑⎜
−⎜
⎟
ni > 0 +
⎜
⎟
⎜
⎟
x
x
∂
∂
⎟
i , ni + n 'i
i , ni + n 'i ⎠ x
i =1 ⎜
⎝
=
0
i , ni + n 'i
⎝
⎠
N
+ ∑ F ( z − ei , x) Bi (ni + n 'i , xi ,ni + n 'i )λ i I ni > 0 +
i =1
⎛ ∂F ( z + e j − ei , x) ⎞
⎟
p j ,i Bi (ni + n 'i , xi , ni + n 'i ) ⎜
I ni > 0 +
⎜ ∂x j ,n + n ' +1 ⎟
j =1 i =1, i ≠ j
j
j
⎝
⎠ x j ,n j + n ' j =0
N
+∑
N
∑
N ⎛
∂F ( z + ei , x ) ⎞
+∑ ⎜
pi ,0 +
⎟⎟
⎜
i =1 ⎝ ∂xi , ni + n 'i +1 ⎠ x
i , ni + n 'i +1 = 0
N
∑ F ( z + ei − e 'i , x)υi I n ' >0 +
i =1
i
N
+ ∑ F ( z − ei + e 'i , x)ϕi I ni > 0 .
(20)
i =1
Разобьем эту систему уравнений на уравнения локального баланса следующим
образом:
F ( z , x)(υi I ni > 0 + ϕi I n 'i > 0 ) = F ( z + ei − e 'i , x)υi I n 'i >0 + F ( z − ei + e 'i , x)ϕi I ni > 0 ; (21)
⎛⎛
⎞
∂F ( z , x) ⎟
⎜ ⎜ ∂F ( z , x) ⎞⎟
I n >0 =
−
⎜⎜ ⎜ ∂xi ,n + n ' ⎟
∂xi , ni + n 'i ⎟⎟ i
⎝
i
i ⎠ xi , n + n ' = 0
⎝
⎠
i
i
N
⎛ ∂F ( z + e j − ei , x) ⎞
⎟
= ∑ p j ,i Bi (ni + n 'i , xi , ni + n 'i ) ⎜
I ni > 0 +
⎜ ∂x j , n + n ' +1 ⎟
j =1, j ≠ i
j
j
⎝
⎠ x j ,n j + n ' j =0
+ F ( z − ei , x) Bi (ni + n 'i , xi ,ni + n 'i )λ i I ni > 0 ;
(22)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Инвариантность стационарного распределения состояний
69
⎛ ∂F ( z + ei , x) ⎞
λi F ( z, x) = ⎜
pi ,0 .
⎟⎟
⎜ ∂x
i , ni + n 'i +1 ⎠ x
⎝
0
=
i , ni + n 'i +1
(23)
Покажем, что функции распределения F(z, x), определенные формулами (7) и
(8), являются решением уравнений (21) – (23), а следовательно, и уравнений (20).
Если ni >0, то подставляя (7) и (8) в уравнение (22), приводя подобные слагаемые, деля обе части полученного соотношения на F ( z − ei , x) Bi (ni + n 'i , xi ,ni + n 'i ) ,
получим уравнение трафика (5). Если ni = 0, то (22) превращается в тождество,
i∈J. Подставляя (7) и (8) в (23) и деля обе части на F(z, x), получим следствие
уравнения трафика λi = εi pi,0, i∈J. И, наконец, подставляя (7) и (8) в (21), получаем
тождество.
Утверждение доказано.
Под {p(z), z∈Z} будем понимать стационарное распределение вероятностей
состояний процесса z(t). Из теоремы с учетом равенства p(z) = F(z,+ ∞ ) , z∈Z вытекает следующее утверждение:
Следствие. При выполнении условий (1) и (2) процесс z(t) эргодичен, а его
стационарное распределение вероятностей состояний {p(z), z∈Z} не зависит от
функционального вида распределений Bi(s, x), i∈J, и имеет вид
p((n1 , n '1 ),..., (nN , n ' N )) = p1 (n1 , n '1 )... pN (nN , n ' N ) ,
(24)
где pi(ni, ni′) определяются по формулам (8).
Заключение
Исследовано стационарное функционирование открытой сети массового обслуживания с временно неактивными заявками. Предусматривалась возможность
перехода заявки из обычного состояния в неактивное и обратно. Для случая произвольного распределения длительностей обслуживания заявок в узлах установлена инвариантность стационарного распределения состояний сети по отношению
к функциональной форме распределений длительностей обслуживания при фиксированных первых моментах.
Результаты исследований могут иметь прикладное значение и использоваться
при рассмотрении стационарного функционирования систем и сетей массового
обслуживания, в которых заявки могут по некоторым причинам терять свои качественные характеристики и на некоторое время становиться непригодными для
обслуживания.
ЛИТЕРАТУРА
1. Tsitsiashvili G. Sh., Osipova M. A. Distributions in stochastic network models // Nova Publishers. 2008.
2. Malinkovsky Y., Bojarovich J. An open queueing network with partly non-active customers //
Queues: Flows, Systems, Networks: Proc. 21 International Conference “Modern Probbabilistic
Methods for Analysis and Optimization of Information and Telecommunication Networks “.
Minsk, 2011. No 21. P. 34–37.
3. Малинковский Ю.В., Боярович Ю.С. Характеризация стационарного распределения сетей с групповыми перемещениями положительных и отрицательных заявок в форме
произведения геометрических распределений // Вестник ГрГУ им. Я. Купалы. 2007.
№ 3(57). С. 39–43.
4. Гнеденко Б.В., Коваленко И.Н. Введение в теорию массового обслуживания. М.: КомКнига, 2005.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.В. Малинковский, Ю.С. Боярович
70
5. Ивницкий В.А. Об условии инвариантности стационарных вероятностей для сетей массового обслуживания // Теория вероятностей и ее применения. 1982. Т. 27. № 1. С. 188–
192.
6. Старовойтов А.Н. Инвариантность стационарного распределения состояний сетей с
многорежимными стратегиями обслуживания // Проблемы передачи информации. 2006.
Т. 42. № 4. С. 121–128.
7. Севастьянов Б.А. Предельная теорема для марковских процессов и ее приложение к телефонным системам с отказами // Теория вероятностей и ее применения. 1957. Т. 2. № 1.
С. 106–116.
Малинковский Юрий Владимирович
Боярович Юлия Сигизмундовна
Гомельский государственный университет им. Ф. Скорины
Е-mail: Malinkovsky@gsu.by; juls1982@list.ru
Поступила в редакцию 23 мая 2012 г.
Malinkovsky Yury V., Bojarovich Julia S. (Gomel State University). Stationary distribution invariance of an open queueing network with temporarily non-active customers.
Keywords: open queueing network, temporarily non-active customers, stationary distribution invariance.
This paper considers stationary functioning of an open queueing network with temporarily
non-active customers. Systems set is J = {1,…,N}. Non-active customers are located in a system
queue and do not get service. Customers may turn from non-active state into state, when they may
get their service and vice versa; ni(t), ni′(t) denote the numbers of ordinary and non-active customers at system i∈J at time t accordingly. Service times are assumed to be independent random
distributed values with distribution functions Bi (ni + n 'i , xi , ni + n 'i ) and mean values 1/ μ i , i∈J.
Under conditions of ergodicity: εi<μi, εiυi<μiφi, i∈J, process z(t) = ((n1(t),n1′(t)),…, (nN(t),nN′(t)))
has stationary distribution {p(z), z∈Z}, which may be founded by formulas:
p((n1 , n '1 ),...,( nN , n 'N )) = p1 (n1 , n '1 )... pN ( nN , n 'N ) ,
n
n'
⎛ε ⎞ i⎛ευ ⎞ i
where pi (ni , n 'i ) = ⎜ i ⎟ ⎜ i i ⎟ ; here εi is an unique positive solution to the system of traffic
⎝ μi ⎠ ⎝ μi ϕi ⎠
equations, i∈J. Stationary distribution which is invariant to service time distribution is obtained.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
УДК 336:51
Г.А. Медведев
О ВРЕМЕННОЙ СТРУКТУРЕ ДОХОДНОСТИ.
3. ОДНОФАКТОРНАЯ МОДЕЛЬ ДАФФИ – КАНА
Временная структура процентных ставок играет ключевую роль при определении цен облигаций. Поэтому ее свойства интересуют многих финансовых аналитиков. Однако в имеющейся литературе обычно встречается схематичное описание этих свойств. Здесь делается попытка детального описания всех возможных форм временной структуры для класса аффинных моделей процентных ставок, поскольку для этих моделей можно записать решения в явной форме. В качестве основной принимается модель Даффи –
Кана (DK) с произвольной нижней границей для безрисковой (спот) процентной ставки. Результаты для широко известных моделей CIR и Васичека
получаются как частные случаи. Найдены возможные типы формы кривой
доходности.
Ключевые слова: процентные ставки доходности, аффинная модель, кривая доходности, форвардная кривая, модель Васичека, модель Кокса – Ингерсолла – Росса, модель Даффи – Кана.
Известно, что аффинные модели временной структуры доходности требуют,
чтобы краткосрочная процентная ставка r(t) следовала случайному процессу, описываемому стохастическим дифференциальным уравнением
dr(t) = (αr(t) + β)dt + γ r (t ) + δ dW(t), γr(0) + δ > 0,
(1)
где α, β, γ и δ – константы; а W(t) – стандартный винеровский процесс. При этом
рыночная цена риска λ(r) должна быть такова, чтобы λ(r) γ r + δ = ξr + η являлась аффинной функцией. Предполагается, что значения констант α, β, γ и δ обеспечивают существование стационарного решения уравнения (1). Если в уравнении (1) γ = 0, то получающуюся модель временной структуры доходности называют моделью Васичека. Если же в уравнении (1) δ = 0, то аффинную модель временной структуры называют моделью Кокса – Ингерсолла – Росса (модель CIR).
Различие этих моделей состоит в том, что в первом случае процесс r(t) является
гауссовым, а во втором случае r(t) имеет распределение гамма. Свойства временных структур доходности в этих моделях были представлены в предыдущих
статьях [1, 2]. Здесь мы рассмотрим общий случай, когда все четыре параметра α,
β, γ и δ отличаются от нуля. Статистический смысл параметров уравнения (1) сразу не виден, поэтому вместо этих параметров мы введем другие, при которых
уравнение с практической точки зрения удобнее трактуется:
r (t ) − x
dW(t), r(0) > х.
(2)
θ− x
Параметры уравнения (2) имеют следующий конкретный статистический
смысл: θ − стационарное математическое ожидание краткосрочной процентной
ставки r(t); D – ее стационарная дисперсия; х – параметр, имеющий смысл нижней
границы процесса r(t), так что r(t) ≥ х для всякого t; согласно результатам В. Фел-
dr(t) = k(θ − r(t))dt + 2kD
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
72
Г.А. Медведев
лера [3, с. 173] эта граница является недостижимой сверху при (θ − x)2 > D; k – параметр, определяющий коэффициент автокорреляции процесса в виде
ρ(τ) = E[(r(t) – θ)(r(t + τ) – θ)]/D = exp{– k|τ|}.
Заметим, что в случае х = − ∞ уравнение (2) порождает модель Васичека [4,
с. 185], а в случае х = 0 уравнение (2) порождает модель CIR [5, с. 391]. На модель
с произвольным (допустимым) значением параметра х при необходимости будем
ссылаться как на однофакторную модель Даффи – Кана (модель DK), которые
рассмотрели ее многофакторный аналог [6, с. 383]. Функции временной структуры A(τ) и В(τ) для модели DK были найдены С. Коксом и Г. Медведевым [7, с.
917]; детальный анализ однофакторной модели DK содержится в книге Г. Медведева [8, гл. 3].
Соотношение между параметрами уравнений (1) и (2) устанавливаются очевидным образом при сопоставлении уравнений
β
γβ − αδ
δ
> 0, D =
> 0, х = –
< θ.
k = – α > 0, θ = –
2
γ
α
2α
Коэффициенты аффинной структуры, связанные с рыночной ценой риска, определяются соотношением λ(r) γ r + δ = ξr + η. Используя это, можно написать,
ξr + η
ξ
ηγ − ξδ
= σ( r ) +
. Очевидно, если волатильность краткосрочσ( r )
γ
γσ(r )
ной процентной ставки σ(r) стремится к нулю, то переходим к детерминированному рынку, поэтому рыночная цена риска λ(r) (и премия за риск) должна стремиться к нулю. Из приведенного равенства видно, что этот факт будет иметь место тогда и только тогда, когда справедливо равенство ηγ − ξδ = 0. Кроме того, в
различных моделях при анализе одной и той же реализации процесса краткосрочной процентной ставки необходимо также так установить значения коэффициентов ξ и η аффинной структуры в этих моделях, чтобы они обеспечивали, насколько это возможно, одинаковый уровень рыночной цены риска. Естественно ожидать, что рисковая премия при краткосрочной процентной ставке, равной среднему ее уровню в установившемся режиме, будет одинаковой для всех сравниваемых моделей. Кроме того, чтобы рисковая премия была положительной, необходимо выполнение условия λ(r) < 0 [5, с. 393]. Поэтому потребуем, чтобы для всех
трех рассматриваемых моделей λ(θ) = − λ , λ > 0. И выражение для λ(r) получается следующим:
ξ
δ
r−x
ξ
η γ
r+ =
r +1 = − λ
.
λ(r) = σ(r ) =
θ− x
γ
γ
δ δ
γ
что λ(r) =
1. Форвардная кривая и кривая доходности
в однофакторной модели Даффи – Кана
В текущий момент времени t, когда r(t) = r, цена P(t, r, Т) бескупонной облигации, по которой в дату погашения Т выплачивается одна денежная единица, определяется формулой [1]
P(t, r, Т) = exp{A(Т − t) − rВ(Т − t)}.
(3)
В дальнейшем для краткости срок до погашения облигации будем обозначать
τ = Т − t. Модели процентных ставок доходности, позволяющие выразить цену
облигации P(t, r, Т) в виде (3), относятся к классу аффинных временных структур
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 3. Однофакторная модель Даффи – Кана
73
процентных ставок. Функции временной структуры A(τ) и В(τ) удовлетворяют
обыкновенным дифференциальным уравнениям
kD
[B(τ)]2, B(0) = 0;
(4)
B′ = 1 − (k + λσ)B(τ) −
θ− x
kDx
[B(τ)]2, A(0) = 0.
θ− x
Решения этих уравнений выражаются в виде
A′ = − (kθ + λσx)B(τ) −
(5)
−1
ε
+ V ⎞⎟ ;
В(τ) = ⎛⎜ ετ
⎝ e −1
⎠
A(τ) = x [ B (τ) − τ] −
(θ − x ) 2
[vτ − ln(1 + vB(τ))],
D
(6)
(7)
где для краткости записи обозначено
2kD
4kD
2
, ε = ( k + λσ ) +
, v = (ε − k − λσ) / 2, V = (ε + k + λσ) / 2. (8)
θ− x
θ− x
Заметим, что v + V = ε, vV = kD/(θ − x).
Доходность до погашения у(τ) бескупонной облигации в рамках аффинной
структуры выражается в виде
rB (τ) − A(τ)
.
(9)
у(τ) ≡
τ
Для определенности заметим, что функции аффинной временной структуры
A(τ) и В(τ) являются функциями одного аргумента только в рассматриваемом случае постоянных коэффициентов уравнения (1). Форвардная ставка f(τ) определяется выражением
dB(τ) dA(τ)
dy (τ)
−
.
= y ( τ) + τ
(10)
f(τ) = r
dτ
dτ
dτ
В дальнейшем взаимные свойства форвардной ставки и доходности до погашения будем исследовать как функции срока погашения τ в рамках аффинной
структуры в зависимости от величин r, х и λ, которые будут рассматриваться как
параметры: r = r(t) – параметр состояния рынка в момент времени t; х – параметр
модели краткосрочной ставки; λ − параметр модели доходности. С практической
точки зрения имеет смысл исследовать свойства функций f(τ) и у(τ) только для
неотрицательных сроков погашения τ ≥ 0, неотрицательных значений краткосрочной ставки r ≥ 0 и выполнении условия Феллера о недостижимости нижней
границы процесса r(t): θ − х > D , т. е. х < θ − D .
Для того чтобы получить явный вид функции у(τ), определяющей зависимость
доходности от срока до погашения, достаточно подставить функции (6) и (7) в (9).
Это приводит к выражению
B (τ) r − x k ⎛ ln(1 + vB (τ)) ⎞⎤
(11)
+ ⎜1 −
у(τ) = x + (θ − x) ⎡⎢
⎟⎥ .
τv
⎣ τ θ− x V ⎝
⎠⎦
σ=
Здесь уместно отметить, что функция В(τ), зависящая также от параметра х, играет
основную роль при определении как функций A(τ) и у(τ), так и функции f (τ). Согласно формуле (6), функция В(τ) является монотонно возрастающей и такой, что
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
74
Г.А. Медведев
В(0) = 0 ≤ В(τ) ≤ В(∞) = V − 1, 0 ≤ τ ≤ ∞.
(12)
Используя формулу (10) для форвардной ставки и уравнения (4) и (5) для
функций A(τ) и В(τ), получаем следующее выражение для f (τ):
f (τ) = r + (θ − x)[k В(τ) − В(τ)(V − v)(r − x)/(θ − x) − vV В(τ) 2 (r − x)/(θ − x)]. (13)
Функции y(τ) и f (τ), которые определяются формулами (11) и (13), соответственно называются далее кривой доходности и форвардной кривой. Заметим, что
форвардная кривая для модели Васичека и модели CIR была получена в другой
форме в статье Е. Шлегла и Д. Соммера [9, с. 6], и там приведены некоторые
свойства для форвардных кривых. В некоторых литературных источниках имеется информация о совместном поведении кривой доходности и форвардной кривой. Например, в книгах J. Hull [10, с. 83, 84], Z. Bodie, A. Kane и A. Marcus [11,
с. 437], J. Campbel, A. Lo и A. MacKinlay [12, с. 398], K. Kortanek и V. Medvedev
[13, с. 201] представлены графики поведения кривой доходности и форвардной
кривой на отдельных периодах времени конечной продолжительности. Однако по
этим примерам нельзя представить в полной мере характер изменения кривых. Из
этих графиков, например, можно видеть, что с увеличением времени до погашения различие между кривыми доходности и форвардными кривыми увеличивается. Ниже будет показано, что это невозможно, по крайней мере, для моделей временных структур аффинного класса.
2. Свойства форвардной кривой и кривой доходности
Заметим, что параметр r в выражениях (11) и (13) входит только в сочетании с
другими параметрами в виде (r − x)/(θ − x). Поэтому для дальнейшего изложения
удобно вместо r ввести другой параметр ζ = (r − x)/(θ − x). По определению ζ
можно назвать нормированным значением краткосрочной процентной ставки в
момент времени t, при этом 0 ≤ ζ ≤ ∞.
Доходность до погашения у(τ) и форвардная ставка f(τ) принимают одинаковые значения для крайних сроков погашения τ = 0 и τ = ∞:
f (0) = у(0) = r,
(θ − x ) 2
k
k
≡ θ + ⎛⎜ 1 − ⎞⎟ x.
(14)
V
D
⎝ V⎠
Поскольку 0 < k /V < 1, то х < f (∞) ≡ f*(х) = у(∞) ≡ у*(х) < θ. Из этого следует, в
частности, что при τ → ∞ предельные значения кривой доходности и форвардной
кривой всегда меньше стационарного среднего θ краткосрочной процентной ставки r(t).
При малых сроках погашения кривые у(τ) и f (τ) имеют представления
y(τ) = r + ½ (θ − х) [k − (V − v) ζ]τ + O(τ2),
f(∞) ≡ f*(х) = у(∞) ≡ у*(х) ≡ х + v
f (τ) = r + (θ − х) [k − (V − v) ζ]τ + O(τ2).
Эти формулы показывают, что кривые у(τ) и f (τ) при τ = 0 стартуют из одной
точки у(0) = f (0) = r, причем форвардная кривая f (τ) убывает (возрастает) в 2 раза
быстрее, чем кривая доходности у(τ).
Модель Васичека (х = − ∞) часто критикуется за то, что допускает отрицательные значения краткосрочных ставок r(t). Это приводит к тому, что кривые доходности у(τ) и форвардные ставки f (τ) также могут принимать отрицательные значения. Вместе с тем в модели CIR (х = 0) гарантируется неотрицательность крат-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 3. Однофакторная модель Даффи – Кана
75
косрочных ставок r(t), а следовательно, и кривых у(τ) и f (τ). Поэтому желательно
выяснить, каким является минимальное значение границы х в модели DK, которое
обеспечивает положительность кривых доходности у(τ) и форвардных ставок f (τ).
Необходимыми условиями для этого являются, например, такие: положительный
наклон кривых у(τ) и f (τ) в окрестности точки τ = 0 при r = 0 и положительность
предельного при τ → ∞ значения ставки f(∞) = у(∞) ≡ f*(х) ≡ у*(х), определяемого
равенством (14).
Предельное при τ → ∞ значение f*(х) форвардной кривой (и кривой доходности), определяемое формулой (14), является монотонно возрастающей функцией
границы х и на интервале [− ∞, θ] принимает значения
f*(− ∞) = θ − (D + λ 2kD )/k ≤ f*(х) ≤ f*(θ) = θ.
Таким образом, если kθ ≥ D + λ 2kD , то предельное значение форвардной
кривой f*(х) − положительное для всякого х < θ. Если выполняется неравенство
kθ ≤ D + λ 2kD , минимальное значение х = х*, при котором f*(х) ≥ 0, определяется выражением
х* = − θ
k θ + k θD + λ 2 kD / 2 − λ kD / 2
.
D − k θ + λ 2kD
Многие авторы при анализе кривых доходности и форвардных кривых отмечали, что эти кривые могут иметь максимумы. Найдем условия, при которых существуют максимумы этих кривых, и определим их характеристики.
Заметим, что из формулы (6) следует, что обратная функция В(τ) имеет вид
τ(В) = [ln(1 + vB) − ln(1 − VB)]/ε.
(15)
В дальнейшем удобно рассматривать форвардную кривую f(τ) и кривую доходности у(τ) как сложные функции, зависящие от срока погашения τ только через функцию аффинной структуры В(τ), т. е. у(τ) ≡ Y(В(τ)) и f (τ) ≡ F(В(τ)). Вопервых, это удобно, потому что интервал возможных значений функции В(τ) является конечным согласно (12), в связи с чем свойства функций Y(В) и F(В) можно
иллюстрировать наглядно с помощью графиков на всем интервале возможных
значений сроков погашения τ. Во-вторых, как отмечалось в CIR [14, c. 57], функцию В(τ) можно рассматривать как меру дюрации, поскольку подобно стандартной дюрации цены облигации по отношению к процентной ставке (в этом случае
по отношению к спот-ставке) она определяется формулой [∂P/∂r]/P = − B(τ).
Из выражений (11), (13) и (15) получается, что
B ζ − k ln(1 + vB ) vV ⎞
⎛k
;
Y(B) ≡ x + (θ − x) ⎜ + ε
ln(1 + vB ) − ln(1 − VB ) ⎟⎠
⎝V
(16)
(17)
F(B) ≡ r + (θ − x)[kB − B(V − v) ζ− vV В 2 ζ].
Если ζ удовлетворяет неравенствам
k /(V + v) ≤ ζ ≤ k /( V − v),
то форвардная кривая F(В) на интервале 0 ≤ В ≤ V −1 имеет максимум в точке
В* = (kζ − V + v) / 2vV, а максимальное значение функции F(В) вычисляется по
формуле
F(В*) = r + (θ − x)[k − ( V − v)ζ]2 / 4vVζ.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
76
Г.А. Медведев
Если параметр ζ удовлетворяет неравенству
ζ < k /(V + v),
(18)
то кривая F(В) строго возрастает на интервале 0 ≤ В ≤ V −1. Если параметр ζ удовлетворяет неравенству
ζ > k /(V − v),
(19)
то форвардная кривая F(В) строго убывает на интервале 0 ≤ В ≤ V −1. Так что для
значения краткосрочной ставки r, определяемого равенством ζ = k /(V − v), максимум форвардной кривой встречается при В = 0 (при τ = 0), из чего следует, что
форвардная ставка максимальна для коротких сроков погашения. Для значения
краткосрочной процентной ставки r, определяемого равенством ζ = k /(V − v), максимум форвардной кривой встречается при В = V −1 (т. е. при τ = ∞), откуда следует, что в этом случае форвардная ставка максимальна для длительных сроков погашения. Форвардная кривая F(В), определяемая выражением (17), является вогнутой функцией. Ранее свойство вогнутости форвардной кривой было отмечено
Брауном и Шейфером [15, c. 566].
Характер изменения кривой доходности у(τ) ≡ Y(В(τ)) в зависимости от В(τ)
является более сложным.
Если параметр ζ удовлетворяет неравенству ζ ≥ (k/v) ln(1 + v/V), тогда кривая
доходности Y(В) – вогнутая на интервале 0 ≤ В ≤ V −1. Если значение ζ удовлетворяет неравенству (18), то кривая доходности Y(В) – выпуклая на интервале 0 ≤ В ≤ V −1.
Если значение параметра ζ удовлетворяет неравенствам
k /( V + v) ≤ ζ ≤ (k/v) ln(1 + v/V),
(20)
то кривая доходности Y(В) на интервале 0 ≤ В ≤ V −1 имеет точку перегиба Вп.
Причем кривая доходности Y(В) – вогнутая на интервале 0 ≤ В < Вп и выпуклая на
интервале Вп < В ≤ V −1.
Заметим, что при τ → ∞ для предельного значения кривой доходности (14)
можно записать неравенство
y (∞) − x Y (V −1 ) − x k k ⎛
v
≡
= > ln ⎜ 1 +
θ− x
θ− x
V v ⎝ V
⎞ > ζ.
⎟
⎠
При выполнении этого неравенства кривая доходности Y(В) возрастает на интервале 0 ≤ В ≤ V −1.
Кривая доходности Y(В) имеет максимум на интервале 0 < В < V −1, если ζ
удовлетворяет неравенствам
(k/v) ln(1 + v/V) < ζ < k /(V − v),
(21)
В этом случае кривая доходности Y(В) пересекает форвардную кривую F(В) в
точке В0 (т. е. Y(В0) = F(В0)) и точка В0 является точкой максимума кривой доходности Y(В). При этом
Y ( B ) < F ( B), если 0 < B < B0 ;
Y ( B ) > F ( B ), если B0 < B < V −1.
Другими словами, кривая доходности Y(В) пересекает форвардную кривую
F(В) в точке В0 своего максимума. Из этого, в частности, следует, что если максимум кривой доходности Y(В) существует, то максимальное значение Y(В0) всегда
меньше максимального значения форвардной кривой F(В*), так как В* < В0.
Взаимные свойства кривых Y(В) и F(В) сведены в табл. 1.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 3. Однофакторная модель Даффи – Кана
77
Таблица 1
Формы кривой доходности Y(В) и форвардной кривой F(В)
в зависимости от величины процентной ставки
Кривые
F(В)
Y(В)
Параметры модели удовлетворяют неравенствам
(21)
(20)
(18)
вогнутая
убывает
имеет максимум в точке В*
возрастает
вогнутая
имеет перегиб
выпуклая
имеет максимум
убывает
возрастает
в точке В0, В0 > В*
имеется пересечение
Y(В) > F(В)
Y(В) < F(В)
в точке В0, В0 > В*
(19)
На рис. 1 иллюстрируются взаимные свойства кривых F(В) и Y(В). Кривые на
рис. 1 рассчитывались для значений параметров, представленных в табл. 2.
Сплошными толстыми линиями изображены форвардные кривые F(В), а сплошными тонкими линиями – кривые доходности Y(В). Круглые маркеры отмечают
предельные точки. Пунктирной линией изображен отрезок прямой, соединяющий
предельные точки. Интересно отметить, что производная dY(В)/dВ по абсолютной
величине при В → V −1 стремится к бесконечности, причем она положительная,
если ζ > (k/v) ln(1 + v/V), и отрицательная в обратном случае.
Таблица 2
Значения параметров для кривых рис. 1
k
0,05
θ
0,06
D
0,001
x
0,02
λ
0,01
Параметр r = r(t), вообще говоря, является случайным. Остальные параметры
детерминированные. В [8, c. 61] показано, что процесс r(t) имеет стационарную
плотность вероятностей p(r), которая является сдвинутой плотностью гамма с параметром сдвига x, параметром формы q и параметром масштаба c, т. е.
p(r) = c q (r − x) q −1 e − c ( r − x ) Γ(q) , x < r < ∞,
где q = (θ − x) 2 D , c = (θ − x) D > 0. Поэтому имеется возможность рассчитать
вероятности появления той или иной формы кривых доходности при наблюдаемом процессе краткосрочной ставки.
На рис. 2 представлена иллюстрация того, каким образом нижний предельный
уровень влияет на характер взаимного положения форвардной кривой F(В) и кривой доходности Y(В). На рис. 2 сплошными толстыми линиями изображены форвардные кривые F(В), а сплошными тонкими линиями – кривые доходности Y(В).
Значения параметров для кривых рис. 2 выбраны те же, что и в табл. 2 за исключением параметра х, который принимает 5 различных значений, соответственно каждой паре кривых. Параметр r = 0,07. Нижняя пара кривых соответствует
значению х = − ∞ (модель Васичека). Выше показана пара кривых для х = − 0,01.
Третья снизу пара кривых рассчитана для х = 0 (модель CIR). Далее следуют кривые для х = 0,03 и х = 0,05. Таким образом, для выбранных значений параметров с
повышением нижнего предельного уровня х доходности увеличиваются.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
78
F(B), Y(B)
F(B), Y(B)
0,051
0,065
0,050
0,055
0,049
0,045
0,00
0,25
0,50
0,75
B
r = 0,07; ζ > k /(V − v)
0,048
0,00
0,25
0,50
0,75
B
r = 0,05; (k/v) ln(1 + v/V) < ζ < k /(V − v)
F(B), Y(B)
F(B), Y(B)
0,048
0,048
0,046
0,046
0,044
0,044
0,042
0,042
0,0
0,2
0,4
0,6
0,8
B
0,040
0,00
r = 0,044; k /( V + v) ≤ ζ ≤ (k/v) ln(1 + v/V)
0,25
0,50
r = 0,042; ζ < k /(V + v)
Рис. 1. Четыре возможные вида кривых доходности Y(B)
в сравнении с поведением форвардной кривой F(В)
F(B), Y(B)
0,070
0,065
0,060
0,055
0,050
0,045
0,040
0,035
0,00
0,20
0,40
0,75
0,60
0,80
B
Рис. 2. Влияние нижнего предельного уровня
на поведение форвардной кривой F(В) и кривой доходности Y(В)
B
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 3. Однофакторная модель Даффи – Кана
79
Заключение
Для однофакторной модели аффинной доходности Даффи – Кана найдены
аналитические представления кривых доходности и форвардных кривых и исследованы их свойства, когда в качестве временной переменной используется
мера дюрации безрисковой ставки. Показано, что для всего многообразия параметров существует только четыре возможных вида кривой доходности. Для малых сроков погашения актива доходность определяется, в основном, текущим
уровнем безрисковой ставки, в то время как для очень продолжительных сроков
до погашения доходность определяется стационарным математическим ожиданием безрисковой ставки. В связи с этим можно было бы ожидать, что влияние
текущего уровня безрисковой ставки на доходность будет с увеличением времени затухать. Однако это не так. Оказалось, что текущий уровень безрисковой
ставки существенным образом влияет на вид всей кривой доходности и форвардной кривой. Отметим также, что кривая доходност и форвардная кривая
стартуют при τ = 0 из одной точки и при τ → ∞ стремятся к одному и тому же
пределу, что отличается от обычно принятой точки зрения, что с увеличением τ
эти кривые расходятся.
ЛИТЕРАТУРА
1. Медведев Г.А. О временной структуре доходности. 1. Модель Васичека // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 1(18). С. 102.
2. Медведев Г.А. О временной структуре доходности. 2. Модель Кокса – Ингерсолла –
Росса // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 2(19). С. 102.
3. Feller W. Two singular diffusion problems // Ann. Math. 1951. V. 54. 173–181.
4. Vasiček O. An equilibrium characterization of the term structure // J. Financial Economics.
1977. V. 5. P. 177–188.
5. Cox J., Ingersoll J., Ross S. A theory of the term structure of interest rate // Econometrica.
1985. V. 53. Р. 385–407.
6. Duffie D., Kan R. A yield-factor model of interest rates // Mathematical Finance. 1996. V. 6.
Р. 379–406.
7. Medvedev G., Cox S. The market price of risk for affine interest rate term structures // Proc.
of the 6th Intern. AFIR Symposium. Nuremberg. 1996. Р. 913–924.
8. Медведев Г.А. Стохастические процессы финансовой математики. Минск: БГУ, 2005.
243 c.
9. Schlogl E., Sommer D. Factor Models and the Shape of the Term Structures. Working paper
No. B-395, 1997.
10. Hull J. Options, Futures, and other Derivative Securities. Englewood: Prentice Hall, 1993.
492 p.
11. Bodie Z. Kane A., Marcus J. Investment. Chicago: Irwin Prof. Publ., 1996.
12. Campbel J., Lo A., MacKinlay A. The Econometrics of Financial Markets. Princeton: Princeton Univ. Press, 1997.
13. Kortanek K., Medvedev V. Building and Using Dynamic Interest Rate Models. N.Y.: John
Wiley & Sons, 2001.
14. Cox J., Ingersoll J., Ross S. Duration and the measurement of basis risk // J. Business. 1979.
Vоl. 52. Р. 51–61.
15. Brown R., Schaefer S. Interest rate volatility and shape of the term structure // Phil. Trans. R.
Soc. Lond. 1994. V. A 347. Р. 563–576.
Медведев Геннадий Алексеевич
Белорусский государственный университет
E-mail: MedvedevGA@cosmostv.by
Поступила в редакцию 17 марта 2012 г.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
80
Г.А. Медведев
Medvedev Gennady A. (Belarusian State University). On term structure of yield rates. 3. The
Duffie – Kan one-factor model.
Keywords: yield interest rates, affine model, yield curve, forward curve, Vasiček model, model
CIR, Duffie-Kan model.
The time structure of interest rates plays a key role at the bond pricing. Therefore its properties interest many financial analysts. However in the available literature usually there is a schematic description of these properties. Attempt of the detailed description of all possible forms of
time structure for a class of affine models of interest rates as for these models it is possible to
write down decisions in the closed form here becomes. As the basic the model of Duffie – Kan
(DK) with any bottom border for risk free (spot) interest rate is accepted. Results for widely
known models CIR and Vasiček turn out as special cases.
For one-factor model of affine yield of Duffie – Kan analytical representations of yield curves
and forward curves are found and their properties when the duration measure of risk free rates as
a time variable is used are investigated. It is shown that for all variety of parameters exists only
four possible kinds of yield curves. For small terms to maturity an bond yield is defined, basically, current level of risk free rates while for very long terms to maturity the yield is defined by a
stationary expectation of risk free rates. In this connection it would be possible to expect that influence of current level of risk free rates on yield with time increase will damp. However it not so.
It has appeared that current level of risk free rates essentially influences on sight of entire yield
curve and a forward curve. Let's notice also that yield curve and a forward curve start from one
point and at increase in term to maturity converge to the same limit that differs from usually accepted point of view that these curves diverge when the term to maturity increase.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
УДК 519.872
А.Н. Моисеев, С.П. Моисеева
ИССЛЕДОВАНИЕ ВХОДЯЩЕГО ПОТОКА ДЛЯ GRID-СИСТЕМЫ
С АДАПТИРУЕМЫМ ВЫДЕЛЕНИЕМ ВЫЧИСЛИТЕЛЬНЫХ РЕСУРСОВ
В работе предложена математическая модель GRID-системы с адаптируемым выделением вычислительных ресурсов. Данная модель представлена в
виде системы массового обслуживания с входящим потоком, имеющим несколько уровней интенсивности, и блоками обслуживания, соответствующими каждому такому уровню. Основное внимание сосредоточено на получении вероятностных характеристик входящего потока. Отдельно рассмотрена проекция входящего потока на один уровень интенсивности. В работе
получены вероятностные характеристики потока для отдельных уровней интенсивности входящего потока, а также корреляционные характеристики
разных режимов работы системы.
Ключевые слова: GRID-система, системы массового обслуживания, марковский модулированный поток.
Внимание к теории массового обслуживания в значительной степени обусловлено необходимостью применения результатов этой теории к важным практическим задачам, возникающим в связи с бурным развитием систем коммуникаций,
эволюцией информационно-вычислительных комплексов, развитием автоматизированных систем управления.
Производительность вычислительных сетей связана с временными аспектами
функционирования. При оценке производительности первостепенное значение
имеет продолжительность вычислительных процессов. Случайный характер процессов формирования, обработки и передачи данных обуславливает необходимость применения стохастических моделей, в качестве которых широко используются модели, представляющие собой системы и сети массового обслуживания
различных классов.
Следуя необходимости создания адекватных моделей различных явлений и
систем, многие исследователи разработали схемы потоков событий, при помощи
которых можно учитывать различные реальные факторы и, в частности, зависимость между поступающими требованиями. Д. Кокс [1] рассмотрел потоки однородных событий, интенсивность которых зависит от состояний управляющего потоком процесса. Позже были даны общие определения такого потока [2–4]. Одним из наиболее распространенных частных случаев марковских входящих потоков (МАР-потоков) является марковский модулированный пуассоновский поток
событий (ММРР-поток). Исследованию ММРР-потока посвящены работы зарубежных и российских ученых [5, 6].
Как правило, все работы посвящены методам исследования процесса, характеризующего число наступивших событий в потоке за некоторое время. В то же
время для решения практических задач представляет интерес исследование совокупности потоков различной интенсивности, определяемых состояниями управляющей цепи Маркова. Очевидно, что для оптимального функционирования вы-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
82
А.Н. Моисеев, С.П. Моисеева
числительных систем необходимо учитывать интенсивность входящих задач и
предоставлять возможности для их быстрой обработки. То есть потоки заявок
большей интенсивности должны обслуживаться быстрее. Если для обслуживания
заявок, поступивших на разных уровнях интенсивности, применяются различные
блоки серверов, то актуальной является также задача исследования проекций входящего ММРР-потока на каждый из таких блоков.
1. Постановка задачи
Пусть имеется GRID-система [7] – система распределенных вычислений на
основе кластеров, где в качестве серверов используются обычные рабочие станции либо серверы, выполняющие повседневные задачи, не связанные с распределенными вычислениями. Таким образом, серверы выделяют под GRID-задачи
лишь часть своих вычислительных ресурсов. Рассматривается ситуация, когда задачи в этой системе поступают на обработку с изменяющейся интенсивностью.
Чтобы оптимизировать исполнение поступающих задач в условиях переменной
интенсивности, владелец GRID-системы принял решение настроить всю систему
таким образом, что при возрастании интенсивности поступления серверы будут
выделять больше вычислительных ресурсов для исполнения GRID-задач, чтобы
не создавать задержек в их выполнении. При уменьшении интенсивности поступления серверы уменьшают выделенные под GRID-задачи вычислительные ресурсы, чтобы возвратиться к решению повседневных задач.
Построим математическую модель описанной задачи в виде бесконечнолинейной системы массового обслуживания (СМО), на вход которой поступает
поток событий с изменяющейся интенсивностью. Будем представлять его в виде
MMPP-потока [6] с K состояниями, каждое из которых определяет собственную
интенсивность событий λ s ( s = 1, K ) . Переходы между состояниями управляющей
цепи задаются матрицей инфинитезимальных характеристик Q = ||qij||.
Основной целью исследования является получение вероятностных характеристик входящего потока. Отдельный интерес представляет проекция входящего потока на каждый из уровней интенсивности. Это актуально для случая, когда заявки, поступившие при разных интенсивностях (состояниях управляющей цепи
входящего потока), обслуживаются на разных группах серверов, имеющих различную, заранее настроенную производительность обслуживания. В этом случае
для одной такой группы ситуация будет выглядеть так, что пока управляющая
цепь находится в соответствующем состоянии, заявки поступают в этот блок с
определенной интенсивностью, когда же состояние управляющей цепи меняется,
заявки начинают поступать в другие блоки, а на входе данного блока наступает
время «тишины».
2. Входящий поток
Для начала получим характеристики входящего потока всей системы. Пусть
k(t) – состояние управляющей цепи входящего MMPP-потока в момент времени t,
n1(t), …, nK(t) – количество событий входящего потока, произошедших на каждом
из K уровней интенсивности за время t. Рассмотрим многомерный случайный
процесс {k(t), n1(t),…, nK(t)}. Обозначим через P(k, n1,…, nK, t) = P{k(t) = k,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование входящего потока для GRID-системы
83
n1(t) = n1, …, nK(t) = nK}. Для этой функции можно записать следующее выражение:
P (k , n1 ,..., nK , t + ∆t ) = P( k , n1 ,..., nK , t )(1 − λ k ∆t )(1 + qkk ∆t ) +
K
+ P (k , n1 ,..., nk − 1,..., nK , t )λ k ∆t + ∑ P (ν, n1 ,..., nK , t )qνk ∆t + o(∆t ).
ν=1
ν≠ k
Выполнив несложные преобразования и перейдя к пределу при ∆t → 0, получим
∂P (k , n1 ,..., nK , t )
=
∂t
K
= − P(k , n1 ,..., nK , t )λ k + P (k , n1 ,..., nk − 1,..., nK , t )λ k + ∑ P (ν, n1 ,..., nK , t )qνk .
ν=1
ν≠ k
Воспользуемся методом производящих (характеристических) функций [6]. Для
этого умножим левую и правую части полученного уравнения на e ju1n1 ⋅ ... ⋅ e juK nK ,
где j = −1 , а u1,…,uK – некоторые переменные, и просуммируем по n1,…,nK от 0
до ∞. Введя обозначение
H (k , u1 ,..., uK , t ) =
∞
∑
n1 = 0
∞
... ∑ e ju1n1 ⋅ ... ⋅ e juK nK P (k , n1 ,..., nK , t ) ,
nK = 0
получим уравнение относительно функции H(k,u1,…,uK,t):
K
∂H (k , u1 ,..., uK , t )
= H (k , u1 ,..., uK , t )(e juk − 1)λ k + ∑ H (ν, u1 ,..., u K , t )qνk .
∂t
ν=1
(1)
Обозначим через H(u1,…,uK,t) вектор-строку, состоящую из компонент
{
}
H(1,u1,…,uK,t),…, H(K,u1,…,uK,t). Пусть B (u1 ,..., u K ) = diag (e jus − 1)λ s + Q . Тогда
s =1, K
(1) в матричном виде запишется следующим образом:
∂H (u1 ,..., u K , t )
= H (u1 ,..., u K , t ) B (u1 ,..., u K ) .
∂t
Решение этого уравнения записывается с помощью матричной экспоненты [8]
H (u1 ,..., uK , t ) = Rexp { B (u1 ,..., uK ) t} ,
(2)
где элементы вектор-строки R = {R(1),…,R(K)} находятся из начальных условий
R (k ) = H (k , u1 ,..., uK , 0) = P {k (0) = k } .
3. Проекция входящего потока
Рассмотрим теперь проекцию входящего потока на блок одной интенсивности,
пусть это будет блок номер s. Положим в уравнении (1) все u1,…,uK, кроме us,
равными нулю. Будем использовать обозначение H(k,us,t) = H(k,0,…,0,us,0,…,0,t).
Тогда уравнение (1) перепишется в виде
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Н. Моисеев, С.П. Моисеева
84
K
∂H ( s, us , t )
= H ( s, us , t )(e jus − 1)λ s + ∑ H (ν, us , t )qνs для k = s;
∂t
ν=1
∂H (k , us , t ) K
= ∑ H (ν, us , t )qνk для k ≠ s;
∂t
ν=1
или в матричном виде
∂H (us , t )
= H (us , t ) Bs (us ) ,
∂t
где H(us,t) – вектор-строка с компонентами H (k , us , t ), k = 1, K , а элементы матрицы Bs(us) равны элементам матрицы Q за исключением элемента bss, который равен (e jus − 1)λ s + qss .
Решение этого уравнения имеет вид
H (us , t ) = Rexp { Bs (us ) t} .
Введем обозначение
K
h(us , t ) = ∑ H (k , us , t ) = H (us , t ) E = Rexp { Bs (us ) t}E ,
k =1
где E – вектор-столбец, состоящий из единиц. Тогда, учитывая, что
H (k , us , t ) =
∞
∑ e ju n P(k , ns , t )
s s
ns = 0
и, следовательно,
π
P (k , ns , t ) =
1
− ju n
∫ e s s H (k , us , t ) dus ,
2π −π
получаем
π
P (ns , t ) =
1
− ju n
∫ e s s h(us , t ) dus .
2π −π
(3)
Здесь P(ns,t) = P{ns(t) = ns} – вероятность того, что за время t в систему поступило
ns заявок с интенсивностью λs.
4. Основные вероятностные характеристики
Получим первый момент этого распределения. Продифференцируем (1) по us и
положим все ui = 0, i = 1, K . Учитывая, что
∂H (k , u1 ,..., uK , t )
∂us
u =...=u
1
∞
K
=0
= j ∑ ns P (k , ns , t ) = j m(k , s, t ) ,
ns = 0
получим
K
∂m(k , s, t )
= R (k )λ k + ∑ m(ν, s, t )qνk для k = s;
∂t
ν=1
(4)
∂m(k , s, t ) K
= ∑ m(ν, s, t )qνk для k ≠ s.
∂t
ν=1
(5)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование входящего потока для GRID-системы
85
Здесь функция m(k,s,t) имеет смысл среднего числа заявок уровня s, поступивших
за интервал длины t, в то время, когда состояние управляющей цепи равно k. ТоK
гда m( s, t ) = ∑ m(k , s, t ) есть среднее число заявок уровня s, поступивших за инk =1
тервал времени длины t (первый момент). Суммируя уравнения системы (4), (5) и
K
учитывая, что
∑ qνk = 0 , получаем дифференциальное уравнение относительно
k =1
этой функции:
dm( s, t )
= R ( s )λ s .
dt
С учетом начального условия m(s,0) = 0 это уравнение имеет следующее решение:
m( s , t ) = R ( s )λ s t .
(6)
Найдем второй начальный момент распределения (3). Продифференцируем (1)
по us и ui, где s и i – некоторые числа из диапазона от 1 до K. Учтем, что
∂ 2 H (k , u1 ,..., u K , t )
∂us2
= j2
∞
∑ ns2 P(k , ns , t ) = j 2 m2 (k , s, t )
ns = 0
u1 =...= u K = 0
и
∂ 2 H (k , u1 ,..., u K , t )
∂us ∂ui
u =...= u
1
= j2
K =0
∞
∞
∑ ∑ ns ni P(k , ns , ni , t ) = j 2 r (k , s, i, t )
для s ≠ i .
ns = 0 ni = 0
Здесь функции m2(k,s,t) и r(k,s,i,t) имеют смысл соответственно второго начального момента и смешанного момента для числа заявок, поступивших за время t на
уровнях интенсивности s и i при условии, что управляющая цепь находилась в состоянии k. В результате получаем следующие системы дифференциальных уравнений. Относительно второго момента:
K
∂m2 (k , s, t )
= 2m(k , s, t )λ k + R(k )λ k + ∑ m2 (ν, s, t )qνk для k = s;
∂t
ν=1
(7)
∂m2 (k , s, t ) K
= ∑ m2 (ν, s, t )qνk для k ≠ s.
∂t
ν=1
(8)
Относительно смешанного момента:
K
∂r (k , s, i, t )
= m(k , s, t )λ k + m(k , i, t )λ k + ∑ r (ν, s, i, t )qνk для k = s;
∂t
ν=1
∂r (k , s, i, t ) K
= ∑ r (ν, s, i, t )qνk для k ≠ s.
∂t
ν=1
(9)
(10)
K
Функция m2 ( s, t ) = ∑ m2 (k , s, t ) – это второй начальный момент распределения
k =1
вероятностей (3) числа заявок, пришедших на уровне интенсивности s за время t, а
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Н. Моисеев, С.П. Моисеева
86
K
r ( s, i, t ) = ∑ r (k , s, i, t ) – смешанный момент числа заявок, пришедших за время t
k =1
на уровнях интенсивности s и i. Суммируя (7), (8) и (9), (10) по k от 1 до K, получаем дифференциальные уравнения относительно этих искомых функций:
∂m2 ( s, t )
= 2 m ( s , t )λ s + R ( s )λ s ;
∂t
(11)
∂r ( s, i, t )
= [ m( s, t ) + m(i, t ) ] λ s .
∂t
(12)
Здесь функции m(s,t) определяются из (6). Решения этих уравнений при начальных условиях m2(s,0) = 0 и r(s,i,0) = 0 могут быть легко получены для каждого частного случая.
Заключение
Таким образом, в работе проведено исследование входящего потока для модели GRID-системы с адаптируемым выделением вычислительных ресурсов, представленной в виде системы массового обслуживания с входящим MMPP-потоком
и блоками обслуживания различной производительности. Получено выражение
для характеристической функции (2) многомерного распределения числа заявок,
поступивших на каждом из уровней интенсивности, распределение вероятностей
(3) числа заявок одного уровня, а также первый момент (6) и общий вид систем
обыкновенных дифференциальных уравнений для вычисления второго начального (11) и смешанного (12) моментов этого распределения. Полученные результаты
могут быть использованы на практике при построении GRID-систем с соответствующей инфраструктурой.
ЛИТЕРАТУРА
1. Cox D.R. The analysis of non-Markovian stochastic processes // Proc. Cambr. Phil. Soc. 1955.
V. 51. N 3. P. 433–441.
2. Serfozo R. Processes with conditional independent inerements // Appl. Prob., 1972. V. 9.
P. 303–315.
3. Neuts M.F. A versatile Markovian arrival process // J. Appl. Prob. 1979. V. 16. P. 764–779.
4. Lucantoni D.M., Meier-Hellsten K.S., Neuts M.F. A single-server queue with server vacations
and a class of non-renewal arrival processes // Adv. Appl. Prob. 1990. Nо. 22. P. 676–705.
5. Дудин А.Н., Клименок В.И. Системы массового обслуживания с коррелированными потоками. Минск: БГУ, 2000. 175 с.
6. Назаров А.А., Моисеева С.П. Метод асимптотического анализа в теории массового обслуживания. Томск: Изд-во НТЛ, 2006. 112 с.
7. Линеш М. Грид – масштабируемый распределенный компьютинг [Электронный ресурс]
// gridclub.ru: Интернет-портал по грид-технологиям. URL: http://gridclub.ru/library/ publication.2007-07-19.5491913210/view (дата обращения: 31.05.12).
8. Bhatia R. Matrix Analysis. Graduate Texts in Mathematics. V. 169. New York: Springer,
1997. 368 p.
Моисеев Александр Николаевич
Моисеева Светлана Петровна
Томский государственный университет
E-mail: amoiseev@ngs.ru; smoiseeva@mail.ru
Поступила в редакцию 24 мая 2012 г.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование входящего потока для GRID-системы
87
Moiseev Alexander N., Moiseeva Svetlana P. (Tomsk State University). Investigation of input
flow for the GRID-system with adaptive providing of computing resources.
Keywords: GRID-system, queuing system, Markov-modulated Poisson process.
We consider mathematical model of the GRID-system with adaptive providing of computing
resources. The model is represented as queuing system with input MMPP-flow and server blocks
which service intervals depend on input modulating process state.
We obtained an expression for characteristic function of multidimensional distribution for
number of arrivals at each modulating process state. Input flow projection on single modulating
process state was particularly considered. It was shown that probability distribution of events
number ns arriving in the flow at modulating process state s during period t is defined as
π
P (ns , t ) =
1
− ju n
∫ e s s h(us , t ) dus ,
2π −π
where h(us,t) = R exp{Bs(us)t}E, R is row vector of stationary distribution of modulating process
state, E is unit column vector, Bs(us) is a matrix with elements which are equal to elements of infinitesimal matrix Q for modulating process except the single element bss which is equal to
(e jus − 1)λ s + qss ; λs is input flow intensity at state s, qss is element of the matrix Q.
First moment and general form of differential equations system for second and mixed moments of the considered distribution are obtained in the paper also. Results of the paper can be applied to GRID-system construction practice.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
УДК 330.46: 338.55
А.А. Наумов, Т.В. Авдеенко
К ЭФФЕКТИВНОСТИ ИНТЕГРАЦИОННЫХ КЛАСТЕРОВ1
В работе предложены и исследованы модели, которые могут быть положены
в основу методов синтеза, анализа и управления интеграционными процессами на основе процессного подхода (см. [1, 4]).
Ключевые слова: кластеры, интеграция, модели, бизнес-процессы, эффективность.
Реализация инновационных процессов предполагает интегрирование научных,
технических, технологических новинок (идей), опытно-конструкторской базы,
производства, соответствующих ресурсов. Причем такое интегрирование может
происходить на разных условиях, с привлечением ресурсов в разной форме и так
далее (см. [1−3]). В задачах исследования интеграционных процессов экономических систем первостепенное значение придается вопросам оценивания эффективности получающихся интеграционных структур (см., например, [1]). В работе
предложены модели, которые могут быть положены в основу методов анализа,
моделирования и управления интеграционными процессами и реализованы в соответствующих информационных системах.
1. Постановка задачи
Пусть имеется N произвольных бизнес-процессов BPs ,i ( t ) , i = 1, 2,..., N (см.,
например, [4, 5]). Обозначения процессов в таком виде подчеркивают, что каждый
из них структурирован (объединен в структуру, систему) и в них согласованы потоки, так что каждый из них реализуем с учетом имеющихся ограничений на ресурсы. Рассмотрим случай, когда интеграционный кластер образуется всеми бизнес-процессами множества BPs ,i ( t ) , i = 1, 2,..., N . Предположим, что в одном из
них (например, без умаления общности, в BPs ,1 ( t ) ) получено некоторое новшество. Однако для реализации этого новшества требуются ресурсы других бизнеспроцессов (из числа BPs ,i ( t ) , i = 2,..., N ). Очевидно, в этом случае процесс
BPs ,1 ( t ) станет своеобразным «центром притяжения» для других процессов.
Правда, территориально кластер может быть распределен на базе нескольких бизнес-процессов и совсем не обязательно – на территории процесса BPs ,1 ( t ) . Совместно они могут (если это окажется выгодно для них) образовать интеграционный
кластер. В его основе должен лежать совместный интерес бизнес-процессов в
продвижении новшества на рынок в виде нового товара или услуги. Понятно, что
такой кластер должен включать в себя часть или все бизнес-процессы из множе1
Работа поддержана грантом Минобрнауки по проекту ТП-8.536.2011 «Разработка интеллектуальных
технологий, средств компьютерного моделирования и эффективных методов оптимизации как функционального наполнения информационно-аналитических систем поддержки принятия решений».
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
К эффективности интеграционных кластеров
{
89
}
ства BPs ,i ( t ) , i = 1, 2,..., N , в соответствии с принципом минимальной достаточности (необходимой достаточности) и эффективности. Последнее означает, что
для осуществления интеграционного процесса необходимо задействовать те про-
{
}
цессы из множества BPs ,i ( t ) , i = 1, 2,..., N , которые доставят порождаемому ими
интеграционному кластеру наибольшую эффективность. Таким образом, среди
всего множества допустимых структур, образованных из бизнес-процессов мно-
{BP
жества
s ,i
( t )} , i = 1, 2,..., N , следует выбрать такую, которой соответствует
наибольшая эффективность.
2. Математическая модель интеграционного процесса
Интеграционный кластер из бизнес-процессов может быть построен с
использованием трех стратегий. Первая из них должна подобрать (выбрать)
те бизнес-процессы, которые своими ресурсами могут способствовать образованию интеграционного кластера (например, в соответствии с их интеграционными потенциалами). Обозначим этот оператор как CSel I (Selection, подбор
кандидатов на интеграцию). Назначение этого оператора состоит в том, чтобы
на основе бизнес-процессов
{
{BP
s ,i
( t )} , i = 1, 2,..., N сформировать подмножество
}
BPI ,i = BPs ,i ( t ) , i ∈ {i1 , i2 ,...iN s } , {i1 , i2 ,...iN s } ⊆ {1, 2,..., N } с требуемыми и доста-
точными (в совокупности) для осуществления инновационного процесса ресурсами. Оператор второго вида должен для этих процессов (уже из множества
BPI ,i , i ∈ {i1 , i2 ,...iN s } )
выбрать
элементы
(процессы,
ресурсы)
∆BPi ( t ) , i ∈ {i1 , i2 ,...iN s }
и связать их технологически, закрепив за бизнес-
процессами по месту их будущей реализации в рамках интеграционного кластера.
Обозначим этот оператор как CRes I (Resource, ресурс). Наконец, оператор третьего вида должен согласовать потоки в интегрированной структуре. Такой оператор
уже был рассмотрен выше и для его обозначения были использованы дуги над
бизнес-процессом. Если вводить буквенное обозначение для этого оператора, то
это может быть, например, такое – CCoor I (Coordination, согласование, увязка).
Все вместе (в композиции) эти три оператора порождают результирующий оператор, который может быть представлен в виде CI = CCoor I CRes I CSel I . А применительно к множеству базовых для интеграционного процесса бизнес-процессов
{
}
BPI = BPs ,i ( t ) , i = 1, 2,..., N , оператор интегрирования (образования интеграци-
онного кластера) может быть записан так: CI ( BPI ) = CCoor I CRes I CSel I ( BPI ) .
Для формализации представления стратегии CRes I , введем в рассмотрение
бизнес-процессы вида: ∆BPij− ( t ) , i = 1, 2,..., N , j = 1, 2,..., N , – это ресурсы (процессы) i-х бизнес-процессов выделяемые (передаваемые) j-м бизнес-процессам
(здесь для простоты обозначений не использовано множество индексов
{i1 , i2 ,...iNs } ). Заметим, что в общем случае выполняются неравенства
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Наумов, Т.В. Авдеенко
90
∆BPii− ( t ) ≠ 0, i = 1, 2,..., N , что означает, что отторгаемый ресурс остается в рамках
i-го бизнес-процесса (возможно, временно), но переходит в структуру интеграционного кластера. Здесь символом ноль обозначен бизнес-процесс, все элементы
которого (значения потоков, параметров и др.) равны нулю. Сведем элементы
∆BPij− ( t ) , i = 1, 2,..., N , j = 1, 2,..., N , в одно множество (стратегию выбора ресурсов
для образования интеграционного кластера):
t11 ,
t12 , ... ,
⎪⎧
CRes I ≡ ∆BPI = ⎨
−
−
⎪⎩∆BP11 t11 , ∆BP12 t12 ... ,
( )
Здесь
∆BP12−
t11 , t12 ,..., t NN
( )
−
t12 ,..., ∆BPNN
t NN
( )
−
∆BPNN
( t NN )
⎪⎫
⎬.
⎪⎭
( )
∆BP11− t11 ,
– времена начала реализаций процессов
( t NN )
соответственно, CRes I – стратегия выбора ресурсов
бизнес-процессов, входящих (планируемых для вхождения) в интеграционную
структуру, начало реализации которой относится к моменту времени
{
}
t I 1 = min t11 , t12 ,..., t NN . Стратегия CRes I может быть представлена в виде объе-
динения стратегий выбора ресурсов отдельных бизнес-процессов:
N
N ⎧
ti1 ,
ti 2 , ... ,
⎪
−
=
∪
CRes I ≡ ∆BPI = ∪ CRes
⎨
Ii
−
−
... ,
i =1
i =1 ⎪ ∆BPi1 ti1 , ∆BPi 2 ti 2
⎩
( )
( )
tiN
∆BPiN−
( tiN )
⎪⎫
⎬.
⎪⎭
−
В этой записи стратегии CRes
Ii , i = 1, 2,..., N , демонстрируют, какие ресурсы i-й
бизнес-процесс выделил другим бизнес-процессам кластера. Если элементы стратегии CRes I перегруппировать иначе, например, таким образом:
N
N ⎧
t1i ,
t2i , ... ,
⎪
+
CRes I ≡ ∆BPI = ∪ CRes
Ii = ∪ ⎨
−
−
∆
∆
BP
t
,
BP
... ,
i =1
i =1 ⎪
1i 1i
2 i t 2i
⎩
( )
( )
t Ni
∆BPNi−
( t Ni )
⎫⎪
⎬,
⎭⎪
+
то такое разложение будет представлять стратегии CRes
Ii , i = 1, 2,..., N , в соответ-
ствии с которыми i-е, i = 1, 2,..., N , бизнес-процессы получат ресурсы от всех процессов кластера.
Тогда результатом применения стратегии интегрирования CI к множеству
{
}
BPI = BPs ,i ( t ) , i = 1, 2,..., N , (напомним, что после применения оператора CSel I к
этому множеству получится множество BPI ,i , i ∈ {i1 , i2 ,...iN s } ) будет интегрированный кластер
BPs'', I (t ) = BPs'',i1 (t ) ∨ BP BPs'',i2 (t ) ∨ BP ... ∨ BP BPs'',iN (t ) = CCoor I ( BPs'', I (t )) .
s
Или можем записать: CCoor I ( CRes I ( BPI ,i , i ∈ {i1 , i2 ,...iN s } ) ) = BPs'', I (t ) , что эквивалентно записи: CCoor I CRes I ( BPI ,i , i ∈ {i1 , i2 ,...iN s } ) = BPs'', I (t ). Здесь CCoor I CRes I
– произведение (композиция) двух стратегий (соответствующих им операторов), а
BPs'', I (t ) – интегрированный кластер.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
К эффективности интеграционных кластеров
91
Обозначим множество (из N I элементов) допустимых стратегий интеграции
бизнес-процессов как
∆
=
{(C
( CI )∆ = ( CCoor I CRes I CSel I ) =
I
}
CRes I CSel I )1 , ( CI CRes I CSel I )2 ,..., ( CI CRes I CSel I ) N .
I
Тогда эффективные стратегии интеграции образуют его подмножество:
{
( CI )0 = ( CI )i ∈ ( CI )∆
(
''
∀ j∈{1,2,..., N } Q ( j ),i
Ej
)
}
Q ( j ) , i ∈ {1, 2,..., N I } .
Оно может быть определено еще и таким образом:
''
''
''
⎧
Q (1),i , Q (2),i ,..., Q ( N ),i
⎪
∆
( CI ) = ⎨( CI )i ∈ ( CI )
⎪
E Q (1) , Q (2) ,..., Q ( N )
⎩
⎫
E⎪
0
⎬ , i ∈ {1, 2,..., N I } .
⎪
⎭
Здесь обозначение Q использовано для векторного показателя эффективности;
– совокупность показателей эффективности неинтегри-
Q (1) , Q (2) ,..., Q ( N )
рованных
бизнес-процессов
''
''
''
Q (1),i , Q (2),i ,..., Q ( N ),i
из
множества
{
}
BPI = BPs ,i ( t ) , i = 1, 2,..., N ;
– значения тех же показателей для бизнес-процессов после
завершения интеграционного процесса; i – индекс (номер) стратегии интегрирования; E – знак отношения строгого порядка по критерию E. А запись вида
''
''
''
Q (1),i , Q (2),i ,..., Q ( N ),i
E
Q (1) , Q (2) ,..., Q ( N ) , i ∈ {1, 2,..., N I } , следует читать та-
ким образом: «набор значений показателей эффективности для интегрированных
в соответствии со стратегией ( CI )i бизнес-процессов кластера предпочтительнее
по критерию E набора значений этих же показателей для неинтегрированных биз0
нес-процессов». Именно на множестве эффективных стратегий интеграции ( CI )
следует искать наилучшие (оптимальные) стратегии. Множество оптимальных
стратегий можно определить следующим образом:
⎧
* ⎪
(CI )
(CI )i* ∈(CI )
0 ∀
, i*∈ 1,2,...,N * ∀i∈ 1,2,...,N
=⎨
⎪i*∈ 1,2,..., N I*
⎩
{
} &∀
{
I
{
} {
I
}∀i∈{1,2,...,N I*}
i*∈ 1,2,..., N I*
(
''
''
''
(
''
''
''
Q (1),i* ,Q (2),i* ,...,Q ( N ),i*
∼E
)
"
"
"
Q (1),i ,Q (2),i ,...,Q ( N ),i &⎫
⎪
⎬.
"
"
"
⎪
Q (1),i ,Q (2),i ,...,Q ( N ),i
⎭
}\{1,2,...,N I*} Q (1),i* ,Q (2),i* ,...,Q ( N ),i*
E
)
Предложенные модели положены в основу разрабатываемой информационной
системы анализа и управления интеграционными процессами.
3. Пример построения лизингового кластера
Рассмотрим в качестве примера образование лизингового кластера. Основными бизнес-процессами в этом случае будут являться [6, 7]:
- бизнес-процесс, который соответствует лизингополучателю; обозначим его
через BPs ,1 ( t ) ;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Наумов, Т.В. Авдеенко
92
- бизнес-процесс, который является лизингодателем, – BPs ,2 ( t ) ;
- бизнес-процесс, который является поставщиком оборудования, – BPs ,3 ( t ) .
Прежде всего, необходимо сделать некоторые предположения относительно
оборудования, которое будет приобретаться в лизинг процессом BPs ,1 ( t ) . Основой для оценивания эффективности лизингового кластера должно служить сравнение эффективностей бизнес-процесса BPs ,1 ( t ) (As-Is) с тем, что может получиться из этого процесса в результате интегрирования его в новый процесс
BPs'',1 ( t ) (To-Be). А для этого необходимо определить, как процесс образования
нового кластера влияет на изменение исходного бизнес-процесса. Один из вариантов лизинговой схемы может быть таким. Будем считать, что оборудование в
лизинг приобретается для того, чтобы в рамках нового процесса, построенного на
базе BPs ,1 ( t ) , проводить некоторые операции технологического цикла, которые
ранее проводились по аутсорсингу с использованием внешнего бизнес-процесса
процесса BPs ,0 ( t ) . Тогда стратегию интегрирования трех бизнес-процессов в
рамках лизингового кластера можно представить следующим образом. Во-первых, разрываются отношения в кластере BPs , I (t ) = BPs ,1 (t ) ∨ BP BPs ,0 (t ) . Бизнеспроцесс BPs ,0 (t ) не будет получать заготовки для обработки и оплату за эту
обработку (работу). То есть формально это означает, что этот процесс лишается
ресурсов ∆BP10− ( t ) , которые передавались от процесса BPs ,1 (t ) процессу BPs ,0 (t ) .
Кроме этого, прекращает свое существование и процесс ∆BP01− ( t ) , который
заключался в передаче процессу BPs ,1 (t ) результатов работы процесса BPs ,0 (t )
по аутсорсингу. Скорректированный бизнес-процесс, полученный из BPs ,1 (t )
в
результате
разрыва
связей,
условно
можно
представить
в
виде:
BPs',1 (t ) = BPs ,1 (t ) ∨ BP ∆BP10− ( t ) ∨ BP ∆BP01− ( t ) . Во-вторых, необходимо получить от-
вет на вопрос: из каких процессов будет образован новый кластер (в нашем случае – это процессы BPs',1 (t ) , BPs ,2 ( t ) и BPs ,3 ( t ) )? Этот выбор в общем случае
происходит с использованием оператора CSel I . В-третьих, на базе сформированного множества претендентов на вхождение в новый кластер решается задача выделения каждым из них ресурсов (с использованием оператора CRes I ). Для этого
необходимо расписать процессы: ∆BPij− ( t ) , i = 1, 2,3; j = 1, 2,3. Ненулевыми бизнес-процессами в этом случае будут следующие:
1) ∆BP12− ( t ) и ∆BP21− ( t ) – процессы заключения лизингового договора;
2) ∆BP12− ( t ) – процесс включает в себя, помимо прочего, оплату лизинговых
платежей;
3) ∆BP31− ( t ) – процесс передачи оборудования в лизинг;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
К эффективности интеграционных кластеров
93
4) ∆BP11− ( t ) – процесс подготовки и эксплуатации лизингового оборудования в
рамках бизнес-процесса BPs',1 (t ) ;
5) другие процессы обмена ресурсами (лизингодателя и банка, лизингодателя
и поставщика оборудования, поставщика и производителя оборудования); они
входят в общую структуру движения денежных и материальных ценностей, но
непосредственно на формируемом кластере не сказываются.
На этом заканчивает работу оператор CRes I .
В-четвертых, необходимо к бизнес-процессу BPs',1 (t ) подключить все рассмотренные выше ресурсные процессы, выстроить из них структуру и согласовать
в них потоки. После завершения работы оператора CCoor I получится кластер из
трех бизнес-процессов, среди которых процесс BPs'',1 (t ) является определяющим.
Именно в результате сравнения его эффективности и эффективности бизнеспроцесса BPs ,1 (t ) и определится целесообразность перехода от кластера, построенного на схеме аутсорсинга, к кластеру, построенному на схеме лизинга.
4. Моделирование
Рассмотрим иллюстративный пример, демонстрирующий оценивание эффективности интеграционных процессов для случая, когда создается лизинговый кластер так, как это было рассмотрено выше. Пусть потоки бизнес-процесса с лизинговой схемой имеют вид, приведенный в таблице.
Входной и выходной потоки лизингового кластера (бизнес-процесса BPs'',1 ( t ) )
Периоды, ti , i = 0,1,..., m; m = 5
0
1
2
3
4
5
Поток работ на лизинговом оборудовании, W f ,1 ( ti ) , ед. работ
10
15
10
20
15
20
Стоимость единицы работ на лизинговом оборудовании,
π BP ,W1 ( ti ) , ден. ед.
0,5
0,5
0,5
0,5
0,5
0,5
6,8882
6,8882
6,8882
6,8882
6,8882
6,8882
Лизинговые платежи, C fin,2 ( ti ) ,
ден. ед.
Общие затраты на лизинг,
C fin,Σ1 ( ti ) , ден. ед.
11,8882 14,3882 11,8882 16,8882 14,3882 16,8882
Входной финансовый поток основных бизнес-процессов в
BPs'',1 (t ) (без учета лизинга),
89
103,5
89
58
73,5
48
S B (ti ) , ден. ед.
Общий входной поток бизнеспроцесса BPs'',1 (t ) , S (ti ) , ден. ед.
100,8882 117,8882 100,8882 74,8882 87,8882 64,8882
Выходной поток бизнеспроцесса BPs'',1 (t ) , P (ti ) , ден. ед.
0
150
150
130
150
150
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Наумов, Т.В. Авдеенко
94
Предположим, что стоимость оборудования составляет 30 ден. ед. ( L = 30 )
(здесь использованы обозначения, близкие к принятым в работе [7]), арендная
ставка по договору лизинга составляет 10 % ( rleas = 0,1 ), срок использования лизингового оборудования составляет шесть временных тактов ( ti , i = 0,1,...,5 ,
Tleas = 6 ). Тогда лизинговые платежи за использование оборудования можно найти по формуле l = L ATleas , rleas , где ATleas ,rleas – коэффициент приведения ренты,
ATleas , rleas =
Tleas
∑ (1 (1 + rleas )i ) .
Для
рассматриваемого
примера
найдем:
i =1
ATleas ,rleas = 4,3553, l = L / ATleas , rleas
6,8882 ден. ед. (см. строку «Лизинговые пла-
=
тежи, C fin,2 ( ti ) » в таблице). Пусть заемные средства (общего входного потока
бизнес-процесса) возвращаются после шести временных тактов при ti = 6 .
Оценим доход лизингового кластера по формуле (в ней m = 5 ):
m
m
i =0
i =0
Profit(l ) = NFV(l ) = ∑ P(ti )(1 + r0 )tm −ti − ∑ S (ti )(1 + rl )tm −ti
при значениях ставок r0 = 0,5 (50 %), rl = 0,2 (20 %).
Получим NFV(l) = 985,1020 ден. ед., при этом,
m
SP =
∑ P(ti )(1 + r0 )t
m − ti
, SP = 1,9331·103 ден. ед.,
i =0
m
SS =
∑ S (ti )(1 + rl )t
m − ti
, SS = 948,0230 ден. ед.
i =0
Оценим доходность (финансовый усилитель) лизингового кластера, включающего
в себя бизнес-процессы BPs ,1 (t ) , BPs ,2 (t ) и BPs ,3 (t ) , по формуле
m
⎧ m
⎫
Profib((lS) → P ) = IRRNFV( l ) = ⎨r ∑ S (ti )(1 + r )tm −ti = ∑ P(ti )(1 + r0 )tm −ti ⎬ ,
⎩ i =0
⎭
i =0
получим IRRNFV( l ) = 0,4729 (47,29 %).
Найдем, какую часть от суммарного выходного потока бизнес-процесса
приходится на поток затрат, связанный с лизингом (строка «Общие затраты
на лизинг, C fin,Σ1 ( ti ) » в таблице). Итак, поток лизинговых платежей в суммарном
выходном потоке SP = 1.9331·103 ден. ед. составляет величину Eff_C_Leas =
= 262,8333 ден. ед. или в процентах – Eff_C_Leas_Pr = 13,5963 %.
Заключение
В работе предложены модели кластерных систем на основе потоковых представлений бизнес-процессов. Рассмотрены основные стратегии образования интегрированных структур и выписаны условия их эффективности и оптимальности.
Рассмотрен иллюстративный пример оценивания эффективности образования лизингового кластера. Предложенные модели могут быть положены в основу математического обеспечения информационных систем управления интеграционными
процессами.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
К эффективности интеграционных кластеров
95
ЛИТЕРАТУРА
1. Плещинский А.С., Титов В.В., Межов И.С. Механизмы вертикальных взаимодействий
предприятий (вопросы методологии и моделирования). Новосибирск: ИЭОПП СО РАН,
2005. 336 с.
2. Дементьев В.Е. Интеграция предприятий и экономическое развитие. М.: ЦЭМИ, 1998.
114 с.
3. Дементьев В.Е. Особенности разных форм межфирменной интеграции // Экономика:
учебник / под ред. Д.С. Львова, В.И. Видяпина: в 2 кн. Кн. 1. М.: ГОУВПО РЭА
им. Г.В. Плеханова, 2008. С. 599–619.
4. Наумов А.А., Максимов М.А. Управление экономическими системами. Процессный подход. Новосибирск: ОФСЕТ, 2008. 300 с.
5. Наумов А.А., Клавсуц И.Л., Лямзин О.Л. Инновации. Теория, модели, методы управления. Новосибирск: ОФСЕТ, 2010. 415 с.
6. Шатравин В.А. Эффективность лизинговых операций. М.: Ось-89, 1998. 236 с.
7. Щеглов С.В. Разработка схемы взаимодействия и оптимизационной модели при применении механизма лизинга в рамках проектного финансирования // Управление экономическими системами: Электронный научный журнал. 2011. № 3 (27). URL: http://uecs.
mcnip.ru/modules.php?name = News&file = article&sid = 385.
Наумов Анатолий Александрович
Авдеенко Татьяна Владимировна
Новосибирский государственный технический университет
E-mail: a_a_naumov@mail.ru; tavdeenko@mail.ru
Поступила в редакцию 2 мая 2012 г.
Naumov Anatoly A., Avdeenko Tatiana V. (Novosibirsk State Technical University). To effectiveness of cluster integration.
Keywords: Clusters, integration, models, business process, efficiency.
Realization of innovative processes assumes integration of scientific, technical, technological
novelties (ideas), developmental base, the manufacture, appropriating resources. And, such integration can occur under different conditions, by attraction of resources in the different form and
so on. In research problems of integration processes of economic systems questions of efficiency
estimation of integration structures is emphasized. There are proposed models which can be put in
a basis of methods of the analysis, modeling and management of integration processes. These
models are realized in appropriating information systems.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
УДК 519.8
В.В. Поддубный, О.В. Романович
КОМБИНАТОРНО-АНАЛИТИЧЕСКИЙ МЕТОД МАКСИМИЗАЦИИ
НЕГЛАДКОЙ ТОЧНОЙ НИЖНЕЙ ГРАНИЦЫ МНОЖЕСТВА ВОГНУТЫХ
ГЛАДКИХ ФУНКЦИЙ, ЗАВИСЯЩИХ ОТ ПАРАМЕТРА
Рассматриваются системы, функционирующие по непрерывно-дискретному
максиминному критерию. Предлагается комбинаторно-аналитический метод
максимизации негладкой точной нижней границы конечного набора вогнутых гладких функций, зависящих от параметра. Метод основан на использовании необходимых условий максимумов и условий пересечения функций
набора. Построен комбинаторный алгоритм отыскания решения соответствующей негладкой максиминной задачи. Приведён пример решения задачи
нахождения супремума точной нижней границы набора квадратичных вогнутых функций.
Ключевые слова: максиминный критерий, вогнутые функции, точная
нижняя граница, негладкая оптимизация, комбинаторный алгоритм.
Задача максимизации точной нижней границы множества гладких функций
является частным случаем максиминной задачи, в которой максимизация идёт по
непрерывной переменной, а минимизация − по дискретной. Такие непрерывнодискретные максиминные задачи возникают в теории игр (нижняя цена «игры с
природой» [1]), в исследовании операций и теории принятия решений (осторожный критерий Вальда [2]), в математической экономике [3−5], в том числе в математических моделях рынка [6, 7]), и вообще в теории любых динамических систем, функционирующих по непрерывно-дискретному максиминному критерию
(технических, экономических, биологических и др.).
Во всех приложениях, где целевая функция задачи максимизации является поточечной точной нижней гранью множества функций, приходится иметь дело с
недифференцируемой (негладкой) оптимизацией, так как такая целевая функция
даже при гладких функциях множества оказывается не гладкой, а кусочногладкой, кусочно-дифференцируемой. Для численного решения задач выпуклой
негладкой (недифференцируемой) оптимизации в настоящее время разработан
мощный математический аппарат субдифференциалов и субградиентов [8−10], на
основе которого построены эффективные итерационные вычислительные алгоритмы оптимизации [11, 12]. Эти алгоритмы применимы и к решению задач численной максимизации точной нижней грани множества вогнутых функций, в том
числе зависящих от параметра.
Однако задачи максимизации точной нижней грани конечного множества вогнутых функций могут быть решены более простым методом. Метод состоит в
приведении исходной негладкой максиминной задачи к эквивалентному набору
задач гладкой максимизации, обеспечивающих получение точек максимумов всех
функций, и задач отыскания всех точек пересечения этих гладких функций с последующим сравнением значений функций в точках максимумов и в точках пересечений и с комбинаторным отбором точного решения. В ряде случаев (например,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Комбинаторно-аналитический метод максимизации негладкой точной нижней границы
97
при параболических функциях) эти задачи допускают точное аналитическое решение. Использование такого комбинаторно-аналитического метода предпочтительно при построении и исследовании алгоритмов решения максиминных задач,
зависящих от параметров.
1. Математические модели систем, функционирующих
по максиминному критерию
Рассмотрим простейшую математическую модель динамической системы,
функционирующей по максиминному критерию (см., например, [7]):
(1)
x ( t + 1) = arg sup inf { fi ( ξ, u ( t ) , x ( t ) )} , t = 0,1, 2,... , x ( 0 ) = x0 ,
ξ∈ X 1≤ i ≤ m
где вещественные функции fi ( ξ, u ( t ) , x ( t ) ) , i = 1, m , непрерывны, дифференцируемы и вогнуты по скалярным аргументам ξ, x(t) ∈ X = [xmin, xmax] и непрерывны
и монотонны по скалярному аргументу u(t) ∈ U = [umin, umax], а t = 0,1,2,… − дискретное время. Переменная x(t) описывает состояние системы в момент времени t,
переменная u(t) − параметр системы или управляющая переменная.
Поскольку интервал X − непустое компактное и выпуклое множество, то в
случае непрерывности отображения (1) в соответствии с теоремой Брауэра (см.,
например, [13]) это отображение имеет неподвижную точку (точку равновесия)
x ( u ) , к которой стремится состояние x(t) динамической системы (1) при t → ∞.
Опуская индекс t, получаем статическую модель, действующую на каждом
шаге дискретного времени:
{
}
x* = arg sup inf fi ( x, u ) , i = 1, m .
i
x∈ X
(2)
2. Задача максимизации точной нижней границы конечного набора
вогнутых гладких функций
Задача (2) есть задача максимизации точной нижней границы конечного множества
{
}
M = fi ( x, u ) , i = 1, m
вогнутых гладких функций. Обозначив поточечную точную нижнюю грань этих
функций через
{
}
f ( x, u ) = inf fi ( x, u ) , i = 1, m ,
i
представим задачу (2) как задачу максимизации функции f(x, u) по переменной x
при фиксированном значении параметра u:
J ( u ) = sup f ( x, u ) .
x∈ X
Нетрудно показать (см., например, [13]), что функция f (x, u) непрерывна и вогнута по x. Однако, в отличие от исходных функций набора, эта функция в общем
случае не является гладкой.
Теорема 1. Поточечная точная нижняя грань f (x, u) конечного множества M
вогнутых дифференцируемых функций переменной x непрерывна, вогнута и име-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Поддубный, О.В. Романович
98
ет не более m(m − 1) точек разрыва производной первого рода при любом конечном значении параметра u, то есть является непрерывной кусочно-дифференцируемой (кусочно-гладкой) функцией аргумента x.
Доказательство. Непрерывность и вогнутость функции (4) известна [13].
Точками разрыва производной функции f (x, u), очевидно, могут быть только точки пересечения функций множества M. Каждая из вогнутых функций fi(x, u) может либо не иметь общих точек с любой другой вогнутой функцией fj(x, u), либо
иметь одну точку пересечения (или касания), либо иметь две точки пересечения.
Так, число пересечений первой функции с остальными m − 1 функциями не превышает 2(m − 1). Число пересечений второй функции с оставшимися m − 2 функциями не превышает 2(m − 2), третьей функции с оставшимися m − 3 функциями
не превышает 2(m − 3), и т.д. Число пересечений предпоследней функции с единственной оставшейся (последней) функцией не превышает 2. Следовательно, максимальное число возможных точек пересечения m вогнутых функций есть удвоенное число членов арифметической прогрессии
m −1
∑ i =1 i = m ( m − 1) / 2 ,
то есть
m(m − 1). В каждой из точек пересечения скачок производной функции f(x, u) конечен, так как он равен разности производных пересекающихся функций, которая
всегда ограничена вследствие дифференцируемости функций множества M. Теорема доказана.
Таким образом, поточечная точная нижняя грань f(x, u) конечного множества
M дифференцируемых вогнутых функций является непрерывной вогнутой кусочно-дифференцируемой функцией с не более чем m(m − 1) точек изломов (скачков
производной). Поэтому оптимизационная задача (5) есть задача максимизации
непрерывной вогнутой кусочно-дифференцируемой функции.
3. Комбинаторно-аналитический алгоритм решения задачи
максимизации вогнутой кусочно-дифференцируемой функции
Предположим, что часть N1, 0 ≤ N1 ≤ m, вогнутых дифференцируемых функций
множества M унимодальна, то есть на множестве вещественных чисел R имеется
N1 точек
{ xi* ( u ) , i ∈1, m} , в которых выполняются необходимые и достаточные
условия максимума:
(
∂fi xi* ( u ) , u
) = 0 , ∂ 2 fi ( xi* ( u ) , u ) < 0
i ∈ 1, m .
(6)
∂x 2
Если унимодальные функции отсутствуют (N1 = 0), условия (6) отсутствуют.
Обозначим через X 1* множество вещественных точек максимумов функций. Очевидно, это множество есть вещественное подмножество потенциально возможных
∂x
{
}
точек максимумов: X 1* ⊆ xi* ( u ) , i = 1, m .
В соответствии с теоремой 1 на множестве R будет также N2, 0 ≤ N2 ≤ m(m − 1),
точек пересечения функций множества M из потенциально возможного набора
{
}
* 1,2
точек пересечения xij( ) ( u ) , i = 1, m − 1, j = i + 1, m этих функций, определяемых
уравнениями
(
)
(
)
* 1,2
* 1,2
fi xij( ) ( u ) , u = f j xij( ) ( u ) , u , i ∈ 1, m − 1, j ∈ i + 1, m .
(7)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Комбинаторно-аналитический метод максимизации негладкой точной нижней границы
99
Обозначим через X 2* множество действительных точек пересечения функций
набора M. Очевидно, это множество есть вещественное подмножество потенци-
{
}
* 1,2
ально возможных точек пересечений: X 2* ⊆ xij( ) ( u ) , i = 1, m − 1, j = i + 1, m .
*
Решение x (u) задачи максимизации (5) может принадлежать только непустому
объединению X * = X 1* ∪ X 2* конечных множеств X 1* и X 2* . Если X* = ∅, задача
(5) на всей вещественной оси R не имеет решения (вырождена). Действительно, в
этом случае во множестве M нет унимодальных функций, все вогнутые функции
множества M не пересекаются, так что поточечная точная нижняя грань f(x, u)
множества M совпадает с минимальной неунимодальной вогнутой функцией
fmin(x, u) множества M, не имеющей максимума.
Однако при наличии ограничений на интервал [xmin, xmax] возможных (допустимых) значений переменной x решение x*(u) задачи (5) существует всегда, и в
случае пустого множества X * его следует искать на границах интервала
[xmin, xmax], выбирая в качестве решения x*(u) точку наибольшего значения минимальной
функции
fmin(x, u)
множества
M
на
концах
интервала:
x*(u) = arg sup {fmin(xmin, u), fmin(xmax, u)).
Включим теперь граничные точки интервала [xmin, xmax] во множество X * и
определим его как объединение множеств X 1* , X 2* и {xmin, xmax}:
X * = X 1* ∪ X 2* ∪ { xmin , xmax } . Для каждого фиксированного значения параметра u
найдём интервал X(u) как верхнее лебеговское множество, содержащее все точки
X 1* максимумов функций множества M, все точки X 2* пересечения этих функций, а также точки {xmin, xmax}:
X ( u ) = { x ∈ R | f ( x, u ) ≥ c ( u )} ,
(8)
{ (
(
)
)
* 1,2
c ( u ) ≤ min f xi* ( u ) , i ∈ 1, m, xi* ( u ) ∈ X 1* ; f xij( ) ( u ) , i ∈ 1, m − 1,
}
* 1,2
j ∈ i + 1, m, xij( ) ( u ) ∈ X 2* ; f ( xmin , u ) , f ( xmax , u ) ,
(9)
так что X(u) ⊃ X*. Упорядочим в порядке возрастания все элементы множества X*,
оставляя в возможных связках (множествах совпадающих элементов) только по
одному (например, первому или последнему) элементу. Тогда
{
}
X * = x(*k ) ( u ) , k = 1, N ,
(10)
где k − ранг элемента множества X *, N ≤ N1 +N2 +2 ≤ m + m(m – 1) + 2 = m2 + 2 −
мощность (число элементов) множества X *.
Теперь легко построить комбинаторный алгоритм решения оптимизационной
задачи (5) с учётом ограничений x ∈ [xmin, xmax].
Шаг 1. Решаем аналитически или численно с помощью известных алгоритмов
гладкой оптимизации системы уравнений (6) и (7) без учёта ограничений
x ∈ [xmin, xmax]. Для нахождения точек максимумов функций множества M (численного решения системы независимых уравнений (6)) можно использовать любой градиентный метод (например, метод Ньютона или квазиньютоновские методы). Для численного решения системы независимых уравнений (7) можно также
использовать градиентные методы или, например, метод Нелдера – Мида, вычис-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Поддубный, О.В. Романович
100
{ x(
1,2 )
ij
ляя предварительно начальные приближения
чек
{x (
* 1,2 )
ij
( u ) , i = 1, m − 1, j = i + 1, m} то-
( u ) , i = 1, m − 1, j = i + 1, m} как точки пересечения квадратичных ап-
проксимаций функций множества M:
(
)
fi xi* ( u ) , u +
(
)
(
∂fi xi* ( u ) , u
= f j x*j ( u ) , u +
)
( x(
∂x
∂f j x*j ( u ) , u
(
1,2 )
ij
)
( u ) − xi* ( u ) ) =
( x(
)
1,2 )
ij
(11)
( u ) − x*j ( u ) .
∂x
В результате находим все точки максимумов и точки пересечений функций
множества M.
Добавив к этим точкам граничные точки xmin, xmax интервала поиска решения
задачи (2), получаем все элементы множества X * претендентов на решение максиминной задачи (2).
Шаг 2. Упорядочиваем в порядке возрастания элементы множества X *, представляя его в виде (10). Находим ранги (индексы) k1 и k2 элементов xmin и xmax соответственно. Полагаем k = k1.
Заметим, что этот шаг можно пропустить, если следующий шаг выполнять последовательно для всех элементов неупорядоченного множества X *, начиная с
k1 = 1 и заканчивая при k2 = N, а точку максимума функции f(x, u) находить сравнением её значений во всех точках множества X *.
Шаг 3. Вычисляем все функции множества M последовательно в точках
{ x(*k ) ( u ) , k = k1 , k2 } , начиная с k = k . На каждом шаге k этого процесса находим
1
значение точной нижней грани множества функций M:
(
{ (
)
)}
f x(*k ) ( u ) , u = inf fi x(*k ) ( u ) , u .
1≤ i ≤ m
(12)
Шаг 4. При k > k1 сравниваем значение (12) точной нижней грани множества
функций M в точке x(*k ) ( u ) с предыдущим значением (в точке x(*k −1) ( u ) ). Поскольку f(x, u) вогнута по x, принимаем следующие решения:
(
)
(
• если f x(*k ) ( u ) , u < f x(*k −1) ( u ) , u
)
и k ≤ k2, прекращаем процесс вычисле-
ний значений функции f, полагаем x* ( u ) = x(*k −1) ( u ) и переходим на следующий
шаг 5;
(
)
(
• если f x(*k ) ( u ) , u > f x(*k −1) ( u ) , u
)
и k = k2, прекращаем процесс вычисле-
ний значений функции f, полагаем x* ( u ) = x(*k ) ( u ) и переходим на следующий
шаг 5;
• в противном случае увеличиваем k на 1 и возвращаемся на шаг 3 (возможностью совпадения значений функции f в соседних точках упорядоченного множества X * пренебрегаем, так как такое совпадение возможно лишь в том случае, если
во множестве функций M имеется функция-константа, не зависящая от x).
Шаг 5. Конец.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Комбинаторно-аналитический метод максимизации негладкой точной нижней границы 101
4. Пример: задача максимизации точной нижней границы
вогнутых квадратичных функций
4.1. Компьютерное моделирование задачи
В качестве примера решения задачи максимизации точной нижней границы
набора вогнутых гладких функций рассмотрим максиминную задачу для двух и
трёх вогнутых квадратичных функций, зависящих от параметра u:
2
2
f1 ( x, u ) = −a1 ( x − x1 ) − u , f 2 ( x, u ) = −a2 ( x − x2 ) + u ,
2
f3 ( x, u ) = − a3 ( x − x3 ) .
(13)
Эти функции непрерывны и дифференцируемы по своим аргументам, вогнуты
(выпуклы вверх) по x и монотонны по u. Задача (2) максимизации точной нижней
границы этих функций на заданном интервале X = [xmin, xmax] принимает вид
{
}
x* = arg sup inf fi ( x, u ) , i = 1, m , m = 2,3 .
x∈ X
i
(14)
Приведём сначала результаты компьютерного моделирования задачи (14) при
следующих параметрах:
a1 = 2, a2 = 1,5, a3 = 1, x1 = 5, x2 = 10, x3 = 15,
(15)
так что a1 > a2 > a3 , x1 < x2 < x3 . Протабулируем функцию
{
}
f ( x, u ) = inf fi ( x, u ) , i = 1, m
i
на интервалах x ∈ [−40, 20] с шагом 0,1 и u ∈ [−150, 250] с шагом 1.
На рис. 1, 2 представлены контурные карты поверхности f(x, u) соответственно при множествах M двух и трёх функций (13). Тонкие линии разделяют области,
в которых нижняя граница f(x, u) множества функций M совпадает с f1(x, u) (верхняя область на рис. 1, 2), с f2(x, u) (нижняя область на рис. 1, 2), с f3(x, u) (центральная область на рис. 2). Это линии недифференцируемости, разрыва производных функции f(x, u) по переменной x. Полужирные линии изображают геометрическое место точек максимальных по x значений функции f(x, u) при различных
значениях параметра u. Кружочками на этих линиях отмечены точки с координатами (x*, u*), где максиминный критерий J(u) принимает наибольшее по параметру u значение J * (точка глобального максимума).
На рис. 1, 2 видно, что область значений параметра u распадается на части с
разным числом точек пересечения функций множества M. Так, в области «больших» значений параметра может не быть точек пересечения функций, но могут
присутствовать точки максимума одной из функций (в нашем примере это точки
максимума f1(x, u) на полужирной линии).
В области «средних» значений параметра могут присутствовать все или часть
точек пересечения функций и точки максимумов части функций, а также точка
глобального максимума. В области «малых» значений параметра могут присутствовать точки пересечения каких-то функций и точки максимума одной из них (в
нашем примере это точки максимума f2(x, u) на полужирной линии).
На рис. 3, 4 представлен ход зависимости максиминного критерия J от параметра u также при двух и трёх функциях множества M соответственно. Это ход
максиминного критерия вдоль полужирных линий, представляющих на рис. 1, 2
решения задачи максимизации нижней границы множества функций при различных значениях параметра u.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Поддубный, О.В. Романович
102
u
x* = 7,1, u* = 1,8975, J *= –10,7175
u
x* = 10, u* = –25, J *= –25
x
Рис. 1. Контурная карта f (x, u) при m = 2.
Вверху f (x, u) = f1(x, u), внизу f (x, u) = f2(x, u)
x
Рис. 2. Контурная карта f (x, u) при m = 3.
Вверху f (x, u) = f1(x, u), внизу
f (x, u) = f2(x, u), в центре f (x, u) = f3(x, u).
x* = 7,1, u* = 1,8975, J *= –10,7175
J
u
Рис. 3. Зависимость критерия J от параметра u при m = 2
x* = 10, u* = –25, J *= –25
J
u
Рис. 4. Зависимость критерия J от параметра u при m = 3
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Комбинаторно-аналитический метод максимизации негладкой точной нижней границы 103
Обратим внимание, что в точке глобального максимума, лежащей на линиях
пересечений функций, критерий J(u) может быть как дифференцируемым (рис. 3),
так и недифференцируемым (рис. 4).
4.2. Аналитическое решение при m = 2
Решим задачу (14) аналитически в простейшем случае m = 2. Положим для
простоты X = R (поскольку функции параболические, максимин всегда существует на R).
Выпишем систему уравнений (6) для нашего примера при m = 2 и решим её
аналитически:
(
) = −2 a
(
) = −2a
(
∂f1 x1* ( u ) , u
1
∂x
(
∂f 2 x2* , u
)
x1* ( u ) − x1 = 0 , x1* ( u ) = x1 ,
*
2 x2
)
x2*
( u ) = x2 ,
(
∂ 2 f1 x1* ( u ) , u
∂x
(
∂ 2 f 2 x2* ( u ) , u
) = −2a
1
2
<0;
) = −2a
2 <0.
∂x
Выпишем уравнение (7) для этого примера и решим его аналитически:
∂x
(
) (
− x2 = 0 ,
)
(
2
)
(
)
2
2
* 1,2
* 1,2
* 1,2
* 1,2
f1 x12( ) (u),u = f 2 x12( ) (u),u : −a1 x12( ) (u) − x1 −u =− a2 x12( ) (u) − x2 + u ,
a x − a x ± ∆ (u )
2
* 1,2
, ∆ ( u ) = a1a2 ( x1 − x2 ) − 2 ( a1 − a2 ) u .
x12( ) ( u ) = 1 1 2 2
a1 − a2
Получили потенциальные множества точек максимумов и точек пересечения
функций:
{
}
X 1* ⊆ xi* ( u ) , i = 1, 2 = { x1 , x2 } ,
(16)
⎪⎧ a x − a x − ∆ ( u ) a1 x1 − a2 x2 + ∆ ( u ) ⎪⎫
* 1,2
X 2* ⊆ x12( ) ( u ) = ⎨ 1 1 2 2
,
⎬.
a1 − a2
a1 − a2
⎩⎪
⎭⎪
(17)
{
}
Исследуем поведение зависящих от параметра u корней (17) уравнения для точек пересечения функций.
При ∆(u) > 0 корни
x12( ) ( u ) =
*1
a1 x1 − a2 x2 − ∆ ( u ) *( 2 )
a x − a x + ∆ (u )
, x12 ( u ) = 1 1 2 2
a1 − a2
a1 − a2
(18)
действительные разные, и мы имеем две точки пересечения парабол. Эта ситуация
реализуется в области U1 «малых» значений параметра u:
a1a2
U1 : u <
(19)
( x1 − x2 )2 = u0 .
2 ( a1 − a2 )
В этой области для всех x ∈ R имеем
*1
⎧ f1 ( x, u ) , если
x ≤ x12( ) ( u ) ,
⎪
*1
*2
f ( x, u ) = ⎨ f 2 ( x, u ) , если x12( ) ( u ) ≤ x ≤ x12( ) ( u ) ,
*2
⎪ f ( x, u ) , если
x ≥ x12( ) ( u ) .
⎩ 1
(20)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Поддубный, О.В. Романович
104
При этом область U1 распадается на три подобласти U10, U11 и U12:
a
2
U10 : u1 = 2 ( x2 − x1 ) < u < u0 ,
2
(21)
в которой x12( ) ( u ) < x1 и супремум функции f(x, u) достигается в точке максимума функции f1(x, u): x* = x1;
a
2
U11 : u2 = − 1 ( x2 − x1 ) ≤ u ≤ u1 ,
(22)
2
*2
*2
в которой x1 ≤ x12( ) ( u ) ≤ x2 и супремум функции f(x, u) достигается в точке пере*2
*2
сечения x12( ) ( u ) : x* = x12( ) ( u ) ;
U12 : u < u2 ,
(23)
*2
x12( )
в которой
( u ) > x2 и супремум функции f(x, u) достигается в точке максимума функции f2(x, u): x* = x2.
При ∆(u) < 0 корни комплексно-сопряжённые, так что точек пересечения парабол нет (параболы нигде не пересекаются). Эта ситуация реализуется в области U2
«больших» значений параметра u:
a1a2
U2 : u >
(24)
( x1 − x2 )2 = u0 .
2 ( a1 − a2 )
В этой области для всех x ∈ R имеем f(x, u) = f1(x, u) и супремум функции
f(x, u) достигается в точке максимума функции f1(x, u): x* = x1.
При ∆(u) = 0 корни вещественные кратные и имеется только одна точка пересечения парабол (точка касания). Эта ситуация реализуется в области U3, состоящей из единственной точки u0, разделяющей области U1 и U2 значений параметра
u:
a1a2
U3 : u =
(25)
( x1 − x2 )2 = u0 .
2 ( a1 − a2 )
В этой области для всех x ∈ R также имеем: f(x, u0) = f1(x, u0). Поскольку
a x −a x
*1
*2
*
x12( ) ( u0 ) = x12( ) ( u0 ) = x12
( u0 ) = 1 1 2 2 < x1 ,
a1 − a2
(26)
супремум функции f(x, u0) достигается в точке максимума функции f1(x, u0):
x* = x1.
4.3. Численное решение
Продемонстрируем теперь численное решение задачи максимизации (14) на
примере максимизации нижней границы двух вогнутых функций отдельно по областям U1, U2 и U3 значений параметра u.
Воспользуемся алгоритмом п. 3.
Шаг 1. Используя аналитически найденные элементы множества X * претендентов на решение задачи (формулы (16), (17)), составим множества X * по областям, вычислив предварительно по формулам (19), (21), (22) величины u0 = 75,
u1 = 18,75, u2 = −25. Область U1: u < u0 = 75 распадается на три подобласти: U10,
U11, U12.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Комбинаторно-аналитический метод максимизации негладкой точной нижней границы 105
В подобласти U10: u1 = 18,75 < u < u0 = 75 выберем, например, u = 50. Найдём
∆ = 25 и вычислим элементы множества X *. Результат поместим в таблицу 1.
В подобласти U11: u2 = −25 < u < u1 = 18.75 < u0 = 75 выберем, например, u = 0.
Найдём ∆ = 75 и вычислим элементы множества X *. Результат поместим в соответствующую строку таблицы.
В подобласти U12: u < u2 = −25 < u1 = 18.75 < u0 = 75 выберем, например,
u = −100. Найдём ∆ = 175 и вычислим элементы множества X *. Результат также
поместим в соответствующую строку таблицы.
В области U2: u > u0 = 75 выберем, например, u = 100 > u0 = 75. В этом случае
нет точек пересечения функций. Найдём элементы множества X * и поместим их в
соответствующую строку таблицы.
В области U3: u = u0 = 75 имеем кратные корни уравнения, определяющего
точку пересечения функций. Найдём элементы множества X * и поместим их в соответствующую строку таблицы.
Результаты численных расчётов
x1*
x2*
X*
f1(X*, u)
f2(X*, u)
f (X*, u)
5
−50
12,5
−50
10
−100
50
−100
X*
f1(X*, u)
f2(X*, u)
f (X*, u)
5
0
−37,5
−37,5
10
−50
0
−50
X*
f1(X*, u)
f2(X*, u)
f (X*, u)
5
100
−137,5
−137,5
10
50
−100
−100
X*
f1(X*, u)
f2(X*, u)
f (X*, u)
5
−100
62,5
−100
10
−150
100
−150
X*
f1(X*, u)
f2(X*, u)
f (X*, u)
5
−75
37.5
−75
10
−125
75
−125
*(1)
x12
*( 2 )
x12
u = 50 ∈ U10, ∆ = 25
−20
0
−1300
−100
−1300
−100
−1300
−100
u = 0 ∈ U11, ∆ = 75
−27,3205
7,3205
−2089,2
−10,8
−2089,2
−10,8
−2089,2
−10,8
u = −100 ∈ U12, ∆ = 175
−36,4575 16,4575
−3337,5
−162,5
−3337,5
−162,5
−3337,5
−162,5
u = 100 ∈ U2, ∆ = −25 < 0
−
−
−
−
−
−
−
−
u = 75 ∈ U3, ∆ = 0
−10
−10
−525
−525
−525
−525
−525
−525
J = max f
x*
(x*, u)
−50
5
(5, 50)
−10,8
7,3205 (7,3205, 0)
−100
10
(10, −100)
−100
5
(5, 100)
−75
5
(5, 75)
Шаг 2 ранжирования элементов множеств X * опускаем и переходим к шагу 3.
Шаг 3. Вычисляем множества значений функций (13) во всех точках множеств
X* по областям. Результаты помещаем в соответствующие строки таблицы 1.
Шаг 4. Сравниваем значения функций f1(x, u) и f2(x, u) в точках множества X *,
представленных в таблице при каждом фиксированном значении u, и получаем
значения f(x, u) = min{f1(x, u), f2(x, u)} в точках множества X *. Записываем их так-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
106
В.В. Поддубный, О.В. Романович
же в соответствующую строку таблицы. Определяем индекс максимального значения этой функции и считывем значение соответствующего этому индексу элемента множества X *, получая в результате точку x* (решение максиминной задачи
(14)) и величину J максимального значения функции f(x, u) для каждого фиксированного значения параметра u. Эти результаты помещаем в соответствующие
столбцы в правой части таблицы.
Шаг 5. Заканчиваем вычисления.
Сравнивая результаты с табулированными значениями максиминного критерия (14), представленными на рис. 1 и 3, убеждаемся в правильности работы алгоритма.
Заключение
Предложенный в данной работе комбинаторно-аналитический метод решения
непрерывно-дискретной максиминной задачи оптимизации (2) позволяет свести
задачу недифференцируемой максимизации нижней границы конечного множества дифференцируемых вогнутых функций к конечному набору задач дифференцируемой оптимизации с последующим решением задачи отыскания нижней цены некоторой матричной игры. Действительно, набор функций M задачи (2) конечен (m), множество X * претендентов на решение задачи, полученное аналитически
или путём решения задач дифференцируемой оптимизации, конечно (N не более,
чем m2 + 2), так что при каждом фиксированном значении параметра u, как видно
из таблицы 1, мы имеем матричную игру m × N , где m − число стратегий «природы», а N − число стратегий «игрока», функционирующего по максиминному критерию. Заметим, что в общем случае такая игра не имеет седловой точки (решения
в чистых стратегиях), так как нижняя и верхняя цены игры не всегда совпадают.
Например, при u = 0 верхняя цена игры, равная 0, не совпадает с нижней ценой,
равной −10,8, тогда как при других значениях u, представленных в таблице, нижние и верхние цены игр совпадают.
ЛИТЕРАТУРА
1. Льюс Р.Д., Райфа Х. Игры и решения. Введение и критический обзор. М.: ИЛ, 1961.
644 с.
2. Блекуэлл Д., Гиршик М.А. Теория игр и статистических решений. М.: ИЛ, 1958. 374 с.
3. Фон Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение. М.: Наука,
Гл. ред. физ.-мат. лит., 1970. 708 с.
4. Мулен Э. Теория игр с примерами из математической экономики. М.: Мир, 1985. 200 с.
5. Kelly A. Decision Making Using Game Theory: An Introduction for Managers. New York:
Cambridge University Press, 2003. 204 p.
6. Черемных Ю.Н. Микроэкономика. Продвинутый уровень: Учебник. М.: ИНФРА-М,
2008. 844 с.
7. Поддубный В.В., Романович О.В. Математическое моделирование оптимального рынка
конкурирующих товаров в условиях лага поставок // Компьютерные исследования и
моделирование. 2012. Т. 4. № 2. С. 431−450.
8. Демьянов В.Ф., Васильев Л.В. Недифференцируемая оптимизация. М.: Наука, 1981.
384 с.
9. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988. 280 с.
10. Шор Н.З. Методы оптимизации недифференцируемых функций и их приложения. Киев: Наукова думка, 1979. 200 с.
11. Шор Н.З., Стеценко С.И. Квадратичные экстремальные задачи и недифференцируемая
оптимизация. Киев: Наукова думка, 1989. 208 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Комбинаторно-аналитический метод максимизации негладкой точной нижней границы 107
12. Нестеров Ю.Е. Методы выпуклой оптимизации. М.: МЦНМО, 2010. 281 с.
13. Бусыгин В.П., Желободько В.Е., Цыплаков А.А. Микроэкономика − третий уровень:
учебник. Новосибирск, НГУ, 2003. 702 с.
Поддубный Василий Васильевич
Романович Ольга Владимировна
Томский государственный университет,
E-mail: vvpoddubny@gmail.com; hjkm@ngs.ru
Поступила в редакцию 8 июня 2012 г.
Poddubny Vasiliy V., Romanovich Olga V. (Tomsk State University). Combinatorial-analytical
method for maximizing of nonsmooth greatest lower boundary of the set of smooth concave
functions depending on the parameter.
Keywords: maximin criterion, concave functions, greatest lower bound, nonsmooth optimization,
combinatorial algorithm.
We consider systems that operate according a continuous-discrete maximin criterion. The
combinatorial-analytic method of maximizing of nonsmooth greatest lower boundary of the finite
set of concave smooth functions, depending on the parameter, is proposed. The method is based
on necessary conditions for both maxima and intersections of the set of functions. It produces a
set of points-applicants that may become the solution of the nonsmooth maximin problem. A
combinatorial algorithm for finding solution is constructed.
The proposed combinatorial-analytic method for solving discrete-continuous maximin optimization problem reduces the problem of maximizing nondifferentiable lower boundary of a finite
set of differentiable concave functions to a finite set of differentiable optimization problems with
subsequent solution of the problem of finding lower price of some matrix game. In general, this
game has no saddle point (solution in pure strategies), because the lower and upper values of the
game do not always coincide.
The use of the combinatorial-analytic method is more preferable in comparison with subgradient optimization methods by construction and study of algorithms for solving the maximin
problems depending on parameters. An example of solving of the problem of finding of the supremum of the greatest lower boundary of the set of quadratic concave functions is shown.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
УДК 681.324
П.А. Михеев, С.П. Сущенко
АНАЛИЗ БЫСТРОДЕЙСТВИЯ БЕСПРОВОДНОЙ ЛВС
Предложена математическая модель метода случайного множественного
доступа с контролем несущей и предотвращением коллизий для соперничающих абонентов. Показана возможность захвата среды передачи данных
одним из соперников на неопределенно долгое время и унимодальная зависимость операционных характеристик протокола доступа от начальной ширины конкурентного окна. Предложены меры предупреждения эффекта захвата, основанные на модификации протокольных правил выбора размера
конкурентного окна. Для исследования эффекта захвата с произвольным
числом соперников построена имитационная модель процесса соперничества. Показана эффективность профилактических мер, обеспечивающих справедливое распределение совместно используемого ресурса времени разделяемой среды передачи данных при несущественном снижении общей пропускной способности метода доступа.
Ключевые слова: беспроводные сети стандарта 802.11, соперничество,
конкурентное окно, таймер случайной отсрочки, положительная обратная
связь, время соперничества, эффект захвата среды передачи данных, пропускная способность.
Широкое распространение беспроводных сетей обусловлено простотой их
развертывания и доступа к интернет-ресурсам в местах большого скопления людей. Протокол, обеспечивающий работоспособность беспроводных ЛВС в распределенном режиме доступа (DCF) [1, 2], использует механизм множественного доступа с контролем несущей и предотвращением коллизий (carrier sense
multiple access with collision avoidance, CSMA/CA) [2−4]. Данный механизм основан на том, что передающая станция проверяет, присутствует ли в среде сигнал
несущей и, прежде чем начать отправку кадра, ожидает освобождения «эфира».
Беспроводные станции стандарта 802.11, в отличие от проводных Ethernet, не способны обнаруживать коллизии в среде передачи данных [5]. В силу этого обнаружение коллизий и бесконфликтных передач протокольных блоков данных основано на механизме тайм-аутов и алгоритме положительной обратной связи. Цикл
передачи кадра данных от отправителя к получателю начинается с прослушивания отправителем среды для определения ее незанятости. По истечении межкадрового интервала запускается алгоритм случайной задержки для выбора номера
слота, в котором можно начать передачу данных. Номер слота равновероятно выбирается из промежутка [ 0, Sn − 1] , где S n – целочисленный размер конкурентного окна, измеренного в слотовых интервалах tc и определяемого соотношением
n,
n ≤ 10 − N 0 ;
Sn = 2 N0 + m , m =
Здесь N 0 – начальное значение, задаю10 − N 0 , n > 10 − N 0 .
щее ширину конкурентного окна при первой попытке отправителя передать данные, а n ≥ 0 – номер повторной передачи. Ширина конкурентного окна не может
превышать максимального значения Smax = 1024 , установленного стандартом
802.11 [2]. Номер выбранного слота присваивается значению таймера отсрочки
{
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ быстродействия беспроводной ЛВС
109
to , после чего начинают отсчитываться слотовые интервалы. В конце каждого
слотового интервала таймер отсрочки уменьшается на единицу, при этом прослушивается среда передачи данных. Как только фиксируется занятость среды, таймер отсрочки замораживается до тех пор, пока не освободится «эфир». После освобождения «эфира» таймер запускается со значения, зафиксированного непосредственно перед замораживанием. По истечении таймера отсрочки станцияотправитель начинает передачу кадра данных. По окончании передачи отправитель ждет положительную квитанцию в течение времени tout , по завершении которого считается, что состоялся конфликт и станции, попавшие в него, увеличивают значение n на единицу, а действия, направленные на передачу данных, повторяются. Ширина конкурентного окна удваивается с каждой попыткой передачи кадра данных, до тех пор, пока не достигнет максимального значения, а с каждой последующей попыткой отправки кадра ширина конкурентного окна остается
равной Smax . После успешной передачи кадра ширина окна принимает начальное
значение S0 . Таким образом, технология беспроводного доступа в силу невозможности обнаружения коллизии в среде передачи данных имеет три существенных отличия от случайного метода доступа, реализуемого в проводной среде. Вопервых, беспроводный метод передачи использует механизм положительной обратной связи. Во-вторых, в отличие от случайного метода доступа в проводных
сетях технология WiFi уже при первой передаче использует механизм случайной
отсрочки. И наконец, беспроводный протокол доступа использует механизм «замораживания» счетчика отсрочки при обнаружении факта занятости среды до истечения таймера случайной задержки.
1. Математическая модель беспроводной ЛВС
Проанализируем функционирование беспроводной локальной сети до первой
безошибочной передачи кадра и получения квитанции об успешной доставке данных. Предположим, что в беспроводной ЛВС имеется K станций-источников данных. Считаем, что все источники независимы, равноправны, всегда имеют кадры
данных для отправки, а все интервальные промежутки выражены в слотовых интервалах tc . Пусть все станции обмениваются кадрами одинакового размера. Тогда согласно последовательности протокольных действий элементарный цикл отправки
кадра получателю определится размером межкадрового промежутка tm , периодом
случайной отсрочки to , длительностью «заморозки» таймера случайной отсрочки
t z , временем передачи информационного кадра tk , а также величиной тайм-аута
ожидания положительной квитанции tout , которая складывается из короткого межкадрового промежутка и времени передачи положительной квитанции [2, 4]. Среднее время передачи кадра T ( K , N 0 ) складывается из взвешенной суммы средних
времен ожидания неудачных отправлений и успешную передачу [6]
T ( K , N0 ) = d +
∞
⎡
N −1
N =0 ⎣
n=0
⎤
∑ ⎢ Nd + ∑ t (n, K , N0 ) + τ( N , K , N0 )⎥ f ( N , K , N0 ) .
(1)
⎦
Здесь d = tm + tk + tout , t (n, K , N 0 ) и τ( N , K , N 0 ) – средние условные времена
до неудачной и успешной N-й повторной попытки отправить кадр абонентом,
а f ( N , K , N 0 ) – функция вероятности продолжительности конкуренции
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
110
П.А. Михеев, С.П. Сущенко
между абонентами за «эфир», которая определяется вероятностью успешной
передачи кадра на N-м повторном шаге P ( N , K , N 0 ) после N−1 неудач
π ( n, K , N 0 ) = 1 − P ( N , K , N 0 ) [6]:
N −1
f ( N , K , N 0 ) = P ( N , K , N 0 ) ∏ π ( n, K , N 0 ) .
(2)
n =0
Наряду со средним временем передачи кадра одним из основных показателей эффективности функционирования сети передачи данных является пропускная способность. Будем искать индивидуальное быстродействие, нормированное значение которого определится как отношение времени, необходимого на передачу
информационного кадра tk , к среднему времени передачи кадра T ( K , N 0 ) :
tk
.
(3)
T ( K , N0 )
Рассмотрим соперничество двух беспроводных станций (K = 2) локальной вычислительной сети. Обозначим соперничающие станции через А и В. Найдем вероятностно-временные характеристики (ВВХ) процесса передачи данных станцией А. Обозначим через pn (i ) вероятность выбора случайной отсрочки длительностью равной i слотовым интервалам на n-й повторной передаче станцией А, а через f n ( j ) – станцией В. Тогда условная вероятность возникновения конфликта на
n-й повторной передаче для станции A определится соотношением
π(n,2, N 0 ) =
C ( K , N0 ) =
S −1
i
⎧
n = 0;
∑ i=00 p0 (i)∑ j=0 f0 ( j ) Li− j ,
⎪
=⎨ n
Sk −1
i
Sn −1
S k −1
⎪⎩∑ k =1 Ek (n) ⎣⎡∑ i=0 pn (i )∑ j =0 f k ( j ) Li− j + ∑ i=S pn (i )∑ j=0 f k ( j ) Li− j ⎦⎤ , n ≥1.
k
(4)
Здесь Lk – рекуррентные вероятности движения станции В «снизу» к конфликтному слотовому интервалу i, выбранному станцией А, за множество шагов с успешными передачами:
⎧⎪ ∑ ∞ f 0i (0)∑ k f 0 (i ) Lk −i , k = 1, S0 − 1, L0 = 1;
i =1
(5)
Lk = ⎨ ∞i =0
S0 −1
i
k = S0 , Sn − 1.
⎪⎩∑ i = 0 f 0 (0)∑ i =1 f 0 (i ) Lk −i ,
Отсюда нетрудно видеть, что конкурирующая станция В перед конфликтом
с соперником А может выполнить неограниченное количество успешных передач
при «выпадении» случайной отсрочки нулевой длительности. Используя соотношения для арифметико-геометрической прогрессии [7] для Lk при k = 1, S0 − 1 ,
k
получаем окончательное соотношение Lk = S0 k −1 ( S0 − 1) , k = 1, S0 − 1 . Подставляя данный результат в (4), находим вероятность конфликта на первой попытке передачи кадра данных:
S
S0 − 1 ⎡⎛ S0 ⎞ 0 ⎤
π(0, 2, N 0 ) =
(6)
⎢⎜
⎟ − 1⎥ .
S02 ⎢⎣⎝ S0 − 1 ⎠
⎥⎦
Коэффициенты Ek (n) в соотношении (4) являются вероятностями того, что на n-й
повторной передаче станцией А, станция В будет находиться в состоянии k-й повторной передачи:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ быстродействия беспроводной ЛВС
111
Sn −1 −1
Sk −1
i −1
⎧ n −1 Ek (n − 1) ⎡ Sk −1
⎤
⎪∑
⎢ ∑ pn −1 (i ) ∑ f k ( j ) Li − j + ∑ pn −1 (i ) ∑ f k ( j ) Li − j ⎥ ,
⎥⎦
⎪ k =1 π(n − 1, 2, N 0 ) ⎢⎣ i =1
j =0
i = Sk
j =0
⎪
Ek (n) = ⎨n ≥ 2, k = 1, E1 (1) = 1;
⎪
Sk −1 −1
⎪ Ek −1 (n − 1)
pn −1 (i ) f k −1 (i ), n ≥ 2, k = 2, n.
⎪⎩ π(n − 1, 2, N 0 ) ∑
i =0
Средние условные времена до неудачной и успешной n-й попытки передачи
данных t ( N , K , N 0 ) и τ( N , K , N 0 ) складываются из средней длительности
случайной отсрочки N s (n) (среднего количества слотов до начала передачи) и
среднего количества заморозок, обусловленных захватом «эфира» станцией В,
Z t (n, N 0 ) в случае неудачи и Z τ (n, N 0 ) в случае успеха соответственно:
t ( n, 2, N 0 ) = N s (n) + Z t (n, N 0 )d , τ ( n, 2, N 0 ) = N s (n) + Z τ (n, N 0 )d . Здесь
Sn − 1
,
(7)
2
а средние значения числа заморозок Z t (n, N 0 ) и Z τ (n, N 0 ) имеют схожий вид
S −1
N s (n) = ∑ i =n0 ipn (i ) =
Z t ( n, N 0 ) =
S0 −1
i−1
p0 (i ) j =0 f 0 ( j ) M i− j ,
i =1
i−1
S −1
f ( j ) M i− j + i=nS pn (i )
j =0 k
k
⎧
∑
⎪
=⎨ n
Sk −1
⎪⎩∑ k =1 Ek (n) ⎣⎡∑ i=1 pn (i )∑
∑
∑
n = 0;
∑
S k −1
f (
j =0 k
j ) M i− j ⎤ ,
⎦
(8)
n ≥1;
Z τ ( n, N 0 ) =
S −1
i−1
⎧
n = 0;
∑ i=01 p0 (i)∑ j=0 f0 ( j )Vi− j ,
⎪
=⎨ n
S k −1
i−1
Sn −1
S k −1
⎪⎩∑ k =1 Ek (n) ⎣⎡∑ i=1 pn (i )∑ j=0 f k ( j )Vi− j ++ ∑ i=S pn (i )∑ j=0 f k ( j )Vi− j ⎦⎤ , n ≥1.
k
(9)
Элементы M k и Vk являются показателями среднего числа заморозок таймера
отсрочки абонента А после выбора случайной задержки длительностью i на n-й
повторной передаче при выборе соперничающей станцией В j-го слота, предшествующего i-му:
⎧⎪ ∑ k f 0 (m)∑ ∞ ( i + 1 + M k − m ) f 0i (0), k = 1, S0 − 1, M 0 = 0;
i =0
M k = ⎨ Sm =−11
∞
i
0
k = S0 , Sn − 1;
⎪⎩∑ m =1 f 0 (m)∑ i =0 ( i + 1 + M k − m ) f 0 (0),
(10)
⎧⎪∑ ∞ (i +1) f 0i (0)∑ S0 −1 f 0 (m) + ∑ k −1 f 0 (m)∑ ∞ (i +1+Vk −m ) f 0i (0), k =1, S0 −1;
m=k +1
m=1
i=0
Vk = ⎨ i=0
(11)
S0 −1
∞
i
+
+
f
m
i
V
f
k = S0 , Sn −1.
(
)
1
⎪⎩
∑ m=1 0 ∑ i=0(
k −m ) 0 (0),
При подстановке сюда вероятностей выпадения длительности отсрочки f 0 (m)
получаем следующие соотношения:
⎧ S ⎡⎛ S ⎞k ⎤
⎪ 0 ⎢⎜ 0 ⎟ −1⎥ , k =1, S0 −1;
⎪ S0 −1⎣⎢⎝ S0 −1⎠ ⎥⎦
Mk =⎨
S −1
⎪ S0 ∑ m0=1 M k −m
+
, k = S0 , Sn −1.
⎪
S0 −1
⎩S0 −1
⎧ S − 2⎛ S ⎞ k
k =1, S0 −1;
⎪ 0 ⎜ 0 ⎟ ,
⎪ S0 −1 ⎝ S0 −1⎠
Vk = ⎨
S0 −1
⎪ S0 ∑ m=1 Vk −m
, k = S0 , Sn −1.
+
⎪
S0 −1
⎩S0 −1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
П.А. Михеев, С.П. Сущенко
112
Показатель общей пропускной способности можно найти по аналогии с индивидуальным быстродействием (3), при этом в числителе указанного соотношения
нужно учесть не только успешно переданный пакет станцией А, но и среднее количество переданных пакетов станцией В за рассматриваемый период:
(G ( N 0 ) + 1)tk
Cобщ (2, N 0 ) =
,
T (2, N 0 )
где G ( N 0 ) определится взвешенной суммой среднего количества заморозок таймера отсрочки станции А в ожидании неудачных и успешной передачи, которые
определяются соотношениями (8) и (9):
∞
N −1
G ( N 0 ) = ∑ N = 0 ⎡ ∑ n =0 Z t (n, N 0 ) +Z τ ( N , N 0 ) ⎤ f ( N , 2, N 0 ) .
⎣
⎦
Численные исследования среднего времени передачи кадра абонентом А показывают, что функция (1) имеет ярко выраженный минимум по координате N 0 ,
определяющей начальный размер конкурентного окна и, как следствие, степень
рассеяния станций по длительностям отсрочки перед началом процедуры соперничества. Для двух соперничающих станций минимум достигается при N 0 = 4 .
Очевидно, что значение N 0 , минимизирующее среднее время передачи кадра,
максимизирует индивидуальную пропускную способность (рис. 1). Кроме того,
уже на этапе формализации задачи стала очевидной возможность захвата среды
передачи данных одним из абонентов, о котором упоминается в [5]. Особенно
сильно этот эффект проявляется при малых значениях N 0 . В результате эффекта
захвата среды передачи данных наблюдаются дискриминационные индивидуальные показатели при высоком уровне общей пропускной способности сети (рис. 1).
Уже при первой попытке соперничества двух станций возможен захват среды передачи данных (например, станцией В), вероятность которого определится вероятностями того, что у одной из станций (В) длительность отсрочки окажется
меньше длительности отсрочки другой станции (А), а затем у «успешной» станции (В) будет выпадать отсрочка нулевой длительности, чередуясь с отсрочками
меньшими, чем остаточное значение таймера отсрочки станции (А):
Pz (0, 2, N 0 ) =
S0 −1
∑
i =1
∞
p0 ( i )Li −1 ∑ f 0k ( 0 ) =
k =1
1 ⎛ S0 ⎞
⎜
⎟
S02 ⎝ S0 − 1 ⎠
S0 −1
.
Отсюда нетрудно видеть, что вероятность захвата в значительной мере определяется начальной шириной конкурентного окна S0 (рис. 2). После нескольких
конфликтов возможность захвата для «успешной» станции становится еще более
вероятной.
Основной причиной эффекта захвата среды передачи данных является протокольное действие «замораживание отсрочки», поскольку именно оно приводит к
тому, что после бесконфликтной передачи станция может неопределенно долго
захватывать среду передачи данных, попадая в интервал отсрочки от 0 до остаточного значения отсрочки других станций. Другой причиной повышения вероятности захвата среды передачи данных после нескольких конфликтов одним из
абонентов являются различные размеры конкурентного окна для станций,
вышедших из конфликта, и станций, продолжающих разрешение конфликта в
состоянии ожидания истечения времени отсрочки и периодов заморозки.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ быстродействия беспроводной ЛВС
113
Рис. 1. Зависимость индивидуального быстродействия и общей пропускной способности
от степени начальной ширины конкурентного окна
Рис. 2. Зависимость вероятности захвата среды передачи данных станцией В
на первой попытке передать данные от степени начальной ширины конкурентного окна
После положительного разрешения конфликта одной из станций после n-й повторной передачи (или несколькими станциями) размер ее конкурентного окна
кратно сокращается до начального значения S0 < Sn , что дает этой станции преимущественное право при дальнейшем соперничестве за «эфир» с «конфликтующими» станциями, поскольку меньшая длительность случайной отсрочки для такой станции имеет существенно большую вероятность по сравнению с аналогичным операционным показателем «конфликтующей» станции. Очевидно, что для
снижения вероятности эффекта захвата «эфира» на неопределенно долгое время
можно предложить, с одной стороны, фиксацию размера конкурентного окна для
первой и всех последующих передач, а с другой – выбор длительности случайной
отсрочки to на интервале от 1 до 2 N − 1 слотовых периодов tc (исключение отсрочки нулевого размера). При этом захват «эфира» одной станцией никогда не
превысит 2 N − 2 успешных передач до очередного конфликта или его разрешения. Рассмотрим предложенные меры модификации процедуры доступа к среде
передачи данных для профилактики «эффекта захвата эфира».
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
114
П.А. Михеев, С.П. Сущенко
2. Профилактика эффекта захвата среды передачи данных
Процедура доступа без нулевой отсрочки
Начнем рассмотрение способов предупреждения захвата среды с метода, основанного на сужении области значений случайной отсрочки. Будем считать, что
станции беспроводной сети передачи данных в процессе соперничества за эфир
осуществляют выборку случайной задержки из промежутка 1, Sn − 1 слотовых интервалов. В этом случае исключается возможность выбора задержки нулевой длины и ни одна из станций не сможет бесконечное число раз захватывать среду передачи данных. Назовем этот вариант предупреждения эффекта захвата модифицированным методом доступа к среде передачи данных. Тогда условная вероятность (4) преобразуются к виду
π(n,2, N 0 ) =
1
S
−
1
⎧
n = 0; (12)
∑ i=01 p0 (i) Li = S −1⎡⎣(S0 (S0 −1))S0 −1 −1⎤⎦ ,
⎪
0
=⎨
⎪∑ n E (n) ⎡∑ Sk −1 p (i )∑ i f ( j ) L + ∑ Sn −1 p (i )∑ Sk −1 f ( j ) L ⎤ , n ≥1.
i− j
i− j ⎦
j =1 k
i =Sk n
j =1 k
⎩ k =1 k ⎣ i=1 n
Здесь Lk определяются отличным от (5) соотношением
⎧⎪ ∑ k f 0 (i ) Lk −i , k = 1, S0 − 1, L0 = 1,
Lk = ⎨ Si =−11
k = S0 , Sn − 1.
⎪⎩∑ i =01 f 0 (i ) Lk −i ,
Определение элементов Ek (n) также отличается от исходного для базового протокола доступа:
S n −1 −1
Sk −1
i −1
⎧ n −1 Ek (n − 1) ⎡ Sk −1
⎤
⎪∑
⎢ ∑ pn −1 (i )∑ f k ( j ) Li − j + ∑ pn −1 (i ) ∑ f k ( j ) Li − j ⎥ ,
⎥⎦
⎪ k =1 π(n − 1, 2, N 0 ) ⎢⎣ i =1
j =1
i = Sk
j =1
⎪⎪n ≥ 2, k = 1, E (1) = 1;
1
Ek ( n ) = ⎨
⎪
⎪ E (n − 1) Sk −1 −1
⎪ k −1
∑ pn−1 (i) f k −1 (i), n ≥ 2, k = 2, n.
⎪⎩ π(n − 1, 2, N 0 ) i =1
Средняя длительность отсрочки до начала передачи (7) в этом случае преобразуется:
S
S −1
N s (n) = 1 + ∑ i =n1 ipn (i ) = n + 1 .
(13)
2
Элементы Z t (n, N 0 ) и Z τ (n, N 0 ) отличаются от исходных (8) и (9) тем, что суммирование по всем индексам выполняется не от нуля, а от единицы, а входящие в
них элементы M k и Vk имеют вид
⎧ k
⎪ ∑ f 0 (i ) (1 + M k −i ) , k = 1, S0 − 1, M 0 = 0;
⎪
M k = ⎨ Si =−11
0
⎪
f 0 (i ) (1 + M k −i ) ,
k = S0 , Sn − 1;
∑
⎪⎩
i =1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ быстродействия беспроводной ЛВС
115
k −1
⎧ S0 −1
⎪ ∑ f 0 (i ) + ∑ f 0 (i ) (1 + Vk −i ) , k = 1, S0 − 1;
⎪
Vk = ⎨i = k +1 S −1 i =1
0
⎪
k = S0 , Sn − 1.
∑ f0 (i) (1 + Vk −i ) ,
⎪
⎩
i =1
При подстановке соответствующих вероятностей выпадения того или иного слота
данные соотношения преобразуются:
⎧ ⎛ S ⎞k
k = 1, S0 − 1;
⎪ ⎜ 0 ⎟ − 1,
⎪ ⎝ S0 − 1 ⎠
Mk = ⎨
S0 −1
⎪ ∑ i =1 M k −i
, k = S0 , Sn − 1;
⎪1 +
S0 − 1
⎩
⎧ S − 2 ⎛ S ⎞ k −1
0
⎪ 0
⎜
⎟ , k = 1, S0 − 1;
−
S
1
S
⎪ 0
⎝ 0 −1 ⎠
Vk = ⎨
S0 −1
Vk −i
⎪
∑
i =1
,
k = S0 , Sn − 1.
⎪ 1+
S0 − 1
⎩
Процедура доступа c фиксированным размером
конкурентного окна
В случае фиксированной ширины конкурентного окна, ВВХ процедуры доступа будут одинаковы для каждой попытки передачи данных станциями А и В. Тогда условная вероятность возникновения конфликта на n-й повторной передаче
для станции A определится соотношением (6), а так как вероятность успешной
передачи данных является обратной к вероятности неуспеха
P (n, 2, N 0 ) = 1 − π(n, 2, N 0 ) ,
то функция вероятности (2) принимает вид
N
⎛ S − 1 ⎡ ⎛ S ⎞ S0 ⎤ ⎞ ⎛ S 2 + S − 1 S − 1 ⎛ S ⎞ S0 ⎞
f ( N , 2, N 0 ) = ⎜ 0 2 ⎢⎜ 0 ⎟ − 1⎥ ⎟ ⎜ 0 20
− 0 2 ⎜ 0 ⎟ ⎟ . (14)
⎜ S ⎢⎝ S0 − 1 ⎠
⎟
⎜
S
S0 ⎝ S0 − 1 ⎠ ⎠⎟
0
⎝ 0 ⎣
⎦⎥ ⎠ ⎝
Используя соотношения (10) и (11) получаем среднее количество заморозок до
конфликтной ( Z t (n, N 0 ) ) и успешной ( Z τ (n, N 0 ) ) передач.
⎛ S ⎞
Z t (n, N 0 ) = ⎜ 0 ⎟
⎝ S0 − 1 ⎠
S − 2 ⎛ S0 ⎞
Z τ (n, N 0 ) = 0
⎜
⎟
S 0 − 1 ⎝ S0 − 1 ⎠
S0
−
S0
3
− ;
S0 − 1 2
S0 −1
−
S 0 − 2 S0 − 2
−
.
S0 − 1
S0
Тогда с использованием соотношения (7) среднее условное время до неудачной и
успешной n-й попыток передачи данных окончательно принимает вид
t (n, 2, N 0 ) =
τ(n, 2, N 0 ) =
⎡ ⎛ S ⎞ S0 5 S − 3 ⎤
S0 − 1
0
+ d ⎢⎜ 0 ⎟ −
⎥,
2
2( S0 − 1) ⎥⎦
⎢⎣⎝ S0 − 1 ⎠
⎛ S − 2 ⎡⎛ S ⎞ S0 −1 ⎤ S − 2 ⎞
S0 − 1
0
⎟.
+d⎜ 0
− 1⎥ − 0
⎢
⎜ S0 − 1 ⎢⎜⎝ S0 − 1 ⎟⎠
2
S0 ⎠⎟
⎝
⎣
⎦⎥
Поскольку данные соотношения не зависят от номера повторной передачи, то с
учетом (14) находим среднее время передачи кадра (1) станцией А:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
П.А. Михеев, С.П. Сущенко
116
T ( 2, N 0 ) =
⎛ S − 2 ⎡⎛ S ⎞ S0 −1 ⎤ 2
S0 − 1
0
+d⎜ 0
− 1⎥ +
⎢
⎜ S0 − 1 ⎢⎜⎝ S0 − 1 ⎟⎠
2
⎥⎦ S0
⎝
⎣
⎧⎪ S − 1
⎡ ⎛ S ⎞ S0
+⎨ 0
+ d ⎢⎜ 0 ⎟
⎩⎪ 2
⎣⎢⎝ S0 − 1 ⎠
⎞
⎟+
⎟
⎠
( S0 − 1) ⎡⎣( S0 ( S0 − 1) )S0 − 1⎤⎦
S0
1 ⎤⎫⎪
.
−
− ⎥⎬
S
S0 − 1 2 ⎦⎭
⎥ ⎪ S02 + S0 − 1 − ( S0 − 1) [ S0 ( S0 − 1)] 0
Процедура доступа c фиксированным окном
без нулевой отсрочки
Для процедуры профилактики эффекта захвата, основанной на фиксированной
ширине конкурентного окна и исключении случайной отсрочки нулевой длительности, ВВХ системы связи будут инвариантны к номеру повторной передачи. Тогда с учетом (12) для функции вероятности продолжительности соперничества (2)
получаем
N
S −1
⎛ 1 ⎡⎛ S ⎞ S0 −1 ⎤ ⎞ ⎛ S
⎞
S0 0
f ( N , 2, N 0 ) = ⎜
(15)
− 1⎥ ⎟ ⎜ 0 −
⎢⎜ 0 ⎟
⎟.
S
⎜
⎜
⎟
0 ⎟
⎝ S0 − 1 ⎣⎢⎝ S0 − 1 ⎠
⎦⎥ ⎠ ⎝ S0 − 1 ( S0 − 1) ⎠
Используя соотношения (10) и (11) с учетом отсутствия нулевой отсрочки, получаем среднее количество заморозок до конфликтной ( Z t (n, N 0 ) ) и успешной
( Z τ (n, N 0 ) ) передач:
S −1
⎤
5S0 − 2
S 0 − 2 ⎡⎛ S 0 ⎞ 0
−
− 2⎥ .
, Z τ (n, N 0 ) =
⎢⎜
⎟
2 ( S0 − 1)
S0 − 1 ⎢⎣⎝ S0 − 1 ⎠
⎥⎦
С учетом соотношения (13) окончательный вид средних условных времен до неудачной и успешной n-й попыток передачи данных преобразуется к виду
⎛ S ⎞
Z t (n, N 0 ) = ⎜ 0 ⎟
⎝ S0 − 1 ⎠
S0
⎡⎛ S ⎞ S0
S0
5S0 − 2 ⎤
+ 1 + d ⎢⎜ 0 ⎟ −
t (n, 2, N 0 ) =
⎥,
2
2 ( S0 − 1) ⎥⎦
⎢⎣⎝ S0 − 1 ⎠
S −1
⎤
S0
S − 2 ⎡⎛ S0 ⎞ 0
+1+ d 0
− 2⎥ .
⎢⎜
⎟
2
S0 − 1 ⎢⎣⎝ S0 − 1 ⎠
⎥⎦
Используя данные соотношения и выражение (15), находим среднее время передачи кадра (1) станцией А:
τ(n, 2, N 0 ) =
T ( 2, N 0 ) =
⎛ S − 2 ⎛ S ⎞ S0 −1 S − 3 ⎞
S0
0
⎟+
+1+ d ⎜ 0
− 0
⎜ S0 − 1 ⎜⎝ S0 − 1 ⎟⎠
2
S0 − 1 ⎟⎠
⎝
S −1
⎧⎪ S
⎡ ⎛ S ⎞ S0
3S0 ⎤⎫⎪ [ S0 ( S0 − 1)] 0 − 1
0
+ ⎨ + 1 + d ⎢⎜ 0 ⎟ −
.
⎥⎬
S −1
2 ( S0 − 1) ⎦⎭
⎥ ⎪ S0 − [ S0 ( S0 − 1)] 0
⎪⎩ 2
⎣⎢⎝ S0 − 1 ⎠
Отметим, что данную модификацию метода доступа к среде передачи данных
следует использовать при N 0 ≥ 2 , так как для N 0 = 1 станции всегда будут попадать в конфликт.
На рис. 3 представлены сравнительные кривые среднего времени передачи
кадра абонентом в сети из двух станций для всех рассмотренных методов доступа
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ быстродействия беспроводной ЛВС
117
Рис. 3. Сравнительные кривые среднего времени передачи
кадра для базового (БМ) и модифицированного (ММ) методов
соперничества, а также для случаев с фиксированной шириной конкурентного окна – (БМФО) и (ММФО)
к среде передачи данных. Из рисунка видно, что в сети из двух станций при 100 %-й
загрузке базовый метод доступа к среде передачи данных с фиксированной шириной конкурентного окна является предпочтительным в сравнении с тремя другими способами борьбы за «эфир». С одной стороны, этот метод обеспечивает
меньшее, чем у базового и модифицированного методов, время передачи кадра
данных при N 0 = 1, 4 , а с другой – не уступает ни одному из методов на всем
отрезке допустимых значений начальной степени ширины конкурентного окна.
В целом, при N 0 = 5,10 различие между производительностью методов нивелируется.
Для анализа индексов быстродействия беспроводной ЛВС при произвольном
числе конкурирующих станций проведено имитационное моделирование логики
протокольных действий базового метода доступа к разделяемой среде передачи
данных и предложенных его модификаций для профилактики эффекта захвата На
рис. 4 для стандартного метода доступа к разделяемой среде показаны сравнительные кривые минимального ( Cmin ) и максимального ( Cmax ) индивидуальных
быстродействий конкурирующих станций, а также кривые общей пропускной
способности системы ( Cобщ ) как функции степени начальной ширины конкурентного окна. В семействе кривых общей пропускной способности представлена
также кривая, соответствующая аналитическому решению для сети с двумя активными станциями ( Cтеор ). Из представленных численных результатов видно,
что при малых значениях степени N 0 имеет место эффект захвата разделяемой
среды передачи данных одной из станций для любого количества соперничающих
абонентов беспроводной локальной сети. При этом благодаря захвату разделяемой среды какой-либо станцией и, как следствие, бесконфликтной передаче
большого количества пакетов наблюдаются хорошие показатели общей пропускной способности сети и большой дисбаланс по показателям индивидуального
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
118
П.А. Михеев, С.П. Сущенко
Рис. 4. Сравнительные кривые минимального и максимального
индивидуальных быстродействий, и общей пропускной способности для различного числа станций сети
Рис. 5. Сравнительные кривые общей пропускной способности
для базового (БМ) и модифицированного (ММ) методов доступа к
среде передачи данных, а также для случаев с фиксированной
шириной конкурентного окна – (БМФО) и (ММФО) при оптимальных N 0
быстродействия и среднего времени передачи кадра отдельных станций. С увеличением ширины конкурентного окна значения индивидуальных характеристик
станций выравниваются, причем наблюдается максимум общей пропускной способности по параметру степени начальной ширины конкурентного окна. С ростом
числа станций сети этот максимум смещается в сторону максимально возможного
размера конкурентного окна, и если для сети из двух станций как такового экстремума нет, то для большего числа активных абонентов максимум ярко выражен:
для трех станций – N 0 = 4 , для пяти – N 0 = 5 , для десяти – N 0 = 6 , а для двадцати – N 0 = 7 . При таких начальных параметрах имеет место снижение коллизион-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ быстродействия беспроводной ЛВС
119
ных передач и выравнивание индивидуальных показателей станций на фоне пика
общей пропускной способности беспроводной сети. Кроме того, для малых N 0
значение общей пропускной способности выше для сети с малым числом станций,
а с увеличением ширины окна имеет место обратная зависимость – чем больше
станций, тем выше общая пропускная способность. Сопоставление результатов
аналитического и имитационного моделирования сети из двух станций показывает, что значения общей пропускной способности для различных размеров N 0 отличается менее чем на 4 %. На рис. 5 представлены сравнительные кривые пропущенного потока для различных модификаций метода доступа к среде передачи
данных от количества активных станций сети при оптимальном значении ширины
конкурентного окна.
Заключение
Проведенный анализ направлен на исследование операционных характеристик
метода случайного множественного доступа с контролем несущей и предотвращением коллизий. Получены аналитические соотношения для вероятностновременных характеристик процесса соперничества двух станций. Обнаружены
«эффект захвата эфира» и экстремальная зависимость операционных характеристик от начального размера конкурентного окна. Предложены параметрические
изменения в протокольную процедуру соперничества, обеспечивающие предупреждение эффекта захвата при сохранении высоких значений индивидуальных и
интегрального индексов быстродействия. Показано, что оптимальная начальная
ширина конкурентного окна ( S0 ) определяется активным размером сети (количеством соперничающих станций) и обеспечивает близкое к равномерному распределение совместно используемого ресурса времени «эфира» между конкурирующими абонентами. Исследование мер профилактики эффекта захвата среды передачи данных в локальной сети, включающей до 20 соперничающих абонентов на
имитационной модели, показало эффективность предложенных изменений параметров протокольной процедуры соперничества. Показано также, что для нетривиального размера активной сети K ≥ 6 наиболее эффективной мерой профилактики эффекта захвата является модифицированный метод, исключающий отсрочку нулевого размера и обеспечивающий минимальное снижение общей пропускной способности.
ЛИТЕРАТУРА
1. Олифер В.Г., Олифер Н.А. Компьютерные сети. СПб: Питер, 2006. 958 с.
2. IEEE Std 802.11–2007, Revision of IEEE Std 802.11–1999. Part 11: Wireless LAN Medium
Access Control (MAC) and Physical Layer (PHY) Specifications. IEEE Computer Society,
2007. 1184 p.
3. Гейер Д. Беспроводные сети. Первый шаг. М.: Вильямс, 2005. 192 с.
4. Roshan P., Leary J. 802.11 Wireless LAN Fundamentals. Cisco Press, 2004. 312 p.
5. Вишневский В.М. и др. Широкополосные беспроводные сети передачи информации. М.:
Техносфера, 2005. 592 с.
6. Сущенко С.П., Кустов Н.Т. О пропускной способности метода случайного множественного доступа // Автоматика и телемеханика. 2001. № 1. С. 91–102.
7. Прудников А.П., Брычков Ю.П., Маричев О.И. Интегралы и ряды: Элементарные функции. М.: Наука, 1981. 800 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
120
П.А. Михеев, С.П. Сущенко
8. Рыжиков Ю.И. Имитационное моделирование: Теория и технологии. М.: Альтекс-А,
2004. 380 с.
9. Кельтон В., Лоу А. Имитационное моделирование. Классика CS. 3-е изд. СПб.: Питер,
2004. 847 с.
Михеев Павел Андреевич
Сущенко Сергей Петрович
Томский государственный университет
E-mail: doka-patrick@mail.ru; ssp@inf.tsu.ru
Поступила в редакцию 2июня 2012 г.
Mikheev Pavel A., Sushchenko Sergey P. (Tomsk State University). Wireless LAN performance
analysis.
Keywords: wireless networks, contention, contention window, a random delay timer, positive acknowledgment, contention time, the effect of carrier capture, throughput.
A mathematical model of access method “carrier sense multiple access with collision avoidance” for active stations is proposed. The effect of carrier capture and unimodal dependence of
the operating characteristics from the initial width of the contention window is detected. Measures
of preventing the effect of carrier capture, based on the modifications of the standard protocol are
proposed. The first measure is based on request of contention window, which is fixed for all retransmission, the second – on zero random delay exception and the third – on first and second
composite. The simulation model of the wireless network is developed to investigate the effect of
carrier capture with a large number of stations. The effectiveness of the proposed measures of
preventing the effect of carrier capture is shown. It is established that zero random delay exception is the best of measures for nontrivial active stations number.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
УДК 004.652.8
А.М. Бабанов, А.С. Скачкова
СИНОНИМИЯ В ERM-МОДЕЛИ И ПРОБЛЕМЫ ОБЕСПЕЧЕНИЯ
НЕПРОТИВОРЕЧИВОСТИ И ПОПОЛНЕНИЯ ERM-СХЕМ
В статье выявляются истоки синонимии в ERM-схемах, формулируются
возникающие при этом проблемы обеспечения их непротиворечивости и пополнения, а также предлагаются способы их решения.
Ключевые слова: семантическая модель данных, ERM-модель, ERM-схема,
синонимия, непротиворечивость схемы, пополнение схемы.
В подавляющем большинстве моделей данных каждое типичное явление моделируемого мира представлено в схеме БД лишь однажды, либо в виде структурного элемента, либо в виде ограничения целостности. В таком случае человек
сам должен заботиться о корректности и полноте описания предметной области
(ПрО). Модель «Сущность – Связь – Отображение» или, сокращённо, ERMмодель (от английского «Entity – Relationship – Mapping») [1] позволяет проектировщику схемы работать с одними и теми же фактами ПрО на разных уровнях детализации и в разных представлениях. Подобный подход даёт возможность проектировщику не следовать жёстким требованиям модели, используя единственно
возможные формы данных и самостоятельно контролируя правильность своих
действий. Вместо этого он может фиксировать все представляющие интерес понятия, взаимосвязи между ними и закономерности этих взаимосвязей в подходящий
момент в любой удобной для него форме, не задумываясь о возможной противоречивости и неполноте получающейся схемы.
Это приводит к тому, что в модели одному и тому же явлению ПрО могут соответствовать различные формы и, часто, некоторые из них могут присутствовать
в ERM-схеме одновременно. Такое положение дел неизбежно влечет за собой необходимость решения проблемы, касающейся обеспечения непротиворечивости
различных форм выражения в схеме одного и того же явления ПрО. Второй проблемой, сопутствующей синонимии, является редукция ERM-схемы – доведение
её до базовых понятий модели, необходимых для автоматической генерации
СУБД-ориентированной схемы БД. Подобная «нормализация» схемы позволяет
минимизировать набор правил её трансляции на язык СУБД.
1. Базовые и производные понятия ERM-модели и ТСЗО
Поскольку ERM-модель является преемницей модели «Сущность – Связь» (ERмодели) [2], её язык сохраняет все традиционные понятия модели Чена – множество
сущностей, множество связей, роль, атрибут, множество значений. Однако в ERMмодели эти структурные понятия не играют роли базовых концепций.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
122
А.М. Бабанов, А.С. Скачкова
Таковыми в ней являются новые понятия «класс» и «отображение», которые
существенно расширяют выразительные возможности модели по сравнению с ERмоделью. Они также обеспечивают должный уровень абстракции, доведённой в
теории семантически значимых отображений (ТСЗО) до формальной системы
[3−5]. К тому же, базовые концепции ERM-модели фигурируют в правилах
трансформации схем в СУБД-ориентированные модели данных.
Привычные же понятия ER-модели являются в ERM-модели производными от
базовых понятий, своеобразными их специализациями. Они обеспечивают более
понятные человеку формы восприятия данных. Подобный подход позволяет проектировщику оперировать в основном знакомыми понятиями, прибегая к использованию новых форм лишь в случае недостаточной выразительности первых.
Возможны ситуации, когда при проектировании ERM-схемы используются только правила структуризации и задания ограничений целостности, целиком принадлежащие ER-модели, а новые возможности явно не применяются.
Чтобы пояснить образование базовых и производных понятий ERM-модели,
для начала сформулируем семантические концепции ERM-моделирования. Для
этого воспользуемся результатами, полученными логиками в ходе анализа естественных языков.
Моделируемый мир могут составлять объекты любого вида (как эмпирические, так и теоретические). Основной информационной (мыслительной) единицей
представления ПрО в голове человека является суждение, которое может быть
выражено в языковой форме – высказывании. Главную роль играют единичные
атрибутивные суждения и единичные суждения об отношениях, утверждающие
наличие у конкретного объекта определенного свойства, характеристики или отношения к другим объектам.
Характерным для единичных суждений является использование в качестве логических подлежащих их высказываний единичных имен, предметными значениями которых являются отдельные предметы или объекты. Таким образом, имеем одну из основных семантических концепций ERM-модели – объект. Совокупность объектов, соответствующих одному определённому понятию, образует
класс объектов.
Логическое сказуемое в единичных атрибутивных высказываниях может быть
задано с использованием одиночного общего имени, предикатора или предметного функтора либо более сложного логического выражения, включающего эти знаки и логические термины. Все указанные семантические категории могут быть
выражены через предметные функции. Последние представляют вторую основную семантическую концепцию ERM-модели, которую мы будем называть более
подходящим термином «отображение». Он, во-первых, не несет математического, количественного смысла образов и прообразов, традиционного для понятия
«функция». Во-вторых, с функцией, как правило, ассоциируется требование единственности образа, чего нам также хотелось бы избежать. Каждый факт соответствия одному объекту одного другого объекта представляет экземпляр отображения.
Введённые базовые понятия ERM-модели – объект и экземпляр отображения
(для знаков), класс и отображение (для типов), обеспечивают всю выразительную
мощь модели. Однако человек не всегда использует этот обобщённый уровень
мышления и общения. Для простоты выделяются частные виды объектов, классов
и отображений, образующие множество производных понятий модели.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Синонимия в ERM-модели и проблемы обеспечения непротиворечивости
123
Объекты, мыслимые в высказываниях как предметы, представляют собой
сущности, а классы таких объектов есть не что иное, как множества сущностей.
Идеальные объекты, такие, как числа, даты, строки символов, являются значениями. Они не обладают свойствами, характеристиками и не вступают в отношения с другими объектами, кроме того, что являются значениями характеристик
этих объектов. Значения объединяют во множества значений по синтаксическим
особенностям. Объекты, соответствующие конкретным понятиям об n-ках предметов, представляют собой связи, а классы объектов, составляющих объемы таких понятий, есть не что иное, как множества связей. Каждый объект в n-ке связи играет определённую роль, характеризующую его функцию в этой связи.
Отображения, определяемые множествами связей, которые в качестве областей определения и значений имеют одиночные множества сущностей или их декартовы произведения, называются реляционными. Общее количество реляционных отображений, определяемых одним множеством связей степени n, равно
2n–2. Отображение, ставящее в соответствие объекту или связи истинностное значение, называется отображением-свойством. Если в качестве области значений в
отображении используется произвольное множество значений, такое отображение
будем называть отображением-характеристикой. Отображения-свойства представляют собой частный случай отображений-характеристик. Отображенияхарактеристики (в том числе и отображения-свойства) являются не чем иным, как
атрибутными отображениями, или просто атрибутами.
Таким образом, нам удалось связать фундаментальные понятия логики с основными структурными понятиями ER-модели, сохранив при этом базовые понятия – объект, класс и отображение. Все вместе они составляют понятийный базис
ERM-модели.
2. Графическая нотация ERM-модели
и примеры синонимии элементов ERM-схем
Для демонстрации синонимии в ERM-схеме воспользуемся наиболее наглядной формой её представления – графической ERM-диаграммой.
Поскольку ERM-модель является преемницей ER-модели, её графический
язык сохраняет многие традиционные конструкции нотаций Чена и Баркера, а
также вводит новые, специфические именно для модели «Сущность – Связь –
Отображение» графические элементы.
ERM-схема в графической нотации представляет собой граф. Часть типов
вершин и дуг этого графа и их представление в точности соответствует аналогам
ER-диаграммы Чена. Множества сущностей, множества связей и множества значений, как и ранее, обозначаются прямоугольниками, ромбами и овалами соответственно. Роль множества сущностей во множестве связей обозначается неориентированным ребром, соединяющим эти множества. При необходимости оно
помечается именем роли, а также числами, характеризующими тип множества
связей. Ориентированные дуги представляют атрибуты. Они выходят из вершины
множества сущностей или множества связей, входят в вершину множества значений и помечаются именами атрибутов.
Основное нововведение модели «Сущность – Связь – Отображение» – понятие
«отображение». Для его обозначения добавляется новый вид вершин графа –
стрелка. Имя отображения пишется внутри стрелки, под ним в скобках указываются количественные характеристики отображения (минимальное кардинальное
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.М. Бабанов, А.С. Скачкова
124
число, максимальное кардинальное число). Множества, составляющие область
определения отображения, соединяются ребрами с началом стрелки, а множества,
составляющие область значений отображения, – с концом стрелки. Рёбра помечаются именами ролей образов и прообразов.
Продемонстрируем синонимию в ERM-схемах на примере диаграмм предметной области, связанной с ближайшими родственниками. На рис. 1 показан фрагмент диаграммы множеств сущностей и множеств связей.
Рождение
M
Е
Мать
1
M
Е
Ребенок
M
Е
Отец
Человек
1
1
||
Мать
Отец
Рис. 1. Фрагмент диаграммы множеств сущностей и множеств связей
Для уточнения схемы можно создать диаграммы других видов. На рис. 2 показана диаграмма, демонстрирующая все реляционные отображения, определяемые
тернарным множеством связей РОЖДЕНИЕ.
Мать
Мать
Мать
Отец и ребенок
(1, М)
Ребенок родителей
(0, М)
Ребенок
Мать ребенка от отца
(0, 1)
Рождение
Отец ребенка от матери
(0, 1)
Отец
Отец
Отец
Человек
Ребенок
Родители ребенка
(1, 1)
Мать и ребенок
(1, М)
Рис. 2. Диаграмма реляционных отображений множества связей
Налицо синонимия элементов схемы: роли образов и прообразов реляционных
отображений дублируют роли сущностей во множестве связей (структурная си-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Синонимия в ERM-модели и проблемы обеспечения непротиворечивости
125
нонимия), максимальные кардинальные числа отображений совпадают с соответствующими пометками на рёбрах ролей множества связей, пометки «Е» на этих
рёбрах говорят о ненулевом минимальном кардинальном числе реляционных отображений (синонимия ограничений целостности).
3. Проблема обеспечения непротиворечивости
и задача пополнения ERM-схем
Особенности языка ERM-модели и сформулированные ранее принципы построения ERM-диаграмм, ориентированные на удобство для проектировщика,
влекут за собой возможность синонимии и создания некорректной схемы за счёт
задания противоречивых свойств элементам-синонимам. Поэтому ТСЗО должна
обеспечить соответствующие проверки на непротиворечивость схем.
Первая группа проверок порождена метасхемой модели и не требует доказательства, поскольку сама структура схемы гарантирует невозможность противоречий. Примером может служить требование, чтобы каждую роль независимо от
того, является ли она ролью множества связей или ролью отображения, всегда играл один и только один класс.
Вторая группа проверок порождается гипотезами и теоремами формальной
системы, которые были сформулированы в процессе непрекращающегося анализа
закономерностей во взаимоотношениях между понятиями модели. Именно эта
группа правил проверки позволяет обеспечить корректность модели при всём
многообразии её элементов и их синонимии.
Кроме правил обеспечения корректности схемы ТСЗО должна предоставить
правила автоматической редукции схемы, предусматривающие построение соответствующих базовых элементов (отображений) из явно указанных человеком
производных элементов (множеств связей, атрибутов).
Правила пополнения схемы необходимы по двум причинам. Во-первых, отображения, полученные автоматически из множеств связей, открывают перед проектировщиком дополнительные возможности для совершенствования схемы, в
частности, для более полного выражения особенностей и законов ПрО. А, вовторых, правила генерации СУБД-ориентированных схем строятся с использованием именно базовых элементов ERM-схемы. Поэтому необходимо хотя бы к моменту генерации получить базовые элементы из всех производных элементов.
4. Теоретическая основа проверок ERM-схем на непротиворечивость
Обсудим подробнее проверки, основанные на гипотезах и теоремах формальной системы ERM-модели. Новые гипотезы и теоремы строятся на основе аксиом
и ранее доказанных теорем формальной системы ТСЗО. В статьях [3, 4] предложены первоначальные варианты формальной системы, а в [5] приведена её последняя версия и методика доказательства новых теорем.
К настоящему моменту исследователями ERM-модели накоплен значительный
банк гипотез ТСЗО, ожидающих своего доказательства. Одним из источников
этих гипотез является непрекращающийся анализ закономерностей во взаимоотношениях между понятиями ERM-модели и ТСЗО. Другим важным источником
гипотез является теория реляционных БД, теоремы которой часто отражают такие
закономерности данных, которые можно выразить в терминах ТСЗО.
Одним из важнейших понятий реляционной модели является понятие функциональной зависимости (ФЗ). Оно играет основную роль в процессе нормализа-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
126
А.М. Бабанов, А.С. Скачкова
ции отношений, определяет важный класс ограничений целостности. Кроме того,
выводимость одних и тех же ФЗ из имеющихся в схеме – важное условие эквивалентности двух схем. Предварительным шагом классической методики декомпозиции отношений является построение минимального покрытия ФЗ.
Во всех этих случаях используются аксиомы Армстронга, определяющие
взаимоотношения между ФЗ. Для удобства также используются три правила, являющиеся следствием этих аксиом. В ERM-модели есть понятие, очень близкое
понятию «функциональная зависимость», – «функциональное отображение». Взаимно-однозначное соответствие этих понятий позволяет получать гипотезы и теоремы ТСЗО на основе аксиом Армстронга и правил вывода ФЗ.
Аксиома пополнения. Пусть A, B и C являются произвольными подмножествами множества атрибутов отношения R. Тогда, если имеется ФЗ A -> B, то справедливы ФЗ A, C -> B, C и A, C -> B.
Гипотеза пополнения. Пусть имеем функциональное отображение A -> B, где
ООО (A) и ОЗО (B) составляют произвольные совокупности классов. Тогда, если
некоторое другое отображение включает в ООО и ОЗО те же совокупности классов (A и B соответственно) и справедливо хотя бы одно из двух высказываний:
1) в ООО и ОЗО этого отображения кроме упомянутых A и B одновременно
входит только одна и та же совокупность классов C;
2) ОЗО этого отображения состоит только из B, а ООО кроме A может включать в себя дополнительные классы,
то это отображение функционально.
Аксиома транзитивности. Пусть A, B и C являются произвольными подмножествами множества атрибутов отношения R. Тогда, если имеются ФЗ A -> B и B
-> C, то справедлива ФЗ A -> C.
Гипотеза транзитивности. Композиция двух функциональных отображений
функциональна.
Правило декомпозиции. Пусть A, B и C являются произвольными подмножествами множества атрибутов отношения R. Тогда, если имеется ФЗ A -> B, C, то
справедливы ФЗ A -> B и A -> C.
Теорема декомпозиции. Если отображение со сложным образом функционально, функциональны и все его проекции на любые роли образов и их совокупности.
Правило объединения. Пусть A, B и C являются произвольными подмножествами множества атрибутов отношения R. Тогда, если имеются ФЗ A -> B и A -> С,
то справедлива ФЗ A -> B, C.
Теорема объединения. Агрегат двух функциональных отображений функционален.
Правило псевдотранзитивности. Пусть A, B, C и D являются произвольными
подмножествами множества атрибутов отношения R. Тогда, если имеются ФЗ
A -> B и B, C ->D, то справедлива ФЗ A, C -> D.
Гипотеза псевдотранзитивности. Пусть имеем функциональное отображение
A -> B, где ООО (A) и ОЗО (B) составляют произвольные совокупности классов.
Есть также функциональное отображение, ООО которого полностью включает
ОЗО первого (B) и дополнительно некоторую совокупность классов C. Тогда отображение, ООО которого состоит из ООО первого (A) и дополнения ООО второго
(C), а ОЗО совпадает с ОЗО второго отображения, функционально.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Синонимия в ERM-модели и проблемы обеспечения непротиворечивости
127
Кроме приведенных выше гипотез и теорем, навеянных теорией реляционных
БД, есть ряд гипотез и теорем собственно ТСЗО, также касающихся функциональных отображений.
Гипотеза о функциональности проекций. Если проекции отображения на
все роли образов функциональны, функционально и само отображение.
Теорема о функциональности пересечения. Пересечение двух отображений
функционально, если функционально хотя бы одно из отображений-операндов.
Теорема о функциональности разности. Разность отображений функциональна, если функционально уменьшаемое отображение.
Теорема о функциональности посылки. Отображение, являющееся посылкой функционального отображения, функционально.
Гипотезы и теоремы о функциональности отображений являются одним из частных примеров зависимостей кардинальных чисел результатов операций от кардинальных чисел операндов. Наряду с функциональными отображениями немалую роль в проектировании схемы БД играют полностью определённые отображения. Тот факт, что отображение полностью определено, говорит о наличии зависимости одного класса от другого и напрямую влияет на генерацию, например,
реляционной схемы, в которой она трансформируется в обязательность задания
значения для столбца. Далее перечислены гипотезы о полноте отображений.
Гипотеза о полноте объединения. Объединение двух отображений полностью определено, если хотя бы одно из отображений-операндов полностью определено.
Гипотеза о полноте следствия. Следствие полностью определённого отображения полностью определено.
Гипотеза о полноте проекции. Проекция полностью определённого отображения на любые группы ролей образов и прообразов полностью определена.
Гипотеза о полноте агрегата. Агрегат двух полностью определённых отображений полностью определён.
Гипотеза о полноте композиции. Композиция двух полностью определённых
отображений полностью определена.
Заключение
Богатые выразительные возможности ERM-модели обеспечивают проектировщика всем необходимым для создания максимально полного и подробного
описания предметной области уже на этапе семантического моделирования. Синонимия языка модели оставляет выбор удобного способа представления информации за проектировщиком, но при этом требует осуществлять проверки схемы
на непротиворечивость.
За счёт увеличения детальности информации о семантике ПрО, представленной в схеме, усложняются правила её преобразования в СУБД-ориентированную
схему. Однако, благодаря теории семантически значимых отображений, предлагаемые правила трансформации не носят характер рекомендаций, строящихся на
предположениях, их обоснованность подтверждается соответствующими теоремами и аксиомами. Кроме того, вся информация, внесённая проектировщиком, по
возможности учитывается при генерации целевой схемы, и каждое незначитель-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
128
А.М. Бабанов, А.С. Скачкова
ное на первый взгляд дополнение может существенно улучшить результат –
СУБД-ориентированную схему.
ЛИТЕРАТУРА
1. Бабанов А.М. Семантическая модель «Сущность – Связь – Отображение» // Вестник
Томского государственного университета. Управление, вычислительная техника и информатика. 2007. № 1. С. 77–91.
2. Чен П. Модель «Сущность – Связь» – шаг к единому представлению о данных // СУБД.
1995. № 3. С. 137−158.
3. Бабанов А.М. Формальная система теории семантически значимых отображений //
Вестник Томского государственного университета. Математика. Кибернетика. Информатика. 2006. № 290. С. 261–263.
4. Бабанов А.М. Развитие формальной системы теории семантически значимых отображений // Вестник Томского государственного университета. Информатика. Кибернетика.
Математика. 2006. № 293. С. 135–139.
5. Бабанов А.М., Скачкова А.С. Методика доказательства теорем для формальной системы
ERM-модели // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 2. С. 113–123.
Бабанов Алексей Михайлович
Скачкова Анна Сергеевна
Томский государственный университет
E-mail: babanov2000@mail2000.ru skachkova@indorsoft.ru
Поступила в редакцию 7 июня 2012 г.
Babanov Aleksey. M., Skachkova Anna. S. (Tomsk State University). ERM-model’s synonymy
and problems of scheme consistency and completeness ensuring.
Keywords: semantic data model, ERM-model, ERM-scheme, synonymy, scheme consistency,
scheme completion.
In most semantic data models an aspect of the reality can be represented in schema only once
as a structural element or as an integrity constraint. In this case man should care about scheme
consistency and completeness by himself. «Entity – Relationship – Mapping» model (or ERMmodel for short) gives an opportunity to describe the same aspects of the reality at different levels
in different representations. This feature of the ERM-model allows reflecting any fact at any moment in any form.
As a result there can be several forms of the same fact in the scheme at the same moment. It
leads to a problem of consistency between different forms of the same fact. The second problem
is scheme reduction. It is a process of scheme transformations up to base concepts, which are necessary to DBMS-oriented scheme generation. This «normalization» helps to minimize the set of
the rules for translation into DBMS-language.
This paper includes definitions of base and derivative concepts and a demonstration of ERMscheme elements synonymy using graphical notation. Consistency checks can be divided into two
groups: checks based on meta-scheme constraints and checks based on formal system’s hypothesis and theorems. The second group makes it possible to provide scheme consistency with all
kinds of elements and synonymy between them. This paper gives the list of ERM-scheme checks
and describes theorem sources and their impact on resulting scheme.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
ПРОЕКТИРОВАНИЕ И ДИАГНОСТИКА
ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
УДК 004.312
A.Yu. Matrosova, E.A. Nikolaeva, S.A. Ostanin, V. Singh
ROBUST PDFS TESTING OF COMBINATIONAL CIRCUITS
BASED ON COVERING BDDS1
A method of deriving test pair v1, v2 for robust path delay fault (PDF) of special
combinational circuit is suggested. Circuit is obtained by covering binary decision
diagram (BDD) with look up table (LUT) based configurable logic blocks
(CLBs). It is found out that for each path of the circuit there exists a test pair v1, v2
on which delay fault manifests itself as robust. Triplets v1, v2, v1 or v2, v1, v2 detect
delays of both rising and falling transitions of the same path. Integrating triplets of
all paths we derive test T that detects any path delay fault of the circuit, single and
multiple.
Keywords: path delay fault (PDF), robust PDF, binary decision diagram (BDD),
design for testability, FPGA.
Delay testing has become very important problem with development of nanometer
technologies. The objective of delay testing is to detect timing defects degrading the
performance of a circuit. Path delay fault model is considered more preferable for detection of timing defects.
To observe delay defects, it is necessary to generate and propagate transitions in the
circuit input. This requires application of a pair of vectors v1, v2. The first vector v1 stabilizes all signals in the circuit. The second vector v2 causes the desired transition on the
input of a circuit. Take into account that delays of falling transition and rising transition
along the same path from a primary input to a primary output in a circuit may be different. In the general case it is necessary a pair of vectors v1, v2 for each kind of transitions
of a path. We will call a pair of vectors on which PDF manifests itself as PDF test pair
(for the corresponding transition along the path). Single and multiple PDFs are distinguished.
In accordance with the conditions of fault manifestation single PDFs are divided into
robust and non robust [1, 2]. PDF is robust if there is a test pair on which the fault manifestation does not depend on delays of other circuit paths.
PDF is non robust if a manifestation of the fault on a test pair is possible only when
all other paths of a circuit are fault free.
It is very important to provide testability during circuit design. Circuits derived from
BDDs as a rule are implemented with multiplexors. Their testability is investigated under different fault models [3−6] but the approaches suggested did not provide100% testability. In the paper [7] simple transformation of a circuit is suggested that guarantees
1
This work was supported by grant «РФФИ № 11-08-92694-ИНД».
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
130
A.Yu. Matrosova, E.A. Nikolaeva, S.A. Ostanin, V. Singh
100% testability for both single stuck-at fault (SAF) and PDF models. The circuits are
derived from BDDs with using multiplexors. The size of a circuit is directly proportional to the given BDD size. Optimization connected with variable ordering directly
transfers to the circuit size. Disadvantage of this approach consists of using additional
input.
In the paper [8] circuits are derived by covering BDDs with CLBs. In this paper it is
revealed that each single stuck-at fault at the CLB pole is equivalent either single stuckat fault of the proper internal node of BDD or 10 (01) faults of edges coming from the
internal node. It is also determined that each single stuck-at fault at the CLB pole is detectable. It means that the circuit guarantees 100% testability under SAF. Moreover test
for all multiple stuck-at faults may be derived directly from test for single stack-at
faults. Test for multiple stuck-at faults is 2.5 times longer [8] than test for single stuckat faults (at the average).
In this paper we show that circuit obtained from BDD by covering CLBs guarantees
100% testability for PDFs without an additional input. A size of the circuit is directly
proportional to the given BDD size. Optimization connected with variable ordering directly transfers to the circuit size. Moreover the lengths of tests for all PDFs of circuits
considered in this paper and the numbers of three input elements of these circuits as a
rule less than ones in the circuits implemented with multiplexors [7]. In this paper in
comparison with the paper [9] the experimental results are represented and proofs of the
theorems are given.
In Section 2 a problem of deriving special combinational circuits is discussed. In
Section 3 test pair is found on which PDF manifests itself as robust for rising and falling
transitions. In Section 4 experimental results are given.
1. A combinational circuit design
It is well known that BDD is a directed acyclic graph based on using Shannon decomposition in each non terminal node v:
f v = xi f vxi = 0 + xi f vxi =1 ,
f vxi =0 = f v ( x1 ,..., xi = 0,..., xn ) ,
(1)
f vxi =1 = f v ( x1 ,..., xi = 1,..., xn ) ).
Here fv is the function corresponding to the node v, dashed edge points to f vxi = 0 and
solid edge points to f vxi =1 . A BDD is called ordered if variables are encountered in the
same order on all paths connecting the BDD root with a terminal node. A BDD is reduced if it does not contain either isomorphic subgraphs nor nodes so that
f vxi =0 = f vxi =1 . Reduced and ordered BDD is a canonical representation of Boolean
function for the chosen order of variables [10].
Any path that connects the BDD root with the 1 terminal node originates the product
of the Disjoint Sum of Products (DSoP) of a function f that is represented with this
BDD. DSoP is a sum of products in which any two product cubes don’t intersect.
Let F = { f1 ,..., f m } , be the system of Boolean functions describing a combinational
circuit behavior. Derive BDD using the same order of variables for each Boolean function from F. Join isomorphic subgraphs in the different BDDs. Combine BDDs 1 terminal nodes into one 1 terminal node and their 0 terminal nodes into one 0 terminal node.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Robust PDFs Testing of Combinational Circuits based on Covering BDDs
131
Due to we obtain the graph with m roots and two terminal nodes. This graph jointly represents a system of m Boolean functions. It is called Shared BDD [10]. Without loss of
generality we will consider further system with one function.
In Fig. 1 a BDD for one output Boolean function is shown. For each path connecting
the BDD root with the 1 terminal node define the product of the DSoP. The DSoP of the
function f is as follows.
f = x1 x2 x3 ∨ x1 x2 x3 x4 x5 ∨ x1 x2 x3 x4 x5 ∨ x1 x2 x4 x5 ∨ x1 x2 x4 x5 ∨ x1 x2 x4 x5 ∨
∨ x1 x2 x4 x5 ∨ x1 x2 x3 x4 x5 ∨ x1 x2 x3 x4 x5 ∨ x1 x2 x3 x5 .
Eliminate from BDD all edges connected with
f
0 terminal node and obtain the BDD representing a
x1
combinational circuit behavior. Call this BDD as
x2
x2
Circuit BDD. Cover Circuit BDD with CLBs to
x3
x3
get a combinational circuit executing that we use
the following rules [8].
x4
x5
x5
1. CLB output corresponds to either non
terminal node or the root of the Circuit BDD.
2. CLB input corresponds to either output of
1
0
another CLB or variable of the Boolean function.
3. If two or more edges drop in a non terminal
Fig. 1. BDD for f
node of the Circuit BDD then this node may be
split and covered with different CLBs.
4. The Boolean function implementing by a CLB is represented with the part
(subgraph) of a Circuit BDD that is covered by the CLB. This function is derived from
subgraph as DSoP depending on internal and input variables of the combinational
circuit.
As a result we have got the combinational circuit C.
Covering Circuit BDD in accordance with rules 1−4 we have to provide coincidence
of DSoPs system represented by the Circuit BDD with the DSoPs system derived from
the combinational circuit C with substituting the proper DSoP of CLB instead of each
internal variable of the combinational circuit C.
Consider Circuit BDD obtained from the
x4
x3
x2
BDD in Fig. 1 with using 3 inputs CLBs.
Subgraphs of covering CLBs are reprex5
x5
x5
w1
x3
sented in Fig. 2. The circuit obtained is
w1
shown in Fig. 3.
1
1
Thus for each CLB we have subgraph of
1
the
Circuit BDD and the corresponding
(CLB1)
(CLB2)
(CLB3)
DSoP. CLB output may be either output of
the circuit or internal node of the circuit that
x2
x1
is input of another CLB.
w1
w2
w4
w3
For example DSoP x2 w1 ∨ x2 x3 w1 ∨ x2 x3
(CLB4)
(CLB5)
corresponds to CLB3 derived from relevant
Fig. 2. Subgraphs of covering CLBs
subgraph of Fig. 2. Here x2, x3 – variables
corresponding to the circuit inputs, and w1
is internal circuit variable relating to the output of CLB1.
Non terminal node of Circuit BDD corresponds to CLB output if the node is a root
of the CLB subgraph.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
132
A.Yu. Matrosova, E.A. Nikolaeva, S.A. Ostanin, V. Singh
2. Deriving test pair for PDF
2.1. Premises of test pair
We will examine one output circuit and corresponding BDD. Consider path α in the
circuit of Fig. 3 (thick line). It begins from input variable x4 and traverses the CLBs 1, 4,
5. CLB5 output is output of the circuit.
w5
We suppose that delays of the different paths
from input to output of the same CLB are equal
CLB5
w4
as CLB is LUT based. It means if a path α
traverses certain CLB we may include any path
CLB4
of the CLB subgraph (connecting the subgraph
w2
w3
root with its proper leaf) into the path α when
CLB2
CLB3
investigating delay of the path α.
w1
Derive reduced disjoint sum of products
CLB1
(reduced DSoP) for each CLB traversed by the
path α. Reduced DSoP is formed from the CLB
DSoP with including either products that contain
the input variable corresponding to the
beginning of the path α or products that contain
x4 x5 x3
x2
x1
the internal variable corresponding to the output
Fig. 3. Circuit C
of the previous CLB traversing with the path α.
For the chosen path α in Fig. 3 we have the
following reduced and non reduced DSoPs ( Fig. 2).
Reduced DSoP of CLB1: x4 x5 ∨ x4 x5 , non reduced DSoP of CLB1 is the same.
Reduced DSoP of CLB4: x2 w1 , non reduced DSoP of CLB4: x2 w2 ∨ x2 w1 .
Reduced DSoP of CLB5: x1w4 , non reduced DSoP of CLB5: x1w3 ∨ x1w4 .
Move along the path α from the output of the circuit to the beginning of the path α.
Substitute reduced DSoPs of the corresponding CLBs instead of internal nodes traversed
and remove brackets. If obtained sum of products has internal variables corresponding to
the outputs of CLBs that are not traversed with the path α, then substitute instead of these
variables the corresponding non reduced DSoPs and remove brackets till a set of internal
variables becomes empty. Denote derived set of products as Kα.
Notice that we will consider any set of products here and further also as sum of these
products (SoP).
For the path α in our example we have the result of the first substitution: x1 x2 w1 .
Then after the second substitution we have got Kα: x1 x2 x4 x5 ∨ x1 x2 x4 x5 . Take into
consideration that if we would derive Equivalent Normal Form (ENF) from the circuit
considered [12] then each literal of the sum of products would be supplied with
sequence of numbers of elements corresponding to the proper circuit path.
Let products that contain literal ENF marked with the path α be called connected
with the path α.
If we exclude in ENF sequences representing paths from all literals then Kα obtained
above is a set of products connected with the path α.
Theorem 1. A set Kα contains all products connected with the path α. Kα is DSoP.
Proof. Each product from Kα contains either literal xi or literal xi that corresponds to
the beginning of the path α and path α itself as each product is obtained with
substitutions along the path α. By the construction Kα contains all products
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Robust PDFs Testing of Combinational Circuits based on Covering BDDs
133
corresponding to the path α. Kα is DSoP as changing in any DSoP some internal variable
for corresponding DSoP originates also DSoP [13]. The theorem is proved.
Take into account that each BDD path connecting its root with 1 (0) terminal node
originates the product. If the path traverses the internal node marked with i and solid
(dashed) edge then the originated product contain xi ( xi ).
Any path connecting two internal BDD nodes originates the product in the similar
way.
For example the path of Fig. 1 (thick lines) originates product x1 x2 x4 x5 and part of
this path connecting nodes 2 and 5 originates product x2 x4 .
Theorem 2. For each product from Kα there exists the path from the root of BDD to
its 1 terminal node that originates this product.
Proof. From covering Circuit BDD with CLBs follows that we have got all products
of DSoPs as a result of all substitutions of the proper CLB DSoPs instead of circuit
internal variables. It means that we have got all products of DSoP for each function of
the system. For the path α we execute part of substitutions, excluding internal variables
to obtain all products connected with the path α. Consequently each product connected
with the path α is among the BDD products corresponding to the one output circuit
considered. The theorem is proved.
One test pattern from a test pair detecting robust PDF of both rising and falling
transitions [14] has to turn into 1 product K from Kα possibly together with other
products from Kα. In our case the circuit behavior is represented with DSoP.
Consequently this test pattern turns into 1 only product K. This product contains either
xi, or xi .
Let K be obtained from K with changing literal xi ( xi ) for the inversion literal. Call
K as an addition of K.
Another test pattern of a test pair has to turn into 1 K and into 0 DSoP derived from
BDD [13] of the circuit considered. Denote this DSoP as Dd. Let u be minimal cube
covering v1 ,v2 and ku product representing u.
To detect robust PDF it is necessary to provide the condition: product ku is
orthogonal to products of Dd excluding product K.
Take into consideration that input variable xi corresponding to the beginning of the
path α is correlated (in general case) to several nodes of BDD covered by the CLB
traversed with the path α. These nodes are marked with the same variable xi. To find test
pair we may choose any of them [8]. Denote the chosen node as v.
For example if we would consider the path traversing the same CLBs that the path α,
but beginning from the input variable x5 we have got two nodes of BDD covered by
CLB1 and marked with the variable x5.
Let ε be path from the BDD root into chosen node v. It originates the product kε.
Derive from Kα the products corresponding to the path ε that is products containing kε.
Exclude from them variables of kε. Denote the result as K*.
In the example considered a set of products corresponding to the path ε is as follows:
kε = x1 x2 , K * = x4 x5 ∨ x4 x5 .
Divide a set K* into two subsets. Products of one subset have the literal xi, and
another – the literal xi . Exclude from them these literals and denote obtained subsets
K *xi , K *xi correspondingly. These subsets represent functions implemented in nodes that
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
A.Yu. Matrosova, E.A. Nikolaeva, S.A. Ostanin, V. Singh
134
are incidental to right (solid) and left (dashed) edges of
the node v (Fig. 4). These functions are different by the
construction of BDD (in this paper we always means
ROBDD)
In the example we have: K *xi = x5 , and K *xi = x5 .
Subsets K *xi , K *x are determined with the pole v
i
and do not depend on the chosen path ε (Fig. 4).
As the subsets represent different functions then
there exists Boolean vector γ on which they take different values. Let γ turns into 1 K *xi
Fig. 4. Fragment of BDD
and into 0 K *x , k* is a product representing γ.
i
In the example considered subsets K *xi , K *x depend on the only variable x5. Then
x5
i
*
we have: γ = 0 , k = x5 .
First add literal xi to k* and then the product kε. Denote the result K ′ , K ′ = k * xi kε
is absorbed by the only product K from Kα . It follows from the theorem 1 and the
construction of Boolean vector γ. Let K ′ be addition of K ′ relative to xi , then K ′ is
absorbed by K . It follows from the construction of Boolean vector γ and K ′ . In the
example: K ′ = x1 x2 x4 x5 , K ′ = x1 x2 x4 x5 . Here K, K coincide with K ′ , K ′ .
Two products are orthogonal if their cubes don’t intersect.
A product k is orthogonal to the sum of products (SoP) if k is orthogonal to each
product of the SoP.
Theorem 3. K ′ is orthogonal to Dd.
Proof. We have to show that K ′ is orthogonal to products of K * that are obtained
from Kα with using path ε in above mentioned way. Remind that K ′ contains
subproduct kε. Product K ′ is orthogonal to set of products K *x under construction.
i
Product K ′ is also orthogonal to set of products xi K *xi hence K ′ is orthogonal to K * .
The theorem is proved.
*
Let Boolean vectors γ* , γ turns into 1 products K ′, K ′ correspondingly and these
vectors don’t differ with variables that are absent in the products K ′, K ′ . Let u be
minimal cube covering these vectors and ku – product representing this cube.
*
Theorem 4. Boolean vectors γ* , γ comprise test pairs detecting robust PDF of the
path α for both rising and falling transitions.
Proof. Vector γ* turns into 1 product K (K from Kα) as K absorbs K ′ and vector γ
*
*
turns into 1 product K as K absorbs K ′ . Except γ turns into 0 Dd. Product ku is
orthogonal to products of Dd that does not contain kε as subproduct. Except (by the
construction) ku is orthogonal to a set of products K *xi and a set of products K *xi without
*
the product K. It means [13] that on vectors γ* , γ PDF of α manifests itself as robust
for both falling and rising transitions. The theorem is proved.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Robust PDFs Testing of Combinational Circuits based on Covering BDDs
135
2.2. Algorithm of deriving test pair
Remind that each path connecting two nodes of BDD is related to the product
originated by the path. Two paths are compatible if their originated products are not
orthogonal.
The algorithm is partly (steps 1−5) based on results represented in [8] and connected
with finding test pattern for single stuck-at fault of the circuit obtained by covering
BDD with CLBs. We mean single stuck-at fault of the CLB pole directly connected
with a circuit input.
1. Consider a path that begins from the node in which edge corresponding to xi (solid
edge) goes from the node v and ends into 1 terminal node of the BDD. Denote the path
as η.
2. Look through paths that begin in the node in which edge corresponding to xi
(dashed edge) goes from the node v and ends into 0 terminal node of BDD in order to
find path compatible with η. If we find such path then go to step 5. Otherwise return to
step 1. If all paths η have looked through go to step 3.
3. Consider a path that begins from the node in which edge corresponding to xi
(dashed edge) goes from v and ends into 1 terminal node of BDD. Denote the path as η.
4. Look through paths that begin in the node in which edge corresponding to xi (solid
edge) goes from v and ends into 0 terminal node of BDD in order to find path
compatible with η. If we find such path then go to step 5. Otherwise return to step 3.
5. Obtained path denote as ζ. Conjunction of products originated by the paths η, ζ,
represents γ.
*
6. Derive Boolean vectors γ* , γ in above mentioned way. These vectors have to
*
turn into 1 the proper products K ′, K ′ . Except, the Boolean vectors γ* , γ do not differ
with variables that are absent in products K ′, K ′ .
In the example:
xx x x x
xx x x x
*
γ* = 1 2 3 4 5 , γ = 1 2 3 4 5 , K ′ = x1 x2 x4 x5 , K ′ = x1 x2 x4 x5 .
0 0 010
0 0 0 0 0
*
In the products K ′, K ′ variable x3 is absent. In the Boolean vectors γ* , γ this variable
takes the 0 value.
In Fig. 5 thick lines represent paths correspond*
f
*
ing to γ , γ .
X2
X1
X2
To detect robust PDF of α for rising and falling
X3
transitions we need triplets v1, v2, v1 or v2, v1, v2. X3
Integrating triplets of all circuit paths we derive test
X4
X5
X5
T for all path delay faults.
Theorem 5. Test T detects any PDF of a circuit
1
0
(single and multiple).
Proof. As test T consists of pairs on which PDF
*
manifests itself as robust and includes test pair for
Fig. 5. Representing γ* , γ
each path of a circuit then each single PDF is
detectable with test T. As each single PDF manifests itself as robust on the proper pair
of test T consequently any multiple PDF is detectable at the expense of single PDF
comprising multiple fault. The theorem is proved.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
A.Yu. Matrosova, E.A. Nikolaeva, S.A. Ostanin, V. Singh
136
Notice that all results derived for BDD easily may be spread to Shared BDD.
3. Experimental results
For the experiments we used the benchmarks LGSynth’91 [15].
In Table 1, the names of the benchmarks are given in the first column. The numbers
of inputs and outputs are given in the second and the third columns, respectively.
In section MUX-map, the results are given for a direct mapping of BDDs by
multiplexors as described in [6]. The number of nodes in BDD (NoN), the number of
paths (NoP), and the PDF coverage (PDFC) are given in corresponding columns. This
technique doesn’t provide the 100% PDF covering. To provide 100% PDF covering for
circuits in the frame of this technique it is necessary an additional input [7]. Using an
additional input increases the number of nodes in BDD (and consequently the number
of multiplexors) and the number of paths [7] for the same benchmark.
In section LUT-map, the results are given for the technique described above for 3
inputs CLBs. The number of CLBs in the circuit (NoC), the number of paths (NoP), and
the PDF coverage (PDFC) are given in corresponding columns.
Experimental results
Name
in
out
5xpl
C17
alu2
b9
clip
conl
count
il
15
t481
tcon
9sym
f51m
z4ml
x2
7
5
10
41
9
7
35
25
133
16
17
9
8
7
10
10
2
6
21
5
2
16
13
66
1
16
1
8
4
7
NoN
90
12
259
237
256
20
251
60
313
34
34
35
72
66
75
MUX-map
NoP
PDFC
273
89.0
22
68.1
873
86.9
1773
64.6
954
79.4
47
74.4
2248
66.1
137
74.4
44198
61.3
4518
86.1
40
100.0
328
72.5
326
99.3
175
77.1
188
72.3
NoC
69
6
246
141
235
9
199
41
169
26
16
27
58
50
61
LUT-map
NoP
PDFC
175
100.0
12
100.0
929
100.0
380
100.0
597
100.0
18
100.0
642
100.0
85
100.0
941
100.0
1226
100.0
32
100.0
195
100.0
139
100.0
118
100.0
251
100.0
Experimental results showed that the number of CLBs and the number of paths are
as a rule less then the number of multiplexers and the number of paths for the same
benchmark.
Conclusion
Special combinational circuits are investigated. They are derived by covering BDDs
with LUT based CLBs. It is found out that PDF of each path of such circuits manifests
itself as robust. Except for delays of rising and falling transitions of the same path there
exist triplets v1, v2, v1 or v2, v1, v2 detecting these delays. Triplets are found with BDD
analyses based on finding test pattern for single stuck-at fault of CLB input directly
connected with a circuit input. Experimental results showed that lengths of tests for
PDFs of investigated circuits and the numbers of three input elements of these circuits
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Robust PDFs Testing of Combinational Circuits based on Covering BDDs
137
as a rule less than ones in circuits implemented with multiplexors. Investigated circuits
do not demand additional input to provide 100% testability for robust PDFs.
REFERENCES
1. Lin C.J., Reddy S.M. On Delay fault testing in logic circuits // IEEE Trans. on ComputerAided Design. V. 6. No. 5. P. 694–701.
2. Bushnell M. L., Agrawal V. D. Essentials of electronictesting for digital, memory and mixedsignal // VLSI Circuits. Hingham, MA, USA: Kluwer Academic Publishers, 2000. 432 p.
3. Ashar P., Devadas S., Keutzer K. Gate-delay-fault testability properties of multiplexor-based
networks / P. Ashar, S. Devadas, K. Keutzer // Proc. Int. Test Conf. 1991. P. 887–896.
4. Ashar P., Devadas S., Keutzer K. Testability properties of multilevel logicnetworks derived
from binary decision diagrams // Proc. Adv. Res. VLSI. Univ. California, Santa Cruz. 1991.
P. 33–54.
5. Ashar P., Devadas S., Keutzer K. Path-delay-fault testability properties of multiplexor-based
networks // Integration, VLSI J. 1993. V. 15. No. 1. P. 1–23.
6. Becker B. Testing with decision diagrams // Integration, VLSI J. 1998. V. 26. P. 5–20.
7. Drechsler R., Shi J., Fey G. Synthesis of fully testable circuits from BDDs // IEEE
Transactions on Computer-Aided Design of Integrated Circuits and Systems. 2004. V. 23.
No. 3. P. 1–4.
8. Matrosova A., Lukovnikova E., Ostanin S., Zinchyk A., Nikolaeva E. Test generation for
single and multiple stuck-at faults of a combinational circuit designed by covering shared
ROBDD with CLBs // Proc. of the 22nd IEEE Intern. Symp. 2007. P. 206–214.
9. Matrosova A., Nikolaeva E. PDFs testing of cmbinational circuits based on covery ROBDDs
// Proc. of EW&DT Symposium. 2010. P. 160–163.
10. Bryant R.E. Graph-based algorithms for Boolean function manipulation // IEEE Trans.
Comput. 1986. V. C-35. P. 677–691.
11. Minato S., Ishiura N., Yajima S. Shared binary decision diagram with attributed edges for
efficient Boolean function manipulation // Proc. 27th IEEE/ACM DAC. 1990. P. 52–57.
12. Armstrong D.B. On finding a nearly minimal set on fault detection tests for combinational
logic nets // IEEE Trans. Electronic Computers. 1966. EC-15. P. 66–73.
13. Matrosova A. Random simulation of logical circuits // Automation and Remote Control.
1995. No. 1. P. 156−164.
14. Matrosova A., Lipsky V., Melnikov A., Singh V. Path delay faults and ENF // Proc. of
EW&DT Symposium. 2010. P. 164–167.
15. Yang S. Logic synthesis and optimization benchmarks user guide // Tech. Rep.,
Microelectron. Center of North Carolina. 1991. 44 p.
Matrosova Anzhela Yu., Nikolaeva Ekaterina A., Ostanin Sergey A.
Tomsk State University
Singh Virendra
Indian Institute of Technology Bombay
E-mail: mau11@yandex.ru; ostanin@mail.tsu.ru;
nikolaeve-ea@yandex.ru; virendra@computer.org
Поступила в редакцию 15 декабря 2011 г.
Матросова А.Ю., Николаева Е.А., Останин С.А. (Томский государственный университет),
Сингх В. (Индийский институт технологий, Бомбей). Построение тестов для неисправностей задержек робастно тестируемых путей для комбинационных схем, построенных
покрытием BDD-графов.
Ключевые слова: неисправность задержки пути, робастно тестируемый путь, бинарные
решающие диаграммы, контролепригодное проектирование, ПЛИС.
При тестировании неисправностей задержек путей особенно важно обнаружение робастно тестируемых путей. К сожалению, не все пути в произвольных схемах являются робастно тестируемыми. Установлено, что неисправность задержки каждого пути схемы, полу-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
138
A.Yu. Matrosova, E.A. Nikolaeva, S.A. Ostanin, V. Singh
ченной покрытием системы ROBDD-графов программируемыми логическими блоками с
сохранением системы ОДНФ (ортогональных дизъюнктивных нормальных форм), представляемой графами, проявляется как робастная. Предложен алгоритм построения пары
тестовых наборов, обнаруживающей робастно тестируемую неисправность задержки пути.
Найденная пара может быть использована для тестирования обоих перепадов значений
сигналов пути при перестановке элементов пары. Тест, обнаруживающий робастно тестируемые неисправности задержек всех одиночных путей, обнаруживает все кратные неисправности задержек путей схемы и одиночные константные неисправности на полюсах логических элементов схемы.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
УДК 004.052.32
A.V. Melnikov
OBSERVABILITY ESTIMATION OF A STATE VARIABLE
WHEN THE LOS TECHNIQUE IS APPLIED1
Structural scan based delay testing is used for detecting the circuit delays. Because
of architectural limitations not an each test pair can be applied through a scan delay test. Enhanced scan techniques were developed to remove these restrictions on
vector pairs. Unfortunately these techniques have rarely been used in practice because of the near doubling of the flip-flop area. Most promising are partial enhanced scan approaches based on partial selection of flip-flops for including them
in enhanced scan chains. The problem is how to select proper flip-flops. In this
paper we suggest to estimate flip-flop observability as a probability of robust PDF
manifestation for paths connected with corresponding state variable in the frame
of the LOS technique. It is desirable to include in enhanced scan chains flip-flops
with low observabilities of corresponding state variables. The algorithm of observability calculation is developed and experimental results are presented.
Keywords: path delay fault (PDF); robust PDF; equivalent normal form (ENF);
Launch-on-Shift (LOS) scan technique.
Because of architectural limitations not an each test pair v1, v2 can be applied
through a scan delay test. Enhanced scan techniques were developed to remove these
restrictions on vector pairs. Unfortunately these techniques have rarely been used in
practice because of the near doubling of the flip-flop area. Most promising are partial
enhanced scan approaches based on proper selection of flip-flops for including them in
enhanced scan chains [1].
In the paper [2] it was suggested to include flip-flops with low estimations of
controllability of corresponding state variables in scan chains. Facilities of signal
change propagation from an input to an output of a circuit (observability) are not
considered. In the paper [3] estimations oriented to cutting the test length and improving
the test coverage were developed for both controllability and observability. In both
papers estimations are related to providing the constant value for the state variable but
not to providing the change of its value.
1. Calculation of observability estimation of a state variable
Suppose we have a synchronous circuit (Fig. 1) in which x1,…,xn are input variables,
y1,…,yp are state variables, z1,…,zm are output variables, and d1,…,dp are flip-flops. Circuit
C is a combinational part of a sequential circuit.
Random input sequence of a sequential circuit is described with a probability
distribution ρ(x1),…,ρ(xn). Here ρ(xi), i = 1,…,n, is a probability an input variable xi
takes the 1 value on a random input vector. Assume that a probability distribution
ρ(y1),…,ρ(yp) of state variables is also known.
The problem of probability calculation of robust PDF manifestation (calculation of
observability estimation) for the state variable was considered in the paper [4] under
1
This work was supported by grant «РФФИ № 11-08-92694-ИНД».
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
A.V. Melnikov
140
suggestion that the vector v1 of the test pair is a unit of
random sequence with the given probability
distribution of 1 values of input and state variables.
C
Moreover each test pair v1, v2 can be applied through a
y1
delay test. The algorithm of observability estimation
…
is based on deriving a ROBDD representation of all
yp
robust PDF test pairs for the path. Remind that
d1
ROBDD paths from its root to the 1 value terminal
node represent a Disjoint Sum of Products (DSoP). In
dp
a DSoP all products are pairwise orthogonal. When
the LOS technique is applied we also consider that the
Fig. 1. Synchronous circuit
vector v1 in the test pair is a unit of the random
sequence but the vector v2 is obtained by single right
cyclic shift among state variables of the vector v1. The latter means that not an each test
pair v1, v2 can be applied in the frame of the LOS technique. In that case we first suggest
deriving a ROBDD representation of all robust PDF test pairs for each product (of the
Equivalent Normal Form) that generates test pairs. Then we derive prime products for
each function represented by a ROBDD. After that we correct prime products in order
to provide existence of test pairs in the frame of the LOS technique.
Consider ENF products containing the literal representing the path α. In line with
theorems 1, 2 [4] such products may originate robust PDF test pairs. Find all robust test
pairs both for rising and falling transitions of the given path originated by one product
of ENF [4]. For that we have to find product K that does not contain repeated variable
xi. Analyzing ENF we don’t pay attention to index sequences of literals representing
paths of the circuit. All roots of the special equation [4] D = 0 are represented as
ROBDD R. R is compact description of a disjoint sum of products (DSoP). Exclude the
variable xi from K and obtain the product K*. Represent the expression K*&DSoP as
ROBDD R*. Each path of R* from the root till the 1 terminal node represents the
product corresponding to 2n−r−1 robust test pairs consisting of neighboring Boolean
vectors. Here r is a rank of the product originated by the R* path and n is the number of
ENF variables.
Extract from the R* sum of all prime products and denote it as a SoPP. Any product
of the SoPP represents conditions for forming test pairs: each test pair must have same
values a) among variables of K* (theorems 1, 2, point 4, [4]) and b) among subset of the
rest variables (except xi) which provide orthogonality to products of the set K (theorems
1, 2, point 3[4]). Notice that all minimal subsets are represented with prime products of
the SoPP and we need them all in order to keep all test pairs. Experimental results
showed that SoPPs as a rule are rather simple.
Let Kj be the product of the SoPP. Consider the following proposals.
Proposal 1. Product Kj from the SoPP with literals yk y k +1 ( y k yk +1 ), k≠i-1, does
x1
…
xn
z1
…
zm
not originate robust test pairs (if k = n, then k+1 = 1).
Proof. Really both vectors v1, v2 must turn the product Kj into the 1 but it is
impossible if the Kj contains literals yk yk +1 ( yk yk +1 ), k≠i-1, as v2 is obtained from v1
by single right cyclic shift among state variables. The proposal is proved.
Proposal 2. The product Kj from the SoPP with literals yi −1 yi +1 ( yi −1 yi +1 ) does not
originate robust test pairs. If i = n we should consider literals yn −1 y1 ( yn −1 y1 ), if i = 1 –
literals yn y2 ( yn y2 ).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Observability estimation of a state variable when the LOS technique is applied
141
Proof. Really both vectors v1, v2 must turn the product Kj into the 1 and at the same
time provide the value change of the variable yi. But it is impossible if the Kj contains
above mentioned literals as v2 is obtained from v1 by single right cyclic shift among
state variables. The proposal is proved.
If a product K* in accordance with proposals 1 and 2 does not originate robust test
pairs it must be excluded from the consideration. Consider K* that may originate robust
test pairs.
Find the proper R* and the SoPP. Exclude from the SoPP products which don’t
originate robust test pairs. Denote the result as the SoPP*. Consider the SoPP* and find
all test pairs originated by these products when the LOS technique is used. Represent
them as a ROBDD R(Kj). For that we have to do the following.
1. If a literal yk−1 is absent in the Kj from the SoPP* but a literal yk is present, k≠i, k1≠i then add the literal yk−1 into the Kj so that signs of inversions of both these literals
are the same (if k = 1, then k − 1 = n). This procedure provides turning the product Kj
into the 1 by both vectors v1, v2 when the LOS technique is used.
Recall that any product Kj does not contain the variable yi. Add this variable to generate robust test pair providing the state variable value change.
2. If variables yi−1, yi+1 are both present in the Kj add the variable yi with the same
sign of inversion that the variable yi+1 has.
3. If the variable yi+1 is present in the Kj but yi−1 is absent add the variable yi with the
same sign of inversion that the variable yi+1 has and add yi−1 with the opposite sign of
inversion.
4. If the variable yi+1 is absent in the Kj but yi−1 is present add variables yi, yi+1 with
the opposite sign of inversion that the variable yi−1 has.
5. If variables yi−1, yi+1 are absent in the product Kj we generate two products from
the Kj. One is obtained by appending yi yi+1 without an inversion and the variable yi−1
with an inversion. Another one by appending yi yi+1 with an inversion and yi−1 without
an inversion.
If i = n (i = 1) the similar 2−5 conditions may be formulated for variables yn−1, y1
(yn, y2).
Points 2−5 provide conditions for turning the product Kj into the 1 on vectors v1, v2
and for the value change of the state variable yi in the test pair. After executing points
1−5 for all products of the SoPP* we obtain the SoP*. We should additionally check
products of the SoP* against proposals 1, 2, because of boundary conditions may not be
satisfied after appending some variables in points 1−5. After exclusion some
incompatible products we obtain SoP**. Its products may not be prime products but
each of them provides generation of robust test pairs which turns into the 1
corresponding product of the SoPP*.
Execute disjunction of all SoPs** corresponding to different ENF products related
to the path α and represent this disjunction as a ROBDD Rα.
It should be noted that in special case, when n≤3 (number of state variables is less
than or equal to 3) all observabilities are equal to 0 because of incompatibility with
proposals 1, 2.
Theorem 1. When using the LOS technique the robust test pair exists if and only if
the vector v1 is absorbed with a product contained in the ROBDD Rα.
Proof. Let the vector v1 be absorbed with one product K from the DSoP
corresponding to the Rα. Show that v1 forms the robust test pair when the LOS technique
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
A.V. Melnikov
142
is used. From the construction of the DSoP we conclude that the variable yi changes its
value to opposite one on the vector v2. As the K is absorbed by at least one product from
the SoPP* (proper Kj) then vectors v1, v2 keep values of variables of the product K*
(theorems 1, 2, point 4) and vectors v1, v2 are orthogonal to the set K (theorems 1, 2,
point 3). It means that v1 and v2 form robust PDF test pair together.
Let we have the robust test pair so that the vector v2 is built in the frame of the LOS
technique. Show that the vector v1 of this test pair is absorbed with a product from the
DSoP corresponding to the Rα. The construction of the ROBDD corresponding to the Rα
let us forming v2 from any possible v1: we have in the proper SoP** all necessary
minimal subsets of variables for providing the orthogonality to products of the set K.
The ROBDD Rα contains functions represented by all necessary SoPs** and
consequently v1 is absorbed with a product of the DSoP of the Rα. The theorem is
proved.
Using Rα and the probability distribution of input and state variables we may
calculate a probability of the robust PDF manifestation (observability estimation) along
the path α.
We can calculate observability estimation Po(LOS) of the state variable yi for one
circuit output by deriving ROBDDs for each path started at yi and terminated at this
circuit output. For that we must summarize observability estimations for each path
corresponding to the state variable and the circuit output as products representing test
pairs for different paths terminated at one output are orthogonal.
To obtain more representative results we should calculate average observability
estimation Po,avg(LOS) of the state variable yi per all circuit outputs. In the similar way it
is possible to calculate observability estimations for all state variables of the sequential
circuit. We have got the following experimental results.
2. Experimental results
The suggested approach is based on ENF analysis and ROBDD application. ENF is
very complicate formula for real circuits. It is possible to use OR-AND trees to present
all paths of a circuit C [5], one OR-AND tree for each output of a combinational part of
a sequential circuit. These trees were used for finding estimations for benchmarks of the
Table.
Experimental results of observability estimations for ISCAS89 benchmarks set
Circuit
s208
Inputs
11
Outputs
2
s298
3
6
s344
9
11
s349
9
11
State Variables
Y_8; Y_7; Y_4; Y_3; Y_2;
Y_1; Y_6; Y_5
G18; G14; G12; G10; G11;
G13; G23; G22; G15; G20;
G16; G19; G21; G17
ACVQN0; CT0; CT1; CT2;
MRVQN0; MRVQN1;
MRVQN2; MRVQN3; AX0;
AX1; ACVQN1; AX2;
ACVQN2; AX3; ACVQN3
CT2; CT0; CT1; MRVQN0;
MRVQN1; MRVQN2;
MRVQN3; AX0; ACVQN0;
AX1; ACVQN1; AX2;
ACVQN2; AX3; ACVQN3
Po,avg(LOS)*10000
0; 0; 21; 25; 20; 53;
0; 4;
0; 41; 24; 51; 14;
27; 83; 63; 62; 0;
4; 0; 4; 0;
11; 110; 24; 52;
2; 24;
12; 24; 43;
42; 5; 48;
7; 49; 10;
75; 52; 6; 2;
24; 24;
24; 39; 12;
42; 5; 42;
5; 48; 5;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Observability estimation of a state variable when the LOS technique is applied
143
Table continued
Circuit
s382
Inputs
3
Outputs
6
s386
s400
7
3
7
6
s444
3
6
s510
19
7
s526
3
6
s526n
3
6
s820
s832
s953
18
18
16
19
19
23
State Variables
OLATCH_G1L; C3_Q2;
UC_17; UC_9; UC_10;
UC_11; UC_8; TESTL;
UC_18; UC_19; UC_16;
C3_Q1; C3_Q0; C3_Q3; FML;
OLATCH_FEL;
OLATCH_G2L;
OLATCH_R1L;
OLATCH_Y2L;
OLATCHVUC_5;
OLATCHVUC_6
v7; v9; v8; v10; v12; v11
OLATCH_G2L;
OLATCH_FEL; FML; C3_Q3;
TESTL; UC_8; UC_9; UC_10;
UC_11; UC_16; UC_17;
UC_18; UC_19; C3_Q2;
C3_Q1; C3_Q0;
OLATCH_Y2L;
OLATCHVUC_5;
OLATCH_G1L;
OLATCHVUC_6;
OLATCH_R1L
G27; G24; G19; G22; G20;
G18; G15; G31; G14; G11;
G12; G13; G16; G17; G21;
G23; G29; G25; G28; G30;
G26
st_0; st_1; st_3; st_4; st_5;
st_2
G25; G13; G19; G11; G10;
G14; G15; G16; G30; G17;
G18; G12; G21; G20; G29;
G22; G27; G23; G26; G28;
G24
G23; G13; G19; G11; G10;
G14; G15; G16; G30; G17;
G18; G12; G21; G20; G29;
G22; G24; G25; G26; G27;
G28
G42; G41; G39; G40; G38
G42; G41; G39; G40; G38
ReWhBufHS1; TgWhBufHS1;
SeOutAvHS1; LdProgHS1;
State_3; State_1; State_0;
State_2; State_5; State_4;
Mode2HS1; ReRtTSHS1;
ShftIRHS1; NewTrHS1;
Mode1HS1; ShftORHS1;
ActRtHS1; Mode0HS1;
TxHInHS1; LxHInHS1;
NewLineHS1; ActBmHS1;
GoBmHS1; LoadOHHS1;
DumpIHS1; SeFullOHS1;
GoRtHS1; LoadIHHS1; SeFullIHS1
Po,avg(LOS)*10000
0; 28;
25; 6; 0;
18; 7; 51;
2; 9; 6;
15; 21; 18; 46;
32;
0;
0; 0;
0;
0;
0; 6; 0; 54; 0; 2
0;
33; 46; 23;
48; 4; 6; 0;
18; 4; 23;
2; 9; 25;
15; 29;
0;
0;
0;
0;
0;
0; 41; 16; 17; 16;
6; 3; 46; 2; 3;
6; 17; 9; 24; 27;
46; 0; 0; 0; 0;
0
0; 0; 0; 24; 24;
24
0; 50; 3; 23; 14;
0; 0; 14; 61; 6;
27; 39; 37; 8; 46;
68; 0; 0; 0; 0;
0
0; 52; 2; 23; 17;
12; 6; 20; 64; 7;
42; 62; 44; 8; 46;
35; 0; 0; 0; 0;
0
0; 2; 0; 33; 0
0; 0; 0; 33; 0
0; 0;
0; 0;
5; 8; 2;
2; 6; 13;
0; 0;
0; 0;
0; 0;
0; 0;
0; 0;
0; 0;
0; 0;
0; 0;
0; 0;
0
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
144
A.V. Melnikov
Flip-flops corresponding to state variables with low Po,avg(LOS) can be selected for
including them in enhanced scan chains. The additional investigations are necessary for
choosing the threshold values for Po,avg.
Conclusion
The method of observability estimation based on probability calculation of robust
PDF manifestation of all paths connected with a state variable in the frame of the LOS
technique was developed. It allows grading state variables and including ones with low
Po,avg(LOS) in enhanced scan chains.
REFERENCES
1. Xu G., Singh A. D. Achieving high transition delay fault coverage with partial DTSFF enhanced scan chains // Proc. of International Test Conference. 2007. P. 1−9.
2. Gefu Xu, Adit D. Singh. Flip-flop selection to minimize TDF coverage ith partial enhanced
scan // Proc. of ATS. 2007. P. 335−340.
3. Seongmoon Wang, Wenlong Wei. Low overhead partial enhenced scan technique for compact
and high fault coverage transition delay test patterns // Proc. of ETS. 2008. P. 125−130.
4. 4.Matrosova A.Yu., Melnikov A.V., Mukhamedov R.V., Ostanin S.A., Singh V. Flip-Flops selection for partial enhanced scan techniques // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 2(19). C. 112−120.
5. Matrosova A., Andreeva A., Melnikov A., Nikolaeva E. Multiple stuck-at fault and path delay
fault testable circuits // Proc. of EW&DT Symposium. Lvov. Ukraine. 2008. P. 356−364.
Melnikov Alexey Vladimirovich
Tomsk State University
Email: alexey.ernest@gmail.com
Поступила в редакцию 28 апреля 2012 г.
Мельников А.В. (Томский государственный университет). Вычисление наблюдаемости
триггеров в рамках LOS техники сканирования состояний схемы.
Ключевые слова: неисправность задержки пути; робастная неисправность задержки; эквивалентная нормальная форма (ЭНФ); LOS-техника сканирования состояний схемы.
Для обнаружения неисправностей задержек сигналов в схемах с памятью используется
техника сканирования состояний схемы, основанная на применении специальных триггеров, функционирующих как элементы памяти в рабочем режиме и как элементы сдвигового регистра в режиме тестирования. При этом не каждая тестовая пара может поступать на
входы комбинационного эквивалента схемы. Зарубежными исследователями была предложена расширенная техника сканирования, основанная на дублировании триггеров. Эта техника требует большой аппаратурной избыточности, которая не устраивает практиков.
Затем была предложена частичная техника сканирования, при которой в расширенную сканируемую цепь включаются лишь некоторые триггеры. Возникает проблема их выбора.
В статье приводится алгоритм оценки наблюдаемости переменной состояния, сопоставляемой триггеру, основанный на робастной тестируемости неисправностей задержек путей
и ориентированный на Launch-on-Shift (LOS)-технику сканирования. Триггеры с низкими
оценками наблюдаемости соответствующих переменных состояния являются претендентами для включения в расширенную сканируемую цепь. Приводятся результаты экспериментов на контрольных примерах.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 3(20)
СВЕДЕНИЯ ОБ АВТОРАХ
АВДЕЕНКО Татьяна Владимировна − профессор, доктор технических наук, зав. кафедрой экономической информатики Новосибирского государственного технического университета. E-mail: tavdeenko@mail.ru
АВЕРИНА Татьяна Александровна − кандидат технических наук, старший научный сотрудник Института вычислительной математики и математической геофизики СО РАН,
доцент Новосибирского государственного университета. E-mail: ata@osmf.sscc.ru
БАБАНОВ Алексей Михайлович – доцент, кандидат технических наук, доцент кафедры
программной инженерии факультета информатики Томского государственного университета. E-mail: babanov2000@mail2000.ru
БОЯРОВИЧ Юлия Сигизмундовна – кандидат физико-математических наук, ассистент
кафедры экономической кибернетики и теории вероятностей математического факультета
Гомельского государственного университета им. Ф. Скорины (Республика Беларусь).
E-mail: juls1982@list.ru
ГЛУХОВА Ирина Юрьевна – аспирантка факультета прикладной математики и кибернетики Томского государственного университета. E-mail: win32_86@mail.ru
ГОРЦЕВ Александр Михайлович – профессор, доктор технических наук, заведующий
кафедрой исследования операций факультета прикладной математики Томского государственного университета. E-mail: amg@fpmk.tsu.ru
ДЕМИДЕНКО Николай Данилович − профессор, доктор технических наук, ведущий научный сотрудник специального конструкторско-технологического бюро «Наука» Красноярского научного центра СО РАН (г. Красноярск). E-mail: tpya74@mail.ru
ДМИТРИЕВ Юрий Глебович – профессор, доктор физико-математических наук, заведующий кафедрой теоретической кибернетики Томского государственного университета.
E-mail: dmit@mail.tsu.ru
ДОМБРОВСКИЙ Владимир Валентинович – профессор, доктор технических наук, заведующий кафедрой математических методов и информационных технологий в экономике
экономического факультета Томского государственного университета. E-mail: dombrovs@
ef.tsu.ru
КОШКИН Геннадий Михайлович – профессор, доктор физико-математических наук,
профессор кафедры теоретической кибернетики Томского государственного университета.
E-mail: kgm@mail.tsu.ru
КУРИЦИНА Светлана Валерьевна – студентка 5-го курса факультета прикладной математики и кибернетики Томского государственного университета. E-mail: sniksa1174@
vtomske.ru
МАЛИНКОВСКИЙ Юрий Владимирович – профессор, доктор физико-математических
наук, заведующий кафедрой экономической кибернетики и теории вероятностей математического факультета Гомельского государственного университета им. Ф. Скорины (Республика Беларусь). E-mail: Malinkovsky@gsu.by
МАТРОСОВА Анжела Юрьевна − профессор, доктор технических наук, заведующая кафедрой программирования факультета прикладной математики и кибернетики Томского
государственного университета. E-mail: mau11@yandex.ru
МЕДВЕДЕВ Геннадий Алексеевич – профессор, доктор физико-математических наук,
профессор факультета прикладной математики и информатики Белорусского государственного университета (Минск, Республика Беларусь). E-mail: MedvedevGA@cosmostv.by
МЕЛЬНИКОВ Алексей Владимирович − старший преподаватель кафедры программирования факультета прикладной математики и кибернетики Томского государственного университета. E-mail: alexey.ernest@gmail.com
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
146
Сведения об авторах
МИХЕЕВ Павел Андреевич − аспирант кафедры прикладной информатики факультета
информатики Томского государственного университета. E-mail: doka-patrick@mail.ru
МОИСЕЕВ Александр Николаевич – доцент, кандидат технических наук, доцент кафедры математических методов и информационных технологий в экономике экономического
факультета Томского государственного университета. E-mail: amoiseev@ngs.ru
МОИСЕЕВА Светлана Петровна – доцент, кандидат технических наук, доцент кафедры
теории вероятности и математической статистики факультета прикладной математики и
кибернетики Томского государственного университета. E-mail: smoiseeva@mail.ru
НАУМОВ Анатолий Александрович − доцент, кандидат технических наук, доцент кафедры экономической информатики Новосибирского государственного технического университета. E-mail: a_a_naumov@mail.ru
НИКОЛАЕВА Екатерина Александровна − старший преподаватель кафедры программирования факультета прикладной математики и кибернетики Томского государственного
университета. E-mail: nikolaeve-ea@yandex.ru
ОБЪЕДКО Татьяна Юрьевна – аспирантка факультета прикладной математики и кибернетики Томского государственного университета. E-mail: tani4kin@mail.ru
ОСТАНИН Сергей Александрович − доцент, кандидат технических наук, доцент кафедры программирования факультета прикладной математики и кибернетики Томского государственного университета. E-mail: ostanin@mail.tsu.ru
ПОДДУБНЫЙ Василий Васильевич − профессор, доктор технических наук, профессор
факультета информатики Томского государственного университета. E-mail: vvpoddubny@
gmail.com
РОМАНОВИЧ Ольга Владимировна − старший преподаватель факультета информатики
Томского государственного университета. E-mail: hjkm@ngs.ru
СИНГХ Вирендра − PhD, адъюнкт-профессор факультета электронной инженерии Индийского института технологий (Бомбей). E-mail: virendra@computer.org
СКАЧКОВА Анна Сергеевна – аспирантка факультета информатики Томского государственного университета. E-mail: skachkova@indorsoft.ru
СОЛОВЬЕВ Александр Александрович – аспирант факультета прикладной математики
и кибернетики Томского государствен-ного университета. E-mail: sisal@mail.ru
СУЩЕНКО Сергей Петрович − профессор, доктор технических наук, заведующий кафедрой прикладной информатики факультета информатики Томского государственного
университета. E-mail: ssp@inf.tsu.ru
1/--страниц
Пожаловаться на содержимое документа