close

Вход

Забыли?

вход по аккаунту

?

783.Вестник Томского государственного университета. Управление, вычислительная техника и информатика №1 2012

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО
МИНИСТЕРСТВО
ОБРАЗОВАНИЯ УНИВЕРСИТЕТА
И НАУКИ РФ
Управление, вычислительная техника и информатика
2012
№ 1(18)
ВЕСТНИК
ТОМСКОГО
ГОСУДАРСТВЕННОГО
УНИВЕРСИТЕТА
УПРАВЛЕНИЕ,
ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА
И ИНФОРМАТИКА
TOMSK STATE UNIVERSITY
JOURNAL OF CONTROL AND COMPUTER SCIENCE
Научный журнал
2012
№ 1(18)
Свидетельство о регистрации: ПИ № ФС 77-29497
от 27 сентября 2007 г.
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2
М.Ю. Приступа, В.И. Смагин
РЕДАКЦИОННАЯ КОЛЛЕГИЯ ЖУРНАЛА
«ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА.
УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА»
Горцев А.М., д-р техн. наук, проф. (председатель); Смагин В.И., д-р техн. наук, проф.
(зам. председателя); Лопухова С.В., канд. физ.-мат. наук, доц. (отв. секретарь); Агибалов Г.П.,
д-р техн. наук, проф.; Дмитриев Ю.Г., д-р физ.-мат. наук, проф.; Домбровский В.В.,
д-р техн. наук, проф.; Змеев О.А., д-р физ.-мат. наук, проф.; Евтушенко Н.В., д-р техн. наук, проф.; Конев В.В., д-р физ.-мат. наук, проф.; Костюк Ю.Л., д-р техн. наук, проф.; Кошкин Г.М., д-р физ.-мат. наук, проф.; Матросова А.Ю., д-р техн. наук, проф.; Назаров А.А.,
д-р техн. наук, проф.; Параев Ю.И., д-р техн. наук, проф.; Поддубный В.В., д-р техн. наук,
проф.; Сущенко С.П., д-р техн. наук, проф.; Тарасенко Ф.П., д-р техн. наук, проф.; Хорошевский В.Г., д-р техн. наук, проф., член-корр. РАН; Enzo Orsingher, Prof., University of
Rome (Italy); Paolo Prinetto, Prof., Polytechnic Institute Turine (Italy); Yervant Zorian, PhD,
Vice President & Chief Scientist, Virage Logic Corp., Fremont, CA (USA).
Научный журнал «Вестник Томского государственного университета. Управление, вычислительная техника и информатика» был выделен в самостоятельное периодическое издание из общенаучного журнала «Вестник Томского государственного университета» в
2007 г. Журнал зарегистрирован в Федеральной службе по надзору в сфере массовых коммуникаций, связи и охраны культурного наследия (свидетельство о регистрации ПИ № ФС
77-29497 от 27 сентября 2007 г.), ему присвоен международный стандартный номер сериального издания (ISSN 1998-8605). С 2010 г. журнал входит в Перечень ВАК. Журнал выходит ежеквартально и распространяется по подписке, его подписной индекс 44031 в объединённом каталоге «Пресса России».
В журнале «Вестник ТГУ. УВТиИ» публикуются результаты теоретических и прикладных исследований вузов, научно-исследовательских, проектных и производственных организаций в области управления, вычислительной техники и информатики в технических,
экономических и социальных системах.
Тематика публикаций журнала:
• УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
• МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
• ОБРАБОТКА ИНФОРМАЦИИ
• ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
• ДИСКРЕТНЫЕ ФУНКЦИИ И АВТОМАТЫ
• ПРОЕКТИРОВАНИЕ И ДИАГНОСТИКА ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
Правила оформления статей приведены на сайте: http://vestnik.tsu.ru/informatics/
Адрес редакции:
634050, г. Томск, пр. Ленина, д.36, корп. 2, к. 201
Электронный адрес: http://vestnik.tsu.ru
Контактный тел./факс: (3822) 529-599
E-mail: vestnik_uvti@mail.tsu.ru
ООО «Издательство научно-технической литературы»
634050, Томск, пл. Новособорная, 1, тел. (3822) 533-335
Редактор Т.С. Портнова
Верстка Д.В. Фортеса
Изд. лиц. ИД № 04000 от 12.02.2001. Подписано к печати 07.03.2012.
Формат 70 × 100 1/16. Бумага офсетная. Печать офсетная. Гарнитура «Таймс».
Усл. п. л. 12,09. Уч.-изд. л. 13,55. Тираж 300 экз. Заказ № 14.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
СОДЕРЖАНИЕ
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
Приступа М.Ю., Смагин В.И. Прогнозирующее управление дискретными системами с неизвестным входом и его применение к задаче управления экономическим объектом .........................................................................................................................5
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Любина Т.В., Назаров А.А. Исследование немарковской модели компьютерной сети связи, управляемой динамическим протоколом доступа..............................................16
Поддубный В.В., Романович О.В. Имитационное статистическое моделирование
рынка одного товара с оптимальной детерминированной стратегией поставки
товара в условиях стохастичности спроса ..........................................................................28
ОБРАБОТКА ИНФОРМАЦИИ
Бобров А.В., Перепелкин Е.А. Построение робастных оценок средних значений и
вариаций двумерных данных на основе спектральной матричной нормы.......................39
Буркатовская Ю.Б., Воробейчиков С.Э., Сергеева Е.Е. Оценивание параметров и
обнаружение момента их изменения для обобщенного авторегрессионного процесса с условной неоднородностью.....................................................................................48
Горцев А.М., Калягин А.А. Вероятность ошибочных решений при оценивании состояний обобщенного полусинхронного потока событий .................................................58
Дюнова Д.Н., Рутковский А.Л. Параметрическая идентификация объектов управления, функционирующих в замкнутых системах .............................................................71
Крысанова К.А., Моисеева С.П. Метод асимптотического анализа для исследования параллельного обслуживания кратных заявок потока Марковского восстановления.................................................................................................................................82
Лившиц К.И., Бублик Я.С. Распределение условного времени до разорения страховой компании при дважды стохастических потоках страховых премий и страховых выплат .........................................................................................................................91
Медведев Г.А. О временной структуре доходности. 1. Модель Васичека ..........................102
Статкевич C.Э., Маталыцкий М.А. Исследование сети массового обслуживания с
ненадежными системами в переходном режиме ..............................................................112
ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
Капилевич В.Л. Архитектурное проектирование системы инновационной организации и поддержки учебного процесса в высшем учебном заведении ...........................126
Курносов М.Г., Пазников А.А. Децентрализованные алгоритмы диспетчеризации
пространственно-распределённых вычислительных систем...........................................133
МЕМУАРЫ, ПАМЯТНЫЕ ДАТЫ, ПЕРСОНАЛИИ
80 лет профессору ФЕЛИКСУ ПЕТРОВИЧУ ТАРАСЕНКО ................................................143
75 лет профессору ПОДДУБНОМУ ВАСИЛИЮ ВАСИЛЬЕВИЧУ.....................................146
СВЕДЕНИЯ ОБ АВТОРАХ ......................................................................................................149
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
TOMSK STATE UNIVERSITY
2012
Journal of Control and Computer Science
No. 1(18)
CONTENTS
CONTROL OF DYNAMICAL SYSTEMS
Pristupa M.Yu., Smagin V.I. Model Predictive Control discrete systems with unknown
input and its application to control problem of economic object...............................................5
MATHEMATICAL MODELLING
Lyubina T.V., Nazarov A.A. Research non-markovian models of the computer communication network operated the dynamic report of access .........................................................16
Poddubny V.V., Romanovich O.V. Simulation statistical modeling of the market of one
goods with the optimal deterministic strategy of the delivery of goods in condition of
fortuity of demand...................................................................................................................28
DATА PROCESSING
Bobrov A.V., Perepelkin E.A. Construction of robust estimates of mean values and
variations of two-dimensional data on the basis of the spectral matrix norm ..........................39
Burkatovskaya Yu.B., Vorobeychikov S.E., Sergeeva E.E. Parameter estimation and
their change-point detection for generalized autoregressive process with conditional
heteroscedasticity ....................................................................................................................48
Gortsev A.M., Kalyagin A.A. The probability of wrong decisions in the estimation of
states of a generalized semi-synchronous flow of events ........................................................58
Dyunova D.N., Rutkovsky A.L. Parametric identification of the control objects functioning in closed systems.........................................................................................................71
Krysanova K.A., Moiseeva S.P. Method of the asymptotic analysis for research of parallel service multiple demands of Markov renewal stream......................................................82
Livshits K.I., Bublic Y.S. Distribution of the conditional time before ruin of an insurance
company under double stochastic insurance premium and insurance payment streams ..........91
Medvedev G.A. On term structure of yield rates. 1. Vasiček model ...................................... 102
Statkevich S.E., Matalytski M.A. Investigation of queueing network with unreliable
systems at transient regime ......................................................................................... 112
INFORMATICS AND PROGRAMMING
Kapilevich V.L. Architectural design of the system for university innovation management and educational process supporting ..............................................................................126
Kurnosov M.G., Paznikov A.A. Decentralized scheduling algorithms of geographicallydistributed computer systems ...................................................................................... 133
MEMOIRS, MEMORABLE DATE, PERSONALITIES
80 years to Prof. F.P. Tarasenko..................................................................................................143
75 years to Prof. V.V. Poddubny .................................................................................................146
BRIEF INFORMATION ABOUT THE AUTHORS ..................................................................149
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
УДК 519.2
М.Ю. Приступа, В.И. Смагин
ПРОГНОЗИРУЮЩЕЕ УПРАВЛЕНИЕ ДИСКРЕТНЫМИ СИСТЕМАМИ
С НЕИЗВЕСТНЫМ ВХОДОМ И ЕГО ПРИМЕНЕНИЕ К ЗАДАЧЕ
УПРАВЛЕНИЯ ЭКОНОМИЧЕСКИМ ОБЪЕКТОМ
Рассматривается задача синтеза прогнозирующего управления, построенного на основе слежения за выходом системы при наличии неизвестного входа.
Прогнозирование осуществляется на основе вычисления оценок состояний
объекта, построенных с использованием экстраполятора Калмана, и оценок
неизвестного входа. Рассматривается задача управления экономической системой производства, хранения и поставок товара потребителям.
Ключевые слова: дискретные системы, прогнозирующее управление, оценки неизвестного входа, модель производства.
При синтезе управлений широко используется метод управления динамическими объектами с применением прогнозирующих моделей – Model Predictive
Control (MPC) [1, 2]. Область применения MPC охватывает задачи управления
технологическими процессами, производственными системами и финансовую математику (управление портфелем ценных бумаг) [1−5] и др.
В работе рассматривается задача синтеза прогнозирующего управления для
динамических объектов с неизвестным входом, при этом применяются методы
вычисления оценок вектора состояния объекта, использующие оценки неизвестного возмущения (входа) [6−15]. В [6, 7] для вычисления оценок неизвестного
возмущения рассматриваются алгоритмы расширения пространства состояний (к
основной модели объекта добавляется модель ненаблюдаемого возмущения) и алгоритм двухэтапной фильтрации, уменьшающий вычислительные затраты за счет
декомпозиции задачи. В работах [8−15] для вычисления таких оценок предложены алгоритмы рекуррентной оптимальной фильтрации, не использующие метод
расширения пространства состояний.
Предложено синтезировать прогнозирующее управление с использованием
оценок неизвестного входа, которые могут вычисляться двумя способами в зависимости от уровня априорной информации: на основе фильтра Калмана и на основе модифицированного МНК. Рассмотрена задача синтеза прогнозирующего
управления производством, хранением и поставками товара с учетом случайных
факторов при неизвестном входе.
1. Постановка задачи
Модели объекта, канала наблюдений и управляемого выхода описываются
следующими соотношениями:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Ю. Приступа, В.И. Смагин
6
n
xt +1 = Axt + But + Irt + wt , xt =0 = x0 ;
(1)
ψ t = Hxt + vt ;
(2)
yt = Gxt ,
(3)
где xt ∈ R − состояние объекта, ut ∈ R
m
− управляющее воздействие (известный
вход), rt ∈ R q − неизвестный входящий сигнал, ψ t ∈ R l − наблюдения, выход
системы контроля, y t ∈ R p − управляемый выход, A, B, I, H, G – матрицы соответствующих размерностей. Предполагается, что случайные возмущения wt и шумы измерения vt не коррелированы между собой и подчиняются гауссовскому
распределению с нулевым средним и с соответствующими ковариациями:
Μ{wt wkΤ } = W δt ,k , Μ{vt vkΤ } = V δt ,k ,
где δt ,k – символ Кронекера. В (1) вектор начальных условий x0 является случайным, некоррелированным с величинами wt и vt и определяется следующими
характеристиками:
Μ{x0 } = x0 , Μ{( x0 − x0 )( x0 − x0 )Τ } = Px .
0
Ограничения на векторы состояния и управления зададим в виде
a1 ≤ S1 xt ≤ a2 , ϕ1 ( xt ) ≤ S2ut ≤ ϕ2 ( xt ) ,
(4)
где S1 и S2 – структурные матрицы, состоящие из нулей и единиц и определяющие
компоненты векторов xt и ut, на которые накладываются ограничения; a1, a2, φ1(xt),
φ2(xt) – заданные постоянные векторы и вектор-функции соответствующих размерностей.
Задача состоит в том, чтобы по наблюдениям ψt определить стратегию управления, при которой вектор выхода системы yt будет близок к заданному вектору с
учетом ограничений (4).
2. Прогнозирование поведения объекта
Модель (1) используется для прогнозирования поведения объекта на протяжении всего горизонта прогнозирования, обозначаемого N, на основе информации,
имеющейся в момент времени t. Осуществим синтез алгоритма оптимального
прогнозирования поведения объекта и вектора выхода, используя экстраполятор
Калмана [16]. Пусть xˆi| j и yˆi| j − оценки состояния и вектора выхода в момент
времени i, вычисляющие информацию с j-го момента времени, j ≤ i. Тогда:
xˆt +1|t = Axˆt|t −1 + But + Irˆt + Kt (ψ t − Hxˆt|t −1 ) , x̂0|−1 = x0 ;
yˆt +1|t = Gxˆt +1|t ;
(5)
(6)
−1
Kt = APt H Τ ( HPt H Τ + V ) ;
−1
Pt +1 = W + APt AΤ − APt H Τ ( HPt H Τ + V ) HPt AΤ , P0 = Px0 .
(7)
(8)
Для построения модели прогнозирования необходимо вычислить оценки неизвестного входа. Рассмотрим два подхода построения оценок неизвестного
входа rˆt .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прогнозирующее управление дискретными системами с неизвестным входом
7
Для того чтобы применить подход, основанный на использовании фильтра
Калмана, необходим определенный уровень априорной информации о неизвестном входе rt , например необходимо иметь модель поведения неизвестного входа.
Предположим, что закон его поведения задается следующим уравнением:
rt +1 = Rrt + τt , rt =0 = r0 ,
(9)
где R – матрица, определяющая динамику неизвестного сигнала, τt – случайная
гауссовская величина с нулевым средним и дисперсией Τ , r0 – случайный вектор
начальных
условий
с
известными
характеристиками
( Μ{r0 } = r0 ,
Μ{(r0 − r0 )(r0 − r0 )Τ } = Pr0 ). Предполагается, что τt не коррелирована со случай-
ными возмущениями wt и шумами измерения vt.
Применяя фильтр Калмана к модели (9), получим оценку неизвестного сигнала
в момент времени t+1, которая определяется из следующих выражений:
rˆt +1 = Rrˆt + K t (ψ t +1 − HAxˆt|t −1 − HBut − HIrˆt ) , r̂0 = r0 ,
−1
Kt = Pt H Τ ( HPt H Τ + HWH Τ + V ) ,
Pt +1 = ( En − Kt H ) Pt , P0 = Pr0 ,
(10)
где En – единичная матрица размера n×n.
Перейдем к рассмотрению второго подхода. В этом случае отсутствует необходимость знать модель поведения неизвестного входа (9). Вычисление значений
прогноза состояния системы (5) выполним как решение некоторой новой задачи
оптимального управления, при этом под управлением понимаются значения неизвестного входа rˆt . Критерий оптимальности строится исходя из принципа минимума ошибок прогнозируемых оценок вектора состояния. Второй подход является
вариантом модифицированного МНК. В качестве критерия оптимальности будем
использовать квадратическую функцию следующего вида:
t
{
J (rˆt −1 ) = ∑ ψ i − Hxˆi|i −1
i =1
2
CR
+ rˆi −1
2
DR
},
(11)
где CR и DR – симметричные, положительно определенные матрицы.
Оптимизация критерия до текущего момента времени t сводится к минимизации критерия в каждый момент времени i = 1, t :
t
{
J (rˆt −1 ) = min min … min ∑ ψi − Hxˆi|i −1
rˆ0
rˆ1
rˆt −1
i =1
2
CR
+ rˆi −1
2
DR
}.
(12)
Оптимальная оценка неизвестного входа на шаге t = 1 :
{
+ rˆ0
2
DR
}.
J (rˆ0 ) = min ψ1 − HAx0 − HBu0 − HIrˆ0
2
CR
+ rˆ0
J (rˆ0 ) = min ψ1 − Hxˆ1|0
rˆ0
2
CR
Учитывая, что xˆ1|0 = Ax0 + Bu0 + Irˆ0 , имеем
rˆ0
{
После преобразований получаем
2
DR
}.
(13)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Ю. Приступа, В.И. Смагин
8
{ (
}
)
J (rˆ0 ) = min rˆ0Τ I Τ H T CR HI + DR rˆ0 − 2rˆ0Τ I Τ H T CR ( ψ1 − HAx0 − HBu0 ) + α 0 ,
rˆ0
где α 0 – величина, не зависящая от r̂0 .
Оптимальная оценка находится из условия
∂J (rˆ0 )
= 2 I Τ H T CR HI + DR rˆ0 − 2 I Τ H T CR ( ψ1 − HAx0 − HBu0 ) = 0 ,
ˆ
∂r0
(
)
откуда получаем оптимальную оценку неизвестного входа в момент времени
t =1:
rˆ0 = S R ( ψ1 − HAx0 − HBu0 ) ,
(14)
(
где S R = I Τ H T CR HI + DR
)
−1 Τ
I H T CR . Подставляя полученное выражение для r̂0
в (13), вычисляем оптимальное значение критерия в момент времени t = 1 :
Τ
J (rˆ0 ) = ( ψ1 − HAx0 − HBu0 ) M R ( ψ1 − HAx0 − HBu0 ) ,
(
(15)
)
где M R = CR − 2CR HIS R + S RΤ I Τ H T CR HI + DR S R .
В момент времени t = 2 оптимальная оценка неизвестного входящего сигнала
находится исходя из оптимизации следующего критерия:
{
J (rˆ1 ) = min min ψ 2 − Hxˆ2|1
rˆ0
rˆ1
2
+ rˆ1
CR
2
DR
+ ψ1 − Hxˆ1|0
2
CR
+ rˆ0
2
DR
}.
Используя принцип оптимальности Беллмана, выражение для J (rˆ1 ) может
быть преобразовано следующим образом:
{
2
J (rˆ1 ) = min ψ 2 − Hxˆ2|1
rˆ1
{
= min ψ 2 − HAxˆ1|0 − HBu1 − HIrˆ1
rˆ1
{ (
2
CR
CR
+ rˆ1
+ rˆ1
2
DR
2
DR
}
+ J (rˆ0 ) =
+ ψ1 − HAx0 − HBu0
2
MR
}=
}
)
= min rˆ1Τ I Τ H T CR HI + DR rˆ1 − 2rˆ1Τ I Τ H T CR ( ψ 2 − HAxˆ1|0 − HBu1 ) + α1 ,
rˆ1
где α1 – величина, не зависящая от r̂1 . Дифференцируя по r̂1 , по аналогии с операциями, проведенными на первом шаге, имеем
rˆ1 = S R ( ψ 2 − HAxˆ1|0 − HBu1 ) ;
Τ
J (rˆ1 ) = ( ψ 2 − HAxˆ1|0 − HBu1 ) M R ( ψ 2 − HAxˆ1|0 − HBu1 ) .
(16)
(17)
Применяя принцип Беллмана для последующих шагов и метод математической
индукции, получаем
rˆt = S R ( ψ t +1 − HAxˆt|t −1 − HBut ) .
(18)
Таким образом, учитывая динамику оценок неизвестного входа (10), (18), прогнозирование поведения объекта и выхода системы может быть выполнено по
следующим формулам:
i −1
i −1
k =1
k =1
xˆt +i|t = Ai −1 xˆt +1|t + ∑ Аi −k −1But + k|t + ∑ Аi −k −1Irˆt + k , yˆt +i|t = Gxˆt +i|t , i = 1, N ,
(19)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прогнозирующее управление дискретными системами с неизвестным входом
9
где ut+k|t – управление, используемое для прогнозирования, rˆt + k – оценки прогноза неизвестного входа, которые строятся исходя из того, какой метод оценивания
был выбран. В случае отсутствия априорной информации о поведении неизвестного входа оценки прогноза rˆt + k могут быть построены на основе методов прогнозирования временных рядов. В случае, когда модель поведения неизвестного
входа известна, целесообразно строить прогноз rˆt + k на основе уравнения динамики (9):
rˆt + k = Rrˆt + k −1 ,
где начальное значение rˆt +1 определяется из (10).
Уравнения для прогнозируемых векторов состояния и выхода представляются
в векторно-матричной форме. Для этого вводятся следующие векторы и матрицы:
⎡ En ⎤
⎡ G ⎤
⎢
⎥
⎢ GA ⎥
ˆ
ˆ
ˆ
x
y
u
r
A
⎡ t +1|t ⎤
⎡ t +1|t ⎤
⎡ t +1|t ⎤
⎡ t +1|t ⎤
⎢
⎥
⎢
⎥
2
⎢
⎥
⎢
⎥
⎢
⎥
⎢
⎥
Xˆ t =
, Yˆt =
, Ut =
, Rˆt =
, Ψ = ⎢ A ⎥ , Λ = ⎢ GA2 ⎥ ,
⎢
⎥
⎢
⎥
⎢
⎥
⎢
⎥
⎢
⎥
⎢
⎥
⎣⎢ yˆt + N |t ⎦⎥
⎣⎢ut + N |t ⎦⎥
⎣⎢ rˆt + N |t ⎦⎥
⎣⎢ xˆt + N |t ⎦⎥
⎢ N −1 ⎥
⎢ N −1 ⎥
⎣A ⎦
⎣GA ⎦
⎡ 0
⎢ B
⎢
Ρ = ⎢ AB
⎢
⎢ N −2
⎣A B
0
0
B
0
0
0
…
A N −3 B
B
0⎤
0
⎡ 0
⎢ GB
0⎥
0
⎥
⎢
0 ⎥ , Φ = ⎢ GAB
GB
⎥
⎢
⎥
⎢ N −2
N −3
0⎦
⎣GA B GA B
0
0
0
…
GB
0⎤
0⎥
⎥
0⎥,
⎥
⎥
0⎦
0
0 … 0⎤
0
0 … 0⎤
⎡ 0
⎡ 0
⎢ I
⎥
⎢
GI
0
0
0
0
0
0⎥
⎢
⎥
⎢
⎥
0
0 ⎥ , Q = ⎢ GAI
0
0 ⎥ . (20)
I
GI
S = ⎢ AI
⎢
⎥
⎢
⎥
⎢ N −2
⎥
⎢ N −2
⎥
N −3
N −3
I 0⎦
GI 0 ⎦
⎣A I A I
⎣GA I GA I
Прогнозирующая модель (19) может быть представлена в виде следующей
системы:
Xˆ = Ψxˆ + ΡU + SRˆ ,
t
t +1|t
t
t
Yˆt = Λxˆt +1|t + ΦU t +QRˆt .
(21)
Схема преобразования ограничений (4) для прогнозирующей модели подробно
изложена в [5].
3. Синтез прогнозирующего управления
Для решения поставленной задачи в качестве целевой функции используется
критерий
J (t ) =
1 N
∑ yˆt +k|t − yt +k
2 k =1
{
2
C
+ ut + k |t − ut + k −1|t
где матрицы C > 0 и D > 0 – весовые матрицы.
2
D
},
(22)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Ю. Приступа, В.И. Смагин
10
Критерий (22) преобразуется к векторно-матричному виду:
1
J (t ) = U tΤ FU t + U tΤ f + α ,
(23)
2
где α – слагаемое, не зависящее от управления,
⎡ xˆt +1|t ⎤ ⎡ Dut ⎤
⎡ yt +1|t ⎤
⎢ ˆ ⎥ ⎢ 0 ⎥
Τ
Τ
Τ
Τ
⎢
⎥,
F = Φ C Φ + D , f = Γ ⎢ Rt ⎥ − ⎢
⎥ , Γ = ⎡⎣Φ C Λ Φ CQ −Φ C ⎤⎦ , Yt = ⎢
⎥
⎥
⎢ Yt ⎥ ⎢
⎣⎢ yt + N |t ⎦⎥
⎣
⎦ ⎢⎣ 0 ⎥⎦
C и D – диагональные матрицы, составленные из весовых коэффициентов
С и D:
0 ⎤
⎡ 2D −D 0
0⎤
⎡C 0
⎢−D 2D − D
⎥
0
⎢0 C
0⎥
⎢
⎥
C=⎢
⎥, D=⎢
⎥.
⎢
⎥
−D 2D −D⎥
⎢ 0
⎢⎣ 0 0
C ⎥⎦
⎢⎣ 0
0 − D 2 D ⎥⎦
Аналитическое решение cформулированной задачи квадратичного програмdJ (t )
= 0 с использовамирования без учета ограничений находится из условия
dU t
нием формул векторно-матричного дифференцирования [17]:
Τ
Τ
∂J (t )
∂ ⎡1 Τ
⎤ = 1 ∂ (trFU tU t ) + ∂ (U t f ) =
Τ
U
FU
U
f
=
+
+
α
t
t
t
⎥⎦ 2
∂U t
∂U t ⎢⎣ 2
∂U t
∂U t
1
(24)
= ⎡⎣ F ΤU t + FU t ⎤⎦ + f = 0.
2
В силу симметричности матрицы F уравнение (24) можно представить в виде
FU t + f = 0 .
Решение этого уравнения определяется выражением
⎛ Dut ⎞
⎜ 0 ⎟
= −(Φ C Φ + D) (Φ C Λxˆt +1|t + Φ CQRˆt − Φ CYt ) − ⎜
⎟.
⎜⎜
⎟⎟
⎝ 0 ⎠
Оптимальное прогнозирующее управление примет вид
U t*
Τ
−1
Τ
ut*+1|t = ( En
Τ
0
Τ
0 )U t* .
Оптимизация модели (1) – (3) с ограничениями (4) может быть выполнена
численно. Для оптимизации целевой функции (23) используется процедура quadprog системы Matlab.
4. Моделирование управления экономическим объектом
Рассмотрим задачу управления экономическим объектом, предназначенным
для производства, хранения и поставок товаров потребителям [3, 5]. Модель объекта с дополнительно включенными неизвестными составляющими возмущений
имеет вид
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прогнозирующее управление дискретными системами с неизвестным входом
11
qt +1 = Aqt +bt + ϕt +ξt , q0 = q0 ,
zt +1 = zt + B ωt + dt − ϕt + ζ t , z0 = z0 ,
(25)
где qt ∈ R s , qi,t − количество товара i-го типа у потребителя в момент времени t
( t = 1, T , i = 1, s ); zi,t − количество товаров i-го типа на складе производителя; ωi,t –
объем производства товаров i-го типа; φi,t – объем поставок товаров i-го типа; bt, dt
– неизвестные составляющие возмущений; ξt , ζ t – векторные гауссовские случайные
последовательности
(M{ ξt } = 0,
M{ ζ t } = 0,
Μ{ξt ξΤk } = Σδt ,k ,
Μ{ζ t ζ Τk } = Ξδt ,k , Μ{ξt ζ Τk } = 0 ); A и B – матрицы, определяющие динамику про-
изводства и потребления.
В каждый момент времени t должны выполняться ограничения
zmin ≤ zt ≤ zmax, 0 ≤ ωt ≤ ωmax, 0 ≤ ϕt ≤ zt.
Переменные ωt и ϕt рассматриваются как управляющие воздействия. Неизвестные составляющие возмущений вводятся по той причине, что на практике параметры модели (матрицы A и B ) часто определяются с погрешностями, влияние которых может быть учтено за счет введения неизвестных возмущений. Задача состоит в том, чтобы по наблюдениям определить стратегию управления производством, хранением и поставками товара, обеспечивающую количество товаров у потребителя qt, близкое к заданному вектору q , при этом должны учитываться ограничения.
Модель системы (25) преобразуется к виду модели (1). Оптимизационная
задача решается на каждой итерации для прогнозируемых значений вектора состояния.
Моделирование проведено при постоянных неизвестных возмущениях для
следующих исходных данных:
0,75
0 ⎤
0,3 0,1⎤
0,1
1,5
A = ⎡⎢
, B = ⎡⎢
, zmin = ⎡⎢ ⎤⎥ , zmax = ⎡⎢ ⎤⎥ ,
⎥
⎥
⎣0, 2 0,8⎦
⎣ 0,1⎦
⎣ 2,5⎦
⎣ −0, 25 0,9 ⎦
0,8
0, 2
0
1
0,1
ωmax = ⎡⎢ ⎤⎥ , z0 = ⎡⎢ ⎤⎥ , q0 = ⎡⎢ ⎤⎥ , q = ⎡⎢ ⎤⎥ , ω0 = ω1 = ϕ0 = ϕ1 = ⎡⎢ ⎤⎥ ,
0,7
0,
2
0
2
⎣ ⎦
⎣ ⎦
⎣ ⎦
⎣ 0,1⎦
⎣ ⎦
Τ
Τ
Τ
b = [ 0,05 0,03] , d = [ 0,04 0,02] , bˆ0 = dˆ0 = [ 0 0] , h1 = h2 = 1 , N=10,
C = E2 , Px0 = Pr0 = H = D = E4 , W = 0, V = diag{0,0005; 0,0005; 0,0005 ; 0,0005}.
Результаты численного моделирования с использованием фильтра Калмана
для построения оценок неизвестного входа приведены в виде графиков переходных процессов на рис. 1–4.
Результаты численного моделирования с применением модифицированного
МНК для построения оценок неизвестного входа приведены на рис. 5–8. Прогнозирование оценок неизвестного входа осуществлено с помощью линейной экстраполяции. Для улучшения качества оценок прогноза использован метод экспоненциального сглаживания.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Ю. Приступа, В.И. Смагин
12
q1
q2
1
2
q1
q2
0,5
0
1
10
20
t
0
10
20
t
Рис. 1. Динамика изменения количества товаров у потребителя
z1,ϕ1
z2,ϕ2
1
0,5
0
2
z1
zmin1
10
1
ϕ1
20
z2
t
zmin2
0
10
ϕ2
20
t
Рис. 2. Динамика изменения количества товаров на складе и объемов поставок
ω1
ω1
ωmax1
0,6
0,6
0,5
0,5
0,2
0
ωmax2
0,2
ωmin1
10
20
t
ωmin2
0
10
20
t
Рис. 3. Процессы изменения объемов производства товаров
b1
b2
0,06
0,05
0,04
b1
0
0,02
10
20
t
10
20
t
20
t
d2
d1
0,06
0,04
d1
d2
0,04
0,02
0
0
b2
0,02
10
20
t
0
10
Рис. 4. Входные сигналы и их оценки
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прогнозирующее управление дискретными системами с неизвестным входом
q1
q2
1
2
q1
q2
0,5
0
1
10
20
t
0
10
20
t
Рис. 5. Графики изменения количества товаров у потребителя
z1,ϕ1
z2,ϕ2
z1
1
0,5
1
zmin1 ϕ1
0
z2
2
10
20
t
ϕ2
zmin2
0
10
20
t
Рис. 6. Графики изменения количества товаров на складе и объемов поставок
ω1
ω1
0,6
ωmax1
0,6
0,5
0,5
0,2
0
ωmax2
ωmin1
10
20
0,2
t
0
ωmin2
10
20
t
Рис. 7. Процессы изменения объемов производства товаров
b2
b1
b1
0,06
b2
0,04
0,04
0,02
0,02
0
10
20
t
0
10
20
t
20
t
d2
d1
0,06
0,03
d1
0,04
0,02
0,02
0,01
d2
0
0
10
20
t
0
10
Рис. 8. Входные сигналы и их оценки
13
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
14
М.Ю. Приступа, В.И. Смагин
Заключение
Разработан метод решения задачи управления на основе синтеза прогнозирующего управления выходом дискретного объекта при наличии неизвестного
входа, для реализации которого предложено использовать два алгоритма построения оценок неизвестного входа. Второй алгоритм, основанный на применении
модифицированного МНК, для реализации управления с прогнозированием требует существенно меньшего уровня априорной информации о неизвестном входе,
тем самым снимает вопрос об идентификации модели неизвестного входа, что играет важную роль при решении практических задач. Результаты моделирования
показали, что основная цель (определение стратегии управления объектом, при
которой вектор выхода будет близок к заданному вектору) достигается в обоих
случаях.
ЛИТЕРАТУРА
1. Maciejowski J.M. Predictive control with constraints. Prentice Hall, 2002. 331 p.
2. Camacho E. F., Bordons C. Model predictive control. London: Springer-Verlag. 2004. 405 p.
3. Перепелкин Е. А. Прогнозирующее управление экономической системой производства,
хранения и поставок товаров потребителям // Экономика и математические методы.
2004. Т. 40. №. 1. С. 125–128.
4. Домбровский В.В., Домбровский Д.В., Ляшенко Е.А. Управление с прогнозирующей моделью системами со случайными зависимыми параметрами при ограничениях и применение к оптимизации инвестиционного портфеля // Автоматика и телемеханика.
2006. № 12. C. 71–85.
5. Киселева М.Ю., Смагин В.И. Управление производством, хранением и поставками товаров на основе прогнозирующей модели выхода системы // Вестник Томского государственного университета. Управление, вычислительная техника и информатика.
2009. № 2(7). C. 24–30.
6. Friedland B. Treatment of bias in recursive filtering // IEEE Trans. Automat. Contr. 1969.
V. AC-14. P. 359−367.
7. Astrom K., Eykhoff P. System identification. A survey // Automatica. 1971. V.7. P.123−162.
8. Hou M., Patton R. Optimal filtering for systems with unknown inputs // IEEE Trans. on
Automat. Contr. 1998. V. AC-43. P. 445–449.
9. Darouach M., Zasadzinski M., Xu S. J. Full-order observers for linear systems with unknown
inputs // IEEE Trans. Automat. Contr. 1999. V. AC-39. P. 606.
10. Hsieh C.-S. Robust two-stage Kalman filters for systems with unknown inputs // IEEE Trans.
Automat. Contr. 2000. V. AC-45. – P. 2374–2378.
11. Janczak D., Grishin Y. State estimation of linear dynamic system with unknown input and
uncertain observation using dynamic programming // Control and Cibernetics. 2006.
V. 35(4). P. 851–862.
12. Gillijns S., Moor B. Unbiased minimum-variance input and state estimation for linear discrete-time systems // Automatica. 2007. V. 43. P. 111–116.
13. Hsieh C.-S. Extension of the optimal unbiased minimum-variance filter for systems with unknown inputs // Proc. 15th IEEE International Workshop on Nonlinear Dynamics of Electronic Systems. Tokushima. Japan. 2007. P. 217–220.
14. Hsieh C.-S. Robust parameterized minimum variance filtering for uncertain systems with unknown inputs // Proc. American Control Conference. New York, 2007. P. 5118–5123.
15. Hsieh C.-S. A unified solution to unbiased minimum-variance estimation for systems with
unknown inputs // Proc.17th World Congress The International Federation of Automatic
Control. Seoul. Korea. July 6−11, 2008. P. 14502–14509.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прогнозирующее управление дискретными системами с неизвестным входом
15
16. Brammer K. and Siffling G. Kalman-Bucy Filters. Norwood, MA: Artech House, Inc., 1989.
391 p.
17. Athans M. The matrix minimum principle // Information and Control. 1968. V. 11. Nо. 5/6.
P. 592–606.
Приступа Марина Юрьевна
Смагин Валерий Иванович
Томский государственный университет
E-mail: vsm@mail.tsu.ru, kiselevamy@gmail.com
Поступила в редакцию 26 октября 2011 г.
Pristupa Marina Yu., Smagin Valery I. (Tomsk State University). Model Predictive Control discrete systems with unknown input and its application to control problem of economic object.
Keywords: discrete systems, model predictive control, estimations unknown input, production
model.
The problem considered in the paper deals with synthesis of Model Predictive Control that is
applied to the discrete system containing unknown input. The control is carried out on the base of
the system output tracking. The prediction is derived on the base of state estimation obtained by
Kalman filter (extrapolator) and unknown input estimations. Two methods are considered to be
used for evaluating the unknown input estimations. The first is based on the applying Kalman filter, the second – on the modified least-squares method. It is discussed that the choice of the
method depends on the available a priori statistical information concerning unknown input signals.
The model investigated in the paper contains states, known and unknown inputs and disturbances acting on the system. It is assumed also that the system is operating under the state and input constraints. The aim of the system control is to synthesize control inputs based on observations providing the system output to be close to the reference.
The simulation results of the proposed methods are given for an example of the goods production, storage and delivery to consumers’ problem.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
УДК 519.872
Т.В. Любина, А.А. Назаров
ИССЛЕДОВАНИЕ НЕМАРКОВСКОЙ МОДЕЛИ
КОМПЬЮТЕРНОЙ СЕТИ СВЯЗИ, УПРАВЛЯЕМОЙ
ДИНАМИЧЕСКИМ ПРОТОКОЛОМ ДОСТУПА1
В статье рассматривается немарковская модель компьютерной сети связи,
управляемая динамическим протоколом доступа. Проводится анализ математической модели сети связи и находится характеристическая функция
числа заявок в источнике повторных вызовов. Найдено условие существования стационарного режима сети. Получено распределение вероятностей
числа заявок в источнике повторных вызовов.
Ключевые слова: RQ-система, динамический протокол доступа, конфликт
заявок, оповещение о конфликте, стационарный режим.
Построение адекватных математических моделей телекоммуникационных, вычислительных, производственных систем может быть осуществлено в рамках теории массового обслуживания [1–3]. Сети связи обеспечивают возможность оперативно получать, обрабатывать и передавать необходимую информацию. Поэтому
актуальной является задача построения адекватных моделей сетей связи случайного доступа и методов их исследования. Исследованию сетей связи в виде систем массового обслуживания (СМО) с источником повторных вызовов посвящены работы А.А. Назарова [4, 5], Г.И. Фалина [6, 7], В.И. Клименок [8], И.И. Хомичкова [9−11] и др. Методы теории массового обслуживания [1−3] являются
наиболее действенными в проведении исследований компьютерных сетей связи,
адекватными математическими моделями которых являются RQ-системы (Retrial
Queueing systems) [6, 12, 13]. В монографии J. R. Artalejo, A. Gomez-Corral [12]
приведено большое количество ссылок на работы, опубликованные за последние
двадцать лет, по этой тематике.
Представляет интерес рассмотрение моделей, учитывающих интервалы недоступности прибора (моноканала), когда реализуется этап оповещения о конфликте
[14], а также исследование сетей связи, управляемых статическими [15], динамическими [16, 17], адаптивными [18] протоколами случайного множественного
доступа.
В статье рассмотрим немарковскую модель компьютерной сети связи, управляемую динамическим протоколом доступа.
Работа выполнена при поддержке АВЦП «Развитие научного потенциала высшей школы
(2009−2011 годы)», проект № 2.1.2/11803 «Разработка методов исследования немарковских
систем массового обслуживания и их применение к сложным экономическим системам и
компьютерным сетям связи».
1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование немарковской модели компьютерной сети связи
17
1. Постановка задачи
Любая абонентская станция, сформировав свое сообщение, отправляет его на
общий ресурс. Если ресурс свободен, то начинает осуществляться немедленная
передача сообщения, которая заканчивается успешно, если другие сообщения не
поступали. А если во время передачи некоторого сообщения поступает другое,
происходит наложение сигналов, сообщения считаются искаженными, то есть
возникает конфликт. От момента возникновения конфликта рассылается сигнал
оповещения о конфликте. Сообщения, попавшие в конфликт, а также поступившие на этапе оповещения о конфликте, считаются искаженными и переходят в источник повторных вызовов (ИПВ), откуда вновь обращаются к ресурсу после случайного времени задержки. Задачей данной работы является нахождение распределения вероятностей состояний системы.
2. Математическая модель
Математическую модель сети связи рассмотрим в виде немарковской однолинейной RQ-системы, управляемой динамической дисциплиной обслуживания, на
вход которой поступает простейший поток заявок с интенсивностью λ (рис. 1).
Требование, заставшее прибор свободным, занимает его для обслуживания в течение случайного времени, имеющего произвольную функцию распределения
B(x). Если во время обслуживания одной заявки поступает другая, то они вступают в конфликт. От этого момента начинает реализовываться этап оповещения о
конфликте. Длины интервалов оповещения о конфликте имеют функцию распределения А(x). Обе заявки, попавшие в конфликт, а также заявки, поступившие на
интервале оповещения о конфликте, переходят в источник повторных вызовов
(ИПВ), из которого с динамической (зависящей от состояния ИПВ) интенсивностью σ / i вновь обращаются к прибору с попыткой повторного обслуживания, то
есть вероятность обращения к прибору за время ∆t для любой заявки из ИПВ соσ
ставляет ∆t + o(∆t ) , если в ИПВ находится i заявок. Если прибор свободен, то
i
поступающая заявка становится на обслуживание, если же он занят, то вновь возникает конфликт заявок и процедура его разрешения повторяется.
σ/ i
σ/ i
σ/ i
А(х)
λ
B(x)
Рис. 1. Немарковская динамическая RQ-система
с конфликтами заявок и оповещением о конфликтах
Задачей является нахождение распределения вероятностей состояний системы,
то есть числа заявок в источнике повторных вызовов и состояний прибора.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
18
Т.В. Любина, А.А. Назаров
3. Исследование немарковской модели компьютерной сети связи,
управляемой динамическим протоколом случайного доступа
Пусть i (t ) – число заявок в ИПВ, k (t ) – определяет состояние прибора следующим образом:
⎧0, если прибор свободен,
⎪
k (t ) = ⎨1, если прибор занят,
⎪⎩2, если идет этап оповещения о конфликте,
z(t) – длина интервала от момента t до момента окончания текущего режима
функционирования прибора при k ( t ) = 1 и k ( t ) = 2 в момент времени t.
Компонента z(t) определяется только в те моменты, когда k ( t ) ≠ 0 , если
k ( t ) = 0 , то компонента z(t) не определяется. Обозначим
P { k ( t ) = 0, i ( t ) = i} = P0 ( i, t ) ,
P { k ( t ) = k , i ( t ) = i, z (t ) < z} = Pk ( i, z, t ) .
Процесс {k ( t ) , i ( t ) , z (t )} изменения во времени состояний описанной системы
является марковским.
Для распределений вероятностей P0 (i, t ) и Pk (i, z , t ) ∆t -методом по формуле
полной вероятности составим систему равенств
⎧ P0 (0, t + ∆t ) = P0 ( 0, t ) (1 − λ∆t ) + P1 ( 0, ∆t , t ) + o(∆t ),
⎪ P (0, z − ∆t , t + ∆t ) = [ P (0, z , t ) − P (0, ∆t , t )] (1 − λ∆t ) +
1
1
⎪ 1
⎪+ P0 ( 0, t ) λ∆tB( z ) + P0 (1, t ) σ∆tB ( z ) + o(∆t ),
⎪ P1 (1, t + ∆t ) = P0 (1, t ) (1 − λ∆t )(1 − σ∆t ) + P1 (1, ∆t , t ) + o(∆t ) ,
⎪
⎪ P1 (1, z − ∆t , t + ∆t ) = [ P1 (1, z , t ) − P1 (1, ∆t , t )] (1 − λ∆t )(1 − σ∆t ) +
⎪+ P0 (1, t ) λ∆tB ( z ) + P0 ( 2, t ) σ∆tB ( z ) + o(∆t ),
⎨
⎪...
⎪ P0 (i, t + ∆t ) = P0 ( i, t ) (1 − λ∆t )(1 − σ∆t ) + P1 ( i, ∆t , t ) + P ( 2 i, ∆t , t ) + o(∆t ) ,
⎪ P (i, z − ∆t , t + ∆t ) = [ P (i, z , t ) − P (i, ∆t , t ) ] (1 − λ∆t )(1 − σ∆t ) +
1
1
⎪ 1
⎪+ P0 ( i, t ) λ∆tB ( z ) + P0 ( i + 1, t ) σ∆tB( z ) + о(∆t ),
⎪ P (i, z − ∆t , t + ∆t ) = [ P (i, z , t ) − P (i, ∆t , t )] (1 − λ∆t ) + P ( i − 1, z, t ) λ∆t +
2
2
2
⎪ 2
⎩+ P1 ( i − 2, ∞, t ) λ∆tA( z ) + P1 ( i − 1, ∞, t ) σ∆tA( z ) + о(∆t ),
(1)
применяя которые, получим систему дифференциальных уравнений Колмогорова,
∂P ( 0, z , t )
∂P ( 0, 0, t )
:
= 1
в которой обозначим 1
∂z
∂z
z =0
∂P (0, 0, t )
⎧ ∂P0 (0, t )
= − P0 (0, t )λ + 1
,
⎪⎪ ∂t
∂z
⎨
⎪ ∂P1 (0, z , t ) = ∂P1 (0, z , t ) − ∂P1 (0, 0, t ) − P (0, z , t )λ + P ( 0, t ) λB ( z ) + P (1, t ) σB ( z ),
1
0
0
⎪⎩
∂t
∂z
∂z
∂P (0, 0, t )
⎧ ∂P0 (1, t )
,
= − P0 (1, t )(λ + σ) + 1
⎪⎪ ∂t
∂z
⎨
⎪ ∂P1 (1, z , t ) = ∂P1 (1, z , t ) − ∂P1 (1, 0, t ) − P (1, z , t )(λ + σ) + P (1, t ) λB ( z ) + P ( 2, t ) σB ( z ),
1
0
0
⎪⎩
∂t
∂z
∂z
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование немарковской модели компьютерной сети связи
19
…
∂P1 (i, 0, t ) ∂P2 (i, 0, t )
⎧ ∂P0 (i, t )
+
,
⎪ ∂t = − P0 (i, t )(λ + σ) +
∂z
∂z
⎪
⎪⎪ ∂P1 (i, z , t ) = ∂P1 (i, z , t ) − ∂P1 (i, 0, t ) − P (i, z , t )(λ + σ) + P ( i, t ) λB ( z ) + P ( i + 1, t ) σB( z ),
1
0
0
⎨
∂t
∂z
∂z
⎪ ∂P2 (i, z , t ) ∂P2 (i, z , t ) ∂P2 (i, 0, t )
=
−
− P2 (i, z , t )λ + P2 (i − 1, z , t )λ + P1 ( i − 2, t ) λA( z )
⎪
∂t
∂z
∂z
⎪
+ P1 ( i − 1, t ) σA( z ).
⎪⎩
Запишем полученную систему для стационарного распределения P0 ( i, t ) = Π 0 (i ),
Pk (i, z , t ) = Π k (i, z ) :
∂Π1 (0, 0)
⎧
= 0,
⎪⎪−Π 0 (0)λ +
∂z
⎨
⎪ ∂Π1 (0, z ) − ∂Π1 (0, 0) − Π (0, z )λ + Π ( 0 ) λB ( z ) + Π (1) σB ( z ) = 0,
1
0
0
⎪⎩ ∂z
∂z
∂Π1 (0, 0)
⎧
= 0,
⎪⎪−Π 0 (1)(λ + σ) +
∂z
⎨
⎪ ∂Π1 (1, z ) − ∂Π1 (1, 0) − Π (1, z )(λ + σ) + Π (1) λB ( z ) + Π ( 2 ) σB( z ) = 0,
1
0
0
⎪⎩ ∂z
∂z
…
(2)
∂Π1 (i, 0) ∂Π 2 (i, 0)
⎧
+
= 0,
⎪−Π 0 (i )(λ + σ) +
∂z
∂z
⎪
⎪⎪ ∂Π1 (i, z ) − ∂Π1 (i, 0) − Π (i, z )(λ + σ) + Π ( i ) λB ( z ) + Π ( i + 1) σB( z ) = 0,
1
0
0
⎨ ∂z
∂z
⎪ ∂Π 2 (i, z ) ∂Π 2 (i, 0)
−
− Π 2 (i, z )λ + Π 2 (i − 1, z )λ + Π1 ( i − 2 ) λA( z ) +
⎪
∂z
⎪ ∂z
⎪⎩+Π1 ( i − 1) σA( z ) = 0.
Чтобы решить систему (2), определим характеристические функции
∞
∞
i =0
i =0
H 0 (u ) = ∑ e jui Π 0 (i ) , H k (u , z ) = ∑ e jui Π k (i, z ) .
(3)
Из системы (2) с учётом равенств (3) получаем следующую систему уравнений
для функций H 0 (u ) и H k (u , z ) :
∂H1 (u , 0) ∂H 2 (u, 0)
⎧
+
+ Π 0 (0)σ = 0,
⎪− H 0 (u )(λ + σ) +
∂z
∂z
⎪
⎪ ∂H1 (u, z ) − H (u, z )(λ + σ) = ∂H1 (u , 0) − H (u )(λ + e − ju σ) B ( z ) −
1
0
⎪ ∂z
∂z
⎪
− ju
⎨−Π1 (0, z )σ + Π 0 ( 0 ) e σB ( z ),
⎪ ∂H (u , z )
∂H 2 (u , 0)
− H 2 (u , z )λ (1 − e ju ) =
− H1 (u )(λe 2 ju + σe ju ) A( z ) +
⎪ 2
z
z
∂
∂
⎪
⎪+Π1 ( 0 ) e ju σA( z ),
⎪
⎩
(4)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.В. Любина, А.А. Назаров
20
которая является системой трёх уравнений с тремя основными неизвестными
∂H1 (u, 0)
H 0 (u ) , H1 (u, z ) , H 2 (u , z ) и шестью вспомогательными неизвестными
,
∂z
∂H 2 (u , 0)
, H1 (u ) , Π 0 (0) , Π1 ( 0 ) и Π1 (0, z ) .
∂z
Нахождение вспомогательных неизвестных
Из первых двух уравнений системы (2) неизвестные Π1 (0, z ) и Π1 ( 0 ) выразим через величину Π 0 (0) . Для этого второе уравнение системы (2) запишем в
виде
∂Π1 (0, z )
∂Π1 (0, 0)
− Π1 (0, z )λ =
− Π 0 ( 0 ) λB ( z ) − Π 0 (1) σB ( z ),
∂z
∂z
откуда получим
z
⎧ ∂Π (0, 0)
⎫
Π1 (0, z ) = eλz ∫ e−λx ⎨ 1
− Π 0 ( 0 ) λB ( x) − Π 0 (1) σB( x) ⎬dx .
z
∂
⎩
⎭
0
(5)
Так как λ > 0 , следовательно, lim eλz = ∞ , а это означает, что для второго соz →∞
множителя выполняется предельное равенство
∞
∫e
0
−λx
⎧ ∂Π1 (0, 0)
⎫
− Π 0 ( 0 ) λB( x) − Π 0 (1) σB( x) ⎬dx = 0 .
⎨
z
∂
⎩
⎭
∂Π1 (0, 0)
− Π 0 ( 0 ) λB* (λ) − Π 0 (1) σB* (λ ) = 0 ,
∂z
Тогда
(6)
∞
B* (λ ) = ∫ e−λx dB( x) .
где
0
Из первого уравнения системы (2) следует, что
∂Π1 (0, 0)
= Π 0 (0)λ ,
∂z
поэтому уравнение (6) примет вид
(
(7)
)
Π 0 ( 0 ) λ 1 − B* (λ ) − Π 0 (1) σB* (λ ) = 0 ,
следовательно,
Π 0 (1)σ = λΠ 0 (0)
1 − B* (λ )
B* ( λ )
.
Тогда, с учётом равенств (7) и (8) уравнение (5) перепишем в виде
z
⎧
⎫
1 − B* (λ )
Π1 (0, z ) = Π 0 (0, 0)eλz ∫ e−λx ⎨λ − λB ( x) − λ *
B ( x) ⎬dx =
B (λ )
⎩
⎭
0
z
⎧
B( x) ⎫
= Π 0 (0)eλz ∫ e −λx λ ⎨1 − * ⎬dx.
⎩ B (λ ) ⎭
0
(8)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование немарковской модели компьютерной сети связи
21
Так как Π1 ( 0 ) = lim Π1 (0, z ) , то
z →∞
1 ⎞
λ ⎛⎜1 − *
⎛ 1
⎞
1 − B* (λ )
B (λ ) ⎟⎠
Π1 ( 0 ) = Π 0 (0) ⎝
= Π 0 (0) ⎜ *
− 1⎟ = Π 0 (0) *
.
−λ
B (λ )
⎝ B (λ ) ⎠
Для системы (4) можно записать
z
⎧
⎧ ∂H (u , 0)
( λ+σ ) z
H
u
z
e
e− (λ+σ ) x ⎨ 1
(
,
)
=
− H 0 (u ) λ + e − ju σ B ( x) −
⎪ 1
∫
z
∂
⎩
⎪
0
⎪
⎪ Π1 (0, x)σ + Π 0 (0)e− ju σB( x) dx,
⎪
(10)
⎨
z
⎪
λ (1− e ju ) z
−λ (1− e ju ) x ⎧ ∂H 2 (u , 0)
−
⎨
∫e
⎪ H 2 (u, z ) = e
∂z
⎩
0
⎪
⎪
ju
ju
2 ju
⎪ H1 (u ) λe + σe A( x) + Π1 (0)e σA( x) dx,
⎩
тогда получим следующую систему уравнений:
⎧ ∂H1 (u ,0)
− H 0 (u ) λ + e − ju σ B* (λ + σ) − Π1* (0, λ + σ)σ + Π 0 (0)e− ju σB* (λ + σ) = 0,
⎪ ∂z
⎪
⎪ ∂H1 (u ,0) + H (u ) ( λ + σ ) − H (u )(λ + σ) − Π (0)σ + Π (0)e − ju σ = 0,
1
0
1
0
⎪ ∂z
⎪⎪ ∂H 2 (u,0)
(11)
− H1 (u ) λe 2 ju + σe ju A* λ 1 − e ju + Π1 (0)e ju σA* λ 1 − e ju = 0,
⎨
∂
z
⎪
⎪ ∂H 2 (u,0) + H (u )λ 1 − e ju − H (u ) λe 2 ju + σe ju + Π (0)e ju σ = 0,
1
2
1
⎪ ∂z
⎪ ∂H (u ,0) ∂H (u,0)
⎪ 1
+ 2
− H 0 (u ) ( λ + σ ) + Π 0 (0)σ = 0,
∂z
⎩⎪ ∂z
(
)
}
(
(
)
) ( (
(
(
где
}
)
Π1 ( 0 ) = Π 0 (0)
)
(
1 − B* (λ )
))
( (
))
)
, Π1* (0, λ + σ) =
λ
B* (λ ) − B* (λ + σ )
.
Π 0 (0)
σ
B* ( λ )
B* (λ )
Система (11) является системой пяти уравнений относительно трёх основных
∂H1 (u, 0) ∂H 2 (u , 0)
,
H 0 (u ) , H1 (u ) , H 2 (u ) и двух вспомогательных неизвестных
.
∂z
∂z
В эту систему также входит величина Π 0 (0) , значение которой будет определено
ниже из условия нормировки.
Исключение вспомогательных неизвестных
Домножим второе уравнение системы (11) на e ju , сложим с четвертым и, вычитая из полученного равенства пятое уравнение, запишем
∂H1 (u, 0) ju
e − 1 − H 0 (u )λ e ju − 1 − H1 (u )λe ju e ju − 1 − H 2 (u )λ e ju − 1 = 0 ,
∂z
откуда получим равенство
∂H1 (u, 0)
= H 0 (u )λ + H1 (u )λe ju + H 2 (u )λ .
(12)
∂z
(
)
(
)
(
)
(
)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.В. Любина, А.А. Назаров
22
( (
Домножая четвертое уравнение системы (11) на A* λ 1 − e ju
третьего уравнения, запишем
∂H 2 (u, 0)
1 − A* λ 1 − e ju
∂z
откуда получим равенство
{
( (
))
и вычитая из
) )} − H 2 (u)λ (1 − e ju ) A* ( λ (1 − e ju ) ) = 0,
( (
( (
)) = 0 .
))
A* λ 1 − e ju
∂H 2 (u, 0)
ju
= H 2 (u )λ 1 − e
∂z
1 − A* λ 1 − e ju
(
)
(13)
Применяя полученные равенства (12) и (13) к первому, второму и четвертому
уравнениям системы (11), получим
{ (
)
}
{(
) }
(
)
))
( (
⎧ H 0 (u ) λ − λ + e − ju σ B* (λ + σ) + H1 (u )λe ju + H 2 (u )λ =
⎪
⎧ B* ( λ ) − B* ( λ + σ)
⎫
⎪
=
Π
(0)
− σe − ju B* (λ + σ) ⎬ ,
⎨λ
0
⎪
*
B (λ )
⎩
⎭
⎪
⎪
*
⎨− H (u )e − ju σ + H (u ) λ e ju + 1 + σ + H (u )λ = Π (0) ⎧σ 1 − B (λ ) − σe − ju ⎫ , (14)
⎨
⎬
0
1
2
0
*
⎪
⎩ B (λ )
⎭
⎪
ju
*
⎪
λ 1− e
⎧ 1 − B (λ) ju ⎫
⎪− H1 (u ) λe 2 ju + σe ju + H 2 (u )
= Π 0 (0) ⎨−σ *
e ⎬.
*
ju
B (λ )
1− A λ 1− e
⎪⎩
⎩
⎭
Система (14) является системой трёх линейных однородных алгебраических
уравнений относительно трёх неизвестных функций H k (u ) и одной неизвестной
{
}
постоянной Π 0 (0) .
Н а х о ж д е н и е н е и з в е с т н ы х ф у н к ц и й H k (u )
и п о с т о я н н о й Π 0 (0)
Для того чтобы найти значение величины Π 0 (0) в системе (14), положим
u = 0 . При этом в третьем уравнении получаем неопределенность вида
0
. Для
0
того чтобы ее раскрыть воспользуемся правилом Лопиталя, то есть
λ (1 − x )
−λ
1
1
lim
= lim
= lim
=−
,
*′
*′
1
x →1 1 − A* ( λ (1 − x ) )
x →1 − A*′ λ 1 − x
x
→
− A ( λ (1 − x ) )
A (0)
( (
) ) ( −λ )
∞
где x = e ju . Так как A* ( λ (1 − x ) ) = ∫ e−λ (1− x ) y dA( y ) , то
0
∞
∞
0
0
A*′ (0) = ∫ e0 y (− y )dA( y ) = − ∫ ydA( y ) = − a .
где а – математическое ожидание продолжительности этапа оповещения о конфликте. Тогда
λ (1 − x )
1
lim
= .
x →1 1 − A* ( λ (1 − x ) )
a
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование немарковской модели компьютерной сети связи
23
Следовательно, с учётом этих преобразований получаем следующую систему
трёх уравнений при u = 0 :
{
}
⎧ H 0 (0) λ − ( λ + σ ) B* (λ + σ) + H1 (0)λ + H 2 (0)λ =
⎪
⎧ B* ( λ ) − B * (λ + σ )
⎫
⎪
− σB* (λ + σ) ⎬ ,
⎪= Π 0 (0) ⎨λ
*
B (λ )
⎩
⎭
⎪⎪
(15)
⎨
⎧ 1 − B* ( λ )
⎫
− σ⎬ ,
⎪− H 0 (0)σ + H1 (0) {2λ + σ} + H 2 (0)λ = Π 0 (0) ⎨σ *
⎩ B (λ )
⎭
⎪
*
⎪
⎧ 1 − B (λ ) ⎫
1
⎪ H1 (0) ( λ + σ ) − H 2 (0) = Π 0 (0) ⎨σ *
⎬,
a
⎪⎩
⎩ B (λ ) ⎭
Система (15) является системой трёх алгебраических уравнений относительно величин H k (0) , значения которых определяются в виде
H 0 (0) =
H1 (0) =
H 2 (0) = a(λ + σ)
где b1 = λ
( λ + σ) B * ( λ + σ )
,
λ − b1Π 0 (0) − B* (λ + σ) [λ − b2 Π 0 (0) ]
( λ + σ) B * ( λ + σ )
,
(16)
− B* (λ + σ)b3Π 0 (0) + λb1Π 0 (0) − B* (λ + σ) [ λ − b2 Π 0 (0) ]
B* ( λ ) − B* (λ + σ)
B* (λ )
λ − b1Π 0 (0)
( λ + σ) B * ( λ + σ )
− σB* (λ + σ) , b2 = σ
1 − B* (λ )
B* (λ )
− σ , b3 = σ
1 − B* (λ )
B* (λ )
,
.
Значение Π 0 (0) найдём из условия нормировки
2
∑ H k (0) = 1 ,
k =0
тогда, принимая во внимание (16), получим
Π 0 (0) =
λ [ 2 + a (λ + σ) ] − B* (λ + σ) {λ [ 2 + a (λ + σ) ] + σ}
λ [ 2 + a(λ + σ) ] B* (λ ) − B* (λ + σ) {λ [ 2 + a (λ + σ) ] + σ}
B* (λ ) .
(17)
Таким образом, значение величины Π 0 (0) определяется равенством (17), а из
системы (14) однозначно определяются значения функций H k (u ) . Неоднородную
систему линейных алгебраических уравнений (14) перепишем в матричном виде
Н (u )Q(u ) = Π 0 (0)G (u ) ,
(18)
Н (u ) = { H 0 (u ), H1 (u ), H 2 (u )} ,
обозначив
(
)
⎡ λ − λ + e − ju σ B* ( λ + σ )
−e− ju σ
0
⎢
Q(u ) = ⎢
λe ju
λ e ju + 1 + σ
−λe2 ju − σe ju
⎢
λ 1 − e ju
⎢
λ
λ
⎢
1 − A* λ 1 − e ju
⎢⎣
(
)
(
)
))
( (
⎤
⎥
⎥,
⎥
⎥
⎥
⎥⎦
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.В. Любина, А.А. Назаров
24
(
)
⎧⎪ λ B* (λ ) − B* (λ + σ)
1 − B* (λ )
1 − B* (λ ) ju ⎫⎪
− σe − ju B* (λ + σ); σ *
− σe− ju , σ *
G (u ) = ⎨
e ⎬,
*
B (λ )
B (λ )
B (λ )
⎪⎩
⎪⎭
где Π 0 (0) определяется равенством (17), тогда решение Н (u ) системы (18)
Н (u ) = Π 0 (0)G (u )Q −1 (u ) .
Так как характеристическая функция h(u ) = Me jui (t ) имеет вид
h(u ) =
2
∑ H k (u ) = H (u ) E ,
k =0
где Е – единичный вектор, тогда распределение вероятностей Π (i ) числа заявок в
источнике повторных вызовов можно записать как
π
Π (i ) =
1
e − jui h(u )du.
∫
2π −π
(19)
Численное интегрирование в (17) при заданных значениях параметров λ , σ и
преобразованиях Лапласа – Стилтьеса B* (λ ) и B* (λ + σ) не представляет труда
для широкого спектра значений i .
4. Исследование условия существования стационарного режима
В силу свойств вероятности должны выполняться неравенства 0 < Π 0 (0) < 1 ,
тогда из (17) запишем двойное неравенство
0<
λ [ 2 + a(λ + σ) ] − B* (λ + σ) {λ [ 2 + a(λ + σ) ] + σ}
λ [ 2 + a (λ + σ) ] B (λ ) − B (λ + σ) {λ [ 2 + a(λ + σ) ] + σ}
*
*
B * (λ ) < 1 ,
которое определяет условие существования стационарного режима. Таким образом в данном неравенстве необходимо, чтобы числитель и знаменатель принимали значения одного и того же знака. Нетрудно показать, что эти значения должны
быть положительными, тогда имеет место система трёх неравенств:
⎧λ [ 2 + a (λ + σ) ] < λ [ 2 + a (λ + σ) ] B* (λ ),
⎪
*
⎨λ [ 2 + a (λ + σ) ] > B (λ + σ) {λ [ 2 + a (λ + σ) ] + σ} ,
⎪ λ 2 + a ( λ + σ ) B * ( λ ) > B * ( λ + σ ) λ 2 + a (λ + σ ) + σ .
{ [
]
] }
⎩ [
Таким образом, из вида этой системы следует, что при выполнении второго неравенства
λ [ 2 + a (λ + σ) ] > B* (λ + σ) {λ [ 2 + a (λ + σ) ] + σ}
(20)
выполняются также и два остальных.
Полученное неравенство (20) является условием существования стационарного режима в немарковской модели компьютерной сети связи, управляемой динамическим протоколом доступа.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование немарковской модели компьютерной сети связи
25
5. Численные результаты
Рассмотрим гамма-распеделения времени обслуживания заявок и продолжительности этапа оповещения о конфликтах заявок. Для гамма-распределения времени обслуживания заявок с параметрами α и β преобразования Лапласа –
Стилтьеса B* (λ ) и B* (λ + σ) имеют следующий вид:
α
⎛ β ⎞
B* (λ ) = ⎜
⎟ ,
⎝β+λ ⎠
α
β
⎛
⎞
B * ( λ + σ) = ⎜
(21)
⎟ .
⎝β+λ+σ⎠
Для гамма-распределения продолжительности этапа оповещения о конфликтах
( (
заявок с параметрами γ и ν преобразование Лапласа – Стилтьесса A* λ 1 − e ju
))
запишется как
ν
⎛
⎞
γ
⎟ .
=⎜
A λ 1− e
ju
⎜ γ + λ 1− e ⎟
⎝
⎠
Значение пропускной способности для данной сети связи будет определяться
условием (20), в котором B* (λ + σ) имеет соответствующий вид (21).
Определение. Пропускной способностью сети связи называется точная верхняя граница S тех значений загрузки ρ = λb , где b – среднее значение времени
обслуживания, для которых в математической модели сети существует стационарный режим.
Для заданных значений параметров σ = 1,5 , α = β = 0,5 , γ = ν = 0,5 пропускная способность данной системы составляет S = 0,3365 , поэтому значение параметра λ примем равным, например, λ = 0, 25 . Распределение вероятностей Π (i)
числа заявок в источнике повторных вызовов определяется обратным преобразованием Фурье (19) и приведено в таблице, где также указаны значения величин
δ(i ) = Π (i + 1) / Π (i ) .
*
( (
ju
))
(
)
Распределение вероятностей Π (i) числа заявок в ИПВ
при гамма-распределении времени обслуживания
i
Π (i )
δ(i )
i
Π (i )
δ(i )
0
0,5515
0,0649
9
0,0157
0,7785
1
0,0358
2,6245
10
0,0122
0,7785
2
0,0939
0,7517
11
0,0095
0,7785
3
0,0706
0,7793
12
0,0074
0,7785
4
0,0550
0,7781
13
0,0058
0,7785
5
0,0428
0,7784
14
0,0045
0,7785
6
0,0333
0,7784
15
0,0035
0,7785
7
0,0259
0,7785
16
0,0027
0,7785
8
0,0202
0,7785
…
…
…
Данное распределение вероятностей Π (i) обладает свойством стабилизации
последовательности отношений δ(i ) = Π (i + 1) / Π (i ) , которое заключается в том,
что элементы этой последовательности принимают постоянное значение при i > 2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
26
Т.В. Любина, А.А. Назаров
с точностью до двух знаков после запятой. Аналогичные результаты имеют место
и для других значений параметров λ , σ , α и β , γ и ν .
Для аппроксимации распределений вероятностей, обладающих указанным
свойством стабилизации последовательности δ(i ) , целесообразно предложить
квазигеометрическое распределение Π (i) дефекта n , впервые рассмотренное в
работе [16]. Полученное распределение вероятностей дефекта 2 является квазигеометрическим.
Заключение
Таким образом, в данной статье проведено исследование немарковской модели
компьютерной сети связи, управляемой динамическим протоколом доступа, в виде немарковской динамической RQ-системы с конфликтами заявок и оповещением о конфликте. В результате исследования получена характеристическая функция h(u ) числа заявок в источнике повторных вызовов. Равенством (19) определено распределение вероятностей Π (i). В виде (20) найдено условие существования стационарного режима данной RQ-системы.
Далее для гамма-распределения времени обслуживания заявок и продолжительности оповещения о конфликтах заявок найдено распределение вероятностей
Π (i) числа заявок в ИПВ. Показано, что распределение вероятностей обладает
свойством стабилизации последовательности отношений δ(i ) = Π (i + 1) / Π (i ) .
Для аппроксимации полученного распределения вероятностей предложено
квазигеометрическое распределение дефекта 2.
ЛИТЕРАТУРА
1. Гнеденко Б.В., Коваленко И.И. Введение в теорию массового обслуживания. 3-е изд.,
испр. и доп. М.: КомКнига, 2005. 400 с.
2. Назаров А.А., Терпугов А.Ф. Теория массового обслуживания: учеб. пособие. 2-е изд.,
испр. Томск: Изд-во НТЛ, 2010. 228 с.
3. Саати Т.Л. Элементы теории массового обслуживания и ее приложения. М.: Сов. радио, 1971. 519 с.
4. Назаров А.А., Марголис Н.Ю. Исследование неустойчивых сетей случайного доступа,
управляемых статистическим протоколом с оповещением о конфликте // Автоматика и
телемеханика. 2004. № 8. С. 72−84.
5. Назаров А.А., Цой С.А. Исследование математической модели двухканальной сети случайного доступа // Вестник ТГУ. 2003. № 280. С. 232−238.
6. Falin G.I. A survey of retrial queues // Queuing Systems. 1990. V. 7. P. 127−167.
7. Falin G.I. Multichannel queuing system with repeated calls under high intensity of repetition
// J. Inform. Processing and Cybernetics. 1987. No. 23. P. 37−47.
8. Klimenok V.I. Optimization of dynamic management of the operating mode of data systems
with repeat calls // Automatic Control and Computer Sciences. 1993. V. 24. Is. 1. P. 23−28.
9. Хомичков И.И. Исследование моделей локальной сети с протоколом случайного множественного доступа // Автоматика и телемеханика. 1993. № 12. С. 89−90.
10. Хомичков И.И. Об оптимальном управлении в сети передачи данных со случайным
множественным доступом // Автоматика и телемеханика. 1991. № 8. С. 176−188.
11. Khomichkov I.I. Calculation of the characteristics of local area network with P-persistent
protocol of multiple random access // Automation and Remote Control. 1995. V. 56. Is. 2.
P. 208−218.
12. Artalejo J.R., Gomez-Corral A. Retrial Queueing Systems: A Computational Approach.
Springer, 2008. 309 p.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование немарковской модели компьютерной сети связи
27
13. Artalejo J.R. Accessible bibliography on Retrial Queues // Mathematical and Computer Modeling. 1999. V. 30. Is. 1−2. P. 1−6.
14. Назаров А.А., Кузнецов Д.Ю. Адаптивные сети случайного доступа. Томск: ТПУ, 2002.
256 с.
15. Назаров А.А., Судыко Е.А. Метод асимптотических семиинвариантов для исследования
математической модели сети случайного доступа // Проблемы передачи информации.
2010. № 1. С. 94−111.
16. Любина Т.В., Назаров А.А. Исследование марковской динамической RQ-системы с
конфликтами заявок // Вестник Томского государственного университета. Управление,
вычислительная техника и информатика. 2010. № 3 (12). С. 73−84.
17. Назаров А.А., Юревич Н.М. Исследование сети с динамическим протоколом случайного множественного доступа Алоха // Автоматика и вычислительная техника. 1995. № 6.
С. 53−59.
18. Назаров А.А., Кузнецов Д.Ю. Исследование сети связи, управляемой адаптивным протоколом случайного множественного доступа, в условиях критической загрузки // Проблемы передачи информации. 2004. № 3. С. 69−80.
Любина Татьяна Викторовна
Назаров Анатолий Андреевич
Томский государственный университет
E-mail: lyubina_tv@mail.ru; anazarov@fpmk.tsu.ru
Поступила в редакцию 11 июля 2011 г.
Lyubina Tatiana V., Nazarov Anatoly A. (Tomsk State University). Research of non-Markovian
model of the computer communication network directed by dynamic protocol of access.
Keywords: RQ-system, dynamic report of access, conflict of service requests, notification about
the conflict, stationary mode.
Тhe non-Markovian model of a computer communication network directed by dynamic protocol of access is considered in the paper. The analysis of mathematical model of a communication network is carried out and there is found a characteristic function of number of demands in a
source of repeated calls. The condition of existence of a stationary mode of a network is found.
For the case of gamma distribution of a holding time of demands and duration of the notification about conflicts of demands the distribution of probabilities П(i) of a number of demands in a
source of repeated calls is obtained. It is shown that distribution of probabilities possesses property of stabilization of sequence δ(i) = П(i+1)/П(i).
For approximation of the obtained distribution of probabilities almost geometric distribution
of defect 2 is proposed.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
УДК 519.865
В.В. Поддубный, О.В. Романович
ИМИТАЦИОННОЕ СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
РЫНКА ОДНОГО ТОВАРА С ОПТИМАЛЬНОЙ ДЕТЕРМИНИРОВАННОЙ
СТРАТЕГИЕЙ ПОСТАВКИ ТОВАРА В УСЛОВИЯХ
СТОХАСТИЧНОСТИ СПРОСА
Рассматривается имитационная модель инерционного рынка одного товара в
условиях запаздывания поставок и флуктуаций покупательского спроса при
оптимальной детерминированной стратегии поставки товара на рынок. Математическое описание рынка представляется рестриктивной (подчиняющейся ограничениям типа неравенств) динамической моделью с запаздывающим управлением, учитывающей случайные флуктуации покупательского спроса. Показано, что оптимальная в смысле максимума прибыли продавца стратегия поставки товара на рынок определяется условиями состояния рынка (товарного дефицита, затоваривания рынка, динамического равновесия рынка). Построен алгоритм нахождения оптимальной детерминированной стратегии поставки товара на рынок на основе упреждающей детерминированной модели рынка. Проведено имитационное моделирование и
статистический анализ функционирования рынка с одновременным использованием стохастической и упреждающей детерминированной моделей.
Ключевые слова: динамическая система, ограничения типа неравенств,
запаздывающее управление, оптимизация, рынок одного товара, флуктуации спроса, статистическое имитационное моделирование.
1. Постановка задачи
В работе [1] рынок одного товара, функционирующий в условиях запаздывания поставок товара на рынок, рассматривался как детерминированная инерционная нелинейная управляемая динамическая система, подчиняющаяся ограничениям типа неравенств. Получено точное решение задачи оптимального управления
поставкой товара на рынок при детерминированном спросе на товар в указанных
условиях. Было показано, что оптимальная стратегия поставки товара на рынок
может быть реализована с помощью детерминированной математической модели,
позволяющей точно прогнозировать состояние рынка вперёд на время запаздывания. Проведено имитационное моделирование инерционного рынка одного товара
при оптимальном управлении поставкой товара на рынок в условиях запаздывания поставок. В работе [2] описывается математическая модель рынка одного товара, в которую включено влияние флуктуаций покупательского спроса на переменные, описывающие функционирование рынка в условиях запаздывания поставки товара на рынок при той же детерминированной (но уже не оптимальной)
стратегии поставки товара. В настоящей работе проводится статистическое имитационное моделирование рынка с флуктуирующим покупательским спросом и
исследуются его статистические характеристики.
Рассмотрим модель рынка одного товара, функционирующую в дискретном
времени t = 0,1,2,... . Пусть P(t) – цена товара в момент времени t, QO(t) – остаток
товара на рынке. Стратегия заказа товара определяется переменной QZ(t – τ) –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Имитационное статистическое моделирование рынка одного товара
29
объём товара, заказываемого в момент времени t – τ для поставки на рынок в момент t (предполагается запаздывание τ в поставках товара). Пусть в момент t дискретного времени спрос QD(t) на товар при цене P(t) имеет вид простейшей линейной зависимости с аддитивным членом ξ(t), характеризующим случайные
флуктуации спроса:
Q D ( t ) = Qm − aP ( t ) + ξ ( t ) ,
(1)
где Qm > 0 и a > 0 – заданные константы.
Будем считать, что ξ(t) – стационарный некоррелированный случайный процесс с нулевым средним значением и произвольным стандартным отклонением σ.
Неотрицательность спроса обеспечим нелинейной рестриктивной зависимостью
спроса от цены при любом значении σ путём усечения процесса ξ(t):
Q − aP ( t ) + ξ ( t ) , если Qm − aP ( t ) + ξ ( t ) > 0,
QD (t ) = m
(2)
0,
если Qm − aP ( t ) + ξ ( t ) ≤ 0.
{
Объём товара Q(t), предлагаемого к продаже в момент времени t, складывается из остатка товара в объёме QO(t) и товара в объёме QZ(t – τ), заказанного продавцом в момент времени t – τ (с учётом запаздывания поставки) для поставки его
на рынок к моменту времени t:
Q ( t ) = QO ( t ) + Q Z ( t − τ ) .
Тогда объём продаж QS(t) на интервале t дискретного времени равен
(
)
Q S ( t ) = min Q D ( t ) , QO ( t ) + Q Z ( t − τ ) ,
(3)
а остатки товара удовлетворяют рекуррентному соотношению
QO ( t + 1) = QO ( t ) + Q Z ( t − τ ) − Q S ( t ) .
(4)
Будем считать целевой функцией рыночного механизма ценообразования прибыль продавца J(t) в момент времени t. В рассматриваемых условиях прибыль
продавца равна разности между выручкой от продажи товара и затратами на его
приобретение и хранение. Если P1 – цена закупки товара (на оптовом рынке или у
производителя), P2 – цена хранения единицы товара, не проданного на предыдущем интервале дискретного времени, то прибыль продавца в момент времени t
составит величину
R
2
J ( t ) = Q S ( t ) P ( t ) − Q Z ( t ) P1 − QO ( t ) P2 − ( P ( t ) − P ( t − 1) ) .
(5)
2
Последнее слагаемое (с коэффициентом R > 0) «штрафует» продавца за изменение цены товара и определяет инерционность рынка – за резкое повышение цены могут последовать санкции законодательного характера, за резкое снижение
цены – «санкции» конкурентов, выражающиеся в нанесении ущерба продавцу в
размере, эквивалентном этой штрафной функции.
Решим задачу нахождения такой цены товара P(t) (устанавливаемой рынком) и
такой дополнительной поставки QZ(t – τ) товара на рынок (устанавливаемой продавцом), чтобы прибыль продавца при заданной линии спроса на t-ом интервале
дискретного времени была максимальной:
J ( t ) ⇒ sup
.
(6)
P ( t ), Q Z ( t −τ )
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
30
В.В. Поддубный, О.В. Романович
При решении этой задачи должны выполняться ограничения на величину цены
товара P(t):
P1 < Pmin < P(t) < Pmax(t) = (Qm + ξ(t)) / a
и на величину дополнительного заказа товара QZ(t – τ) ≥ 0 .
2. Стохастическая и детерминированная модели.
Оптимизация цены и поставки товара
Принцип решения поставленной задачи (6) без учета возможных флуктуаций
спроса описан в работе [1]. При наличии флуктуаций спроса ξ(t) схема решения
остаётся аналогичной и впервые представлена в работе [2]:
1) Находится оптимальная (обеспечивающая максимум прибыли продавца (5))
цена P(t) товара при фиксированных значениях предыдущей цены P(t − 1) товара
и объёма предложения Q(t) (следовательно, при фиксированном объёме заказа
QZ(t – τ)):
J ( t ) ⇒ max .
P ( t ) |Q ( t )
2) Находится оптимальное значение объёма Q(t) товара, предлагаемого на
рынке, и заказа QZ(t – τ) товара в зависимости от его остатка QO(t) на рынке.
Однако имеется важное различие между стохастической и детерминированной
задачами оптимизации. В детерминированной постановке задачи в каждый момент дискретного времени t на рынок поступает оптимальный объём QZ(t – τ) товара, заказанного за τ шагов до момента t в условиях полной предсказуемости поведения рынка в течение этих шагов. А в стохастической постановке рынок идёт
по стохастической траектории, так что предсказать точно будущий спрос на товар
и найти точное значение оптимального объёма QZ(t – τ) поставки товара на рынок
в момент t – τ невозможно (будущие значения флуктуаций спроса ξ(t) ещё не известны).
Поэтому решать стохастическую задачу приходится с использованием двух
моделей. Одна модель (стохастическая) является имитационной. Она моделирует
стохастическую динамику рынка при известном на каждом шаге t объёме поставки QZ(t – τ). Другая модель (детерминированная) − скользящая упреждающая. Она
запускается на каждом текущем шаге t на τ шагов вперёд с начальными условиями, выражающими состояние стохастической модели в этот момент времени, для
предсказания будущего состояния рынка на момент t + τ. По предсказанному состоянию производится расчёт требуемой к этому моменту времени оптимальной
детерминированной поставки товара QZ(t + τ), которая и принимается к реализации в имитационной модели (или на настоящем рынке).
На рис. 1 приведена схема взаимодействия стохастической и детерминированной моделей рынка.
При решении как стохастической, так и детерминированной задачи (с учётом
её рестриктивности в силу соотношения (3)) следует выделить области, соответствующие дефициту товара на рынке (область 1, в которой Q(t) < QD(t)), затовариванию рынка (область 2, в которой Q(t) > QD(t)) и балансу спроса и предложения (область 3, область динамического равновесия, в которой Q(t) = QD(t)). Соотношения, получаемые для стохастической модели, являются более общими. В детерминированной модели во всех формулах следует положить ξ(t) = 0.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Имитационное статистическое моделирование рынка одного товара
31
Детерминированная модель
PM (t)≠P (t)
t−τ
QZ(t+τ)
QZ(.)
PM (t)=P(t)
t
t+τ
QZ(t−τ)
Стохастическая модель функционирования рынка
Рис. 1. Взаимодействие детерминированной и стохастической моделей рынка
1) В области товарного дефицита Q(t) < QD(t), и в соответствии с соотношением (3) имеем QS(t) = Q(t), так что
R
2
J ( t ) = Q ( t ) P ( t ) − Q ( t ) P1 + QO ( t )( P1 − P2 ) − ( P ( t ) − P ( t − 1) ) ⇒ sup . (7)
2
P ( t ) |Q ( t )
Это вогнутая квадратичная функция переменной P(t), достигающая условного
максимума при
Q (t )
P ( t ) = P ( t − 1) +
= P (1) ( t ) .
(8)
R
Как видим, P(1)(t) растет с ростом Q(t) по линейному закону. Выражение (8)
справедливо не при любом Q(t), а лишь при Q(t), удовлетворяющем условию
Q(t) < QD(t) принадлежности к области 1. Это условие с учетом (1) и (8) имеет
вид
a
Q ( t ) < Qm + ξ ( t ) − aP (1) ( t ) = Qm + ξ ( t ) − aP ( t − 1) − Q ( t ) ,
R
откуда
Q (t ) <
R ( Qm + ξ ( t ) − aP ( t − 1) )
= Q(1) ( t ) .
a+R
(9)
Поскольку в силу (2) Q D ( t ) = Qm + ξ ( t ) − aP(1) ( t ) ≥ 0 , возможная (допустимая)
флуктуация ξ(t), не приводящая к отрицательности спроса, подчиняется неравенству
ξ ( t ) ≥ − ( Qm − aP ( t − 1) ) ,
(10)
что обеспечивает выполнение неравенства Q(1) ( t ) ≥ 0 . Таким образом, в области 1
P(t) линейно растёт с ростом Q(t) от значения
P (1) ( t ) |Q( t ) = 0 = P ( t − 1)
до значения
Qm + ξ ( t ) + RP ( t − 1)
(1)
= Pmax
(t ) ,
a+R
причем условие принадлежности Q(t) к области 1 выражается неравенством (9) с
P (1) ( t ) |Q t
( ) =Q(1) ( t )
=
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Поддубный, О.В. Романович
32
учётом (10), то есть 0 ≤ Q(t) < Q(1)(t). После подстановки P(t) = P(1)(t) в выражение
(7) для J(t) имеем
Q2 (t )
+ ( P ( t − 1) − P1 ) Q ( t ) + QO ( t )( P1 − P2 ) = J (1) ( t ) .
2R
Дальнейшая оптимизация J(1)(t) по Q(t) производится только в детерминированной модели, не содержащей в течение τ предыдущих шагов флуктуации спроса
ξ(t), и нужна для определения оптимального объёма поставки QZ(t – τ) товара
продавцом.
Видно, что J(1)(t) монотонно растет с ростом Q(t) по линейно-квадратичному
закону, достигая максимального значения на границе области при Q(t) = Q(1)(t):
J (t ) =
(1)
J max
( t ) = J (1) ( t ) |Q t
( ) =Q(1) ( t )
.
Если остаток товара QO(t) от продаж предыдущего интервала дискретного
времени не превышает величину Q(1)(t), то дополнительный заказ и поставка товара на рынок в объеме QZ(t – τ) = Q(1)(t) – QO(t) (в частности, QZ(t – τ) = 0 при
QO(t) = Q(1)(t)) обеспечивает максимум прибыли. Иначе, при QO(t) > Q(1)(t), следует искать решение задачи оптимизации прибыли в областях 2 или 3.
2) В области затоваривания рынка Q(t) > QD(t), и в соответствии с выражением (3) имеем QS(t) = QD(t), так что с учетом (1)
J ( t ) = ( Qm + ξ ( t ) − aP ( t ) ) P ( t ) − Q ( t ) P1 + QO ( t )( P1 − P2 ) −
−
R
( P ( t ) − P ( t − 1) )2 ⇒ sup .
2
P ( t ) |Q ( t )
(11)
Это вогнутая квадратичная функция переменной P(t) с точкой максимума
Q + ξ ( t ) + RP ( t − 1)
(12)
P (t ) = m
= P( 2) ( t ) .
2a + R
При выполнении условия (10) эта величина неотрицательна и не меньше
P(1)(t). Как видим, P(2)(t) не зависит от Q(t) (остаётся постоянной при любом Q(t) в
этой области). Выражение (12) справедливо лишь при условии, что Q(t) > QD(t),
то есть при условии
( a + R ) ( Qm + ξ ( t ) ) − aRP ( t − 1)
,
Q ( t ) > Qm + ξ ( t ) − aP ( 2 ) ( t ) =
2a + R
R ( Qm + ξ ( t ) − aP ( t − 1) ) + a ( Qm + ξ ( t ) )
(13)
= Q( 2) ( t ) .
2a + R
Последнее неравенство определяет условие принадлежности Q(t) к области 2.
Нетрудно показать, что Q(2)(t) > Q(1)(t). В области 2 Q(t) > Q(2)(t). После подстановки в J(t) P(t) = P(2)(t), не зависящего от Q(t), имеем
откуда
Q (t ) >
(
)
J ( t ) = Qm + ξ ( t ) − aP( 2 ) ( t ) P ( 2 ) ( t ) − Q ( t ) P1 + Q o ( t )( P1 − P2 ) −
2
R ( 2)
P ( t ) − P ( t − 1) = J ( 2 ) ( t ) .
2
Дальнейшая оптимизация J(2)(t) по Q(t) производится только в детерминированной модели, не содержащей в течение τ предыдущих шагов флуктуации спроса
ξ(t), и нужна для определения оптимального объёма поставки QZ(t – τ) продавцом.
−
(
)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Имитационное статистическое моделирование рынка одного товара
33
Как видим, J(2)(t) монотонно убывает с ростом Q(t) по линейному закону, так
что достигает в этой области наибольшего значения при Q(t) = Q(2)(t):
( 2)
J max
( t ) = J ( 2) ( t ) |Q t
( ) = Q( 2 ) ( t )
.
Если QO(t) < Q(2)(t), то дополнительный заказ и поставка товара на рынок в
объеме QZ(t – τ) = Q(2)(t) – QO(t) обеспечивает получение этого максимума прибыли. Если же QO(t) > Q(2)(t), то QZ(t – τ) = 0 и достигается лишь значение прибыли
( 2)
J ( 2 ) ( t ) |Q( t ) =QO ( t ) < J max
(t ) .
3) В области баланса спроса и предложения (то есть в области динамического равновесия рынка) Q(t) = QD(t) и в соответствии с выражением (3) имеем,
как и в области 2, объём продаж, равный спросу, то есть QS(t) = QD(t), и прибыль
J(t) в виде (10). Но Q(t) = Qm + ξ(t) – aP(t), откуда
Q + ξ (t ) − Q (t )
(14)
P (t ) = m
= P ( 3) ( t ) .
a
Границами области 3 по Q(t) являются точки Q(1)(t) и Q(2)(t):
Q(1) ( t ) ≤ Q ( t ) ≤ Q( 2 ) ( t ) .
Как видим из (13), в этой области P(3)(t) линейно убывает с ростом Q(t) от
Q + RP ( t − 1)
(1)
P ( 3) ( t ) |Q t =Q(1) t = m
= Pmax
(t )
()
()
a+R
до
Qm + ξ ( t ) + RP ( t − 1)
= P( 2) ( t ) .
2a + R
После подстановки P(t) = P(3)(t) в J(t) для этой области имеем
Q + ξ (t ) − Q (t )
J (t ) = Q (t ) m
− Q ( t ) P1 + Q o ( t )( P1 − P2 ) −
a
P ( 3) ( t ) |Q t
( ) = Q( 2 ) ( t )
=
2
−
R ⎛ Qm + ξ ( t ) − Q ( t )
⎞
− P ( t − 1) ⎟ = J ( 3) ( t ) .
⎜
a
2⎝
⎠
Дальнейшая оптимизация J(3)(t) по Q(t) производится только в детерминированной модели, не содержащей в течение τ предыдущих шагов флуктуации спроса
ξ(t), и нужна для определения оптимального объёма поставки QZ(t – τ). J(3)(t) – вогнутая линейно-квадратичная функция переменной Q(t). В точке
R ( Qm + ξ ( t ) − aP ( t − 1) ) + a ( Qm + ξ ( t ) − aP1 )
Q (t ) =
= Q ( 3) ( t )
2a + R
прибыль J(3)(t) достигает максимального значения. Нетрудно показать, что
Q(1)(t) < Q(3)(t) < Q(2)(t), то есть точка максимума Q(3)(t) лежит в области 3. Максимальное значение прибыли в области 3 (при QO(t) < Q(3)(t))
( 3)
J max
( t ) = J ( 3) ( t ) |Q t
( ) = Q ( 3) ( t )
.
Это значение является и глобально максимальным, потенциально возможным
при QO(t) ≤ Q(3)(t). Если же Q(3)(t) < QO(t) ≤ Q(2)(t), то глобально максимальное значение прибыли не может быть достигнуто, и достигается только условномаксимальное значение (при фиксированном QO(t)) внутри области 3, лежащее
( 3)
между J max
( t ) и J(2)(t).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Поддубный, О.В. Романович
34
3. Статистический анализ стохастической динамики рынка
Статистический анализ функционирования имитационной модели рынка в условиях стохастических флуктуаций спроса проводился в различных ситуациях, в
том числе в ситуации, когда сначала, до некоторого момента времени t = 0 включительно, рынок находился в состоянии равновесия и флуктуации спроса отсутствовали. Равновесная цена товара P* = (Qm + aP1) / (2a), спрос QD* = Qm − aP* равнялся предложению, запасы товара на складе отсутствовали (QO* = 0). Таким образом, в момент времени t = 0 цена товара P0 оставалась равной P*, остаток товара
Q0 = 0. Начиная со следующего момента, спрос начинал флуктуировать, вследствие чего рынок выводился из состояния равновесия. Флуктуации спроса моделировались последовательностью независимых нормально распределённых случайных величин с нулевым средним и одинаковой дисперсией σ2. При этом для обеспечения неотрицательности спроса производилось его усечение в соответствии с
рестриктивным преобразованием (2). Расчёты проводились при R = 50, Qm = 4,
a = 0,4, T = 2000, P0 = P*, P1 = 3, P2 = 0,1, Pmin = P1 + P2, Pmax = Qm / a, P* = 6,5,
Q0 = 0, τ = 7, σ = 0,1. Эксперимент повторялся N = 2000 раз. При каждой n-й реализации имитационного моделирования рынка (прогонке модели) рекуррентно
уточнялись средние значения M(t), дисперсии D(t) = σ2(t) и функции автокорреляции K(t, t+τ) = σ(t)σ(t+τ)r(t, t+τ) всех переменных модели по схеме:
n
1
M n +1 ( t ) =
M n (t ) +
xn +1 , M 1 = x1 , n = 1, N − 1 ,
n +1
n +1
Dn+1 (t ) =
n −1
1
2
2
Dn (t ) + ( xn+1 (t ) − M n+1 (t )) , D1 ( t ) = ( x1 ( t ) − M1 ( t ) ) = 0 , n = 1, N − 1 ,
n
n
K n +1 ( t , t + τ ) =
n −1
1
K n ( t , t + τ ) + ( xn +1 ( t ) − M n +1 ( t ) ) ( xn +1 ( t + τ ) − M n +1 ( t + τ ) ) ,
n
n
K1 ( t , t + τ ) = 0 , n = 1, N − 1 .
На рис. 2 – 7 изображена реализация стохастической динамики основных переменных состояния рынка вместе с их математическими ожиданиями M и границами полос разброса значений (шириной 2σ(t)). Видно, что средние значения всех
параметров рынка в условиях флуктуаций спроса постепенно отклоняются от начальных равновесных значений параметров детерминированного (невозмущённого) рынка и асимптотически приближаются к значениям, характеризующим статистическое равновесие. Это смещение объясняется нелинейным (именно, рестриктивным, связанным с ограничениями вида неравенств (2), (3)) характером рассматриваемой модели рынка.
Как видно на рис. 2 и 3, хаотические флуктуации спроса приводят к сравнительно медленным флуктуациям оптимальной цены и предложения товара, определяемого оптимальной детерминированной стратегией поставки товара на рынок. Остальные переменные флуктуируют достаточно быстро.
На рис. 8 представлено поведение нормированной автокорреляционной функции цены rP(t,t + τ), полученное по N = 2000 прогонкам модели рынка в одних и
тех же условиях. Верхняя и нижняя горизонтальные плоскости, показанные на
рисунке, указывают границы 95 %-го интервала статистической незначимости
функции автокорреляции, то есть статистической значимости нулевой гипотезы
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Имитационное статистическое моделирование рынка одного товара
P
MP
MP±σP
t
Рис. 2. Динамика цены товара
QZ
MQZ
MQZ±σQZ
t
Рис. 3. Стратегия заказа товара
QD
MQD
MQD±σQD
t
Рис. 4. Покупательский спрос
35
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
36
В.В. Поддубный, О.В. Романович
Q
MQ
MQ±σQ
t
Рис. 5. Остаток непроданного товара
QS
MQS
MQS±σQS
t
Рис. 6. Динамика продаж
J
MJ
MJ±σJ
t
Рис. 7. Динамика прибыли
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Имитационное статистическое моделирование рынка одного товара
37
H0: r(t, t+τ) = 0 о некоррелированности флуктуаций. Они определяются t-критерием Стьюдента и равны ± 1
1 + ( N − 2 ) t N2 − 2, 0,975 = ± 0,0438, где t N − 2, 0,975 −
квантиль уровня 0,975 распределения Стьюдента с N – 2 степенями свободы. Как
видно на рис. 8, при критическом уровне значимости 5 %-й корреляции значений
цены товара статистически значимо отличаются от нуля для всех значений параметра τ сдвига в интервале от τ = 1 до τ = 200, не менее. Аналогично ведёт себя и
функция автокорреляции rQZ(t,t + τ) предложения (заказа) товара. Все остальные
переменные имеют слабо коррелированные во времени значения. Наименее автокоррелированы остатки QO непроданного товара, функция автокорреляции
rQO(t,t + τ) которых приведена на рис. 9. Поверхности функций автокорреляции
объёма QS продаж, спроса QD и прибыли J имеют вид, промежуточный между поверхностями, изображёнными на рис. 8 и 9, но ближе к рис. 9. Почти всюду их автокорреляции практически статистически незначимы.
rP
t
τ
Рис. 8. Нормированная автокорреляционная функция цены
и границы 95 %-го интервала её незначимости
rQ
t
τ
Рис. 9. Нормированная автокорреляционная функция остатков
и границы 95 %-го интервала её незначимости
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
38
В.В. Поддубный, О.В. Романович
Заключение
Итак, в работе получены точные соотношения, определяющие имитационную
математическую модель оптимального (по критерию максимума прибыли продавца) инерционного рынка одного товара в условиях запаздывания поставок товара на рынок и флуктуаций покупательского спроса. Построена оптимальная детерминированная стратегия поставки товара на рынок. Показано, что в силу нелинейности модели случайные колебания спроса отклоняют статистическое равновесие рынка от детерминированного равновесия.
ЛИТЕРАТУРА
1. Поддубный В.В., Романович О.В. Рестриктивная динамическая модель инерционного
рынка одного товара с оптимальной поставкой товара на рынок в условиях запаздывания // Вестник Томского государственного университета. Управление, вычислительная
техника и информатика. 2011. 4(17). С. 16–24.
2. Поддубный В.В., Романович О.В. Имитационная модель рынка одного товара с оптимальной детерминированной стратегией поставки товара в условиях стохастичности
спроса // Информационные технологии и математическое моделирование (ИТММ-2011):
Материалы Х Всероссийской научно-практической конференции с международным
участием (25−26 ноября 2011 г.). Томск: Изд-во Том. ун-та, 2011. Ч. 2. − С. 47−53.
Поддубный Василий Васильевич
Романович Ольга Владимировна
Томский государственный университет
E-mail: vvpoddubny@gmail.com; njkm@ngs.ru
Поступила в редакцию 1 декабря 2011 г.
Poddubny Vasily V., Romanovich Olga V. (Tomsk State University). Simulation statistical modeling of the market of one goods with the optimal deterministic strategy of the delivery of
goods under condition of stochastic demand.
Keywords: dynamic system, restrictions of an inequality type, time-lag control, optimization,
market of one goods, casual fluctuations of demand, statistical simulation modeling.
The simulation model of the inertial market of one goods is considered under conditions of
delivery time-lag and casual fluctuations of the purchase requirement under the optimal deterministic strategy of the supply of goods to the market. The mathematical description of the market is
given by the restrictive (because of restrictions of inequalities type) dynamic model with the timelag of control taking into account casual fluctuations of the purchase requirement. It was shown
that the optimal (in the sense of the maximum profit of the seller) strategy of the goods delivery to
the market is determining by the market conditions (commodity deficit, overstocking of the market, or the dynamic balance state of the market). The algorithm of the finding of optimum deterministic strategy of the delivery of goods to the market is constructed with using of the forecasting deterministic model of the market. The simulation modeling and statistical analysis of the
market dynamics are organized with simultaneous use of the stochastic model and of the forecasting deterministic model. The statistical simulation of the model behavior is performed; average values, variances, and auto-correlation functions for all variables of the model are investigated. It is shown that in view of non-linearity of the model the casual fluctuations of demand
shift the statistical equilibrium of the market from its deterministic equilibrium.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
ОБРАБОТКА ИНФОРМАЦИИ
УДК 519.6
А.В. Бобров, Е.А. Перепелкин
ПОСТРОЕНИЕ РОБАСТНЫХ ОЦЕНОК
СРЕДНИХ ЗНАЧЕНИЙ И ВАРИАЦИЙ ДВУМЕРНЫХ ДАННЫХ
НА ОСНОВЕ СПЕКТРАЛЬНОЙ МАТРИЧНОЙ НОРМЫ
Описываются алгоритмы построения робастных оценок средних значений и
вариаций двумерных данных, полученные на основе спектральной матричной нормы. Рассматриваются алгоритмы для дискретных и непрерывных
данных. Анализируются результаты тестовых расчетов.
Ключевые слова: анализ данных, среднее значение, вариация, робастность.
Теория робастных оценок составляет одно из наиболее важных и актуальных
направлений в методах обработки данных [1−3]. Необходимость построения робастных оценок связана с целым рядом причин: ограниченным объемом выборки,
пропуском данных, ошибками в записи данных и др. Один из подходов к построению робастных оценок основан на решении задач оптимизации. Пусть данные измерений представлены числовыми значениями x1 , x2 , …, xn . Классическая оценка среднего значения
n
c = ∑ xi wi ,
i =1
где wi – весовые коэффициенты,
n
∑ wi = 1 ,
i =1
wi ≥ 0 .
Эта оценка является решением задачи оптимизации
n
c = arg min ∑ ( s − xi ) 2 wi .
s
i =1
Робастную оценку можно получить, решая задачу оптимизации
n
c = arg min ∑ | s − xi | p wi .
s
i =1
где 1 ≤ p < 2 . Такие оценки принадлежат к классу M -оценок и называются L p оценками [3].
В данной работе описываются алгоритмы построения робастных оценок средних значений и вариаций двумерных данных, полученные на основе спектральной
матричной нормы. Рассматриваются алгоритмы для дискретных и непрерывных
данных. Приводятся и анализируются результаты тестовых расчетов.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.В. Бобров, Е.А. Перепелкин
40
1. Дискретные данные
Пусть числовые данные представлены в виде матрицы
⎡ a11 … a1m ⎤
⎥.
A=⎢
⎢
⎥
a
a
…
⎣ n1
nm ⎦
Обычно вычисляют взвешенное среднее значение c и вариацию данных d в
матрице А:
n
m
c = ∑∑ aij wij ,
i =1 j =1
n
m
d = ∑∑ (c − aij ) 2 wij ,
i =1 j =1
где wij – весовые коэффициенты,
n
m
∑∑ wij = 1 ,
i =1 j =1
wij ≥ 0 .
Заметим, что значение c является решением задачи оптимизации
c = arg min B ( s )
s
где
B(s)
F
F
,
⎛ n m
⎞
= ⎜ ∑∑ (bij ( s )) 2 ⎟
⎜
⎟
⎝ i =1 j =1
⎠
1
2
– норма Фробениуса матрицы B ( s ) с элементами bij ( s ) = ( s − aij ) wij . При этом
d = B (c )
2
F
.
В вычислительной математике, методах обработки данных [4, 5] наряду с нормой Фробениуса применяются и другие матричные нормы, например гельдеровы
нормы:
n
B 1 = max ∑ bij ,
j
i =1
B
2
= σmax ( B ) ,
m
B
∞
= max ∑ bij ,
i
j =1
где σmax ( B) – максимальное сингулярное число матрицы B . В расчетах на реальных данных часто применяется 2-норма (спектральная норма), поскольку данная норма обладает свойством грубости (робастности) по отношению к изменениям в элементах матрицы [5]. Изменения (возмущения) в матрице данных возможны по ряду причин: технические ошибки при записи данных, отсутствие данных и
др. Рассмотрим влияние возмущений в матрице данных на спектральную норму
матрицы B ( s ) .
Сингулярные числа матрицы A размером n × m , упорядоченные по невозрастанию, обозначим σ1 ( A) ≥ σ 2 ( A) ≥ ... ≥ σmin( n, m) ( A) . Справедливы следующие утверждения [5].
Утверждение 1. Пусть матрицы P , Q , R размером n × m связаны соотношением P = Q + R . Тогда
σi ( P ) − σi (Q) ≤ σ1 ( R ) , i = 1,..., min(n, m) .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Построение робастных оценок средних значений и вариаций двумерных данных
41
Утверждение 2. Пусть матрица Q получена из матрицы P вычеркиванием
строки или столбца. Тогда σ1 ( P ) ≥ σ1 (Q) ≥ σ2 ( P ) .
Рассмотрим два вида возмущений в матрице данных: ошибки в записи элементов матрицы и пропуски строк или столбцов.
Утверждение 3. Пусть две матрицы данных A и A отличаются k элементами, т.е.
k
A = A + ∑ Ai δi ,
i =1
где в матрицах Ai все элементы равны нулю, за исключением одного, равного
единице. Составим вектор возмущений δ = [ δ1 , ..., δk ] . Тогда для любого s
справедлива оценка
B (s) 2 − B(s) 2 ≤ δ 2 ,
1/ 2
⎛ k
⎞
= ⎜ ∑ δi 2 ⎟ .
2
⎝ i=1 ⎠
Доказательство. Обозначим через ∆aij элементы матрицы
где δ
k
∆A = ∑ Ai δi .
i =1
Тогда bij ( s ) = bij ( s ) − ∆aij wij . В соответствии с утверждением 1
σ1 ( B ( s ) ) − σ1 ( B ( s ) ) ≤ σ1 ( R ) ,
где матрица R состоит из элементов ∆aij wij . Справедливо неравенство [4]
σ1 ( R) ≤ R
F
.
Из структуры матрицы R следует неравенство
R
F
≤ δ 2.
Таким образом, для любого s справедлива оценка
σ1 ( B ( s ) ) − σ1 ( B( s ) ) ≤ δ 2 .
Утверждение доказано.
Утверждение 4. Пусть в результате удаления строки или столбца в матрице
данных A получена матрица A . Тогда для любого s справедлива оценка
B(s)
2
≥ B (s)
2
≥ σ2 ( B ( s )) .
Доказательство. Удаление строки или столбца в матрице A означает удаление соответствующей строки или столбца в матрице B ( s ) . На основании утверждения 2 мы можем записать
σ1 ( B ( s )) ≥ σ1 ( B ( s )) ≥ σ2 ( B ( s )) .
Утверждение доказано.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.В. Бобров, Е.А. Перепелкин
42
Мы предлагаем для оценки среднего значения и вариации данных в двумерном
массиве использовать спектральную норму. Среднее значение определим как решение задачи оптимизации
c = arg min B ( s ) 2 .
s
Вариацию данных будем вычислять по формуле
2
d = B (c ) 2 .
Определить значения c и d достаточно просто, применяя системы компьютерной математики, например MATLAB или SCILAB.
Пример 1. Тестовые расчеты проводились в системе MATLAB на данных
модульно-рейтинговой системы квалиметрии учебной деятельности студентов
АлтГТУ. Матрица данных является ведомостью студенческой группы с семестровыми рейтингами студентов в 100-балльной шкале по предметам семестра. Заданы веса предметов. Необходимо определить рейтинг группы в целом и вариацию
рейтинга в группе. Оценки рейтинга группы, полученные на основе нормы Фробениуса и спектральной нормы матрицы B ( s ) , соответственно равны 65 и 64 ,
оценки вариации рейтинга в группе равны 19, 2 и 14, 7 .
70
60
50
40
30
20
0
20
40
60
80
s
Рис. 1. Зависимость норм матриц B ( s ) и B ( s ) от s
в примере 1
Предположим, что в ведомости не проставлены 10 % оценок. Соответствующие элементы матрицы A полагаются равными нулю. Оценки рейтинга группы
равны 54 и 56 , оценки вариации рейтинга в группе равны 29,3 и 25,1 соответственно для нормы Фробениуса и спектральной нормы матрицы B ( s ) .
Таким образом, оценка рейтинга группы изменилась на 16,9 % и 12,5 % при
расчете соответственно на основе нормы Фробениуса и спектральной нормы.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Построение робастных оценок средних значений и вариаций двумерных данных
43
2. Непрерывные данные
Пусть имеется массив данных в виде значений функции двух аргументов
A = {a( x, y ) ( x, y ) ∈ D = [ xmin , xmax ] × [ ymin , ymax ]} .
Например, это может быть фрагмент цифровой фотографии, данные геофизических измерений и т.д. Необходимо построить оценки среднего значения и вариации данных в области D , грубые по отношению к ошибкам в данных.
Среднее значение и вариация определяются в виде интегралов
xmax ymax
c=
∫ ∫
xmax ymax
a( x, y ) w( x, y )dxdy , d =
xmin ymin
∫ ∫
( c − a( x, y ) )2 w( x, y )dxdy ,
xmin ymin
где w( x, y ) – весовая функция,
xmax ymax
∫ ∫
w( x, y )dxdy = 1 ,
w( x, y ) ≥ 0 ,
( x, y ) ∈ D .
xmin ymin
Введем функцию трех аргументов b( s, x, y ) = ( s − a( x, y )) w( x, y ) . Тогда
2
d = b ( c, x, y ,
1/ 2
⎛ xmax ymax
⎞
где
b( s, x, y ) = ⎜ ∫ ∫ b( s, x, y ) 2 dxdy ⎟
⎜
⎟
⎝ xmin ymin
⎠
– норма функции b( s, x, y ) как функции двух аргументов x и y в пространстве
L2 ( D) . В свою очередь, значение c есть решение задачи оптимизации
c = arg min b( s, x, y ) .
s
Норму функции b( s, x, y ) в пространстве L2 ( D) можно приближенно вычислить, выполнив дискретизацию множества D конечным числом точек ( xi , y j ) ,
i = 1,..., n , j = 1,..., m . Например, при равномерной дискретизации по каждой из
переменных
2i − 1
2 j −1
xi = xmin +
∆x ,
y j = ymin +
∆y ,
2
2
где
∆x =
xmax − xmin
,
n
∆y =
ymax − ymin
,
m
оценка нормы b( s, x, y ) имеет следующий вид:
b ( s , x, y ) ≈ ∆ x ∆ y B ( s )
F
.
1/ 2
Здесь
B(s)
F
⎛ n m
⎞
= ⎜ ∑∑ (bij ( s )) 2 ⎟
⎜
⎟
⎝ i =1 j =1
⎠
– норма Фробениуса матрицы B ( s ) с элементами bij ( s ) = s − a( xi , y j ) .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.В. Бобров, Е.А. Перепелкин
44
Таким образом, среднее значение данных в области D может быть найдено
как решение задачи оптимизации
c = arg min B ( s ) F .
s
При этом вариация данных будет равна
d = ∆ x ∆ y B (c )
2
F
.
От нормы Фробениуса перейдем к спектральной норме матрицы B ( s ) . Среднее значение определим как решение задачи оптимизации
c = arg min B ( s ) 2 .
s
Вариацию данных будем вычислять по формуле
2
d = ∆ x ∆ y B (c ) 2 .
Пример 2. Пусть анализируемые данные представлены функцией
a( x, y ) = 1, 2( x − 5) 2 + 1,5( y + 7) 2 + 2, 7
в области D = [3, 7] × [−10, −5] . На рис. 2 показаны значения a( x, y ) в области D .
Расчеты проводились при n = 100 , m = 100 . На рис. 3 показана зависимость
B ( s ) F и B ( s ) 2 от s для исходных данных. Значения
c = arg min B ( s )
s
F
,
c = arg min B ( s )
2
F
,
d = ∆ x ∆ y B (c )
s
2
совпадают и равны 7,8. Значения
d = ∆ x ∆ y B (c )
2
2
равны соответственно 12,5 и 13,81.
a(x,y)
25
20
15
10
5
0
7
6
5
x
4
3 –10
–9
–8
Рис. 2. Исходные данные
–7
y
–6
–5
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Построение робастных оценок средних значений и вариаций двумерных данных
45
480
460
440
420
400
380
360
340
5
6
7
8
9
s
Рис. 3. Зависимость норм матрицы B ( s ) от s
для исходных данных
Пусть в анализируемых данных пропущены 20 % значений. Соответствующие
значения данных показаны на рис. 4. Зависимость B ( s ) F и B ( s ) 2 от s при
пропущенных данных показана на рис. 5. В этом случае оценки средних значений
и вариаций данных существенно отличаются при расчете на основе нормы Фробениуса и спектральной нормы матрицы B ( s ) . Значение c , полученное на основе
нормы Фробениуса, равно 6,39, на основе спектральной нормы – 7,48. Значения
a(x,y)
25
20
15
10
5
0
7
6
5
x
4
3 –10
–9
–8
–7
y
Рис. 4. Данные с пропущенными значениями
–6
–5
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.В. Бобров, Е.А. Перепелкин
46
600
550
500
450
400
350
5
6
7
8
9
s
Рис. 5. Зависимость норм матрицы B ( s ) от s
для данных с пропущенными значениями
d равны соответственно 22,07 и 13,81. Таким образом, оценка среднего значения,
полученная на основе нормы Фробениуса, изменилась на 10,5 %, на основе спектральной нормы – на 4,1 %. Оценки вариаций изменились соответственно на 51,8
и 10,5 %.
Заключение
В статье описан метод расчета средних значений и вариаций двумерных дискретных и непрерывных данных на основе спектральной матричной нормы. Получены неравенства, позволяющие оценить влияние ошибок в матрице данных на
результаты расчетов средних значений и вариаций данных. Результаты тестовых
расчетов подтверждают грубость оценок средних значений и вариаций, полученных на основе спектральной нормы, по отношению к ошибкам в данных.
ЛИТЕРАТУРА
1. Смоляк С.А., Титаренко Б.П. Устойчивые методы оценивания. М.: Статистика, 1980.
208 с.
2. Хьюбер Дж.П. Робастность в статистике. М.: Мир, 1984. 304 с.
3. Крянев А.В., Лукин Г.В. Математические методы обработки неопределенных данных.
М.: Физматлит, 2003. 216 с.
4. Воеводин В.В. Кузнецов Ю.А. Матрицы и вычисления. М.: Наука, 1984. 320 с.
5. Лоусон Ч., Хенсон Р. Численное решение задач метода наименьших квадратов. М.: Наука, 1986. 232 с.
Бобров Александр Валерьевич
Перепелкин Евгений Александрович
Алтайский государственный технический университет
им. И.И. Ползунова
E-mail; 22bav@mail.ru eap@list.ru
Поступила в редакцию 30 октября 2011 г.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Построение робастных оценок средних значений и вариаций двумерных данных
47
Bobrov Alexandr V., Perepelkin Evgeniy A. (Polzunov Altai State Technical University). Construction of robust estimates of meano values and variations of two-dimensional data on the
basis of the spectral matrix norm.
Keywrds: data analysis, mean value, variation, robustness.
The problem of estimating of mean values and variations of two-dimensional data is considered. Data can be represented as a matrix in discrete case, or as a function of two variables in the
continuous case. Estimate of the mean value of discrete data is found as solution of the optimization problem with objective function in the form of the spectral norm of a matrix. In the continuous case the problem is reduced to the discrete case by sampling the domain of function. The inequalities to assess the influencet of errors in the data matrix on the results of calculations of mean
values and variations in data are derived. The results of test calculations confirm the robustness of
the estimates of the mean values and variations derived from spectral norms with respect to data
errors.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
УДК 519.2
Ю.Б. Буркатовская, С.Э. Воробейчиков, Е.Е. Сергеева
ОЦЕНИВАНИЕ ПАРАМЕТРОВ И ОБНАРУЖЕНИЕ МОМЕНТА
ИХ ИЗМЕНЕНИЯ ДЛЯ ОБОБЩЕННОГО АВТОРЕГРЕССИОННОГО
ПРОЦЕССА С УСЛОВНОЙ НЕОДНОРОДНОСТЬЮ
Рассматривается задача обнаружения момента изменения параметров
GARCH(p,q)-процесса. Авторегрессионные параметры процесса предполагаются неизвестными до и после момента разладки. Предлагается последовательная процедура оценивания параметров, основанная на взвешенном
методе наименьших квадратов. Выбор весовых коэффициентов и момента
остановки позволяет строить оценки с ограниченным среднеквадратическим
отклонением, зависящим от параметра процедуры H. Процедура определения момента разладки основана на сравнении оценок неизвестных параметров процесса на различных интервалах наблюдения. Получены верхние границы для расчета вероятностных характеристик предложенной процедуры:
вероятности ложной тревоги и ложного спокойствия.
Ключевые слова: GARCH(p,q), момент разладки, метод наименьших квадратов, среднеквадратическое отклонение, гарантированное оценивание.
В 1986 г. T. Bollerslev [1] впервые предложил использовать модель GARCH –
обобщенную авторегрессионную модель гетероскедастичности для анализа временных рядов. При описании процессов типа GARCH предполагается, что на текущую изменчивость дисперсии влияют как предыдущие изменения показателей,
так и предыдущие значения дисперсии. Модели типа GARCH часто используются
при обработке информации в задачах последовательного анализа данных, имеющих эконометрическую направленность, а именно, при управлении финансовыми
рисками, так как пренебрежение определением структурных изменений может
приводить к финансовым потерям.
В настоящее время интерес к данной модели не снижается, о чем свидетельствует большое количество работ в этой области [2−5] и др. Так, в работе [2]
E. Hillebrand предложил алгоритм оценивания, основанный на функции логарифмического правдоподобия, с использованием ненаблюдаемого процесса условной
вариации. Davies и др. [3] для определения изменения применяют обобщенное отношение правдоподобия, которое приводит к квадратичной форме. Gombey и
Serban в [4] используют эффективный вектор вклада в последовательной процедуре, когда необходимо определить изменение параметра, если начальное значение задано, а остальные компоненты являются мешающими параметрами. Работа
Е.Gombey [5] посвящена апостериорному методу обнаружения разладки, когда
полностью доступна последовательность наблюдений и не определены начальные
параметры, однако необходимо оценивать все параметры модели. Для определения разладки автор использует функцию log-правдоподобия и вектор эффективного вклада.
Во многих практических приложениях задача обнаружения момента разладки
случайных процессов оказывается тесно связана с задачей оценивания параметров
этих процессов. Для оценивания параметров GARCH-модели часто используется
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценивание параметров и обнаружение момента их изменения
49
оценка квазимаксимального правдоподобия. Таким оценкам, в частности, посвящены статьи [6−8]. Pan и др. [9] изучали вероятностные и асимптотические свойства оценки квазимаксимального правдоподобия параметров пороговой модели
GARCH. Для стандартной модели GARCH асимптотические свойства, в частности
асимптотическую нормальность, оценок такого типа рассматривали Berkes [7] и
Francq и Zakoian [8]. Straumann и Mikosch [10] установили, что оценки квазимаксимального правдоподобия для общего класса моделей с условной гетероскедастичностью являются асимптотически нормальными. В работе [11] рассматривался класс пороговых GARCH-моделей и строились оценки по методу квазимаксимального правдоподобия и по методу наименьших квадратов. Авторы показали,
что асимптотически МНК-оценка параметров является более точной, чем оценка
максимального правдоподобия. Робастные оценки параметров модели GARCH
рассматривались в работах [12−14]. Baillie and Chung [15] предложили оценку с
минимальным расстоянием для модели GARCH(1,1), которая основывается на автокорреляционной функции квадратов наблюдений. В статье [16] предлагается
метод оценивания, основанный на автоковариационной функции квадратов наблюдений, не требующий знаний о функции распределения.
В данной работе предлагается последовательная процедура обнаружения момента разладки процесса GARCH(p,q) с неизвестными авторегрессионными параметрами. Метод обнаружения разладки для случая с известными параметрами
рассмотрен в [17]. Предложен метод оценки неизвестных параметров процесса,
основанный на модифицированном взвешенном методе наименьших квадратов
[18], позволяющий получить оценки с гарантированной точностью.
1. Постановка задачи
Рассматривается устойчивый случайный процесс GARCH(p,q)
xn = σ n ε n , n = 0,1...,
(1)
где {εn} – последовательность независимых одинаково распределенных случайных величин с нулевым средним, единичной дисперсией и известным распределением. Плотность распределения шумов положительна на всей числовой прямой.
Условная вариация процесса xn представляет собой случайный процесс вида
p
q
i =1
i =1
σ2n = a + ∑ λ i xn2−i + ∑ μi σ 2n −i .
Параметры {a, λi } предполагаются неизвестными, а параметры μi – известными.
Параметры процесса удовлетворяют условиям
p
q
i =1
j =1
a > 0, λi ≥ 0, μ j ≥ 0, 1 ≤ i ≤ p, 1 ≤ j ≤ q, 0 < ∑ λ i + ∑ μ j < 1.
(2)
{σ2n } является стационарным [1]. Вектор параметров
Λ = [a, λ1 ,… , λ p ] меняет свое значение с Λ0 на Λ1 в неизвестный момент времени
Тогда
процесс
θ. Начальное и конечное значения параметров удовлетворяют условию
2
Λ 0 − Λ1 ≥ ∆ > 0 ,
где ∆ является известным значением, определяющим минимальное расстояние
между значениями параметров до и после момента разладки. Требуется по
наблюдениям за процессом { xn } определить момент разладки.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.Б. Буркатовская, С.Э. Воробейчиков, Е.Е. Сергеева
50
2. Построение оценок параметров
Так как значения параметров до и после момента разладки являются неизвестными, то необходимо получить их оценки. Преобразуем сначала процесс (1), записав его в матричной форме
Sn = X n ΛT + MSn −1 , X n : q × ( p + 1) , M : q × q;
T
Sn = ⎡⎣ σ2n −1 ,… , σ 2n − q ⎤⎦ , Λ = ⎡⎣ a, λ1 ,… , λ p ⎤⎦ ;
⎡ 1 xn2−1 … xn2− p ⎤
⎡μ1 … μ q −1 μ q ⎤
⎢
⎥
⎢
0
0⎥
0 …
0 ⎥, M = ⎢ 1 …
Xn = ⎢ 0
⎥.
⎢… … … … ⎥
⎢… … … … ⎥
⎢0
1
0 ⎦⎥
0 …
0 ⎥⎦
⎣⎢ 0 …
⎣
Используя это представление, получим
(
)
… = ( X n + MX n −1 + … + M k X n − k ) ΛT + M k +1Sn − k −1.
Sn = X n ΛT + MSn −1 = X n ΛT + M X n −1ΛT + MS n − 2 = ( X n + MX n −1 ) ΛT + M 2 Sn − 2 =…
(3)
Из ограничений на параметры (2) следует, что для любого j-мерного вектора S с
положительными коэффициентами выполнено неравенство
max M q S
1≤ j ≤ q
Следовательно, max M k +1S
1≤ j ≤ q
j
j
⎛ q
⎞
< ⎜ ∑ μ j ⎟ max S
⎜
⎟
⎝ j =1 ⎠ 1≤ j ≤ q
.
j
→ 0 при k → ∞ , и последним слагаемым в выра-
жении (3) можно пренебречь.
Запишем аппроксимацию для вектора S n более компактно:
Sn = G ( n, μ, x ) ΛT .
Здесь G ( n, μ, x ) – случайная матрица, зависящая от реализации процесса
{ xk }1≤ k ≤ n −1 и подчиняющаяся следующим рекуррентным соотношениям:
G ( n, μ, x ) = X n + MG ( n − 1, μ, x ) ;
G ( n0 , μ, x ) = X n0 , n0 = max {q, p} .
Условная дисперсия процесса (1) σ2n – это первая компонента вектора S n . Обозначив первую строку матрицы G ( n, μ, x ) через F ( n, μ, x ) , получаем
σn2 = F ( n, μ, x ) ΛT ;
F ( n, μ, x ) = ⎡⎣ F0 ( n, μ, x ) , F1 ( n, μ, x ) ,… , Fp ( n, μ, x ) ⎤⎦ .
(4)
Рекуррентные уравнения для компонент вектора F ( n, μ, x ) принимают вид
q
q
j =1
j =1
F0 ( n, μ, x ) = 1 + ∑ μ j F0 ( n − j , μ, x ), Fi ( n, μ, x ) = xn2−i + ∑ μ j Fi ( n − j , μ, x ), i = 1, p
F ( n0 − j , μ, x ) = ⎡⎣1, xn20 −1− j ,… , xn20 − p − j ⎤⎦ ,
j = 0, q − 1.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценивание параметров и обнаружение момента их изменения
51
Чтобы привести процесс (1) к удобному для исследования авторегрессионному
процессу, используем подход, который был предложен в [19]. Учитывая представлиние (4), запишем процесс (1) в виде
(
)
xn2 = σn2 + σ n2 (ε n2 − 1) = F ( n, μ, x ) ΛT + F ( n, μ, x ) ΛT ε n2 − 1 .
Введем следующие обозначения:
mn = max { F0 ( n, μ, x ) ,… , Fp ( n, μ, x )} ,
yn =
F ( n , μ, x )
xn2
, un ,i = i
,0≤i≤ p,
mn
mn
2
ε 2n − 1
, B 2 = E ε n2 − 1 , bn = BΛU n .
B
Теперь представим процесс (1) в векторном виде:
yn = ΛU n + bn ζ n .
(5)
(
T
U n = ⎡⎣un,0 ,…, un, p ⎤⎦ , Λ = ⎡⎣ a, λ1 ,…, λ p ⎤⎦ , ζ n =
)
Построим оценку величины дисперсии шума bn в (3). Поскольку 0 ≤ un,i ≤ 1 ,
p
⎛
⎞
bn = BΛU n ≤ B ⎜ a + ∑ λi ⎟ .
(6)
⎝
⎠
i =1
Отсюда следует, что дисперсия шума в процессе (5) ограничена сверху, но неизвестна.
Для компенсации неизвестной дисперсии помех вычисляется статистика Γ N .
Учитывая (4), имеем
p
⎛
⎞
xn2 ≥ min { F0 ( n, μ, x ) ,… , Fp ( n, μ, x )} ⎜ a + ∑ λ i ⎟ ε 2n .
⎝
⎠
i =1
Введем обозначение
zn =
xn2
.
min { F0 ( n, μ, x ) ,… , Fp ( n, μ, x )}
Множитель Γ N можно выбрать в одной из двух форм:
−2
2
⎛ N
⎞
⎛ N
⎞
⎜
⎟
a) Γ N = C N ⎜ ∑ zl ⎟ , CN = B 2 E ⎜ ∑ εl2 ⎟ ;
⎜
⎟
⎜ l=N
⎟
⎝ l = N0 ⎠
⎝
⎠
0
b) Γ N = C N
N
∑
l = N0
zl2 , CN =
⎛ N
⎜
B2 E⎜
⎜ l=N
⎝
0
∑
⎞
⎟
εl4 ⎟
⎟
⎠
−1
(7)
.
Плотность распределения шумов {εl } должна быть такова, чтобы существовала константа CN в (7). Типы таких плотностей рассмотрены в [19]. Промежуток
[ N 0 , N ] выбирается из следующих соображений: значение N0 должно быть достаточно велико, чтобы использование аппроксимации (4) было корректным; кроме того, значения функций min { F0 ( n, μ, x ) ,… , Fp ( n, μ, x )} не должны быть близки
к нулю. Поскольку функция F0 ( n, μ, x ) возрастает с ростом n , а плотность распределения шумов процесса положительна на всей числовой прямой, то такой
промежуток может быть выбран за конечное время.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
52
Ю.Б. Буркатовская, С.Э. Воробейчиков, Е.Е. Сергеева
Из соотношений (7) следует, что
2
p
⎛
⎞
1
1
E
≤ , C = B 2 ⎜ a + ∑ λi ⎟ .
Γn C
⎝
⎠
i =1
(8)
Для нахождения оценки неизвестного вектора параметров Λ используем последовательный метод оценивания, предложенный в [18]. Оценка имеет вид
⎛ N1
Λ* ( N1 ) = ⎜⎜ ∑ yn v(n, x)U nT
⎝ n = N +1
Α( N1 ) =
N1
∑
⎞ −1
⎟⎟ A ( N1 ),
⎠
v(n, x)U nU nT .
n = N +1
Для фиксированного значения H>0 определим момент остановки τ = τ(H)
τ = τ( H ) = inf{N1 > N + 1: υmin ( N1 ) ≥ H },
(9)
где υmin(N1) – минимальное собственное значение матрицы Α( N1 ) .
Положительные весовые функции v(n, x) на интервале [ N + 1, N + σ − 1] задаются следующим образом:
1
v ( n, x ) =
,
(10)
Γ N U nT U n
где σ – наименьшее значение N1 , для которого матрица Α( N1 ) не вырождена.
Веса v(n, x) на интервале [ N + σ, τ − 1] находятся из условий
k
υmin (k )
= ∑ v 2 (n, x)U nT U n .
ΓN
n = N +σ
(11)
Последняя весовая функция v(τ, x) находится из условий
τ
υmin (τ)
≥ ∑ v 2 (n, x)U nT U n , υmin (τ) = H .
ΓN
n = N +σ
(12)
Из соотношенй (10) – (12) следует, что весовые функции удовлетворяют условию
1
0 ≤ v(n, x) ≤
.
ΓN
Отсюда и из (6), (8) получаем, что
Ev 2 (n, x)bn2 ≤ 1 .
Оценка параметров Λ∗(H) в момент времени τ имеет следующий вид:
τ
⎛ τ
⎞
(13)
Λ* ( H ) = ⎜ ∑ v(n, x) ynU nT ⎟ A −1 (τ), A(τ) = ∑ v(n, x)U nU nT .
⎝ n = N +1
⎠
n = N +1
Свойства предложенной оценки определяет теорема 1.
Теорема 1. Для любого значения параметра процедуры H>0 момент прекращения наблюдений τ(H) конечен с вероятностью единица и средний квадрат
нормы отклонения оценки Λ* ( H ) от истинного значения вектора параметров Λ
удовлетворяет неравенству
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценивание параметров и обнаружение момента их изменения
E Λ* ( H ) − Λ
2
≤
53
H+p
.
H2
Доказательство. Момент прекращения наблюдений τ(H) является конечным
тогда и только тогда, когда расходится почти наверное ряд
ΓN
∞
∑
v 2 (n, x)U nT U n = ∞.
n = N +1
Для сходимости почти наверное данного ряда необходимо и достаточно, чтобы
выполнялось условие [20]
∞
⎧
⎫
∀ε > 0 : P ⎨Γ N ∑ v 2 (n, x)U nT U n ≥ ε ⎬ ⎯⎯⎯
→ 0.
k →∞
⎩ n=k
⎭
(14)
Так как U nT U n > 1 , это условие может выполняться только при Γ N v 2 (n, x) → 0
по вероятности. Перепишем уравнение для определения весовых коэффициентов
(11) в виде [21]
υmin (n)
υ (n − 1) 2
1
min S T A ( n − 1) + v(n, x)U nU nT S = min
=
+ v (n, x)U nT U n .
ΓN
Γ N x: x =1
ΓN
(
)
Отсюда получаем, что для произвольного вектора S : S = 1 верно
(
v 2 (n, x)U nT U n Γ N − v(n, x) U nT S
) − ( S T A ( n − 1) S − υmin (n − 1) ) ≤ 0 .
2
Приравнивая левую часть к нулю и решая квадратное уравнение, получаем, что
оно имеет два корня, один из которых не положителен, а второй – не отрицателен.
Коэффициент v(n, x) удовлетворяет условию
(U nT S )
v ( n, x ) ≤
2
+
(U nT S )
4
(
+ 4Γ N U nT U n S T A ( n − 1) S − υmin (n − 1)
2Γ N U nT U n
).
Равенство здесь достигается, когда S является собственным вектором матрицы
A ( n ) , соответствующим ее минимальному собственному значению. Отсюда получаем оценку члена ряда в (14)
(
)
⎧ UT S 4
⎫
n
⎪
⎪
T
(15)
ΓN v
> min ⎨
+
−
1
−
υ
(
−
1)
S
A
n
S
n
(
)
⎬.
min
S : S =1 2Γ U T U
⎪⎩ N n n
⎪⎭
Правая часть этого неравенства сходится к нулю, если и только если оба ее
слагаемых сходятся к нулю. Для этого вектор S должен сходиться к вектору, соответствующему минимальному собственному значению матрицы A(n–1), и одновременно к вектору, ортогональному Un. Поскольку вектор Un зависит от случайной величины ξn, не зависящей от A(n–1) , правая часть (15) будет больше некоторой константы с положительной вероятностью.
Используя неравенство Коши – Буняковского и соотношение (4), получаем
2
(n, x)U nT U n
(
2
2
⎛ τ
⎞
1
E Λ* ( H ) − Λ ≤ E ⎜ ∑ bn ζ n v(n, x)U nT ⎟ A−1 (τ) ≤ 2 E
H
⎝ n = N +1
⎠
)
τ
∑
2
bn ζ n v(n, x)U nT
n = N +1
. (16)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.Б. Буркатовская, С.Э. Воробейчиков, Е.Е. Сергеева
54
Введем усеченный момент остановки τ ( N1 ) = min {τ, N1} , тогда τ ( N1 ) → τ при
N1 → ∞ . Выражение (16) преобразуется к виду, отличающемуся от исходного
только пределом суммирования. Обозначим через Fn = σ { x1 ,… , xn0 , ζ n0 +1 ,… , ζ n } σ
– алгебру, порожденную случайными величинами
{ x1 ,…, xn , ζ n +1 ,…, ζ n } .
0
Ис-
0
пользуя свойства условного математического ожидания получаем
1
H2
2
T
bn ζ n v(n, x)U n
n = N +1
N1
n −1
τ ( N1 )
⎡ N1 2 2
⎤
T
2
EE
⎢ ∑ bn v (n, x)U n U n ζ n χ( n ≤τ) Fn −1 ⎥ +
2
H
⎣ n = N +1
⎦
⎡
⎤
2
+ 2 EE ⎢ ∑ ∑ bk bn v (k , x)v(n, x)U kT U n ζ k ζ n χ( n ≤τ) Fn −1 ⎥ =
H
⎣ n = N + 2 k = N +1
⎦
∑
E
=
2
+
=
1
H2
H2
E
1
H2
N1
∑ bn2 v 2 (n, x)U nT U n χ(n≤τ) E ⎡⎣ζ 2n
E
N1
E
1
=
n = N +1
n −1
∑ ∑
Fn −1 ⎤⎦ +
bk bn v(k , x)v(n, x)U kT U n ζ k χ( n ≤τ) E [ ζ n Fn −1 ] =
n = N + 2 k = N +1
N1
τ
1
⎯
→ 2 E ∑ bn2 v 2 (n, x)U nT U n .
∑ bn2 v 2 (n, x)U nT U n χ(n≤τ) ⎯⎯⎯
N →∞
H
1
n = N +1
n = N +1
Учитывая оценки (6), (8) и условия для выбора весов (10)–(12), получаем
1
H
2
τ
E
∑ bn2 v 2 (n, x) U n
n = N +1
2
≤
C
2
N +σ−1
E
∑
v 2 (n, x) U n
2
+
C
H
H
n = N +1
C ( H + p)
1
H+p
E
.
≤
≤
ΓN
H2
H2
2
τ
E
∑
v 2 (n, x) U n
2
≤
n = N +σ
Теорема доказана.
3. Построение процедуры обнаружения разладки
Построим
Α(T1 , T2 ) =
T2
процедуру
определения
∑ v(n, x)U nU nT , а υmin (T1 , T2 )
момента
разладки.
Пусть
матрица
– ее минимальное собственное значение.
n =T1
Весовые функции v(n, x) определяются аналогично (10)–(12). Построим последовательность моментов остановки
τ0 = N ; τi = min {T > τi −1 : υmin (τi −1 + 1, T ) ≥ H } , i ≥ 1.
На каждом интервале [ τi −1 + 1, τi ] найдем оценку параметров ∆*i ( H ) процесса (1),
построенную по формуле, аналогичной (13). Далее сравним оценки параметров,
полученные на интервалах, отстоящих друг от друга на m шагов. Если интервал
[ τi −1 + 1, τi ] не содержит момент разладки θ, то вектор параметров Λ на этом интервале является постоянным и его значение равно или начальному значению Λ0, или
конечному Λ1. Если, для определенного i, разница между значениями параметров на
интервалах [ τi − m −1 + 1, τi − m ] и [ τi −1 + 1, τi ] не меньше, чем заданная величина ∆, то
τi − m ≤ θ ≤ τi −1 . Свяжем статистику Ji с интервалом [ τi −1 + 1, τi ] для i>m
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценивание параметров и обнаружение момента их изменения
55
J i = (Λ*i − Λ*i − m )T (Λ*i − Λ*i − m ).
(17)
Эта статистика характеризует квадрат нормы различия оценок с номерами i и i– m.
Обозначим отклонение оценки ∆*i ( H ) от истинного значения вектора параметров
через σi. Если выполняется условие θ > τi , то до момента τi значения параметров
остаются неизменными и статистика (17) имеет вид
2
J i = σi − σi − m .
Если τi − m ≤ θ ≤ τi −1 , то есть изменение значений параметров произошло на интервале [ τi − m , τi −1 ] , то статистика Ji примет следующий вид:
2
J i = Λ1 − Λ 0 + σi − σi − m .
Алгоритм определения точки изменения параметров процесса заключается в
следующем: значение заданной статистики (17) сравнивается с пороговым значением δ. Решение о наличии разладки принимается при превышении значения статистики Ji значения δ.
Важными характеристиками любой процедуры обнаружения разладки являются вероятности ложной тревоги и ложного спокойствия. Благодаря использованию
взвешенного метода наименьших квадратов для построения оценок, в каждом
цикле наблюдений можно обеспечить заданную вероятность ложной тревоги и
ложного спокойствия, выбирая параметр процедуры H соответствующим образом.
Теорема 2. Пусть 0 < δ < ∆ , тогда вероятность ложной тревоги P0 и вероятность ложного спокойствия P1 на любом интервале наблюдений [τi−1+1, τi] являются ограниченными
4( H + p )
4( H + p )
P0 ( H , δ) ≤
, P1 ( H , δ) ≤
.
2
2
2
H δ
H
∆− δ
(
)
Доказательство. Рассмотрим вероятность ложной тревоги. В этом случае
значение статистики Ji превышает порог δ до момента разладки θ. Используя
свойства нормы вектора и неравенство Чебышева, а также утверждение теоремы 1,
получаем
{
P0 ( H , δ) = P{J i > δ | τi < θ} = P σi − σi − m
2
}
>δ ≤
2 E{ σi
2
2
+ σi }
≤
4( H + p )
.
H 2δ
Для нахождения вероятности ложного спокойствия рассматриваются случаи, когда момент разладки уже наступил, а значение статистики (17) не превысило пороговое значение δ. Вероятность P1 имеет вид
{
δ
P1 ( H , δ) = P { J i < δ | τi − m < θ < τi −1} = P Λ1 − Λ 0 + σi − σi − m
{
2
}
<δ =
}
= P Λ1 − Λ 0 + σi − σi − m < δ .
Учитывая, что ||Λ1-Λ0||² >∆ >0 и используя свойства нормы, неравенство Чебышева и утверждение теоремы 1, получаем
4( H + p )
P1 ( H , δ) ≤ P ∆ − σi − σi − m < δ = P σi − σi − m < ∆ − δ ≤
.
2
H2 ∆ − δ
{
Теорема доказана.
}
{
}
(
)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
56
Ю.Б. Буркатовская, С.Э. Воробейчиков, Е.Е. Сергеева
Заключение
В работе построена и исследована последовательная процедура обнаружения
момента изменения значений параметров процесса GARCH(p,q), параметры которого предполагаются неизвестными до и после момента разладки. Для построения
процедуры обнаружения разладки использовались оценки неизвестных параметров процесса, вычисленные на различных интервалах наблюдений. Предлагаемый
метод построения оценок основан на использовании модифицированного взвешанного метода наименьших квадратов с гарантированным среднеквадратическим отклонением. Таким образом, точность получаемых оценок неизвестных параметров зависит от выбора заданного параметра процедуры. Найдены характеристики процедуры обнаружения разладки.
ЛИТЕРАТУРА
1. Bollerslev T. Generalized autoregressive conditional heteroskedasticity // J. Econometrics.
1986. V. 86. P. 307−327.
2. Hillebrand E. Negleting parameter changes in GARCH models// J. Econometrics. 2005.
V. 129. P. 121−138.
3. Davies R.A., Huang D., Yao Y.-C. Testing for change in the parameter value and order of
autoregressive model // Ann. Statist. 1995. V. 23. P. 282−304.
4. Gombey E., Serban D. Monitoring parameter change in AR(p) time series models // Statistics
Centre Technical Reports 05.04, The University of Alberta, Edmonton, Canada, 2005.
5. Gombey E. Change detection in autoregressive time series // J. Multivariate Analysis. 2008.
V. 99. P. 451−464.
6. Berkes I., Horvath L. The efficiency of the estimators of the parameters in GARCH processes
// Annals of Statistics. 2004. V. 32. P. 633−655.
7. Berkes I., Horvath L., Kokoszka P.S. GARCH processes: Structure and estimation // Bernoulli. 2003. V. 9. P. 201−227.
8. Francq C., Zacoian J.M. Maximum likelihood estimation of pure GARCH and ARMA –
GARCH processes // Bernoulli. 2004. V. 10. P. 605−637.
9. Pan J., Wang H., Tong H. Estimation and power-transformed and threshold GARCH models
// J. Econometrics. 2008. V. 142. P. 352−378.
10. Bai J. Least squares estimation of a shift in linear process // J. Time Series Analysis. 1994.
V. 15. N.5. P. 453−472.
11. Hamadeh T., Zakoian J.-M. Asymptotic properties of LS and QML estimators for a class of
nonlinear GARCH processe // J. Statist. Plann.Inference. 2011. V. 141. P. 488−507.
12. Boudt K., Croux C. Robust M-estimation of multivariate GARCH models // Computational
Statistics and Data Analysis. 2010. V. 54. P. 2459−2469.
13. Muler N., Yohai V.J. Robust estimates for GARCH models // J. Statistical Planning and Inference. 2008. V. 138. N. 10. P. 2918−2940.
14. Peng I., Yao Q. Least absolute deviations estimation for ARCH and GARCH models //
Biometrica. 2003. V. 90. N. 4. P. 967−997.
15. Baillie R.T., Chung H. Estimation of GARCH models from the autocorrelation of the squares
of a process // J. Time Ser. Anal. 2001. V. 22. No. 6. P. 631−650.
16. Storti G. Minimum distance of GARCH(1,1) models // Computattional Statistics and Data
Analysis. 2006. V. 51. P. 1803−1821.
17. Буркатовская Ю. Б., Воробейчиков С.Э. Гарантированное обнаружение момента разладки GARCH-процесса // Автоматика и телемеханика. 2006. № 12. С. 56−70.
18. Meder N., Vorobejchikov S. On guaranteed estimation of parameters of random processes by
the weighted least square method // Proc. 15th Triennial World Congress of the International
Federation of Automatic Control. Barcelona, 2002. No. 1200.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценивание параметров и обнаружение момента их изменения
57
19. Дмитренко А.А., Конев В.В. О последовательной классификации процессов авторегрессии с неизвестной дисперсией помех // Проблемы передачи информации. 1995. Т. 31.
Вып. 4. С. 51−62.
Буркатовская Юлия Борисовна
Воробейчиков Сергей Эрикович
Сергеева Екатерина Евгеньевна
Томский государственный университет,
E-mail: tracey@tpu.ru; sev@mail.tsu.ru; sergeeva_e_e@mail.ru
Поступила в редакцию 5 ноября 2011 г.
Burkatovskaya Yulia B., Vorobeychikov Sergey E., Sergeeva Ekaterina E. (Tomsk State University, Tomsk Polytechnic University). Parameter estimation and their change-point detection
for generalized autoregressive process with conditional heteroscedasticity.
Keywords: GARCH(p,q), change-point, least squares method, mean square error, guaranteed estimation.
The problem of change-point detection of the parameters of GARCH(p,q) process is considered. The utoregressive parameters of the process before and after the change point are supposed
to be unknown. A sequential procedure for estimating the parameters based on the weighted least
squares method is developed. The choice of the weights and the stopping rule allows one to construct an estimator with a preassigned mean square error depending on parameter H of the procedure. The procedure of change-point detection is based on comparison of parameter estimators on
different observation intervals. The upper bounds for probabilities of the false alarm and the delay
are found.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
УДК 519.21
А.М. Горцев, А.А. Калягин
ВЕРОЯТНОСТЬ ОШИБОЧНЫХ РЕШЕНИЙ
ПРИ ОЦЕНИВАНИИ СОСТОЯНИЙ ОБОБЩЕННОГО
ПОЛУСИНХРОННОГО ПОТОКА СОБЫТИЙ
Рассматривается обобщенный полусинхронный поток событий, являющийся
одной из адекватных математических моделей информационных потоков
заявок (событий), функционирующих в современных цифровых сетях интегрального обслуживания. Приводятся аналитические результаты по нахождению условной и безусловной вероятности ошибочного решения при решении задачи оптимальной оценки состояний обобщенного полусинхронного потока событий.
Ключевые слова: обобщенный полусинхронный поток событий, состояние
потока, апостериорная вероятность состояния, оценка состояния, вероятность ошибки вынесения решения.
Настоящая статья является непосредственным продолжением работы [1], в которой рассматривается задача оценки состояний обобщенного полусинхронного
потока событий. Последний является одной из адекватных математических моделей информационных потоков заявок (событий), функционирующих в современных цифровых сетях интегрального обслуживания (ЦСИО) [2], и относится к
классу дважды стохастических потоков событий с интенсивностью, являющейся
кусочно-постоянным случайным процессом. Обширная литература по исследованию подобных потоков событий (асинхронных, синхронных и полусинхронных
МС-потоков событий) приведена в [1, 3, 4]. Вследствие этого оставляем за рамками данной статьи вопросы, связанные с классификацией дважды стохастических
потоков событий и задачами, возникающими при их исследовании.
В [1] решена задача оптимальной оценки состояний (задача фильтрации интенсивности потока) обобщенного полусинхронного потока событий по наблюдениям за потоком в течение конечного интервала времени. В качестве критерия оптимальности в [1] используется критерий максимума апостериорной вероятности,
обеспечивающий минимум полной (безусловной) вероятности ошибки вынесения
решения о том или ином состоянии обобщенного полусинхронного потока событий [5]. Путем имитационного моделирования в [1] найдены (для определенного
набора параметров) оценки безусловной вероятности ошибки вынесения решения.
В связи с этим представляет интерес получить аналитические результаты, связанные с нахождением условной (безусловной) вероятности ошибки вынесения решения, чему и посвящена настоящая статья.
1. Постановка задачи
Рассматривается полусинхронный дважды стохастический поток с инициированием дополнительных событий (далее обобщенный полусинхронный поток или
просто поток), интенсивность которого есть кусочно-постоянный случайный процесс λ(t) с двумя состояниями λ1 и λ2 (λ1 > λ2). В течение временного интервала,
когда λ(t) = λj , имеет место пуассоновский поток событий с интенсивностью λj ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вероятность ошибочных решений при оценивании состояний
59
j = 1,2. Переход из первого состояния процесса λ(t) во второе возможен только в
момент наступления события, при этом переход осуществляется с вероятностью p
(0 < p ≤ 1); с вероятностью 1 – p процесс λ(t) остается в первом состоянии. Тогда
длительность пребывания процесса λ(t) в первом состоянии есть случайная величина с экспоненциальной функцией распределения F1 (τ) = 1 − e − pλ1τ . Переход из
второго состояния процесса λ(t) в первое состояние может осуществляться в произвольный момент времени. При этом длительность пребывания процесса λ(t) во
втором состоянии распределена по экспоненциальному закону: F2 (τ) = 1 − e − ατ .
При переходе процесса λ(t) из второго состояния в первое инициируется с вероятностью δ (0 ≤ δ ≤ 1) дополнительное событие в первом состоянии (т.е. сначала
осуществляется переход, а затем инициируется дополнительное событие). Очевидно, что в сделанных предпосылках λ(t) – марковский процесс. Вариант возникающей ситуации приведен на рис. 1, где 1, 2 – состояния случайного процесса
λ(t); t1 , t2 ,… – моменты наступления событий; t4 ,… – моменты инициирования
дополнительных событий с вероятностью δ.
1
1–p
1–p
p
α
1–p
p
...
α
2
t
t1
t2
t3 t4
t5
t6
t7 t8
t9
t10
t
Рис. 1. Формирование обобщенного полусинхронного потока
Если δ = 0, то имеет место обычный полусинхронный поток событий [6]. Так
как процесс λ(t) и типы событий (события пуассоновских потоков и дополнительные события) являются принципиально ненаблюдаемыми, а наблюдаемыми являются только временные моменты наступления событий t1 , t2 ,… , то необходимо
по этим наблюдениям оценить состояние процесса (потока) λ(t) в момент окончания наблюдений и определить возникающую при этом безусловную (или условную) вероятность ошибки вынесения решения.
Рассматривается установившийся (стационарный) режим функционирования
потока событий, поэтому переходными процессами на полуинтервале наблюдения
(t0 , t], где t0 – начало наблюдений, t – окончание наблюдений (момент вынесения
решения), пренебрегаем. Пусть w (λj|t1 ,…, tm) – апостериорная вероятность того,
что в момент времени t значение процесса λ(t) = λj , j = 1,2, m – количество наблюденных событий за время t, при этом w (λ1|t1 ,…, tm) + w (λ2|t1 ,…, tm) = 1. Вынесение решения о состоянии ненаблюдаемого процесса λ(t) (или потока) в момент
времени t производится по критерию максимума апостериорной вероятности: если w(λ1|t1 ,…, tm) ≥ w(λ2|t1 ,…, tm) (w(λ1|t1 ,…, tm) ≥ 1/2), то оценка состояния процесса λ(t) есть λ(t ) = λ1, в противном случае λ(t ) = λ2.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
60
А.М. Горцев, А.А. Калягин
2. Вероятности ошибочного решения о состоянии обобщенного
полусинхронного потока в общем случае
Рассмотрим полуинтервал (t0 , t] наблюдения за обобщенным полусинхронным
потоком, его длительность есть t – t0. Зафиксируем момент времени t. Так как моменты наступления событий t1 ,…, ti (t1 < t2 < … < ti < t), попавшие в интервал (t0, t],
случайны, то случайна и разность t – ti. Таким образом, момент вынесения решения t лежит между моментами времени ti и ti+1 (ti < t < ti+1), при этом разность
ti+1 – t также случайна (момент времени ti+1 может быть, в принципе, сколь угодно
большим). Итак, вынесение решения о состоянии процесса λ(t) привязано к интервалу между двумя соседними временными моментами наступления событий:
(ti , ti+1). Сам момент вынесения решения t можно трактовать как некоторую точку,
случайным образом «падающую» на ось времени 0t, никак не связанную с потоком событий. Вследствие этого точка t может попасть в любой интервал между
соседними событиями обобщенного полусинхронного потока. При этом начало
наблюдений, т.е. точка t0, однозначно определяется на оси времени 0t. Момент
начала наблюдений t0 можно положить равным нулю (t0 = 0).
Обозначим τi = t – ti. Следующее событие потока наступит в момент времени
ti+1 (ti+1 > ti). Тогда τi ограничено снизу нулем, сверху τi может быть, в принципе,
неограниченным, т.е. τi ≥ 0. Обозначим w(λ1|t) – апостериорную вероятность того,
что в момент вынесения решения t процесс λ(t) принял значение λ1 (λ(t) = λ1), т.е.
обобщенный полусинхронный поток в момент t находится в первом состоянии,
при этом ti ≤ t < ti+1 (w(λ2|t) = 1 – w(λ1|t)). С учетом введенного обозначения
w(λ1|t) = w(λ1|ti + τi), τi ≥ 0. В момент t = ti имеем w(λ1|t = ti) = w(λ1|ti + 0). Так как τi
привязано к моменту времени ti наступления i-го события, то для простоты обозначим w(λ1|ti + τi) = w(λ1|τi), τi ≥ 0.
Остановимся на алгоритме принятия решения. Процесс λ(τi), τi ≥ 0, является
ненаблюдаемым. В момент ti наступления события значение процесса λ(τi = 0)
может быть равным либо λ1, либо λ2. Вследствие этого в момент τi вынесения решения процесс λ(τi) может также принимать либо значение λ1 (λ(τi) = λ1), либо
значение λ2 (λ(τi) = λ2). Тогда оценка λ (τi ) значения процесса λ(τi) в момент времени τi (получаемая по критерию максимума апостериорной вероятности) также
может принимать либо значение λ1 ( λ (τi ) = λ1), либо значение λ2 ( λ (τi ) = λ2). При
этом возможны следующие варианты: 1) если в момент времени τi значение процесса λ(τi) = λ1 , то правильное решение ( λ (τi ) = λ1) будет приниматься, если
w(λ1|τi) ≥ w(λ2|τi); если же w(λ1|τi) < w(λ2|τi), то будет приниматься ошибочное решение (совершаться ошибка): λ (τi ) = λ2; 2) если в момент времени τi значение
процесса λ(τi) = λ2, то правильное решение ( λ (τi ) = λ2) будет приниматься, если
w(λ1|τi) < w(λ2|τi); если же w(λ1|τi) ≥ w(λ2|τi), то будет приниматься ошибочное решение (совершаться ошибка): λ (τi ) = λ1.
Обозначим w(λ(τi), τi) – распределение вероятностей значений двумерной смешанной случайной величины (λ(τi), τi), здесь λ(τi) – значение дискретной случайной величины (λ(τi) = λj, j = 1,2), τi – значение непрерывной случайной величины
(τi ≥ 0). Тогда уравнение w(λ(τi) = λ1, τi) = w(λ(τi) = λ2, τi) определяет границу τ0i
критической области, в которой отклоняется гипотеза λ (τi ) = λ2 , а принимается
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вероятность ошибочных решений при оценивании состояний
61
гипотеза λ (τi ) = λ1 (либо, наоборот, отклоняется гипотеза λ (τi ) = λ1 , а принимается гипотеза λ (τi ) = λ2). Сам корень данного уравнения (если он существует и
единственен) может быть меньше нуля (τi0 < 0), равен нулю (τi0 = 0) и может быть
больше нуля (τi0 > 0). Кроме того, возможны ситуации, когда данное уравнение
определяет некоторое множество корней. Расписывая в данном уравнении
w(λ(τi) = λj , τi), j = 1,2, через безусловную плотность w(τi) и апостериорную вероятность w(λ(τi) = λj|τi) = w(λj|τi), приходим к следующему виду уравнения для границы τi0 критической области:
(1)
w(λ1|τi) = w(λ2|τi) (w(λ1|τi) = 1/2), i = 1,2… .
Тогда, если w(λ1|τi) ≥ w(λ2|τi), то апостериорную вероятность w(λ1|τi) можно
трактовать как условную вероятность вынесения правильного решения: λ (τi ) = λ1
при условии, что вынесение решения произведено в момент времени τi (τi ≥ 0).
Апостериорную же вероятность w(λ2|τi) при этом можно трактовать как условную
вероятность вынесения ошибочного решения (трактовать как условную вероятность ошибки): решение выносится в пользу λ (τi ) = λ1 , хотя на самом деле имеет
место λ(τi) = λ2. Аналогичная трактовка имеет место, если w(λ1|τi) < w(λ2|τi).
В [1] сформулирован алгоритм расчета апостериорной вероятности w(λ1|τi).
При этом поведение апостериорной вероятности w(λ1|τi) на полуинтервале [ti , ti+1)
между соседними наблюдавшимися событиями обобщенного полусинхронного
потока определяется выражением
w(λ1 | τi ) =
w [1 − w(λ1 | ti + 0)] − [ w − w(λ1 | ti + 0)]e−bτi
1 − w(λ1 | ti + 0) − [ w − w(λ1 | ti + 0)]e −bτi
,
(2)
где τi = t – ti ≥ 0, i = 0,1,…; b = λ1 – λ2 – α ≠ 0, w = (1 – δ)/(λ1 – λ2 – αδ), λ1 – λ2 – αδ ≠ 0.
В момент времени τi = t – ti = 0 апостериорная вероятность (2) претерпевает разрыв 1-го рода (i = 1,2,…), поэтому в момент времени τi = 0 имеет место формула
пересчета
αδ + [(1 − p)λ1 − αδ] w(λ1 | ti − 0)
(3)
w(λ1 | ti + 0) =
, i = 1,2… ,
λ 2 + αδ + (λ1 − λ 2 − αδ) w(λ1 | ti − 0)
где w(λ1 | ti − 0) вычисляется по формуле (2), в которой, во-первых, вместо τi
нужно подставить τi–1 и, во-вторых, вычисления производить для τi–1 = ti – ti–1 ,
i = 1,2,… . Последнее реализует вычисление предела слева апостериорной вероятности w(λ1|τi) в момент времени τi = 0 (в момент ti наступления события). В качестве начального значения w(λ1 | t0 + 0) = w(λ1 | t0 = 0) в (2) выбирается априорная
финальная вероятность первого состояния процесса λ(t): π1 = α/(α+pλ1), которая
находится из уравнений pλ1π1–απ2 = 0, π1+π2 = 1 [7].
Изучим поведение апостериорной вероятности w(λ1|τi) как функции τi (τi ≥ 0).
Производная функции (2) по τi примет вид
dw(λ1 | τi )
b 2 [1 − w(λ1 | ti + 0) ][ w − w(λ1 | ti + 0) ] e −bτi
,
=
2
d τi
(λ1 − λ 2 − αδ) ⎡⎣1 − w(λ1 | ti + 0) − [ w − w(λ1 | ti + 0)]e−bτi ⎤⎦
(4)
где b определена в (2), w(λ1 | ti + 0) – в (3), i = 0,1,… . Рассмотрим поведение производной (4) в зависимости от τi (τi ≥ 0). Из (2) вытекает: 1) если b > 0, то
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
62
А.М. Горцев, А.А. Калягин
lim w(λ1 | τi ) = w при τi →∞; 2) если b < 0, то lim w(λ1 | τi ) = 1 при τi →∞. При
этом знак производной (4) определяется знаком величин a1 = λ1 – λ2 – αδ и
a2 = w − w(λ1 | ti + 0) : 1) если a1 > 0, a2 > 0, то dw(λ1|τi)/dτi > 0, и апостериорная вероятность w(λ1|τi) – возрастающая функция переменной τi, стремящаяся к w снизу
при τi →∞; 2) если a1 < 0, a2 < 0, то dw(λ1|τi)/dτi > 0, и w(λ1|τi) – возрастающая функция переменной τi, стремящаяся к единице снизу при τi →∞; 3) если a1 > 0, a2 < 0,
то dw(λ1|τi)/dτi < 0, и w(λ1|τi) – убывающая функция переменной τi, стремящаяся к
w сверху при τi →∞. Случай a1 < 0, a2 > 0 невозможен.
Таким образом, апостериорная вероятность w(λ1|τi) – монотонная функция переменной τi и уравнение (1) имеет либо единственный корень τi0 ( τi0 < 0, τi0 ≥ 0 ),
либо корень τi0 не существует. Подставляя (2) в (1) и решая полученное уравнении
относительно τi, находим
w(λ1 | ti + 0) − w
1
, i = 0,1… .
(5)
τi0 = ln
b (1 − 2w)[1 − w(λ1 | ti + 0)]
Выражение (5) определяет границу критической области τi0 и в зависимости от
значений величин b, a1, δ, w, w(λ1|ti + 0) возможны различные варианты положения τi0 на временной оси.
Случай 1. b > 0, a1 > 0, 0 ≤ δ ≤ 1. Тогда 0 ≤ w ≤ 1, lim w(λ1 | τi ) = w при τi →∞.
1.1. 0 ≤ w(λ1|ti + 0) ≤ w ≤ 1/2. Тогда корень τi0 не существует, при этом условная
вероятность ошибки, обозначим ее (здесь и далее) Po(w(λ1|ti + 0), τi), определится в
виде
Pо(w(λ1|ti + 0), τi) = w(λ1|τi), τi ≥ 0.
(6)
1.2. 0 ≤ w < w(λ1|ti + 0) ≤ 1/2. Тогда τi0 ≤ 0 и условная вероятность ошибки определится формулой (6).
1.3. 0 ≤ w < 1/2 < w(λ1|ti + 0) < 1. Тогда τi0 > 0 и условная вероятность ошибки
определится в виде
⎧⎪1 − w(λ1 | τi ), 0 ≤ τi ≤ τi0 ;
(7)
Pо ( w(λ1 | ti + 0), τi ) = ⎨
0
⎪⎩ w(λ1 | τi ), τi > τi .
1.4. 0 ≤ w < 1/2 < w(λ1|ti + 0) = 1. Тогда корень τi0 не существует и Pо(w(λ1|ti + 0),
τi) = 0, τi ≥ 0.
1.5. 0 ≤ w(λ1|ti + 0) ≤ 1/2 < w < 1. Тогда корень τi0 ≥ 0 и условная вероятность
ошибки определится в виде
⎧⎪ w(λ1 | τi ), 0 ≤ τi < τi0 ;
(8)
Pо ( w(λ1 | ti + 0), τi ) = ⎨
0
⎪⎩1 − w(λ1 | τi ), τi ≥ τi .
1.6. 1/2 < w(λ1|ti + 0) < w < 1. Тогда корень τi0 < 0 и условная вероятность
ошибки определится в виде
(9)
Po (w(λ1|ti + 0), τi) = 1 – w(λ1|τi), τi ≥ 0.
0
1.7. 1/2 < w ≤ w(λ1|ti + 0) ≤ 1. Тогда корень τi не существует и условная вероятность ошибки определится формулой (9).
Случай 2. b < 0, a1 > 0, 0 ≤ δ < δ* (δ* = (λ1 – λ2)/α < 1). Тогда w > 1,
lim w(λ1 | τi ) = 1 при τi →∞.
2.1. 0 ≤ w(λ1|ti + 0) ≤ 1/2. Тогда корень τi0 ≥ 0 и условная вероятность ошибки
определится (8).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вероятность ошибочных решений при оценивании состояний
63
2.2. 1/2 < w(λ1|ti + 0) < 1. Тогда корень τi0 < 0 и условная вероятность ошибки
определится (9).
2.3. w(λ1|ti + 0) = 1. Тогда корень τi0 не существует и Po(w(λ1|ti + 0), τi) = 0, τi ≥ 0.
Случай 3. b < 0, a1 < 0, δ* < δ ≤ 1. Тогда w ≤ 0, lim w(λ1 | τi ) = 1 при τi →∞.
3.1. 0 ≤ w(λ1|ti + 0) ≤ 1/2. Тогда корень τi0 ≥ 0 и условная вероятность ошибки
определяется (8).
3.2. 1/2 < w(λ1|ti + 0) < 1. Тогда корень τi0 < 0 и условная вероятность ошибки
определится (9).
3.3. w(λ1|ti + 0) = 1. Тогда корень τi0 не существует и Po(w(λ1|ti + 0), τi) = 0, τi ≥ 0.
Формулы (2), (3), (5) – (9) позволяют сформулировать алгоритм расчета условной вероятности вынесения ошибочного решения Po(w(λ1|ti + 0), τi) в любой момент времени τi ≥ 0, i = 0,1… :
1) в момент времени t0 = 0 задается w(λ1|t0 + 0) = w(λ1|t0 = 0) = π1;
2) по формуле (5) для i = 0 рассчитывается τi0, тем самым устанавливается положение границы критической области на временной оси;
3) находится один из 13 вышеизложенных возможных вариантов: 1.1 – 1.7, 2.1
– 2.3, 3.1 – 3.3;
4) для найденного варианта рассчитывается (с использованием формулы (2))
вероятность Po(w(λ1|ti + 0), τi) в любой момент времени τi (0 ≤ τi < ti+1 – ti); при этом
для вариантов 1.3, 1.5, 2.1, 3.1 может выполняться либо 0 ≤ τi0 ≤ ti+1 – ti, либо
τi0 > ti+1 – ti;
5) по формуле (2) рассчитывается вероятность w(λ1|τi) в момент времени
τi = ti+1 – ti, т.е. w(λ1|ti+1 – 0); затем по формуле (3) производится пересчет апостериорной вероятности в момент времени ti+1, т.е. находится w(λ1|ti + 0); i увеличивается на единицу и алгоритм переходит на шаг 2) и т.д.
Здесь подчеркнем, что в силу формулы пересчета (3) значение w(λ1|ti + 0) зависит от всех моментов t1 ,…, ti наступления событий в потоке, т.е. вся предыдущая
информация сосредоточена в вероятности w(λ1|ti + 0). Вследствие этого для нахождения безусловной вероятности ошибки необходимо усреднить условную вероятность ошибки Po(w(λ1|ti + 0), τi) по моментам наступления событий t1 ,…, ti. Однако найти в явном виде функцию распределения вероятностей моментов t1 ,…, ti
наступления событий в обобщенном полусинхронном потоке представляется затруднительным или вообще невозможным. Как будет видно ниже, определить
безусловную вероятность ошибки возможно только для некоторых частных и
особых случаев.
3. Частные случаи
Представляет интерес рассмотреть частные случаи соотношения параметров
λi, i = 1,2, α, δ.
1. λ1 – λ2 – α = 0, 0 ≤ δ < 1. Тогда а1 = α(1 – δ) > 0, w = 1. При этом [1]
w(λ1 | ti + 0) + α(1 − δ)[1 − w(λ1 | ti + 0)]τi
, τi ≥ 0, i = 0,1,… ;
(10)
w(λ1 | τi ) =
1 + α(1 − δ)[1 − w(λ1 | ti + 0)]τi
w(λ1 | ti + 0) =
αδ+[(1 − p)λ1 − αδ]w(λ1 | ti − 0)
, i = 1,2,… .
λ1 − α(1 − δ)[1 − w(λ1 | ti − 0)]
Подставляя (10) в (1), находим границу критической области
(11)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.М. Горцев, А.А. Калягин
64
τi0 =
2[1/ 2 − w(λ1 | ti + 0)]
, i = 0,1… .
α(1 − δ)[1 − w(λ1 | ti + 0)]
(12)
Тогда, если w(λ1|ti + 0) > 1/2, то τi0 < 0 и Po(w(λ1|ti + 0), τi) определяется формулой (9); если w(λ1|ti + 0) ≤ 1/2, то τi0 ≥ 0 и Po(w(λ1|ti + 0), τi) определяется формулой
(8).
2. λ1 – λ2 – αδ = 0. Отсюда следует, что равенство нулю достигается для
δ* = (λ1 – λ2)/α, при этом λ1 – λ2 – α < 0. Тогда [1]
w(λ1|τi) = 1 – [1 – w(λ1|ti+0)] e(λ1 − λ 2 −α) τi , τi ≥ 0, i = 0,1,… ;
w(λ1 | ti + 0) = (1/ λ1 )[λ1 − λ 2 + (λ 2 − pλ1 ) w(λ1 | ti − 0)] , i = 1,2,… .
(13)
Подставляя (13) в (1), находим границу критической области
1
ln {2[1 − w(λ1 | ti + 0)]} , i = 0,1… .
τi0 = −
λ1 − λ 2 − α
Тогда, если w(λ1|ti + 0) > 1/2, то τi0 < 0 и Po(w(λ1|ti + 0), τi) определяется формулой (9); если w(λ1|ti + 0) ≤ 1/2, то τi0 ≥ 0 и Po(w(λ1|ti + 0), τi) определяется формулой
(8).
4. Особые случаи
Рассмотрим особые случаи соотношения параметров λi, i = 1,2, p, α, δ, для которых возможно вычисление безусловной вероятности ошибки.
1. λ1 – λ2 – α = (1–δ) pλ1 , 0 ≤ δ < 1. Тогда a1 = (1–δ)(α+pλ1), w = π1 = α/(α+pλ1).
При этом [1]
w(λ1 | τi ) =
π1[1 − w(λ1 | ti + 0)] − [π1 − w(λ1 | ti + 0)]e − (1−δ) pλ1τi
1 − w(λ1 | ti + 0) − [π1 − w(λ1 | ti + 0)]e − (1− δ) pλ1τi
, τi ≥ 0, i = 0,1,… .
(14)
Так как w(λ1|t0 + 0) = π1 , то из (14) следует, что w(λ1|τ0) = π1 для 0 ≤ τ0 ≤ t1 – t0,
т.е. w(λ1|t1 – 0) = π1. Тогда из (3) вытекает, что w(λ1|t1 + 0) = π1 и т.д. Таким образом, имеем w(λ1|τi) = π1, τi ≥ 0, i = 0,1,… . Последнее говорит о том, что при таком
соотношении параметров информация о моментах наступления событий t1,…, tm
не оказывает влияния на апостериорную вероятность w(λ1|τi), т.е. в конечном итоге не влияет на качество оценивания состояний процесса λ(t). Решение о том или
ином состоянии обобщенного полусинхронного потока выносится на основании
априорных данных. При этом вероятность Po(w(λ1|ti + 0), τi) = π2, если π1 ≥ π2, либо
Po(w(λ1|ti + 0), τi) = π1, если π1 < π2, i = 0,1,… , так что в данном особом случае
Po(w(λ1|ti + 0), τi) является безусловной вероятностью ошибочного решения.
2. λ1 – λ2 – α = 0, δ = 1. Тогда [1] w(λ1|τi) = consti, τi ≥ 0, i = 0,1,… . Формула пересчета (3) при этом примет вид
w(λ1 | ti + 0) = (1/ λ1 ) {α+[(1 − p )λ1 − α] w(λ1 | ti − 0)} , i=1,2,… .
(15)
Так как w(λ1|t0 + 0) = π1, то w(λ1|t) = π1 для t0 ≤ t < t1 . Таким образом, и для t = t1
получаем w(λ1|t1–0) = π1. Подставляя π1 = α/(α+pλ1) в (15), находим w(λ1|t1+0) = π1 и
т.д. Таким образом, имеем w(λ1|τi) = π1, τi ≥ 0, i = 0,1,… . Здесь так же, как и в особом случае 1, отсутствует зависимость апостериорной вероятности от моментов
наступления событий t1,…, tm и решение о том или ином состоянии потока выносится на основании априорных данных аналогично особому случаю 1.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вероятность ошибочных решений при оценивании состояний
65
3. p = 1, δ = 0. Тогда a1 = λ1 – λ2 > 0, w = α/(λ1 – λ2). При этом формула пересчета
(3) приобретает вид
(16)
w(λ1|ti+0) = 0, i = 1,2,… .
Подставляя (16) в (2), находим (для любых i = 1,2,…)
w(λ1 | τ) =
w − we −bτ
, τ ≥ 0.
(17)
1 − we −bτ
В (17) имеют место следующие ситуации:
1) если λ1 – λ2 – α > 0, то 0 < w < 1 и lim w(λ1|τ) = w при τ→∞;
2) если λ1 – λ2 – α < 0, то w > 1 и lim w(λ1|τ) = 1 при τ→∞.
Для начального полуинтервала изменения t: t0 ≤ t < t1, справедлива формула
(2), в которой i = 0 и w(λ1|t0+0) = π1 = α/(α+λ1).
Из (16), (17) вытекает, что апостериорная вероятность w(λ1|τ) не зависит от
предыстории, т.е. полусинхронный (δ = 0) поток событий в данном случае является рекуррентным потоком.
Подставляя (17) в (1) находим границу критической области τi0 для любого полуинтервала [ti, ti+1) i=1,2,… , в виде
τi0 = (1/ b) ln[ w /(2 w − 1)] .
(18)
τi0
Для начального полуинтервала [t0, t1) граница критической области
определяется в (5), где i = 0 и вместо w(λ1|t0 + 0) нужно подставить π1.
Из (18) следует: 1) если 0 < w ≤ 1/2, то корень τi0 не существует и условная вероятность ошибки, обозначим ее Pо(1) (τ) , определится в виде
Pо(1) (τ) = w(λ1|τ), τ ≥ 0;
(19)
2) если w ≥ 1/2, то τi0 >0 и
0
⎪⎧ w(λ1 | τ), 0 ≤ τ < τ ;
Pо(2) (τ) = ⎨
⎪⎩1 − w(λ1 | τ), τ ≥ τ0 .
(20)
Для начального полуинтервала [t0, t1) условная вероятность ошибки Po(π1, τ0) в зависимости от значений величин π1, w, b, a1, δ определится одной из формул (6) –
(9).
Для нахождения безусловной вероятности ошибки Po необходимо знать плотность вероятностей длительности интервала (ti, ti+1), i = 0,1,… , которому принадлежит момент вынесения решения t. В силу того, что момент вынесения решения
есть некоторая точка, случайным образом падающая на ось времени, то тогда
плотность вероятностей w(τ) длительности интервала (ti, ti+1), i = 0,1,… , в который попала точка t, для рекуррентных потоков определится в виде [8]
∞
w(τ) = τp (τ) / E (τ), E (τ) = ∫ τp (τ)d τ ,
(21)
0
где p(τ) – плотность вероятностей длительности интервала между соседними событиями рекуррентного полусинхронного потока событий. Можно показать [6],
что
p(τ) = γλ1e −λ1τ + (1 − γ )(α + λ 2 )e− (α+λ 2 ) τ , γ = −α /(λ1 − λ 2 − α ), τ ≥ 0.
(22)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.М. Горцев, А.А. Калягин
66
Тогда, подставляя (22) в (21), находим
w(τ) = A1τe −λ1τ + A2 τe − (α+λ 2 ) τ , τ ≥ 0,
A1 = −
λ12 α(α + λ 2 )
λ (λ − λ 2 )(α + λ 2 ) 2
, A2 = 1 1
.
(α + λ1 )(λ1 − λ 2 − α )
(α + λ1 )(λ1 − λ 2 − α )
(23)
Учитывая (17), (19), (23), получаем выражение для безусловной вероятности
ошибки Po(1) (для ситуации 0 < w ≤ 1/2) в виде
∞
Pо(1) = ∫ w(τ) w(λ1 | τ)d τ =
0
∞
∫ f (τ)d τ,
0
f (τ) = w[( A1 − A2 )e−λ1τ − A1e− (λ1 + b ) τ + A2 e− (α+λ 2 ) τ ]
τ
1 − we −bτ
,
(24)
где А1, А2 определены в (23), w определена в (17), b – в (2).
Для ситуации w ≥ 1/2 с учетом формул (17), (20), (23) находим
Pо(2)
τ0
=
∞
∫ w(τ)w(λ1 | τ)d τ +
0
∫ w(τ)[1 − w(λ1 | τ)]d τ =
τ0
0
0
A
A2
1
1
( τ0 +
)e− (α+λ 2 ) τ +
= 1 (τ0 + )e −λ1τ +
λ1
λ1
α + λ2
α + λ2
τ0
∫
0
∞
f (τ)d τ −
∫
f (τ)d τ, (25)
τ0
где τ0 определена в (18), А1, А2 – в (23), f(τ) – в (24). Интегралы, входящие в (24) и
(25), могут быть вычислены только численно.
Для начального полуинтервала [t0, t1) безусловная вероятность ошибки Po(0)
находится аналогично нахождению безусловных вероятностей ошибок Po(1) и Po(2),
при этом та или иная формула для Po(0) выписывается в зависимости от значений
величин π1, w, b, a1, δ. Например, если реализуется подслучай 1.6 раздела 2, то
∞
Pо(0) = ∫ w(τ)[1 − w(λ1 | τ)]d τ,
0
где w(λ1|τ) = w(λ1|τ0), последняя определена формулой (2), в которой w(λ1|t0+0) =
= π1 = α/(α + λ1).
4. λ1 – λ2 – α = 0, p = 1, δ = 0. Тогда a1 = λ1 – λ2 > 0, w = 1. В этом случае для
апостериорной вероятности w(λ1|τi) реализуются формулы (10), (11). Подставляя
в них p = 1, δ = 0, находим (11) в виде (16), а (10) (для любых i, i =1,2,…) в виде
(26)
w(λ1|τ) = ατ/(1 + ατ), τ ≥ 0.
Для начального полуинтервала изменения t: t0 ≤ t < t1 справедлива формула
(10), в которой i = 0, w(λ1|t0 + 0) = π1 = α/(α + λ1), δ = 0.
Из (16), (26) вытекает, что (аналогично особому случаю 3) апостериорная вероятность w(λ1|τ) не зависит от предыстории, т.е. и здесь полусинхронный (δ = 0)
поток событий является рекуррентным потоком.
Граница критической области (12) при этом (для любых i, i =1,2,…) примет
вид
τ0 = 1/α.
(27)
0
Из (27) следует, что τ > 0 и условная вероятность ошибки Po(τ) (так как w = 1) определяется формулой
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вероятность ошибочных решений при оценивании состояний
0
⎪⎧ w(λ1 | τ), 0 ≤ τ < τ ;
Po ( τ ) = ⎨
⎪⎩1 − w(λ1 | τ), τ ≥ τ0 .
Для начального полуинтервала [t0, t1) из (10) и (12) вытекает, что
π + α (1 − π1 )τ 0 2(1/ 2 − π1 )
w(λ1 | τ) = 1
,τ =
.
1 + α (1 − π1 )τ
α(1 − π1 )
67
(28)
(29)
Тогда: 1) если π1 > 1/2, то τ0 < 0 и условная вероятность ошибки определится в виде
(30)
Po(1)(τ) = 1 – w(λ1|τ), τ ≥ 0;
2) если π1 ≤ 1/2, то τ0 ≥ 0 и условная вероятность ошибки определится в виде (20).
Можно показать, что для рассматриваемого особого случая плотность вероятностей p(τ), аналогичная (22), выпишется в виде
p ( τ ) = ( λ 2 + αλ1τ ) e −λ1τ , τ ≥ 0.
(31)
Тогда, подставляя (31) в (21), находим
w(τ) = Aτ(λ 2 + αλ1τ)e−λ1τ , A = λ12 /(2α + λ 2 ), τ ≥ 0.
(32)
Учитывая (26), (28), (32), получаем выражение для безусловной вероятности
ошибки:
Po =
τ0
∞
∫ w(τ) w(λ1 | τ)d τ +
∫ w(τ)[1 − w(λ1 | τ)]d τ =
0
τ
0
τ0
∞
= Aα ∫ τϕ(τ)d τ + A ∫ ϕ(τ)d τ, ϕ(τ) = τ(λ 2 + αλ1τ)(1 + ατ) −1 e−λ1τ ,
0
(33)
τ0
где τ0 определяется в (27), А – в (32).
Для начального полуинтервала [t0, t1) аналогично находится безусловная вероятность ошибки Po(0). Например, принимая во внимание (29), (30) и (32), получаем
∞
∞ −x
⎡
⎤
λ1
α + λ1
e
Po(0) = ∫ w(τ)[1 − w(λ1 | τ)]d τ =
dx ⎥ , β =
. (34)
⎢ −α + 2(α + λ1 )eβ ∫
x
(2
)
α
α
+
λ
α
⎢
2 ⎣
0
β
⎦⎥
5. Результаты численных расчётов
Для получения численных результатов разработан алгоритм вычисления условной вероятности ошибки Po(w(λ1|ti + 0), τi) для общего случая, а также для частных и особых случаев. Программа расчета реализована на языке программирования Borland C++, Builder 6. Первый этап расчета предполагает имитационное
моделирование обобщенного полусинхронного потока событий. Описание алгоритма имитационного моделирования здесь не приводится, так как никаких принципиальных трудностей алгоритм не содержит. Второй этап расчета – непосредственное вычисление условной вероятности ошибки Po(w(λ1|ti + 0), τi) по формулам (6) – (9). Расчеты произведены для общего случая и для следующих значений
параметров: λ1 = 0,8; λ2 = 0,1; α = 0,2; δ = 0,3; p = 0,2 и времени моделирования
T = 20 ед. времени. В качестве иллюстрации на рис. 2 приведена траектория
(верхняя часть рис. 2) случайного процесса λ(t), полученная путем имитационного
моделирования (истинное поведение ненаблюдаемого процесса λ(t)), где 1, 2 – состояния процесса λ(t), и траектория (нижняя часть рис. 2) оценки λ(t ) , получен-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.М. Горцев, А.А. Калягин
68
ной по критерию максимума апостериорной вероятности, где 1,2 – состояния
оценки λ(t ) . Вынесение решения о состоянии процесса λ(t) производилось с шагом ∆t = 0,001. На рис. 2 штриховкой на оси времени обозначены временные промежутки, на которых оценка состояния не совпадает с истинным значением процесса λ(t) (область ошибочных решений). На рис. 3 приведена траектория поведения апостериорной вероятности w(λ1|τi), i = 0,1,… , соответствующая полученной
при имитационном моделировании последовательности моментов наступления
событий t1, t2… . На рис. 4 приведена траектория условной вероятности ошибки
Po(w(λ1|ti + 0), τi), i =0,1,… , соответствующая той же последовательности моментов наступления событий.
λ(t)
1
2
λ(t)
1
2
0
2
4
6
8
10
12
14
16
18
t
Рис 2. Траектория процесса λ(t) и оценки λ(t )
1
w(λ1|τi)
0,5
0
2
4
6
8
10
12
14
16
18
t
18
t
Рис 3. Траектория апостериорной вероятности w(λ1|τi)
1
Po (w(λ1|ti+0),τi)
0,5
0
2
4
6
8
10
12
14
16
Рис 4. Траектория условной вероятности ошибки Po(w(λ1|ti + 0), τi)
Таким образом, предложенный алгоритм осуществляет оценку состояния процесса λ(t) в любой момент времени t и одновременно с этим же моментом времени
вычисляет условную вероятность сделанной при вынесении решения ошибки.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Вероятность ошибочных решений при оценивании состояний
69
Для особых случаев рассчитаны безусловные вероятности ошибки по формулам (24), (25), (33), (34), приведенные в табл. 1 – 4.
Таблица 1
Результаты расчета безусловной вероятности ошибки
λ1
Pо(1)
0,61
0,62
0,63
0,64
0,66
0,67
0,68
0,69
0,7
0,209
0,174
0,149
0,13
0,115
0,104
0,094
0,086
0,079
Таблица 2
Результаты расчета безусловной вероятности ошибки
λ1
Pо(2)
0,61
0,62
0,63
0,64
0,66
0,67
0,68
0,69
0,7
0,145
0,142
0,139
0,136
0,131
0,129
0,126
0,124
0,122
Таблица 3
Результаты расчета безусловной вероятности ошибки
λ1
λ2
Po
0,11
0,1
0,155
0,21
0,2
0,087
0,31
0,3
0,061
0,41
0,4
0,047
0,51
0,5
0,038
0,61
0,6
0,032
0,71
0,7
0,027
0,81
0,8
0,024
0,91
0,9
0,022
Таблица 4
Результаты расчета безусловной вероятности ошибки
λ1
λ2
Pо(0)
0,05
0,04
0,06
0,05
0,07
0,06
0,08
0,07
0,09
0,08
0,1
0,09
0,11
0,1
0,12
0,11
0,13
0,12
0,269
0,26
0,254
0,25
0,246
0,244
0,242
0,24
0,239
В первой строке табл. 1 – 4 указаны значения изменяемого параметра λ1. Во
второй строке табл. 3, 4 указаны значения изменяемых параметров λ2, α соответственно. В последней строке всех таблиц указаны значения безусловной вероятности ошибки.
В табл. 1 вероятность Po(1) рассчитана по формуле (24) для λ2 = 0,6; α = 0,04;
в табл. 2 вероятность Po(2) – по формуле (25) для λ2 = 0,6; α = 0,05; в табл. 3 вероятность Po – по формуле (33) для α = 0,01 и в табл. 4 вероятность Po(0) – по формуле
(34) для α = 0,01.
Поведение безусловных вероятностей ошибок в зависимости от изменяемых
параметров согласуется с физическими представлениями.
Заключение
Предложенный алгоритм оптимального оценивания состояний обобщенного
полусинхронного потока событий осуществляет оценку состояний по результатам
текущих наблюдений за потоком. Параллельно с этим в момент оценки состояния
потока вычисляется условная вероятность ошибки вынесения решения.
Для особых случаев, когда поток событий является рекуррентным, выражения
безусловной вероятности ошибки выписаны в явном виде. Последнее позволяет
до начала наблюдений определить, при заданном наборе параметров, значение
безусловной вероятности ошибки, не привлекая методов имитационного моделирования.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
70
А.М. Горцев, А.А. Калягин
ЛИТЕРАТУРА
1. Горцев А.М., Калягин А.А., Нежельская Л.А. Оптимальная оценка состояний обобщенного полусинхронного потока событий // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 2(11). С. 66 – 81.
2. Дудин А.Н., Клименок В.И. Системы массового обслуживания с коррелированными потоками. Минск: Изд-во БГУ, 2000. 175 С.
3. Горцев А.М., Леонова М.А. Оптимальная оценка состояний обобщенного асинхронного
дважды стохастического потока // Вестник Томского государственного университета.
Управление, вычислительная техника и информатика. 2010. №1(10). С. 33 – 47.
4. Горцев А.М., Зуевич В.Л. Оптимальная оценка состояний асинхронного дважды стохастического потока событий с произвольным числом состояний // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010.
№2(11). С. 44 – 65.
5. Хазен Э.М. Методы оптимальных статистических решений и задачи оптимального
управления. М.: Сов. радио, 1968. 256с.
6. Горцев А.М., Нежельская Л.А. Полусинхронный дважды стохастический поток событий
при продлевающемся мертвом времени // Вычислительные технологии. 2008. Т. 13. №1.
С. 31 – 41.
7. Нежельская Л.А. Алгоритм оценивания состояний полусинхронного потока событий с
учетом мертвого времени // Массовое обслуживание: потоки, системы, сети: материалы
Четырнадцатой Белорусской зимней школы-семинара по теории массового обслуживания. Минск: Изд-во БГУ, 1998. С. 18 – 21.
8. Вентцель Е.С., Овчаров Л.А. Теория случайных процессов и её инженерные приложения. М.: Высшая школа, 2000. 383с.
Горцев Александр Михайлович
Калягин Алексей Андреевич
Томский государственный университет
E-mail: amg@fpmk.tsu.ru redall@inbox.ru
Поступила в редакцию 31 октября 2011 г.
Gortsev Alexander M., Kalyagin Aleksey A. (Tomsk State University). The probability of wrong
decisions in the estimation of states of a generalized semi-synchronous flow of events.
Keywords: generalized semi-synchronous flow of events, flow state, posterior probability of state,
state estimation, the probability of wrong decision.
Generalized semi-synchronous flow of events which intensity is piecewise constant stochastic
process λ(t) with two states λ1 and λ2 (λ1 > λ2) is considered. During the time interval when
λ(t) = λi , Poisson flow of events takes place with the intensity λi, i = 1,2. Transition from the first
state of the process λ(t) into the second one is possible only at the moment of event occurrence,
thus, the transition is carried out with probability p (0 < p ≤ 1); with probability 1 – p process λ(t)
remains in the first state. In this case the duration of process stay λ(t) in the first state is a random
variable with exponential distribution function F1 (τ) = 1 − e− pλ1τ . Transition from the second state
of process into the first state can be carried out at any moment of time. Thus, duration of process
stay λ(t) in the second condition is distributed in accordance with the exponential law:
F2 ( τ) = 1 − e−ατ . The process of transition λ(t) from the second state into the first initiates with
probability δ (0 ≤ δ ≤ 1) additional event in the first state.
We solve the problem of finding the unconditional (or conditional) probability of error decision. The algorithm for calculating the conditional probability of wrong decisions Po(w(λ1|ti + 0),
τi) at any time τi ≥ 0, i = 0,1… (general case) is proposed. For the particular and special cases of
relations between flow parameters the unconditional probability of wrong decision is found.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
УДК 62-52
Д.Н. Дюнова, А.Л. Рутковский
ПАРАМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ ОБЪЕКТОВ УПРАВЛЕНИЯ,
ФУНКЦИОНИРУЮЩИХ В ЗАМКНУТЫХ СИСТЕМАХ
Рассматривается линейный объект, выходная переменная которого стабилизируется относительно постоянного значения посредством обратной связи.
Входное случайное воздействие является неконтролируемым. Определяются
условия, при которых по наблюдениям выходной переменной системы может быть решена задача идентификации передаточной функции объекта и
формирующего фильтра возмущения. Предложен итеративный алгоритм
поиска искомых оценок параметров.
Ключевые слова: идентификация в замкнутых системах, алгоритм идентификации, условия идентифицируемости.
Большинство промышленных объектов функционирует в условиях замкнутых
систем. Характерные особенности задачи идентификации в этом случае связаны с
наличием обратной связи, устанавливающей причинно-следственную связь между
выходом объекта и входным управляющим воздействием на объект в дополнение
к уже существующей в объекте причинно-следственной связи между входом и
выходом. Применение в этих условиях известных методов пассивной идентификации по данным измерений координат на входе – выходе объекта без учета влияния обратной связи является невозможным, так как приводит к неверным результатам или порождает неоднозначность решения задачи идентификации [1−3].
В связи с этим актуальным является разработка алгоритмов идентификации объектов управления, эффективных в условиях замкнутых систем.
1. Постановка задачи
Рассмотрим линейный объект, выходная переменная которого стабилизируется относительно своего постоянного значения с помощью обратной связи. Динамической системе регулирования соответствует схема, изображенная на рис. 1. На
схеме приняты следующие обозначения: y – выходная переменная системы; x –
наблюдаемая выходная переменная; u – управляющее воздействие; v, η – неконтролируемые стационарные случайные процессы типа дискретного белого шума с
нулевым математическим ожиданием; τ – запаздывание в объекте по каналу передачи управляющего воздействия, величина которого известна, заданное значение
выходной переменой системы уз – неизменное во времени заданное значение выходной переменно.
Положим, что объект описывается разностными уравнениями, допускающими
линеаризацию, и является квазистационарным. Влияние внешней среды на объект
проявляется посредством возмущающих воздействий типа дискретного белого
шума с нулевым математическим ожиданием:
M {vt } = 0,
.
M {ηt } = 0.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Д.Н. Дюнова, А.Л. Рутковский
72
v
Ф(z)
z−τ
y
W 0 (z)
η
u
x
− W p(z)
Рис. 1. Функциональная схема системы регулирования
Для определенности будем полагать, что модели объекта и формирующего
фильтра возмущения представлены в виде передаточных функций с известными
априори порядками полиномов n0 , m0 , nФ и неизвестными векторами параметров
⎡⎣ k0 , a0,1 ,..., a0, n , a1,1 ,..., a1,m , b0,1 ,..., b1,n ⎤⎦ :
0
0
Ф
m0
P ( z)
W0 ( z ) = k0 0
= k0
Q0 ( z )
∏ (1 + a1,i z −1 )
i =1
n0
,
(1)
∏ (1 + a0,i z )
−1
i =1
Ф( z ) =
1
=
QФ ( z )
1
nФ
.
(2)
∏ (1 + b0,i z )
−1
i =1
Математическая модель «объект – среда» в виде канонической формы для
дискретной стационарной динамической системы с одним входом и одним выходом имеет вид
y ( z ) = W ( z ) z − τ u ( z ) + W ( z )Ф( z )v( z ) .
(3)
0
0
В цепи обратной связи находится регулятор произвольного вида с известной
передаточной функцией
P ( z)
p
W ( z) = k
.
(4)
p
p Q ( z)
p
Задача идентификации замкнутой системы, изображенной на рис. 1. , состоит в
определении несмещенных и состоятельных оценок параметров передаточной
функции объекта k0 , a0,i ( i = 1,..., n0 ) , a1,i ( i = 1,..., m0 ) и параметров передаточной функции формирующего фильтра возмущения b0,i ( i = 1,..., nФ ) .
Если бы входное случайное возмущение было доступно наблюдению, задача
идентификации параметров передаточной функции объекта и спектральной плотности возмущения была бы тривиальной. Особенность рассматриваемой задачи
состоит в том, что входное возмущение не контролируется и требуется по наблю-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Параметрическая идентификация объектов управления
73
даемым значениям одной лишь выходной переменной определить параметры передаточных функций объекта и формирующего фильтра возмущения.
Выражение для выходной переменной y в области комплексной переменной z
имеет вид
k0 P0 ( z )Q ( z ) z − τ u ( z ) + k0 P0 ( z )v( z )
Ф
y( z) =
.
(5)
Q0 ( z )Q ( z )
Ф
Тогда выражение для наблюдаемой выходной переменной x
k0 P0 ( z )Q ( z ) z − τ u ( z ) + k0 P0 ( z )v( z ) + Q0 ( z )Q ( z )η( z )
Ф
Ф
x( z ) = y ( z ) + η( z ) =
. (6)
Q0 ( z )Q ( z )
Ф
Обозначим неконтролируемую составляющую (5) через
ψ( z ) = k0 P0 ( z )v( z ) + Q0 ( z )Q ( z )η( z )
(7)
Ф
или во временной области
m0
n0 + nФ
i =0
i =0
ψt = ∑ g1,i νt −i +
∑
g 2,i ηt −i ,
(8)
где коэффициенты g1,i и g 2,i связаны с параметрами соответствующих передаточных функций однозначными соотношениями.
Поскольку выходная переменная системы y не наблюдается, вместо схемы,
представленной на рис. 1, рассмотрим схему замкнутой системы, изображенной
на рис. 2. В данном случае получена замкнутая система без возмущающего воздействия в обратной связи.
Ψ
V (z)
z−τ
W 0 (z)
x
Ψu
u
− Wp (z)
Рис. 2. Первая модификация функциональной схемы
системы регулирования
Передаточная функция V ( z ) , согласно (6) и (7), имеет вид
V ( z) =
1
.
k0 P0 ( z ) QФ ( z )
В соответствии со схемой, представленной на рис.2, выражение для выходной
переменной x запишется как
x ( z ) = W0 ( z ) z − τ u ( z ) + W0 ( z ) V ( z ) ψ ( z ) .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Д.Н. Дюнова, А.Л. Рутковский
74
Поэтому выражение для неконтролируемого возмущения может быть представлено следующим образом:
ψ ( z ) = Wψ ( z ) x ( z ) = Q0 ( z ) QФ ( z ) x ( z ) − k0 P0 ( z ) z − τ QФ ( z ) u ( z ) .
Откуда с учетом равенств (1) и (2) получим
ψ( z) =
n0 + nФ
m0 + nФ
i =1
i =1
∏ (1 + λ1,i z −1 ) x ( z ) − k0 ∏ (1 + λ 2,i z −1 ) z − τ u ( z ) ,
⎧a0,i при i = 1,..., n0
λ1,i = ⎨
,
⎩b0,i − m0 при i = n0 + 1,..., n0 + nФ
где
(8)
(9)
⎧a0,i при i = 1,...,m0
λ 2,i = ⎨
(10)
⎩b0,i − m0 при i = m0 + 1,..., m0 + nФ
Выражению (8) во временной области соответствует разностное уравнение
ψt = xt +
n0 + nФ
∑
i =1
ρi xt −i −
m0 + nФ + τ
∑
i=τ
qi ut −i ,
(11)
в котором коэффициенты ρi , qi связаны взаимнооднозначными преобразованиями
с коэффициентами λ1,i , λ2,i и, следовательно, с коэффициентами передаточных
функций k0 , a0,i , b0,i , a1,i .
Таким образом, если бы удалось восстановить возмущение ψ в виде (11), то
задача определения неизвестных оценок параметров передаточных функций объекта и формирующего фильтра была бы решена. Покажем, каким образом и при
каких условиях можно осуществить указанное восстановление возмущения ψ по
контролируемым переменным x и u.
2. Критерий идентификации в замкнутой системе
Для решения задачи идентификации необходимо ввести некоторую меру соответствия объекта и модели, в качестве которой нашли практическое применение
критерии, характеризующие соответствие выходных координат модели и объекта.
Сформулируем критерий идентификации для условия решаемой задачи.
x
Q0 ( z )
QФ (z )
z−τ
u
ψ
k 0 P0 (z )
Wψ(z)
Рис. 3. Вторая модификация системы регулирования
В соответствии с (7) передаточная функция системы, которая восстанавливает
неконтролируемое возмущение ψ, имеет вид
Wψ ( z ) = Q0 ( z ) QФ ( z ) x ( z ) − k0 P0 ( z ) z − τ QФ ( z ) u ( z ) ,
(12)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Параметрическая идентификация объектов управления
где
n0
(
nФ
)
(
m0
)
75
(
)
Q0 ( z ) = ∏ 1 + a0,i z −1 , QФ ( z ) = ∏ 1 + b0,i z −1 , P0 ( z ) = ∏ 1 + a1,i z −1 .
i =1
i =1
i =1
Схема системы приведена на рис. 3.
В соответствии с этой схемой возмущение ψt восстанавливается в виде оценки
ψt = xt +
n0 + nФ
∑
i =1
ρi xt −i −
m0 + nФ + τ
∑
i=τ
qi ut −i .
(13)
Примем в качестве критерия идентификации условие равенства взаимно корреляционных функций
(14)
ε(θ) = Rxψ ( θ ) − Rxψ ( θ )
Используя (13), можно выразить левую часть (14) через корреляционные
функции наблюдаемых случайных процессов x и u, а также через неизвестные коэффициенты ρi , qi. В результате получим
Rx ψ ( θ ) = Rxx ( θ ) +
n0 + nФ
∑
i =1
ρi Rxx ( θ − i ) −
m0 + nФ + τ
∑
qi Rxu ( θ − i ) .
(15)
qi Rxu ( θ − i ) = Rxψ ( θ ) .
(16)
i=τ
Тогда условие (14) принимает вид
Rxx ( θ ) +
n0 + nФ
∑
i =1
ρi Rxx ( θ − i ) −
m0 + nФ + τ
∑
i=τ
На первый взгляд, использование (16) не представляется возможным, так как
сигнал ψt не наблюдается и, следовательно, неизвестна взаимно корреляционная
функция Rxψ(θ). Учитывая выражение (8) и известные свойства белого шума, имеем Rxψ ( θ ) = 0 при θ > n0 + nФ . Поскольку интервал корреляции возмущения ψ
конечен и равен θ > n0 + nФ (вытекает из (11)), то прошлые значения выхода x,
начиная со сдвига θ = n0 + nФ , некоррелированны с текущим значением возмущения ψ. Следовательно, вместо (16) можно записать следующий критерий, содержащий статистические характеристики только контролируемых случайных процессов:
Rxx ( θ ) +
n0 + nФ
∑
i =1
ρi Rxx ( θ − i ) −
m0 + nФ + τ
∑
i=τ
qi Rxu ( θ − i ) = 0 .
(17)
3. Условия параметрической идентифицируемости замкнутой системы
При использовании критерия (17) контролируемым переменным восстановление возмущающего воздействия ψ можно выполнить по наблюдаемым сигналам x
и u. Действительно на основе (17), при различных значениях θ, принадлежащих
некоторому
интервалу
корреляции,
можно
сформировать
систему
n0 + 2nФ + m0 + 1 алгебраических уравнений, линейных относительно неизвестных
коэффициентов, в качестве которых выступают коэффициенты ρi , qi . Решив полученную систему известными методами линейной алгебры, можно в соответствии с (9) – (13) перейти от коэффициентов ρi , qi к искомым оценкам коэффициентов k0 , a0,i , b0,i , a1,i передаточной функций объекта и передаточной функции формирующего фильтра.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
76
Д.Н. Дюнова, А.Л. Рутковский
Следует отметить, что определение коэффициентов ρi , qi на основе приведенного критерия возможно только для замкнутых систем. Действительно, пусть
W p ( z ) = 0, U = const , т.е. в идентифицируемой системе отсутствует управляемый
вход. В этом случае в выражении (17) отсутствует последняя сумма, содержащая
неизвестные коэффициенты qi . В то же время эти коэффициенты, как это следует
из выражений (8), (10), (11), содержат информацию о статическом коэффициенте
передачи объекта k0 и коэффициентах числителя передаточной функции объекта
a1,i (i = 1,..., m0 ) . Оставшихся же в (17) коэффициентов ρi недостаточно для однозначного определения параметров объекта и формирующего фильтра. Иными словами, коэффициенты ρi , qi разностного уравнения (13), связывающего входное неконтролируемое возмущение ψt и наблюдаемые переменные xt , ut, являются одновременно функциями и коэффициентов передаточной функции объекта k0, a0,i, a1,i, и
коэффициентов передаточной функции формирующего фильтра b0,i.
Вместе с тем лишь для замкнутых систем удается разделить коэффициенты
передаточных функций объекта и фильтра; для разомкнутых систем это разделение невозможно. Физический смысл таких, различных, с точки зрения идентификации, свойств замкнутых и разомкнутых систем можно объяснить следующим
образом. В случае разомкнутой системы можно по выходной переменной определять лишь передаточную функцию объекта по каналу возмущение ψ – выходная
переменная. Для того чтобы отдельно определить передаточные функции объекта
и формирующего фильтра необходимо было бы на вход объекта дополнительно
подать контролируемое возмущение, содержащее некоррелированную с возмущением ψ составляющую (пунктирная стрелка на рис.2).
В замкнутой системе роль упомянутого дополнительного возмущения играет
управляющее воздействие, в котором при определенных условиях содержится некоррелированная составляющая. Детальный анализ позволяет установить, что не
во всякой замкнутой системе управляющее воздействие содержит некоррелированную составляющую, достаточную для определения передаточных функций
объекта и формирующего фильтра. Условия, при которых это возможно, являются
условиями идентифицируемости замкнутых систем.
Определим условия, при которых из всевозможных уравнений (17), составленных для сдвигов θ, находящихся внутри интервала корреляции θk процесса х,
т.е. для сдвигов θ = θ0 ,...,θ k (θ 0 > n0 + nФ ) , можно сформировать систему
n0 + 2nФ + m0 + 1 независимых уравнений.
Сформируем на основе (17) избыточную систему уравнений вида
AC = R ,
(18)
a
…
a
a
…
a
⎡ 11
1j
1 j +1
1l ⎤
… … …⎥,
где
(19)
A = ⎢… … …
⎢
⎥
…
…
a
a
a
a
⎢⎣ k1
kj +1
kl ⎥
kj
⎦
a11 = Rxx ( θ 0 − 1) , a1 j = Rxx ( θ0 − n0 − nф ) , a1 j +1 = Rxu ( θ 0 − τ ) ,
a1l = Rxu ( θ 0 − τ − m0 − nФ ) , ak1 = Rxx ( θ k − 1) , akj = Rxx ( θ k − n0 − nф ) ,
akj +1 = Rxu ( θ k − τ ) , ak ,l = Rxu ( θ k − τ − m0 − nФ ) ,
С Т = ⎡ −ρ1 … − ρ n0 + nф … qτ … qτ + m0 + nФ ⎤ , RT = [ Rxx ( θ 0 )… Rxx ( θ k )] .
⎣
⎦
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Параметрическая идентификация объектов управления
77
Данная задача однозначно разрешима тогда и только тогда, когда векторы
матрицы А являются линейно независимыми. Для того чтобы система (20) имела
единственное решение, необходима и достаточна линейная независимость столбцов матрицы А. В качестве критерия независимости воспользуемся критерием
Грамма для системы векторов, согласно которому определитель матрицы
G = AT A должен отличаться от нуля т.е.
det ( G ) ≠ 0 .
(20)
Условие (21) является условием единственности решения системы (18), одновременно может рассматриваться как необходимое условие идентифицируемости
замкнутой системы. В то же время, поскольку равенство (17) справедливо для
замкнутой системы с параметрами C = C , то условие (20) является одновременно
и достаточным условием идентифицируемости.
4. Алгоритм идентификации
Рассмотренный выше критерии идентификации приводит к системам алгебраических уравнений, коэффициентами которых являются значения авто- и взаимно корреляционных функций. При этом решение задачи идентификации замкнутой системы сводится к последовательной процедуре определения коэффициентов ρi и qi уравнения (11) и разделения их на искомые параметры передаточной функции объекта и фильтра. Вместе с тем интерес представляют итеративные
алгоритмы идентификации, с помощью которых значения корреляционных функций и идентифицируемых параметров уточняются на каждом шаге поступления
информации о выходной переменной системы и управляющем воздействии.
Рассмотрим решение системы алгебраических уравнений (18) для определения
коэффициентов ρi и qi на некотором интервале корреляции θ = θ 0 ,...,θC , параметры которого определяются соотношениями: θ0 > n0 + nФ , θС = θ 0 + 2nФ + m0 + n0 .
В процессе решения данной задачи могут встретиться два варианта: неизбыточная
система уравнений и избыточная система уравнений. Первый случай предполагает, что число уравнений рассматриваемой системы равно числу определяемых коэффициентов. Способы решения таких систем делятся на две группы: точные методы (метод Крамера, метод Гаусса, метод главных элементов, метод квадратных
корней и др.), представляющие собой конечные алгоритмы для определения корней системы, и итерационные методы, позволяющие получать корни системы с
заданной точностью путем использования сходящихся вычислительных процессов (метод итерации, метод Зейделя, метод релаксации и др.).
Рассмотрим вначале случай, когда матрица системы уравнений (17) квадратная:
Rxx ( θ ) = −
n0 + nФ
∑
i =1
ρi Rxx ( θ − i ) +
m0 + nФ + τ
∑
i = τ.
qi Rxu ( θ − i ) .
(21)
Заменив в (22) выражение для корреляционных функций их оценками, получим систему уравнений
xt xt −θ = −
n0 + nФ
∑
i =1
ρi ,t xt xt − ( θ −i ) +
m0 + nФ + τ
∑
i = τ.
qi ,t xt ut − ( θ −i ) .
(22)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Д.Н. Дюнова, А.Л. Рутковский
78
Введем обозначения:
X tT = [ xt ,..., xt − N ] , C T = ⎡⎣ −ρ1,t ... − ρn0 + nФ ,t qτ,t ,..., qτ+ m0 + nФ ,t ⎤⎦ ,
S1,t
⎡ xt −θ0 … xt −θC ⎤
⎡ xt −1
⎢ … … … ⎥
⎢
⎥ , S2,t = ⎢ …
=⎢
⎢ … … … ⎥
⎢ …
⎢ xt −θ − N
⎥
⎢ xt −1− N
x
t −θC − N ⎦
⎣
⎣
0
… xt − n0 − nФ
ut −τ … ut −τ− m0 − nФ ⎤
⎥
…
…
… …
…
⎥.
…
…
… …
…
⎥
… xt − n0 − nФ − N ut −τ− N … ut −τ− m0 − nФ − N ⎥⎦
В результате получим новую систему уравнений
S1,Tt X t = S1,Tt S2,t Ct .
(23)
Выражение (23) представляет собой систему нормальных уравнений. Поскольку матрица S1,t имеет ранг N и матрица S2,t имеет ранг N , то матрица S1,Tt S2,t
также имеет ранг N и является невырожденной и положительно определенной.
(
Следовательно, для нее существует обратная матрица S1,Tt S 2,t
)
−1
. Тогда из соот-
ношения (23) оценку вектора коэффициентов Ct можно представить в виде
(
Ct = S1,Tt S2,t
)
−1
S1,Tt xt .
(24)
Используя соотношение (25), можно получить итеративную процедуру для
вычисления вектора искомых оценок неизвестных коэффициентов Ct на основе
метода наименьших квадратов.
Положим
(
Bt−−11 = s1,Tt −1s2,t −1
)
−1
T
, Bt−1 = Bt−−11 + s1,t s2,
t ,
(25)
T
где s1,Tt = ⎡⎣ xt −θ0 ...xt −θ N ⎤⎦ , s2,
t =⎡
⎣ xt −1...xt − n0 − nФ ut −τ ...ut −τ− m0 − n0 ⎤⎦ .
Тогда с учетом (25) и (26) следует
(
T
Bt = Bt −1 − Bt −1s1,t 1 + s2,
t Bt −1 s1,t
)
−1 T
s2,t Bt −1.
(26)
Используя зависимости (25) и (27), по аналогии с выводом, предложенным в
работе [4], получим общую рекуррентную формулу для определения вектора искомых оценок коэффициентов:
(
T
Ct = Ct −1 + Bt −1 1 + s2,
t Bt −1 s1,t
−1
) ( xt − s2,T t Bt −1 ) ,
(27)
B0 = γ 2 I ,
где γ = const , I – единичная матрица.
Таким образом, в виде зависимостей (26) и (27) выведены общие рекуррентные формулы для вычисления текущих оценок ρi и qi коэффициентов ρi и qi .
Итеративная процедура (27), как показано в [3], дает несмещенные и состоятельные оценки исходного разностного уравнения. Для перехода к оценкам коэффициентов передаточной функции объекта и фильтра можно воспользоваться соотношениями (8) – (10).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Параметрическая идентификация объектов управления
79
5. Пример
Для проверки сходимости алгоритма идентификации проведен вычислительный эксперимент. Simulink-модель, имитирующая функционирование системы
регулирования (рис. 4), включает объект с передаточной функцией
0,1
(1 + 0, 4 z −1 )
−1
, фильтр с передаточной функцией (1 + 0,3z −1 ) и регу−1
−1
(1 + 0,1z )(1 + 0, 2 z )
лятор, описываемый соотношением U t = 0,3xt + 0, 6 xt −1 . Дискретный регулятор
находится в составе системы регулирования в виде подсистемы PIDm.
Рис. 4. Simulink-модель системы регулирования
С помощью Simulink-модели системы регулирования формируются значения
входного и выходного сигнала объекта qi . Использование итеративного соотношения (27) позволило получить несмещенные и состоятельные оценки разностного уравнения. Начальные оценки коэффициентов разностного уравнения приняты
T
равными C = ( 0, 0, 0, 0, 0, 0 ) . На основе соотношений (8) – (10) выполнено разделение коэффициентов передаточной функции объекта и фильтра. Результаты вычислений, иллюстрирующие сходимость алгоритма, представлены на рис. 5. Здесь
изображены графики текущих оценок параметров замкнутой системы, содержащей ПИ-регулятор в обратной связи, при значении запаздывания τ = 4 .
Как видно из рис. 5, оценки параметров
⎡⎣ k0 , a0,1 ,..., a0, n , a1,1 ,..., a1,m , b0,1 ,..., b1,n ⎤⎦
0
0
Ф
сходятся к истинным значениям
⎡⎣ k0 , a0,1 ,..., a0, n , a1,1 ,..., a1,m , b0,1 ,..., b1,n ⎤⎦ ,
0
0
Ф
что согласуется со сформулированными ранее условиями идентифицируемости.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Д.Н. Дюнова, А.Л. Рутковский
80
0,5
5
0,4
4
3
0,3
2
0,2
1
0,1
0
2
4
6
8
10
12
t
Рис. 5. Графики изменения оценок коэффициентов: кр. 1 – изменение
значения оценки коэффициента a0,1; кр. 2 – изменение значения
оценки коэффициента a0,2; кр. 3 – изменение значения оценки коэффициента b0,1; кр. 4 – изменение значения оценки коэффициента a1,1;
кр. 5 – изменение значения оценки коэффициента k0
Заключение
1. Рассмотрена задача идентификации объектов управления и формирующего
фильтра возмущения в замкнутых системах регулирования, функционирующих в
режиме нормальной эксплуатации при наличии возмущающих воздействий. Проведено исследование возможности применения корреляционного подхода к решению поставленной задачи.
2. Установлено, что идентифицируемость в замкнутой системе определяется
видом авто- и взаимно корреляционных функций случайных процессов на входе и
выходе объекта, а также величиной запаздывания по каналу передачи управляющих воздействий и передаточной функцией регулятора. Определены условия
идентифицируемости в замкнутой системе, при которых по наблюдениям выходной переменной системы может быть решена задача параметрической идентификации передаточной функции объекта и формирующего фильтра возмущения.
3. Разработанный алгоритм идентификации позволяет на основе текущей информации о выходной переменной определять параметры передаточной функции
формирующего фильтра возмущения и передаточной функции объекта. Результатом практической реализации алгоритма является получение несмещенных и состоятельных оценок искомых параметров передаточных функций. Предложенный
алгоритм может найти применение при синтезе замкнутых систем регулирования
и настройке регуляторов в процессе нормальной эксплуатации.
ЛИТЕРАТУРА
1. Яковлев В.Б. Адаптивные системы автоматического управления. Л.: Изд-во ЛГУ, 1984.
368 c.
2. Штейнберг Ш.Е. Идентификация в системах управления. М.: Энергоатомиздат. 1987.
197 c.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Параметрическая идентификация объектов управления
81
3. Семенов А.Д. , Артамонов Д.В. , Брюхачев А.В. Идентификация объектов управления.
учеб. пособие. Пенза.: Изд-во ПГУ, 2003. 68 c.
4. Ли Р. Оптимальные оценки. Определение характеристик и управление. М.: Наука. 1964.
200 с.
Дюнова Диана Николаевна
Рутковский Александр Леонидович
Северо-Кавказский горно-металлургический институт
(государственный технологический университет),
E-mail: Dunova_dn@mail.ru; Rutkowski@mail.ru
Поступила в редакцию 21 ноября 2011 г.
Dyunova Diana N., Rutkovsky Alexander L. (North Caucasian Institute of Mining and Metallurgy). Parametric identification of the control objects functioning in closed systems.
Keywords: identification in closed systems, algorithm of identification, an identifiability condition.
The task of identification of control objects and the perturbation shaping filter in the closed
systems of regulation functioning in a mode of normal maintenance in the presence of perturbing
influences is considered. The composition of system of regulation includes the linear object which
output variable is stabilized concerning constant value by means of feedback.
As criterion of identification the condition of equality of mutually correlative function of an
observable output signal and perturbing influence and correlative function of an observable output
signal and a reset estimation of perturbing influence is accepted. Identifiability conditions in
closed system at which on observations of output variable system the task of parametric identification of transmitting function of object and the perturbation shaping filter can be solved are defined. The developed algorithm of identification allows on the basis of the current information on
an output variable to define parameters of the shaping filter of perturbation and transmitting function of object. Result of practical implementation of algorithm is obtaining of unbiased and consistent estimations of required parameters of transmitting functions which can find application at
synthesis of closed systems of regulation and adjustment of regulators in the course of normal
maintenance.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
УДК 519.872
К.А. Крысанова, С.П. Моисеева
МЕТОД АСИМПТОТИЧЕСКОГО АНАЛИЗА
ДЛЯ ИССЛЕДОВАНИЯ ПАРАЛЛЕЛЬНОГО ОБСЛУЖИВАНИЯ
КРАТНЫХ ЗАЯВОК ПОТОКА МАРКОВСКОГО ВОССТАНОВЛЕНИЯ
Построена модель обслуживания кратных заявок в системе массового обслуживания, состоящей из двух блоков обслуживания с неограниченным
числом обслуживающих приборов. На вход системы поступает поток марковского восстановления сдвоенных заявок, заявок 1- го и 2-го типов.
Ключевые слова: кратные заявки, поток марковского восстановления
сдвоенных заявок, асимптотический анализ.
На современном этапе развития теории массового обслуживания одним из
востребованных направлений является исследование систем массового обслуживания (СМО) с групповым поступлением заявок и параллельным обслуживанием
[1−3]. Область применения таких систем довольно обширна, например, при моделировании современных информационно-вычислительных систем необходимо
учитывать пакетный характер трафика, а также один из основных принципов при
проектировании современных компьютерных сетей – параллельность процессов
обработки информации [4, 5]. Поэтому возникает необходимость в разработке новых математических моделей систем массового обслуживания, а именно, систем с
неординарными входящими потоками и различными вариантами обслуживания, в
том числе с двумя и более блоками обслуживания.
Исследованию однолинейных систем массового обслуживания с неординарными входящими потоками (пуассоновским и рекуррентным) посвящены работы
Бочарова П.П., Печинкина А.В. и других российских учёных [6−9], в которых
рассматриваются системы массового обслуживания с марковским неординарным
входящим потоком, несколькими типами заявок, обобщённой дисциплиной преимущественного разделения прибора заявками с минимальной обслуженной длиной, марковским обслуживанием и накопителем бесконечной ёмкости. Но, как
правило, в данных работах все заявки в группе являлись однотипными, и время их
обслуживания было одинаково распределённым, что не всегда применимо для
описания реальных вычислительных процессов.
Вышесказанное подтверждает, что построение и анализ новых математических
моделей с параллельно функционирующими блоками обслуживания и общими
входящими потоками имеет большое практическое значение.
Исследование подобных систем с двумерным пуассоновским потоком приводится в статье [10], однако, предлагаемый авторами метод довольно сложен и неприменим для исследования аналогичных систем с произвольным временем обслуживания или непуассоновским входящим потоком.
В настоящей работе проводится исследование модели параллельного обслуживания кратных заявок потока марковского восстановления методом асимптотического анализа [11], который позволяет найти основные характеристики системы
при выполнении некоторого предельного условия, например растущего времени
обслуживания.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Метод асимптотического анализа для исследования параллельного обслуживания
83
1. Математическая модель параллельного обслуживаниям
сдвоенных заявок потока марковского восстановления
...
В качестве математической модели параллельного обслуживания кратных заявок рассмотрим систему массового обслуживания (СМО) с входящим потоком
марковского восстановления (MR(2)||M2|∞) и двумя блоками обслуживания, каждый из которых содержит неограниченное число приборов (рис. 1). На вход системы поступает поток марковского восстановления сдвоенных заявок, заданный набором функций распределения длин интервалов A1(x), A2(x),
μ1
… , Ak(x) и матрицей переходных вероятностей P
– вложенной по моментам наступления событий
цепи Маркова k(t) [5]. Продолжительности обμ1
служивания различных заявок стохастически не(2)
зависимы, одинаково распределены в каждом
MR
блоке и имеют экспоненциальное распределение
с параметрами μ1 и μ2 соответственно. Поступивμ2
шая заявка занимает любой из свободных приборов, завершив обслуживание, заявка покидает
систему.
μ2
Ставится задача исследования двумерного
процесса, характеризующего число заявок в каждом блоке.
Обозначим is – число заявок в s-м блоке обРис. 1. СМО с параллельным
служивания, s=1,2. Так как входящий поток непу- обслуживанием кратных заявок
ассоновский, то двумерный процесс {i1(t), i2(t)},
MR(2)||M2|∞
не является марковским. Для его марковизации
применим метод дополнительных переменных. Пусть z(t) – длина интервала от
момента времени t до момента наступления очередного события во входящем MRпотоке, а процесс k(t) – вложенная по моментам наступления событий цепь Маркова. Определенный таким образом четырехмерный процесс {k(t), z(t), i1(t), i2(t)}
является марковским с непрерывным временем.
Определим вероятности
P (k , z , i1 , i2 , t ) = P {k (t ) = k , z (t ) < z , i1 (t ) = i1 , i2 (t ) = i2 } .
...
Для распределения P(k, z, i1, i2, t) ∆t-методом запишем равенства
P (k , z − ∆t , i1 , i2 , t + ∆t ) = { P(k , z, i1 , i2 , t ) − P( k , ∆t , i1 , i2 , t )}(1 − i1μ1∆t )(1 − i2μ 2 ∆t ) +
+ ∑ P (ν, ∆t , i1 − 1, i2 − 1, t ) Pνk Ak ( z ) + P (k , z, i1 + 1, i2 , t ) ( i1 + 1) μ1∆t +
ν
+ P (k , z , i1 , i2 + 1, t ) ( i2 + 1) μ 2 ∆t + o(∆t ),
из которых получим систему дифференциальных уравнений Колмогорова:
∂P (k , z ,i1 ,i2 ,t ) ∂P (k , z ,i1 ,i2 ,t ) ∂P(k ,0,i1 ,i2 ,t )
=
−
− P (k , z ,i1 ,i2 ,t )i1μ1 − P(k , z,i1 ,i2 ,t )i2μ 2 +
∂t
∂z
∂z
∂P (ν,0,i1 −1,i2 −1,t )
+ P (k , z ,i1 +1,i2 ,t )(i1 +1)μ1 + P (k , z,i1 ,i2 +1,t )(i2 +1)μ 2 + ∑
Pνk Ak ( z ) .
∂z
ν
Для стационарного распределения вероятностей эту систему перепишем в виде
∂ ∏(k , z , i1 , i2 ) ∂ ∏(k , 0, i1 , i2 )
−
− ∏(k , z , i1 , i2 )i1μ1 − ∏(k , z , i1 , i2 )i2 μ 2 +
∂z
∂z
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
К.А. Крысанова, С.П. Моисеева
84
+∏(k , z ,i1 +1,i2 )(i1 +1)μ1 +∏(k , z ,i1 ,i2 +1) (i2 +1)μ 2 + ∑
ν
∂∏(ν,0,i1 −1,i2 −1)
Pνk Ak ( z ) = 0.
∂z
Обозначая
H (k , z , u1 , u2 ) =
∞
∞
∑ ∑ e ju i e ju i
11
22
i1 = 0 i2 = 0
∏(k , z , i1 , i2 )
(1)
и принимая во внимание, что
∞ ∞
∂H (k , z , u1 , u2 )
= j ∑ ∑ i1e ju1i1 e ju2i2 ∏(k , z , i1 , i2 ) ,
∂u1
i1 = 0 i2 = 0
∞ ∞
∂H (k , z , u1 , u2 )
= j ∑ ∑ i2 e ju1i1 e ju2i2 ∏(k , z , i1 , i2 ) ,
∂u2
i1 = 0 i2 = 0
для функций H(k,z,u1,u2) получаем систему дифференциальных уравнений в частных производных
∂H (k , z , u1 , u2 ) ∂H (k , 0, u1 , u2 )
∂H (k , z , u1 , u2 )
−
+ jμ1 1 − e − ju1
+
∂z
∂z
∂u1
(
(
+ jμ 2 1 − e− ju2
)
) ∂H (k ,∂zu, u1 , u2 ) + e j (u +u ) ∑ ∂H (ν,∂0,zu1 , u2 ) Pνk Ak ( z) = 0 .
1
2
ν
2
Обозначив H(z,u1,u2)={H(1,z,u1,u2),H(2,z, u1,u2 )...},
0 ⎞
⎛ p11 … p1k ⎞
⎛1 … 0⎞
⎛ A1 ( z ) …
⎜
⎟
⎟,
⎜
⎟
D( z ) =
, P=
, I =⎜
⎜
⎟
⎜
⎟
⎜
⎟
pkk ⎠
1⎠
Ak ( z ) ⎠
⎝ pk1
⎝0
⎝ 0
получим основное уравнение для исследования системы MR(2)||M2|∞
∂H ( z , u1 , u2 ) ∂H ( 0, u1 , u2 ) j ( u1 + u2 )
∂H ( z , u1 , u2 )
+
e
PD ( z ) − I + jμ1 1 − e − ju1
+
∂z
∂z
∂u1
{
}
(
) ∂H ( ∂z,uu1 , u2 ) = 0 .
+ jμ 2 1 − e− ju2
(
)
(2)
2
Решение H(z,u1,u2) дифференциально-матричного уравнения, удовлетворяющее условию
H ( z , 0, 0) = R( z ) ,
определяет характеристические функции числа занятых приборов в каждом блоке, занятых в стационарном режиме в системе MR(2)|M2|∞, равенствами
h(u1 ) = Me ju1i1 (t ) = H (∞, u1 , 0) E ,
h(u2 ) = Me ju2i2 (t ) = H (∞, 0, u2 ) E .
Здесь R(z) – вектор-функция стационарного распределения вероятностей значений
двумерного марковского процесса {k(t), z(t)}.
Следует отметить, что получить аналитическое решение уравнения (2) не удается, поэтому в данной статье предлагается решать это уравнение методом асимптотического анализа в условиях растущего времени обслуживания в каждом
блоке.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Метод асимптотического анализа для исследования параллельного обслуживания
85
2. Асимптотика первого порядка
Рассмотрим основное уравнение для характеристической функции (2), которое
1
1
, то есть μ1 , μ 2 → 0 .
будем решать, полагая, что b1 , b2 → ∞ , тогда μ1 = , μ 2 =
b1
b2
Обозначим μ1 = ε, μ 2 = qε и в уравнении (2) выполним замены
u1 = εw1 , u2 = εqw2 , H ( z , u1 , u2 ) = F1 ( z , w1 , w2 , ε) ,
в результате чего получаем уравнение для F1 ( z , w1 , w2 , ε) вида
∂F1 ( z , w1 , w2 , ε) ∂F1 (0, w1 , w2 , ε) jε( w1 +w2 )
∂F ( z , w1 , w2 , ε)
+
e
PD ( z ) − I − j e − jεw1 −1 1
−
∂z
∂z
∂w1
(
) (
) ∂F1 ( z,∂ww1 , w2 , ε) = 0 .
(
− j e− jεw2 − 1
)
(3)
2
Теорема. Предельное (при ε→0) значение F1(z,w1,w2) решения F1(z,w1,w2,ε)
уравнения (3) имеет вид
F1 ( z , w1 , w2 ) = R ( z ) exp { j ( w1 + w2 )λ} ,
где R(z) – стационарное распределение вероятностей значений случайного процесса {z(t)}, параметр λ определяется выражением
∂R (0)
E=λ.
∂z
Доказательство. В уравнении (3) выполним предельный переход при ε→0,
получим, что F1(z,w1,w2) является решением уравнения
∂F1 ( z , w1 , w2 ) ∂F1 (0, w1 , w2 )
+
{PD( z ) − I } = 0 .
∂z
∂z
Так как вектор-функцию R(z), характеризующая стационарное распределение
длин интервалов MR-потока, удовлетворяет уравнению
∂R (0)
∂Φ
∂Φ
Φ1 ( w1 , w2 )(e jε ( w1 −w2 ) P − I ) E − j (e− jεw1 −1) R( z )
E − j (e− jεw2 −1) R ( z )
E =0 ,
∂z
∂w1
∂w2
то вектор-функция
F1 ( z , w1 , w2 ) = R ( z )Φ1 ( w1 , w2 ) .
(4)
Скалярную функцию Φ1(w1,w2) определим следующим образом. В уравнении
(3) выполним предельный переход при z→∞, получим
∂F1 (0, w1 , w2 , ε) j ( w1 + w2 )ε
∂F (∞, w1 , w2 , ε)
e
P − I − j e− jεw1 − 1 1
−
∂z
∂w1
(
) (
(
)
) ∂F1 (∞∂, ww1 , w2 , ε) = 0 .
− j e− jεw2 − 1
2
Поделив левую и правую части на ε и выполнив предельный переход при ε→0,
получим систему уравнений
∂F1 (0, w1 , w2 )
∂F (∞, w1 , w2 )
∂F (∞, w1 , w2 )
j ( w1 + w2 ) + j 2 w1 1
+ j 2 w2 1
=0,
∂z
∂w1
∂w2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
К.А. Крысанова, С.П. Моисеева
86
подставляя в которое (4) и просуммировав уравнения, получаем дифференциальное уравнение в частных производных вида
∂Φ1 ( w1 , w2 ) 2 ∂Φ1 ( w1 , w2 )
∂R (0)
+ j w2
= j ( w1 + w2 )
EΦ1 ( w1 , w2 ) = j ( w1 + w2 )λΦ1 ( w1 , w2 ) ,
∂w1
∂w2
∂z
решение которого, удовлетворяющее начальному условию Φ1 ( 0, 0 ) = 1 , имеет вид
Φ1 ( w1 , w2 ) = exp { jλ ( w1 + w2 )} .
F1 ( z , w1 , w2 ) = R( z ) exp { jλ ( w1 + w2 )} ,
Получаем
что и требовалось доказать.
В силу замены (7) и равенства (9) можно записать приближённое (асимптотическое) равенство
u u
u u
H ( z , u1 , u2 ) = R ( z ) exp{ jλ ( 1 + 2 )} = R ( z ) exp{ jλ ( 1 + 2 )} ,
ε qε
μ1 μ 2
из которого для характеристической функции процесса{i1(t), i2(t)} в стационарном
режиме получим
⎧
λ⎫
Me ju1i1 (t ) = H (∞, u1 , 0) E = exp ⎨ ju1 ⎬ ,
μ
⎩
1⎭
⎧
λ⎫
Me ju2i2 (t ) = H (∞, 0, u2 ) E = exp ⎨ ju2 ⎬ .
μ2 ⎭
⎩
Полученные равенства будем называть асимптотикой первого порядка для
блоков обслуживания системы MR(2)||M2|∞.
Для более детального исследования рассмотрим асимптотику второго порядка.
3. Асимптотика второго порядка
В уравнении (3) выполним замену
⎧ ⎛ u u ⎞⎫
H ( z , u1 , u2 ) = H 2 ( z , u1 , u2 ) exp ⎨ jλ ⎜ 1 + 2 ⎟ ⎬ ,
⎩ ⎝ μ1 μ 2 ⎠⎭
получим уравнение
∂H 2 ( z , u1 , u2 )
⎧ ⎛ u u ⎞⎫
exp ⎨ jλ ⎜ 1 + 2 ⎟ ⎬ +
∂z
⎩ ⎝ μ1 μ 2 ⎠⎭
+
∂H 2 (0, u1 , u2 )
⎧ ⎛ u u q ⎞⎫
exp ⎨ jλ ⎜ 1 + 2 ⎟ ⎬ (exp{ j (u1 + u2 q)}PD( z ) − I ) − jμ1 (e − ju1 − 1) ×
∂u1
⎩ ⎝ μ1 μ 2 ⎠⎭
⎡ ∂H ( z , u1 , u2 )
⎧ ⎛ u u ⎞⎫
⎧ ⎛ u u ⎞⎫ λ ⎤
×⎢ 2
exp ⎨ jλ ⎜ 1 + 2 ⎟ ⎬ + H 2 ( z , u1 , u2 ) exp ⎨ jλ ⎜ 1 + 2 ⎟ ⎬ j ⎥ −
∂u1
⎣
⎩ ⎝ μ1 μ 2 ⎠⎭
⎩ ⎝ μ1 μ 2 ⎠⎭ μ1 ⎦
⎡ ∂H ( z , u1 , u2 )
⎧ ⎛ u u q ⎞⎫
exp ⎨ jλ ⎜ 1 + 2 ⎟ ⎬ +
− jμ 2 e − ju2 − 1 ⎢ 2
∂u2
⎣
⎩ ⎝ μ1 μ 2 ⎠⎭
(
)
⎧ ⎛ u u q ⎞⎫ λ ⎤
+ H 2 ( z , u1 , u2 ) exp ⎨ jλ ⎜ 1 + 2 ⎟ ⎬ j ⎥ = 0 ,
⎩ ⎝ μ1 μ 2 ⎠⎭ μ 2 ⎦
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Метод асимптотического анализа для исследования параллельного обслуживания
87
которое перепишем в виде
∂H 2 ( z ,u1 ,u2 ) ∂H 2 (0,u1 ,u2 )
∂H 2 ( z ,u1 ,u2 )
+
+
(exp{ j (u1 + u2 )} PD ( z ) − I ) + jμ1 1− e− ju1
∂z
∂z
∂u1
(
(
+ jμ 2 1− e − ju2
)
) ∂H 2 (∂zu,u1 ,u2 ) −λ (1− e− ju ) H 2 ( z,u1 ,u2 ) −λ (1− e− ju ) H 2 ( z,u1 ,u2 ) = 0 .
1
2
2
Обозначив μ1=ε2, μ2=ε2, в последнем уравнении выполним замены
u1 = εw1 , u2 = εw2 , H 2 ( z , u1 , u2 ) = F2 ( z , w1 , w2 , ε) ,
получим
∂F2 ( z , w1 , w2 , ε) ∂F2 (0, w1 , w2 , ε) jε( w1 + w2 )
+
e
PD ( z ) − I +
∂z
∂z
(
(
+ jε 1 − e− jεw1
(
)
) ∂F2 ( z,∂ww1 , w2 , ε) + jε (1 − e− jεw ) ∂F2 ( z,∂ww1 , w2 , ε) −
2
1
)
2
(
)
−λ 1 − e − jεw1 ∂F2 ( z , w1 , w2 , ε) − λ 1 − e − jεw2 ∂F2 ( z , w1 , w2 , ε) = 0 .
Теорема. Предельное (при ε → 0 )
F2 ( z , w1 , w2 , ε) уравнения (5) имеет вид
значение
F2 ( z , w1 , w2 )
(5)
решения
2
2
j 2 λw1w2 ⎪⎫
⎪⎧ j κ 2 ( w1 + w2 )
−
F2 ( z , w1 , w2 ) = R( z ) exp ⎨
⎬,
2
2
⎩⎪
⎭⎪
где R(z) – стационарное распределение вероятностей значений случайного процесса {z(t)}, параметр λ определяется выражением
∂R (0)
E=λ,
∂z
величина κ2 определяется равенством
∂f (0)
κ2 = λ + 2
E,
∂z
где вектор-функция f2(z) удовлетворяет условию f2(∞)E=0 и является решением
уравнения
∂f 2 ( z ) ∂f 2 (0)
∂R (0)
+
PD( z ) − λR ( z ) = 0 .
( PD( z ) − I ) +
∂z
∂z
∂z
Доказательство. Решение уравнения (10) запишем в виде
F2 ( z , w1 , w2 , ε) = Φ 2 ( w1 , w2 ) { R ( z ) + jε ( w1 + w2 ) f 2 ( z )} + o(ε 2 ) ,
(6)
здесь вектор-функция R ( z ) определена выше, функция f 2 ( z ) удовлетворяет условию f2(∞)E = 0.
Подставляя (11) в (10), получим
∂f ( z ) ⎫
∂f (0) ⎫
⎧ ∂R( z )
⎧ ∂R (0)
Φ 2 ( w1 , w2 ) ⎨
+ jε ( w1 + w2 ) 2 ⎬ + Φ 2 ( w1 , w2 ) ⎨
+ jε ( w1 + w2 ) 2 ⎬ ×
∂
z
∂
z
∂
z
∂z ⎭
⎩
⎭
⎩
× {( PD( z ) − I ) + jε( w1 + w2 ) A( z )} − λjεΦ ( w1 , w2 ) R( z ) − λjεw2 Φ 2 ( w1 , w2 ) R ( z ) = o(ε 2 ) ,
которое перепишем виде
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
К.А. Крысанова, С.П. Моисеева
88
∂f ( z ) ⎧ ∂R (0)
∂f (0) ⎫
∂R ( z )
+ jε ( w1 + w2 ) 2
+⎨
+ jε ( w1 + w2 ) 2 ⎬ ( PD( z ) − 1) −
∂z
∂z
∂z ⎭
⎩ ∂z
−λjε ( w1 + w2 ) R ( z ) + jε ( w1 + w2 )
∂R (0)
PD( z ) = o(ε 2 ) .
∂z
(7)
Так как выполняется равенство
∂R ( z ) ∂R (0)
+
( PD( z ) − I ) = 0 ,
∂z
∂z
то (7) можно переписать в виде уравнения
∂f 2 ( z )
∂f (0)
∂R (0)
− λR ( z ) + 2 ( PD( z ) − I ) +
PD( z ) = 0 ,
∂z
∂z
∂z
определяющего функцию f2(z). В уравнении (10), устремив z→∞, получим равенство
∂F2 (0, w1 , w2 , ε) jε( w1 + w2 )
∂F2 (∞, w1 , w2 , ε)
e
− 1 + jε 1 − e − jεw1
+
∂z
∂w1
(
(
+ jε 1 − e − jεw2
)
(
)
) ∂F2 ( ∞∂, ww1 , w2 , ε ) − λ (1 − e− jεw ) F2 ( ∞, w1 , w2 , ε ) −
1
2
(
)
−λ 1 − e − jεw2 F2 ( ∞, w1 , w2 , ε ) = 0 .
Далее подставим (6) и для нахождения скалярной функции Φ 2 ( w1 , w2 ) просуммируем и выполним предельный переход при ε → 0 , получаем уравнение в
частных производных для Φ 2 ( w1 , w2 ) :
∂Φ 2 ( w1 , w2 )
∂Φ 2 ( w1 , w2 )
+ w2
=
∂w1
∂w2
⎡
2
2 ∂f ( 0 ) ⎤
= j 2 ⎢ λ ( w1 + w2 ) − λw1w2 + ( w1 + w2 ) 2
E ⎥ Φ 2 ( w1 , w2 ),
∂z
⎣
⎦
w1
для характеристик которого запишем систему дифференциальных уравнений
dw1 dw2
d Φ 2 ( w1 , w2 )
=
=
,
w1
w2
⎡
2
2 ∂f ( 0 ) ⎤
j 2 ⎢ λ ( w1 + w2 ) − λw1w2 + ( w1 + w2 ) 2
E ⎥ Φ 2 ( w1 , w2 )
∂z
⎣
⎦
решение которой имеет вид
2
2
2
λC w 2 w 2 ( C1 + 1) ∂f 2 ( 0 ) ⎤⎫⎪
⎪⎧ ⎡ w ( C1 + 1)
Φ 2 ( w1 , w2 ) = C2 exp ⎨ j 2 ⎢λ 2
− 1 2 + 2
E⎥⎬ ,
∂z
2
2
2
⎥⎪
⎩⎪ ⎣⎢
⎦⎭
где C1 =
w1
.
w2
Из начальных условий Φ 2 (0, 0) = 1 следует C2 = 1 , поэтому
⎧⎪ ⎡ ( w + w2 )2 λw1w2 ( w1 + w2 )2 ∂f 2 ( 0 ) ⎤⎫⎪
Φ 2 ( w1 , w2 ) = exp ⎨ j 2 ⎢ λ 1
−
+
E⎥⎬ .
∂z
2
2
2
⎥⎪
⎩⎪ ⎣⎢
⎦⎭
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Метод асимптотического анализа для исследования параллельного обслуживания
89
∂f 2 (0)
E , запишем
∂z
⎧⎪ ⎡ ( w + w2 )2 λw1w2 ⎤⎫⎪
Φ 2 ( w1 , w2 ) = exp ⎨ j 2 ⎢ κ 2 1
−
⎥⎬ .
2
2 ⎦⎭
⎥⎪
⎪⎩ ⎣⎢
Подставив в (6) полученное выражение, получим искомое выражение.
Можно записать асимптотическое (приближённое) равенство
Обозначив κ 2 = λ +
⎧⎪ ⎡ ( w + w )2 λw w ⎤⎫⎪
H 2 ( z ,u1 ,u2 ) = F2 ( z , w1 , w2 ε) ≈ F2 ( z , w1 , w2 ) = R ( z )exp ⎨ j 2 ⎢κ 2 1 2 − 1 2 ⎥ ⎬ =
2
2 ⎦⎭
⎥⎪
⎩⎪ ⎣⎢
2
⎧⎪ j 2 κ ⎛ u
u2 ⎞
2 λu1u2
2
1
= R ( z ) exp ⎨
+
⎜
⎟ −j
2
μ2 ⎠
2 μ1μ 2
⎝ μ1
⎪⎩
⎫⎪
⎬,
⎪⎭
из которого для характеристической функции H ( z , u1 , u2 ) получаем равенство
2
⎧⎪ ⎛ u u ⎞ j 2 κ ⎛ u
u2 ⎞
2 λu1u2
2
1
+
H ( z , u1 , u2 ) = R ( z ) exp ⎨ jλ ⎜ 1 + 2 ⎟ +
⎜
⎟ −j
μ
μ
2
μ2 ⎠
2 μ1μ 2
2 ⎠
⎝ μ1
⎪⎩ ⎝ 1
⎫⎪
⎬,
⎪⎭
тогда для характеристических функций величин ik (t ) имеем
⎧⎪ u ( ju1 )2 ⎫⎪
Me ju1i1 (t ) = H (∞, u1 , 0) E = exp ⎨ jλ 1 +
κ2 ⎬ ,
2μ1
⎪⎭
⎩⎪ μ1
⎧⎪ u
( ju2 )2 ⎫⎪
Me ju2i2 (t ) = H (∞, 0, u2 ) E = exp ⎨ jλ 2 +
κ2 ⎬ .
2μ 2
⎪⎭
⎩⎪ μ 2
Полученные равенства будем называть асимптотикой второго порядка для
блоков обслуживания системы MR(2)||M2|∞.
Заключение
Таким образом, в работе рассмотрена система массового обслуживания кратных заявок с входящим потоком марковского восстановления с двумя блоками
обслуживания, каждый из которых содержит неограниченное число приборов.
Получены выражения для асимптотик первого и второго порядков рассматриваемой СМО.
ЛИТЕРАТУРА
1. Таташев А.Г. Система массового обслуживания с групповым поступлением и инверсионной дисциплиной // Кибернетика и системный анализ. 1995. № 6. С. 163–165.
2. Таташев А.Г. Одна инверсионная дисциплина обслуживания в одноканальной системе
с разнотипными заявками // Автоматика и телемеханика. 1999. № 7. С. 177–181.
3. Collings T.W.R. A queueing problem in which customers have different service distributions
// Applied Statistics. 1974. V. 23. No. 1. P. 75–82.
4. Эндрюс Г.Р. Основы многопоточного, параллельного и распределённого программирования: пер. с англ. М.: Изд. дом «Вильямс», 2003. 512 с.
5. Топорков В.В. Модели распределенных вычислений. М.: ФИЗМАТЛИТ, 2004. 320 с.
6. Нагоненко В.А. О характеристиках одной нестандартной системы массового обслуживания. I // Изв. АН СССР. Техническая кибернетика. 1981. № 1. С. 187–195.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
90
К.А. Крысанова, С.П. Моисеева
7. Печинкин А.В. Инверсионный порядок обслуживания с вероятностным приоритетом в
системе обслуживания с неординарным входящим потоком // Случайные процессы и
их приложения. Математические исследования. Кишинёв: Штиинца, 1989. Вып. 109.
8. Печинкин А.В. Об одной инвариантной системе массового обслуживания // Math.
Operationsforsch. und Statist. Ser. Optimization, 1983. V. 14. No. 3. P. 433–444.
9. Бочаров П.П., Д’Апиче Ч., Мандзо Р., Фонг Н.Х. Об обслуживании многомерного пуассоновского потока на одном приборе с конечным накопителем и повторными заявками
// Проблемы передач информации. 2001. Т. 37. № 4. С. 130−140.
10. Чечельницкий А.А., Кучеренко О.В. Стационарные характеристики параллельно функционирующих систем обслуживания с двумерным входным потоком // Сборник научных статей. Минск, 2009. Вып. 2. С. 262–268.
11. Назаров А.А., Моисеева С.П. Метод асимптотического анализа в теории массового обслуживания. Томск: Изд-во НТЛ, 2006. 112 с.
Крысанова Кристина Андреевна
Моисеева Светлана Петровна
Томского государственного университета.
E-mail: Krysanova@sibmail.com; smoiseeva@mail.ru
Поступила в редакцию 10 сентября 2011 г.
Krysanova Kristina A., Moiseeva Svetlana P. (Tomsk State University). Method of asymptotic
analysis for research of parallel service multiple demands of Markovian renewal flow.
Keywords: multiple customers, Markovian renewal flow with dual customers, asymptotic analysis.
We identify the method of the asymptotic analysis in the queuing theory as a solving of equations defining any characteristics of system while performing under some limiting condition
whose type depends on the models and research tasks.
We consider queuing system of multiple customers with an input flow of Markovian renewal
(MR(2)||M2|∞) with two blocks of service, each of which contains unlimited number of devices.
The input flow is the Markovian renewal of the dual customers, defined by functions of distribution of lengths of intervals and a matrix of transitive probabilities – imbedded on arrival times.
Durations of service of various customers are assumed to be stochastically independent, equally
distributed in each block and exponentially distributed with parameters μ1 and μ2, accordingly.
The arrived customer occupies any of free devices and after finishing of service the customers
leaves system.
The problem of investigation of the two-dimensional process which characterizes a number of
customers in each block is considered.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
УДК 519.865
К.И. Лившиц, Я.С. Бублик
РАСПРЕДЕЛЕНИЕ УСЛОВНОГО ВРЕМЕНИ ДО РАЗОРЕНИЯ
СТРАХОВОЙ КОМПАНИИ ПРИ ДВАЖДЫ СТОХАСТИЧЕСКИХ
ПОТОКАХ СТРАХОВЫХ ПРЕМИЙ И СТРАХОВЫХ ВЫПЛАТ1
Найдена производящая функция моментов условного времени до разорения
страховой компании при дважды стохастических потоках страховых премий и выплат и малой нагрузке страховой премии.
Ключевые слова: условное время до разорения, вероятность разорения,
дважды стохастический поток, нагрузка страховой премии
Настоящая работа является непосредственным продолжением работы [1], в которой было получено выражение для вероятности разорения страховой компании
на бесконечном временном интервале при дважды стохастических потоках страховых премий и страховых выплат и малой нагрузке страховой премии. Однако
более исчерпывающей характеристикой деятельности компании является распределение условного времени до ее разорения при условии, что разорение происходит [2]. Через распределение условного времени до разорения может быть выражена, в частности, вероятность разорения на конечном временном интервале.
В настоящей работе находится производящая функция моментов условного времени до разорения страховой компании при дважды стохастических потоках
страховых премий и страховых выплат и малой нагрузке страховой премии.
1. Математическая модель страховой компании
Итак, будем считать, что интенсивность потока страховых премий λ ( t ) является однородной цепью Маркова с непрерывным временем и m состояниями
λ ( t ) = λi [3] . Переход из состояния в состояние задается матрицей инфинитезимальных характеристик
Α = ⎡⎣ αij ⎤⎦ ранга m − 1 . Таким образом, переход из со-
стояния i в состояние j за малое время ∆t имеет вероятность
Pi j ( ∆t ) = α ij ∆t + o ( ∆t ) , i ≠ j;
Pii ( ∆t ) = 1 + αii ∆t + o ( ∆t ) , i = 1, m,
где α ij ≥ 0 при i ≠ j и
m
∑ αij = 0.
(1)
j=1
Обозначим Pi ( t ) = P {λ ( t ) = λ i } , i = 1, m. Если управляющая цепь является нераз1
Работа выполнена в рамках аналитической ведомственной целевой программы «Развитие научного
потенциала высшей школы» (2009–2011 гг.), проект № 2.1.2/11803 и гранта РФФИ № 11-01-90713моб. ст.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
К.И. Лившиц, Я.С. Бублик
92
ложимой, то существуют финальные вероятности
πi = lim Pi ( t ) ,
t →∞
которые являются решением системы уравнений
m
∑ π j α ji ;
(2)
j=1
π1 + π2 +
+ πm = 1.
(3)
Обозначим, далее, через λ 0 среднюю интенсивность потока страховых премий в
стационарном режиме
m
λ 0 = ∑ πi λ i .
(4)
i=1
Будем считать, что страховые премии являются независимыми случайными величинами с плотностью распределения ϕ ( x ) , средним значением M { x} = a и мо-
{ }
ментами M x k = ak , k = 2,3.
Будем считать, что интенсивность потока страховых выплат μ ( t ) также является однородной цепью Маркова с непрерывным временем и n состояниями интенсивности μ ( t ) = μi . Переход из состояния в состояние задается матрицей инфинитезимальных характеристик Β = ⎡⎣βij ⎤⎦ ранга n − 1 , где βij ≥ 0 при i ≠ j и
n
∑ βij = 0 .
(5)
j=1
Обозначим через ρ j – финальные вероятности состояний μ j . Величины ρ j являются решениями системы уравнений
n
∑ ρ j β ji = 0 ;
(6)
j=1
ρ1 + ρ2 +
+ ρn = 1.
(7)
Обозначим через μ0 среднюю интенсивность потока страховых выплат
n
μ 0 = ∑ ρi μ i .
(8)
i=1
Будем считать, что страховые выплаты являются независимыми случайными величинами с плотностью распределения ψ ( x ) , средним значением M { x} = b и
{ }
моментами M x k = bk , k = 2,3 .
Наконец, будем считать, что с начала функционирования страховой компании
прошло какое-то время, имеются застрахованные риски, потоки страховых премий и страховых выплат не зависят друг от друга.
Пусть S ( t ) – средний капитал компании в момент времени t. Как показано
в [1] ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Распределение условного времени до разорения страховой компании
93
S ( t ) = S ( 0 ) + ( λ 0 a − μ0b ) t +
m
t
n
t
i =1
0
i =1
0
+ ∑ λi a ∫ ( P {λ ( t ) = λ i } − πi ) dt − ∑ μi b ∫ ( P {μ ( t ) = μi } − ρi ) dt.
(9)
Из выражения (9) следует, что при t 1 капитал компании в среднем монотонно
возрастает, если
λ 0 a = (1 + θ ) μ0 b,
(10)
где θ > 0 . При θ < 0 компания разоряется. Параметр θ , как и в классической модели [ 4] , – нагрузка страховой премии.
2. Производящие функции условного времени
Пусть (Ω, F , F= ( Ft )t ≥ 0 , P ) – вероятностное пространство, на котором определены траектории процесса S ( t ) изменения капитала компании. Пусть в начальный момент времени капитал компании равен s и значения интенсивностей
λ ( t ) = λi и μ ( t ) = μ j . Разобьем все возможные траектории процесса S ( t ) , выходящие из этой точки, на два класса: {Sω ( t ) , ω ∈ Ωi j ( s )} – траектории, приводящие
к разорению, и
{Sω ( t ) , ω ∈ Ωi j ( s )}
– траектории, приводящие к выживанию.
Пусть ti j ( s, ω ) – время до разорения на траектории, приводящей к разорению.
Обозначим
Φ ij ( s, u ) =
∫
e
− utij ( s ,ω)
P ( d ω)
(11)
Ωi j ( s )
и пусть
Gij ( s ) =
∫
P ( d ω)
(12)
Ωij ( s )
– вероятность разорения на бесконечном интервале при условии, что в начальный
момент времени капитал равен s и интенсивности потоков равны λ i и μ j . Тогда
ϕij ( s, u ) =
Φ ij ( s, u )
Gij ( s )
(13)
есть производящая функция моментов условного времени до разорения при условии, что в начальный момент времени капитал равен s и интенсивности потоков
равны λ i и μ j .
Функции Φ ij ( s, u ) должны удовлетворять граничным условиям
Φ ij ( s, 0 ) = Gij ( s ) ,
lim Φ ij ( s, u ) = 0,
s →∞
(14)
второе из которых вытекает из того, что при s → ∞ область интегрирования в
(11) Ωij ( s ) → ∅ .
Пусть Fi j ( t , s ) – функция распределения условного времени до разорения при
условии, что в начальный момент времени капитал равен s и интенсивности по-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
К.И. Лившиц, Я.С. Бублик
94
токов равны λ i и μ j . Если Pij ( s, t ) – вероятность разорения страховой компании
за время t , то
Pij ( s, t ) = Fij ( s, t ) Gij ( s ) ,
так как для разорения за время, не превосходящее t , компания должна разориться
и время до разорения должно быть не больше, чем t . Поэтому определение любой из вероятностей Pij ( s, t ) или Fij ( t , s ) определяет и вторую вероятность.
Для вывода уравнений, которым должны удовлетворять функции Φ ij ( s, u ) ,
рассмотрим два соседних момента времени t и t + ∆t .Пусть в момент времени t
капитал компании равен s , интенсивность λ = λi , интенсивность μ = μ j . За время ∆t капитал компании изменится на величину ∆s и
tij ( s, ω) = ∆t + t pq ( s + ∆s, ω) ,
(15)
где номер p соответствует значению интенсивности λ ( t ) , а номер q – значению
интенсивности μ ( t ) в момент времени t + ∆t . Усредняя соотношение (15), будем
иметь
Φ ij ( s, u ) = e −u∆t M ∆s , p ,q {Φ p ,q ( s + ∆s, u )} .
(16)
При принятой модели за время ∆t могут произойти следующие события:
1. С вероятностью (1 − λi ∆t ) (1 − μ j ∆t ) (1 + α ii ∆t ) (1 + β jj ∆t ) + o ( ∆t ) страховые
премии не поступают, страховые выплаты не производятся, интенсивности потоков не меняются.
2. С вероятностью λ i ∆t ϕ ( x ) dx + o ( ∆t ) поступает страховая премия размера
x , выплаты не производятся, интенсивности потоков не меняются.
3. С вероятностью μ j ∆t ψ ( x ) dx + o ( ∆t ) производится страховая выплата размера x , страховые премии не поступают, интенсивности потоков не меняются.
4. С вероятностью αik ∆t + o ( ∆t ) интенсивность потока страховых премий изменяется с λ i на λ k , страховые выплаты не производятся, страховые премии не
поступают.
5. С вероятностью β jk ∆t + o ( ∆t ) интенсивность потока страховых выплат изменяется с μ j на μ k , страховые выплаты не производятся, страховые премии не
поступают.
Остальные события имеют вероятность o ( ∆t ) .
Используя формулу полной вероятности, получим из (16)
Φ i j ( s, u ) = (1 − u ∆t )[(1 − ( λ i + μ j ) ∆t + (α ii + β jj )∆t ) Φ i j ( s, u ) +
∞
s
0
∞
0
+ λi ∆t ∫ Φ i j ( s + x, u ) ϕ ( x ) dx + μi ∆t ∫ Φ ij ( s − x, u )ψ ( x ) dx +
+ μ j ∆t ∫ ψ( x)dx + ∑ αik ∆t Φ kj ( s, u ) + ∑ β jk Φ ik ( s, u ) + ο(∆t ),
s
k ≠i
k≠ j
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Распределение условного времени до разорения страховой компании
95
где учтено, что при s < 0 ti j ( s, u ) = 0. Переходя к пределу при ∆t → 0 , получим
∞
( λi + μ j + u ) Φi j ( s, u ) = λi ∫ Φi j ( s + x, u )ϕ ( x ) dx +
0
s
m
n
∞
0
k =1
k =1
s
(17)
+μ j ∫ Φ ij ( s − x, u )ψ ( x)dx + ∑ α ik Φ kj ( s, u ) + ∑ β jk Φ ik ( s, u ) + μ j ∫ ψ ( x)dx.
3. Производящие функции условного времени
при малой нагрузке страховой премии
Получить точное решение систем уравнений (17) не удается. Поэтому рассмотрим далее асимптотический случай, когда нагрузка страховой премии θ 1 .
Решение системы уравнений (17) будем искать в виде
u
(18)
Φ i j ( s, u ) = A ( u, θ ) fij ⎛⎜ θs, 2 , θ ⎞⎟ ,
⎝ θ
⎠
где A ( u, θ ) и fij ( z , u, θ ) – некоторые пока не определенные функции. В силу
произвольности функции A ( u, θ ) можно считать, что
m
n
i =1
i =1
∑ ∑ πi ρ j fij ( 0, u, θ ) = 1.
(19)
Также будем считать, что функции fij ( z , u, θ ) по крайней мере дважды дифференцируемы по z и равномерно непрерывны по u и θ , а также, что существует
конечный предел
(
)
lim A θ2u , θ ≠ 0 .
θ→0
Подставляя (18) в уравнения (17) и сделав замены переменных θs = z ,
u
θ2
= ω,
получим уравнения относительно функций fi j ( z , ω, θ )
∞
(λ i + μ j + ωθ2 ) fij ( z , ω, θ) = λ i ∫ fij ( z + θx, ω, θ)ϕ( x)dx +
0
∞
m
n
0
k =1
k =1
+μ j ∫ fij ( z − θx, ω, θ)ψ ( x)dx + ∑ α ik f kj ( z , ω, θ) + ∑ β jk fik ( z , ω, θ) + R (θ),
∞
где
R ( θ ) = μ j ∫ fij ( z − θx, ω, θ)ψ ( x)dx +
z
θ
Оценим поведение R ( θ ) при θ
1
θ3
∞
∫ ψ ( x ) dx =
z
θ
1
∞
z3
A(θ2 ω, θ)
∞
∫ ψ( x)dx .
z
θ
1 . Имеем
1
∫ ψ ( x ) dx ≤ z 3
z 3 z θ3
θ
μj
∞
3
→0 ,
∫ x ψ ( x ) dx ⎯⎯⎯
θ→0
z
θ
(20)
(21)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
К.И. Лившиц, Я.С. Бублик
96
так как по условию M {x 3 } = b3 существует. Так как fij ( z , θ ) считается дифференцируемой и, следовательно, ограниченной, то аналогично ведет себя и второе
( )
слагаемое. Поэтому R ( θ ) = o θ3
и в дальнейшем это слагаемое учитываться не
будет.
Обозначим
fi j ( z , ω) = lim fi j ( z , ω, θ ) .
(22)
θ→0
Переходя в (20) к пределу при θ → 0 , получим, что
m
n
k =1
k =1
∑ αik f kj ( z, ω) + ∑ β jk fik ( z, ω) = 0 .
Как показано в [1] , отсюда можно получить, что
fi j ( z , ω) = f ( z , ω) ∀i, j ,
(23)
где f ( z , ω) – неизвестная пока функция.
Представим теперь функции fi j ( z , ω, θ ) в виде
fi j ( z , ω, θ ) = f ( z , ω) + Ai ( z , ω) θ + o ( θ ) .
(24)
Подставляя разложения (24) в уравнения (20), раскладывая f ( z ± θx ) , Aij ( z ± θx )
в ряд Тейлора и ограничиваясь членами разложения, имеющими порядок θ , получим, что
n
⎡m
⎤
θ ⎢ ∑ α ik Akj ( z , ω) + ∑ β jk Aik ( z , ω) ⎥ + θ(λ i a − μ j b) f ′( z , ω) + ο(θ) = 0 .
⎣ k =1
⎦
k =1
Наконец, с учетом (10)
(25)
λ i a − μ j b = ( λ i − λ 0 ) a − ( μ j − μ 0 ) b + μ 0 bθ.
Переходя в (61) к пределу при θ → 0 , будем иметь
m
n
k =1
k =1
∑ αik Ak j ( z, ω) + ∑ β jk Aik ( z, ω) = −[( λi − λ 0 ) a − (μ j − μ0 )b] f ′ ( z, ω) .
(26)
Представим теперь функции fi ( z , v, θ ) в виде
( )
fi j ( z , ω, θ ) = f ( z , ω) + Ai j ( z , ω) θ + Bi j ( z , ω) θ2 + o θ2 .
(27)
Подставляя разложения (27) в уравнения (20), раскладывая f ( z ± θx ) , Aij ( z ± θx ) ,
Bij ( z ± θx ) в ряд Тейлора и ограничиваясь членами, имеющими порядок θ2 , по-
лучим, учитывая (26), что при θ → 0
m
n
∑ αik Bkj ( z, ω) + ∑ β jk Bik ( z, ω) +
k =1
λi a2 + μ j b2
f ′′ ( z ) + μ 0bf ′( z , ω) +
2
+[(λi − λ 0 )a − (μ j − μ0 )b] Aij′ ( z , ω) = ωf ( z , ω).
k =1
(28)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Распределение условного времени до разорения страховой компании
97
Умножая соотношения (28) на πi и ρ j , суммируя и учитывая (2),(6) , получим
m
n
λ 0 a2 + μ 0b2
f ′′ ( z , ω) + μ0 bf ′ ( z , ω) − ωf ( z , ω) + ∑ πi (λ i − λ 0 )a ∑ ρ j Aij′ ( z , ω) −
2
i =1
j =1
n
m
j =1
i =1
− ∑ ρ j (μ j − μ0 )b∑ πi Aij′ ( z , ω) = 0.
(29)
Обозначим
n
Vi ( z , ω) = ∑ ρ j Aij ( z , ω) , i = 1, m.
j =1
m
U j ( z , ω) = ∑ πi Aij ( z , ω) ,
j = 1, n.
i =1
Из соотношений (26), учитывая (2), (4) и (6), (8), умножая уравнения системы
на πi и ρ j соответственно и суммируя, получим, что функции U j ( z , ω) и
Vi ( z , ω) удовлетворяют системам уравнений
n
∑ β jkU k ( z, ω) = ( μ j − μ0 ) bf ′ ( z, ω)
(30)
k =1
m
∑ αikVk ( z, ω) = − ( λi − λ0 ) af ′ ( z, ω) .
и
(31)
k =1
Рассмотрим систему уравнений (30). Ранг матрицы ⎡⎣β jk ⎤⎦ равен n − 1 . Перепишем систему (30) в виде
n −1
∑ β jkU k ( z, ω) = − β jnU n ( z, ω) + ( μ j − μ0 ) bf ′ ( z, ω) .
k =1
Откуда
n −1
U k ( z , ω) = U n ( z , ω) + ∑ Qkj ( μ j − μ 0 ) bf ′ ( z , ω) ,
(32)
k =1
где
Аналогично,
⎡ β11
Q = ⎡⎣Qij ⎤⎦ = ⎢
⎢
⎣⎢βn −1,1
−1
β1,n −1 ⎤
⎥ .
⎥
βn −1,n −1 ⎦⎥
m −1
Vk ( z , ω) = Vm ( z , ω) − ∑ Rkj ( λ j − λ 0 ) af ′ ( z , ω) ,
(33)
(34)
j =1
−1
α1,m −1 ⎤
⎡ α11
⎥ .
где
R = ⎡⎣ Rij ⎤⎦ = ⎢
(35)
⎢
⎥
α m −1,m −1 ⎥⎦
⎢⎣ α m −1,1
Подставляя соотношения (32) и (34) в (29), получим уравнение на функцию
f ( z , ω)
A1 f ′′ ( z , ω) + A2 f ′ ( z , ω) − ωf ( z , ω) = 0,
(36)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
К.И. Лившиц, Я.С. Бублик
98
где
A1 =
m −1
m −1
λ 0 a2 + μ 0b2
− a 2 ∑ πk ( λ k − λ 0 ) ∑ Rkj ( λ j − λ 0 ) −
2
k =1
j =1
n −1
n −1
k =1
j =1
−b 2 ∑ ρk ( μ k − μ 0 ) ∑ Qkj ( μ j − μ 0 ) ,
(37)
A2 = μ0 b .
f ( z , ω) = U1 ( ω) e x1 ( ω) z + U 2 ( ω) e x2 ( ω) z ,
Откуда
x1 ( ω) =
где
− A2 − A22 + 4 A1ω
,
2 A1
x2 ( ω) =
− A2 + A22 + 4 A1ω
2 A1
(38)
– корни характеристического уравнения дифференциального уравнения (36).
В работе [1] было доказано, что постоянная A1 > 0 . Поэтому U 2 ( ω) = 0 . Наконец, из условия (19) получаем, что U1 ( ω) = 1 . Таким образом,
f ( z , ω) = e
−
A2 + A22 + 4 A1ω
z
2 A1
Φ i j ( s, u ) = A ( u , θ )
и
⎛ u ⎞
x1 ⎜ 2 ⎟θs
e ⎝θ ⎠
(39)
+ O (θ) .
(40)
При выводе соотношения (40) неявно предполагалось, что в уравнениях (20)
s ≠ 0 . Для определения функции A ( u, θ ) рассмотрим теперь уравнения (20) при
s = 0 . Умножая уравнения системы (20) на πi и ρ j и складывая уравнения, при
s = 0 будем иметь
∞ x ⎛ u ⎞ θx
1⎜ 2 ⎟
⎝ θ ⎠ ϕ( x ) dx + μ
(λ 0 + μ0 + u ) A(u , θ) = λ 0 A(u, θ) ∫ e
0
.
(41)
0
Откуда
μ0
A ( u, θ ) =
∞ x ⎛ u ⎞ θx
1⎜ 2 ⎟
e ⎝ θ ⎠ ϕ( x)dx
.
(42)
(λ 0 + μ 0 + u ) − λ 0 ∫
0
Таким образом, окончательно получаем, что
Φ i j ( s, u ) =
μ0
⎛ u ⎞
x1 ⎜ 2 ⎟ θs
e ⎝θ ⎠
∞ x ⎛ u ⎞ θx
1⎜ 2 ⎟
e ⎝ θ ⎠ ϕ( x)dx
+ O ( θ) .
(43)
(λ 0 + μ 0 + u ) − λ 0 ∫
0
Из соотношений (43) и (14) можно получить теперь ранее вычисленное [1] выражение для вероятностей разорения на бесконечном интервале при θ 1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Распределение условного времени до разорения страховой компании
μ0 e
Gi j ( s ) =
−
A2
θs
A1
∞ − A2 θx
A1
λ 0 + μ0 − λ 0 ∫ e
.
99
(44)
ϕ( x)dx
0
Моменты условного времени до разорения определяются соотношениями
(−1)k ∂ k Φ i j ( s, u )
(45)
ti kj ( s ) =
u =0 .
Gij ( s )∂u k
Вычисляя производные, получим, что при θ 1 среднее значение условного
времени
λ0 a ⎞
1 ⎛
ti1 j ( s ) =
(46)
⎜s+
⎟ + O (1) .
θA2 ⎝
μ0 ⎠
Дисперсия условного времени
Di j ( s ) =
λ a⎞
2 A1 ⎛
1
s + 0 ⎟ + O ⎛⎜ 2
3 3⎜
μ0 ⎠
⎝θ
θ A2 ⎝
⎞.
⎟
⎠
(47)
4. Плотность распределения условного времени
при неограниченно возрастающем начальном капитале
Будем теперь считать, что при θ → 0 начальный капитал компании s → ∞ .
3
Более точно, будем считать, что lim θs ( θ ) = ∞ , но lim θ 2 s ( θ ) = 0 .Обозначим
θ→ 0
m=
θ→0
2 A1
1
, σ=
θA2
θ3 A23
z=
и введем величину
t − ms
σ s
.
Производящая функция величины z
mus
u
, s ⎞⎟ ,
ϕi , j , z ( u, s ) = e σ s ϕi , j ⎛⎜
⎝σ s ⎠
или
∞
A2
θx
∞ −
e A1 ϕ( x ) dx⋅
∫
λ 0 + μ0 − λ 0 ∫ e 0
ϕi , j , z ( u, z ) =
A2
0
λ 0 + μ0 +
Обозначим γ =
u
σ s
∞ x ⎛ u ⎞ θx
⎟
1⎜ 2
e ⎝ θ σ s ⎠ ϕ( x)dx
e A1
m
⎛ u ⎞
su .
θs + x1 ⎜ 2
⎟ θs +
σ
⎝θ σ s ⎠
.
(48)
− λ0 ∫
0
A2
. Тогда
2 A1
A2
e A1
θs +
m
⎛ u ⎞
su + x1 ⎜ 2
⎟ θs
σ
⎝θ σ s ⎠
=e
⎛ u ⎞
2 γ 2 θs +γu θs + x1 ⎜ 2
⎟ θs
⎝θ σ s ⎠ .
(49)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
К.И. Лившиц, Я.С. Бублик
100
Далее,
A2
u ⎞
2u
x1 ⎛⎜ 2
= −γ 2 − γ 2 1 +
=
⎟=−
2 A1
⎝θ σ s ⎠
γ θs
= −γ 2 [2 +
u
γ θs
−
1 u2
1
u3
1 ⎞
+ 3
+ ο ⎛⎜
⎟.
2
2 γ θs 2 γ θs θs
⎝ θs θs ⎠
⎛ u ⎞
2 γ 2 θs +γu θs + x1 ⎜ 2
⎟ θs
⎝θ σ s ⎠
e
Поэтому
=e
Наконец, при θ → 0 и s → ∞ отношение
∞
λ 0 + μ 0 − λ 0 ∫ e −2 γ
2
θx
1 2
u3
1 ⎞
u −
+ο⎛⎜
⎟
2
2 γ θs ⎝ θs ⎠
ϕ( x)dx
0
λ 0 + μ0 +
∞ χ (
1
u
− λ0 ∫ e
σ s
.
→ 1.
u
2
θ σ s
) θx
ϕ( x)dx
0
Положив u = jω , получим, при θ → 0 и s → ∞
lim ϕ z ( j ω, s ) = e
−
θ→0
ω2
2
,
т.е. распределение условного среднего времени до разорения при условии, что разорение происходит, сходится к нормальному распределению.
Заключение
В работе найдена производящая функция условного времени до разорения
страховой компании при дважды стохастических потоках страховых премий и
страховых выплат и дополнительном предположении о малости нагрузки страховой премии. Предложенная методика может быть использована для анализа других моделей страхования при условии, что нагрузка страховой премии считается
малой.
ЛИТЕРАТУРА
1. Лившиц К.И., Бублик Я.С. Вероятность разорения страховой компании при дважды стохастических потоках страховых премий и страховых выплат // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2011.
№ 4(17). С. 64–73.
2. Глухова Е.В., Змеев О.А., Лившиц К.И. Математические модели страхования. Томск:
Изд-во Том. ун-та, 2004. 180 с.
3. Наумов В.А. Марковские модели потоков требований // Системы массового обслуживания и информатика. М.: УДН, 1978. С. 67−73.
4. Panjer H.Y., Willmont G.E. Insurance Risk Models. Society of Actuaries, 1992. 442 p.
Лившиц Климентий Исаакович
Томский государственный университет
Бублик Яна Сергеевна
Филиал Кемеровского государственного университета
в г. Анжеро-Судженске
E-mail: kim47@mail.ru; yana@asf.ru
Поступила в редакцию 8 ноября 2011 г.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Распределение условного времени до разорения страховой компании
101
Livshits Klimentiy I., Bublic Yana S.(Tomsk State University. Anjero-Sudjensk branch of the Kemerovo State University). Distribution of the conditional time to ruin of an insurance company under double stochastic insurance premium and insurance payment flows.
Keywords: conditional time to ruin, probability of the ruin over a finite interval, double stochastic
flow, relative security loading.
The generating function for the moments of the conditional time to ruin of an insurance company provided that ruin has happened is evaluated for the situation when the intensities of the insurance premiums and the insurance payments flows are the homogeneous Markov chains with
the continuous time and the relative security loading θ is small.
Let s be the initial capital of an insurance company. It is shown that the conditional time to
3
ruin has the asymptotical normal distribution if θs ( θ ) → ∞ , but θ 2 s ( θ ) → 0 as θ → 0.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
УДК 336:51
Г.А. Медведев
О ВРЕМЕННОЙ СТРУКТУРЕ ДОХОДНОСТИ. 1. МОДЕЛЬ ВАСИЧЕКА
Исследуются свойства таких характеристик временной структуры процентных ставок, как кривые доходности и форвардные ставки, в случае, когда
используется аффинная модель доходности. В отличие от известных подходов анализируются не только однофакторные, но и многофакторные модели.
Кроме того, рассматривается не только диапазон коротких и средних сроков
погашения активов, но и длительные сроки. При этом в качестве временной
переменной предлагается использовать дюрацию безрисковой ставки. Это
дает возможность сравнения кривых доходности и форвардных кривых на
всем интервале изменения сроков погашения активов.
Ключевые слова: процентные ставки доходности, аффинная модель, кривая доходности, форвардная кривая, модель Васичека.
В последние годы много внимания уделяется исследованию временной структуры процентных ставок (т.е. зависимости процентных ставок доходности от срока до погашения свободных от неуплаты ценных бумаг) и относящихся к ней таких величин, как номинальная кривая доходности и форвардная кривая. Эта зависимость играет важную роль при определении стоимости долговых инструментов
и финансовых производных от процентных ставок [1, c. 137; 2, c. 9], исследовании
влияния налогообложения и ликвидности на цены облигаций [3, c. 1540; 4, c. 617].
Временная структура процентных ставок используется также при управлении
риском (см. например, технологию RiskMetrics [5]), где используются методы генерирования спот-ставок, по которым конструируется матрица ковариации, а
также при разработке монетарной стратегии, когда ожидаемые ставки разделяются на краткосрочные, среднесрочные и долгосрочные [6, c. 27]. Известна также
попытка формализовать связь между кривой доходности и реальной экономической активностью. На основании этой связи выводятся формулы для временной
структуры процентных ставок. При этом временная структура олицетворяет рыночные ожидания об изменениях макроэкономической основы – роста реального
совокупного продукта экономики, что позволяет использовать рыночные данные
об облигациях для предсказания роста внутреннего валового продукта в промышленных странах [7, c. 6].
Временной структурой, интересной для практиков и исследователей, является
номинальная кривая доходности, представляющая доходность до погашения на
номинальные облигации (т.е. облигации, продающиеся по номинальной стоимости и имеющие купоны с такой же доходностью). Определение номинальной кривой доходности основывается на наблюдении находящихся в обращении государственных ценных бумаг, только что проданных на аукционе и наиболее ликвидных. Эти ценные бумаги в странах с развитой экономикой выпускаются для 10
начальных сроков погашения 0,25, 0,5, 1, 2, 3, 5, 7, 10, 20 и 30 лет. Они обычно
продаются по номинальной стоимости и их доходности называются доходностями
номинальных облигаций. Определение временной структуры процентных ставок
сводится к тому, что имея только 10 находящихся в обращении номинальных до-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 1. Модель Васичека
103
ходностей, непосредственно наблюдаемых на рынке, и используя другую информацию, содержащуюся в описании этих ценных бумагах, необходимо сконструировать функцию, позволяющую вычислять доходность для любого срока до погашения. Заметим, что имеются методы, не основанные на номинальной кривой
доходности, такие, как метод кубических сплайнов [8, c. 21] и сглаживающий метод [9, c. 7].
1. Общие свойства многофакторных моделей временной структуры
доходностей
Будем рассматривать номинальные облигации, продаваемые на аукционе в некоторый текущий момент времени t по цене P(t, T, x), где T – дата погашения облигации, а x = x(t) – в общем случае вектор переменных, характеризующих состояние финансового рынка на дату t, t < T. Считается, что облигация является
свободной от неуплаты и на дату T погашается за 1 денежную единицу, т.е. цена
P(T, T, x) = 1 для любых состояний x(T).
Процентной ставкой доходности до погашения (или просто доходностью) называется величина
− ln P(t , T , x)
y (t , T , x) =
.
T −t
Временной структурой доходности называют зависимость y(t, T, x) от срока до
погашения T − t. Именно она представляет интерес для инвесторов, заботящихся
об эффективности своих инвестиций в будущем.
Краткосрочная процентная ставка доходности (или просто краткосрочная
(short) ставка) определяется как предел
y (t , x) = lim
T →t
− ln P (t , T , x) ∂ ln P (t , T , x)
=
.
T −t
∂t
T =t
(1)
Эта ставка различными авторами называется также спот (spot)-ставкой или безрисковой (risk-free) ставкой, поскольку она характеризует доходность в течение
инфинитезимального интервала времени, на котором как бы ни изменялось состояния рынка оно «не успеет» стать рисковым.
Наряду со ставкой доходности до погашения, характеризующей доходность облигации за весь период ее активности, инвесторов интересуют доходности облигаций на некотором временном интервале между будущими датами T1 и T2 на основе
информации о доходности, имеющейся в текущий момент времени t, t < T1 < T2. Такие ставки f(t, T1, T2) называются форвардными. Форвардные ставки при T1 → T2 = T
определяют краткосрочные ставки для будущих моментов времени T и называются
мгновенными форвардными ставками f(t, T, x). Именно они чаще интересуют инвесторов и словосочетание «форвардные ставки» обычно относится именно к f(t, T, x).
Форвардная ставка f(t, T, x) определяется соотношением [10, c. 137]
∂ ln P (t , T , x )
f (t , T , x) = −
.
∂T
Между доходностью до погашения и форвардной ставкой имеется взаимно однозначные соотношения
y (t , T , x) =
1
T −t
T
∫ f (t , s, x)ds ,
t
f (t , T , x) = y (t , T , x) + (T − t )
∂ y (t , T , x)
.
∂T
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
104
Вектор состояния финансового рынка X(t) = (X1, X2, …, Xn)Т следует однородному по времени марковскому процессу, порождаемому стохастическим дифференциальным уравнением
dX(t) = μ(X(t)) dt + σ(X(t)) dW(t)
с n-вектором дрейфа μ(x), (n×m)-матрицей волатильности σ(x), и m-вектором W(t)
независимых стандартных винеровских процессов.
Предполагается, что функция P(t, T, x) цены облигации дифференцируема по
первому аргументу и дважды дифференцируема по третьему аргументу. Согласно
стохастическому анализу Ито, цена облигации как функция времени P(t, T, X(t)) ≡
≡ Z(t) тоже оказывается случайным процессом диффузионного типа и удовлетворяет стохастическому дифференциальному уравнению
dZ(t) = μP(t, T, x) dt + σP(t, T, x)ТdW(t),
где μP(t, T, x) и σP(t, T, x) – скалярная функция дрейфа и m-вектор волатильности
соответственно, определяемые соотношениями
μ P (t , T , x) =
⎞
∂ P (t , T , x)
∂ P (t , T , x) 1 ⎛
∂ 2 P (t , T , x)
+ μ( x)T
+ tr ⎜ σ( x)T
σ( x ) ⎟ ,
2
∂t
∂x
2 ⎝
∂x
⎠
σ P (t , T , x)T = σ( x )T
∂ P (t , T , x)
.
∂x
Уравнение для определения функции P(t, T, x) находится из условия отсутствия на финансовом рынке арбитражных возможностей [11, c. 180], которое в рассматриваемом случае многофакторной модели сводится к тому, что должен существовать m-вектор λ(t, x), не зависящий от даты погашения облигаций T, такой,
чтобы выполнялось равенство μP(t, T, x) − y(x)P(t, T, x) = σP(t, T, x)Тλ(t, x). Функция
λ(t, x) называется рыночной ценой риска. Таким образом, приходим к уравнению
с частными производными для функции P(t, T, x):
⎞
∂ P (t , T , x)
∂ P (t , T , x) 1 ⎛
∂ 2 P (t , T , x)
+ μ( x)T
+ tr ⎜ σ( x )T
σ( x ) ⎟ − y ( x ) P(t , T , x) =
2
2 ⎝
∂t
∂x
∂x
⎠
T ∂ P (t , T , x )
.
= λ(t, x)Т σ( x )
∂x
Это уравнение должно решаться с краевым условием P(T, T, x) = 1 для любых состояний x.
Тот факт, что марковский процесс X(t) является однородным по времени, приводит к следующему свойству функции P(t, T, x): она зависит не от t и T в отдельности, а только от разности T − t, т. е. не от текущего времени и даты погашения, а
только от оставшегося срока до погашения τ = T − t. Так что P(t, T, x) ↔ P(τ, x),
при этом y(t, x) ↔ y(x), λ(t, x) ↔ λ(x). В литературе часто предполагают, что вектор дрейфа μ(x) и матрица диффузии σ(x)σ(x)Т состояний финансового рынка
описываются аффинными функциями, а рыночные цены риска таковы, что
σ(x)λ(x) – n-вектор с аффинными компонентами,
μ(x) = K(θ − x), σ(x)σ(x)Т = α +
n
∑ βi xi ,
i =1
σ(x)λ(x) = ξ +
n
∑ ηi xi .
i =1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 1. Модель Васичека
105
Здесь K, α и βi − (n×n)-матрицы; θ, ξ и ηi − n-векторы, xi − компоненты вектора x.
Заметим, что указанные соотношения удовлетворяются при
σ(x) = σ
γ + Γx , λ(x) =
γ + Γx λ ,
где γ, λ − m-векторы, σ − (n×m)-матрица, Γ − (m×n)-матрица, а
γ + Γx
− диаго-
нальная (m×m)-матрица, по диагонали которой стоят квадратные корни компонент
вектора γ + Γx. В этом случае α = σ 〈γ〉 σ Т, ξ = σ 〈γ〉 λ , а элементы матрицы βi и вектора ηi определяются равенствами
(βi)kj =
m
m
u=1
u =1
∑ σku σ ju Γui , 1 ≤ k, j ≤ n; (ηi)k = ∑ σku Γui λu , 1 ≤ k ≤ n.
Такие предположения приводят к аффинной временной структуре процентных
ставок доходности. Перепишем уравнение для цены облигации P(t, T, x) в этом
случае:
−
n
⎞
∂ P (τ, x)
∂ P (τ, x) 1 ⎛ ∂ 2 P (τ, x)
(α + ∑ βi xi ) ⎟ − y ( x) P(τ, x) =
+ (θ − x ) T K T
+ tr ⎜
2
2 ⎝ ∂x
∂τ
∂x
⎠
i =1
= (ξ +
n
∑ ηi xi )T
i =1
∂ P(τ, x)
.
∂x
(2)
Решение этого уравнения может быть представлено в виде P(τ, x) = ехр{A(τ) −
– xТB(τ)}, где функции A(τ) и B(τ) удовлетворяют начальным условиям: A(0) = 0 и
B(0) = 0. Заметим, что для цены облигации в таком виде краткосрочная процентная ставка (1) приобретает вид
− ln P (τ, x)
x T B (τ) − A(τ)
dB (τ)
dA(τ)
= lim
= xT
−
=
τ→ 0
τ→0
τ
τ
d τ τ= 0
d τ τ= 0
= x T B ′(0) − A′(0),
y ( x) = lim
(3)
т.е. тоже является аффинной функцией вектора x. Штрих обозначает производную
по τ. Заметим, что состояние финансового рынка обычно характеризуется значениями процентных ставок, иначе говоря, компонентами вектора x являются величины, имеющие смысл процентных ставок. Когда процентные ставки равны нулю,
доходность облигации отсутствует, поэтому в выражении (3) следует положить
A′(0) = 0. В дальнейшем это предположение будет приниматься во всех случаях.
Обозначим B′(0) = φ. Вектор φ можно рассматривать как вектор, составленный из
весов, которые приписываются той или иной компоненте вектора состояния x при
определении краткосрочной ставки
y(x) = xТφ = x1φ1 + x2φ2 + … + xnφn; φi ≥ 0, 1 ≤ i ≤ n; φ1 + φ2 + … + φn = 1.
Подстановка решения P(τ, x) = ехр{A(τ) − xТB(τ)} в уравнение (2) для P(t, T, x)
приводит к обыкновенным дифференциальным уравнениям для функции A(τ) и
компонент вектора B(τ) = (B1(τ), B2(τ), …, Bn(τ)):
A′(τ) = (ξ − Kθ)ТB(τ) + B(τ)Тα B(τ) /2, A(0) = 0;
(4)
Bi′(τ) = φi − B(τ)Т(ηi + Ki) − B(τ)Тβi B(τ) /2, Bi(0) = 0.
В уравнении для Bi(τ) символ Ki обозначает i-й столбец матрицы K, 1 ≤ i ≤ n.
(5)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
106
Заметим, что как следует из вышеприведенных определений, в рамках аффинной структуры ставка доходности и форвардная ставка определяются соотношениями
y (τ, x ) =
x T B (τ) − A(τ)
dB (τ) dA(τ)
−
, f (τ, x ) = xT
;
τ
dτ
dτ
y (τ, x) =
1
∂ y (τ, x)
f ( s, x)ds , f (τ, x ) = y (τ, x) + τ
.
∫
τ0
∂τ
(6)
τ
(7)
Функции y(τ, x) и f(τ, x), рассматриваемые как функции от переменной τ,
обычно называются соответственно кривой доходности и форвардной кривой.
Вид и свойства именно этих функций представляют интерес для инвесторов. Поэтому в дальнейшем мы будем интересоваться явным аналитическим выражением
этих функций и определением их свойств. Выясним вначале некоторые общие
свойства.
Общим пределом обеих кривых на левом конце, т.е. при τ → 0, является краткосрочная процентная ставка доходности y(x). Действительно, так как A′(0) = 0 и
B′(0) = φ,
y(x) = xТφ = lim y (τ, x ) = lim f (τ, x).
τ→0
τ→0
Для малых сроков погашения согласно (7) справедливы представления
⎛ ∂y (τ, x) ⎞
⎛ ∂y (τ, x ) ⎞
y (τ, x) = y ( x) + τ ⎜
+ o(τ) , f(τ, x) = y ( x) + 2τ ⎜
⎟
⎟ + o(τ).
⎝ ∂ τ ⎠τ=0
⎝ ∂ τ ⎠τ= 0
Отсюда видно, что, стартуя из одной точки y(x), кривые y(τ, x) и f(τ, x) с ростом τ
расходятся. При этом форвардная кривая изменяется вдвое быстрее.
Если кривая доходности имеет экстремум для некоторого срока до погашения
∂ y (τ, x)
= 0 , тогда форвардная ставка и ставка доходности для этого
τ∗, т.е.
∂ τ τ=τ∗
срока совпадают по величине f(τ∗, x) = y(τ∗, x).
Отсюда следует общий вывод о том, что если кривая доходности имеет максимум (минимум) y(τ∗, x), то наибольшее (наименьшее) значение форвардной ставки
f ∗ всегда больше (меньше) этого значения y(τ∗, x).
Для выяснения того, как кривые y(τ, x) и f(τ, x) ведут себя для длительных сроков погашения, требуется знать свойства функций A(τ) и B(τ). Однако решить
уравнения для этих функций в общем случае не удается. Можно только сказать,
что вектор B(τ) является решением многомерного уравнения Риккати. Если вектор
B(τ) удается найти, то функция A(τ) находится просто интегрированием правой
части уравнения для A(τ). Более детальные свойства функций A(τ) и B(τ) можно
выяснить только при конкретном задании K, α, β, η, θ и ξ. Однако используя некоторые ожидаемые свойства функций A(τ) и B(τ), можно выяснить ожидаемые
свойства кривых y(τ, x) и f(τ, x). Состояние финансового рынка x может быть
представлено набором ставок доходностей различных ценных бумаг [12, c. 392],
следовательно, компоненты вектора x имеют смысл процентных ставок и являются неотрицательными. Компоненты вектора B(τ) поэтому имеют размерность времени и их можно рассматривать [13, c. 57; 14, c. 566] как соответствующую дюра-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 1. Модель Васичека
107
цию, т.е. временной интервал, измеренный в определенном масштабе. Таким образом, можно ожидать, что компоненты вектора B(τ) неотрицательны и ограничены, т.е. для всех k = 1, 2, …, n ожидается, что 0 < Bk(τ) < + ∞. Предположим, что
пределы Bk(τ) при τ → + ∞ существуют и lim B (τ) = B (∞), B (∞) < ∞. В этих усτ→∞
ловиях естественно ожидать, что lim B ′(τ) = 0. В этом случае вектор B(∞) можно
τ→∞
определить из системы уравнений
φi = B(∞)Т(ηi + Ki) + B(∞)Тβi B(∞) /2, 1 ≤ i ≤ n.
Поэтому имеют место следующие равенства:
B ( τ)
dB(τ)
A(τ)
dA(τ)
lim
= lim
= 0, lim
= lim
= (ξ − Kθ)ТB(∞) + B(∞)Тα B(∞) /2.
τ→∞ τ
τ→∞ d τ
τ→∞ τ
τ→∞ d τ
Из равенств (6) также следует, что
y(∞, x) = f(∞, x) = (Kθ − ξ)ТB(∞) − B(∞)Тα B(∞) / 2 .
Таким образом, кривая доходности y(τ, x) и форвардная кривая f(τ, x) совпадают
для коротких сроков до погашения (при τ → 0), с увеличением τ кривые расходятся, но при продолжительных сроках (при τ → ∞) снова стремятся к одному и тому
же пределу. Последнее свойство до сих пор не указывалось авторами, а кривая
доходности y(τ, x) и форвардная кривая f(τ, x) обычно изображаются расходящимися кривыми. В дальнейшем рассмотрим конкретные модели, обычно рассматриваемые в литературе, чтобы при помощи строгого исследования выяснить, оправдан ли приведенный умозрительный анализ.
2. Модель Васичека и ее обобщение на многомерный случай
В однофакторном случае в качестве состояния рынка принимается краткосрочная ставка X(t) = r(t) и соответствующее стохастическое уравнение имеет вид
dr(t) = k(θ − r(t))dt + σdW(t),
где k, θ, σ − скалярные константы, т.е. K = k, α = σ2, β = 0, η = 0, ξ = σλ.
В этом случае также y(r) = r, т.е. B′(0) = 1. Уравнения (4) – (5) для определения
функций A(τ) и B(τ) превращаются в следующие:
A′(τ) = (σλ − k θ) B(τ) + σ2B(τ) 2 /2, A(0) = 0,
B′(τ) = 1 − k B(τ), B(0) = 0. B(τ) = (1 − ехр{− kτ}) / k.
Функция B(τ) имеет простой вид и является монотонно возрастающей функцией
от 0 до 1/k, B(∞) = 1/k. Поскольку B(τ) – монотонная функция, определяющая
дюрацию процентной ставки, она может быть использована в качестве аргумента
в кривой доходности y(τ, r) и форвардной кривой f (τ, r) вместо срока до погашения τ.
Преимущество такой замены заключается в том, что зависимость на всем интервале времени в виде графика представить невозможно из-за неограниченности
интервала времени, τ ∈ (0, ∞), в то время как этому неограниченному интервалу
соответствует конечный интервал изменения дюрации, B(τ) ∈ (0, 1/k). Тогда получим соответствия y(τ, r) ↔ Y(B, r), f(τ, r) ↔ F(B, r), τ = − ln(1− kB)/k. При этом
можно ожидать, что свойства функций Y(B, r) и F(B, r) могут оказаться проще. На
рис. 1 сравнение этих двух представлений кривой доходности и форвардной кривой иллюстрируется графиками для двухфакторной модели.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
108
Аналитические выражения кривой доходности y(τ, r) и форвардной кривой
f(τ, r) как функций времени имеют вид (здесь аналитическое выражение функции
B(τ) для краткости записи не выписывается)
y (τ, r ) =
⎛
σλ σ2
= ⎜θ −
−
k 2k 2
⎝
τ
⎞
r
1 ⎛
σ2
B (τ) − ∫ ⎜ (σλ − k θ) B ( s ) +
B( s ) 2 ⎟ ds =
2
τ
τ 0⎝
⎠
⎞ ⎛
σλ σ2 ⎞ B (τ) σ 2 B (τ) 2
σλ σ2
+ 2⎟
+
→ θ−
−
≡ y (∞ ) ,
⎟+⎜r −θ+
k 2k ⎠ τ
4k τ τ→∞
k 2k 2
⎠ ⎝
y(τ, r) = y (∞) + (r − y (∞))
B ( τ) σ 2 B ( τ ) 2
+
,
τ
4k τ
f (τ, r ) = r (1 − kB (τ)) − (σλ − k θ) B(τ) − σ2B(τ) 2 /2 → θ −
τ→∞
σλ σ2
−
= y (∞ ) .
k 2k 2
В свою очередь, аналитические выражения для функций Y(B, r) и F(B, r) получаются такими:
Y(B, r) = y (∞) − (r − y (∞))
kB
σ2 (kB ) 2
− 2
ln(1 − kB ) 4k ln(1 − kB )
→ y (∞ ) ,
B →1/ k
F ( B, r ) = r + [k(θ − r) − σλ]B − σ2B2 /2 → y (∞) .
B →1/ k
Отсюда, в частности, видно, что функция F(B, r) для любых значений параметров
модели является вогнутой. Впервые этот факт был отмечен Брауном и Шейфером
[14, c. 566] для однофакторных моделей.
В многофакторном случае уравнение для состояния рынка приобретает вид
dX(t) = K(θ − X(t))dt + σdW(t).
Здесь считается, что матрица коэффициентов диффузии не зависит от состояния,
γ = 1, Γ = 0. Поэтому α = σσТ, β = 0, η = 0, ξ = σλ. При этих значениях параметров
функции A(τ) и B(τ) определяются из уравнений
A′(τ) = (σλ − Kθ)ТB(τ) + B(τ)ТσσТB(τ) /2, A(0) = 0,
B′(τ) = φ − KТB(τ), B(0) = 0.
Обозначим через U(τ) фундаментальную матрицу решений однородного уравнения B′(τ) = − KТB(τ). Тогда решение уравнения для функции B(τ) записывается в
виде
τ
B(τ) = ∫ U (τ − s ) φ ds
0
Матрицу U(τ) можно представить в виде матричного ряда
τ2
τn
… + (− K T )n
+ …,
2!
n!
где I − единичная матрица. Используя это разложение под интегралом, находим
вектор B(τ):
U(τ) = e − K
T
τ
B(τ) = [Iτ + (− K T )
≡ I + (− KТ) τ + (− K T ) 2
T
τ2
τn +1
+ … + (− K T )n
+ …]φ = (K−1)Т(I − e − K τ ) φ.
2!
(n + 1)!
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 1. Модель Васичека
109
Заметим, что для существования этого решения нужно, чтобы матрица K была
невырожденной и ее собственные числа {γj} были положительные. Нетрудно видеть, что в этом случае имеет место соотношение
B(τ) → B(∞) = (K−1)Тφ.
τ→∞
Кривая доходности y(τ, x) и форвардная кривая f(τ, x) вычисляются по формулам
y (τ, x) = x T
τ
B ( τ) 1 ⎛
1
− ∫ ⎜ (σλ − Kθ )T B ( s ) + B( s )T σσT B( s ) ⎞⎟ ds ,
2
τ
τ 0⎝
⎠
(8)
y(τ, x) → y (∞) = θТφ − (K−1σλ)Тφ − φТ(K−1σ)( K−1σ)Тφ/2 ;
τ→∞
f (τ, x) = x T (φ − K T B (τ)) − (σλ − Kθ)ТB(τ) − B(τ)ТσσТB(τ) /2,
(9 )
f(τ, x) → y (∞) .
τ→∞
Таким образом, ожидаемые свойства функций A(τ) и B(τ) в рассматриваемом
случае также подтверждаются. Однако для перехода от временной переменной τ
к дюрации необходимо использовать только одну из компонент вектора B(τ). Для
этого надо иметь больше информации о свойствах B(τ), т.е. о виде матрицы K.
Для пояснения этого рассмотрим конкретный случай двухфакторной модели.
Предположим, что состояние рынка описывается не только краткосрочной
ставкой, но также экспоненциально сглаженным ее средним значением [15,
c. 398]. Состояние рынка X(t) в этом случае характеризуется двумя компонентами,
одной из которых r(t) является наблюдаемая краткосрочная ставка, а другой s(t) –
экспоненциально сглаженное ее среднее значение. Уравнения состояния рынка
приобретают вид
⎛ dr (t ) ⎞ = ⎛ k1 (θ − r (t )) ⎞ dt + σdW (t ).
⎜ ds (t ) ⎟ ⎜ k (r (t ) − s (t )) ⎟
⎝
⎠ ⎝ 2
⎠
Параметры модели в этом случае задаются соотношениями β = 0, η = 0,
0⎞
⎛ k
⎛ σ1 0 ⎞
⎛ φ1 ⎞
⎛ λ1 ⎞
⎛θ⎞
K= ⎜ 1
⎟ , θ = ⎜θ⎟ , σ = ⎜ 0 σ ⎟ , φ = ⎜φ ⎟ , λ = ⎜λ ⎟ .
−
k
k
⎝ ⎠
⎝ 2
⎝
⎝ 2⎠
⎝ 2⎠
2⎠
2⎠
Уравнения для функций временной структуры A(τ) и B(τ):
A′(τ) = (σ1λ1 − k1θ)B1(τ) + σ2λ2B2(τ) + σ12B1(τ)2/2 + σ22B2(τ)2/2, A(0) = 0;
B1′(τ) = φ1 − k1B1(τ) + k2B2(τ), B1(0) = 0;
B2′(τ) = φ2 − k2B2(τ), B2(0) = 0.
Функции B1(τ) и B2(τ) определяются выражениями
B1(τ) = (φ1 + φ2)
− k2 τ
1 − e − k1τ
− e − k1τ , B (τ) = φ 1 − e − k2 τ .
− φ2 e
2
2
k1
k1 − k2
k2
(10)
Подставляя эти выражения в равенства (8) и (9), получим явные выражения для
кривой доходности y(τ, x) и форвардной кривой f(τ, x). К сожалению, поскольку
количество параметров в рассматриваемом примере двухфакторной модели достаточно большое, выражения для функций y(τ, x) и f(τ, x) будут громоздкими. Для
получения компактных выражений введем вспомогательные обозначения:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
110
u=
φ2
φ2
φ
1
−
, v=
, w= 2;
k1 k1 − k2
k1 − k2
k2
τ
I1 (τ) =
τ
1
1
1
1
(1 − e − k1t )dt = 1 −
(1 − e− k1τ ), I 2 (τ) = ∫ (1 − e − k2t )dt = 1 −
(1 − e− k2 τ ),
τ ∫0
k1τ
τ0
k2 τ
τ
I 3 ( τ) =
1
2
1
(1 − e − k1t ) 2 dt = 1 −
(1 − e− k1τ ) +
(1 − e−2 k1τ ),
∫
2k1τ
τ0
k1τ
I 4 ( τ) =
1
2
1
(1 − e − k2t ) 2 dt = 1 −
(1 − e− k2 τ ) +
(1 − e −2 k2 τ ),
∫
2k2 τ
τ0
k2 τ
τ
τ
I 5 ( τ) =
1
1
1
1
(1− e − k1t )(1− e− k2t )dt = 1− (1− e− k1τ ) −
(1− e− k2 τ ) +
(1− e − ( k1 +k2 ) τ ).
(k1 + k2 )τ
τ ∫0
k1τ
k2 τ
Отметим, что функции Ii(τ), 1 ≤ i ≤ 5, являются монотонно возрастающими от 0 до
1 с увеличением τ от 0 до ∞. Напомним, что в рассматриваемом случае xТ = (r, s).
Использование принятых обозначений приводит к выражению, удобному для расчета кривой доходности
y(τ, x) = ruk1(1 − I1(τ)) + (rv + sw)k2(1 − I2(τ)) + (θk1 − σ1λ1)uI1(τ) +
+ [(θk1 − σ1λ1)v − σ2λ2w]I2(τ) − (σ1u)2I3(τ)/2 − (σ12v2 + σ22w2)I4(τ)/2 − σ12uvI5(τ).
Расчет форвардной кривой удобно выполнять по формуле (9) с применением
формул (10).
Заключение
Для многофакторных моделей аффинной доходности найдены аналитические
представления кривых доходности и форвардных кривых и предложено в качестве временной переменной использовать дюрацию безрисковой ставки. Поскольку
дюрация принимает значения только на конечном интервале, это позволяет наблюдать поведение кривых на всем интервале изменения реального времени.
ЛИТЕРАТУРА
1. Fabozzi F. Bond Markets, Analysis, and Strategies, 4th edition. New York: Prentice Hall
Publishing. 2000. 734 р.
2. Hull J., White A. Numerical procedure for implementing structural models I: Single-factor
models // J. Derivatives. 1994. V. 2. P. 7–16.
3. Elton E., Green C. Tax and liquidity effects in pricing government bonds // J. Finance. 1998.
V. 53. P. 1533–1562.
4. Green R., Odegaard B. Are there tax effects in the relative pricing of U.S. government
bonds? // J. Finance. 1997. V. 52. P. 609–633.
5. RiskMetrics. http://www.riskmetrics.com
6. Svensson L. Estimating and interpreting forward interest rates: Sweden 1992−1994 // International Monetary Fund: Working Paper WP/94/114. 1994. 53 р.
7. Hu Z. The Yield Curve and Real Activity // International Monetary Fund: Working paper
WP/93/19. 1993. 38 p.
8. McCulloch J. H. Measuring the term structure of interest rates // J. Business. 1971. V. 44.
P. 19–31.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 1. Модель Васичека
111
9. Fisher M., Nychka D., Zervos D. Fitting the term structure of interest rates with smoothing
splines // Federal Reserve Board: Discussion Series, Division of Research and Statistics,
Washington, DC. 1995. 27 р.
10. Hull J. Options, Futures, and other Derivative Securities. Englewood: Prentice Hall, 1993.
492 p.
11. Vasiček O. An equilibrium characterization of the term structure // J. Financial Economics.
1977. V. 5. P. 177–188.
12. Duffie D., Kan R. A yield-factor model of interest rates // Mathematical Finance. 1996. V. 6.
Р. 379–406.
13. Cox J., Ingersoll J., Ross S. Duration and the measurement of basis risk // J. Business. 1979.
V. 52. Р. 51–61.
14. Brown R., Schaefer S. Interest rate volatility and shape of the term structure // Phil. Trans. R.
Soc. Lond. 1994. V. A 347. Р. 563–576.
15. Cox J., Ingersoll J., Ross S. A Theory of the term structure of interest rate // Econometrica.
1985. V. 53. Р. 385–407.
Медведев Геннадий Алексеевич
Белорусский государственный университет
E-mail: MedvedevGA@cosmostv.by
Поступила в редакцию 17 декабря 2012 г.
Medvedev Gennady A. (Belarusian State University). On term structure of yield rates. 1.
Vasiček model.
Keywords: yield interest rates, affine model, yield curve, forward curve, Vasiček model.
The time structure, interesting to experts and researchers, is the nominal yield curve that represents the yields to maturity for nominal bonds (i.e. the bonds that are issued at a face-value and
have the coupons with the same yields). Determination of nominal yield curve is based on observation of the state securities being in circulation just sold at auction and most liquid. These securities in the countries with the developed economy are issued for 10 initial terms to maturity. They
are issued usually at a face-value and to their yield rates are called as yield of nominal bonds.
Determination of time structure of interest rates is reduced to that having only 10 nominal yields
being in circulation directly observed in the market, and using other information contained in the
description of these securities it is necessary to design the function, allowing to calculate yields
for any term to maturity. In the paper properties of such characteristics of time structure of interest rates as yield curve and forward rates in a case when the affine model of yield is used are researched. Unlike known approaches are analyzed not only one-factor, but also multifactor models.
Besides, it is considered not only a range of short and middle terms to maturity of securities, but
also long terms. For multifactor models of affine yields the analytical representations of yield
curves and forward curves are found. In addition instead of time variable it is proposed to use the
risk-free rate durations. It gives the possibility for comparisons of yield curves and forward curves
for every possible entire interval of change of term to maturities of assets.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
УДК 519.872
C.Э. Статкевич, М.А. Маталыцкий
ИССЛЕДОВАНИЕ СЕТИ МАССОВОГО ОБСЛУЖИВАНИЯ
С НЕНАДЕЖНЫМИ СИСТЕМАМИ В ПЕРЕХОДНОМ РЕЖИМЕ
Рассматривается применение метода производящих функций для нахождения зависящих от времени вероятностей состояний открытой сети массового
обслуживания (МО) с ненадежными системами обслуживания (СМО).
Предполагается, что сеть функционирует в условиях высокой нагрузки. Параметры поступления и обслуживания заявок, исправной работы и восстановления неисправных линий зависят от времени. Такая сеть может служить
моделью функционирования беспроводной локальной компьютерной сети
(БЛС). Получены приближенные выражения для определения вероятностей
состояний, среднего числа исправных линий и среднего числа заявок систем
сети в произвольный момент времени. Рассмотрен пример нахождения вероятностей состояний для сети с центральной СМО.
Ключевые слова: производящая функция, ненадежные СМО, вероятности
состояний сети.
Сети МО с ненадежными системами обслуживания описаны в [1], там же приведены формулы для их стационарных вероятностей состояний. В данной работе
проводится исследование таких сетей в переходном режиме, находятся зависящие
от времени характеристики.
Рассмотрим открытую экспоненциальную сеть МО с однотипными заявками,
состоящую из n СМО S1 , S2 ,… , Sn . В сеть поступает простейший поток заявок из
внешней среды (система S0 ) с интенсивностью λ ( t ) . Система Si состоит из mi
идентичных линий обслуживания, время обслуживания заявок в каждой из которых распределено по экспоненциальному закону с параметром μi ( t ) , i = 1, n .
Будем считать, что линии обслуживания системы S0 абсолютно надежны, а в
других системах S1 , S2 ,… , Sn линии обслуживания подвергаются случайным поломкам, причем время исправной работы каждой линии системы Si имеет показательную функцию распределения (ф.р.) с параметром βi ( t ) , i = 1, n . После поломки линия немедленно начинает восстанавливаться и время восстановления
также имеет показательную ф. р. с параметром γ i ( t ) , i = 1, n . Допустим, что времена обслуживания заявок в линиях, длительности исправной работы линий и
времена восстановления линий обслуживания являются независимыми случайными величинами. Под состоянием сети будем понимать вектор
Z ( t ) = ( z , t ) = ( d , k , t ) = ( d1 , d 2 ,… , d n , k1 , k2 ,… , kn , t ) ,
где di − количество исправных линий обслуживания в системе Si , 0 ≤ di ≤ mi ,
ki − число заявок в системе Si в момент времени t , t ∈ [ 0, +∞ ) , i = 1, n . Обозначим через p0 j − вероятность поступления заявки из системы S0 в систему S j ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование сети массового обслуживания с ненадежными системами
n
113
∑ p0 j = 1 ;
pij − вероятность перехода заявки в СМО S j после ее обслуживания в
СМО Si ,
∑ pij = 1 ,
j =1
n
P = pij
j =0
( n +1)×( n +1)
i = 1, n , u ( x ) =
{
1, x > 0
– функция Хэвисайда. Матрица
0, x ≤ 0
является матрицей вероятностей переходов неприводимой мар-
ковской цепи. Будем также предполагать, что если во время обслуживания некоторой заявки линия обслуживания вышла из строя, то после окончания восстановления линии прерванная заявка дообслуживается. На обслуживание заявки выбираются в соответствии с дисциплиной FIFO.
Таким образом, рассматривается случай, когда параметры входящего потока
заявок, обслуживания, длительности исправной работы и длительности восстановления линий обслуживания зависят от времени. То есть на интервале времени
[t , t + ∆t ) в сеть поступает заявка с вероятностью λ ( t ) ∆t + o ( ∆t ) ; если в момент
времени t на обслуживании в линии i-й СМО находится заявка, то на интервале
[t , t + ∆t ) ее обслуживание закончится с вероятностью μi ( t ) ∆t + o ( ∆t ) , i = 1, n ;
кроме того, на интервале времени [t , t + ∆t ) линия обслуживания i-й СМО с вероятностью βi ( t ) ∆t + o ( ∆t ) может выйти из строя либо восстановиться с вероятностью γ i ( t ) ∆t + o ( ∆t ) , i = 1, n .
1. Система уравнений для вероятностей состояний сети
Лемма. Вероятности состояний рассматриваемой сети удовлетворяют системе
разностно-дифференциальных уравнений (РДУ):
n
dP ( d , k , t )
⎡
⎤
= − ⎢λ ( t ) + ∑ [μi ( t ) min ( di , ki ) + βi ( t ) di + γ i ( t )( mi − di )]⎥ P ( d , k , t ) +
dt
⎣
⎦
i =1
n
n
+λ ( t ) ∑ p0i u ( ki ) P ( d , k − I i , t ) + ∑ μi ( t ) min ( di , ki + 1) pi 0 P ( d , k + I i , t ) +
i =1
i =1
n
+ ∑ μi ( t ) min ( di , ki + 1) pij u ( k j ) P ( d , k + I i − I j , t ) +
i , j =1
n
n
i =1
i =1
+ ∑ γ i ( t )( mi − di + 1) u ( di ) P ( d − I i , k , t ) + ∑ βi ( t )( di + 1)P ( d + I i , k , t ) .
(1)
Доказательство. В силу экспоненциальности времен обслуживания заявок,
исправной работы линий обслуживания и восстановления неисправных линий
случайный процесс Z ( t ) = ( d , k , t ) является цепью Маркова с непрерывным временем и счетным числом состояний. Возможны следующие переходы в состояние
( d , k , t + ∆t ) за время ∆t :
• из состояния ( d , k , t ) с вероятностью
n
⎡
⎤
1 − ⎢ λ ( t ) + ∑ ⎡⎣μ j ( t ) min ( d j , k j ) + β j ( t ) d j + γ j ( t ) ( m j − d j ) ⎤⎦ ⎥ ∆t + o ( t ) ;
⎢⎣
⎥⎦
j =1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
C.Э. Статкевич, М.А. Маталыцкий
114
• из состояния ( d , k − I i , t ) с вероятностью
⎡
⎧
n
⎢
⎣
⎩⎪
j =1
j ≠i
[ λ ( t ) p0i u ( ki ) ∆t + o ( ∆t )] ⎢1 − ⎪⎨λ ( t ) ∑ p0 j +
n
⎫
⎤
+ ∑ ⎣⎡μ j ( t ) min ( d j , k j ) + β j ( t ) d j + γ j ( t ) ( m j − d j ) ⎦⎤ ⎪ ∆t + o ( ∆t ) ⎥ , i = 1, n ;
⎬
j =1
⎥
⎪⎭
j ≠i
⎦
• из состояния ( d , k + I i , t ) с вероятностью
⎡
⎧⎪
n
⎢⎣
⎩⎪
j =1
[μi ( t ) pi 0 min ( di , ki + 1) ∆t + o ( ∆t )] ⎢1 − ⎨λ ( t ) + ∑ ⎡⎣μ j ( t ) min ( d j , k j ) +
⎫
⎤
+β j ( t ) d j + γ j ( t ) ( m j − d j ) ⎤⎦ ⎬ ∆t + o ( ∆t ) ⎥ , i = 1, n ;
⎭
⎦
(
• из состояния d , k + I i − I j , t
)
с вероятностью
n
⎡ ⎧
⎡⎣μi (t ) pij min (di , ki +1)u (k j ) ∆t + o (∆t )⎤⎦ ⎢1− ⎪λ (t ) + ∑[μ r (t ) min (d r , kr ) +βr (t ) d r +
⎨
r =1
⎢ ⎪
r≠ j
⎣ ⎩
⎤
⎫
⎤
+γ r (t )(mr − d r )⎥ +μ j (t ) min (d j , k j −1) +β j (t ) d j +γ j (t )(m j − d j )⎬ ∆t + o (∆t )⎥ , i, j =1, n ;
⎦
⎭
⎦
• из состояния ( d − I i , k , t ) с вероятностью
[ γ i ( t )( mi − di + 1) u ( di ) ∆t + o ( ∆t )] ×
n
⎡ ⎧⎪
⎫⎪
⎤
× ⎢1 − ⎨λ (t ) + ∑ ⎡⎣μ j (t ) min ( d j , k j ) + β j (t ) d j + γ j (t )( m j − d j )⎤⎦ ⎬ ∆t + o ( ∆t )⎥ , i = 1, n ;
⎢⎣ ⎩⎪
j =1
⎭⎪
⎦⎥
• из состояния ( d + I i , k , t ) с вероятностью
[βi ( t )( di + 1) ∆t + o ( ∆t )] ×
n
⎡ ⎧⎪
⎫⎪
⎤
× ⎢1 − ⎨λ (t ) + ∑ ⎡⎣μ j (t ) min ( d j , k j ) + β j (t ) d j + γ j (t )( m j − d j )⎤⎦ ⎬ ∆t + o ( ∆t )⎥ , i = 1, n ;
⎢⎣ ⎩⎪
j =1
⎭⎪
⎦⎥
• из остальных состояний – с вероятностью o ( ∆t ) , например из состояния
( d + Ii − I j , k , t )
с вероятностью
⎡
⎧
⎣
⎩
[βi ( t )( di + 1) ∆t + o ( ∆t )] ⎡⎣ γ j ( t ) ( m j − d j + 1) u ( d j ) ∆t + o ( ∆t ) ⎤⎦ ⎢1 − ⎨λ ( t ) +
n
n
r =1
r =1
r ≠i
+ ∑ μ r ( t ) min ( d r , kr ) + ∑ [βr ( t ) d r +
⎫
⎤
+ γ r ( t )( mr − d r )]⎬ ∆t + o ( ∆t ) ⎥ = o ( ∆t ) , i, j = 1, n , i ≠ j .
⎭
⎦
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование сети массового обслуживания с ненадежными системами
115
Тогда, используя формулу полной вероятности, можно записать
P ( d , k , t + ∆t ) =
n
⎧ ⎡
⎤ ⎫
= ⎨1 − ⎢λ ( t ) + ∑ [μi ( t ) min ( di , ki ) + βi ( t ) di + γ i ( t )( mi − di )]⎥ ∆t ⎬ P ( d , k , t ) +
⎩ ⎣
⎦ ⎭
i =1
n
n
+λ ( t ) ∑ p0i u ( ki ) P ( d , k − I i , t )∆t + ∑ μi ( t ) min ( di , ki + 1) pi 0 P ( d , k + I i , t ) ∆t +
i =1
i =1
n
+ ∑ μi ( t ) min ( di , ki + 1) u ( k j ) pij P ( d , k + I i − I j , t )∆t +
i , j =1
n
+ ∑ γ i ( t )( mi − di + 1) u ( di ) P ( d − I i , k , t ) ∆t +
i =1
n
+ ∑ βi ( t )( di + 1)P ( d + I i , k , t ) ∆t + o ( ∆t ) .
i =1
Разделив обе части полученного соотношения на ∆t и переходя к пределу при
∆t → 0 , получим систему уравнений (1). Лемма доказана.
2. Нахождение вероятностей состояний с помощью метода
производящих функций
Обозначим через Ψ 2 n ( z , t ) , где z = ( z1 , z2 ,… , zn , zn +1 ,… , z2 n ) , 2n-мерную производящую функцию
Ψ 2n ( z, t ) =
mn
m1
∞
∞
∑ … ∑ ∑ … ∑ P ( d1 ,… , d n , k1 ,…, kn , t ) z1d ·…·znd
1
d1 = 0
=
d n = 0 k1 = 0
m1
kn = 0
mn
∞
∞
n
kn = 0
i =1
∑ … ∑ ∑ … ∑ P ( d , k , t ) ∏ zid znk+i ,
i
d1 = 0
n
d n = 0 k1 = 0
i
k
znk1+1 ⋅… ⋅ z2nn =
z <1.
(2)
Предположим, что все системы сети функционируют в режиме высокой нагрузки
[2], т.е. ki ( t ) > di ( t ) ∀t > 0 , i = 1, n . Тогда система (1) принимает вид
n
dP ( d , k , t )
⎡
⎤
= − ⎢λ ( t ) + ∑ [( μi ( t ) + βi ( t ) − γ i ( t ) ) di + γ i ( t ) mi ]⎥ P ( d , k , t ) +
dt
⎣
⎦
i =1
n
n
i =1
i =1
+λ ( t ) ∑ p0i P ( d , k − I i , t ) + ∑ μi ( t ) di pi 0 P ( d , k + I i , t ) +
n
n
i , j =1
i =1
+ ∑ μi ( t ) di pij P ( d , k + I i − I j , t ) + ∑ γ i ( t )( mi − di + 1) u ( di ) P ( d − I i , k , t ) +
n
+ ∑ βi ( t )( di + 1)P ( d + I i , k , t ) ,
(3)
i =1
количество уравнений в которой счетно в случае открытой сети и конечно в случае замкнутой.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
C.Э. Статкевич, М.А. Маталыцкий
116
Теорема 1. Производящая функция Ψ 2 n ( z , t ) удовлетворяет дифференциальному уравнению (ДУ) в частных производных:
n
∂Ψ 2 n ( z , t )
⎡
⎛
⎞ n
⎤
= − ⎢λ ( t ) ⎜ 1 − ∑ p0i zn + i ⎟ + ∑ γ i ( t ) mi (1 − zi ) ⎥ Ψ 2 n ( z , t ) −
∂t
⎣
⎝ i =1
⎠ i =1
⎦
n
β ( t ) ⎤ ∂Ψ 2 n ( z , t )
p
⎡
− ∑ ⎢ ( μ i ( t ) + βi ( t ) ) z i − μ i ( t ) i 0 − i
+
zn + i
zi ⎥⎦
∂zi
i =1 ⎣
zn + j ∂Ψ 2 n ( z , t )
.
zn + i
∂zi
n
+ ∑ μi ( t ) pij
i , j =1
(4)
n
∏ zld zlk
Доказательство. Умножим каждое из уравнений системы (3) на
l
l
и
l =1
просуммируем по всем возможным значениям dl от 0 до ml и по kl от 1 до +∞ ,
l = 1, n . Здесь суммирование по всем kl берется от 1, так как все слагаемые в (2),
для которых в состоянии сети Z ( t ) встречаются компоненты kl = 0 , в силу предположения о функционировании в режиме высокой нагрузки равны нулю, поскольку, например, P ( d , k1 , …, kl −1 , 0, kl +1 , …, kn , t ) = 0 , l = 2, n . Тогда получим
m1
mn
dP ( d , k , t ) n dl kl
∏ zl zn+l =
dt
kn =1
l =1
∞
∞
∑ … ∑ ∑… ∑
d1 = 0
d n = 0 k1 =1
n
⎡
⎤
= − ⎢λ ( t ) + ∑ [( μi ( t ) + βi ( t ) − γ i ( t ) ) di + γ i ( t ) mi ]⎥ ×
⎣
⎦
i =1
m1
×∑…
d1 = 0
n
+λ ( t ) ∑ p0i u ( ki )
i =1
n
+ ∑ μi ( t ) di pi 0
i =1
mn
∞
∞
n
kn =1
l =1
∑ ∑ … ∑ P ( d , k , t ) ∏ zld znk+l +
l
d n = 0 k1 =1
mn
m1
∞
l
∞
n
kn =1
l =1
∑ … ∑ ∑ … ∑ P ( d , k − Ii , t ) ∏ zld znk+l +
l
d1 = 0
d n = 0 k1 =1
mn
m1
∞
∞
n
kn =1
l =1
l
∑ … ∑ ∑ … ∑ P ( d , k + Ii , t ) ∏ zld znk+l +
l
d1 = 0
n
m1
i , j =1
d1 = 0
d n = 0 k1 =1
+ ∑ μi ( t ) di pij u ( k j ) ∑ …
mn
∞
l
∞
n
kn =1
l =1
∑ ∑ … ∑ P ( d , k + Ii − I j , t ) ∏ zld znk+l +
l
d n = 0 k1 =1
n
m1
i =1
d1 = 0
n
m1
i =1
d1 = 0
+ ∑ γ i ( t )( mi − di + 1) u ( di ) ∑ …
mn
∞
∞
n
kn =1
l =1
l
∑ ∑ … ∑ P ( d − Ii , k , t ) ∏ zld znk+l +
l
d n = 0 k1 =1
+ ∑ βi ( t )( di + 1) u ( mi − di ) ∑ …
mn
∞
∞
n
kn =1
l =1
l
∑ ∑ … ∑ P ( d + Ii , k , t ) ∏ zld znk+l .
l
d n = 0 k1 =1
l
(5)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование сети массового обслуживания с ненадежными системами
117
Рассмотрим суммы, входящие в соотношение (5). Пусть
n
⎡
⎤
∑1 ( z, t ) = − ⎢λ ( t ) + ∑ [( μi ( t ) + βi ( t ) − γ i ( t ) ) di + γ i ( t ) mi ]⎥ ×
⎣
⎦
i =1
m1
×∑…
d1 = 0
mn
∞
∞
n
kn =1
l =1
∑ ∑ … ∑ P ( d , k , t ) ∏ zld znk+l .
l
d n = 0 k1 =1
l
Тогда
⎡
n
⎣
i =1
mn
m1
⎤
∞
∑1 ( z, t ) = − ⎢λ ( t ) + ∑ γ i ( t ) mi ⎥ ∑ … ∑
⎦ d1 =0
n
− ∑ ( μ i ( t ) + βi ( t ) − γ i ( t ) ) d i
i =1
∞
d n = 0 k1 =1
mn
m1
n
∑ … ∑ P ( d , k , t ) ∏ zl l znl+l −
kn =1
∞
d
k
l =1
∞
n
kn =1
l =1
∑ … ∑ ∑ … ∑ P ( d , k , t ) ∏ zld znk+l =
l
d1 = 0
d n = 0 k1 =1
l
n
n
∂Ψ 2 n ( z , t )
⎡
⎤
= − ⎢λ ( t ) + ∑ γ i ( t ) mi ⎥ Ψ 2 n ( z , t ) − ∑ ( μi ( t ) + βi ( t ) − γ i ( t ) ) zi
.
∂zi
⎣
⎦
i =1
i =1
Для суммы
mn
n
m1
i =1
d1 = 0
∞
∞
n
kn =1
l =1
∑ 2 ( z, t ) = λ ( t ) ∑ p0i u ( ki ) ∑ … ∑ ∑ … ∑ P ( d , k − Ii , t ) ∏ zld znk+l
l
d n = 0 k1 =1
l
имеем
n
n
m1
mn
i =1
d1 = 0
dn =0
∞
l
∞
∑ 2 ( z, t ) = λ ( t ) ∑ p0i zn +i ∑ … ∑ ∑ ∑ P ( d , k − Ii , t )
n
= λ ( t ) ∑ p0i zn + i
i =1
mn
m1
∞
d1 = 0
l
l =1
=
zn + i
k j =1 ki =1
j =1, n , j ≠ i
n
∑… ∑ ∑
∏ zld znk+l
n
P ( d , k , t ) ∏ zl l znl+ l = λ ( t ) ∑ p0i zn + i Ψ 2 n ( z , t ) .
d n = 0 k j =1
j =1, n
d
k
i =1
l =1
Сумма
mn
n
m1
i =1
d1 = 0
∑ 3 ( z, t ) = ∑ μi ( t ) di pi 0 ∑ … ∑
∞
∞
n
kn =1
l =1
∑ … ∑ P ( d , k + Ii , t ) ∏ zld znk+l
l
d n = 0 k1 =1
l
имеет вид
n
mn
m1
p
∞
∞
n
kn =1
l =1
∑ 3 ( z, t ) = ∑ μi ( t ) di z i 0 ∑ … ∑ ∑ … ∑ P ( d , k + Ii , t ) ∏ zld znk+l zn +i =
l
n + i d1 = 0
i =1
n
= ∑ μi ( t )
i =1
pi 0
zn + i
m1
∑…
d1 = 0
d n = 0 k1 =1
mn
∞
∞
l
n
∑ ∑ … ∑ di P ( d , k , t ) ∏ zld znk+l −
l
d n = 0 k1 =1
kn =1
l
l =1
n
n
p
−∑ μi ( t ) i 0
z
n +i
i =1
m1
mn
∞
d1 = 0
dn =0
k j =1
j =1, n , j ≠ i
∑… ∑ ∑
∏ zld znk+l
l
di P ( d , k1 , …, ki −1 , 0, ki +1 , …, kn , t )
l =1
k
zni+ i
l
=
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
C.Э. Статкевич, М.А. Маталыцкий
118
pi 0 ∂Ψ 2 n ( z , t )
−
zn + i
∂zi
n
= ∑ μi ( t )
i =1
n
p
−∑ μi ( t ) i 0
zn + i
i =1
∏ zld znk+l
l
m1
mn
∞
d1 = 0
dn =0
k j =1
j =1, n , j ≠ i
n
∑… ∑ ∑
di P ( d , k1 , …, ki −1 , 0, ki +1 , …, kn , t )
n
= ∑ μi ( t )
i =1
l
l =1
k
zni+ i
=
pi 0 ∂Ψ 2 n ( z , t )
.
zn + i
∂zi
Сумма
mn
m1
n
∞
∞
n
∑ 4 ( z, t ) = ∑ μi ( t ) di pij u ( k j ) ∑ … ∑ ∑ … ∑ P ( d , k + Ii − I j , t ) ∏ zld znk+l :
l
i , j =1
d1 = 0
n
∑ 4 ( z, t ) = ∑ μi ( t ) di pij
i , j =1
=
zn + j
zn + i
m1
d1 = 0
n
d1 = 0
mn
∞
dn =0
k j =1
j =1, n , j ≠ i
∞
kn =1
l =1
∞
n
d n = 0 k1 =1
kn =1
l
=
n+ j
l =1
n
zn + j ∂Ψ 2 n ( z , t )
zn + j
− ∑ μi ( t ) pij
×
∂zi
zn + i
zn + i
i , j =1
n
di P ( d , k1 , …, ki −1 , 0, ki +1 , …, kn , t )∏ zl l znl+ l ⋅
d
k
l =1
=
z
∑ … ∑ ∑ … ∑ P ( d , k + Ii − I j , t )∏ zld znk+l ⋅ z n +i
∑ μi ( t ) pij
∑ ∑
d n = 0 k1 =1
l
i , j =1
×∑…
mn
m1
l
n
∑ μi ( t ) pij
i , j =1
zn + i
=
zn + j
zn + j ∂Ψ 2 n ( z , t )
.
∂zi
zn + i
Для суммы
mn
m1
n
∑ 5 ( z, t ) = ∑ γi ( t )( mi − di + 1) u ( di ) ∑ … ∑
i =1
d1 = 0
∞
∞
n
∑ … ∑ P ( d − Ii , k , t ) ∏ zld znk+l
l
d n = 0 k1 =1
kn =1
l
l =1
справедливо соотношение
∑ 5 ( z, t ) =
mn ∞
n
∞
n
⎡n
⎤ m1
d k
= ⎢ ∑ γ i ( t ) mi − ∑ γ i ( t ) u ( di )( di − 1) ⎥ ∑ … ∑ ∑ … ∑ P ( d − I i , k , t ) ∏ zl l znl+ l =
⎣ i =1
⎦ d1 =0 d n = 0 k1 =1 kn =1
i =1
l =1
n
mn
m1
n
∞
⎡
⎤
= ⎢ ∑ γ i ( t ) ( mi − u ( di )( di − 1) ) ⎥ zi ∑ … ∑ ∑ … ∑ P ( d − I i , k , t )
⎣ i =1
⎦ d1 = 0 dn =0 k1 =1 kn =1
⎡n
⎤
= ⎢ ∑ γ i ( t )( mi − di ) ⎥ zi
⎣ i =1
⎦
mj
mi −1 ∞
∑ ∑
∏ zld znk+l
l
∞
∞
n
kn =1
l =1
l =1
zi
∑ … ∑ P ( d , k , t ) ∏ zl l znl+l =
d j = 0 di = 0 k1 =1
j =1, n j ≠ i
d
k
l
=
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование сети массового обслуживания с ненадежными системами
119
mn ∞
n
∞
⎡n
⎤ m1
d k
= ⎢ ∑ γ i ( t )( mi − di ) ⎥ zi ∑ … ∑ ∑ … ∑ P ( d , k , t ) ∏ zl l znl+ l −
⎣ i =1
⎦ d1 =0 d n =0 k1 =1 kn =1
l =1
⎡n
⎤
− ⎢ ∑ γ i ( t )( mi − mi ) ⎥ zi
⎣ i =1
⎦
mj
∞
∞
n
kn =1
l =1
∑ ∑ … ∑ P ( d1 ,…, di −1 , mi , di +i ,…, d n , k , t ) ∏ zld znk+l =
l
d j = 0 k1 =1
j =1, n j ≠ i
n
n
i =1
i =1
= ∑ γ i ( t ) mi zi Ψ 2 n ( z , t ) − ∑ γ i ( t ) zi
l
∂Ψ 2 n ( z , t )
.
∂zi
И, наконец, для последней суммы
mn
n
m1
i =1
d1 = 0
∑ 6 ( z, t ) = ∑ βi ( t )( di + 1) ∑ … ∑
∞
∞
n
kn =1
l =1
∑ … ∑ P ( d + Ii , k , t ) ∏ zl l znl+l
d n = 0 k1 =1
d
k
будем иметь
mn ∞
n
∞
βi ( t ) m1
d k
… ∑ ∑ … ∑ ( di + 1) P ( d + I i , k , t ) ∏ zl l znl+ l zi =
∑
z
i d1 = 0
i =1
d n = 0 k1 =1
kn =1
l =1
n
∑ 6 ( z, t ) = ∑
βi ( t )
i =1 zi
n
=∑
mj
mi
∞
∞
n
kn =1
l =1
∑ ∑ ∑ … ∑ di P ( d , k , t ) ∏ zld znk+l zi =
l
d j = 0 di =1 k1 =1
j =1, n , j ≠ i
l
mn ∞
n
∞
n
βi ( t ) m1
β ( t ) ∂Ψ 2 n ( z , t )
d k
.
… ∑ ∑ … ∑ di P ( d , k , t ) ∏ zl l znl+ l = ∑ i
∑
z
∂zi
i d1 = 0
i =1
d n = 0 k1 =1
kn =1
i =1 zi
l =1
n
=∑
Таким образом, учитывая вид производящей функции (2), получаем уравнение
в частных производных первого порядка (4). Теорема доказана.
Далее рассмотрим случай, когда
mi = 1 , ki ( t ) > 0 ∀t , i = 1, n .
(6)
При этом число исправных линий обслуживания в системе Si может быть равным
0 или 1. Если состоянием сети ( d , k , t ) является ( d1 ,…, di −1 , 0, di +1 ,…, d n , k , t ) , то
справедлива система уравнений
n
dP ( d , k , t )
⎡
⎤
= − ⎢ λ ( t ) + ∑ [ μ i ( t ) + βi ( t ) + γ i ( t ) ] ⎥ P ( d , k , t ) +
dt
⎣
⎦
i =1
n
n
i =1
i =1
+λ ( t ) ∑ p0i P ( d , k − I i , t ) + ∑ μi ( t ) pi 0 P ( d , k + I i , t ) +
n
n
i , j =1
i =1
+ ∑ μi ( t ) pij P ( d , k + I i − I j , t ) + ∑ βi ( t ) P ( d1 ,…, di −1 ,1, di + i ,…, d n , k , t ) ,
а если ( d1 , …, di −1 ,1, di +1 , …, d n , k , t ) , то
n
dP ( d , k , t )
⎡
⎤
= − ⎢ λ ( t ) + ∑ [ μ i ( t ) + βi ( t ) + γ i ( t ) ] ⎥ P ( d , k , t ) +
dt
⎣
⎦
i =1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
C.Э. Статкевич, М.А. Маталыцкий
120
n
n
+λ ( t ) ∑ p0i P ( d , k − I i , t ) + ∑ μi ( t ) pi 0 P ( d , k + I i , t ) +
i =1
i =1
n
n
i , j =1
i =1
+ ∑ μi ( t ) pij P ( d , k + I i − I j , t ) + ∑ γ i ( t )P ( d1 ,…, di −1 , 0, di + i ,…, d n , k , t ) .
Их можно объединить в одну систему
n
dP ( d , k , t )
⎡
⎤
= − ⎢ λ ( t ) + ∑ [ μ i ( t ) + βi ( t ) + γ i ( t ) ] ⎥ P ( d , k , t ) +
dt
⎣
⎦
i =1
n
n
+λ ( t ) ∑ p0i P ( d , k − I i , t ) + ∑ μi ( t ) pi 0 P ( d , k + I i , t ) +
i =1
i =1
n
n
i , j =1
i =1
+ ∑ μi ( t ) pij P ( d , k + I i − I j , t ) + ∑ γ i ( t ) u ( di )P ( d1 ,…, di −1 , 0, di + i ,…, d n , k , t ) +
n
+ ∑ βi ( t ) (1 − u ( di ) ) P ( d1 , …, di −1 ,1, di + i , …, d n , k , t ) .
(7)
i =1
Пусть
Λ ( t ) = ∫ λ ( t ) dt , Μ i ( t ) = ∫ μi ( t ) dt ,
Βi ( t ) = ∫ βi ( t ) dt , G i ( t ) = ∫ γ i ( t ) dt .
(8)
Из последней теоремы вытекает следующее утверждение.
Теорема 2. Если в начальный момент времени сеть МО находится в состоянии
( α1 , α 2 ,…, α 2n , 0 ) , αi ≥ 0 , α n +i > 0 , i = 1, n , то производящая функция (2) имеет
вид
n
p ⎫
⎧
⎫
⎧n
Ψ 2 n ( z , t ) = a0 ( t ) exp ⎨( Λ ( t ) − Λ ( 0 ) ) ∑ p0i zn + i ⎬ exp ⎨∑ ( Μ i ( t ) − Μ i ( 0 ) ) i 0 ⎬ ×
zn + i ⎭
⎩
⎭
⎩ i =1
i =1
zn + j ⎫⎪
⎧⎪ n
⎧n
⎫
exp
× exp ⎨ ∑ ( Μ i ( t ) − Μ i ( 0 ) ) pij
⎬
⎨∑ ( G i ( t ) − G i ( 0 ) ) (1 − u ( di ) ) zi ⎬ ×
zn + i ⎭⎪
⎩ i =1
⎭
⎩⎪i , j =1
⎧n
1 ⎫ 2n α
× exp ⎨∑ ( Βi ( t ) − Βi ( 0 ) ) u ( di ) ⎬ ∏ zl l ,
zi ⎭ l =1
⎩ i =1
где
(9)
⎧
a0 ( t ) = exp ⎨− ( Λ ( t ) − Λ ( 0 ) ) −
⎩
n
⎫
(10)
− ∑ [ ( Μ i ( t ) − Μ i ( 0 ) ) + ( Βi ( t ) − Βi ( 0 ) ) + ( G i ( t ) − G i ( 0 ) ) ]⎬ .
⎭
i =1
Преобразуем (9) к виду, удобному для нахождения вероятностей состояний сети, разложив входящие в него экспоненты в ряд Маклорена. Тогда будет справедливо следующее утверждение:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование сети массового обслуживания с ненадежными системами
121
Теорема 3. Выражение для производящей функции (9) можно представить в
виде
n
Ψ 2 n ( z , t ) = a0 ( t )
∞
∞
∞
∞
∞
∞
∞
∞
∞
∞
∑ … ∑ ∑ … ∑ ∑ … ∑ ∑ … ∑ ∑ … ∑ ( Λ (t ) − Λ ( 0))
g1 = 0
g n = 0 q1 = 0
qn = 0 l1 = 0
ln = 0 r1 = 0
rn = 0 h1 = 0
∑ li
i =1
×
hn = 0
h
⎡
n
⎞i
li ri ⎛
⎢p p ⎜
p ⎟
n ⎢ 0i i 0 ⎜ ∏ ij ⎟
j =1
⎝
⎠ Μ t − Μ 0 ri + hi G t − G 0 1 − u d qi ×
×∏ ⎢
( i ) )]
[ i ( ) i ( )] [( i ( ) i ( ) ) (
!
!
!
!
l
r
h
q
g
⎣
i i i i
i!
i =1
× [ ( Βi ( t ) − Β i ( 0 ) ) u ( d i ) ]
gi
⎤
⎥
α + q − g α +l −r −h + H
zi i i i zn +ni+ i i i i ⎥⎦ ,
(11)
n
где H = ∑ hi .
i =1
Пример 1. Рассмотрим модель БЛС, изображенную на рис. 1. Системы
S1 , S2 ,… , Sn −1 соответствуют терминалам (периферийным компьютерам), система
Sn − локальному серверу. Напомним, что БЛС часто функционируют в условиях
высокой нагрузки [2]. Запросы (пакеты, заявки) могут поступать на сервер не
только из терминалов, но и из внешней среды через базовую станцию.
Рис.1. Модель локальной сети
Выражение (11) в этом случае принимает вид
n
Ψ 2 n ( z , t ) = a0 ( t )
∞
∞
∞
∞
∞
∞
∞
∞
∞
∞
∑ … ∑ ∑ … ∑ ∑ … ∑ ∑ … ∑ ∑ … ∑ ( Λ (t ) − Λ ( 0))
g1 = 0
g n = 0 q1 = 0
qn = 0 l1 = 0
ln = 0 r1 = 0
rn = 0 h1 = 0
∑ li
i =1
×
hn = 0
l
r
n −1
n ⎡
p0ii pi 0i
h
h
×∏ p jnj pnjn ∏ ⎢
[ Μ i ( t ) − Μ i ( 0 )]ri + hi [( G i ( t ) − G i ( 0 ) ) (1 − u ( di ) )]qi ×
l
r
h
q
g
!
!
!
!
!
j =1
i =1 ⎢
⎣i i i i i
g
αi + qi − gi α n + i + li − ri − hi + H
zn + i
× [( Βi ( t ) − Βi ( 0 ) ) u ( di )] i zi
⎤
⎥.
⎥⎦
(12)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
C.Э. Статкевич, М.А. Маталыцкий
122
Пусть, например,
λ ( t ) = λ cos ( at + ω ) + b , μi ( t ) = μi sin ( ai t + ωi ) + ci ,
βi ( t ) = βi sin ( θi t + ν i ) + ρi , γ i ( t ) = γ i cos ( ηi t + δi ) + ei , i = 1, 2 ,
тогда
Λ (t ) =
λ sin ( at + ω)
λ sin ω
+ bt , Λ ( 0 ) =
,
a
a
Μ i ( t ) = −μi
cos ( ai t + ωi )
cos ωi
+ ci t , Μ i ( 0 ) = −μi
,
ai
ai
Βi ( t ) = −βi
cos ( θi t + ν i )
cos ν i
+ ρi t , Βi ( 0 ) = −βi
,
θi
θi
G i ( t ) = −γ i
cos ( ηi t + δi )
cos δi
+ ei t , G i ( 0 ) = − γ i
, i = 1, n ,
ηi
ηi
λ sin ( at + ω) λ sin ω ⎞
⎧ ⎛
a0 ( t ) = exp ⎨− ⎜ bt +
−
⎟−
a
a ⎠
⎩ ⎝
n
cos ( ai t + ωi )
cos ωi
⎡⎛
−∑ ⎢⎜ ci t − μi
+ μi
a
ai
i
i =1 ⎣⎝
⎞
⎟+
⎠
cos ( ηi t + δi )
cos ( θi t + νi )
cos δi ⎞ ⎛
cos νi ⎞⎤⎫
⎛
+ ⎜ ei t − γ i
+ γi
+ βi
⎟ + ⎜ ρi t − β i
⎟ ⎬.
η
η
θ
θi ⎠⎦⎥ ⎭
⎝
i
i ⎠ ⎝
i
Из (12) получаем
Ψ 2 n ( z , t ) = a0 ( t ) ×
n
∑ li
λ sin ( at + ω) λ sin ω ⎞i =1
⎛
−
× ∑ … ∑ ∑ … ∑ ∑ … ∑ ∑ … ∑ ∑ … ∑ ⎜ bt +
⎟ ×
a
a ⎠
g1 = 0 g n = 0 q1 = 0 qn = 0 l1 = 0 ln = 0 r1 = 0
rn = 0 h1 = 0 hn = 0 ⎝
∞
∞
∞
∞
∞
∞
∞
∞
∞
∞
r +h
l
r
n −1
n ⎡
p0ii pi 0i
cos ( ai t + ci )
cos ωi ⎤ i i
⎡
h
h
c
t
×∏ p jnj pnjn ∏ ⎢
−
μ
+
μ
×
i
i
⎢ i
ai
ai ⎥⎦
⎢ li !ri !hi !qi ! gi ! ⎣
j =1
i =1 ⎣
cos ( ηi t + δi )
cos δi
⎡⎛
× ⎢⎜ ei t − γ i
+ γi
ηi
ηi
⎣⎝
cos ( θi t + νi )
cos νi ⎞
⎡⎛
⎤
× ⎢⎜ ρi t − βi
+ βi
⎟ u ( di ) ⎥
θi
θi ⎠
⎣⎝
⎦
q
⎞
⎤i
1
u
d
−
(
(
)
)
⎟
i ⎥ ×
⎠
⎦
gi
αi + qi − gi α n + i + li − ri − hi + H
zn + i
zi
⎤
⎥.
⎥⎦
Вероятность состояния P ( d1 …, d n , k1 , …, kn , t ) является коэффициентом при
z1d1 ·…· zn d n zn +1k1 ·…· z2 n kn
в разложении функции Ψ 2 n ( z , t ) в многократный ряд
(12), при условии, что в начальный момент времени сеть находится в состоянии
( α1 , α 2 ,…, α 2n , 0 ) .
Положим, что n = 4 , λ = 15 , a = 1 , ω = 0.5 , b = 2 , μ1 = μ3 = 5 , μ 2 = μ 4 = 3 ,
a1 = 1 , a2 = 5 , a3 = a4 = 2 , ω1 = 5 , ω2 = ω3 = ω4 = 0.5 , c1 = c2 = c3 = c4 = 8 ,
β1 = 3.5 , β2 = 0.9 , β3 = β4 = 0.4 , θ1 = θ2 = θ3 = θ4 = 1 , ν1 = ν 2 = ν3 = ν 4 = 1 ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование сети массового обслуживания с ненадежными системами
ρ1 = ρ2 = ρ3 = ρ4 = 0 ,
γ1 = 4 ,
γ 2 = γ3 = γ 4 = 1 ,
123
η1 = η2 = η3 = η4 = 2 ,
δ1 = δ2 = δ3 = δ 4 = 1 , e1 = e2 = e3 = e4 = 0.5 , p0i = 1 4 , i = 1, 4 , pi 0 = 2 5 , i = 1,3 ,
p40 = 1 2 , p4i = 1 6 , i = 1,3 , pi 4 = 3 5 , i = 1,3 , pii = 0 , i = 0, 4 . На рис. 2 изображен график вероятности состояния P (1, 0, 0, 0, 2, 4,3,3, t ) при условии, что в начальный момент времени сеть находилась в состоянии (1,1,1,1, 4,5,5, 4 ) .
Рис. 2. График вероятности состояния P (1,0,0,0, 2, 4,3,3, t )
3. Нахождение средних характеристик
Математическое ожидание с-й компоненты многомерной случайной величины
можно найти, продифференцировав выражение для производящей функции по zc
и положив zi = 1 , i = 1, 2n . Тогда среднее число исправных линий в системе Sc
может быть найдено по формуле
dc ( t ) =
= a0 ( t )
∞
∞
∞
∞
∂Ψ 2 n ( z , t )
∂zc
∞
∞
∞
=
z =(1,1,…,1)
∞
∞
∞
∑ … ∑ ∑ … ∑ ∑ … ∑ ∑ … ∑ ∑ … ∑ ( ac + qc − gc ) ×
g1 = 0
g n = 0 q1 = 0
n
qn = 0 l1 = 0
× ( Λ ( t ) − Λ ( 0 ) )i∑=1 i
l
ln = 0 r1 = 0
rn = 0 h1 = 0
hn = 0
h
⎡
⎛ n
⎞i
⎢ p0lii pir0i ⎜ ∏ pij ⎟
⎜
⎟
n ⎢
j =1
r +h
∏ ⎢⎣ l !r !⎝h !q ! g !⎠ [Μ i ( t ) − Μ i ( 0 )] i i ×
i i i
i =1
qi
× [( G i ( t ) − G i ( 0 ) ) (1 − u ( ai + qi − gi ) )]
[( Βi ( t ) − Βi ( 0 ) ) u ( ai + qi − gi )]
gi
⎤
⎥
⎦ , c = 1, n ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
C.Э. Статкевич, М.А. Маталыцкий
124
а среднее число заявок в системе Sc имеет вид
= a0 ( t )
∞
∞
∑…∑
g1 = 0
∞
Nc ( t ) =
∂Ψ 2 n ( z , t )
∂zn + c
∞
∞
∑…∑
g n = 0 q1 = 0
∞
∑…∑
qn = 0 l1 = 0
n
× ( Λ ( t ) − Λ ( 0 ) )i∑=1 i
l
∞
∞
=
z = (1,1,…,1)
∑… ∑
ln = 0 r1 = 0
∞
∞
∑ … ∑ ( an+c + lc − rc − hc + H ) ×
rn = 0 h1 = 0
⎡
⎛ n
⎞
⎢ p0lii pir0i ⎜ ∏ pij ⎟
⎜
⎟
n ⎢
j =1
∏ ⎢⎣ l !r !⎝h !q ! g !⎠
i i i
i =1
qi
× [( G i ( t ) − G i ( 0 ) ) (1 − u ( ai + qi − gi ) )]
hn = 0
hi
[Μ i ( t ) − Μ i ( 0 )]ri + hi ×
[( Βi ( t ) − Βi ( 0 ) ) u ( ai + qi − gi )]
gi
⎤
⎥
⎦,
c = 1, n .
(13)
Сделав в выражении (13) замену переменных kc = α n + c + lc − rc − hc + H , т.е.
lc = kc − α n + c + rc + hc − H , с учетом того, что системы сети функционируют в условиях высокой нагрузки, получим
N c ( t ) = a0 ( t )
∞
∞
∑…∑
g1 = 0
∞
∞
∑…∑
g n = 0 q1 = 0
∞
∞
∞
∞ α n +1 − h1 + H −1
∑ … ∑ kc ∑ … ∑
qn = 0 k1 = 0
kn = 0
h1 = 0
hn = 0
∑
r1 = 0
α 2 n − hn + H −1
…
∑
×
rn = 0
h
⎡
⎛ n
⎞i
⎢ ( ( Λ ( t ) − Λ ( 0 ) ) p0i )ki −α n + i + ri + hi − H pir0i ⎜ ∏ pij ⎟
⎜
⎟
n ⎢
⎝ j =1 ⎠ Μ t − Μ 0 ri + hi ×
×∏ ⎢
[ i ( ) i ( )]
( ki − α n +i + ri + hi − H )!ri !hi !q ! g !
i =1 ⎣
qi
× [( G i ( t ) − G i ( 0 ) ) (1 − u ( ai + qi − gi ) )]
[( Βi ( t ) − Βi ( 0 ) ) u ( ai + qi − gi )]
gi
⎤
⎥
⎦.
Заключение
В работе проведено исследование в переходном режиме и условиях высокой
нагрузки сети произвольной структуры с ненадежными СМО. Такие сети могут
служить моделями функционирования БЛС. Полученная система дифференциальных уравнений Колмогорова для вероятностей состояний системы (1) с нелинейными коэффициентами заменяется системой (3) с линейными коэффициентами, которая решается с помощью метода производящих функций. Данная замена
является приближенным методом исследования системы (1) в условиях высокой
нагрузки. Получены выражения, позволяющие определить вероятности состояний
такой сети, а также среднее число исправных линий обслуживания и среднее число заявок в системах сети в произвольный момент времени.
ЛИТЕРАТУРА
1. Маталыцкий М.А. Сети массового обслуживания в стационарном и переходном режимах. Гродно: ГрГУ, 2001. 211 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование сети массового обслуживания с ненадежными системами
125
2. Вишневский В.М. Теоретические основы проектирования компьютерных сетей. М.: Техносфера, 2003. 512 с.
Статкевич Святослав Эдуардович
Маталыцкий Михаил Алексеевич
Гродненский государственный университет
имени Янки Купалы, Беларусь
E-mail: sstat@grsu.by; m.matalytski@gmail.com
Поступила в редакцию 7 октября 2011 г.
Statkevich Svyatoslav, Matalytski Mikhail (Grodno State University of Yanka Kupala, Belarus).
Investigation of queueing network with unreliable systems at transient regime.
Keywords: generating function, unreliable QS, state probabilities.
The open exponentional queuing network with unreliable systems which functioning under
condition of heavy loading is investigated. The Poisson flow of rate λ ( t ) enters the network. The
service time of messages in each of network systems has exponential distribution with parameter
μi ( t ) , i = 1, n . Service channels are exposed to random failure and serviceable work time of each
channel of system Si has exponential distribution with parameter βi ( t ) , i = 1, n . After failure the
service channel immediately starts to be restored and restoration time also has exponential distribution with parameter γ i ( t ) , i = 1, n . Let's consider, that service times of messages, durations of
serviceable work of channels and restoration time of service channels are independent random
variables.
State of network could be described via vector
Z ( t ) = ( z , t ) = ( d , k , t ) = ( d1 , d 2 ,… , d n , k1, k2 ,…, kn , t ) ,
where di − number of serviceable channels in system Si , 0 ≤ di ≤ mi , ki − messages number in
system Si at the moment t , t ∈ [ 0, +∞ ) , mi − total number of channels in system Si , i = 1, n .
By the instrumentality of generating functions approximate expressions for the timedependent state probabilities, average number of messages and serviceable channels are obtained.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
УДК 004.4:004.9
В.Л. Капилевич
АРХИТЕКТУРНОЕ ПРОЕКТИРОВАНИЕ
СИСТЕМЫ ИННОВАЦИОННОЙ ОРГАНИЗАЦИИ И ПОДДЕРЖКИ
УЧЕБНОГО ПРОЦЕССА В ВЫСШЕМ УЧЕБНОМ ЗАВЕДЕНИИ
Статья посвящена рассмотрению архитектуры программного комплекса,
обеспечивающего автоматизацию планирования и организации учебного
процесса крупного вуза с учетом современных тенденций интеграции российских высших учебных заведений в общеевропейское и мировое образовательное пространство. Основной задачей описываемых программных
средств является обеспечение возможности интерактивного формирования
для каждого студента вуза индивидуального учебного плана, систематизации и обобщению сформированных учебных планов с целью составления
оптимального расписания учебных занятий и мониторинга их проведения.
Приводится обоснование реализации данной системы как облачного сервиса, т.е. предоставления программного обеспечения как услуги (SaaS). Проводится анализ необходимого функционала данной системы, основанный на
требованиях Федеральных государственных образовательных стандартов,
кредитно-рейтингового подхода, индивидуализации траекторий обучения,
концепций CDIO, PBL и др.
Ключевые слова: информационная система, организация учебного процесса, индивидуальная траектория обучения, SaaS (Software as a Service).
В настоящее время российская система высшего образования переживает коренные изменения в организационной структуре, методах оценки знаний и методологиях обучения [1]. Данные изменения обусловлены глобализацией образования и требованиями современного бизнеса и производства. В последние годы
гармонизация национальной образовательной системы, по крайней мере, с образовательными стандартами европейского сообщества очень актуальна [1, 2]. Заметим, что процесс модернизации образовательных систем в рамках Болонского и
Копенгагенского процессов стал выходить за рамки европейского сообщества, охватывая все большее количество стран различных регионов мира [3].
Таким образом, гармонизация образовательных стандартов выдвигает перед
всеми ведущими мировыми державами такие цели [1] в области реформации
высшего профессионального образования, как создание четких и единых квалификаций, переход на двухуровневую систему подготовки, введение системы кредитов, обеспечение академической мобильности студентов и преподавателей, международное сотрудничество в обеспечении качества высшего образования, образование в течение всей жизни (LLL – Lifelong learning) и др. Немаловажным, говоря языком бизнеса, является ориентация на потребителя, т.е. в нашем случае установка студента в центр образовательного процесса.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Архитектурное проектирование системы инновационной организации и поддержки
127
На сегодняшний день множество российских высших учебных заведений находятся в процессе перехода к вышеназванным принципам построения процесса
обучения и организации работы вуза, но они сталкиваются с множеством проблем. В том числе, c одной из самых трудоемких – полностью управляемый студентом план обучения, который требует тесного взаимодействия студентов, преподавателей курсов, составителей расписания, деканата, учебного управления и
других структур учебного заведения. Очевидно, что необходимо внедрение информационной системы, позволяющей управлять процессом обучения и контролировать его на всех этапах.
При проектировании данной информационной системы был сделан упор на
введении принципиально нового системного подхода в организации образовательного процесса и сопутствующих ему управляющих процессов. Особенностью
данного подхода является акцентирование внимания на индивидуализацию образовательных траекторий студентов, поддержку современных образовательных
концепций (таких, как CDIO и PBL) [4] и обеспечение предельно дружественных
в использовании компьютерных технологий для выполнения всех видов организационной деятельности. Кроме того, отдельное внимание при планировании было уделено социальным элементам системы.
1. Возможности системы
Прежде всего, проектируемая система является хранилищем данных обо всех
аспектах учебной и организационной деятельности в вузе. После проведения анализа работы типового университета были выделены следующие основные сущности: учетные записи студентов, преподавателей и других сотрудников, аудиторный фонд, набор дисциплин и привязанных к ним материалов, учебные планы
(как базовые, так и индивидуальные), структура подразделений, условия составления расписания, индивидуальные расписания и некоторые другие вплоть до
данных мониторинга текущей успеваемости.
Очевидно, система должна предоставлять отдельный набор операций в зависимости от роли вошедшего пользователя. Поэтому была имплементирована
служба ролей с разграничением доступа к функциям системы. Данная служба позволяет пользователю иметь несколько ролей, что необходимо для внедрения в
реальном учебном заведении, так как зачастую один и тот же сотрудник исполняет несколько обязанностей из различных ролей.
Каждая роль имеет свой фронт-энд для удобного доступа ко всем разрешенным функциям через веб-интерфейс. На первом этапе развития системы было
принято решение сделать четыре типа фронт-энда: для студента, для преподавателя, для администратора учебного заведения или его подразделения и для свободного просмотра (гостя). В дальнейшем планируется добавить различные
фронт-энды для других подразделений и сотрудников, например для ректора, работника деканата, заведующего корпусом и т.д.
Фронт-энд студента привязан к аккаунту студента, который создается и заполняется на этапе его поступления в учебное заведение (или при внедрении системы, в случае, если студент уже находится на обучении), после чего студенту выдаются данные для доступа. Студенту доступны следующие основные функции:
редактирование и просмотр личных данных, запись на курсы, отслеживание соответствия индивидуального учебного плана обязательной образовательной про-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
128
В.Л. Капилевич
грамме и подсчет кредитов, просмотр индивидуального расписания, просмотр материалов по выбранным курсам, оценка курсов и преподавателей, просмотр текущей успеваемости и заданий, связь с преподавателем.
Фронт-энд преподавателя также привязан к аккаунту преподавателя, который
создается или при вступлении в должность, или при внедрении системы для уже
работающих преподавателей. Было принято решение включить в систему возможность преподавателю заявлять пожелания и требования к составлению расписания и записи на его курсы.
Получив доступ к аккаунту, преподаватель может добавить в систему свои
курсы (или отметить себя преподавателем уже существующего в системе курса),
добавить описание, рабочую программу, список занятий, учебно-методические
материалы и др. Затем он должен определить ограничения для записи на курс. Такими ограничениями могут быть: максимальное количество слушателей, необходимый набор уже пройденных студентом предметов, институт, к которому должен относиться слушатель, и т.п. Кроме того, преподаватель может предъявить
требования к аудиториям, в которых будут проходить занятия: наличие экрана с
проектором, аудиосистемы, компьютеров для каждого студента, специального лабораторного оборудования, размещение аудитории в конкретном корпусе (корпусах) и т.п. Преподавателю доступны следующие основные функции: редактирование и просмотр личных данных, создание курсов и открытие их для записи студентов, просмотр личного расписания, просмотр списка студентов на курсах, публикация материалов по своим курсам, публикация заданий для самостоятельного
выполнения студентами, ведение текущего контроля успеваемости и посещения
занятий, связь со студентами (как массовая рассылка, так и индивидуальная).
Администраторы подразделений авторизуются в системе под одноименным
фронт-эндом. Основная цель этих пользователей – ввод данных об аудиториях,
преподавателях, студентах и т.д. На более поздних этапах разработки данной системы будут добавлены специальные роли для данных задач, такие, как отдел кадров или приемная комиссия. Они примут на себя обязанности по управлению
всеми статическими данными (корпуса, аудитории, персонала и т.д.), возлагаемые
на этапе внедрения системы на администраторов подразделений.
Также можно выделить отдельно роль и соответствующий фронт-энд технического администратора системы. В нем реализуется различный функционал по
контролю работоспособности всех уровней системы, её обслуживанию: проверка
базы данных на ошибки, редактирование прав доступа, контроль различных технических характеристик (нагрузка системы, сообщения об ошибках) и т.д. Кроме
того, технический администратор осуществляет запуск различных ресурсоемких
процедур, таких, как составление общего расписания или подсчета статистики.
Общий фронт-энд предназначен только для просмотра общедоступной информации. Одним из сценариев его применения является предоставление информации о студенте работодателю. Данный функционал присутствует во многих системах профессиональной сертификации, например в сертификационном центре
Microsoft. Работодатель может по коду, предоставленному выпускником этого
учебного заведения, получить информацию о пройденных курсах, их содержании
и успеваемости студента.
Помимо доступа к функциям разрабатываемой информационной системы посредством веб-браузера планируется имплементировать Web API (англ. Web
Application Programming Interface – сетевой интерфейс программирования прило-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Архитектурное проектирование системы инновационной организации и поддержки
129
жений) для решения проблемы доступа к данным и функциям системы с использованием других программ [5]. Данный Web API впоследствии будет использоваться при реализации приложений для мобильных устройств и нативных приложений для различных операционных систем. Такой дополнительный метод взаимодействия с системой, при наличии документации для API в свободном доступе,
позволит разработчикам сторонних приложений расширять систему, создавать
различные виджеты и т.д.
Важной функцией рассматриваемой информационной системы является непосредственно генерация учебного расписания, удовлетворяющего всему множеству
заданных ранее условий. Эта задача является наиболее нетривиальной и ресурсоемкой в рамках разрабатываемой системы [6, 7], так как является NP-полной и в
сравнении с распространенными системами генерации расписаний, работающими
с небольшим набором групп (классов) и, в большинстве случаев, не берущими в
расчет никаких дополнительных условий – данная информационная система работает с большѝм количеством индивидуальных планов студентов и учитывает
различные условия, предъявленные преподавателями при объявлении курсов.
По причине высокой ресурсоемкости было принято решение выделить в сетевой архитектуре системы отдельный вычислительный кластер для задач генерации расписания. Данное решение принято для разгрузки центрального сервера
системы, так как он отвечает за взаимодействие с пользователями и может существенно снизить время ответа при генерации расписания на том же сервере. Генерация расписания является полностью автономной задачей и не требует вмешательств в процессе выполнения. Таким образом, эта задача является идеальной
для выполнения одним из сервисов облачных вычислений [8]. В настоящий момент выбор в пользу сервисов облачных вычислений оправдан как экономически,
так и удобством внедрения и обслуживания [9]. Отсутствие необходимости закупки серверного оборудования, аренды помещения, обеспечения сохранности
данных и т.д. делает облачные сервисы наилучшим инструментом для выполнения удаленных вычислений.
В общем случае генерация расписания происходит несколько раз в учебный
год. Генерация инициируется администратором системы после проверки наличия
всех необходимых компонентов: индивидуальных учебных планов, дисциплин,
различных условий генерации и описания аудиторного фонда. В случае, если студент не предоставил индивидуальный учебный план, применяется базовый план
для его специальности.
Хранилище данных накапливает данные по дисциплинам, индивидуальным
учебным планам и расписаниям. После окончания учебного года, а порой и семестра, данная информация становится неактуальной, но не может быть удалена, так
как может понадобиться для статистических или других целей. В данный момент
в большинстве высших учебных заведениях такая информация наполняет бумажные архивы в худшем случае и неструктурированные электронные хранилища – в
лучшем. Оставлять устаревшие данные в основной базе данных системы тоже является не лучшим решением, так как при малой полезности эти данные замедляют
скорость запросов с каждым годом все больше и больше. По этой причине было
принято решение выделить в сетевой архитектуре системы отдельное хранилище
данных, которое не должно обеспечивать оперативный доступ к данным. Таким
образом, будет снижена нагрузка на основную БД и произведена кластеризация
данных по признаку их текущей полезности [10].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
130
В.Л. Капилевич
2. Сетевая архитектура системы
Базируясь на заявленном ранее функционале системы, была разработана следующая сетевая архитектура информационной системы (рис. 1).
Рис. 1. Схема сетевой архитектуры системы информационной поддержки
высшего учебного заведения
Основой архитектуры являются облачные веб-приложения и хранилище данных. Основное веб-приложение выполняет важнейшую функцию распределения
прав, предоставления и обработки данных. Хранилище данных не имеет средств
разграничения доступа, поэтому вся работа с ним происходит только через вебприложение. На схеме база данных обозначена как сетевая единица, но при необходимости может быть масштабирована путем внедрения системы репликации
без модификации других частей системы.
На левой половине схемы изображены возможные варианты клиентского доступа к системе: мобильные и обычные веб-клиенты (доступ посредством браузера
к соответствующей версии веб-сайта), нативные программы для мобильных устройств и различных операционных систем (доступ посредством Web API). Все варианты доступа реализуются через единые механизмы основного веб-приложения
для обеспечения идентичного поведения различных подсистем.
Особое внимание в сетевой архитектуре было уделено возможности масштабирования абсолютно всех частей системы, что позволяет реализовать данную
систему как сервис облачных вычислений для предоставления клиентам. Являясь
одним из популярнейших трендов на сегодняшний день – облачные сервисы являются наилучшим способом предоставления ПО сторонним компаниям (в нашем
случае высшим учебным заведениям). Решение предоставлять систему по модели
SaaS (Software as a Service, программное обеспечение как услуга) значительно
уменьшает затраты на внедрение, полностью исключает затраты на серверное
оборудование и построение инфраструктуры для каждого клиента, избавляет от
проблемы обновления программного обеспечения каждому клиенту, позволяет
имплементировать единые системы резервного копирования и т.д. [11, 12].
3. Внедрение и работа с системой
При заключении соглашения с высшим учебным заведением о внедрении данной информационной системы создается профиль университета в хранилище данных и добавляются основные администраторы (ответственные за сопровождение
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Архитектурное проектирование системы инновационной организации и поддержки
131
системы в учебном заведении). Дальнейшая работа по сопровождению делегируется службе информатизации вуза. Следующим этапом является внесение в хранилище данных – аудиторий, студентов, преподавателей, и т.д. На этом, благодаря использованию системы как облачного сервиса внедрение непосредственно
программного комплекса заканчивается.
Затем происходит публикация дисциплин, их описаний, материалов, требований преподавателями. После этого студенты выбирают дисциплины для изучения
из списков доступных и составляют индивидуальный учебный план на ближайший семестр. Каждый учебный план проверяется на соответствие всем нормам и
требованиям как учебного заведения, так и Федеральным государственным образовательным стандартам.
С использованием собранных данных составляется индивидуальное расписание для каждого студента и преподавателя, удовлетворяющее всем поставленным
строгим требованиям и максимально подходящее под все нестрогие. Алгоритмически модуль генерации расписания основан на комплексном использовании эволюционных вычислений и метода штрафов. Данная комбинация позволяет включать дополнительные условия в процесс генерации и уменьшить время генерации
расписания по сравнению с использованием этих методов отдельно или применения некоторых других методик [13]. Процедура составления расписания может
проводиться несколько раз с параллельным изменением настроек или требований
к расписанию, пока не будет получен оптимальный результат. В качестве объективного критерия оптимальности принимается минимальное отклонение от функции штрафов, задаваемой массивом требований к расписанию с различными значениями приоритета. Кроме того, возможна (субъективная) ручная оценка отдельных срезов расписания и последующая корректировка.
Заключение
Следует отметить, что подобные системы существуют, но в основном внедрены за рубежом, например TechAct University Management System или AccelUMS.
Использование этих систем в российских учебных учреждениях невозможно, так
как они не учитывают особенностей переходного состояния нашей системы образования и имеют жесткую привязку к зарубежным стандартам делопроизводства и
организации образовательного процесса.
Представленная в данной статье информационная система позиционируется
для последующего внедрения в крупные высшие учебные заведения России, в частности в национальные исследовательские университеты.
ЛИТЕРАТУРА
1. Волков А., Ливанов Д., Фурсенко А. Высшее образование: повестка 2008–2016 // Эксперт. 2007. № 32 (573).
2. Примерное положение об организации учебного процесса в высшем учебном заведении с использованием системы зачетных единиц: Приложение к письму Министерства
образования РФ № 1-55-357 ин/15 от 09.03.2004.
3. Байденко В.И. Болонский процесс: поиск общности европейских систем высшего образования // Исследовательский центр проблем качества подготовки специалистов, 2006.
211 с.
4. Zhu Ming, Meng Li. Exploration and practice in engineering education reform of EE major
based on CDIO mode // Engineering Education and Management. V. 112. Berlin, 2011.
P. 19−23.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
132
В.Л. Капилевич
5. Bianchini D., Valeria De Antonellis. Semantics-enabled web API organization and recommendation // Advances in Conceptual Modeling. Recent Developments and New Directions.
Heidelberg, 2011. P. 34−43.
6. Carter M.W., Laporte G. Recent developments in practical course timetabling // Springer
Practice and Theory of Automated Timetabling II. London, 1998. P. 3−19.
7. Barry McCollum. University timetabling: bridging the gap between research and practice //
5th International Conference on the Practice and Theory of Automated Timetabling. Amsterdam, 2006. P. 13−35.
8. Dong, B., Zheng, Q., Yang, J., Li. An E-learning ecosystem based on cloud computing infrastructure // Advanced Learning Technologies, Ninth IEEE International Conference. Riga,
2009. P. 125–127.
9. Vinay Chawla, Prenul Sogani. Cloud computing – the future // High Performance Architecture and Grid Computing, Communications in Computer and Information Science. V. 169.
Heidelberg, 2011. P. 113−118.
10. Moore R.W. Archiving experimental data // Encyclopedia of Database Systems. Springer,
2009. P. 132−135.
11. Иванченко Д.А. Построение информационной инфраструктуры вуза с применением модели SaaS // Высшее образование в России. 2010. № 10. С. 121−126.
12. Doelitzscher F., Sulistio A., Reich C., Kuijs H., Wolf D. Private cloud for collaboration and eLearning services: from IaaS to SaaS // Computing Magazine V. 91. Nо. 1. Wien, 2000.
P. 23−42.
13. Sadaf Naseem Jat, Shengxiang Yang. A hybrid genetic algorithm and tabu search approach
for post enrolment course timetabling // J. Scheduling. V. 14. Nо. 6. Amsterdam, 2011.
P. 617−637.
14. Капилевич В.Л., Ботыгин И.А. Архитектура системы информационной поддержки инновационной организации и планирования учебного процесса в высшем учебном заведении // Сборник трудов IX Всероссийской научно-практической конференции студентов, аспирантов и молодых ученых «Молодежь и современные информационные технологии». Томск, 2011. С. 206−207.
Капилевич Вячеслав Леонидович
Томский политехнический университет
E-mail: skkapi@gmail.com
Поступила в редакцию 4 ноября 2011 г.
Kapilevich Viacheslav. L. (Tomsk Polytechnic University). Architectural design of the system
for university innovation management and educational process supporting.
Keywords: information system, educational process management, individual studying trajectory,
SaaS (Software as a Service).
In design process of this information system, emphasis was placed on the fundamentally new
systematic approach for organizing the educational process and associated control processes. A
feature of this approach is the emphasis on individualized educational trajectories of students,
support of modern educational concepts (such as CDIO, PBL, etc.) and providing user-friendly
computer technology for all kinds of organizational activities.
System presented in this article is positioned for future implementation in major universities
in Russia, particularly in the national research universities.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
УДК 004.272
М.Г. Курносов, А.А. Пазников
ДЕЦЕНТРАЛИЗОВАННЫЕ АЛГОРИТМЫ
ДИСПЕТЧЕРИЗАЦИИ ПРОСТРАНСТВЕННО-РАСПРЕДЕЛЁННЫХ
ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ1
Рассмотрена задача управления ресурсами пространственно-распределённых вычислительных систем. Предложены алгоритмы децентрализованной
диспетчеризации: локально-оптимальный (ДЛО), алгоритмы на основе репликации (ДР) и миграции (ДМ) задач и с применением комбинированного
подхода (ДРМ). Проведено исследование алгоритмов на мультикластерной
ВС. Выполнено сравнение эффективности пакета GBroker децентрализованной диспетчеризации параллельных программ с централизованным диспетчером GridWay.
Ключевые слова: диспетчеризация параллельных программ, пространственно-распределенные вычислительные системы, GRID-системы.
В настоящее время при решении сложных задач науки и техники широко используются пространственно-распределённые вычислительные системы (ВС).
В архитектурном плане такие ВС представляют собой макроколлективы рассредоточенных вычислительных средств (подсистем), взаимодействующих между
собой через локальные и глобальные сети связи (включая сеть Internet) [1]. К пространственно-распределённым относятся мультикластерные вычислительные и
GRID-системы.
К значимым проблемам организации функционирования пространственнораспределённых ВС относится диспетчеризация. Для каждой параллельной задачи, из поступивших в ВС, требуется определить подсистемы для её решения. При
этом важно учитывать изменения состава и загрузки ВС с течением времени.
В пространственно-распределённых вычислительных и GRID-системах каждая
подсистема функционирует под управлением локальной системы управления ресурсами (СУР) (TORQUE, Altair PBS Pro, SLURM и др.), которая поддерживает
очереди пользовательских задач и выделяет для них вычислительные ресурсы
(процессорные ядра).
Централизованные средства диспетчеризации задач в пространственнораспределённых ВС подразумевают наличие в системе центрального диспетчера,
поддерживающего глобальную очередь задач. Отказ такого диспетчера может
привести к неработоспособности всей системы. Кроме того, в случае применения
таких средств в большемасштабных ВС возрастают временные затраты на поиск
требуемых ресурсов.
Основными программными пакетами организации централизованной диспетчеризации параллельных задач в пространственно-распределённых вычислительных и
GRID-системах являются: GridWay [2], AppLeS [3], GrADS [4], Nimrod/G [5],
Работа выполнена при поддержке РФФИ (гранты № 11-07-00105, 10-07-00157), Совета по
грантам Президента РФ для поддержки ведущих научных школ (грант НШ-5176.2010.9) и в
рамках госконтракта № 07.514.11.4015 с Минобрнауки РФ.
1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
134
М.Г. Курносов, А.А. Пазников
Condor-G [6]. Пакет GridWay входит в состав пакета Globus Toolkit и является наиболее распространённым GRID-диспетчером. В нём преследуется цель минимизации времени обслуживания задач и поддерживается механизм их миграции между
подсистемами. В AppLeS диспетчеризация выполняется на уровне самого приложения, что требует от пользователя знания конфигурации системы – это снижает универсальность указанного пакета. Пакет GrADS, как и GridWay, поддерживает миграцию задач и допускает указание зависимостей по данным между задачами.
Nimrod/G на основе экономических моделей обеспечивает равновесие между условными поставщиками (подсистемами) и потребителями вычислительных ресурсов (задачами). В Condor-G зависимости между задачами задаются в виде ориентированного ациклического графа.
При децентрализованной диспетчеризации в распределённой ВС функционирует коллектив диспетчеров, которые поддерживают распределённую очередь задач и совместно принимают решение о выборе ресурсов. Это позволяет достичь
живучести ВС – способности систем продолжать работу при отказах отдельных
подсистем.
Для распределённых вычислительных систем с программируемой структурой
созданы эффективные децентрализованные алгоритмы управления ресурсами
[7, 8]. Однако применимость этих методов для пространственно-распределённых
вычислительных и GRID-систем ограничена. В алгоритмах не учитывается производительность каналов связи между ресурсами и возможность образования очередей задач на подсистемах.
В статье предложено три новых алгоритма, основанных на репликации задач
(ДР), миграции задач (ДМ) и применении комбинированного подхода (ДРМ).
Подходы, реализованные в этих алгоритмах, позволяют качественнее учитывать
переменный характер загрузки ресурсов и производительность каналов связи (по
сравнению с локально-оптимальным алгоритмом (ДЛО) [9]). Также исследовано
влияние выбора структуры локальных окрестностей диспетчеров на эффективность диспетчеризации.
1. Децентрализованная диспетчеризация параллельных задач
в пространственно-распределённых ВС
Пусть имеется пространственно-распределённая ВС, состоящая из H подсистем; N – суммарное количество элементарных машин (ЭМ) в подсистемах. Под
ЭМ понимается единица вычислительного ресурса, предназначенного для выполнения ветви параллельной программы (например, процессорное ядро). Введем
обозначения: ni – количество ЭМ, входящих в состав подсистемы
i ∈ S = {1, 2,…, H}; ci – число свободных ЭМ в подсистеме i; qi – число задач в
очереди подсистемы i; si – число задач, выполняющихся на ЭМ подсистемы i;
tij = t(i, j, m) – время передачи сообщения размером m байт между подсистемами
i, j ∈ S ([t(i, j, m)] = с). Считается, что все подсистемы объединены сетью связи.
На каждой подсистеме присутствует локальная СУР и децентрализованный
диспетчер. Коллектив диспетчеров представлен в виде ориентированного графа
G(S, E), в котором вершинам соответствуют диспетчеры, а ребрам – логические
связи между ними (рис. 1). Наличие дуги (i, j) ∈ E в графе означает, что диспетчер
i может отправлять задачи диспетчеру j. Множество вершин j, смежных вершине
i, образуют её локальную окрестность L(i) = {j ∈ S | (i, j) ∈ E}.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Децентрализованные алгоритмы диспетчеризации
Подсистема 1
ЭМ 1
ЭМ2
Подсистема 2
...
ЭМ n1
СУР
ЭМ1
ЭМ 2
...
ЭМn2
СУР
Локальные задачи
Локальные задачи
Диспетчер 1
Диспетчер 2
Диспетчер3
Диспетчер 4
Локальные задачи
СУР
ЭМ 1
ЭМ2
Подсистема 3
135
Локальные задачи
СУР
... ЭМn3
ЭМ1
ЭМ 2
... ЭМn 4
Подсистема 4
Рис. 1. Пример локальных окрестностей диспетчеров:
H = 4, L(1) = {2, 3}, L(2) = {1, 4}, L(3) = {1, 4}, L(4) = {2, 3}
Пользователь направляет задачу диспетчеру i. Задача содержит программу,
входные файлы и ресурсный запрос, в котором указываются ранг r программы
(количество параллельных ветвей), размеры z1, z2, …, zk исполняемого и входных
файлов программы ([zl] = байт), а также номера h1, h2, …, hk, подсистем на которых размещены соответствующие файлы (hl ∈ S). Диспетчер (в соответствии с
реализованным в нём алгоритмом) выполняет поиск (суб)оптимальной подсистемы j* ∈ L(i) ∪ {i} (или подсистем j1∗ , j2∗ ,… ,jm∗ ) из его локальной окрестности.
2. Децентрализованные алгоритмы диспетчеризации задач
Предложено четыре децентрализованных алгоритма диспетчеризации параллельных задач в пространственно-распределённых ВС. Каждый алгоритм описывает функционирование диспетчера i при поступлении задачи в его очередь. На
начальном этапе работы все алгоритмы предполагают обращение диспетчера i к
системе мониторинга ресурсов ВС и получение текущих значений параметров tij,
cj, sj, qj и nj (j ∈ L(i) ∪ {i}). После этого строится множество допустимых подсистем S(i) = {j | nj ≥ r, j ∈ L(i) ∪ {i}}, имеющих количество ЭМ не ниже требуемого.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Г. Курносов, А.А. Пазников
136
2.1. Алгоритм локально-оптимальной диспетчеризации (ДЛО)
Алгоритм осуществляет выбор локально-оптимальной подсистемы.
Шаг 1. Из окрестности S(i) диспетчера i выбирается подсистема j* с минимальным значением F(j), j Ι S(i):
wj
⎧ tj
c
+ max +
, если c j < r или q j > 0,
⎪
cj
wmax
⎪ tmax
*
F ( j) = ⎨
j = arg min F ( j ) ,
j∈S (i )
⎪ tj ,
иначе,
⎪⎩ t
max
k
где t j = ∑ t (hl , j , zl )
– время доставки файлов задачи до подсистемы j;
l =1
tmax = max{t j } ; cmax = max{c j } , wj = qj / nj – количество задач в очереди, прихоj∈S (i )
j∈S (i )
дящееся на одну ЭМ подсистемы j; wmax = max{w j } .
j∈S (i )
Шаг 2. Задача направляется в очередь локальной СУР подсистемы j*, после
чего осуществляется доставка файлов задачи на эту подсистему.
Ранжирование подсистем по значению функции F(j) позволяет учесть время
доставки файлов задачи до подсистем, а также их относительную загруженность.
2.2. Алгоритм диспетчеризации на основе
репликации задач (ДР)
Шаг 1. Из окрестности S(i) выбирается m подсистем j1∗ , j2∗ ,… ,jm∗ в порядке неубывания значений функции F(j).
Шаг 2. Задача одновременно направляется в очереди локальных СУР подсистем j1∗ , j2∗ ,… ,jm∗ , после чего осуществляется доставка файлов задачи до этих подсистем.
Шаг 3. С интервалом времени ∆ диспетчер i проверяет состояние задачи на
подсистемах j1∗ , j2∗ ,… ,jm∗ и определяет подсистему j', на которой задача запущена
на выполнение раньше других подсистем.
Шаг 4. Задача удаляется из очередей локальных СУР подсистем, отличных
от j'.
2.3. Алгоритм диспетчеризации на основе
миграции задач (ДМ)
Шаг 1. Из окрестности S(i) диспетчера i выбирается подсистема j* с минимальным значением F(j), j Ι S(i).
Шаг 2. Задача направляется в очередь локальной СУР подсистемы j*, после
чего осуществляется доставка файлов задачи на эту подсистему.
Шаг 3. Диспетчер i c интервалом времени ∆ запускает процедуру ДЛО поиска
подсистемы j' для задачи в очереди диспетчера j*.
Шаг 4. Если для найденной подсистемы выполняется условие F(j*) – F(j') > ε,
то выполняется миграция задачи в очередь подсистемы j' (задача удаляется из
очереди диспетчера j*).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Децентрализованные алгоритмы диспетчеризации
137
2.4. Алгоритм диспетчеризации на основе
репликации и миграции задач (ДРМ)
Алгоритм основан на комбинации двух подходов – назначения на несколько
подсистем и миграции из очереди.
Важно отметить, что вычислительная сложность поиска подсистем предложенными алгоритмами не зависит от количества H подсистем, так как поиск осуществляется только в пределах локальных окрестностей диспетчеров. Это обеспечивает применимость алгоритмов в большемасштабных пространственно-распределённых ВС.
3. Программный пакет GBroker
децентрализованной диспетчеризации задач
Все предложенные алгоритмы были реализованы в пакете GBroker [9] децентрализованной диспетчеризации параллельных задач в пространственнораспределённых ВС. Пакет разрабатывается Центром параллельных вычислительных технологий ФГОБУ ВПО «Сибирский государственный университет телекоммуникаций и информатики» (ЦПВТ ФГОБУ ВПО «СибГУТИ»), совместно с
Лабораторией вычислительных систем Института физики полупроводников
им. А.В. Ржанова СО РАН (ИФП СО РАН). Он включает в себя диспетчер
GBroker, модуль интерфейса GClient и системы мониторинга NetMon и DCSMon.
Модуль GBroker реализует алгоритмы децентрализованной диспетчеризации задач, взаимодействуя с локальной СУР через подсистему GRAM пакета Globus
Toolkit. DCSMon отвечает за информацию о вычислительных ресурсах подсистем
локальной окрестности диспетчера. NetMon формирует сведения о производительности каналов связи межу подсистемами.
Все модули устанавливаются на подсистемах; администратор задаёт локальные окрестности диспетчеров и систем мониторинга. Задача состоит из параллельной программы и описания на языке Job Submission Description Language
(JSDL). Пользователь может отправить задачу (командой gclient) любому из диспетчеров GBroker распределённой ВС. Передача файлов внутри системы осуществляется средствами GridFTP.
4. Экспериментальное исследование алгоритмов
Исследование созданных алгоритмов проводилось на пространственно-распределённой мультикластерной ВС, созданной ЦПВТ ФГОБУ ВПО «СибГУТИ» совместно с лабораторией вычислительных систем ИФП СО РАН (рис. 2). На каждом сегменте установлена операционная система GNU/Linux, локальная система
управления ресурсами TORQUE 2.3.7, пакет Globus Toolkit 5.0 и компоненты пакета GBroker. На сегменте 5 (Xeon80) настроен диспетчер GridWay 5.6.1 для
управления ресурсами всех подсистем.
В качестве тестовых задач использовались MPI-программы из пакета тестов
SPEC MPI 2007: Weather Research and Forecasting (WRF) – пакет моделирования
климатических процессов; The Parallel Ocean Program (POP2) – пакет моделирования процессов в океане; LAMMPS – пакет решения задач молекулярной динамики;
RAxML – пакет моделирования задач биоинформатики; Tachyon – пакет расчета
графических сцен. Входные данные для тестовых задач размещались на сегменте
Xeon80; на эту же подсистему доставлялись результаты выполнения программ.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Г. Курносов, А.А. Пазников
138
1
Коммутатор
Gigabit Ethernet
D-Link DGS-1216
...
Кластер L400a1
8 ядер
(4узла:1 x Intel Core 2 Duo E8400)
2
...
Кластер L400a2
8 ядер
(4узла:1 x Intel Core 2 Duo E8400)
Коммутатор
Gigabit Ethernet
D-Link DGS-1216T
ЛВС
Коммутатор
Gigabit Ethernet
Allied Telesis AT-GS950/8
Интернет-шлюз
D-Link DFL-800
3
4
5
Linuxмаршрутизатор
6
Коммутатор
Gigabit Ethernet
D-Link DGS-1016D
...
Кластер Xeon16
8 ядер (2узла:
2 x Intel Xeon 5150)
Кластер Xeon32
8 ядер ( 1 узел:
2 x Intel Xeon 5345)
Кластер Xeon80
80 ядер (10 узлов:
2 x Intel Xeon 5420)
Кластер L400l
18 ядер
(9узлов: 1 x Intel Dual Core E5200 )
Рис. 2. Тестовая конфигурация мультикластерной ВС (H = 6, N = 130)
Генерировались простейшие потоки c различной интенсивностью λ поступления задач, которые псевдослучайно с равномерным распределением выбирались
из тестового набора. Каждый поток формировался из M задач. Ранг r каждой задачи выбирался из множества {1, 2, 4, 8} псевдослучайно с равномерным распределением.
Обозначим через tk время поступления задачи k ∈ {1, 2, …, M} на вход диспетчера, tk′ – время начала решения задачи k, tk′′ – время завершения решения задачи
k. Пусть τ – суммарное время обслуживания потока из M задач.
Для оценки эффективности алгоритмов диспетчеризации использовались следующие показатели: пропускная способность B системы, среднее время T обслуживания задачи и среднее время W пребывания задачи в очереди:
M
1 M
1 M
B=
, T=
(tk′′ − tk ) , W =
∑
∑ (tk′ − tk ) .
τ
M k =1
M k =1
4.1. Сравнительный анализ алгоритмов
На рис. 3 и 4 приведены результаты сравнения эффективности алгоритмов
ДЛО, ДР, ДМ и ДРМ при обслуживании потока из M = 200 задач. Поток задач поступал на подсистему Xeon80, локальные окрестности диспетчеров имели структуру полного графа.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Децентрализованные алгоритмы диспетчеризации
а
а
б
б
в
в
Рис. 3. Сравнение эффективности алгоритмов ДЛО и ДР: 1 – Алгоритм ДЛО; 2 – Алгоритм ДР, m = 2; 3 – Алгоритм ДР, m = 3;
4 – Алгоритм ДР, m = 6
139
Рис. 4. Сравнение эффективности алгоритмов ДЛО, ДМ и ДРМ: 1 – Алгоритм ДМ; 2 –
Алгоритм ДЛО; 3 – Алгоритм ДРМ, m = 2;
4 – Алгоритм ДРМ, m = 3
Пропускная способность системы при использовании алгоритма ДР для
m ∈ {2, 3} выше пропускной способности при использовании алгоритма ДЛО. Деградация показателей при больших значениях m связана с увеличением загрузки каналов связи при передаче входных файлов одной задачи на несколько сегментов.
В алгоритмах ДМ и ДРМ интервал поиска подсистемы ∆ = 30 с, условие миграции ε = 0,2. Наименьшие среднее время обслуживания задач и среднее время
ожидания в очереди достигнуты при использовании алгоритмов ДЛО и ДМ
(рис. 4), при этом большая пропускная способность системы получена для ДМ.
Алгоритмы ДР и ДРМ рекомендуется применять в случае малой интенсивности
потоков задач или небольших размеров входных данных.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Г. Курносов, А.А. Пазников
140
а
а
б
б
в
в
Рис. 5. Влияние структур локальных окрестностей диспетчеров на эффективность диспетчеризации: 1 – полный граф; 2 – звезда;
3 – кольцо; 4 – решетка; 5 – 2D-тор; 6 – D2граф
Рис. 6. Сравнение эффективности диспетчеров GBroker и GridWay: 1 – GBroker; 2 –
GBroker, полный граф; 3 – GBroker, 2D-тор;
4 – GridWay
При большой интенсивности потока задач значительно возрастает время доставки входных данных вследствие повышения загрузки каналов связи и сетевой
файловой системы на сегментах. Это приводит к снижению пропускной способности системы и увеличению времени обслуживания задач (ожидания в очереди)
для всех алгоритмов диспетчеризации.
4.2. Выбор структуры локальных окрестностей
диспетчеров
Выполнено исследование влияния структуры локальных окрестностей диспетчеров на эффективность диспетчеризации. В эксперименте на вход всех диспетче-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Децентрализованные алгоритмы диспетчеризации
141
ров одновременно поступали потоки из M = 50 задач. Рассматривались локальные
окрестности в виде полных графов, колец, решёток, звёзд, 2D-торов и D2-графов [1].
На рис. 5 показано влияние структуры локальных окрестностей диспетчеров
на эффективность обслуживания потоков задач алгоритмом ДМ. Высокие значения пропускной способности, помимо полносвязной структуры, были получены
для конфигураций на основе 2D-тора, решётки и D2-графа, при этом для двух последних были достигнуты наибольшие значения. Использование неполносвязных
структур при формировании локальных окрестностей диспетчеров не приводит к
значительному снижению показателей эффективности диспетчеризации. Такие
структуры могут быть образованы при отсутствии прямых линий связи между отдельными подсистемами, например в случае отказов некоторых подсистем. В качестве структур локальных окрестностей могут быть рекомендованы торы или Dnграфы, которые обладают малым (средним) диаметром.
4.3. Сравнительный анализ диспетчеров
GBroker и GridWay
Выполнено сравнение эффективности обслуживания потоков задач централизованным диспетчером GridWay и созданным децентрализованным пакетом GBroker.
Для диспетчера GBroker проведено два эксперимента. В ходе первого на подсистему Xeon80 поступал поток из M = 300 задач. Во втором эксперименте моделировалось распределённое обслуживание задач: одинаковые потоки из M = 50 задач
одновременно поступали в очереди диспетчеров всех 6 подсистем. При этом в качестве структур логических связей диспетчеров использовались 2D-тор и полный
граф, а в качестве алгоритма диспетчеризации – ДМ. Пакет GridWay установлен на
сегменте Xeon80 и настроен в соответствии с рекомендациями разработчиков.
На рис. 6 видно, что пропускная способность диспетчера GBroker при обслуживании нескольких потоков превосходит пропускную способность пакета
GridWay. Среднее время обслуживания и среднее время пребывания задач в очереди близки с GridWay и незначительно возрастают при централизованном обслуживании.
Заключение
По сравнению с централизованным подходом, предложенные алгоритмы децентрализованной диспетчеризации существенно снижают сложность поиска ресурсов и обеспечивает живучесть пространственно-распределённых ВС. По сравнению с централизованным диспетчером GridWay была достигнута более высокая
пропускная способность (с использованием алгоритма ДМ), при сопоставимых
значениях среднего времени обслуживания задачи.
Механизм миграции, реализованный в алгоритмах ДМ, ДРМ, может использоваться для повышения пропускной способности системы (по отношению к ДЛО).
При репликации задач на несколько подсистем (алгоритмы ДР, ДРМ) возрастают
накладные расходы на доставку данных, что приводит к увеличению времени обслуживания задач.
Созданный пакет GBroker является свободно распространяемым. Для организации децентрализованной диспетчеризации задач в пространственно-распределённой ВС достаточно установить пакет GBroker на всех подсистемах и выполнить конфигурацию диспетчеров в соответствии с выработанными рекомендациями. При формировании локальных окрестностей диспетчеров рекомендуется
использовать структуры малого диаметра.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
142
М.Г. Курносов, А.А. Пазников
ЛИТЕРАТУРА
1. Хорошевский В.Г. Распределённые вычислительные системы с программируемой структурой // Вестник СибГУТИ. 2010. № 2 (10). С. 3−41.
2. Huedo E., Montero R., Llorente I. A framework for adaptive execution on grids // Software –
Practice and Experience (SPE). 2004. V. 34 P. 631−651.
3. Berman F., Wolski R., Casanova H. Adaptive computing on the grid using AppLeS // IEEE
Trans. on Parallel and Distributed Systems. 2003. V. 14. No. 4. P. 369−382.
4. Cooper K., Dasgupta A., Kennedy K. New grid scheduling and rescheduling methods in the
GrADS project // In Proc. of the 18th International Parallel and Distributed Processing
Symposium (IPDPS’04). 2004. P. 199−206.
5. Buyya R., Abramson D., Giddy J. Nimrod/G: An architecture for a resource management and
scheduling system in a global computational Grid // Proc. of the 4th International Conference
on High Performance Computing in Asia-Pacific Region. 2000. P. 283−289.
6. Frey J., Tannenbaum T., Livny M., et al. Condor-G: A computation management agent for
multi-institutional grids // Cluster Computing. 2001. V. 5. P. 237−246.
7. Корнеев В.В. Архитектура вычислительных систем с программируемой структурой. Новосибирск: Наука, 1985. 164 с.
8. Монахов О.Г., Монахова Э.А. Параллельные системы с распределённой памятью: управление ресурсами и заданиями. – Новосибирск: ИВМиМГ СО РАН, 2001. 168 с.
9. Курносов М.Г., Пазников А.А. Инструментарий децентрализованного обслуживания потоков параллельных MPI-задач в пространственно-распределенных мультикластерных
вычислительных системах // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 3 (16). С. 78−85.
Курносов Михаил Георгиевич
Пазников Алексей Александрович
Сибирский государственный университет
телекоммуникаций и информатики,
E-mail: mkurnosov@gmail.com, apaznikov@gmail.com
Поступила в редакцию 3 июня 2011 г.
Kurnosov Mikhail G., Paznikov Alexey A. (Siberian State University of Telecommunications and
Information Sciences). Decentralized scheduling algorithms of geographically-distributed
computer systems.
Keywords: task scheduling, meta-scheduling, geographically-distributed computer systems,
GRID-systems.
Locally optimal algorithm and algorithms based on job migration, job replication and both
migration and replication of decentralized scheduling of parallel programs in geographicallydistributed computer systems are proposed in this paper. Software of parallel jobs decentralized
scheduling is considered. Job migration and job replication are indented to help to consider dynamically changed structure and resource workload. Computational complexity of proposed algorithms doesn’t depend on number of subsystems, because the search implements within the
scheduler’s local neighborhood. This provides algorithms applicability in large-scale geographically-distributed CS.
Algorithms have been realized and included into GBroker software suite of parallel programs
decentralized scheduling in geographically-distributed multicluster and GRID-systems. Modeling
of developed algorithms and software tools on the active multicluster system has shown high effectiveness of job migration. Investigation of local neighborhood structures has shown that the
using of non-fully connected structures of small (mean) diameter doesn’t result in significant decrease of the system performance. An experimental comparison of developed packet GBroker
with centralized scheduler GridWay has shown that mean service time of job flows with centralized and decentralized scheduling is comparable. Using of the algorithm with migration has allowed to exceed the bandwidth of this centralized scheduling system.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
МЕМУАРЫ, ПАМЯТНЫЕ ДАТЫ, ПЕРСОНАЛИИ
80 лет профессору
ФЕЛИКСУ ПЕТРОВИЧУ ТАРАСЕНКО
6 марта 2012 года исполнилось 80 лет известному ученому в области теории
информации, кибернетики, математической статистики и системному анализу,
члену редколлегии журнала, доктору технических наук, профессору, академику
МАНВШ, член-корреспонденту РАЕН, заслуженному деятелю науки РФ, почетному работнику высшего профессионального образования РФ, заслуженному
профессору Томского государственного университета Феликсу Петровичу Тарасенко.
После окончания мужской средней школы № 41 г. Красноярска с золотой медалью в 1950 г. поступил на радиофизический факультет ТГУ. В 1955 г. окончил с
отличием университет по специальности «радиофизика и электроника». С 1955 г.
Ф.П. Тарасенко продолжил свою деятельность в ТГУ: аспирант, ассистент, доцент
(1955−1960), зав. кафедрой электронной вычислительной техники и автоматики
ТГУ (1960−1964), зав. кафедрой статистической радиофизики ТГУ (1964−1965),
зав. отделом кибернетики Сибирского физико-технического института им. акад.
В.Д. Кузнецова, (1970−1977), зав. кафедрой теоретической кибернетики ТГУ
(1977−1998), декан Международного факультета управления (МФУ) ТГУ (с
1992 г. по настоящее время).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
144
80 лет профессору Феликсу Петровичу Тарасенко
В разные годы Тарасенко Ф.П. читал в ТГУ курсы: физика; кибернетика; статистика; системный анализ; менеджмент; методология исследования систем с позиций кибернетики и системного анализа. Научная деятельность Тарасенко Ф.П.
была связана с проблемами пропускной способности радиотехнических каналов
связи, непараметрической статистики, робастой статистики. В 1975 г. в совете при
ТГУ Феликс Петрович защитил диссертацию «Проблемы передачи информации
по каналам с частично или полностью неизвестными распределениями шумов» на
соискание ученой степени доктора технических наук. Он является основоположником научной школы, развивающейся в двух направлениях: «Непараметрические и робастные статистические методы в кибернетике», «Статистический анализ данных и разработка моделей социально-экономических систем». По этим направлениям Ф.П. Тарасенко подготовлено 7 докторов и 36 кандидатов наук.
Ф.П. Тарасенко опубликовал 4 монографии и более 160 научных работ в российских и зарубежных научных изданиях. Научное признание отражено в избрании
Ф.П. Тарасенко в состав научного совета АН СССР по кибернетике (секция теории информации), Советского комитета по автоматическому управлению ИФАК,
рабочей группы по советско-американскому сотрудничеству по кибернетике АН
СССР. Ф.П. Тарасенко удостоен премии им. В.М. Глушкова с вручением Золотой
медали лауреата за разработку теоретических основ и системного синтеза сложных наукоемких территориальных информационных систем. Феликс Петрович –
прекрасный преподаватель, инициатор многих образовательных проектов ТГУ.
Он является пропагандистом идей системного анализа. Его курс по системному
анализу читается в вузах разных городов и для студентов разных специальностей.
Им написано учебное пособие «Прикладной системный анализ» (Изд-во «Кнорус», Москва, 2010 г.) и переведены на русский язык 4 книги классиков системного анализа (2007−2009 гг.), которые стали настольным руководством по выработке решений для многих современных руководителей. Под его руководством в течение 19 лет МФУ внес существенный вклад в подготовку кадров для Томской
области и города. В 2003 г. на факультете появилась новая специальность «Государственное и муниципальное управление». В числе первых слушателей по программе второго высшего образования были главы муниципальных образований,
их заместители, сотрудники администрации области.
Научная и практическая работа Ф.П. Тарасенко внесла существенный вклад в
развитие Томской области и г. Томска, о чем свидетельствует ряд фактов из его
профессиональной биографии: в 70-х годах он входил в комплексную научнотехническую группу, которая занималась разработкой основ технического проекта по созданию автоматизированной системы управления хозяйством Томской
области (был заместителем генерального конструктора АСУ Томской области);
участвовал в координация программно-целевого комплекса «Лес и лесообработка» – одного из 19 народнохозяйственных комплексов Томской области (1970−
1975 гг.); организовал подготовку высококвалифицированных специалистов по
государственному и муниципальному управлению для г. Томска; участвовал в
разработке законодательной основы научно-инновационных процессов в сотрудничестве с ТО СО РАН и вузов г. Томска (2000−2001 гг.). Результаты его работы
были отмечены бронзовой медалью ВДНХ. Он активно участвует в общественной
жизни. Являлся инициатором создания и первым президентом Ротарианского
клуба в г. Томске, председателем комитета международных проектов томского
Ротари-клуба и председателем Всероссийского фонда образования (Томское городское отделение), инициатором создания Научно-образовательного канала
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
80 лет профессору Феликсу Петровичу Тарасенко
145
(НОК) на телевидении в г. Томске. Участвовал в реализация международной программы «Образование и бизнес в Сибири». Осуществлял научное руководство работ по оценке перспектив нефтегазоносных районов Томской области (2000−
2001 гг.) и научное руководство работы по теме «Отработка методики разработки
программ социально-экономического развития муниципальных образований на
примере Томского района» (2003 г.). Оказывал благотворительную помощь ряду
томских детских и медицинских учреждений.
Ф.П. Тарасенко является главным редактором научно-практического журнала
«Проблемы управления в социальных системах», издаваемого в ТГУ. В течение
почти 40 лет входил (часто возглавляя его) в оргкомитет Всесоюзной (позднее
Международной) школы-семинара по непараметрическим и робастным статистическим методам в кибернетике. Неоднократно приглашался для чтения лекций на
международные симпозиумы. В 1967−1968 гг. как эксперт ЮНЕСКО был лектором Дар-эс-Саламского университета в Танзании. Он является членом Американского математического общества. Его биография включена в справочники «Кто
есть кто в мире», «Кто есть кто в России». В 1994 г. Американским биографическим институтом назван человеком года. Награжден орденом Трудового Красного
Знамени, медалями «За доблестный труд в ознаменование 100-летия со дня рождения В.И. Ленина», «Ветеран труда» и «За заслуги перед Томским университетом». Отмечен нагрудными знаками «За заслуги перед городом Томском» и «Отличник высшей школы».
Дорогой Феликс Петрович!
Поздравляем Вас с юбилеем и желаем здоровья на многие годы!
Творческих Вам успехов!
Факультет прикладной математики и кибернетики ТГУ
Редакционная коллегия журнала «Вестник ТГУ. Управление,
вычислительная техника и информатика»
Кафедра теоретической кибернетики
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
75 лет профессору
ПОДДУБНОМУ ВАСИЛИЮ ВАСИЛЬЕВИЧУ
22 декабря 2011 года исполнилось 75 лет известному ученому в области информатики динамических систем, лауреату премии Правительства РФ в области
науки и техники, почетному работнику высшего профессионального образования
РФ, действительному члену Международной академии информатизации, члену
редколлегии журнала, профессору кафедры прикладной информатики, доктору
технических наук Поддубному Василию Васильевичу.
После окончания с серебряной медалью Томской мужской средней школы №8
в 1954 г. Поддубный В.В. поступил на радиофизический факультет (РФФ) ТГУ.
Окончил университет в 1959 г. по специальности «радиофизика и электроника» с
квалификацией «физик-радиоэлектроник», защитив дипломную работу «Последовательный некогерентный анализатор» под научным руководством доцента (ныне
профессора) Ф.П. Тарасенко. С 1959 г. – аспирант ТГУ. С 1963 г. – ассистент каф.
ЭВТиА, с марта 1967 г. – доцент каф. статистической радиофизики и общей теории связи РФФ ТГУ. С 1968 г. – зав. лаб. счетно-решающих устройств Сибирского физико-технического института им. акад. В.Д.Кузнецова, с 1970 г. – зав. лаб.
информационных систем, с 1977 г. – зав. отделом кибернетики, с 1986 г. – зав. отделом автоматизации и информатики и с 1993 г. – зав. лаб. информатики и процессов управления СФТИ. С 1993 г. Поддубный В.В. – доцент, а с 1998 г. –профессор каф. прикладной информатики факультета информатики ТГУ.
Ученое звание профессора по кафедре прикладной информатики присвоено
МО РФ в 2000 г. Читает курсы: теория вероятностей и математическая статистика; теория случайных процессов; дифференциальные уравнения и теория управ-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
75 лет профессору Поддубному Василию Васильевичу
147
ления; математический анализ; спецкурсы: теория информации; статистическая
теория радиолокации; теория игр; основы кибернетики; теория оптимального
управления дискретными процессами; методы и пакеты статистической обработки данных и др. Основное научное направление его исследований – применение и
развитие методов прикладной математики и информатики для математического и
компьютерного исследования и оптимизации сложных динамических систем обработки информации и управления в условиях случайности, неопределенности и
ограничений. Он развил теорию дважды стохастических процессов (в частности,
пуассоновских потоков со случайной интенсивностью – эрмитовских и лагерровских потоков), на основе которой разработал оптимальные математические методы и алгоритмы обработки слабых оптических сигналов с учетом их макроскопических и квантовых флуктуаций. Применил эти методы к обработке сигналов с
«разладками» на выходе модуляционных оптических угломеров и сигналов на
выходе оптических интерферометров интенсивностей Брауна и Твисса, использующих разнесенный прием. Неизвестная динамика наблюдаемых объектов была
описана Поддубным В.В. «рестриктивными» кинематическими соотношениями,
позволившими адекватно учесть инерционный характер движения объектов. Системы пассивной оптической локации, использующие указанные алгоритмы, были
им исследованы путем математического моделирования на электронных цифровых вычислительных машинах. На основе развития методов инвариантного погружения и аппроксимации для решения двухточечных краевых задач оптимизации рестриктивных процессов и динамических систем Поддубный В.В. создал
теорию и компьютерные методы решения задач обработки информации (адаптации и фильтрации состояний) и управления нелинейными рестриктивными и рестриктивно-стохасгическими системами. На основе этого подхода он предложил и
исследовал также новый класс полиномиальных сплайнов – рестриктивные
сплайны, занимающие промежуточное положение между известными сплайнами
соседних целочисленных дефектов. С использованием методов инвариантного погружения и аппроксимации под руководством и при участии Поддубного В.В.
(совместно с учеными С.-Петербурга и Москвы) были проведены исследования по
математическому моделированию, оптимизации и созданию математического и
программного обеспечения морских навигационных и океанографических комплексов, в т. ч. базового судового автоматизированного комплекса сбора и обработки океанографической информации «Лидер», запущенного в серийное производство. Эти исследования легли в основу защищенной Поддубным В.В. диссертации «Методы инвариантного погружения и аппроксимации в рестриктивных
задачах управления и фильтрации» (по опубликованной монографии) 4 июля
1998 г. на соискание ученой степени доктора технических наук. Принимал участие в работе многих международных, всесоюзных научных конференций. Автор
более 150 научных работ, в т.ч. монографии. Подготовил 12 кандидатов наук, трое
из которых стали докторами наук.
В 1970−1980 гг. сформировалась научая школа Поддубного В.В. по математическому моделированию, обработке информации и управлению в нелинейных рестриктивных и рестриктивно-стохастических динамических системах. Это направление получило название информатики рестриктивных и рестриктивностохастических динамических систем. С 2000 г. он – зам. председателя (с 2010 г. –
председатель) диссертационного совета в ТГУ. Был редактором научных сборников трудов. Удостоен премии ТГУ за монографию «Методы инвариантного погружения и аппроксимации в рестриктивных задачах управления и фильтрации»
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
148
75 лет профессору Поддубному Василию Васильевичу
(1997 г.). Награжден почетной грамотой МВиССО РСФСР, нагрудным знаком
МВиССО СССР «За отличные успехи в работе». Премию Правительства РФ в области науки и техники получил в 2001 г. за создание базового судового автоматизированного комплекса сбора и обработки океанографической информации и внедрение на его основе новых технологий мониторинга и картографирования параметров физических полей Мирового океана. Отмечен медалями «За доблестный
труд в ознаменование 100-летия со дня рождения В. И. Ленина», «Ветеран труда»,
«За заслуги перед Томским университетом», «400 лет городу Томску», «В благодарность за вклад в развитие Томского университета».
Дорогой Василий Васильевич!
Поздравляем Вас с юбилеем и желаем здоровья на многие годы!
Творческих Вам успехов!
Факультет информатики ТГУ
Редакционная коллегия журнала «Вестник ТГУ. Управление,
вычислительная техника и информатика»
Кафедра прикладной информатики
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012
Управление, вычислительная техника и информатика
№ 1(18)
СВЕДЕНИЯ ОБ АВТОРАХ
БОБРОВ Александр Валерьевич – аспирант кафедры прикладной математики факультета информационных технологий Алтайского государственного технического университета
им. И.И.Ползунова. E-mail: 22bav@mail.ru
БУБЛИК Яна Сергеевна – ассистент кафедры экономики и управления филиала Кемеровского государственного университета в г. Анжеро-Судженске. E-mail: yana@asf.ru
БУРКАТОВСКАЯ Юлия Борисовна – кандидат физико-математических наук, доцент
кафедры вычислительной техники Томского политехнического университета, программист
кафедры высшей математики и математического моделирования Томского государственного университета. E-mail: tracey@tpu.ru
ВОРОБЕЙЧИКОВ Сергей Эрикович – профессор, доктор физико-математических наук,
профессор кафедры высшей математики и математического моделирования Томского государственного университета. E-mail: sev@mail.tsu.ru
ГОРЦЕВ Александр Михайлович – профессор, доктор технических наук, заведующий
кафедрой исследования операций факультета прикладной математики Томского государственного университета. E-mail: amg@fpmk.tsu.ru
ДЮНОВА Диана Николаевна − кандидат технических наук, доцент кафедры Теории и
автоматизации металлургических процессов и печей Северо-Кавказского горно-металлургического института (государственного технологического университета). E-mail: dunova_dn
@mail.ru
КАЛЯГИН Алексей Андреевич – аспирант факультета прикладной математики и кибернетики Томского государственного университета. E-mail: redall@inbox.ru
КАПИЛЕВИЧ Вячеслав Леонидович – магистрант кафедры информатики и проектирования систем Томского политехнического университета. E-mail: skkapi@gmail.com
КРЫСАНОВА Кристина Андреевна – магистрант кафедры теории вероятности и математической статистики факультета прикладной математики и кибернетики Томского государственного университета. E-mail: Krysanova@sibmail.com
КУРНОСОВ Михаил Георгиевич – кандидат технических наук, доцент кафедры вычислительных систем Сибирского государственного университета телекоммуникаций и информатики (г. Новосибирск). E-mail: mkurnosov@gmail.com
ЛИВШИЦ Климентий Исаакович – профессор, доктор технических наук, профессор кафедры прикладной математики Томского государственного университета. E-mail: kim47@
mail.ru
ЛЮБИНА Татьяна Викторовна – аспирантка факультета прикладной математики и кибернетики Томского государственного университета. E-mail: lyubina_tv@mail.ru
МАТАЛЫЦКИЙ Михаил Алексеевич – профессор, доктор физико-математических наук,
заведующий кафедрой стохастического анализа и эконометрического моделирования факультета математики и информатики Гродненского государственного университета имени
Янки Купалы (г. Гродно, Республика Беларусь). E-mail: m.matalytski@gmail.com
МЕДВЕДЕВ Геннадий Алексеевич – профессор, доктор физико-математических наук,
профессор факультета прикладной математики и информатики Белорусского государственного университета (г. Минск, Республика Беларусь). E-mail: MedvedevGA@cosmostv.by
МОИСЕЕВА Светлана Петровна – кандидат технических наук, доцент кафедры теории
вероятности и математической статистики факультета прикладной математики и кибернетики Томского государственного университета. E-mail: smoiseeva@mail.ru
НАЗАРОВ Анатолий Андреевич – профессор, доктор технических наук, заведующий кафедрой теории вероятностей и математической статистики Томского государственного
университета. E-mail: nazarov@fpmk.tsu.ru
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
150
Сведения об авторах
ПАЗНИКОВ Алексей Александрович – магистрант кафедры вычислительных систем
Сибирского государственного университета телекоммуникаций и информатики (г. Новосибирск). E-mail: apaznikov@gmail.com
ПЕРЕПЕЛКИН Евгений Александрович – профессор, доктор технических наук, профессор кафедры прикладной математики факультета информационных технологий Алтайского государственного технического университета им. И.И.Ползунова. E-mail: eap@list.ru
ПОДДУБНЫЙ Василий Васильевич – профессор, доктор технических наук, профессор
кафедры прикладной информатики факультета информатики Томского государственного
университета. E-mail: vvpoddubny@gmail.com
ПРИСТУПА Марина Юрьевна – аспирантка кафедры прикладной математики факультета прикладной математики и кибернетики Томского государственного университета.
Е-mail: kiselevamy@gmail.com
РОМАНОВИЧ Ольга Владимировна – старший преподаватель кафедры теоретических
основ информатики факультета информатики Томского государственного университета.
E-mail: njkm@ngs.ru
РУТКОВСКИЙ Александр Леонидович − доктор технических наук, профессор кафедры
Теории и автоматизации металлургических процессов и печей Северо-Кавказского горнометаллургического института (государственного технологического университета). E-mail:
Rutkowski@mail.ru
СЕРГЕЕВА Екатерина Евгеньевна – ассистент кафедры вычислительной техники Томского политехнического университета, ассистент кафедры высшей математики и математического моделирования Томского государственного университета. E-mail: sergeeva_e_e
@mail.ru
СМАГИН Валерий Иванович – профессор, доктор технических наук, профессор кафедры
прикладной математики факультета прикладной математики и кибернетики Томского государственного университета. Е-mail: vsm@mail.tsu.ru
СТАТКЕВИЧ Святослав Эдуардович – старший преподаватель кафедры стохастического анализа и эконометрического моделирования факультета математики и информатики
Гродненского государственного университета имени Янки Купалы (г. Гродно, Республика
Беларусь). E-mail: sstat@grsu.by
1/--страниц
Пожаловаться на содержимое документа