close

Вход

Забыли?

вход по аккаунту

?

621.Вестник Томского государственного университета. Управление, вычислительная техника и информатика №2 2013

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО
МИНИСТЕРСТВО
ОБРАЗОВАНИЯ УНИВЕРСИТЕТА
И НАУКИ РФ
Управление, вычислительная техника и информатика
2013
№ 2(23)
ВЕСТНИК
ТОМСКОГО
ГОСУДАРСТВЕННОГО
УНИВЕРСИТЕТА
УПРАВЛЕНИЕ,
ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА
И ИНФОРМАТИКА
TOMSK STATE UNIVERSITY
JOURNAL OF CONTROL AND COMPUTER SCIENCE
Научный журнал
2013
№ 2(23)
Свидетельство о регистрации: ПИ № ФС 77-29497
от 27 сентября 2007 г.
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2
М.Е. Шайкин
РЕДАКЦИОННАЯ КОЛЛЕГИЯ ЖУРНАЛА
«ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА.
УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА»
Горцев А.М., д-р техн. наук, проф. (председатель); Смагин В.И., д-р техн. наук, проф.
(зам. председателя); Лопухова С.В., канд. физ.-мат. наук, доц. (отв. секретарь); Агибалов Г.П.,
д-р техн. наук, проф.; Дмитриев Ю.Г., д-р физ.-мат. наук, проф.; Домбровский В.В.,
д-р техн. наук, проф.; Змеев О.А., д-р физ.-мат. наук, проф.; Евтушенко Н.В., д-р техн. наук, проф.; Конев В.В., д-р физ.-мат. наук, проф.; Костюк Ю.Л., д-р техн. наук, проф.; Кошкин Г.М., д-р физ.-мат. наук, проф.; Матросова А.Ю., д-р техн. наук, проф.; Назаров А.А.,
д-р техн. наук, проф.; Параев Ю.И., д-р техн. наук, проф.; Поддубный В.В., д-р техн.
наук, проф.; Сущенко С.П., д-р техн. наук, проф.; Тарасенко Ф.П., д-р техн. наук, проф.;
Enzo Orsingher, Prof., University of Rome (Italy); Paolo Prinetto, Prof., Polytechnic Institute
Turine (Italy); Yervant Zorian, PhD, Vice President & Chief Scientist, Virage Logic Corp.,
Fremont, CA (USA).
Научный журнал «Вестник Томского государственного университета. Управление, вычислительная техника и информатика» был выделен в самостоятельное периодическое издание из общенаучного журнала «Вестник Томского государственного университета» в
2007 г. Журнал зарегистрирован в Федеральной службе по надзору в сфере массовых коммуникаций, связи и охраны культурного наследия (свидетельство о регистрации ПИ № ФС
77-29497 от 27 сентября 2007 г.), ему присвоен международный стандартный номер сериального издания (ISSN 1998-8605). С 2010 г. журнал входит в Перечень ВАК. Журнал выходит ежеквартально и распространяется по подписке, его подписной индекс 44031 в объединённом каталоге «Пресса России».
В журнале «Вестник ТГУ. УВТиИ» публикуются результаты теоретических и прикладных исследований вузов, научно-исследовательских, проектных и производственных организаций в области управления, вычислительной техники и информатики в технических,
экономических и социальных системах.
Тематика публикаций журнала:
• УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
• МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
• ОБРАБОТКА ИНФОРМАЦИИ
• ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
• ДИСКРЕТНЫЕ ФУНКЦИИ И АВТОМАТЫ
• ПРОЕКТИРОВАНИЕ И ДИАГНОСТИКА ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
Правила оформления статей приведены на сайте: http://vestnik.tsu.ru/informatics/
Адрес редакции:
634050, г. Томск, пр. Ленина, д.36, корп. 2, к. 201
Электронный адрес: http://vestnik.tsu.ru
Контактный тел./факс: (3822) 529-599
E-mail: vestnik_uvti@mail.tsu.ru
ООО «Издательство научно-технической литературы»
634050, Томск, пл. Новособорная, 1, тел. (3822) 533-335
Редактор Т.С. Портнова
Верстка Д.В. Фортеса
Изд. лиц. ИД № 04000 от 12.02.2001. Подписано к печати 06.06.2013.
Формат 70 × 100 1/16. Бумага офсетная. Печать офсетная. Гарнитура «Таймс».
Усл. п. л. 14,19. Уч.-изд. л. 15,89. Тираж 300 экз. Заказ № 62.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 2(23)
СОДЕРЖАНИЕ
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
Шайкин М.Е. Обобщение одного результата в статистической теории H2/H∞управления ................................................................................................................................ 5
ОБРАБОТКА ИНФОРМАЦИИ
Бахолдина М.А. Оптимальная оценка состояний модулированного обобщенного
полусинхронного потока событий ........................................................................................ 10
Бериков В.Б. Коллектив алгоритмов с весами в кластерном анализе разнородных
данных ..................................................................................................................................... 22
Буркатовская Ю.Б., Воробейчиков С.Э. Гарантированное оценивание параметров
порогового авторегрессионного процесса с условной неоднородностью ........................ 32
Горцев А.М., Голофастова М.Н. Оптимальная оценка состояний модулированного
синхронного дважды стохастического потока событий..................................................... 42
Леонова М.А., Нежельская Л.А. Оценка максимального правдоподобия длительности мертвого времени в обобщенном асинхронном потоке событий ........................... 54
Медведев Г.А. О временной структуре доходности. 5. Двухфакторные модели
Даффи – Кана (продолжение)................................................................................................ 64
Моисеев А.Н., Назаров А.А. Исследование системы массового обслуживания
HIGI|GI|∝ ................................................................................................................................. 75
Самаль Т.В. Сравнительный численный анализ временных структур доходности в
зависимости от размерности модели .................................................................................... 84
Сергеева Н.А., Цепкова М.В. О непараметрическом моделировании динамических
процессов................................................................................................................................. 92
Фан Н.Х., Буй Т.Т., Спицын В.Г. Распознавание жестов на видеопоследовательности в режиме реального времени на основе применения метода Виолы – Джонса,
алгоритма CAMShift, вейвлет-преобразования и метода главных компонент ................. 102
ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
Климова О.В. Методология декомпозиции данных и единое описание последовательных и параллельных алгоритмов вычисления операций цифровой обработки
сигналов................................................................................................................................. 112
Кабанова Е.С., Викентьев А.А. Расстояние между формулами пятизначной логики
Лукасевича и мера недостоверности высказываний экспертов в кластеризации
баз знаний.............................................................................................................................. 121
ПРОЕКТИРОВАНИЕ И ДИАГНОСТИКА ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
Матросова А.Ю., Кудин Д.В., Николаева Е.А., Румянцева Е.В. Обеспечение тестируемости задержек путей при синтезе схем покрытием BDD-графов ........................ 130
Матросова А.Ю., Митрофанов Е.В. Синтез легко тестируемых последовательностных схем............................................................................................................................. 140
ОБЗОРЫ
Рюмкин А.И., Костюк Ю.Л., Скворцов А.В. О развитии геоинформатики в Томском госуниверситете и НПО «Сибгеоинформатика»...................................................... 148
СВЕДЕНИЯ ОБ АВТОРАХ ....................................................................................................... 175
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
TOMSK STATE UNIVERSITY
2013
Journal of Control and Computer Science
No. 2(23)
CONTENTS
CONTROL OF DYNAMICAL SYSTEMS
Shaikin M.E. Extension of one known result in stochastic H2/H∞-control theory .......................... 5
DATА PROCESSING
Bakholdina M.A. The optimal states evaluation of modulated semisyncronous integrated
flow of events ........................................................................................................................... 10
Berikov V.B. Collective of algorithms with weights for clustering heterogeneous data............... 22
Burkatovskaya Yu.B., Vorobeychikov S.E. Guaranteed estimation of parameters of
threshold autoregressive process with conditional heteroskedasticity ..................................... 32
Gortsev A.M., Golofastova M.N. The optimal state estimation of modulated synchronous twice stochastic flow of events ........................................................................................ 42
Leonova M.A., Nezhelskaya L.A. Maximum likelihood estimation of dead time value at
a generalized asynchronous flow of events .............................................................................. 54
Medvedev G.A. On term structure of yield rates. 5. The Duffie–Kan two factor model
(continuation)............................................................................................................................ 64
Moiseev A.N., Nazarov A.A. Investigation of the queuing system HIGI|GI|∝ ............................ 75
Samal T.V. Comparative numerical analysis of temporal structure yield, depending on the
dimension of the model ............................................................................................................ 84
Sergeeva N.A., Tsepkova M.V. About nonparametric modeling of dynamic processes.............. 92
Phan N.H., Bui T.T., Spitsyn V.G. Real-time hand gesture recognition base on Viola –
Jones method, algorithm CAMShift, wavelet transform and principal component
analysis ................................................................................................................................... 102
INFORMATICS AND PROGRAMMING
Klimova O.V. Methodology of data decomposition and general description of sequential
and parallel algorithms for digital signal processing operations............................................ 112
Kabanova E.S., Vikentiev A.A. Distance between formulas of the five-valued Lukasiewicz logic and unreliability measure of expert statements on the clustering of
knowledge databases .............................................................................................................. 121
DESIGNING AND DIAGNOSTICS OF COMPUTER SYSTEMS
Matrosova A.Yu., Kudin D.V., Nikolaeva E.V., Roumjantseva E.V. Providing full
delay testability for circuits obtained by covering of BDDs .................................................. 130
Matrosova A.Yu., Mitrofanov E.V. Delay testable sequential circuit design ........................... 140
REVIEWS
Ryumkin A.I., Kostyuk Yu.L., Skvortsov A.V. About geoiformatics development in Tomsk State University and Sibgeoinformatcs Ltd ........................................ 148
BRIEF INFORMATION ABOUT THE AUTHORS................................................................... 175
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 2(23)
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
УДК 519.25
М.Е. Шайкин
ОБОБЩЕНИЕ ОДНОГО РЕЗУЛЬТАТА
В СТАТИСТИЧЕСКОЙ ТЕОРИИ H2/H∞-УПРАВЛЕНИЯ1
Получено решение задачи стохастического робастного H2/H∞-управления
динамической системой с внутренними шумами, мультипликативными по
состоянию и управлению, на конечном интервале времени. Задача сводится
к нахождению решения системы двух связанных матричных дифференциальных Риккати-подобных уравнений относительно матричных переменных
P1 (t ) ≤ 0, P2 (t ) ≥ 0.
Ключевые слова: шум, зависящий от состояния и управления, подавление
возмущений, робастное управление, матричное Риккати-подобное уравнение.
Рассмотрим многомерную стохастическую систему
dxt = ( A(t ) xt + B1 (t )vt + B2 (t )ut )dt + ( A0 (t ) xt + B10 (t )vt + B20 (t )ut ) dwt ,
zt = C (t ) xt + D(t )ut , x0 = a, t ∈ [0, T ], T < ∞,
(1)
где xt – вектор состояния, vt – внешнее возмущение, ut – управляющий сигнал, zt –
управляемый выход. Винеровский случайный процесс (wt ), не теряя в общности,
считаем скалярным. Вектор x0 не случайный. Процесс v = ( vt ), детерминированный или случайный неупреждающий, предполагается имеющим конечную энергию E
T
2
∫0 | vt | dt < ∞. Говоря формально, v есть элемент гильбертова пространства
L2F ([0, T ], L2 (Ω, R l )), где Ω – пространство элементарных событий, F – поток
T
σ-алгебр Ft . Норму процесса v определяем как || v ||= ( E ∫ | vt |2 dt )1/ 2 . Энергия
0
|| u || 2 процесса u = (ut ) также предполагается конечной, тогда существует единственное решение xt = x(t , u , v, x0 ) уравнения (1) с конечной энергией [1] . Ясно,
что в этом случае энергия процесса z тоже конечна. Считаем также выполненными условия D ′C = 0, D ′D = I , названные в [2] условиями регулярности, они не
слишком ограничительны. Заметим, что в ряде работ управляемый выход определяется как сумма z=C x+D u, тогда
z'z = x 'C 'C x + u' D' D u + x' C' D u + u' D' C x .
В других работах полагают z = (CDux ) , и тогда
z' z = x' C' C x + u' D' D u.
1
Работа выполнена при финансовой поддержке РФФИ (грант № 13-08-00744).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Е. Шайкин
6
Условие C'D = 0 снимает различие этих двух определений. Условие же D'D = I
вообще ограничением не является, если D – неособенная матрица.
Пусть L : v → z – оператор передачи внешнего возмущения на управляемый
выход. Предположим, что существует число γ > 0 , такое, что ||z|| < γ ||v||. Нормы
||v||, ||z|| индуцируют норму ||L|| оператора L по формуле ||L|| = sup (|| z || / || v ||) .
v ≠ 0, x0 = 0
Норма ||L|| < γ является мерой максимально негативного (наименее благоприятного) влияния, которое при заданном γ может иметь возмущение v на управляемый выход z. Пусть супремум по v ≠ 0, x0 = 0 достигается на элементе
v* ∈ L2F ([0, T ], L2 (Ω, R l )), тогда можно показать [2], что v* минимизирует функционал
T
J1 (v) = E ∫ ( γ 2 vt′vt − zt′ zt )dt .
0
(2)
Тем самым трудная задача вычисления нормы ||L|| < γ сводится к традиционной задаче минимизации функционала.
1. Постановка задачи
Сформулируем стохастические задачи H∞-управления и H2/H∞-управления для
системы (1). Задача H∞-управления состоит в следующем [3]: 1) Для заданного
вещественного числа γ > 0 найти такое управление
u* ∈ L2F ([0, T ], L2 (Ω, R m )) ,
что || L ||< γ, где L(v)=C x( . , u, v, 0) + D u; при этом 2) управление u* стабилизирует замкнутую систему, например, в следующем смысле:
lim E | x(t , u* , 0, x0 ) |2 = 0.
t →∞
Постановка задачи H2/H∞-управления включает те же требования 1), 2) и дополнительное требование: 3) если в уравнении (1) положить v = v∗ , то u = u ∗ минимизирует функционал энергии || z ||2 :
T
J 2 (u ) = E ∫ ( xt′C ′Cxt′ + u ′ut )dt .
0
(3)
Управление u, удовлетворяющее требованиям 1) –3), обозначаем через u ∗ .
Оно решает H2/H∞-задачу. В следующих двух разделах перейдем к решению задач
H∞ и H2/H∞ для системы (1), внутренние шумы которой представлены суммой
случайных процессов, мультипликативных – один по состоянию, другой по
управлению. Случайную составляющую B10 vt dwt, мультипликативную по внешнему возмущению v, считаем отсутствующей ( B10 = 0) . Задача H2/H∞-управления
для системы с внутренним шумом, мультипликативным по состоянию, упомянута
(по-видимому, впервые) в работе [3] как теоретически интересная и практически
значимая. Аналогичная задача для системы (1) с коэффициентами A0 ≠ 0, B10 ≠ 0 ,
но с B20 = 0 решена в работе [2].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Обобщение одного результата в статистической теории
7
2. Задача подавления внешнего возмущения
Замкнем систему (1) (считая B10 = 0 ) обратной связью ut ( x) = K 2 (t ) xt с переменным во времени коэффициентом передачи K 2 (t ) , пока не определенным. Получим замкнутую систему (нижний индекс «с» – от английского closed (замкнутый))
dxc(t) = (Ac(t) xc(t) + B1(t) vt )dt + A0c(t) xc(t) dwt ,
zc(t) = Cc(t) xc(t), xc(0) = a, t ∈ [0,T],
где xc (t ) – вектор состояния замкнутой системы и приняты обозначения
(4)
Ac (t) = A(t) + B2 (t) K2 (t), A0c (t) = A0 (t) + B20 (t) K2 (t),
(5)
Cc (t) = C(t) + D(t) K2 (t).
Сначала, задавшись числом γ > 0 , рассмотрим H∞-задачу гашения внешнего
возмущения. Формально считая vt управлением, задачу гашения будем интерпретировать как задачу минимизации по vt функционала
T
J1 (v) = E ∫ ( γ 2 vt′vt − zc′ (t ) zc (t ))dt.
0
(6)
Необходимое и достаточное условие существования решения H∞-задачи дается
фундаментальной леммой об ограниченности нормы оператора Lc : v → zc для
стохастической системы (4). Сформулируем здесь эту лемму [3].
Лемма об ограниченности. Для стохастической системы (4) и для заданного
γ > 0 условие || L ||< γ выполняется тогда и только тогда, когда дифференциальное уравнение Риккати
.
′ PA0c − γ −2 PB1 B1′ − Cc′Cc = 0, P(T ) = 0
P + Ac′ P + PAc + A0c
(7)
имеет единственное решение P1 (t ) ≤ 0 на [0, T]. Наименее благоприятное возмущение vt* дается формулой
vt* ( x) = −γ −2 B1′ (t ) P1 (t ) x.
В подробной записи уравнение (7) представляется в виде (см. (5))
P1 + ( A + B2 K 2 )′ P1 + P1 ( A + B2 K 2 ) − ( A0 + B20 K 2 )′ P1 ( A0 + B20 K 2 ) −
−γ −2 P1 B1 B1′P1 − K 2′ K 2 − C ′C = 0, P1 (T ) = 0.
(8)
Значение матрицы K 2 все еще не определено (оно будет определено ниже
формулой (10)).
3. Оптимизация системы при наихудшем внешнем возмущении
Подставив в (5) v = v* , получим систему
dxt = (( A(t ) − γ −2 B1 (t ) B1′ (t ) P1 (t )) xt + B2 (t )ut )dt + ( A0 (t ) xt + B20 (t )ut )dwt ,
zt = C (t ) xt + D(t )ut , x0 = a, t ∈ [0, T ].
(9)
Минимизируя функционал J 2 (u ) в формуле (3) при ограничении (9), получим оптимальное управление u* при наименее благоприятном возмущении v* . При
B20 (t ) ≡ 0 решение этой оптимизационной задачи представлено в [3]. В нашем
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
8
М.Е. Шайкин
случае, когда B20 (t ) ≠ 0 , решение u* также известно [4]. Оно получено с использованием теории FBSDE-решений систем прямого (forward) и обратного (backward) стохастических дифференциальных уравнений [5] и имеет вид
′ M ) xt ,
ut* (t ) = K 2 (t ) xt = −( B2′ P2 + B20
(10)
где P2 (t ) ≥ 0, t ∈ [0, T ] – единственное решение следующей дифференциальной
системы:
′ M−
P1 + ( A − γ −2 B1 B1′P1 )′ P2 + P2 ( A − γ −2 B1 B1′P1 ) + A0′ M − P2 B2 B20
′ M.
− P2 B2 B2′ P2 + C ′C = 0, P2 (T ) = 0, M = P2 A0 − P2 B20 B2′ P2 − P2 B20 B20
(11)
Система (11) включает дифференциальное уравнение типа Риккати и алгебраическое уравнение связи матриц P2 и M .
Полученную в работе систему уравнений (8), (11) можно считать обобщением
результата работы [3]. В самом деле, при B20 = 0 (когда нет шума, зависящего от
управления) имеем M = P2 A0 , см. (11), и, следовательно, ut* ( x) = − B2′ P2 x , где
P2 ≥ 0 – решение (существующее по доказанному в [6]) уравнения Риккати
P2 + ( A − γ −2 B1 B1′P1 )′ P2 + P2 ( A − γ −2 B1 B1′P1 ) + A0′ P2 A0 − P2 B2 B2′ P2 + C ′C = 0,
(12)
P2 (t ) = 0.
Система уравнений (11), (12) совпадает с аналогичной системой уравнений (43),
(45), полученной впервые в [3].
′ M из (10), получим запись уравнеПодставив в (8) значение K 2 = − B2′ P2 + B20
ния (8) в следующем виде:
′ M )′ P1 + P1 ( A − B2 B2′ P2 − B2 B20
′ M)−
P1 + ( A − B2 B2′ P2 − B2 B20
′ M )′ P1 ( A0 − B20 B2′ P2 − B20 B20
′ M)−
−( A0 − B20 B2′ P2 − B20 B20
−γ −2 P1 B1 B1′P1 − K 2′ K 2 − C ′C = 0, P1 (T ) = 0.
(13)
Решая систему уравнений (11), (13), получим затем искомые функции
vt* ( x), ut* ( x).
Заключение
В работе получено решение задачи стохастического робастного H2/H∞-управления для случая, когда диффузионная компонента стохастического дифференциального уравнения, описывающего систему управления, содержит внутренние
шумы системы, мультипликативные по состоянию и по управлению. Задача свелась к нахождению решения системы двух связанных дифференциальных уравнений (11), (13) относительно матричных переменных P1 (t ) ≤ 0, P2 (t ) ≥ 0.
ЛИТЕРАТУРА
1. Булинский А.В., Ширяев A.Н. Теория случайных процессов. М.: Физматлит, 2003. 399 c.
2. Hinrichsen D., Pritchard A.J. Stochastic H∞ // SIAM J. Control Optim. 1998. V. 36. No 5.
P. 1504−1538.
3. Chen B.S. and Zhang W. Stochastic H2/H∞-control with state-dependent noise // IEEE Trans.
Automat. Control. 2004. V. 49. No. 1. P. 45−56.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Обобщение одного результата в статистической теории
9
4. Wu Zhen. Forward-backward stochastic differential equations, linear quadratic stochastic optimal control and nonzero sum differential games // J. Systems Science and Complexity. 2005.
V.18. No. 2. P. 179−192.
5. Ma Jin, Protter Philip, Yong Jiongmin. Solving Forward-Backward Stochastic Differential
Equations Explicitly – A Four Step Scheme. Probability Theory and Related Fields. 1994.
V. 98. P. 339−359.
6. Bensoussan A. Lecture Notes in Mathematics. Springer Verlag, 1983. V. 972. P. 3−39.
Шайкин Михаил Ермолаевич
Институт проблем управления
им. В.А. Трапезникова РАН, Москва
E-mail: shaikin@ipu.ru
Поступила в редакцию 5 мая 2012 г.
Shaikin Michail E. (Institute of Control Sciences, RAS, Moscow). Extension of one known result in stochastic H2/H∞-control theory.
Keywords: state and control dependent noise, disturbance attenuation problem, robust control,
Riccati-type equation.
The paper discusses the stochastic linear H2/H∞-control problem with state and control dependent noise. The solution of stochastic H2/H∞-control problem with finite horizon has close relation to a pair of coupled Riccati-type equations.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 2(23)
ОБРАБОТКА ИНФОРМАЦИИ
УДК 519.21
М.А. Бахолдина
ОПТИМАЛЬНАЯ ОЦЕНКА СОСТОЯНИЙ МОДУЛИРОВАННОГО
ОБОБЩЕННОГО ПОЛУСИНХРОННОГО ПОТОКА СОБЫТИЙ1
Решается задача оптимальной оценки состояний модулированного обобщенного полусинхронного потока событий, являющегося одной из математических моделей информационных потоков заявок, функционирующих в
цифровых сетях интегрального обслуживания (ЦСИО). Находится явный
вид апостериорных вероятностей состояний потока. Решение о состоянии
потока выносится по критерию максимума апостериорной вероятности.
Приводятся численные результаты, полученные с использованием расчетных формул и имитационного моделирования.
Ключевые слова: модулированный обобщенный полусинхронный поток событий, состояние потока, апостериорная вероятность состояния, оценка
состояния.
В последнее время в связи с бурным развитием компьютерной техники и информационных технологий появилась важная сфера приложений теории массового обслуживания – проектирование и создание информационно-вычислительных
сетей, телекоммуникационных сетей и т.п., объединенных термином ЦСИО.
Математические методы теории массового обслуживания обеспечивают возможность решения многочисленных задач расчета характеристик качества функционирования различных компонент ЦСИО, включая оценку вероятностновременных характеристик узлов коммутации и маршрутизации; анализ буферной
памяти узлов и методов локального и глобального управления потоками и т.д.
Стоит отметить, что условия функционирования реальных объектов и систем
таковы, что если в отношении параметров обслуживающих устройств можно сказать, что они известны и с течением времени не меняются, то в отношении интенсивностей входящих потоков этого сказать во многих случаях нельзя. Более того,
интенсивности входящих потоков обычно меняются со временем, часто эти изменения носят случайный характер, что приводит к рассмотрению математических
моделей дважды стохастических потоков событий. По-видимому, статья [1] является одной из первых работ в этом направлении, где дважды стохастический
поток определяется как поток, интенсивность которого есть случайный процесс.
С другой стороны, функционирование систем массового обслуживания зависит от
параметров и состояний входящих потоков. В подобных ситуациях наиболее рациональным является применения адаптивных систем массового обслуживания,
1
Работа выполнена в рамках государственного задания Минобрнауки РФ на проведение научных исследований в Томском государственном университете на 2012−2014 годы, задание 8.4055.2011.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальная оценка состояний модулированного обобщенного полусинхронного потока
11
которые в процессе функционирования оценивают неизвестные параметры либо
состояния входящих потоков и изменяют дисциплину обслуживания в соответствии с полученными оценками [2].
Дважды стохастические потоки событий можно разделить на два класса:
к первому классу относятся потоки, интенсивность которых есть непрерывный
случайный процесс; ко второму – потоки, интенсивность которых есть кусочнопостоянный случайный процесс с конечным числом состояний. Потоки второго
класса впервые и независимо введены в работах [3−5]. В [3, 4] введенные потоки
названы MC (Markov chain)-потоками; в [5] – MVP (Markov Versatile Processes)потоками. Последние с начала 90-х годов получили название MAP (Markovian Arrival Process)-потоков событий.
В свою очередь, в зависимости от того, каким образом происходит переход из
состояния в состояние, MC-потоки событий можно разделить на три типа: 1) синхронные потоки [6]; 2) асинхронные потоки [7]; 3) полусинхронные потоки [8].
Здесь указаны ссылки на статьи, в которых авторы впервые рассматривали MCпотоки событий в соответствии с приведенной классификацией. Наиболее полная
литература по изучаемым типам MC-потоков событий приведена в [9].
Подчеркнем, что синхронные, асинхронные и полусинхронные потоки возможно представить в виде моделей MAP-потоков событий первого либо второго
порядков [10]. В [10] показывается, что синхронный MC-поток является частным
случаем MAP-потока первого порядка, асинхронный и полусинхронный MCпотоки – частными случаями MAP-потока второго порядка. Как было отмечено
выше, в реальных ситуациях интенсивность входящего потока событий изменяется со временем случайным образом, поэтому для реализации адаптивного управления системой массового обслуживания требуется решение следующих задач: 1)
оценка состояний потока по наблюдениям за моментами наступления событий
[11, 12]; 2) оценка параметров потока по наблюдениям за моментами наступления
событий [13].
В работе [14] введен в рассмотрение модулированный обобщенный полусинхронный поток событий, относящийся к классу MAP-потоков второго порядка.
В настоящей статье, являющейся непосредственным развитием работы [14], решается в полной мере задача оптимальной оценки состояний модулированного
обобщенного полусинхронного потока событий. Предлагается алгоритм оптимальной оценки состояний, когда решение о состоянии потока выносится по критерию максимума апостериорной вероятности, представляющей наиболее полную
характеристику состояния потока, которую можно получить, располагая только
выборкой наблюдений. Сам критерий минимизирует полную вероятность ошибки
вынесения решения [15].
1. Постановка задачи
Рассматривается модулированный обобщенный полусинхронный поток событий (далее – поток), интенсивность которого есть кусочно-постоянный стационарный случайный процесс λ(t) с двумя состояниями λ1 , λ 2 (λ1 > λ 2 ) . Длительность пребывания процесса λ(t) (потока) в первом состоянии распределена по экспоненциальному закону с параметром β , во втором – с параметром α . Если процесс λ(t) в момент времени t находится в первом (во втором) состоянии, то на полуинтервале [t , t + ∆t ) , где ∆t (здесь и далее) – достаточно малая величина, с ве-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.А. Бахолдина
12
роятностью β∆t + o(∆t ) (с вероятностью α∆t + o(∆t ) ) пребывание процесса λ(t) в
первом (во втором) состоянии закончится, и процесс λ(t) с вероятностью единица
перейдет из первого (второго) состояния во второе (в первое). В течение временного интервала случайной длительности, когда λ (t ) = λ i , имеет место пуассоновский поток событий с интенсивностью λ i , i = 1, 2 . Кроме того, переход из первого состояния процесса λ(t) во второе возможен в момент наступления события пуассоновского потока интенсивности λ1 ; переход осуществляется с вероятностью
р (0 < p ≤ 1) ; с вероятностью 1 – р процесс λ(t) остается в первом состоянии (т.е.
сначала наступает событие потока, затем происходит переход процесса λ(t) из
первого состояния во второе). Переход из второго состояния процесса λ (t ) в первое в момент наступления события пуассоновского потока интенсивности λ 2 невозможен. В момент окончания второго состояния процесса λ(t) при его переходе
с вероятностью единица из второго состояния в первое инициируется с вероятностью δ (0 ≤ δ ≤ 1) дополнительное событие в первом состоянии (т.е. сначала
осуществляется переход, а затем инициируется или не инициируется дополнительное событие). В сделанных предпосылках λ(t) – марковский процесс. Вариант
возникающей ситуации приведен на рис.1, где λ1 , λ 2 – состояния процесса λ(t);
t1 , t2 ,... – моменты наступления событий потока.
λ(t)
λ1
1–p
1–p
p
α
α
β
λ2
δ
0
t1
t2
t3
t4
t5
t6
t7
t
Рис. 1. Модулированный обобщенный полусинхронный поток событий
Блочная матрица инфинитезимальных коэффициентов примет вид
− ( λ1 + β )
β
(1 − p ) λ1 pλ1
D=
= D0 D1 .
λ2
(1 − δ ) α − ( λ 2 + α ) δα
(1)
Матрица D0 описывает ситуацию, когда на полуинтервале [t , t + ∆t ) нет события потока, матрица D1 – когда на полуинтервале [t , t + ∆t ) есть событие потока.
Отметим, что если β = 0 , то имеет место обобщенный полусинхронный поток событий [9].
Так как процесс λ (t ) и типы событий (события пуассоновских потоков с интенсивностями λ1 либо λ 2 ) являются принципиально ненаблюдаемыми, а наблюдаемыми являются только временные моменты наступления событий на временной оси t1 , t2 ,... , то необходимо по этим наблюдениям оценить состояние
процесса λ(t) (потока) в момент окончания наблюдений. Рассматривается стационарный режим функционирования потока событий, поэтому переходными про-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальная оценка состояний модулированного обобщенного полусинхронного потока
13
цессами на интервале наблюдения (t0 , t ) , где t0 – начало наблюдений, t – окончание наблюдений (момент вынесения решения), пренебрегаем. Тогда без потери
общности можно положить t0 = 0 . Для вынесения решения о состоянии процесса
λ(t) в момент времени t необходимо определить апостериорные вероятности
w ( λ i | t ) = w ( λi | t1 ,..., tm , t ) , i = 1, 2 , того, что в момент времени t значение процесса λ (t ) = λ i (m – количество наблюденных событий за время t), при этом
w ( λ1 | t ) + w ( λ 2 | t ) = 1 . Решение о состоянии процесса λ (t ) выносится путем
сравнения апостериорных вероятностей: если w ( λ j | t ) ≥ w ( λ i | t ) , i, j = 1, 2 , i ≠ j ,
то оценка состояния процесса есть λˆ ( t ) = λ j .
2. Вывод апостериорной вероятности состояний
модулированного обобщенного полусинхронного потока событий
Момент
вынесения
решения
будет
принадлежать
интервалу
( tk , tk +1 ) , k = 1, 2,... , между соседними событиями потока. Для начального интервала ( t0 , t1 ) момент t будет лежать между началом наблюдения t0 и первым наблюденным событием потока. Рассмотрим интервал ( tk , tk +1 ) , значение длительности которого есть τk = tk +1 − tk , k = 0,1,... . Для вывода формул апостериорной
вероятности w ( λ1 | t ) используем известную методику [14]: сначала рассмотрим
дискретные наблюдения через равные достаточно малые промежутки времени
∆t , а затем совершим предельный переход при стремлении ∆t к нулю. Пусть
время меняется дискретно с шагом ∆t : t = n∆t , n = 0,1,... . Введем двумерный про-
( λ( n) , rn ) ,
цесс
где λ ( n ) = λ ( n∆t ) – значение процесса λ (t ) в момент времени
(
)
n∆t λ ( n ) = λi , i = 1, 2 ; rn = rn ( ∆t ) = r ( n∆t ) − r ( ( n − 1) ∆t ) – число событий потока,
наблюдаемых на интервале ( ( n − 1) ∆t , n∆t ) длительности ∆t , rn = 0,1,... . Обозначим через Rm = ( r0 , r1 ,..., rm ) последовательность числа событий за время от нуля
до m∆t на интервалах ( ( n − 1) ∆t , n∆t ) длительности ∆t
( n = 0, m ) . Здесь r0 – чис-
ло событий, наблюдаемых на интервале ( −∆t , 0 ) . Это число не определено, так
как на этом интервале наблюдений не производится, поэтому его можно задать
(
произвольным, например r0 = 0 . Обозначим через Λ ( m ) = λ ( 0 ) , λ (1) ,..., λ ( m )
)
по-
следовательность неизвестных (ненаблюдаемых) значений процесса λ ( n∆t ) в
моменты времени n∆t
(
( n = 0, m ) ;
λ ( 0 ) = λ ( 0 ) = λ i , i = 1, 2 . Обозначим через
)
w λ ( m ) | Rm условную вероятность значения λ ( m ) при условии, что наблюдалась
(
)
реализация Rm . Аналогично w λ ( m +1) | Rm +1 . Для марковского случайного про-
(
цесса λ ( n ) , rn
)
в [7] получена рекуррентная формула, связывающая апостериор-
(
)
(
)
ные вероятности w λ ( m ) | Rm и w λ ( m +1) | Rm +1 :
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.А. Бахолдина
14
λ2
(
w λ
( m +1)
)
λ
| Rm +1 =
(
m
) (
w λ ( m ) | Rm p λ ( m +1) , rm +1 | λ ( m ) , rm
∑
( )
=λ1
λ2
λ2
∑
∑
(
где p λ( m +1) , rm +1 | λ ( m ) , rm
шаг ∆t из состояния
)
(
w λ
λ( m ) =λ1 λ( m +1) =λ1
( m)
) (
| Rm p λ
( m +1)
, rm +1 | λ
– вероятность перехода процесса
( λ( m) , rm )
в состояние
(
)
( m)
, rm
)
( λ( n) , rn )
,
(2)
за один
( λ( m+1) , rm+1 ) . В рассматриваемом
)
случае потока случайный процесс λ ( n ) , rn , в силу предпосылок и его конструкции, является марковским, так что формула (2) имеет место.
Лемма 1. В течение времени между моментами наступления соседних событий потока tk и tk +1 , k = 0,1,... , апостериорная вероятность w(λ1 | t ) удовлетворяет
дифференциальному уравнению
w '(λ1 | t ) = α (1 − δ ) − ( λ1 − λ 2 + α + β − 2αδ ) w(λ1 | t ) + ( λ1 − λ 2 − αδ ) w2 (λ1 | t ) ,
tk ≤ t < tk +1 , k = 0,1,... .
(3)
(
)
) (
)
Доказательство. Переходная вероятность p λ( m +1) , rm +1 | λ ( m ) , rm
для потока
в (2) запишется в виде
(
)
(
p λ( m +1) , rm +1 | λ( m ) , rm = p λ ( m +1) | λ ( m ) ⋅ p rm +1 | λ ( m ) , λ ( m +1) ;
λ ( m ) , λ ( m +1) = λ1 , λ 2 .
Принимая во внимание, что
(
)
(
(4)
)
(
)
w λ ( m ) | Rm = w λ ( m ) | Rm ( t ) = w λ ( m ) | t ,
(
)
(
)
(
)
w λ ( m +1) | Rm +1 = w λ ( m +1) | Rm +1 ( t + ∆t ) = w λ ( m +1) | t + ∆t ,
учитывая (4) и полагая в (2) для определенности λ ( m +1) = λ1 , получаем (2) в виде
2
w ( λ1 | t + ∆t ) =
∑ w ( λ s | t ) p ( λ1 | λ s ) p ( rm+1 | λ s , λ1 )
2
s =1
2
.
(5)
∑∑ w ( λ s | t ) p ( λ j | λ s ) p ( rm+1 | λ s , λ j )
j =1 s =1
В силу определения потока величина rm +1 принимает только два значения:
rm +1 = 0 , rm +1 = 1 . Здесь рассматривается поведение вероятности w ( λ1 | t ) на полуинтервале
[tk , tk +1 ) между соседними событиями потока, т.е. tk ≤ t < tk +1 ;
tk ≤ t + ∆t < tk +1 . Тогда в (5) rm +1 = 0 и с учетом матрицы D0 в (1) на полуинтер-
вале [t , t + ∆t ) = [ m∆t , ( m + 1) ∆t ) переходные вероятности (4) примут вид
p ( λ1 | λ1 ) p ( rm +1 = 0 | λ1 , λ1 ) = 1 − ( λ1 + β ) ∆t + o ( ∆t ) ,
p ( λ 2 | λ 2 ) p ( rm +1 = 0 | λ 2 , λ 2 ) = 1 − ( λ 2 + α ) ∆t + o ( ∆t ) ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальная оценка состояний модулированного обобщенного полусинхронного потока
15
p ( λ1 | λ 2 ) p ( rm +1 = 0 | λ 2 , λ1 ) = (1 − δ ) α∆t + o ( ∆t ) ,
p ( λ 2 | λ1 ) p ( rm +1 = 0 | λ1 , λ 2 ) = β∆t + o ( ∆t ) .
(6)
Подставляя (6) в (5), учитывая, что w ( λ 2 | t ) = 1 − w ( λ1 | t ) , находим числитель А0
и знаменатель B0 в (5):
А0 = (1 − δ ) α∆t + (1 − ( λ1 + β ) ∆t − (1 − δ ) α∆t ) w ( λ1 | t ) + o ( ∆t ) ,
B0 = 1 − ∆t [ αδ + λ 2 + ( λ1 − λ 2 − αδ ) w ( λ1 | t )] + o ( ∆t ) .
Подставляя А0 и B0 в (5) и учитывая при этом, что
B0 −1 = 1 + ∆t ⋅ [ αδ + λ 2 + ( λ1 − λ 2 − αδ ) ⋅ w ( λ1 | t )] + o ( ∆t )
(так как (1 − x )
−1
= 1 + x + o ( x ) для достаточно малых x > 0 ), получаем
w(λ1 | t + ∆t ) − w(λ1 | t ) =
{
}
= ∆t α (1 − δ ) − ( λ1 − λ 2 + α + β − 2αδ ) w(λ1 | t ) + ( λ1 − λ 2 − αδ ) w2 (λ1 | t ) + o ( ∆t ) .
Деля здесь левую и правую части на ∆t и переходя к пределу при ∆t → 0 , находим (3). Лемма 1 доказана.
Замечание 1. Уравнение (3) определяет поведение вероятности w ( λ1 | t ) на
полуинтервале [tk , tk +1 ) , k = 0,1,... , т.е. между моментами наступления событий,
причем на правом конце полуинтервала имеет место значение w ( λ1 | tk +1 − 0 ) , на
основе которого, как будет показано в лемме 2, находится вероятность
w ( λ1 | tk +1 + 0 ) , являющаяся начальной для следующего полуинтервала
[tk +1 , tk + 2 ) .
Лемма 2. Апостериорная вероятность w ( λ1 | t ) в момент наступления события
потока tk , k = 0,1,... , определяется формулой пересчета
w ( λ1 | tk + 0 ) =
Доказательство.
αδ + [ λ1 (1 − p ) − αδ ] w ( λ1 | tk − 0 )
, k = 1, 2,... .
λ 2 + αδ + ( λ1 − λ 2 − αδ ) w ( λ1 | tk − 0 )
Пусть
на
интервале
( t , t + ∆t )
в
момент
(7)
времени
tk ( t < tk < t + ∆t ) наступает событие потока ( rm +1 = 1 ). Имеем два смежных интервала ( t , t k ) , ( tk , t + ∆t ) с длительностями tk − t = ∆t ′ , t + ∆t − tk = ∆t ′′ . Тогда
w ( λ s | t ) = w ( λ s | tk − ∆t ′ ) , s = 1,2; w ( λ1 | t + ∆t ) = w ( λ1 | tk + ∆t ′′ ) и (5) примет вид
2
w ( λ1 | tk + ∆t ′′ ) =
∑ w ( λ s | tk − ∆t′) p ( λ1 | λ s ) p ( rm+1 | λ s , λ1 )
2
s =1
2
∑∑ w ( λ s | tk − ∆t′) p ( λ j | λ s ) p ( rm+1 | λ s , λ j )
.
(8)
j =1 s =1
С учетом матрицы D1 в (1) на интервале ( t , t + ∆t ) = ( m∆t , ( m + 1) ∆t ) вероятности
(4) запишутся в виде
p ( λ1 | λ1 ) p ( rm +1 = 1| λ1 , λ1 ) = (1 − p ) λ1∆t + o ( ∆t ) ,
p ( λ 2 | λ 2 ) p ( rm +1 = 1| λ 2 , λ 2 ) = λ 2 ∆t + o ( ∆t ) ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.А. Бахолдина
16
p ( λ1 | λ 2 ) p ( rm +1 = 1| λ 2 , λ1 ) = αδ∆t + o ( ∆t ) ,
p ( λ 2 | λ1 ) p ( rm +1 = 1| λ1 , λ 2 ) = pλ1∆t + o ( ∆t ) .
(9)
Подставляя (9) в (8), получаем числитель А1 и знаменатель B1 в (8):
А1 = ∆t ( (1 − p ) λ1w ( λ1 | tk − ∆t ′ ) + αδw ( λ 2 | tk − ∆t ′ ) ) + o ( ∆t ) ,
B1 = ∆t ( λ1w ( λ1 | tk − ∆t ′ ) + ( λ 2 + αδ ) w ( λ 2 | tk − ∆t ′ ) ) + o ( ∆t ) .
Подставляя А1 и B1 в (8), деля числитель и знаменатель на ∆t , учитывая, что
w ( λ 2 | tk − ∆t ′ ) = 1 − w ( λ1 | tk − ∆t ′ ) , и переходя к пределу при ∆t → 0 ( ∆t ′ и ∆t ′′
одновременно стремятся к нулю), получаем (7). Лемма 2 доказана.
Замечание 2. В точке tk вероятность w ( λ1 | t ) претерпевает разрыв (имеет место конечный скачок). Тогда решение уравнения (3) будет зависеть от начального
условия в момент времени tk , т.е. от w ( λ1 | tk + 0 ) , k = 1, 2,... . В свою очередь,
w ( λ1 | tk + 0 ) зависит от значения w ( λ1 | tk − 0 ) – значения вероятности w ( λ1 | t ) в
момент времени tk , когда w ( λ1 | t ) , определяемая в (3), изменяется на полуинтервале [tk −1 , tk ) , соседнем с полуинтервалом [tk , tk +1 ) , k = 1, 2,... . Таким образом, в
значении w ( λ1 | tk + 0 ) «сосредоточена» вся предыстория наблюдений за потоком
начиная от момента времени t0 = 0 до момента tk . В качестве начального условия
w ( λ1 | t0 + 0 ) = w ( λ1 | t0 = 0 ) на полуинтервале [t0 , t1 ) в (3) выбирается априорная
финальная вероятность первого состояния процесса λ (t ) :
π1 = α / ( α + β + pλ1 ) .
(10)
Леммы 1 и 2 позволяют сформулировать следующую теорему.
Теорема. Поведение апостериорной вероятности w ( λ1 | t ) на временном по-
луинтервале [tk , tk +1 ) , k = 1, 2,... , определяется явной формулой
w ( λ1 | t ) =
w1 =
w1 [ w2 − w ( λ1 | tk + 0 )] − w2 [ w1 − w ( λ1 | tk + 0 )] e−b( t −tk )
w2 − w ( λ1 | tk + 0 ) − [ w1 − w ( λ1 | tk + 0 )] e−b( t −tk )
,
(11)
λ1 − λ 2 + α + β − 2αδ − b
λ − λ 2 + α + β − 2αδ + b
, w2 = 1
,
2 ( λ1 − λ 2 − αδ )
2 ( λ1 − λ 2 − αδ )
2
b = ( λ1 − λ 2 − α + β ) + 4αβ (1 − δ ) ,
где tk ≤ t < tk +1 , k = 0,1,... ; w ( λ1 | t0 + 0 ) = w ( λ1 | t0 = 0 ) = π1 , π1 определена в (10),
w ( λ1 | tk + 0 ) – в (7).
Доказательство. Уравнение (3) в лемме 1 представимо в виде
(( w (λ
1
−1
| t ) − w1 ) − ( w ( λ1 | t ) − w2 )
−1
) dw ( λ
1
| t ) = ( λ1 − λ 2 − αδ ) dt ,
(12)
где w1 и w2 определены в (11). Интегрируя (12) в пределах от tk + 0 до t, получаем (11). Теорема доказана.
Особый случай. λ1 − λ 2 − αδ = 0 . Тогда формула (11) примет вид
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальная оценка состояний модулированного обобщенного полусинхронного потока
w ( λ1 | t ) =
17
α (1 − δ ) ⎡
α (1 − δ ) ⎤ −( α+β−αδ )( t −tk )
+ ⎢ w ( λ1 | tk + 0 ) −
e
,
α + β − αδ ⎣
α + β − αδ ⎥⎦
где tk ≤ t < tk +1 , k = 0,1,... .
Формула (7) остается без изменения. Если к ограничению λ1 − λ 2 − αδ = 0 добавить еще одно ограничение: (1 − p ) λ1 − αδ = 0 , то тогда (7) запишется в виде
w ( λ1 | tk + 0 ) = αδ / ( λ 2 + αδ ) , k = 1, 2,... , т.е. в этом случае апостериорная вероятность w ( λ1 | t ) не зависит от предыстории, а зависит только от ее значения в момент tk .
Частный случай. Если p = 1 , δ = 0 , то тогда w ( λ1 | tk + 0 ) = 0, k = 1, 2,... , т.е. в
этом случае апостериорная вероятность w ( λ1 | t ) также не зависит от предыстории, а зависит только от ее значения в момент tk .
3. Результаты численных расчетов
Для получения численных результатов разработан алгоритм вычисления апостериорной вероятности w ( λ1 | t ) по формулам (7), (10), (11). Программа расчета
реализована на языке программирования С#, Microsoft Visual Studio 2012. Первый
этап расчета предполагает имитационное моделирование потока и как результат
получение истинной траектории интенсивности потока λ ( t ) и временных моментов t1 , t2 ,... наступления событий потока. Описание алгоритма имитационного
моделирования здесь не приводится, так как никаких принципиальных трудностей алгоритм не содержит. Второй этап расчета – непосредственное вычисление
вероятностей w ( λ1 | t ) , t0 ≤ t < t1 ; w ( λ1 | tk + 0 ) , k = 1, 2,... ; w ( λ1 | t ) , tk ≤ t < tk +1 ,
k = 1, 2,... , по формулам (7), (10), (11) и построение оценки λˆ ( t ) . Расчеты произведены для следующих значений параметров: λ1 = 8 , λ 2 = 1 , p = 0,2, β = 0,8 ,
α = 0,5 , δ = 0,8 , число событий входящего потока m = 1000. Данное число событий определяет время моделирования. В качестве иллюстрации на рис. 2 приведена траектория (верхняя часть рис. 2) процесса λ (t ) (истинная траектория), полученная путем имитационного моделирования, и траектория (нижняя часть рис. 2)
оценки λˆ ( t ) .
λ1
λ2
Реализация процесса λ(t)
λ1
λ2
0
Реализация оценки процесса λ(t)
0,5
1,0
1,5
2,0
Рис. 2. Траектория процесса λ(t) и его оценки λˆ ( t )
2,5
t
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.А. Бахолдина
18
Вынесение решения о состоянии процесса λ (t ) производилось с шагом
∆t = 0, 001 . На рис. 2 штриховкой на оси времени обозначены промежутки, на которых оценка состояния не совпадает с истинным значением процесса λ (t ) (область ошибочных решений). На рис. 3 приведена траектория поведения вероятности w ( λ1 | t ) , соответствующей полученной при имитационном моделировании
последовательности наступления событий t1 , t2 ,... .
w(λ1| t)
1
0,5
0,5
0
1,0
1,5
2,0
2,5
t
Рис. 3. Траектория апостериорной вероятности w ( λ1 | t )
Для установления частоты ошибочных решений о состояниях процесса λ (t )
по наблюдениям за потоком проведен статистический эксперимент, состоящий из
следующих этапов: 1) для определенного набора параметров n, λ1 , λ 2 , p, β, α, δ
осуществляется моделирование потока событий на протяжении времени моделирования ⎡⎣0, Tm j ⎤⎦ (отдельный j-й эксперимент); 2) рассчитывается вероятность
w ( λ1 | t ) на отрезке ⎡⎣0, Tm j ⎤⎦ по формулам (7), (10), (11); 3) оценивается траектория процесса λ (t ) на отрезке ⎡⎣0, Tm j ⎤⎦ ; 4) осуществляется определение (для j-го
эксперимента) d j – суммарной протяженности интервалов, на которых истинная
траектория процесса λ (t ) не совпадает с траекторией его оценки λˆ ( t ) ; 5) вычисляется доля ошибочных решений pˆ j = d j / Tm j ; 6) Производится повторение
N раз ( j = 1, N ) шагов 1–5 для расчета оценки безусловной (полной) вероятности
ошибки принятия решения о состояниях процесса λ (t ) .
Результатом выполнения описанного алгоритма является выборка
( pˆ1 , pˆ 2 ,... pˆ N ) долей ошибочных решений в N экспериментах. По этому набору
вычисляются выборочное среднее безусловной вероятности ошибочного решения
N
N
j =1
j =1
2
Pˆ0 = (1/ N ) ∑ pˆ j и выборочная дисперсия Dˆ = (1/ ( N − 1) ) ∑ ( pˆ j − Pˆ0 ) .
Результаты статистического эксперимента приведены в табл. 1–5. В первой
строке таблиц указан параметр, значение которого изменяется от опыта к опыту.
Во второй и третьей строках приведены для каждого опыта численные значения
P̂0 и D̂ .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальная оценка состояний модулированного обобщенного полусинхронного потока
19
При этом результаты получены при следующих значениях параметров:
в табл. 1 для m = 1000 , λ 2 = 3,5 , p = 0,8 , β = 0, 4 , α = 0, 4 , δ = 0,9 , N = 100 ,
в табл. 2 – для m = 1000 , λ1 = 14 , λ 2 = 3,5 , β = 0, 4 , α = 0, 4 , δ = 0,9 , N = 100 ,
в табл. 3 – для m = 1000 , λ1 = 14 , λ 2 = 3,5 , p = 0,8 , α = 0, 4 , δ = 0,9 , N = 100 ,
в табл. 4 – для m = 1000 , λ1 = 14 , λ 2 = 3,5 , p = 0,8 , β = 0, 4 , δ = 0,9 , N = 100 ,
в табл. 5 – для m = 1000 , λ1 = 14 , λ 2 = 3,5 , p = 0,8 , β = 0, 4 , α = 0, 4 , N = 100 .
Таблица 1
λ1
7
8
9
10
11
12
13
14
P̂0
0,0634
0,0560
0,0508
0,0449
0,0427
0,0385
0,0364
0,0339
D̂
0,00006
0,00006
0,00004
0,00004
0,00002
0,00002
0,00002
0,00003
Таблица 2
p
0,1
0,2
0,3
0,4
P̂0 0,1417 0,1081 0,0813 0,0613
D̂
0,5
0,6
0,7
0,8
0,9
1
0,0530
0,0430
0,0378
0,0339
0,0300
0,0271
0,0002 0,0002 0,0001 0,00009 0,00005 0,00003 0,00003 0,00001 0,00001 0,00001
Таблица 3
β
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
P̂0
0,0344 0,0337 0,0340 0,0333 0,0332 0,0336 0,0331 0,0321 0,0325 0,0322
D̂
0,00001 0,00001 0,00002 0,00003 0,00002 0,00002 0,00001 0,00002 0,00002 0,00001
Таблица 4
α
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
P̂0
0,0085 0,0172 0,0251 0,0333 0,0417 0,0492 0,0589 0,0654 0,0727 0,0804
D̂
0,00001 0,00001 0,00001 0,00002 0,00002 0,00003 0,00004 0,00004 0,00004 0,00005
Таблица 5
δ
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
P̂0
0,0334 0,0335 0,0335 0,0334 0,0339 0,0337 0,0335 0,0336 0,0338 0,0335
D̂
0,00001 0,00002 0,00001 0,00002 0,00002 0,00002 0,00002 0,00002 0,00002 0,00002
Отметим, что анализ проведенных многочисленных вариантов расчетов по
нахождению оценки P̂0 показывает, что P̂0 является достаточно стабильной для
m = 1000 событий потока. Вследствие этого m для всех экспериментов выбрано
равным 1000 событий. Анализ результатов, приведенных в табл. 1–5, показывает,
что тренд значений оценки P̂0 в зависимости от λ1 убывающий, так как при увеличении разности λ1 − λ 2 условия различимости состояний потока улучшаются,
при этом оценка D̂ для всех вариантов расчета достаточно мала.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
20
М.А. Бахолдина
Анализ результатов табл. 2 показывает, что значение оценки P̂0 уменьшается
при увеличении вероятности перехода р из первого во второе состояние процесса
λ (t ) . Это связано с тем, что при увеличении параметра р процесс λ (t ) преимущественно будет находиться во втором состоянии, что улучшает условия различимости состояний потока. В случае табл. 3 значение вероятности перехода р = 0,8
достаточно велико, поэтому с вероятностью 0,8 в момент наступления события
пуассоновского потока процесс λ (t ) переходит из первого состояния во второе и
изменение параметра β не приводит к изменению оценки P̂0 . Анализируя табл. 4,
можно прийти к выводу, что при увеличении α значение оценки P̂0 также увеличивается. Это связано с тем, что при увеличении параметра α число переходов
процесса λ (t ) из состояния λ 2 в состояние λ1 увеличивается, и поэтому условия
различимости состояний потока ухудшаются. Анализ результатов табл. 5 показывает, что изменение параметра δ не сказывается на величине оценки P̂0 , так как
длительность нахождения процесса λ (t ) в состоянии λ 2 определяется только
параметром α .
Заключение
Полученные результаты показывают возможность оценивания состояний потока по результатам текущих наблюдений за потоком. Это позволяет изменять
режимы работы системы обслуживания в зависимости от того или иного состояния потока. Выражения апостериорных вероятностей получены в явном виде, что
позволяет производить вычисления без привлечения численных методов. Сам же
алгоритм оценки состояний потока обеспечивает минимум безусловной (полной)
вероятности ошибки вынесения решения.
ЛИТЕРАТУРА
1. Kingman Y.F.C. On doubly stochastic Poisson process // Proc. Cambridge Phylosoph. Soc.
1964. V.60. No 4. P. 923–930.
2. Горцев А.М., Назаров А.А., Терпугов А.Ф. Управление и адаптация в системах массового обслуживания. Томск: Изд-во ТГУ, 1978. 208 с.
3. Башарин Г.П., Кокотушкин В.А., Наумов В.А. О методе эквивалентных замен расчета
фрагментов сетей связи // Изв. АН СССР. Техн. кибернетика. 1979. № 6. С. 92–99.
4. Башарин Г.П., Кокотушкин В.А., Наумов В.А. О методе эквивалентных замен расчета
фрагментов сетей связи // Изв. АН СССР. Техн. кибернетика. 1980. № 1. С. 55–61.
5. Neuts M.F. A versatile Markov point process // Appl. Probab. 1979. V.16. P. 764–779.
6. Нежельская Л.А. Нелинейная оптимальная фильтрация дважды стохастического потока с инициативными событиями // Тез. докл. науч.-технич. конф. «Микросистема-91».
Суздаль. М.: Всесоюзное общество информатики и вычислительной техники, 1991.
С. 26–28.
7. Горцев А.М., Нежельская Л.А. Оптимальная нелинейная фильтрация марковского потока событий с переключениями // Техника средств связи. Сер. Системы связи. 1989.
Вып. 7. С. 46–54.
8. Горцев А.М., Нежельская Л.А. Оценка параметров синхронно-альтернатирующего пуассоновского потока событий методом моментов // Радиотехника. 1995. № 7−8. С. 6−10.
9. Горцев А.М., Калягин А.А., Нежельская Л.А. Оптимальная оценка состояний обобщенного полусинхронного потока событий // Вестник Томского госуниверситета. Управление, вычислительная техника и информатика. 2010. № 2(11). С. 66–81.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальная оценка состояний модулированного обобщенного полусинхронного потока
21
10. Горцев А.М., Нежельская Л.А. О связи MC-потоков и MAP-потоков событий // Вестник
Томского госуниверситета. Управление, вычислительная техника и информатика. 2011.
№ 1(14). С. 13–21.
11. Горцев А.М., Нежельская Л.А., Соловьев А.А. Оптимальная оценка состояний MAPпотока событий в условиях непродлевающегося мертвого времени // Автоматика и телемеханика. 2012. № 8. С. 49–63.
12. Gortsev A.M., Nezhel’skaya L.A., Solov’ev A.A. Optimal state estimation in MAP event flows
with unextendable dead time // Automation and Remote Control. 2012. V.73. No. 8. P. 1316–
1326.
13. Бушланов И.В., Горцев А.М., Нежельская Л.А. Оценка параметров синхронного дважды
стохастического потока событий // Автоматика и телемеханика. 2008. № 9. С. 76–93.
14. Бахолдина М.А., Горцев А.М. Апостериорные вероятности состояний модулированного
обобщенного полусинхронного потока событий // Новые информационные технологии
в исследовании сложных структур: материалы IX Российской конференции с международным участием. Томск: Изд-во НТЛ, 2012. С. 79.
15. Хазен Э.М. Методы оптимальных статистических решений и задачи оптимального
управления. М.: Сов. радио, 1968. 256 с.
Бахолдина Мария Алексеевна
Томский государственный университет
E-mail: maria.bakholdina@gmail.com
Поступила в редакцию 5 марта 2013 г.
Bakholdina Maria A. (Tomsk State University). The optimal states evaluation of modulated
semisyncronous integrated flow of events.
Keywords: modulated generalized semisyncronous flow of events, flow state, state a posteriory
probability, state estimating.
There is studied the modulated generalized semisyncronous flow of events, which is one of
the mathematical models of informational flows of events functioning in Integrated Services
Digital Networks (ISDNs). The flow intensity is a piecewise constant stationary random process
λ(t) with two states λ1 , λ 2 (λ1 > λ 2 ) . During the time interval, while λ (t ) = λ i , there is a Poisson
flow of events with intensity λ i , i = 1, 2 . The transition of process λ(t) from one state to another
state can occur at any time. The duration, while process λ(t) stays in a first state, is distributed according to the exponential law with parameter β. At the same time, after the event arrives the process λ(t) can change the state to λ 2 with probability р or stay in the first state λ1 with probability
1 – р. The duration, while process λ(t)stays in a second state, is distributed according to the exponential law with parameter α. At the moment of state changing from second state to first state additional event in a state λ1 is initiated with probability δ.
The process λ(t) is considered in a steady-state conditions. The explicit formula for a posteriori probability is found and decision is made according to criterion of a posteriory probability
maximum. Numerical results obtained by simulation are given.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 2(23)
УДК 519.2
В.Б. Бериков
КОЛЛЕКТИВ АЛГОРИТМОВ С ВЕСАМИ В КЛАСТЕРНОМ
АНАЛИЗЕ РАЗНОРОДНЫХ ДАННЫХ1
Для кластерного анализа разнородных данных предложен метод построения
коллективного решения с учетом весов различных алгоритмов. Введена вероятностная модель ансамблевого кластерного анализа с латентными классами, учитывающая веса. В рамках модели получено выражение для верхней
границы ошибки классификации. Предложен способ выбора весов, для которых эта граница принимает минимальное значение. С помощью статистического моделирования продемонстрирована эффективность предложенного
метода.
Ключевые слова: кластерный анализ, коллективное принятие решений, алгоритмы с весами, вероятность ошибки классификации.
Задача кластерного анализа (таксономия, группировка объектов по похожести
их характеристик, автоматическая классификация «без учителя») может быть сформулирована следующим образом [1−3]. Имеется множество объектов, описываемых
набором некоторых переменных (либо матрицей попарных расстояний). Эти объекты требуется разбить на относительно небольшое число кластеров (таксонов, групп,
классов) так, чтобы критерий качества группировки принял бы наилучшее значение. Число кластеров может быть как выбрано заранее, так и не задано (в последнем
случае оптимальное количество кластеров должно быть определено автоматически). Под критерием качества обычно понимается некоторый функционал, зависящий от разброса объектов внутри группы и расстояний между группами.
В последнее время в кластерном анализе активно развивается подход, основанный на коллективном принятии решений [4, 5]. Известно, что алгоритмы кластерного анализа не являются универсальными: каждый алгоритм имеет свою
специфическую область применения: например, одни алгоритмы лучше справляются с задачами, в которых объекты каждого кластера описаны «шарообразными»
областями многомерного пространства; другие алгоритмы предназначены для поиска «ленточных» кластеров и т.д. В случае, когда данные имеют разнородную
природу (см. пример на рис. 1), для выделения кластеров целесообразно применять не какой-то один алгоритм, а набор различных алгоритмов. Коллективный
(ансамблевый) подход позволяет также снижать зависимость результатов группировки от выбора параметров алгоритма, получать более устойчивые решения в
условиях «зашумленных» данных, при наличии в них «пропусков».
Существуют следующие основные методики получения коллективных кластерных решений [5]: использование матрицы попарного сходства/различия объектов; максимизация степени согласованности решений (нормализованной взаимной информации, исправленного индекса Ранда и т.д.); применение теоретико1
Работа выполнена при поддержке РФФИ, проекты 11-07-00346а, 10-01-00113а, 11-07-12083-офи-м2011.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Коллектив алгоритмов с весами в кластерном анализе разнородных данных
23
графовых методов; анализ бутстрэп-выборок. В предлагаемой работе развивается
направление, основанное на матрицах попарного различия объектов. В итоговом
коллективном решении требуется учитывать степень «компетентности» каждого
алгоритма на различных подмножествах объектов. Для оценивания компетентности используется модель ансамблевого кластерного анализа, предложенная в работе [6]. Вводится модификация данной модели, учитывающая веса алгоритмов.
Предложенная модель используется для обоснования качества коллективного решения.
10
8
6
4
2
0
–2
–4
–2
0
2
4
6
8
10
Рис. 1. Пример расположения данных
Заметим, что вопросы, связанные с теоретическим обоснованием качества
группировки, остаются одними из наиболее важных в кластерном анализе.
1. Основные понятия и обозначения
Пусть имеется множество s = {o(1) ,…, o( N ) } некоторых объектов, случайным и
независимым образом выбранных из генеральной совокупности. Требуется разбить эти объекты на заданное число K кластеров в соответствии с критерием качества группировки.
Пусть каждый объект описывается с помощью набора вещественных переменных X1 ,…, X n . Через x = x(o) = ( x1 ,…, xn ) обозначим вектор переменных
для объекта o , где x j = X j (o) , j = 1,…, n , а через x N – таблицу данных
( x(o(1) ,..., x(o( N ) ))T . Предположим, что имеется некоторая скрытая (непосредственно ненаблюдаемая) переменная Y , которая задает принадлежность каждого
объекта к некоторому классу Y ∈ {1,…, K } . Каждый класс характеризуется определенным законом условного распределения p ( x | Y = k ) = pk ( x) , k = 1,…, K .
Рассмотрим следующую вероятностную модель генерации данных. Пусть для
каждого объекта определяется класс, к которому он относится, в соответствии с
априорными вероятностями Pk = P(Y = k ) , k = 1,…, K , где
K
∑ Pk = 1 . Затем в соk =1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.Б. Бериков
24
ответствии с распределением pk ( x) определяется значение x . Указанная процедура проводится независимо для каждого объекта. Для произвольной пары объектов a, b ∈ s и соответствующих наблюдений x(a ) и x(b) определим величину
Z = I (Y (a ) ≠ Y (b)),
где I (⋅) – индикаторная функция ( I (true) = 1, I ( false) = 0 ). Обозначим через
PZ = P[ Z = 1| x(a), x(b)]
вероятность события « a и b принадлежат к различным классам, при известных
x(a ) и x(b) »:
PZ = 1 − P[Y (a ) = 1 | x(a )] P[Y (b) = 1 | x(b)] − …− P[Y (a ) =
K
= K | x(a )] P[Y (b) = K | x(b)] = 1 − ∑
k =1
pk ( x(a )) pk ( x(b)) Pk2
,
p ( x(a )) p ( x(b))
K
где p ( x(o)) = ∑ pk ( x(o)) Pk , o = a, b .
k =1
Пусть с помощью некоторого набора алгоритмов кластерного анализа
μ 1 ,…,μ M по таблице данных строятся варианты разбиения множества s на кластеры (число кластеров для каждого варианта может отличаться). Поскольку нумерация классов не играет роли, удобнее рассматривать отношение эквивалентности, т.е. устанавливать, относит ли алгоритм μ m каждую пару объектов в один и
тот же класс, либо в разные классы. Определим для каждой пары объектов a и b
величину hm (a, b) = I [μ m (a ) ≠ μ m (b)].
Рассмотрим следующую модель ансамблевого кластерного анализа. Предположим, каждый алгоритм μ m рандомизирован, т.е. зависит от случайного вектора
Ω m , принадлежащего некоторому множеству Ω m (параметров, или, в более
общем смысле, «условий обучения», таких, как порядок объектов, подмножество
отобранных переменных или случайная подвыборка объектов и т.п.). Кроме
того, будем считать, что решения алгоритма зависят от действительного
статуса пары a , b (т.е. от Z ), а также от исходной таблицы данных:
hm (a, b) = hm (a, b, x N , Ω m , Z ). В дальнейшем, при фиксированных a , b и x N будем обозначать hm (a, b, x N , Ω m , Z ) = hm (Ω m , Z ) . Предположим, что выполняется
P[hm (Ω m , Z ) = 1| Z = 1] = P[hm (Ω m , Z ) = 0 | Z = 0] = qm ,
т.е. условная вероятность правильного решения (либо разделения, либо объединения пары объектов) для алгоритма μ m постоянна. Кроме того, будем полагать, что величина qm > 0,5 . В литературе это предположение известно как условие достижения «слабой обученности» алгоритмов. Это означает, что каждый
алгоритм дает группировку, для которой вероятность правильного решения выше, чем у тривиального алгоритма, основанного на случайном равновероятном
выборе в пользу объединения или разделения рассматриваемой пары объектов.
Обозначим
Pm = P[hm (Ω m , Z ) = 1] .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Коллектив алгоритмов с весами в кластерном анализе разнородных данных
25
Чем ближе величина Pm к 0 или 1 (или чем меньше дисперсия m-го алгоритма
Vm = Pm (1 − Pm ) ), тем более однородными являются решения в ансамбле для алгоритма μm.
Предположим, что алгоритм μm проработал Lm раз при независимых и одинаково распределенных «параметрах». Через Ω1, m ,…, Ω Lm , m обозначим независимые
статистические копии случайного вектора Ω m . В результате работы получим набор случайных решений
hm (Ω1, m , Z ) , …, hm (Ω Lm , m , Z ) , m = 1,…, M .
Для всех Ωl , m каждый алгоритм μ m работает независимо (не использует результаты, полученные для других Ωl ′, m , l ′ ≠ l ). Разные алгоритмы также независимы в том смысле, что они не используют результаты, полученные другими алгоритмами. С другой стороны, решения являются зависимыми от действительного
статуса пары a, b (например, если объекты a и b принадлежат разным кластерам, «разумные» алгоритмы с большей вероятностью будут относить эти объекты
также к различным классам). Данное свойство может быть формализовано следующим образом. Предположим, что решения являются условно независимыми:
P[hm1 (Ωi1 , m1 , Z ) = hr1 ,…, hm j (Ωi j , m j , Z ) = hr j | Z = z ] =
= P[(hm1 (Ωi1 ,m1 , Z ) = hr1 | Z = z ] ⋅ …⋅ P[hm j (Ωi j ,m j , Z ) = hr j | Z = z ],
где Ωi1 ,m1 ,…, Ωi j ,m j – произвольный набор параметров, а индексы m1 ,…, m j соответствуют различным алгоритмам, hr1 ,…, hr j , z ∈ {0,1} .
Пусть
Pm, m = P[hm (Ω′m , Z ) = 1, hm (Ω′′m , Z ) = 1],
где Ω′m , Ω′′m принадлежат тому же распределению, что и Ω m , m = 1,…, M ,
Ω′m ≠ Ω′′m .
Будем полагать, что каждый алгоритм вносит свой вклад в общее коллективное решение. Обозначим
H=
M
∑ αm
m =1
1
Lm
L
∑ hm (Ωl ,m , Z ) ,
l =1
где α m − некоторые константы (веса), m = 1,..., M ,
∑ α m =1. Функцию
m
c(h1 (Ω1 , Z ),…, hm (Ωl , Z ),…, hM (Ω L , Z )) = I [ H > 1/ 2]
назовем ансамблевым решением для a и b , полученным в соответствии со
«взвешенным голосованием». Для построения окончательной ансамблевой кластеризации объектов можно использовать различные подходы [5]. Например,
можно применять метод, основанный на матрице попарных различий
(
)
H = h (o(i1 ) , o(i2 ) ,
где o(i1 ) , o(i2 ) ∈ s , o(i1 ) ≠ o(i2 ) , величина h есть наблюдаемое значение H . Эту
матрицу можно рассматривать как матрицу попарных расстояний между объекта-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.Б. Бериков
26
ми и применять алгоритм построения дендрограммы [2] для разбиения множества
объектов на заданное число кластеров.
2. Верхняя граница вероятности ошибочной классификации
Рассмотрим маржинальную функцию кластерного ансамбля [6]:
mg = { взвешенное число голосов за Z − взвешенное число голосов против Z } ,
где Z ∈ {0,1} . Легко показать, что маржинальная функция
mg = mg ( H , Z ) = (2 Z − 1)(2 H − 1).
С использованием этой функции, можно представить вероятность ошибки
предсказания Z как
Perr = PZ ,Ω1,1,…,Ω L ,M [mg ( H , Z ) < 0].
M
Из неравенства Чебышева следует
Perr <
Var mg ( H , Z )
,
( E mg ( H , Z )) 2
(1)
при условии, что E mg ( H , Z ) > 0 (через E (⋅) и Var (⋅) обозначено математическое
ожидание и дисперсия соответственно).
В работе [6] для случая одного алгоритма ( M = 1 ) и без учета весов были найдены выражения для математического ожидания и дисперсии маржинальной
функции:
4
E mg ( H , Z ) = 2 q1 − 1, Var mg ( H , Z ) = ( P1 − P1,1 ) .
L1
Аналогичным образом можно вывести выражения для характеристик маржинальной функции для случая нескольких алгоритмов с весами. Справедлива следующая
Теорема 1. Пусть выполняются введенные выше предположения модели. Тогда
M
M
m =1
m =1
E mg ( H , Z ) = 2 ∑α m qm − 1, Var mg ( H , Z ) = 4 ∑
α2m ( P
Lm
m
− Pm, m ) ,
(2)
причем для всех m = 1,...M имеет место Pm − Pm, m = qm (1 − qm ) .
Замечание. Требование E mg ( H , Z ) > 0 выполняется, если
M
∑α m qm > 0,5 , т.е.
m =1
усредненная условная вероятность правильного решения выше, чем вероятность
правильного решения, полученного тривиальным алгоритмом случайного равновероятного выбора.
Данная теорема позволяет оценить сверху вероятность ошибки ансамблевого
алгоритма в выражении (1), а также сделать несколько качественных выводов.
Рассмотрим коэффициент корреляции ρm между hm′ = h(Ω′m , Z ) и hm′′ = h(Ω′′m , Z ) ,
где Ω′m ≠ Ω′′m , m = 1,..., M . По определению коэффициента
ρm = ρhm′ , hm′′ =
Pm, m − Pm2
Pm (1 − Pm )
.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Коллектив алгоритмов с весами в кластерном анализе разнородных данных
27
Так как Pm − Pm, m = qm (1 − qm ) и Pm − Pm,m = Pm − Pm2 + Pm2 − Pm, m , то получим следующее выражение:
Var (mg ( H , Z )) = 4∑
m
α 2m
(1 − ρm )Vm .
Lm
Таким образом, можно сделать следующие выводы:
- вероятность ошибки уменьшается с ростом числа элементов Lm в ансамбле
для каждого алгоритма μ m ;
- повышение однородности ансамбля (т.е уменьшение дисперсии Vm ) и увеличение корреляции между его решениями снижает вероятность ошибки.
3. Оценивание характеристик ансамбля и нахождение оптимальных весов
Предположим, в результате работы ансамбля получены различные варианты
классификации объектов. Для фиксированной пары объектов a и b , каждого алгоритма μ m и l-го элемента соответствующего ансамбля определим величину
h m,l ∈ {0,1} , показывающую, была ли данная пара объектов отнесена к одному
или разным кластерам, где l = 1,..., Lm , m = 1,..., M . Эти значения можно использовать для оценивания введенных выше характеристик ансамбля. Например,
1 L
оценкой Pm служит величина P m = ∑ h m,l , а оценкой qm – величина
L l =1
qm = max( Pm ,1 − Pm ) . Аналогичным образом можно оценить и другие введенные
характеристики ансамбля.
Рассмотрим задачу выбора оптимальных весов α1 ,..., α M , для которых минимальна верхняя граница вероятности ошибки (1) при ограничении
∑ α m = 1 . Для
ее решения можно использовать известные методы поиска глобального экстремума функций [7]. Однако поскольку оценка (1) является значительно завышенной в
силу того, что при ее выводе используется неравенство Чебышева, справедливое
для любого распределения, можно использовать и другие подходы. Например,
минимизировать дисперсию маржинальной функции в выражении (2), при условии, что математическое ожидание не ниже заданного значения и т.п. Нахождение
оптимальных коэффициентов может проводиться методом множителей Лагранжа
с учетом ограничений в виде неравенств. При этом возникает задача квадратичного программирования, для которой существует достаточно разработанная теория.
Более подробное изучение различных вариантов поставленной оптимизационной
задачи планируется провести в дальнейших работах.
В случае, когда число алгоритмов M = 2 , число элементов ансамбля для каждого алгоритма одинаково, а в качестве целевого минимизируемого функционала
рассматривается дисперсия маржинальной функции, можно получить следующее
выражение для оптимальных значений весов:
q2 (1 − q2 )
(3)
, α*2 = 1 − α1* .
α1* =
q1 (1 − q1 ) + q2 (1 − q2 )
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
28
В.Б. Бериков
Таким образом, при назначении оптимального веса учитывается, как вели себя
алгоритмы при классификации данной пары объектов при различных условиях
(параметрах) работы. Тот алгоритм, который давал более устойчивые решения,
получает больший вес по сравнению с менее устойчивым (для которого разброс
решений выше).
Интерес представляет также случай, когда для всех пар объектов веса, соответствующие каждому алгоритму, совпадают. Таким образом, требуется оценить
общую степень «компетентности» каждого алгоритма по всевозможным парам.
Для этого можно использовать выражение (3), подставив в него усредненные по
всем парам объектов величины q1 , q2 .
Разработан алгоритм построения ансамблевого решения, реализующий предложенную методику определения оптимальных весов алгоритмов. При этом для
каждой пары объектов с помощью приближенного переборного алгоритма находились веса, для которых верхняя граница вероятности ошибки (3) принимает минимальное значение. После вычисления согласованной матрицы различий, для
нахождения итогового варианта группировки применялся стандартный агломеративный метод построения дендрограммы, который в качестве входной информации использовал попарные расстояния между объектами [2]. При этом расстояние
между группами определялось по принципу «средней связи», т.е. как среднее
арифметическое попарных расстояний между объектами, входящими в группы.
Напомним также, что предполагается независимость отбора различных параметров алгоритмов, а также достижение алгоритмами «слабой» обученности.
Чтобы в максимальной степени обеспечить выполнение условий теоремы 1, дополнительно проводился контроль качества решений базовых алгоритмов по индексам качества результатов кластерного анализа [3]. Так, например, если в полученной группировке число объектов, попавших в один кластер, оказывалось
меньше заданного порога, такой вариант решения исключался из рассмотрения.
4. Экспериментальное исследование
При исследовании разработанной методики построения ансамбля рассматривался случай, когда в ансамбль включены два алгоритма: алгоритм k-средних и
агломеративный алгоритм построения дендрограммы [2], в котором расстояние
между группами определялось по принципу «ближайшего соседа». Для оценки
качества использовался метод статистического моделирования: многократно генерировались выборки, соответствующие заданному распределению для каждого
класса; полученный набор данных классифицировался с помощью предложенного
ансамблевого алгоритма с весами; вычислялся индекс согласованности полученной классификации с истинной. Для определения степени согласованности использовался индекс Ранда, представляющий собой отношение числа пар объектов,
у которых либо одинаковые, либо разные номера классов в полученной и истинной группировке, к общему числу пар различных объектов (значение индекса,
близкое к 1, означает хорошую согласованность группировок). Степень согласованности усреднялась по всем выборкам. Число повторений выборок было задано
равным 100.
В 30-мерном пространстве переменных моделировались кластеры, два из которых имеют шарообразную, а два – ленточную форму (см. типичный пример выборки – проекцию в пространство первых двух переменных на рис. 1). Некоторые
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Коллектив алгоритмов с весами в кластерном анализе разнородных данных
29
переменные, номера которых определялись случайно, являлись «шумовыми», т.е.
все реализации по этим переменным подчинялись равномерному распределению
(число шумовых переменных задавалось параметром n0 ). Объем выборки для каждого из четырех классов был задан равным 25. Для построения ансамбля использовался метод случайных подпространств [5]: из общего числа переменных
случайным образом выбиралось заданное число nans переменных, в пространстве
которых проводилась группировка. В рассмотренном примере было выбрано значение nans = 3 . Число элементов ансамбля для каждого алгоритма было положено
равным 50. На рис. 2 показаны полученные результаты моделирования, в зависимости от числа шумовых переменных. Через R*ens обозначено значение индекса
Ранда для разработанного ансамблевого алгоритма с весами. Для сравнения, приведены результаты работы каждого из алгоритмов без использования ансамбля
(на рисунке обозначено: R10 – индекс Ранда для алгоритма k-средних, R20 – для
алгоритма построения дендрограммы), а также с использованием ансамбля по каждому алгоритму отдельно ( R1ens – для алгоритма k-средних, R2ens – для алгоритма построения дендрограммы). В последних двух случаях число элементов в
ансамбле задавалось равным 100, чтобы обеспечить правомочность сравнения.
1
∗
Rens
R2ens
Индекс Ранда
0,8
0,6
R1ens
R10
0,4
0,2
R 20
1
3
5
7
9
n0
Рис. 2. Результаты моделирования
По результатам моделирования можно сделать следующие выводы. Эксперимент подтвердил преимущество коллективного подхода (особенно это проявляется для алгоритма построения дендрограммы, точность которого при использовании ансамбля возросла в несколько раз). Начиная с определенного порога на число шумовых переменных (в данном случае равного восьми), ансамблевый алгоритм с весами позволил получить наилучшую точность по сравнению с другими
сравниваемыми методиками. При меньшем числе шумовых переменных точность
данного алгоритма практически совпала с точностью ансамблевого алгоритма построения дендрограммы (с удвоенным числом элементов ансамбля) и также являлась оптимальной. Заметим, что заранее неизвестно, какой из двух алгоритмов
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
30
В.Б. Бериков
(алгоритм k-средних или алгоритм построения дендрограммы) оказался бы наилучшим. Использование метода взвешенного ансамбля позволило в данном примере получить гарантированный оптимальный результат.
Заключение
Одна из трудностей кластерного анализа − возможная неоднозначная интерпретация результатов группировки. Алгоритмы, в основу которых заложены различные подходы, могут дать несогласующиеся результаты. В настоящей работе
предполагается, что алгоритмы, на основе которых строится коллективное решение, «неортогональны» в указанном выше смысле, но взаимно дополняют друг
друга: одни компенсируют «слабые места» других. В этом случае требуется подбирать степень вклада, который вносит каждый из алгоритмов в общее решение
на разных структурах данных.
Для решения этой задачи предложен метод, который при построении итогового решения учитывает поведение каждого алгоритма при кластеризации в различных условиях (или при выборе различных параметров работы). На основании этого поведения алгоритму приписывается определенный вес. Для обоснования метола введена вероятностная модель ансамблевой попарной классификации с латентными классами. Модель позволила получить оценку качества, используемую
при нахождении оптимальных весов, для которых верхняя граница вероятности
ошибки минимальна. На основе модели сделаны теоретические выводы о том,
что при выполнении определенных разумных условий качество ансамбля улучшается с ростом числа его элементов, повышением однородности ансамбля и увеличением корреляции между его решениями.
Разработан алгоритм, в котором реализован метод построения ансамбля и вычисления оптимальных весов. Экспериментальное исследование с помощью процедуры статистического моделирования подтвердило эффективность предложенного метода: в условиях большого числа шумовых переменных точность ансамблевого алгоритма с весами оказалась в среднем выше, чем у других сравниваемых
алгоритмов.
ЛИТЕРАТУРА
1. Миркин Б.Г. Методы кластер-анализа для поддержки принятия решений: обзор. М.: Изд.
дом НИУ ВШЭ, 2011.
2. Дуда Р., Харт П. Распознавание образов и анализ сцен. М.: Мир, 1976.
3. Jain A.K., Dubes R.C. Algorithms for clustering data. Prentice Hall, NY, 1988.
4. Jain A.K. Data clustering: 50 years beyond k-means // Pattern Recognition Letters. 2010.
V. 31. No. 8. P. 651−666.
5. Ghosh J., Acharya A. Cluster ensembles // Wiley Interdisciplinary Reviews: Data Mining and
Knowledge Discovery. 2011. V. 1(4). P. 305−315.
6. Berikov V. A latent variable pairwise classification model of a clustering ensemble // Multiple
Classifier Systems, 2011. Lecture Notes on Computer Science, LNCS 6713 / C. Sansone,
J. Kittler, and F. Roli (Eds.). Springer, Heidelberg, 2011. P. 279−288.
7. Жиглявский А.А., Жилинкас А.Г. Методы поиска глобального экстремума. М.: Наука,
Физматлит, 1991.
Бериков Владимир Борисович
Институт математики им. С.Л. Соболева СО РАН
E-mail: berikov@math.nsc.ru
Поступила в редакцию 4 мая 2012 г.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Коллектив алгоритмов с весами в кластерном анализе разнородных данных
31
Berikov Vladimir B. (Sobolev Institute of mathematics SB RAS). Collective of algorithms with
weights for clustering heterogeneous data.
Keywords: cluster analysis, collective decision, algorithms with weights, probability of wrong
classification.
The paper considers a problem of heterogeneous data clustering. Under heterogeneous data
one can understand the data that contain different structures: sphere-like and strip-like clusters;
various geometric figures etc. To raise the grouping quality for such types of data, we suggest
using the ensemble of different clustering algorithms. When including an algorithm into the ensemble, it is assumed that the algorithm produces better results for a specific type of structures.
Besides, it is supposed that the experiment is planned so that the algorithms work independently,
and each algorithm is functioning on independently chosen sets of parameters (learning conditions). For the construction of final decision it is recognized the behavior of each algorithm in the
ensemble, on the basis of which a weight is attributed to it. A probabilistic model of ensemble
clustering with latent classes and algorithm’s weights is introduced. With use of the model, an expression for the upper bound of classification error probability is derived. To minimize the bound,
a method of weights selection is suggested. The procedure of ensemble construction and finding
the weights is implemented in correspondent algorithm. The efficiency of the suggested method is
demonstrated by making use of Monte-Carlo modeling.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 2(23)
УДК 519.2
Ю.Б. Буркатовская, С.Э. Воробейчиков
ГАРАНТИРОВАННОЕ ОЦЕНИВАНИЕ ПАРАМЕТРОВ
ПОРОГОВОГО АВТОРЕГРЕССИОННОГО ПРОЦЕССА
С УСЛОВНОЙ НЕОДНОРОДНОСТЬЮ1
Рассматривается модель пороговой авторегрессии первого порядка с ARCHшумами. Получены достаточные условия эргодичности процесса. Предложены несмещенные гарантированные оценки авторегрессионных параметров и изучены их асимптотические свойства.
Ключевые слова: TAR/ARCH, метод наименьших квадратов, среднеквадратическое отклонение, гарантированное оценивание.
Модель пороговой авторегрессии (TAR) относится к классу нелинейных авторегрессионных моделей. Основным ее свойством является зависимость параметра
авторегрессии от предыдущих значений процесса, в результате чего модель даже
первого порядка хорошо описывает процессы с явно асимметричным относительно нуля распределением. В работе [1] рассмотрен процесс TAR(1), в которой значение параметра процесса зависит знака предыдущего наблюдения. Найдена область эргодичности процесса и доказана состоятельность оценок параметров, построенных с использованием метода наименьших квадратов, при условии существования момента выше второго порядка для распределения шумов. При этом дисперсия шума предполагалась постоянной. В [2] предложена последовательная
оценка для параметров процесса TAR(1) с неизвестной дисперсией, где в качестве критерия останова используется сочетание двух факторов: качества оценивания
и требуемое число наблюдений. Свойства оценок изучаются в асимптотической
постановке. В [3] условия эргодичности были найдены для процесса TAR(1) с задержкой, а в [4] аналогичная задача была рассмотрена для процесса с несколькими порогами. Позже были предложены и исследованы пороговые авторегрессионные модели с переменной дисперсией, которые применяются для описания
случайных процессов с эффектом кластерности. В частности, в [5] получены условия эргодичности для широкого класса нелинейных моделей, дисперсия шума
которых зависит от предыдущих значений шумов.
В данной работе рассмотрена модель пороговой авторегрессии с условной неоднородностью TAR/ARCH. Для нее найдены достаточные условия эргодичности
и предложены последовательные оценки параметров, обладающие гарантированным качеством и не требующие наличия у шумов моментов выше второго порядка. Исследованы асимптотические свойства построенных оценок.
1. Модель
Рассматривается случайный процесс пороговой авторегрессии с ARCH-шумами
xn +1 = λ1 xn+ + λ 2 xn− + σ n ε n +1 ; σ n = ω + αxn2 ; xn+ = max {0, xn } , xn− = min {0, xn } .
1
(1)
Работа выполнена в рамках государственного задания Минобрнауки РФ на проведение научных исследований в Томском государственном университете на 2012−2014 годы, задание 8.4055.2011.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Гарантированное оценивание параметров порогового авторегрессионного процесса
33
где {εn} – последовательность независимых одинаково распределенных случайных величин с нулевым средним, единичной дисперсией и известным распределением. Плотность распределения шумов положительна на всей числовой прямой,
симметрична относительно нуля не возрастает на промежутке [ 0, +∞ ) .
2. Область эргодичности процесса
В случае, когда дисперсия шума в модели (1) постоянна, т.е. σn = σ , область
эргодичности процесса имеет следующий вид [1]:
λ1 < 1, λ 2 < 1, λ1λ 2 < 1.
(2)
Согласно [6], достаточным условием для эргодичности марковского процесса
является существование неотрицательной измеримой функции g ( x ) и компакта
K, таких, что
a) E [ g ( xn+1 ) xn = x ] < g ( x ) − c, c > 0, x ∉ Κ ;
(3)
b) E [ g ( xn+1 ) xn = x ] < R < +∞, x ∈ Κ .
Предположим, что параметры процесса (1) удовлетворяют условию (2). Тогда
существуют такие положительные константы a и b, что
a
b
− < λ1 < 1, − < λ 2 < 1.
(4)
b
a
Пусть компакт Κ = [ − M , M ] и функция g ( x ) имеет вид
g ( x ) = ax + − bx − .
(5)
Если x ∈ Κ , то
(
E [ g ( xn +1 ) xn = x ] = aE λ1 x + + λ 2 x − + ω + αx 2 ε n +1
(
− bE λ1 x + + λ 2 x − + ω + αx 2 ε n +1
)
−
+
−
≤
≤ ( a + b ) E λ1 x + + λ 2 x − + ω + αx 2 ε n +1 ≤
{
)
}
a b
≤ ( a + b ) ⎛⎜1 + max ⎛⎜ , ⎞⎟ ⎞⎟ M + ω + αM 2 E ε n +1 < ∞.
⎝
⎝ b a ⎠⎠
Таким образом, условие (3b) выполнено при
a b
R = ( a + b ) ⎛⎜1 + max ⎛⎜ , ⎞⎟ ⎞⎟ M + ω + αM 2 E ε n +1 .
⎝
⎝ b a ⎠⎠
{
}
Рассмотрим случай x ∉ Κ . Пусть x > M , тогда x + = x , x − = 0 . Введем обозначение c ( x ) = − λ1 x ω + αx 2 , тогда при ε n +1 > c ( x ) имеем λ1 x + ω + αx 2 ε n +1 > 0 .
Обозначим плотность распределения шумов {ε n+1} через f ( z ) . Используя условия (4), получаем
) − bE (λ x + ω + αx ε )
ω + αx z ) f ( z ) dz − b ∫ ( λ x + ω + αx z ) f ( z ) dz =
(
E [ g ( xn +1 ) xn = x ] = aE λ1 x + ω + αx 2 ε n +1
+∞
=a
∫
C( x)
(
+
2
1
C( x)
λ1 x +
2
1
−∞
2
n +1
−
=
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.Б. Буркатовская, С.Э. Воробейчиков
34
+∞
= ax
⎛a⎞
∫ f ( z ) dz + b ⎜⎝ b ⎟⎠ x
C( x)
a
−b ⎛⎜ λ1 + ⎞⎟ x
b⎠
⎝
C( x)
∫
∫
f ( z ) dz −
C( x)
−∞
C( x)
∫
+∞
f ( z ) dz + a ( λ1 − 1) x
C( x)
+∞
f ( z ) dz + a ω + αx 2
zf ( z ) dz − b ω + αx 2
∫
C( x)
−∞
< ax + ( a + b ) ω + αx 2
zf ( z ) dz <
∫
−∞
+∞
∫ zf ( z ) dz − min {a (1 − λ1 ) , ( bλ1 + a )} x.
0
Обозначим сумму двух последних слагаемых в этом выражении через ∆. Для выполнения условия (3) требуется, чтобы величина ∆ была отрицательна. Используя
+∞
обозначение μ =
∫ zf ( z ) dz , получаем
0
∆ = ( a + b ) μ ω + αx 2 − min {a (1 − λ1 ) , ( bλ1 + a )} x < 0 ,
откуда следует условие эргодичности процесса
α<
{
2
min a (1 − λ1 ) , ( bλ1 + a )
2
(a + b) μ
2
} = min {(1 − λ )
1
2
2
, ( t λ1 + 1)
2
(1 + t ) μ
2
2
},
где t = b a . Для получения как можно более широкой области эргодичности величину в правой части неравенства следует максимизировать по t . Она убывает с
ростом t .
Рассматривая аналогично случай x < − M , когда x + = 0 , x − = x , получаем
E [ g ( xn +1 ) xn = x ] < −bx + ( a + b ) ω + αx 2 μ + min {b (1 − λ 2 ) , ( aλ 2 + b )} x.
Условие эргодичности процесса принимает вид
α<
{
2
min t 2 (1 − λ 2 ) , ( λ 2 + t )
2
(1 + t ) μ
2
2
}.
Величина в правой части неравенства возрастает с ростом t .
Итак, получаем задачу оптимизации
{ {
2
2
}
{
2
min min (1 − λ1 ) , ( t λ1 + 1) , min t 2 (1 − λ 2 ) , ( λ 2 + t )
2
(1 + t ) μ
2
2
}} → max ,
t
решение которой находится из условия
{
2
min (1 − λ1 ) , ( t λ1 + 1)
2
} = min {t
2
(1 − λ 2 )2 , ( λ 2 + t )2 } .
Поскольку t > 0 , учитывая (4), имеем
1 − λ1 ≤ t λ1 + 1 при λ1 ≥ 0; t λ1 + 1 < 1 − λ1
при λ1 < 0;
t (1 − λ 2 ) ≤ λ 2 + t при λ 2 ≥ 0; λ 2 + t < t (1 − λ 2 ) при λ 2 < 0.
Рассмотрим 4 области значений параметров [ λ1 , λ 2 ] .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Гарантированное оценивание параметров порогового авторегрессионного процесса
35
Область 1. λ1 ≥ 0, λ 2 ≥ 0 . Тогда решение задачи () находится из условия
1 − λ1 = t (1 − λ 2 ) и условие эргодичности принимает вид
α<
(1 − λ1 )2 (1 − λ 2 )2
.
( 2 − λ1 − λ 2 )2 μ 2
Область 2. λ1 ≥ 0, λ 2 < 0 . Тогда решение задачи () находится из условия
1 − λ1 = λ 2 + t и условие эргодичности принимает вид
α<
(1 − λ1 )2
.
( 2 − λ1 − λ 2 )2 μ 2
Область 3. λ1 < 0, λ 2 ≥ 0 . Тогда решение задачи () находится из условия
t λ1 + 1 = t (1 − λ 2 ) и условие эргодичности принимает вид
α<
(1 − λ 2 )2
.
( 2 − λ1 − λ 2 )2 μ 2
Область 4. λ1 < 0, λ 2 < 0 . Тогда решение задачи () находится из условия
t λ1 + 1 = λ 2 + t и условие эргодичности принимает вид
α<
(1 − λ1λ 2 )2
.
( 2 − λ1 − λ 2 )2 μ 2
Итак, объединяя четыре области, получаем
α<α=
{
2
2
2
2
min (1 − λ1λ 2 ) , (1 − λ1 ) , (1 − λ 2 ) , (1 − λ1 ) (1 − λ 2 )
2
( 2 − λ1 − λ 2 ) μ
2
2
}.
(6)
Если константа M выбирается из условия ω M 2 < α − α , то условие (3a) выполнено для Κ = [ − M , M ] .
3. Построение оценок параметров
Рассмотрим задачу оценивания параметров [ λ1 , λ 2 ] . Предположим сначала,
что параметры [ ω, α ] являются известными. Тогда, используя оценку, предложенную в [7] для авторегрессионных процессов, получаем
1
λˆ 1 =
H
τ1
1
∑ vn,1 xn+ xn+1; λˆ 2 = H
n =1
τ2
∑ vn,2 xn− xn+1.
n =1
Моменты [ τ1 , τ2 ] – это случайные моменты остановки, определяемые из условий
t
t
2
2
⎧
⎫
⎧
⎫
τ1 = min ⎨t > 0 : ∑ ω + αxn2 xn+ > H ⎬ ; τ2 = min ⎨t > 0 : ∑ ω + αxn2 xn− > H ⎬ ,
⎩
⎭
⎩
⎭
n =1
n =1
H – положительный параметр процедуры оценивания. Весовые коэффициенты
{vn,1}n≥1 , {vn,2 }n≥1 принимают значение единицы на интервалах [1, τ1 − 1] и
(
)( )
(
)( )
[1, τ2 − 1] соответственно, а коэффициенты в моменты [ τ1 , τ2 ] находятся из условий
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.Б. Буркатовская, С.Э. Воробейчиков
36
τ1
∑ vn,1 ( ω + αxn2 )( xn+ )
2
= H;
n =1
τ2
∑ vn,2 ( ω + αxn2 )( xn− )
2
= H.
n =1
Выбор момента остановки и весовых коэффициентов гарантирует, что оценки ()
являются несмещенными и их дисперсии ограничены величиной 1 H .
Если параметры [ ω, α ] неизвестны, то процесс (1) является авторегрессионным процессом с неизвестной и неограниченной дисперсией шума. Чтобы привести его к удобному для исследования виду, введем обозначение
mn = max {1, xn } и поделим уравнение (1) на величину mn . Получим процесс
вида
yn +1 = λ1 yn,1 + λ 2 yn,2 + γ n ε n +1 ; yn,1 =
xn+
,
mn
yn,2 =
xn−
ω + αxn2
, γn =
,
mn
mn
(7)
дисперсия шума которого ограничена сверху, т.е. γ 2n ≤ ω + α . Для устранения
влияния неизвестной константы зададимся некоторым начальным объемом выборки N . На этом промежутке модифицируем процесс следующим образом. Введем обозначение mn = min {1, xn } и поделим уравнение (1) на величину mn (чтобы это было возможно, выберем промежуток, где все mn существенно отличны
от нуля). Получим процесс вида
yn +1 = λ1 yn,1 + λ 2 yn,2 + γ n ε n +1 ; yn,1 =
xn+
,
mn
yn,2 =
xn−
ω + αxn2
, γn =
,
mn
mn
и построим специальный компенсирующий множитель Γ N
−1
N
⎛ N ⎞
Γ N = C N ∑ yn2 , C N = E ⎜ ∑ ε 2n ⎟ .
⎝ n =1 ⎠
n =1
Плотность распределения f ( x ) шумов {ε n }n≥1 должна быть такова, чтобы вели-
чина C N была определена для некоторого значения N . Типы таких плотностей
рассмотрены в [8].
Определим оценки параметров [ λ1 , λ 2 ] следующим образом:
λˆ i =
τi
1
ΓN H
∑
n = N +1
vn,i yn,i yn +1 , i = 1, 2 ,
(8)
где моменты остановки определяются из условий
t
⎧
⎫
τi = min ⎨t > N : ∑ yn2,i > Γ N H ⎬ .
⎩
⎭
n = N +1
Весовые коэффициенты
{vn,i }n≥1
(9)
принимают значение единицы на интервалах
[1, τi − 1] соответственно, а коэффициенты в моменты [ τ1 , τ2 ] находятся из условий
τi
∑
n = N +1
vn,i yn2,i = Γ N H .
Свойства оценок сформулированы в следующей теореме.
(10)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Гарантированное оценивание параметров порогового авторегрессионного процесса
37
Теорема 1. Для процесса (1), удовлетворяющего условиям (6), моменты остановки (9) конечны почти наверное. Оценки (8) являются несмещенными. Дисперсия каждой оценки ограничена сверху величиной
2
1
E λˆ i − λ i ≤ , i = 1, 2 .
(11)
H
Доказательство. Для доказательства конечности моментов остановки (9) тре-
(
)
t
∑
буется показать, что ряды
n = N +1
yn2,i расходятся. Если ряды сходятся, то для лю-
бой положительной константы δ
⎧∞
⎫
→0 .
P ⎨ ∑ yn2,i > δ ⎬ ⎯⎯⎯
k →∞
⎩n=k
⎭
Имеем для случая i = 1
P
{
yn2,1
( )
{ }
2
⎧
⎫
xn+
⎪
⎪
> δ = P⎨
>
δ
⎬ = P xn > δ =
2
⎪⎩ max 1, xn
⎪⎭
}
{
{
}
}
= P λ1 xn+−1 + λ 2 xn−−1 + ω + αxn2−1 ε n > δ =
(
λ1 xn+−1
+ λ 2 xn−−1
)
⎧⎪
⎫⎪
δ−
= P ⎨ε n >
⎬.
ω + αxn2−1
⎪⎩
⎪⎭
Поскольку плотность распределения величин {εn} отлична от нуля на всей числовой прямой, и процесс является эргодическим, эта вероятность не стремится к нулю. Случай i = 2 рассматривается аналогично.
Рассмотрим оценку (8). Из уравнения (7), учитывая, что yn,1 yn,2 = 0 , получаем
E λˆ i =
τ
τ
i
i
1
1
E ∑ vn,i yn,i yn +1 =
E ∑ vn,i yn,i ( λ1 yn,1 + λ 2 yn,2 + γ n ε n +1 ) =
Γ N H n = N +1
Γ N H n = N +1
=
τi
τi
λi
1
E ∑ vn,i yn2,i +
E ∑ vn,i yn,i γ n ε n +1.
Γ N H n = N +1
Γ N H n = N +1
Из определения весовых коэффициентов (10) следует, что первое слагаемое равно
λ i . Рассмотрим второе слагаемое. Введем усеченный момент остановки
τi = min {τi , T } и обозначим через Fn = σ { x0 , ε1 ,… , ε n } сигма-алгебру, порожденную случайными величинами { x0 , ε1 ,… , ε n } . Используя свойства условных математических ожиданий, получаем, что
E
τi
∑
n = N +1
vn,i yn,i γ n ε n +1 = E
=E
T
∑
n = N +1
T
∑
n = N +1
E ⎡⎣vn,i yn,i γ n ε n +1χ n≤τi Fn ⎤⎦ =
vn,i yn,i γ n χ n ≤τi E [ ε n +1 Fn ] = 0.
Поскольку τi → τi при T → ∞ , получаем, что математическое ожидание второго
слагаемого равно нулю, и Eλˆ = λ .
i
i
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.Б. Буркатовская, С.Э. Воробейчиков
38
Найдем теперь дисперсию оценки. Используя свойства условных математических ожиданий, получаем
(
)
E λˆ i − λ i
=E
+2 E
2
T
1
(ΓN H )
T
1
⎛ 1
= E ⎜⎜
⎝ ΓN H
∑
2
n = N +1
n −1
∑ ∑
( Γ N H )2 n = N + 2 l = N +1
=E
∑
( Γ N H )2 n = N +1
n −1
T
1
+2 E
∑ ∑
( Γ N H )2 n = N + 2 l = N +1
=E
⎞
∑ vn,i yn,i γ n εn+1 ⎟⎟ =
n = N +1
⎠
E ⎡⎣vn2,i yn2,i γ 2n χ n ≤τi ε 2n +1 Fn ⎤⎦ +
E ⎡⎣vl ,i yl ,i γ l εl +1vn,i yn,i γ n χ n≤τi ε n +1 Fn ⎤⎦ =
T
1
2
τi
vn2,i yn2,i γ 2n χ n ≤τi E ⎡⎣ε 2n +1 Fn ⎤⎦ +
vl ,i yl ,i γ l εl +1vn,i yn,i γ n χ n≤τi E [ ε n +1 Fn ] =
T
1
(ΓN H )
2
∑
n = N +1
vn2,i yn2,i γ 2n χ n ≤τi .
Учитывая, что vn,i ≤ 1 , имеем
(
E λˆ i − λ i
)
2
≤E
τi
1
(ΓN H )
∑
2
n = N +1
vn2,i yn2,i γ 2n ≤ E
(ω + α) ΓN H (ω + α) 1
=
E
. (12)
H
ΓN
( Γ N H )2
N
S N = ∑ yn2 . Найдем математическое ожидание этой
Введем обозначение
n =1
величины
∞
{
}
∞
ES N−1 = ∫ P S N−1 ≥ x dx = ∫ P {S N ≤ 1 x} dx =
0
∞
0
{
}
2
= ∫ P S N −1 + ( λ1 yn −1,1 + λ 2 yn −1,2 + γ n −1ε n ) ≤ 1 x dx =
∞
0
1x
0
0
{
2
}
= ∫ dx ∫ P z + ( λ1 yn −1,1 + λ 2 yn −1,2 + γ n −1ε n ) ≤ 1 x g ( z ) dz =
2
1x ⎧
∞
⎞ 1 x − z ⎪⎫
⎪⎛ λ1 yn −1,1 + λ 2 yn −1,2
= ∫ dx ∫ P ⎨⎜⎜
+
ε
n⎟
⎟ ≤ γ 2 ⎬ g ( z ) dz.
γ n2 −1
⎠
⎪⎩⎝
n −1 ⎪
0
0
⎭
Поскольку плотность распределения шумов {εn} симметрична относительно нуля,
для этих величин справедливо неравенство [9]
{
2
} {
}
P ( a + ε n ) ≤ b ≤ P ε 2n ≤ b .
(13)
Отсюда, учитывая, что γ 2n−1 ≥ ω + α , получаем
2
⎞ 1 x − z ⎪⎫
⎧⎪ 2 1 x − z ⎫⎪
1 x−z
⎪⎧⎛ λ1 yn −1,1 + λ 2 yn −1,2
2
P ⎨⎜⎜
P
+
ε
≤
≤
.
⎬
⎨ε n ≤ 2 ⎬ ≤ P ε n ≤
n⎟
2
2
⎟
ω+ α
γ n −1
γ n −1 ⎪⎭
γ n −1 ⎭⎪
⎠
⎩⎪
⎪⎩⎝
{
}
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Гарантированное оценивание параметров порогового авторегрессионного процесса
39
Следовательно,
∞
1x
0
0
{
ES N−1 ≤ ∫ dx ∫ P ε 2n ≤
}
∞
1 x−z
g ( z ) dz = ∫ P S N −1 + ( ω + α ) ε 2n ≤ 1 x dx.
ω+ α
0
{
}
Повторяя проведенные рассуждения для величин {S N −1 ,…, S1} , приходим к неравенству
ES N−1
−1
∞ ⎧
N
N
⎧
⎫
⎪
−1 ⎛
2
2⎞
≤ ∫ P ⎨( ω + α ) ∑ ε n ≤ 1 x ⎬ dx = ∫ P ⎨( ω + α ) ⎜ ∑ ε n ⎟ ≥
⎭
⎝ n =1 ⎠
n =1
0 ⎩
0 ⎪
⎩
∞
⎫⎪
x ⎬ dx =
⎪⎭
−1
N
⎞
−1 ⎛
= ( ω + α ) E ⎜ ∑ ε n2 ⎟ .
⎝ n =1 ⎠
Итак, для компенсирующего множителя имеем
1
1
1 CN
1
=
=
E
ES N−1 ≤
.
Γ N CN
CN ω + α ω + α
Отсюда и из (12) следует утверждение (11) теоремы.
4. Асимптотические свойства оценок
Рассмотрим свойства оценок (8) при больших значениях параметра H. Нам потребуется следующий результат.
{ }n≥1,k ≤n – последовательность σ -алгебр, F1n ⊆ F2n ⊆ … ,
Теорема [10]. Пусть Fkn
G ⊆ ∪ Fnn и η2 – G-измеримая случайная величина. Пусть также выполнены
n ≥1
условия
n
P
→ η2 ;
∑ ξ2nk ⎯⎯
P
max ξnk ⎯⎯
→ 0;
1≤ k ≤ n
sup E max ξ nk
1≤ k ≤ n
n
k =1
1+δ
< ∞, δ > 0;
E ⎡⎣ ξnk Fkn−1 ⎤⎦ = 0.
n
d
Тогда Sn = ∑ ξnk ⎯⎯
→ Z , где Z – случайная величина с характеристической
k =1
(
)
функцией E exp − λ 2 η2 2 , λ∈R.
Можно показать, используя (7)–(11), что случайные величины
1
ξnk =
vk −1,i yk −1,i γ k −1ε k χ k ≤τ удовлетворяют данным условиям, причем
ΓN H
η2 = ( ω + α ) Γ , т.е. Eη2 ≤ 1 . Величина S → λˆ − λ при n → ∞ .
n
N
i
i
Теорема 2. При достаточно больших значениях H для оценок (7) при δH > d ,
где d > 1 , верно
{(
P λˆ i − λ i
)
2
}
δH ⎞ ⎞
1 ⎫⎪
⎪⎧ N 2
> δ ≤ 2 ⎛⎜ 1 − Φ ⎛⎜
⎬,
⎟ ⎟ + P ⎨∑ ε n < 2
⎝
⎝ d ⎠⎠
d C N ⎭⎪
⎩⎪ n =1
где Φ ( x ) – функция стандартного одномерного нормального распределения.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ю.Б. Буркатовская, С.Э. Воробейчиков
40
Доказательство. Согласно изложенному выше,
{(
P λˆ i − λ i
=
2
∫
)
2
}
> δ ⎯⎯⎯→
H →∞
( Eϕ
η
)
∫
E ϕη ( x ) dx =
x 2 >δH
( x ) χη2 ≤ d 2 dx + P {η2 > d 2 } ,
(14)
x >δH
где ϕη ( ⋅) – плотность нормального распределения с нулевым средним и дисперсией η2 . Принимая во внимание, что для x ≥ η1 > η2 верно ϕη1 ( x ) > ϕη2 ( x ) , получаем, что
∫
x 2 >δH
( Eϕ
η
)
( x ) χη2 ≤ d 2 dx ≤
δH ⎞ ⎞
ϕd ( x ) dx = 2 ⎛⎜ 1 − Φ ⎛⎜
⎟ ⎟.
⎝
⎝ d ⎠⎠
x 2 >δH
∫
(15)
Рассмотрим второе слагаемое правой части (14). Используя неравенство (13) и условие γ 2n ≥ ω + α , имеем
⎧ω + α
⎫
ω + α ⎪⎫
⎪⎧ N
P η2 > d 2 = P ⎨
> d 2 ⎬ = P ⎨∑ yn2 < 2
⎬≤
d C N ⎪⎭
⎪⎩ n =1
⎩ ΓN
⎭
1 ⎪⎫
ω + α ⎪⎫
⎪⎧ N
⎪⎧ N 2
≤ P ⎨∑ γ 2n ε 2n +1 < 2
⎬ ≤ P ⎨∑ ε n +1 < 2
⎬.
d C N ⎪⎭
d C N ⎪⎭
⎪⎩ n =1
⎪⎩ n =1
Отсюда и из (15) следует утверждение теоремы.
{
}
Заключение
В работе рассмотрен процесс пороговой авторегрессии первого порядка с условной неоднородностью. Найдены достаточные условия эргодичности процесса.
Получены последовательные оценки авторегрессионных параметров при условии,
что все параметры процесса неизвестны. Предложенные оценки являются несмещенными и обладают ограниченной дисперсией, зависящей от выбора параметра
процедуры оценивания. Исследованы асимптотические свойства предложенных
оценок.
ЛИТЕРАТУРА
1. Joseph D. Petrucelli, Samuel W. Woolford. A threshold AR(1) model // J. Appl. Prob. 1984.
V. 21. P. 270–286.
2. Rong Chen, Ruey S. Tsay. On the ergodicity of TAR(1) model // The Annals of Applied
Probability. 1991. V. 1. No. 4. P. 613–634.
3. Sangyeol Lee, T.N. Shiram. Sequential point estimation of parameters in a threshold AR (1)
model // Stochastic Processes and Their Applications. 1999. V. 84. P. 343–355.
4. Lee O., Shin D.W. A note on the geometric ergodicity of a multiple threshold AR(1) processes on the boundary region with application to integrated m-m processes.// Economic Letters. 2007. V.96. P. 226–231.
5. Mika Meitz, Pentti Saikkonen. A note on the geometric ergodicity of a nonlinear AR-ARCH
model // Statistics and Probability Letters. 2010. V. 80. P. 631–638.
6. Sean Mein, Richard Tweedie. Markov Chains and Stochastic Stability. Springer Verlag, 1993.
412 p.
7. Борисов, Конев В.В. О последовательном оценивании параметров дискретных процессов // Автоматика и телемеханика. 1977. № 10. С. 58–64
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Гарантированное оценивание параметров порогового авторегрессионного процесса
41
8. Дмитриенко А.А., Конев В.В. О последовательной классификации процессов авторегрессии с неизвестной дисперсией помех // Проблемы передачи информации. 1995.
Т. 31. Вып. 4. С. 51−62.
9. Андерсон Т. Статистический анализ временных рядов. М.: Мир, 1976. 756 с.
10. Липцер Р.Ш., Ширяев А.Н. Теория мартингалов. М.: Наука, 1986. 512 с.
Буркатовская Юлия Борисовна
Томский политехнический университет, Томский государственный университет
Воробейчиков Сергей Эрикович
Томский государственный университет
E-mail: tracey@tpu.ru; sev@mail.tsu.ru
Поступила в редакцию 6 мая 2012 г.
Burkatovskaya Yulia B., Vorobeychikov Sergey E. (Tomsk Polytechnic University, Tomsk State
University). Guaranteed estimation of parameters of threshold autoregressive process with
conditional heteroskedasticity.
Keywords: TAR/ARCH, least squares method, mean square error, guaranteed estimation.
A nonlinear autoregressive model TAR/ARCH(1,1) was considered. In the model the value of
the autoregressive parameter and the noise variation depend on the value of the process in the
previous moment. Sufficient conditions of the ergodicity of the process were obtained. Estimators
of the autoregressive parameters if all the process parameters are unknown were constructed. The
estimators are unbiased and their variations are bounded from above by values depending of the
estimation procedure parameter. Asymptotic properties of the estimators were investigated.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 2(23)
УДК 519.21
А.М. Горцев, М.Н. Голофастова
ОПТИМАЛЬНАЯ ОЦЕНКА СОСТОЯНИЙ МОДУЛИРОВАННОГО
СИНХРОННОГО ДВАЖДЫ СТОХАСТИЧЕСКОГО ПОТОКА СОБЫТИЙ1
Решена задача оптимальной оценки состояний модулированного синхронного дважды стохастического потока событий, являющегося одной из математических моделей информационных потоков событий, функционирующих в
цифровых сетях интегрального обслуживания (ЦСИО). Находится явный
вид апостериорных вероятностей состояний потока. Решение о состоянии
потока выносится по критерию максимума апостериорной вероятности.
Приводятся численные результаты, полученные с использованием расчетных формул и имитационного моделирования.
Ключевые слова: синхронный модулированный поток событий, состояние
потока, апостериорная вероятность состояния, оптимальная оценка состояния.
Математические модели теории массового обслуживания широко применяются при описании реальных физических, технических и других процессов и систем.
В связи с бурным развитием компьютерной техники и информационных технологий появилась важная сфера приложений теории массового обслуживания – проектирование и создание информационно-вычислительных сетей, компьютерных
сетей связи, спутниковых сетей, телекоммуникационных сетей, объединенных
термином – ЦСИО.
На практике параметры, определяющие входной поток событий, изменяются
со временем, при этом изменения часто носят случайный характер, последнее
приводит к рассмотрению дважды стохастических потоков событий. Повидимому, одной из первых работ в этом направлении явилась статья [1], в которой дважды стохастический поток определяется как поток, интенсивность которого есть случайный процесс. Дважды стохастические потоки можно разделить на
два класса: к первому классу относятся потоки, интенсивность которых есть непрерывный случайный процесс; ко второму классу – потоки, интенсивность которых есть кусочно-постоянный случайный процесс с конечным числом состояний.
Подчеркнем, что потоки второго класса впервые введены в рассмотрение практически одновременно в 1979 г. в [2–4]. В [2, 3] введенные потоки названы
MC (Markov chain)-потоками; в [4] – MVP (Markov versatile processes)-потоками.
Последние начиная с конца 80-х годов прошлого века носят название MAP (Markov Arrival Process)-потоков событий. В свою очередь, в зависимости от того, каким образом происходит переход из состояния в состояние, MC-потоки можно
разделить на три типа: 1) синхронные потоки событий [5, 6]; 2) асинхронные потоки событий [7, 8]; 3) полусинхронные потоки событий [9]. Здесь указаны ссылки, в которых авторы впервые рассматривают MC-потоки событий в соответствии
с приведенной классификацией. Наиболее обширная литература по рассматриваемым типам MC-потоков событий приведена в [10]. В [11] введены в рассмот1
Работа выполнена в рамках государственного задания Минобрнауки РФ на проведение научных исследований в Томском государственном университете на 2012−2014 годы, задание 8.4055.2011.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальная оценка состояний модулированного синхронного
43
рение MAP-потоки событий первого порядка (собственно MAP-потоки, введенные в [4]) и MAP-потоки событий второго порядка (суперпозиция (простая сумма)
двух MAP-потоков первого порядка, отличающихся друг от друга исходными
параметрами). В [11] показывается, что синхронный MAP-поток является частным случаем MAP-потока первого порядка, асинхронный и полусинхронный
MC-потоки являются частными случаями MAP-потока второго порядка.
В реальных ситуациях параметры, задающие входящий поток событий, известны либо частично, либо вообще неизвестны, либо (что еще более ухудшает
ситуацию) изменяются со временем. Вследствие этого возникают задачи: 1) оценки состояний потока (задача фильтрации интенсивности потока) по наблюдениям
за моментами наступления событий [12]; 2) оценка параметров потока по наблюдениям за моментами наступления событий [13].
В работе [14] введен в рассмотрение модулированный синхронный поток событий, являющийся обобщением синхронного потока и относящийся к классу
MAP-потоков второго порядка. В настоящей статье, являющейся непосредственным развитием работы [14], решается задача об оптимальной оценке состояний
модулированного синхронного потока. Предлагается алгоритм оптимальной
оценки состояний, когда решение о состоянии потока выносится по критерию
максимума апостериорной вероятности, представляющей наиболее полную характеристику состояний потока, которую можно получить, располагая только выборкой наблюдений. Сам критерий минимизирует полную вероятность ошибки
вынесения решения [15].
1. Постановка задачи
Рассматривается модулированный синхронный поток событий (далее поток),
интенсивность которого есть кусочно-постоянный стационарный случайный процесс λ(t) с двумя состояниями: λ1 ,λ 2 (λ1 > λ 2 ) . Длительность пребывания процесса
λ(t) (потока) в i-м состоянии распределена по экспоненциальному закону с параметром αi , i = 1, 2 . Если процесс λ(t) в момент времени t находится в i-м состоянии, то на полуинтервале [t , t + ∆t ) , где ∆t − достаточно малая величина, с вероятностью αi ∆t + o(∆t ) пребывание процесса λ(t) в i-м состоянии закончится, и
процесс λ(t) с вероятностью равной единице перейдет из i-го состояния в j-е
(i, j=1,2, i≠j). В течение временного интервала случайной длительности, когда
λ(t ) = λ i , имеет место пуассоновский поток событий с интенсивностью λi , i = 1, 2 .
Кроме того, переход из первого состояния процесса λ(t) во второе возможен в момент наступления события пуассоновского потока интенсивности λ1 ; переход
осуществляется с вероятностью p (0 < p ≤ 1); с вероятностью 1−p процесс λ(t)
λ(t)
1–p
λ1
λ2
0
t2
1–p
α1
q
1–q
t1
1–p
t3
t4
1–q
t5
1–q α2
t6
p
t7
t8
…
…
Рис. 1. Модулированный синхронный дважды стохастический поток событий
t
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
44
А.М. Горцев, М.Н. Голофастова
остается в первом состоянии. Переход из второго состояния процесса λ(t) в первое
возможен также в момент наступления события пуассоновского потока интенсивности λ 2 ; переход осуществляется с вероятностью q (0<q≤1); с вероятностью 1−q
процесс λ(t ) остается во втором состоянии. В сделанных предпосылках λ(t) −
марковский процесс. Вариант возникающей ситуации приведен на рис.1, где
λ1 ,λ 2 − состояния процесса λ(t ) , t1 , t2 ,.... − моменты наступления событий потока.
Блочная матрица инфинитезимальных коэффициентов примет вид
−(λ1 + α1 )
α1
(1 − p )λ1
pλ1
D=
= D0 D1 .
α2
(1 − q )λ 2
−(λ 2 + α 2 ) qλ 2
Элементами матрицы D1 являются интенсивности переходов процесса λ(t ) из
состояния в состояние с наступлением события. Недиагональные элементы матрицы D0 − интенсивности переходов из состояния в состояние без наступления
события. Диагональные элементы матрицы D0 − интенсивности выхода процесса
λ(t) из своих состояний, взятые с противоположным знаком. Отметим, что если
αi = 0, i = 1, 2 , то имеет место обычный синхронный поток событий [5].
Подчеркнем, что в постановке задачи принимается первичность наступления
события, затем – переход процесса λ(t) из состояния в состояние. Данное обстоятельство при получении аналитических результатов является несущественным,
так как наступление события и переход процесса λ(t) из состояния в состояние
происходит мгновенно. При получении же численных результатов путем имитационного моделирования необходима определенность, что первично – наступление события, затем смена состояния либо наоборот.
Так как процесс λ(t) и типы событий (события пуассоновских потоков с интенсивностями λ1 либо λ 2 являются принципиально ненаблюдаемыми, а наблюдаемыми являются только временные моменты наступления событий на временной оси t1 , t2 ,... , то необходимо по этим наблюдениям оценить состояние процесса λ(t) (потока) в момент окончания наблюдений.
Рассматривается стационарный режим функционирования потока событий,
поэтому переходными процессами на интервале наблюдения ( t0 , t ) , где t0 − начало наблюдений, t − окончание наблюдений (момент вынесения решения), пренебрегаем. Тогда без потери общности можно положить t0 = 0 . Для вынесения
решения о состоянии процесса λ(t) в момент времени t необходимо определить
апостериорные вероятности w(λ i | t ) = w(λ i | t1 ,...tm , t ), i = 1, 2 , того, что в момент
времени t значение процесса λ(t ) = λ i (m – количество наблюденных событий за
время t), при этом w(λ1 | t ) + w(λ 2 | t ) = 1 , тогда, если w(λ j | t ) ≥ w(λ i | t ), i, j = 1, 2,
i ≠ j , то оценка состояния процесса есть λ̂(t ) = λ j .
2. Алгоритм оптимальной оценки состояний
модулированного синхронного потока
Момент вынесения решения t будет принадлежать интервалу ( tk , tk +1 ) ,
k = 1, 2,... , между соседними событиями потока. Для начального интервала ( t0 , t1 )
момент t будет лежать между началом наблюдения t0 и моментом t1 . Рассмотрим
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальная оценка состояний модулированного синхронного
45
интервал ( tk , tk +1 ) , значение длительности которого есть τ k = tk +1 − tk , k = 0,1,... .
Для вывода формул апостериорной вероятности w(λ1 | t ) используем известную
методику [15]: сначала рассмотрим дискретные наблюдения через равные достаточно малые промежутки времени ∆t , а затем совершим предельный переход при
стремлении ∆t к нулю.
Пусть время меняется дискретно с шагом ∆t : t = n∆t , n = 0,1,... . Введем двумерный процесс (λ ( n ) , rn ) , где λ ( n ) = λ(n∆t ) – значение процесса λ(t ) в момент
времени n∆t (λ ( n ) = λ i , i = 1, 2) ; rn = rn (∆t ) = r (n∆t ) − r ((n − 1)∆t ) – число событий,
наблюденных на временном интервале ((n − 1)∆t ); n∆t ), rn = 0,1,... , длительности
∆t . Обозначим λ (m) = (λ (0) , λ (1) ,..., λ (0) ) – последовательность неизвестных (неназначений
процесса
(0)
r
блюдаемых)
λ(n∆t )
в
моменты
n∆t (n = 0, m) ;
λ = λ(0) = λ i , i = 1, 2 . Обозначим m = (r0 , r1 ,..., rm ) – последовательность числа
событий за время от 0 до m∆t на интервалах ((n − 1)∆t ); n∆t ) длительности ∆t ,
n = 0, m (значение r0 можно задавать произвольно, так как промежуток (−∆t , 0)
m)
при условии, что наблюдалась реализация
m
. Аналогично w(λ ( m ) |
=
λ2
∑λ
(m +1)
w(λ ( m ) |
= λ1
λ2
=λ ∑ λ
1
(m)
= λ1
m ) p (λ
w(λ ( m ) |
( m +1)
r
m +1 )
(m)
r
|
r
w(λ
λ2
∑λ
m)
и w(λ ( m +1) |
, rm +1 | λ ( m ) , rm )
m ) p (λ
( m +1)
, rm +1 | λ ( m ) , rm )
r
формула, связывающая апостериорные вероятности w(λ ( m ) |
( m +1)
m +1 ) .
, rn ) в [8] получена рекуррентная
r
Для марковского случайного процесса (λ
(n)
условную вероятность значения
r
λ
(m)
r
мер, равным 0). Обозначим через w(λ ( m ) |
r
находится за пределами интервала наблюдения (0, m∆t ) , и положить его, напри-
m +1 ) :
,
(1)
где p (λ ( m +1) , rm +1 | λ ( m ) , rm ) − вероятность перехода процесса (λ ( n ) , rn ) за один шаг
∆t из состояния (λ ( m ) , rm ) в состояние (λ ( m +1) , rm +1 ) . В рассматриваемом случае
модулированного синхронного дважды потока процесс (λ ( n ) , rn ) будет марковским, при этом переходная вероятность p (λ ( m +1) , rm +1 | λ ( m ) , rm ) в (1) примет вид
= w(λ ( m +1) |
m +1 (t
λ2
w(λ
( m +1)
| t + ∆t ) =
∑λ
λ2
∑λ
(m +1)
(m)
1
= w(λ ( m ) |
m (t ))
= w(λ ( m +1) | t ),
+ ∆t )) = w(λ ( m +1) | t + ∆t ) , то (1) запишется в виде
w(λ ( m ) | t ) p (λ ( m +1) | λ ( m ) ) p (rm +1 | λ ( m ) , λ ( m +1) )
= λ1
λ2
=λ ∑ λ
m)
r
m +1 )
r
w(λ ( m +1) |
r
Принимая во внимание, что если w(λ ( m ) |
r
p (λ ( m +1) , rm +1 | λ ( m ) , rm ) = p (λ ( m +1) | λ ( m ) ) p (rm +1 | λ ( m ) , λ ( m +1) ) .
(m)
= λ1
w(λ ( m ) | t ) p (λ ( m +1) | λ ( m ) ) p (rm +1 | λ ( m ) , λ ( m +1) )
.(2)
Лемма 1. В течение времени между наступлениями соседних событий модулированного синхронного потока tk и tk +1 , k = 0,1,... , апостериорная вероят-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
46
А.М. Горцев, М.Н. Голофастова
ность w(λ1 | t ) удовлетворяет дифференциальному уравнению
dw(λ1 | t )
= (λ1 − λ 2 ) ( w(λ1 | t ) − w1 ) ( w(λ1 | t ) − w2 ) ,
dt
(3)
w1,2 = ⎡⎢ α1 + α 2 + λ1 − λ 2 ∓ (λ1 − λ 2 + α1 − α 2 ) 2 + 4α1α 2 ⎤⎥ / 2(λ1 − λ 2 ).
⎣
⎦
Доказательство. Для определенности положим в (2) λ ( m+1) = λ1 . В силу определения потока величина rm +1 в (2) может принимать два значения:
rm +1 = 0, rm +1 = 1 . Здесь рассматривается поведение вероятности w(λ1 | t ) на полумежду соседними событиями потока, то есть
интервале [tk , tk +1 )
tk ≤ t < tk +1 , tk ≤ t + ∆t < tk +1 . Тогда в (2) rm +1 = 0 и, с учетом матрицы D0 , на полуинтервале [t , t + ∆t ) = [ m∆t , (m + 1)∆t ) переходные вероятности в (2) запишутся в
виде
p (λ ( m +1) = λ i | λ ( m ) = λ1 ) p (rm +1 = 0 | λ ( m +1) = λ i , λ ( m ) = λ1 ) =
= 1 − αi ∆t − λ i ∆t + o(∆t ), i = 1, 2,
p (λ ( m +1) = λ i | λ ( m ) = λ 2 ) p (rm +1 = 0 | λ ( m +1) = λ.i , λ ( m ) = λ 2 ) =
= αi ∆t + o(∆t ), i = 1, 2.
Подставляя эти выражения в (2), находим
w(λ1 | t )(1 − α1∆t − λ1∆t ) + w(λ 2 | t )α 2 ∆t + o(∆t )
w(λ1 | t + ∆t ) =
.
w(λ1 | t )(1 − λ1∆t ) + w(λ 2 | t )(1 − λ 2 ∆t ) + o(∆t )
Учитывая, что w(λ 2 | t ) = 1 − w(λ1 | t ) и при достаточно малых ∆t величина
A2−1 = 1 + λ 2 ∆t + + w(λ1 | t )(λ1 − λ 2 )∆t + o(∆t ) , то деля обе части равенства на ∆t и
устремив ∆t к 0, получаем
dw(λ1 | t )
= α 2 − w(λ1 | t )(α1 + α 2 + λ1 − λ 2 ) + w2 (λ1 | t )(λ1 − λ 2 ).
dt
Находя корни w1 и w2 характеристического уравнения
α 2 − w(λ1 | t )(α1 + α 2 + λ1 − λ 2 ) + w2 (λ1 | t )(λ1 − λ 2 ) = 0,
подставляя их в полученное дифференциальное уравнение, приходим к (3).
Лемма 1 доказана.
Замечание 1. Уравнение (3) определяет поведение вероятности w(λ1 | t ) на полуинтервале [tk , tk +1 ) , k = 0,1,... , то есть между моментами наступления событий,
причем на правом конце полуинтервала имеет место значение w(λ1 | tk +1 − 0) , на
основе которого, как будет показано в лемме 2, находится вероятность
w(λ1 | tk +1 + 0) , являющаяся начальной для следующего полуинтервала [tk +1 , tk + 2 ) .
Лемма 2. Апостериорная вероятность w(λ1 | t ) в момент наступления события
модулированного синхронного потока tk , k = 0,1,... , определяется формулой пересчета
qλ + ((1 − p )λ1 − qλ 2 ) w(λ1 | tk − 0)
w(λ1 | tk +1 + 0) = 2
, k = 1, 2,... .
(4)
λ 2 + (λ1 − λ 2 )w(λ1 | tk − 0)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальная оценка состояний модулированного синхронного
47
Доказательство. Пусть на интервале (t , t + ∆t ) в момент времени tk
( t < tk < t + ∆t ) наступает событие потока ( rm +1 = 1 ). Имеем два смежных интервала (t , tk ) и (tk , t + ∆t ) . Длительность первого tk − t = ∆t ′ , длительность второго
t + ∆t − tk = ∆t ′′. Тогда в (2) w(λ ( m ) | t ) = w(λ ( m ) | tk − ∆t ′) ,
= w(λ1 | tk + ∆t ′′), и (2) примет вид
w(λ ( m +1) | t + ∆t ) =
λ2
w(λ1 |tk +∆t ′′) =
∑ λ =λ w(λ(m) |tk −∆t ') p(λ1 |λ(m) ) p(rm+1 |λ (m) ,λ(m+1) )
.
λ
( m)
( m+1) ( m )
( m ) ( m+1)
w
(
λ
|
t
−∆
t
')
p
(
λ
|
λ
)
p
(
r
|
λ
,
λ
)
k
m+1
=λ ∑ λ =λ
( m)
∑
λ2
λ ( m+1)
1
1
2
(m)
(5)
1
С учетом матрицы D1 на интервале ( t , t + ∆t ) = ( m∆t , (m + 1)∆t ) переходные вероятности в (5) запишутся в виде
p (λ ( m +1) = λ1 | λ ( m ) = λ1 ) p (rm +1 = 1| λ ( m +1) = λ1 ,λ ( m ) = λ1 ) = (1 − p )λ1∆t + o(∆t ) ,
p (λ ( m +1) = λ 2 |λ ( m ) = λ 2 ) p (rm +1 = 1| λ ( m +1) = λ 2 ,λ ( m ) = λ 2 ) = (1 − q )λ 2 ∆t + o(∆t ) ,
p (λ ( m +1) = λ1|λ ( m ) = λ 2 ) p (rm +1 = 1| λ ( m +1) = λ1 ,λ ( m ) = λ 2 ) = pλ1∆t + o(∆t ) ,
p (λ ( m +1) = λ 2 |λ ( m ) = λ1 ) p (rm +1 = 1| λ ( m +1) = λ 2 ,λ ( m ) = λ1 ) = qλ 2 ∆t + o(∆t ).
Подставляя данные переходные вероятности в (5), получаем числитель B1 и
знаменатель B2 в (5):
B1 = w(λ1 | tk − t ′)(1 − p )λ1∆t + w(λ 2 | tk − ∆t ′)qλ 2 ∆t + o(∆t ),
B2 = w(λ1 | tk − ∆t ′)(1 − p )λ1∆t + w(λ 2 | tk − ∆t ′)qλ 2 ∆t + w(λ1 | tk − ∆t ′) pλ1∆t +
+ w(λ 2 | tk − ∆t ′)(1 − q )λ 2 ∆t + o(∆t ).
Подставляя B1 и B2 в (5) , деля числитель и знаменатель на ∆t и устремляя
∆t к 0 ( ∆t ′ и ∆t ′′ стремятся к 0 одновременно), учитывая, что w(λ 2 | tk − ∆t ′) =
= 1 − w(λ1 | tk − ∆t ′) , приходим к (4). Лемма 2 доказана.
Замечание 2. В точке tk вероятность w(λ1 | t ) претерпевает разрыв (имеет место конечный скачок). Тогда решение уравнения (3) будет зависеть от начального
условия в момент времени tk , т.е. от w(λ1 | tk + 0), k = 1, 2,... . В свою очередь,
w(λ1 | tk + 0) зависит от значения w(λ1 | tk − 0) − значение вероятности w(λ1 | t ) в
момент времени tk , когда w(λ1 | t ) , определяемая в (3), изменяется на полуинтер-
вале [tk −1 , tk ) , соседнем с полуинтервалом [tk , tk +1 ) , k = 1, 2,... . Таким образом, в
значении w(λ1 | tk + 0) «сосредоточена» вся предыстория наблюдений за потоком
начиная от момента времени t0 = 0 до момента tk .
В качестве начального условия w(λ1|t0 + 0) = w(λ1 | t0 = 0) в (3) выбирается априорная финальная вероятность первого состояния процесса λ(t ) :
π1 = (α1 + pλ1 ) /(α1 + α 2 + pλ1 + qλ 2 ) .
(6)
Замечание 3. Рассмотрим случай, когда p+q=1. Тогда выражение (4) приобретает вид
w(λ1 | tk + 0) = q, k = 1, 2,... .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.М. Горцев, М.Н. Голофастова
48
Последнее говорит о том, что для этого частного случая вероятность w(λ1 | t )
не зависит от предыстории, а зависит только от ее значения в момент tk , т.е. от
w(λ1 | tk + 0) = q для любых k (k = 1, 2,...).
Леммы 1 и 2 позволяют сформулировать следующую теорему.
Теорема. Поведение апостериорной вероятности w(λ1 | t ) на временных по-
луинтервалах [tk , tk +1 ) , k = 1, 2,..., определяется явной формулой:
w(λ1 | t ) =
где
w1 ( w(λ1 | tk + 0) − w2 ) − w2 ( w(λ1 | tk + 0) − w1 )e( w1 − w2 )(λ1 − λ 2 )(t −tk )
w(λ1 | tk + 0) − w2 − ( w(λ1 | tk + 0) − w1 )e( w1 − w2 )(λ1 − λ 2 )(t −tk )
tk ≤ t < tk +1 (k = 0,1,...) ; w(λ1 | tk + 0) определена формулой (4),
,
(7)
k = 1, 2,... ;
w(λ1 | t0 + 0) = w(λ1 | t0 = 0) = π1 , где π1 определяется в (6); w1 , w2 определены в
(3).
Доказательство. Уравнение (3) в лемме 1 представимо в виде
1 ⎡ d ( w(λ1 | t ) − w1 ) d ( w(λ 2 | t ) − w2 ) ⎤
−
= (λ1 − λ 2 )dt ,
w1 − w2 ⎢⎣ w(λ1 | t ) − w1
w(λ 2 | t ) − w2 ⎥⎦
(8)
где w1 и w2 определены в (3). Интегрируя (8) в пределах от tk + 0 до t получаем
(7). Теорема доказана.
Полученные формулы позволяют сформулировать алгоритм расчета вероятности w(λ1 | t ) и алгоритм принятия решения о состоянии процесса λ(t ) в любой
момент времени t (алгоритм оптимальной оценки состояния модулированного
синхронного потока):
1) в момент времени t0 = 0 по формуле (6) задается
w(λ1 | t0 + 0) = w(λ1 | t0 = 0) = π1 ;
2) по формуле (7) для k=0 вычисляется вероятность w(λ1 | t ) в любой момент
времени t ( 0 < t < t1 ), где t1 − момент наступления первого события потока;
3) по формуле (7) для k=0 рассчитывается вероятность w(λ1 | t1 ) = w(λ1 | t1 − 0) ;
4) k увеличивается на единицу, и по формуле (4) для k=1 вычисляется значение
w(λ1 | t1 + 0) , являющееся начальным значением для w(λ1 | t ) в формуле (7);
5) по формуле (7) для k=1 рассчитывается вероятность w(λ1 | t ) в любой момент времени t ( t1 < t < t2 );
6) по формуле (7) для k=1 вычисляется вероятность w(λ1 | t2 ) = w(λ1 | t2 − 0) ;
7) алгоритм переходит на шаг 4, после чего шаги 4 − 6 повторяются для k = 2
и т.д.
По ходу вычисления w(λ1 | t ) в любой момент времени t выносится решение о
состоянии процесса λ(t ) : если w(λ1 | t ) ≥ 0,5 , то оценка λ̂(t ) = λ1 , в противном
случае λ̂(t ) = λ 2 .
Особый случай. Если p+q=1, то каждый раз, когда алгоритм возвращается на
шаг 4, вероятность w(λ1 | tk + 0), k = 1, 2,... , полагается равной q.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальная оценка состояний модулированного синхронного
49
3. Результаты статистического эксперимента
Для получения численных результатов разработан алгоритм вычисления апостериорной вероятности w(λ1 | t ) по формулам (4) – (7). Программа расчета реализована на языке программирования Visual C++, Microsoft Visual Studio 2008.
Первый этап расчета предполагает имитационное моделирование модулированного синхронного потока. Описание алгоритма моделирования здесь не приводится,
так как никаких принципиальных трудностей он не содержит. Второй этап расчета – вычисление вероятностей w(λ1 | t ) , t0 ≤ t < t1 ; w(λ1 | tk + 0) ; w(λ1 | t ) ,
tk ≤ t < tk +1 , k=1,2,…, по формулам (4), (6), (7) и построение оценки λ̂(t ) .
Пример поведения процесса λ(t ) и его оценки изображен на рис. 2. Данные
результаты получены для следующих значений параметров: λ1 = 1 , λ 2 = 0,5 ,
p = 0,4, q = 0,5, α1 = 2 , α 2 = 1 , время моделирования T = 100 ед. времени. В верхней части рисунка изображено истинное поведение процесса λ(t ) , полученное
путем имитационного моделирования, где λ1 и λ 2 − состояния процесса λ(t ) .
В нижней части рисунка изображено поведение оценки λ̂(t ) процесса λ(t ) .
Вынесение решения о состоянии процесса λ(t ) производилось с шагом
∆t = 0, 01 . На рис. 2 штриховкой на оси времени обозначены промежутки, на которых оценка состояния не совпадает с истинным значением процесса λ(t ) (область ошибочных решений). На рис. 3 приведена траектория поведения апостериорной w(λ1 | t ), соответствующая полученной при имитационном моделировании
последовательности событий t1 , t2 ,... .
λ(t)
λ1
λ2
0
λ(t)
t
λ1
λ2
t
0
Рис. 2. Траектория процесса λ(t ) и оценки λ̂(t )
w(λ1| t)
1
0,5
0
t1
t2
t3
t4
Рис. 3. Траектория поведения апостериорной вероятности w(λ1 | t )
t
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.М. Горцев, М.Н. Голофастова
50
Для установления частоты ошибочных решений о состоянии процесса λ(t ) по
наблюдениям за потоком проведен статистический эксперимент, состоящий из
следующих этапов: 1) для определенного набора параметров λ1 , λ 2 , p, q, α1 , α 2 ,
Tm ед. времени осуществляется моделирование потока событий на заданном от-
резке времени [ 0, Tm ] (отдельный j-й эксперимент); 2) рассчитывается вероят-
ность w(λ1 | t ) на отрезке [ 0, Tm ] по формулам (4), (6), (7); 3) оценивается траек-
тория процесса λ(t ) на отрезке [ 0, Tm ] ; 4) осуществляется определение (для j-го
эксперимента) d j – суммарной протяженности интервалов, на которых значение
процесса λ(t ) не совпадает с его оценкой λ̂(t ) ; 5) вычисляется доля ошибочных
решений pˆ j = d j / Tm ; 6) производится повторение N раз ( j = 1, N ) шагов 1 − 5 для
расчета оценки безусловной (полной) вероятности принятия решения о состояниях процесса λ(t ) на отрезке [ 0, Tm ] .
Результатом выполнения описанного алгоритма является выборка
( p̂1 , p̂2 ,… pˆ N ) долей ошибочных решений в N экспериментах. По этому набору
вычисляются выборочное среднее безусловной вероятности принятия ошибочноN
N
j =1
j =1
го решения Pˆ = (1/ N )∑ pˆ j и выборочная дисперсия Dˆ = (1/(1 − N ))∑ ( pˆ j − Pˆ ) 2 .
Результаты статистического эксперимента приведены в табл. 1 − 6. В первой
строке таблиц указаны значения изменяющегося параметра при остальных фиксированных. Во второй и третьей строках таблиц для каждого значения изменяющегося параметра приведены численные значения P̂ и D̂ . Результаты в табл. 1,2
получены при следующих фиксированных параметрах, p=0,6, q=0,6, α1 = 1 ,
α 2 = 0, 2 . При этом в табл. 1 параметр λ1 меняет значения от 1 до 10 при
λ 2 = 0,5 , в табл. 2 λ 2 принимает значения от 0,5 до 9 при λ1 = 10 . Результаты в
табл. 3,4 получены при p=0,6, q=0,6, λ1 = 10 , λ 2 = 0,5 , причем в табл. 3 α1 принимает значения от 1 до 10 при α 2 = 0, 2 , в табл. 4 α 2 принимает значения от 0,2
до 9 при α1 = 10 . Результаты в табл. 5 и 6 приведены, когда λ1 = 5 , λ 2 = 0,5 ,
α1 = 5 , α 2 = 0, 2 , при этом в табл. 5 p меняет свое значение от 0,05 до 0,9 при
q=0,6, а в табл. 6 параметр q варьируется от 0,05 до 0,9 при p = 0,6.
Таблица 1
λ1
1
2
3
4
5
6
7
8
9
10
P̂
0,2525 0,2003 0,1602 0,1326 0,1171 0,1085 0,0897 0,0826 0,0763 0,0718
D̂
0,0017 0,0009 0,0006 0,0005 0,0005 0,0003 0,0003 0,0002 0,0002 0,0001
Таблица 2
λ2
0,5
1
2
3
4
5
6
7
8
9
P̂
0,0683 0,1046 0,1683 0,2271 0,2795 0,3066 0,3516 0,3889 0,4122 0,4430
D̂
0,0002 0,0003 0,0004 0,0003 0,0002 0,0007 0,0004 0,0003 0,0004 0,0005
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальная оценка состояний модулированного синхронного
51
Таблица 3
α1
1
2
3
4
5
6
7
8
9
10
P̂
0,0683 0,0610 0,0574 0,0527 0,0468 0,0423 0,0405 0,0394 0,0347 0,0332
D̂
0,0002 0,0001 0,00004 0,00006 0,00009 0,00005 0,00006 0,00005 0,00002 0,00002
Таблица 4
α2
0,2
1
2
3
4
5
6
7
8
9
P̂
0,0337 0,0748 0,1248 0,1648 0,2135 0,2460 0,2788 0,3089 0,3397 0,3628
D̂
0,00002 0,00008 0,00009 0,0001 0,0002 0,0001 0,0001 0,0002 0,0001 0,0001
Таблица 5
p
0,05
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
P̂
0,0820 0,0800 0,0780 0,0741 0,0741 0,0700 0,0641 0,0613 0,0575 0,0532
D̂
0,0002 0,0001 0,0001 0,00009 0,0001 0,00009 0,0001 0,0001 0,0001 0,00007
Таблица 6
q
0,05
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
P̂
0,0305 0,0318 0,0382 0,0415 0,0492 0,0539 0,0629 0,0708 0,0712 0,0747
D̂
0,00005 0,00005 0,00007 0,00009 0,00009 0,0001 0,0001 0,0001 0,0002 0,0002
Заключение
Анализ результатов, приведенных в табл. 1, 2, говорит о том, что имеется тенденция роста оценки P̂ при уменьшении разности λ1−λ2 и, наоборот, тенденция
уменьшения оценки P̂ при увеличении разности λ1−λ2. Последнее вполне естественно, так как при увеличении разности λ1−λ2 условия различимости двух состояний λ1 и λ2 улучшаются. Аналогичная тенденция роста оценки P̂ наблюдается в
табл. 3, 4 при уменьшении разности α1−α2, что объясняется лучшей различимостью состояний λ1 и λ2 процесса λ(t) при увеличении разности α1−α2 и соответственно приводит к уменьшению вероятности принятия ошибочного решения.
Уменьшение вероятности P̂ хорошо прослеживается в табл. 5 и может быть объяснено тем, что при среднем значении вероятности перехода q, высокой частоте
наступления событий в первом состоянии (λ1 = 5) и низкой частоте наступления
событий во втором состоянии (λ2 = 0,5) время, проведенное процессом λ(t) во втором состоянии, увеличивается с ростом вероятности p, что дает возможность
большей различимости состояний и, следовательно, ведет к уменьшению вероятности ошибки. Обратная тенденция наблюдается в табл. 6. Здесь при среднем значении вероятности перехода p, низкой частоте наступления событий во втором
состоянии и, наоборот, высокой частоте наступления событий в первом состоянии
вероятность принятия ошибочного решения увеличивается с ростом q вследствие
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
52
А.М. Горцев, М.Н. Голофастова
уравнивания длительности пребывания процесса λ(t) в каждом из состояний, что
приводит к ухудшению условий их различимости.
ЛИТЕРАТУРА
1. Kingman J.F.C. On doubly stochastic Poisson process // Proc. Cambridge Phylosoph. Soc.
1964. V. 60. No. 4. P. 923–930.
2. Башарин Г.П., Кокотушкин В.А., Наумов В.А. О методе эквивалентных замен расчета
фрагментов сетей связи // Изв. АН СССР. Техн. кибернетика. 1979. № 6. С. 92–99.
3. Башарин Г.П., Кокотушкин В.А., Наумов В.А. О методе эквивалентных замен расчета
фрагментов сетей связи // Изв. АН СССР. Техн. кибернетика. 1980. № 1. С. 55–61.
4. Neuts M.F. A versatile Markov point process // J. Appl. Probab. 1979. V. 16. P. 764–779.
5. Нежельская Л.А. Нелинейная оптимальная фильтрация дважды стохастического потока с инициативными событиями // Тез. докл. науч.-технич. конф. «Микросистема-91».
Суздаль. М.: Всесоюзное общество информатики и вычислительной техники, 1991.
С. 26−28.
6. Горцев А.М., Нежельская Л.А. Оценка параметров синхронного MC-потока событий //
Сети связи с сети ЭВМ: тез. докл. Восьмой Белорусской зимней школы-семинара по
теории массового обслуживания. Минск: Изд-во БГУ, 1992. С. 33.
7. Горцев А.М., Нежельская Л.А. Оптимизация параметров адаптера при наблюдении за
MC-потоком // Стохастические и детерминированные модели сложных систем. Новосибирск: Изд-во ВЦ СО АН СССР, 1988. С. 20−32.
8. Горцев А.М., Нежельская Л.А. Оптимальная нелинейная фильтрация марковского потока событий с переключениями // Техника средств связи. Сер. Системы связи. 1989.
Вып. 7. С. 46−54.
9. Нежельская Л.А. Алгоритм оценивания состояний полусинхронного потока событий с
учетом мертвого времени // Массовое обслуживание: потоки, системы, сети: материалы четырнадцатой Белорусской зимней школы-семинара по теории массового обслуживания. Минск: Изд-во БГУ, 1998. С. 18−21.
10. Горцев А.М., Калягин А.А., Нежельская Л.А. Оптимальная оценка состояний обобщенного полусинхронного потока событий // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 2(11). С. 66−81.
11. Горцев А.М., Нежельская Л.А. О связи MC-потоков и MAP-потоков событий// Вестник
Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 1(14). С. 13−21.
12. Горцев А.М., Нежельская Л.А., Соловьев А.А. Оптимальная оценка состояний MAPпотока событий в условиях непродлевающегося мертвого времени // Автоматика и телемеханика. 2012. № 8. С. 49−63.
13. Gortsev A.M., Nezhel’skaya L.A., Solov’ev A.A. Optimal state estimation in MAP event flows
with unextendable died time // Automation and Remore Control. 2012. V. 73. No. 8.
P. 1316−1326.
14. Бушланов И.В., Горцев А.М., Нежельская Л.А. Оценка параметров синхронного дважды
стохастического потока событий //Автоматика и телемеханика. 2008. № 9. С. 76−93.
15. Голофастова М.Н., Нежельская Л.А. Апостериорные вероятности состояний модулированного синхронного потока событий // Материалы X Российской конференции с
международным участием «Новые информационные технологии в исследовании сложных структур». Томск: Изд-во НТЛ, 2012. С. 83.
16. Хазен Э.М. Методы оптимальных статистических решений и задачи оптимального
управления. М.: Сов. радио, 1968. 256 с.
Голофастова Мария Николаевна
Горцев Александр Михайлович
Томский государственный университет
E-mail: mashuliagol@mail.ru, gam@fpmk.tsu.ru
Поступила в редакцию 17 января 2013 г.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимальная оценка состояний модулированного синхронного
53
Golofastova Maria N., Gortsev Alexander M. (Tomsk State University). The optimal state estimation of modulated synchronous twice stochastic flow of events.
Keywords: modulated synchronous flow, state of flow, posterior state probability, optimal state
estimation.
One considers the modulated synchronous doubly stochastic flow of events, which rate is
piecewise constant random process λ(t) with two states: λ1 , λ 2 (λ1 > λ 2 ) . The time when process
λ(t) is staying in i-th state has exponential probability distribution function with parameter
αi , i = 1, 2 . On the interval when λ(t ) = λ i there is Poisson flow with rate λ i , i = 1, 2 . A state
transition of process λ(t) occurs in moment of Poisson flow event arrival, moreover, the passing
from the first to the second state is realized with probability p, the passing from the second to the
first state is realized with probability q.
A formula of posterior probability w(λ1 | t ) is deduced. One concludes the algorithm of optimal state estimation of modulated synchronous flow using the criterion of posterior probability
maximum, which provides minimum of wrong decision probability. The statistical experiment
data and its analysis are given.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 2(23)
УДК 519.21
М.А. Леонова, Л.А. Нежельская
ОЦЕНКА МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ
ДЛИТЕЛЬНОСТИ МЕРТВОГО ВРЕМЕНИ В ОБОБЩЕННОМ
АСИНХРОННОМ ПОТОКЕ СОБЫТИЙ1
Изучается обобщенный асинхронный поток событий, являющийся одной из
адекватных математических моделей информационных потоков заявок в
цифровых сетях интегрального обслуживания (ЦСИО). Поток функционирует в условиях непродлевающегося мертвого времени, когда длительность
мертвого времени – неизвестная фиксированная величина. Решается методом максимального правдоподобия задача об оценивании длительности
мертвого времени по наблюдениям за моментами наступления событий потока.
Ключевые слова: обобщенный асинхронный поток событий, непродлевающееся мертвое время, функция правдоподобия, оценка максимального
правдоподобия, длительность мертвого времени.
Настоящая статья является непосредственным продолжением исследований
обобщенного асинхронного потока событий (далее – поток), начатых в статьях
[1–4]. Изучаемый поток относится к классу дважды стохастических потоков событий и является одной из адекватных математических моделей информационных
потоков сообщений, функционирующих в ЦСИО [5]. Подчеркнем, что в последнее время дважды стохастические потоки используют при построении моделей
входящих потоков – клиентов в страховых компаниях и банках [6]. Дважды стохастические потоки делятся на два класса: к первому классу относятся потоки,
интенсивность которых есть непрерывный случайный процесс; ко второму классу
относятся потоки, интенсивность которых есть кусочно-постоянный случайный
процесс с конечным числом состояний. Второй класс потоков в настоящее время
принято называть МС-потоками либо МАР-потоками событий. В [7] приведена
классификация МС-потоков событий и установлена связь между МС-потоками и
МАР-потоками событий. Наиболее полная литература по изучаемым типам МСпотоков приведена в [8].
В реальных ситуациях параметры, задающие входящий поток событий, известны либо частично, либо вообще неизвестны, либо (что ещё более ухудшает
ситуацию) изменяются со временем. В подобных ситуациях наиболее рациональным является применение адаптивных систем массового обслуживания, которые в
процессе функционирования оценивают неизвестные параметры либо состояния
входящих потоков событий и изменяют дисциплины обслуживания в соответствии с полученными оценками [9]. Вследствие этого возникают задачи: 1) оценки
состояний потока (задача фильтрации интенсивности потока) по наблюдениям за
моментами наступления событий [10, 11]; 2) оценки параметров потока по наблюдениям за моментами наступления событий [12].
1
Работа выполнена в рамках государственного задания Минобрнауки РФ на проведение научных исследований в Томском государственном университете на 2012−2014 годы, задание 8.4055.2011.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценка максимального правдоподобия длительности мертвого времени
55
Одним из искажающих факторов при оценке состояний и параметров потока
событий выступает мертвое время регистрирующих приборов [13], которое порождается зарегистрированным событием. Другие же события, наступившие в течение периода мертвого времени, не продляют его периода и недоступны наблюдению (теряются). Можно считать, что этот период продолжается некоторое фиксированное время (непродлевающееся мертвое время). Подобные ситуации возникают в компьютерных сетях, например, при использовании протокола случайного
множественного доступа с обнаружением конфликта (протокол CSMA/CD). Для
того чтобы оценить потери сообщений потока, возникающие из-за эффекта мертвого времени, необходимо оценить его длительность.
В настоящей статье для решения задачи оценивания длительности мертвого
времени применяется метод максимального правдоподобия [14], так как оценки,
построенные на основе этого метода, как правило, обладают привлекательными
свойствами.
1. Постановка задачи
Рассматривается обобщенный асинхронный дважды стохастический поток событий, интенсивность которого есть кусочно-постоянный случайный процесс λ(t)
с двумя состояниями λ1 и λ2 (λ1> λ2). В течение временного интервала, когда
λ(t) = λi , имеет место пуассоновский поток событий с интенсивностью λi , i=1,2.
Переход из первого состояния процесса λ(t) во второе (из второго в первое) может
осуществляться в произвольный момент времени. При этом длительность пребывания процесса λ(t) в i-ом состоянии распределена по экспоненцильному закону с
параметром αi , i=1,2. При переходе процесса λ(t) из первого состояния во второе
инициируется с вероятностью p (0≤ p ≤1) дополнительное событие во втором состоянии (т.е. сначала осуществляется переход, а затем инициируется дополнительное событие). Наоборот, при переходе процесса λ(t) из второго состояния в
первое инициируется с вероятностью q (0≤ q ≤1) дополнительное событие в первом состоянии. При этом блочная матрица инфинитезимальных коэффициентов
примет вид
−(λ1 + α1 ) (1 − p )α1 λ1 pα1
D=
= D0 D1 .
(1 − q )α 2 −(λ 2 + α 2 ) qα 2 λ 2
Элементами матрицы D1 являются интенсивности переходов процесса λ(t) из
состояния в состояние с наступлением события. Недиагональные элементы матрицы D0 – интенсивности переходов из состояния в состояние без наступления
события. Диагональные элементы матрицы D0 – интенсивности выхода процесса
λ(t) из своих состояний, взятые с противоположным знаком. В сделанных предположениях λ(t) – марковский процесс. После каждого зарегистрированного в
момент времени ti события наступает время фиксированной длительности T
(мертвое время), в течение которого другие события исходного потока недоступны наблюдению. События, наступившие в течение мертвого времени, не вызывают продления его периода (непродлевающееся мертвое время). По окончании
мертвого времени первое наступившее событие снова создает период мертвого
времени T и т.д. Вариант возникающей ситуации показан на рис. 1, где 1, 2 – состояния случайного процесса λ(t); дополнительные события, которые могут наступать в момент перехода процесса λ(t) из состояния в состояние, помечены буквами p либо q; штриховка – периоды мертвого времени длительности T; t1, t2,… –
моменты наступления событий в наблюдаемом потоке.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.А. Леонова, Л.А. Нежельская
56
1
2
α1
α2
α1
α2
α1
α2
Процесс λ(t)
q
p
α1
t
p
t
Обобщенный асинхронный поток
T
t1
t
T
T
T
Схема создания непродлевающегося мертвого времени
t2
t3
t4
Наблюдаемый поток событий
t
Рис. 1. Формирование наблюдаемого потока событий
Процесс λ(t) и типы событий (события пуассоновских потоков и дополнительные события) являются принципиально ненаблюдаемыми, а наблюдаемыми являются только временные моменты наступления событий t1, t2,… наблюдаемого
потока. Рассматривается установившийся (стационарный) режим функционирования наблюдаемого потока событий, поэтому переходными процессами на интервале наблюдения (t0, t), где t0 – начало наблюдений, t – окончание наблюдений,
пренебрегаем. Необходимо в момент окончания наблюдений (в момент времени t)
осуществить методом максимального правдоподобия оценку Tˆ длительности
мертвого времени.
2. Построение функции правдоподобия
Обозначим τk = tk+1 – tk (k = 1,2,…) – значение длительности k-го интервала
между соседними событиями наблюдаемого потока (τk > 0). Так как рассматривается стационарный режим, то плотность вероятностей значений длительности k-го
интервала pT (τk) = pT (τ), τ ≥ 0, для любого k (индекс T подчеркивает, что плотность вероятностей зависит от длительности мертвого времени). В силу этого момент tk без потери общности можно положить равным нулю или, что то же самое,
момент наступления события наблюдаемого потока есть τ = 0. Тогда [3] плотность
вероятностей примет вид
z1 ⎡
1
⎤
z2 −
f (T ) ⎥ e − z1 ( τ−T ) −
⎢
z2 − z1 ⎣
α1 + α 2
⎦
z2 ⎡
1
⎤ − z2 ( τ−T )
z1 −
f (T ) ⎥ e
−
, τ ≥ T,
z2 − z1 ⎢⎣
α1 + α 2
⎦
pT (τ) = 0, 0 ≤ τ < T ; pT (τ) =
f (T ) = α + λψ (T )e − ( α1 +α 2 )T , ψ (T ) = 1 ⎡⎣ z1 z2 − ( λ1λ 2 − pqα1α 2 ) e− (α1 +α 2 )T ⎤⎦ ,
λ = α1α 2 ( λ1 + pα1 − λ 2 − qα 2 )( λ1 + qα1 − λ 2 − pα 2 ) , α = λ1α 2 + λ 2α1 + ( p + q )α1α 2 ,
z1,2 = ⎡⎢λ1 + λ 2 + α1 + α 2 ∓ (λ1 − λ 2 + α1 − α 2 ) 2 + 4α1α 2 (1 − p )(1 − q ) ⎤⎥
⎣
⎦
0 < z1 < z2 .
2;
(1)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценка максимального правдоподобия длительности мертвого времени
57
В (1) принимается, что λ ≠ 0, (λ1λ 2 − pqα1α 2 ) ≠ 0. Подчеркнем, что (1) – одномерная плотность вероятностей.
Пусть τ1 = t2 – t1, τ2 = t3 – t2 , … , τk = tk+1 – tk – последовательность измеренных
(в результате наблюдения за потоком в течение интервала наблюдения (0, t)) значений длительностей интервалов между соседними событиями потока. Упорядочим величины τ1, … , τk по возрастанию: τmin = τ(1) < τ(2) < … < τ(k). В силу предпосылок последовательность моментов наступления событий t1, t2,…, tk, … образует
вложенную цепь Маркова, т.е. наблюдаемый поток обладает марковским свойством, если его эволюцию рассматривать с момента tk , k = 1,2,… . Тогда [14] функция правдоподобия, с учетом (1), запишется в виде
L(λ i , αi , p, q, T | τ(1) ,..., τ( k ) ) = 0, 0 ≤ τmin < T ;
k
L(λ i , αi , p, q, T | τ(1) ,..., τ( k ) ) = ∏ pT (τ( j ) ), τmin ≥ T .
j =1
Так как поставленная задача заключается в построении оценки Tˆ длительности мертвого времени (в предположении, что остальные параметры потока λi, αi,
i = 1,2, p, q известны), то, согласно методу максимального правдоподобия, ее реализация есть решение оптимизационной задачи:
k
k
( j)
⎧ z ⎡
1
⎤
L(T | τ(1) ,..., τ( k ) ) = ∏ pT (τ( j ) ) =∏ ⎨ 1 ⎢ z2 −
f (T ) ⎥ e − z1 ( τ −T ) −
α1 + α 2
⎦
j =1
j =1 ⎩ z2 − z1 ⎣
z2 ⎡
1
⎤ − z2 ( τ( j ) −T ) ⎫
z1 −
f (T ) ⎥ e
−
⎬ ⇒ max, 0 ≤ T < τmin ,
T
z2 − z1 ⎢⎣
α1 + α 2
⎦
⎭
(2)
где z1, z2, f (T) определены в (1).
Значение T, при котором (2) достигает своего глобального максимума, есть
оценка Tˆ длительности мертвого времени.
3. Решение оптимизационной задачи (2)
Произведем переобозначение: τm = τmin . В силу того, что функция правдоподобия (2) отличается от нуля при 0 ≤ T ≤ τm, то положим pT (τ( j )) = 0, j = 2, k , при
T > τm (τm > 0). Изучим поведение функции pT (τm), 0 ≤ T ≤ τm как функции переменной T. В дальнейшем изложении ситуация, когда принимается τm = 0, означает
доопределение изучаемых функций в граничной точке. Исследуем производную
p'T (τm) по T функции pT (τm). Имеем
⎡ F1 (T ) z1e − z1 ( τm −T ) − F2 (T ) z2e− z2 ( τm −T ) ⎤
⎦,
pT′ (τm ) = ⎣
(α1 + α 2 )( z2 − z1 )
F1 (T ) = (α1 + α 2 ) z1 z2 − z1 f (T ) − f ′(T ), F2 (T ) = (α1 + α 2 ) z1 z2 − z2 f (T ) − f ′(T ),
f ′(T ) = −λ (α1 + α 2 ) z1 z2ψ 2 (T )e − (α1 +α 2 )T ; 0 ≤ T ≤ τm , τm ≥ 0,
(3)
где z1, z2, λ, ψ (T), f (T) определены в (1); f '(T) – производная функции f (T).
Лемма 1. Производная p'T (τm) – неотрицательная функция переменной τm при
T = 0 и λ > 0 (p'0 (τm) ≥ 0).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
58
М.А. Леонова, Л.А. Нежельская
Доказательство. Так как τm – любое неотрицательное число (τm ≥ 0), то
p'0 (τm) можно рассматривать как функцию переменной τm. Подставляя T = 0 в (3),
получаем
p0′ (τm ) = C ⎡⎣ z2 (C − αz1 )e − z2τm − z1 (C − αz2 )e− z1τm ⎤⎦ α 2 ( z2 − z1 ),
C = λ12 α 2 + λ 22 α1 + pqα1α 2 (α1 + α 2 ) + ( p + q )(λ1 + λ 2 )α1α 2 .
(4)
Рассмотрим (на предмет существования корней) уравнение p'0 (τm) = 0, которое, с
учетом (4), преобразуется к виду
2
B = e− ( z2 − z1 ) τm , B = − (1 4λ )( z1 z+ z2 ) ,
z+ = b + (α1 + α 2 ) (λ1 − λ 2 + α1 − α 2 ) 2 + 4α1α 2 (1 − p )(1 − q ),
b = (λ1 − λ 2 )(α1 − α 2 ) + (α1 + α 2 ) 2 − 2( p + q )α1α 2 .
(5)
В (5) знак B определяется знаком λ. Так как λ > 0, то B < 0, и поэтому уравнение
(5) корней не имеет.
Производная [p'0 (τm)]' функции (4) по переменной τm примет вид
[ p0′ (τm )] ′= C ⎡⎣ z12 (C − αz2 )e− z1τm − z22 (C − αz1 )e− z2τm ⎤⎦ α 2 ( z2 − z1 ).
(6)
Рассмотрим (на предмет существования экстремума функции p'0 (τm)) уравнение
[p'0 (τm)]' = 0, которое, с учетом (6), преобразуется к виду
e − ( z2 − z1 ) τm = ( z1 z2 ) B,
(7)
где B определена в (5). Так как для рассматриваемого случая (λ > 0) имеет место
B < 0, то уравнение (7) решения не имеет, т. е. функция p'0(τm) – безэкстремальная.
Кроме того, из (4) следует p'0(0) = (C/α)2, p'0(∞) = lim p'0 (τm) = 0 при τm → ∞. Тогда
p'0 (τm) – убывающая функция переменной τm (τm ≥ 0), не имеющая нулей. Лемма 1
доказана.
Лемма 2. Производная p'0(τm) – неотрицательная функция переменной τm при
λ < 0, b > 0 (p'0(τm) ≥ 0).
Доказательство. Так как λ < 0, то в (5) B > 0. Величина B в (5) представима в
виде
2
B = ( z1 z2 ) ( z+ z− ) ,
z− = b − (α1 + α 2 ) (λ1 − λ 2 + α1 − α 2 ) 2 + 4α1α 2 (1 − p )(1 − q ) ,
(8)
где b определена в (5). Тогда B > 1 и уравнение (5) корней не имеет. 1) Если величина (z1 + z2)C > αz1z2 , то (z1 / z2)B > 1, и поэтому уравнение (7) корней не имеет.
Тогда p'0(τm) убывает от (C/α)2 до нуля (τm → ∞) и при этом не имеет корней, т. е. в
этом случае p'0(τm) – неотрицательная функция (τm ≥ 0). 2) Если величина
(z1 + z2)C < αz1z2 , то (z1 / z2)B < 1, и тогда уравнение (7) имеет единственный корень τ0 = – [1/(z2 – z1)] ln[(z1 / z2)B]. При этом в точке τ0 реализуется единственный
максимум функции p'0(τm). Тогда производная p'0(τm) сначала возрастает от
p'0(0) = (C/α)2 до p'0(τ0), затем убывает до нуля (τm → ∞), так что и во втором случае p'0(τm) – неотрицательная функция (τm ≥ 0). Лемма 2 доказана.
Лемма 3. Неравенства λ < 0, b < 0 несовместны.
Доказательство. Обозначим
2
x = λ1 − λ 2 , x1 = [1 ( α 2 − α1 )] ⎡⎣( α1 + α 2 ) − 2( p + q )α1α 2 ⎤⎦ .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценка максимального правдоподобия длительности мертвого времени
59
Если b < 0, то α1 < α2, x1 > 0 и x > x1. Если λ < 0, то имеет место либо
а) λ1 + pα1 − λ 2 − qα 2 < 0 , λ1 + qα1 − λ 2 − pα 2 > 0 , либо б) λ1 + pα1 − λ 2 − qα 2 > 0 ,
λ1 + qα1 − λ 2 − pα 2 < 0 . Пусть выполняется а). Тогда p < q и pα2 – qα1 < x < qα2 –
− pα1 (qα2>pα1). Обозначим x2=qα2 – pα1 (x2>0). Тогда
x2 − x1 = − [1 ( α 2 − α1 )] ⎡⎣(1 − p ) α12 + (1 − q ) α 22 + α1α 2 ( 2 − p − q ) ⎤⎦ < 0 .
Таким образом, x2 < x1 и неравенства λ < 0, b < 0 несовместны. Аналогично доказывается случай б). Тем самым лемма 3 доказана.
Лемма 4. Производная p'T (τm) при T = τm (τm ≥ 0) строго больше нуля
(p'(τm) > 0).
Доказательство. Подставляя T = τm в (3), получаем
{С +λψ 2 (τm ) ⎡⎣(λ1 +λ 2 ) z1z2 + ( z1 + z2 )(α− z1z2 )e−(α +α )τ
1
p′(τm ) =
2
m
(α1 +α 2 )
}
⎤ e − (α1+α 2 ) τm
⎦
, τm ≥ 0, (9)
где z1, z2, α, λ, ψ (τm) определены в (1). Рассмотрим (9) как функцию τm . Имеем
p'(0) = (C/α)2 , p'(∞) = C/(α1 + α2). Знак разности p'(0) – p'(∞) = λC / (α1 + α2) α2 определяется знаком λ: если λ > 0, то p'(0) > p'(∞); если λ < 0, то p'(0) < p'(∞). Исследуем производную p''(τm) функции p'(τm). Производная p''(τm), с учетом (9), примет
вид
p′′(τm ) = −λz1 z2 ψ 3 (τm ) y (τm )e − ( α1 +α 2 ) τm ,
y (τm ) = (λ1 + λ 2 ) z1 z2 − (λ1 + λ 2 + 2α1 + 2α 2 )(λ1λ 2 − pqα1α 2 )e − ( α1 +α 2 ) τm , τ m ≥ 0.
Функция ψ (τm) > 0 при любых значениях (λ1λ2 – pqα1α 2) ≠ 0, так что знак p''(τ) определяется знаками λ и y(τm).
Пусть λ > 0: 1.1) (λ1λ2 – pqα1α 2) < 0. Тогда y(τm) > 0, так что p''(τm) < 0. Отсюда
следует, что p'(τm) убывает от p'(0) до p'(∞), оставаясь при этом строго больше нуля (p'(τm) > 0); 1.2) (λ1λ2 – pqα1α 2) > 0, C ≥ (α1+α2)(λ1λ2 – pqα1α2). Тогда y(τm) ≥ 0,
причем y(τm) = 0 возможно только в точке τm = 0 при выполнении равенства
C = (α1+α2)(λ1λ2 − pqα1α2), так что p''(τm) ≤ 0. Результат идентичен результату предыдущего пункта; 1.3) (λ1λ2 − pqα1α2) > 0, C < (α1+α2)(λ1λ2 – pqα1α2). Тогда
y(τm) < 0, 0 ≤ τm < τ0; y(τm) = 0, τm = τ0; y(τm) > 0, τm > τ0 , где
1
⎡
⎤ ⎧ (λ1 + λ 2 ) [ α + (λ1λ 2 − pqα1α 2 ) ] ⎫
ln ⎨
τ0 = − ⎢
⎬.
⎥
⎣ (α1 + α 2 ) ⎦ ⎩ (λ1 + λ 2 + 2α1 + 2α 2 )(λ1λ 2 − pqα1α 2 ) ⎭
В точке τ0 достигается единственный максимум функции p'(τm). Тогда p'(τm) > 0.
Пусть λ < 0: 2.1) (λ1λ2 – pqα1α 2) < 0. Тогда y(τm) > 0, так что p''(τm) > 0. Отсюда
следует, что p'(τm) возрастает от p'(0) до p'(∞), поэтому p'(τm) > 0; 2.2) (λ1λ2 –
pqα1α2) > 0, C ≥ (α1+α2)(λ1λ2 – pqα1α2). Тогда y(τm) ≥ 0, так что p''(τm) ≥ 0. Выполнение равенства y(τm) = 0 аналогично пункту 1.2. Результат идентичен результату
предыдущего пункта; 2.3) (λ1λ2 – pqα1α2) > 0, C < (α1+α2)(λ1λ2 – pqα1α2). Тогда поведение y(τm) идентично поведению y(τm) в пункте 1.3. В точке τ0 при этом имеет
место единственный минимум функции p'(τm), причем p'(τ0) > 0, и тогда p'(τm) > 0.
Суммируя результаты пунктов 1.1–1.3, 2.1–2.3, получаем утверждение леммы 4.
Изучим поведение производной p'T(τm) как функции T на отрезке [0, τm]. Рассмотрим (на предмет существования корней) уравнение p'T (τm) = 0, которое, с
учетом (3), приводится к виду
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.А. Леонова, Л.А. Нежельская
60
e − ( z2 − z1 )T = ϕ(T ), ϕ(T ) = ( z2 z1 ) [ F2 (T ) F1 (T ) ] e− ( z2 − z1 ) τm , 0 ≤ T ≤ τm ,
(10)
где F1(T), F2(T) определены в (3). Так как, в принципе, τm может быть сколь угодно большим числом, то сначала изучим функцию φ(T) при T ≥ 0. Имеем
ϕ(0) = (1 B)e − ( z2 − z1 ) τm ; ϕ(∞) = lim ϕ(T ) = ϕ(0) при T → ∞;
{
ϕ′(T ) = λ (λ1λ 2 − pqα1α 2 ) z22 ( z2 − z1 )(α1 + α 2 ) 2 ψ 4 (T ) ×
2
2
× ( z1 z2 ) ⎣⎡1 − e − ( α1 +α 2 )T ⎦⎤ − C (α1 + α 2 )e −2(α1 +α 2 )T
}
e − ( z2 − z1 ) τm e− (α1 +α 2 )T
;
F12 (T )
ϕ′(0) = −λ (λ1λ 2 − pqα1α 2 ) z22 (α1 + α 2 )( z2 − z1 )e − ( z2 − z1 ) τm С (С − αz2 ) 2 ,
(11)
где λ, α, ψ (T) определены в (1); F1(T) – в (3); C – в (4); B – в (5). Решение уравнения φ'(T) = 0, вид φ'(T) приведен в (11), определяет единственную точку экстремума T * = − [1 (a1 + a2 ) ] ln ⎡⎣ z1 z2 z1 z2 + (a1 + a2 )C ⎤⎦ функции φ(T). Если функции F1(T) и F2(T) не имеют нулей, то тогда и функция φ(T) не будет иметь нулей
и особых точек. Обозначим β1 = – z1z2 (α1+α2 – z1) / (λ1λ2 – pqα1α2) (α1+α 2 + z1),
β2 = – z1z2 (α1+α2 – z2) / (λ1λ2 – pqα1α2) (α1+α 2 + z2).
Утверждение. 1) Для λ > 0, (λ1λ2 – pqα1α2) > 0 существуют совместные системы ограничений: а) (α1+α2 – z1) > 0, (α1+α 2 – z2) < 0, β2 > 0; б) (α1+α2 – z1) < 0,
(α1+α2 – z2) < 0, 0 < β1 < 1, β2 > 0;
2) для λ > 0, (λ1λ2 − pqα1α2) < 0 существуют совместные системы ограничений:
а) (α1+α2 – z1) > 0, (α1+α2 − z2) < 0, β1 > 0; б) (α1+α2 – z1) > 0, (α1+α2 − z2) > 0, β1 > 0,
0 < β2 < 1;
3) для λ < 0, b > 0, (λ1λ2– pqα1α2) < 0 существует совместная система ограничений: (α1+α2 – z1) > 0, (α1+α2 − z2) > 0, β1 > 0, β2 > 0;
4) для λ < 0, b > 0, (λ1λ2 − pqα1α2) > 0 существуют совместные системы ограничений: а) (α1+α2 – z1) > 0, (α1+α2 − z2) > 0; б) (α1+α2 – z1) < 0, (α1+α2 – z2) > 0, 0 < β1 < 1;
в) (α1+α2 – z1) > 0, (α1+α2 – z2) < 0, 0 < β2 < 1; г) (α1+α2 − z1) < 0, (α1 + α2 − z2) < 0,
0 < β1 < 1, 0 < β2 < 1,
при которых имеют место реализуемые варианты поведения функций F1(T) и
F2(T) и при которых F1(T), F2(T) не имеют нулей (T ≥ 0).
Таким образом, функция φ(T), определенная в (10), не имеет нулей и особых
точек.
Лемма 5. Уравнение (10) либо не имеет корней, либо имеет один корень, либо
– два корня.
Доказательство. Рассмотрим уравнение (10), которое преобразуется к виду
(
)
( b1 − a1u ) v 2 + ( b2 − a2u ) v + ( b3 − a3u ) = 0, v = e−(α1 +α2 )T , u = e− ( z2 − z1 )T , 0 ≤ T ≤ τm ,
a1 = z12 ( λ1λ 2 − pqα1α 2 ) ( λ + ( λ1λ 2 − pqα1α 2 ) [ (α1 + α 2 ) z2 − α ]) ;
a2 = z12 z2 ( λ ( α1 + α 2 − z1 ) −2 z1 ( λ1λ 2 − pqα1α 2 ) [ (α1 + α 2 ) z2 − α ]) ;
2
a3 = z12 ( z1 z2 ) [ (α1 + α 2 ) z2 − α ] ;
b1 = z22 ( λ1λ 2 − pqα1α 2 ) ( λ + ( λ1λ 2 − pqα1α 2 ) [ (α1 + α 2 ) z1 − α ]) e − ( z2 − z1 ) τm ;
b2 = z1 z22 ( λ ( α1 + α 2 − z2 ) −2 z2 ( λ1λ 2 − pqα1α 2 ) [ (α1 + α 2 ) z1 − α ]) e − ( z2 − z1 ) τm ;
2
b3 = z22 ( z1 z2 ) [ (α1 + α 2 ) z1 − α ] e − ( z2 − z1 ) τm .
(12)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценка максимального правдоподобия длительности мертвого времени
61
Выражение (12) есть квадратное уравнение относительно переменной v. Тогда
уравнение (10) либо не имеет корней, либо имеет один корень, либо – два корня.
Лемма 5 доказана.
Лемма 6. При λ > 0 уравнение (10) корней не имеет.
Доказательство. Из (11) следует φ(0) < 0. Пусть (λ1λ2 – pqα1α2) > 0, тогда из
(11) вытекает φ'(0) < 0, то есть в точке T* реализуется минимум функции φ(T), и
тогда φ(T) < 0, T ≥ 0. Пусть (λ1λ2 – pqα1α2) < 0, тогда из (11) вытекает φ'(0) > 0, т.е.
в точке T* реализуется максимум функции φ(T). В силу пунктов 1, 2 утверждения, φ(T) нулей не имеет, поэтому φ(T) < 0, T ≥ 0. С учетом леммы 5, лемма 6 доказана.
Лемма 7. При λ < 0, (λ1λ2 – pqα1α2) < 0, b > 0 уравнение (10) корней не имеет.
Доказательство. Ограничения леммы 7 соответствуют пункту 3 утверждения. Из (5), (11) следует φ(0) > 0, φ'(0) < 0, т. е. в точке T* реализуется минимум
функции φ(T). Тогда, в силу пункта 3 утверждения, φ(T) > 0, T ≥ 0. Из (5) вытекает B > 0, из (8) следует B > 1. Тогда учитывая (11), получаем φ(0) < 1, и (с учетом
леммы 5) получаем утверждение леммы 7.
Лемма 8. При λ < 0, (λ1λ2 – pqα1α2) > 0, b > 0 уравнение (10) корней не имеет.
Доказательство. Ограничения леммы 8 соответствуют пункту 4 утверждения. Рассмотрим вариант а). Из (5), (11) следует φ(0) > 0, φ'(0) > 0, так что в точке
T* реализуется максимум функции φ(T). Тогда, в силу пункта 4 утверждения,
φ(T) > 0, T ≥ 0. Из (5) вытекает B > 0, из (8) следует B > 1. Тогда φ(0) < 1, и уравнение (10) (с учетом леммы 5) корней не имеет. Аналогичный результат устанавливается для вариантов б), в), г). Лемма 8 доказана.
Лемма 9. При λ > 0, производная p'T (τm) – положительная функция переменной T, 0 ≤ T ≤ τm , 0 < τm < ∞ (p'T (τm) > 0).
Доказывается последовательным применением лемм 1, 4, 6.
Лемма 10. При λ < 0, b > 0 производная p'T (τm) – положительная функция переменной T, 0 ≤ T ≤ τm , 0 < τm < ∞ (p'T (τm) > 0).
Доказывается последовательным применением лемм 2, 4, 7, 8.
Леммы 9, 10 позволяют сформулировать и доказать следующие теоремы.
Теорема 1. При: 1) λ > 0, 0 < τm < ∞; 2) λ < 0, b > 0, 0 < τm < ∞, функция pT (τm) –
возрастающая функция переменной T, 0 < T ≤ τm .
Доказывается для варианта 1 применением леммы 9; для варианта 2 применением леммы 10.
Теорема 2. При любых значениях параметров p (0 ≤ p ≤ 1), q (0 ≤ q ≤ 1), λi > 0
(λ1 > λ2), αi > 0, i = 1, 2, функция pT (τm) переменной T (0 < T ≤ τm ) достигает своего
максимального значения в точке T = τm , 0 < τm < ∞.
Доказательство вытекает из результата теоремы 1.
Следствие 1. Из теоремы 1 вытекает, что функции pT (τ(j)), j = 2, k , являются
возрастающими функциями переменной T (0 < T ≤ τm).
Следствие 2. Из теоремы 2 вытекает, что функция правдоподобия
L(T | τ(1) ,..., τ( k ) ) достигает своего глобального максимума в точке Tˆ = τm , то есть
решением оптимизационной задачи (2) является оценка длительности мертвого
времени Tˆ = τm .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
62
М.А. Леонова, Л.А. Нежельская
Заключение
Полученный результат делает возможным решение задачи оценки длительности мертвого времени без привлечения численных методов: в процессе наблюдения (в течение временного интервала (t0, t)) потока событий вычисляются величины τk, k = 1, n , после чего находится τm = min τk ( k = 1, n ) и полагается Tˆ = τm .
ЛИТЕРАТУРА
1. Горцев А.М., Нежельская Л.А. Асинхронный дважды стохастический поток с инициированием лишних событий // Дискретная математика. 2011. Т. 23. Вып. 2. С. 59–65.
2. Gortsev A.M., Nezhelskaya L.A. An asynchronous double stochastic flow with initiation of
superfluous events // Discrete Mathematics and Applications. 2011. V. 21. Issue 3 (Jul).
P. 283–290.
3. Горцев А.М., Леонова М.А., Нежельская Л.А. Совместная плотность вероятностей длительности интервалов обобщенного асинхронного потока событий при непродлевающемся мертвом времени // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 4(21). С. 14–25.
4. Горцев А.М., Леонова М.А., Нежельская Л.А. Условия рекуррентности обобщенного
асинхронного потока событий при непродлевающемся мертвом времени // Queues:
flows, systems, networks: proceedings of the international conference “Modern Probabilistic
Methods for Analysis, Design and Optimization of Information and Telecommunication
Networks”. Minsk: BSU, 2013. P. 32–38.
5. Дудин А.Н., Клименок В.И. Системы массового обслуживания с коррелированными потоками. Минск: Изд-во БГУ, 2000. 175 с.
6. Лившиц К.И., Бублик Я.С. Распределение условного времени до разорения страховой
компании при дважды стохастических потоках страховых премий и страховых выплат
// Вестник Томского государственного университета. Управление, вычислительная
техника и информатика. 2012. № 1(18). С. 91–101.
7. Горцев А.М., Нежельская Л.А. О связи МС-потоков и МАР-потоков событий // Вестник
Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 1(14). С. 13−21.
8. Горцев А.М., Калягин А.А., Нежельская Л.А. Оптимальная оценка состояний обобщенного полусинхронного потока событий // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 2(11). С. 66−81.
9. Горцев А.М., Назаров А.А., Терпугов А.Ф. Управление и адаптация в системах массового обслуживания. Томск: Изд-во ТГУ, 1978. 208 с.
10. Горцев А.М., Нежельская Л.А, Соловьев А.А. Оптимальная оценка состояний МAPпотока событий в условиях непродлевающегося мертвого времени // Автоматика и телемеханика. 2012. № 8. С. 49−63.
11. Gortsev A.M., Nezhelskaya L.A., Soloviev A.A. Optimal state estimation in MAP event flows
with unextendable dead time // Automation and Remote Control. 2012. V.73. Nо. 8.
P. 1316−1326.
12. Бушланов И.В., Горцев А.М., Нежельская Л.А. Оценка параметров синхронного дважды
стохастического потока событий // Автоматика и телемеханика. 2008. № 9. С. 76−93.
13. Апанасович В.В., Коляда А.А., Чернявский А.Ф. Статистический анализ случайных потоков в физическом эксперименте. Минск: Изд-во “Университетское”, 1988. 254 с.
14. Шуленин В.П. Математическая статистика. Часть 1. Томск: Изд-во НТЛ, 2012. 540 с.
Леонова Мария Алексеевна
Нежельская Людмила Алексеевна
Томский государственный университет
E-mail: mleonova86@mail.ru, ludne@mail.ru
Поступила в редакцию 2 марта 2013 г.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценка максимального правдоподобия длительности мертвого времени
63
Leonova Maria A., Nezhelskaya Lyudmila A. (Tomsk State University). Maximum likelihood
estimation of dead time value at a generalized asynchronous flow of events.
Keywords: generalized asynchronous flow of events, unprolonging dead time, likelihood
function, maximum likelihood estimation, dead time value.
Generalized asynchronous flow of events which intensity is piecewise constant stochastic
process λ(t) with two states λ1 and λ2 (λ1> λ2) at unprolonging dead time is considered. During the
time interval when λ(t) = λi , Poisson flow of events takes place with the intensity λi , i=1,2.
Transition from the first state of process λ(t) into the second one (from the second state into the
first one) is carried out at any moment of time. The sojourn time in the i-th state is exponentially
distributed with parameter αi , i=1,2. The process of transition λ(t) from the first state into the
second one initiates with probability p (0≤ p ≤1) extra event in the second state. Also the process
of transition λ(t) from the second state into the first one initiates with probability вероятностью q
(0 ≤ q ≤ 1) extra event in the second state.
The flow is functioning in conditions of unprolonging dead time (the value of dead time is
fixed). We solve the problem of estimation of dead time using the likelihood function.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 2(23)
УДК 336:51
Г.А. Медведев
О ВРЕМЕННОЙ СТРУКТУРЕ ДОХОДНОСТИ. 5. ДВУХФАКТОРНЫЕ
МОДЕЛИ ДАФФИ – КАНА (ПРОДОЛЖЕНИЕ)
Исследуются модели Даффи – Кана, описывающие динамику краткосрочной
процентной ставки в случае, когда состояние финансового рынка характеризуется не только уровнем самой процентной ставки, но и еще одним изменяющимся во времени параметром. Рассматриваются два случая. В первом в
качестве дополнительной переменной состояния берется локальное по времени среднее значение краткосрочной процентной ставки. Во втором случае
в качестве дополнительной переменной состояния принята мгновенная дисперсия процентной ставки. Двухфакторные модели строятся таким образом,
чтобы они приводили к аффинной временной структуре доходности. Основное внимание уделяется свойствам кривой доходности и форвардной кривой, когда динамика краткосрочной процентной ставки описывается двухфакторными моделями Даффи – Кана.
Ключевые слова: процентные ставки доходности, аффинная модель,
функции временной структуры, модель Даффи – Кана.
Напомним, что для n-факторной модели аффинной доходности предполагается, что вектор состояния финансового рынка X(t) = (X1, X2, …, Xn)Т следует однородному по времени марковскому процессу, порождаемому стохастическим дифференциальным уравнением
dX(t) = μ(X(t)) dt + σ(X(t)) dW(t)
с n-вектором дрейфа μ(x), (n×m)-матрицей волатильности σ(x), и m-вектором W(t)
независимых стандартных винеровских процессов [1]. При этом вектор дрейфа
μ(x) и матрица диффузии σ(x)σ(x)Т должны быть аффинными функциями, а рыночные цены риска такими, что σ(x)λ(x) – n-вектор с аффинными компонентами,
μ(x) = K(θ − x),
σ(x)σ(x)Т = α +
n
∑ βi xi ,
i =1
σ(x)λ(x) = ξ +
n
∑ ηi xi .
(1)
i =1
Здесь K, α и βi − (n×n)-матрицы; θ, ξ и ηi − n-векторы, xi − компоненты вектора x.
Эти свойства для n-факторной модели аффинной доходности приводят к следующим обыкновенным дифференциальным уравнениям для функции A(τ) и компонент вектора B(τ) = (B1(τ), B2(τ), …, Bn(τ)), τ – срок до погашения финансового актива:
A′(τ) = (ξ − Kθ)ТB(τ) + B(τ)Тα B(τ)/2, A(0) = 0;
(2)
Bi′(τ) = φi − B(τ)Т(ηi + Ki) − B(τ)Тβi B(τ)/2, Bi(0) = 0.
(3)
В уравнении для Bi(τ) символ Ki обозначает i-й столбец матрицы K, 1 ≤ i ≤ n. Кривая доходности y(τ, x) и форвардная кривая f(τ, x) определяется через функции
A(τ) и B(τ) по формулам
y (τ, x) =
x T B(τ) − A(τ)
dB(τ) dA(τ)
, f (τ, x) = x T
−
.
τ
dτ
dτ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 5. Двухфакторные модели Даффи – Кана
65
1. Двухфакторная модель «ставка – ее локальное среднее»
Двухфакторная модель «ставка – ее локальное среднее» конструируется как
расширение однофакторной модели Даффи – Кана [2] при помощи предположения о том, что уровень θ, к которому возвращается процентная ставка r(t) (в однофакторной модели он совпадает с ее стационарным средним), рассматривается
как стохастический процесс диффузионного типа θ(t), подобный процессу краткосрочной ставки одномерной модели, но с меньшей волатильностью Dθ < Dr,
меньшим коэффициентом скорости возвращения kθ < kr и фиксированным уровнем
возвращения θ0 [3]:
dr(t) = kr(θ(t) − r(t))dt + 2kr Dr
r (t ) − x
dWr(t), r(0) > х;
θ0 − x
(4)
dθ(t) = kθ(θ0 − θ(t))dt + 2kθ Dθ
θ(t ) − x
dWθ(t), θ(0) > х.
θ0 − x
(5)
Уравнения (2), (3) в этом случае приобретают вид
A′(τ) = − σ11λr xBr(τ) − (kθθ0 + σ22λθ x)Bθ(τ) − x (σ112Br(τ) 2 + σ222Bθ(τ) 2 )/2,
A(0) = 0;
2
2
(6)
Br′(τ) = φr − (kr + σ11λr)Br(τ) − σ11 Br(τ) /2, Br(0) = 0;
(7)
Bθ′(τ) = φθ + krBr(τ) − (kθ + σ22λθ)Bθ(τ) − σ222Bθ(τ) 2 /2, Bθ(0) = 0.
(8)
Здесь φr > 0, φθ > 0, φr + φθ = 1 и для краткости обозначено σ11 =
2kr Dr (θ0 − x) ,
σ22 = 2kθ Dθ (θ0 − x) . Проблемы решения этих уравнений обсуждались в [3].
Функция A(τ) находится из равенства (6) простым интегрированием, если найдены функции Br(τ) и Bθ(τ). Уравнение (7) – это уравнение Риккати и его решение
находится в виде
−1
εr
2
2
⎞
Вr(τ) = φr ⎛⎜
+ Vr ⎟ , εr = (kr + λ r σ11 ) + 2σ11φr , Vr = (ε r + kr + λ r σ11 ) / 2 .
εr τ
⎝ e −1
⎠
В частности, отсюда следует, что
ε r Br ⎞
1 ⎛
ln ⎜1 +
⎟.
ε r ⎝ φr − Vr Br ⎠
Основную трудность представляет решение уравнения (8), которое в аналитическом виде найти не удается и его приходится решать численно или использовать
приближенные решения, описанные в [3]. Здесь мы рассмотрим свойства кривых
доходности и форвардных кривых. Согласно определению и уравнениям (6) – (8),
кривые доходности y(τ, r, θ) и форвардные кривые f(τ, r, θ) определяются через
функции A(τ), Br(τ) и Bθ(τ) по формулам
τ=
y (τ, r , θ) =
rBr (τ) + θBθ (τ) − A(τ)
,
ε r Br (τ) ⎞
1 ⎛
ln 1 +
ε ⎜⎝ φr − Vr Br (τ) ⎟⎠
f (τ, r, θ) = rφr + θφθ + (kr(θ − x) − (r − x)(kr + σ11λr))Br(τ) +
+ (kθ (θ0 − x) − (θ − x)(kθ + σ22λθ)) Bθ(τ) − (r − x)σ112Br(τ) 2 / 2 − (θ − x)σ222Bθ(τ) 2 / 2 .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
66
Их предельные свойства такие:
при τ → 0 обе кривые стремятся к одинаковому пределу
y(0, r, θ) = f(0, r, θ) = rφr + θφθ;
при τ → + ∞ обе кривые также стремятся к общему пределу
y(∞, r, θ) = f(∞, r, θ) = x + kθ (θ0− x)Bθ(∞),
где
Bθ(∞) =
kr
1 ⎛
⎜ φθ + φ r
Vθ ⎝
Vr
⎞
⎟ , Vθ = (εθ + kθ + λ θ σ 22 ) / 2,
⎠
2
εθ = (kθ + λ θ σ 22 ) 2 + 2σ 22
(φθ + kr Br (∞)) , Br(∞) = φr/Vr.
Как видно из этих формул, кривые доходности y(τ, r, θ) и форвардные кривые
f(τ, r, θ) можно рассматривать как сложные функции, зависящие от срока погашения τ только через функции аффинной структуры Br(τ) и Bθ(τ), т. е. у(τ) ≡ Y(Br(τ),
Bθ(τ)) и f (τ) ≡ F(Br(τ), Bθ(τ)). Поскольку функции Br(τ) и Bθ(τ) принимают значения в конечных интервалах, свойства функций Y(Br, Bθ) и F(Br, Bθ) можно иллюстрировать наглядно с помощью графиков на всем интервале возможных значений сроков погашения τ. При этом, поскольку эти функции связаны параметрически параметром τ, то его можно исключить, выбрав значения одной из {Br, Bθ} в
качестве независимой переменной. Если выбрать в качестве переменной функцию
Br ≡ B, тогда получим кривые доходности y(τ, r, θ) и форвардные кривые f(τ, r, θ)
в виде Y(B, Bθ(B)) и f (τ) ≡ F(B, Bθ(B)). На рис. 1 эти кривые представлены для набора параметров, соответствующих найденных Д. Аном и Б. Гао [4], приспосабливавшим модель Даффи – Кана для описания динамики процесса годовой ставки
доходности одномесячных бумаг Казначейства США для периода наблюдения с
января 1960 г. по февраль 1991 г.
0,09
Y
F
Предельное значение
T
0,08
0,07
0,06
0,05
0,04
0
0,5
1
1,5
2
2,5
3
B
Рис. 1. Кривые доходностей Y(B) (штриховые линии) и форвардные кривые F(B) (сплошные линии) для различных значений краткосрочной ставки r: r = x = 0 , 0 3 3 (нижняя пара
кривых); 0,05; 0,075; 0,1 (верхняя пара кривых). Круглый маркер показывает предельное
значение, одинаковое для всех кривых. Ромбовидные маркеры показывают метки реального времени Т через каждые 2 года для первых 20 лет. Другие параметры принимали следующие значения: kr = 0,1347; kθ = 0,01347; θ0 = 0,0762; θ = 0,07; Dr = 0,002892; Dθ =
0,0002892; x = 0,033149; λr = 0,1; λθ = 0,1; φr = 0,6; φθ = 0,4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 5. Двухфакторные модели Даффи – Кана
67
Заметим, что выбор Br ≡ B в качестве независимой переменной не всегда удобен,
так как при φr → 0 длина интервала изменения переменной B ∈ (0, Br(∞)) сужается
до нуля, так как Br(∞) → 0 при φr → 0. Поэтому при при преобразовании временной переменной τ в качестве независимой переменной B можно брать независимое от модели преобразование B(τ) = 1 − е−κτ, когда при изменении τ в интервале
(0, ∞) переменная B изменяется в интервале (0, 1). Значение параметра κ определяется в зависимости от того, начальный или конечный участок временной структуры является интересным. На рис. 2 представлены графики кривых доходности
Y(B) и форвардных кривых F(B) с использованием такой переменной B для следующих случаев: 1) две пары кривых, характеризующих двухфакторную модель
при весовых коэффициентах {φr = φθ = 0,5} и {φr =1, φθ = 0}; первая пара стартует
из начальной точки Y(0) = F(0) = 0,06 и стремится при τ → ∞ к предельному значению Y(B(∞)) = F(B(∞)) = 0,060, а вторая – из начальной точки Y(0) = F(0) = 0,05
0,070
Y
F
Предельное значение
T
0,065
0,060
0,055
0,050
0
0,2
0,4
0,6
0,8
1
Рис. 2. Кривые доходностей Y(B) (штриховые линии) и форвардные кривые F(B)
(сплошные линии) для двух случаев двухфакторных моделей краткосрочной ставки
и одного случая однофакторной модели. Круглый маркер показывает предельные
значения. Ромбовидные маркеры показывают метки реального времени Т через каждые 5 лет до 50 лет и далее через 10 лет. Процентная ставка r = 0,05; параметр
κ = 0,03. Другие параметры принимали те же значения, что и для рис. 1
и стремится к предельному значению Y(B(∞)) = F(B(∞)) = 0,055; заметим, что вторую пару кривых можно было бы рассматривать как порождаемую однофакторной моделью, так как из-за значений весовых коэффициентов {φr =1, φθ = 0} краткосрочная ставка доходности y(r, θ) = rφr + θφθ = r зависит только от одной переменной r; 2) поэтому для сравнения с кривыми Y(B) и F(B) в этом случае на рисунке приведена пара кривых, порождаемых однофакторной моделью с совпадающими параметрами уравнения (4); эта пара кривых стартует тоже из начальной точки Y(0) = F(0) = 0,05, но при τ → ∞ стремится к другому предельному значению Y(B(∞)) = F(B(∞)) = 0,067. Действительно, предельной точкой кривых однофакторной модели [2] является значение
k
Y(B(∞)) = F(B(∞)) = x + r (θ0 − x) ,
Vr
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
68
Г.А. Медведев
в то время как предельное значение кривых двухфакторной модели при весовых
коэффициентах {φr =1, φθ = 0} вычисляется по формуле
k k
Y(B(∞)) = F(B(∞)) = x + θ r (θ0− x).
VθVr
Поскольку имеют место неравенства kθ < Vθ, kr < Vr, предельные значения кривых
однофакторной модели всегда больше предельных значений двухфакторной модели при принятых весовых коэффициентах.
Заметим, что вид кривых Y(B) и F(B) для выбранных параметров различается в
зависимости от количества факторов. Для однофакторной модели кривые монотонно возрастают и для любых сроков погашения форвардная кривая F(B) выше
кривой доходности Y(B), в то время как для двухфакторной модели кривые имеют
максимумы, причем для малых сроков погашения форвардная кривая F(B) выше
кривой доходности Y(B), а для больших сроков погашения – наоборот, кривая доходности Y(B) лежит выше форвардной кривой F(B).
2. Двухфакторная модель «ставка – ее мгновенная дисперсия»
В двухфакторной модели с переменными состояния краткосрочной ставкой r и
мгновенной дисперсией D краткосрочной ставки процентная ставка аффинной
доходности до погашения (кривая доходности) и форвардная процентная ставка
определяются формулами
y(τ, r, D) = − ln P(τ, r, D)/τ = [rBr(τ) + DBD(τ) − A(τ)]/τ;
f(τ, r, D) = r dBr(τ)/dτ + D dBD(τ)/dτ − dA(τ)/dτ.
По экономическому смыслу доходность до погашения растет с увеличением краткосрочной ставки r и падает с увеличением дисперсии краткосрочной ставки D.
Последнее не является очевидным. Поэтому продемонстрируем влияние изменения дисперсии D на кривые доходностей Y(В) и форвардные кривые F(В) на примере однофакторной модели Даффи – Кана, рассмотренной ранее в [2]. Кривые
Y(В) и F(В) стартуют при B = 0 (τ = 0) из точки Y(0) = F(0) = r (будем называть ее
исходной точкой). Заметим, что положение исходной точки не зависит от величины дисперсии D и при ее изменении остается неизменной. С увеличением срока
до погашения τ кривые сначала расходятся, но затем при τ → + ∞ стремятся к одному и тому же пределу (назовем его предельной точкой) Y(В(∞)) = F(В(∞)) =
k
k
= θ + ⎛⎜1 − ⎞⎟ x. При этом В(∞) = V − 1. Явное представление отношения k/V имеет
V
V
⎝
⎠
2
⎛
⎞
k 1⎜ ⎛ k
2 k ⎞ 4 k (θ − x ) ⎛ k
2k ⎞ ⎟
=
θ
−
+
λ
+
−
θ
−
+
λ
(
x
)
(
x
)
⎜
⎟
⎜
⎟ . При малых D
V 2⎜ ⎝ D
D ⎠
D
D
D ⎠⎟
⎝
⎝
⎠
k
k (θ − x )
это выражение может быть записано в виде
=
+ O( D). Таким
V k (θ − x) + λ 2kD
вид
образом, с увеличением дисперсии D параметр k/V монотонно уменьшается от
k/V = 1 при D = 0 до k/V = 0 при D → + ∞. Следовательно, предельная точка с увеличением дисперсии D монотонно уменьшается от Y(В(∞)) = F(В(∞)) = θ при D = 0
до нижней границы процентной ставки x при D → + ∞. Предельное значение дюрации процентной ставки B(∞) также уменьшается с ростом дисперсии D от
B(∞) = k − 1 при D = 0 до 0 при D → + ∞. Здесь уместно заметить, что при D → 0
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 5. Двухфакторные модели Даффи – Кана
69
аналитические выражения для кривых Y(В) и F(В) упрощаются:
Y(В) → θ + (θ − r)kB/ l n(1 − kB), F(В) → r + (θ − r)kB,
B = B(τ) → (1 − ехр(− kτ))/k, B ∈ (0, k − 1).
Ввиду справедливости неравенства z > 1 + z/ l n(1 − z) для z ∈ (0, 1) при малых
дисперсиях форвардная ставка F(В) для любых B ∈ (0, k − 1) больше доходности до
погашения Y(В), если θ > r. При θ < r справедливо обратное. Для произвольных D
форвардную кривую F(В) можно представить в форме с явной зависимостью от D
как
r−x
F(В) = r + (θ − r)kB −
(λ 2kD + 2kDB).
θ− x
Отсюда видно, что с ростом D форвардная ставка уменьшается на всем интервале
изменения B. Аналогично ведет себя кривая доходности Y(В). На рис. 2 представлено семейство пар кривых Y(В) и F(В) для различных значений стационарной
дисперсии D, иллюстрирующее зависимость доходности от дисперсии.
0,08
Y(B)
F(B)
Предельное значение
0,07
0,06
0,05
0,04
0,03
0
0,5
1
1,5
B
Рис. 3. Кривые доходностей Y(B) (штриховые линии) и форвардные кривые F(B)
(сплошные линии) для однофакторной модели Даффи – Кана при различных значениях дисперсии D краткосрочной ставки: D = 0 (верхняя пара кривых); 0,25; 0,375;
0,5; 0,75; 1,0 (нижняя пара кривых). Другие параметры принимали следующие значения: k = 0,5; θ = 0,0721; r = 0 , 0 6 ; x = 0 ; λ = 0,01. Круглые маркеры показывают
предельные значения кривых при B → B(∞), т.е. при τ → + ∞ (для разных D они
различные)
Этот анализ показывает, что доходности должны уменьшаться с ростом дисперсии. Поэтому функция временной структуры BD(τ) в двухфакторной аффинной
модели доходности может принимать только отрицательные значения для τ > 0.
Чтобы это имело место, весовой коэффициент φD должен быть отрицательным.
Когда в качестве второй переменной состояния выбрана мгновенная дисперсия
краткосрочной процентной ставки, уравнения двухфакторной модели переменных
состояния имеют вид [3]
dr(t) = kr(θ − r(t))dt + 2kr D(t ) dWr(t);
dD(t) = kD(V − D(t))dt + 2k D S
D(t ) − x
dWD(t), D(0) > х ≥ 0.
V −x
(9)
(10)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
70
Здесь х – нижняя граница для дисперсии D процентной ставки r; V – стационарное
среднее процесса дисперсии D(t), а S – стационарная дисперсия процесса дисперсии D(t). Для удобства записи в дальнейшем изложении удобно ввести обозначение δ = k D S /(V − x).
Однако в этом случае значение кривых y(τ, r, D) и f(τ, r, D) в исходной точке,
с экономической точки зрения, безусловно, положительное, определяется равенством y(0, r, D) = f(0, r, D) = rφr + DφD, где φD, как указано выше, из экономических соображений должно быть отрицательным. Поэтому для того чтобы описанная модель с фиксированными весовыми коэффициентами {φr, φD} имела
экономический смысл, должно выполняться неравенство rφr + DφD > 0, т.е.
D ≡ D(0) < rφr/|φD|. Вместе с тем процесс D(t), как это следует из уравнения (10),
является стационарным диффузионным процессом «с квадратным корнем» и имеет сдвинутое распределение гамма с параметром масштаба S/(V − x), параметром
формы (V − x)2/S и параметром сдвига x. Поэтому с положительной вероятностью
указанное неравенство в описанной модели будет нарушаться. Для того чтобы эта
модель имела экономический смысл с вероятностью единица, необходимо установить следующие весовые коэффициенты модели {φr =1, φD = 0}. В этом случае
краткосрочная ставка доходности в исходной точке определяется только процентной ставкой r: y(r, D) = rφr + DφD = r.
Уравнения для функций временной структуры A(τ), Br(τ) и BD(τ) в этом случае
имеют вид
(11)
A′(τ) = − krθBr(τ) − (kDV + 2λD xδ)BD(τ) − δxBD(τ) 2 ;
Br′(τ) = 1 − krBr(τ), Br(0) = 0, Br(τ) = (1 − e− kr τ ) / kr ;
2
(12)
2
BD′(τ) = − (kD + 2λD δ)BD(τ) − 2λrkrBr(τ) − krBr(τ) − δBD(τ) , BD(0) = 0. (13)
Функция A(τ) по-прежнему находится через Br(τ) и BD(τ). Функция Br(τ) легко
находится в простом виде, но функция BD(τ), к сожалению, определяется уравнением Риккати с переменным коэффициентом и не может быть выражена в аналитическом виде. При τ → + ∞ функции Br(τ) и BD(τ) стремятся к пределам
−(k D + 2λ D δ) + (k D + 2λ D δ) 2 − 4δ(2λ r + 1/ kr )
.
2δ
Заметим, что предельное значение BD(∞) принимает вещественные значения
только в случае, когда параметры модели удовлетворяют неравенству
(kD + 2λD δ)2 ≥ 4δ(2λr + 1/kr).
(14)
Если это неравенство не удовлетворяется, правая часть дифференциального уравнения (13) для функции BD(τ) ни для каких τ не обращается в нуль, являясь все
время отрицательной. А это приводит к тому, что функция BD(τ) неограниченно
убывает с ростом τ, в связи с чем при достаточно больших τ кривые доходности и
форвардные кривые становятся отрицательными, что противоречит экономическому смыслу этих кривых. Таким образом, неравенство (14) определяет область
возможных значений параметра δ = kDS/(V − x), определяющего волатильность в
уравнении (10), когда имеет смысл использовать рассматриваемую двухфакторную модель динамики процентной ставки. В явной форме это ограничение имеет
вид
Br(∞) = 1/kr,
δ≤
BD(∞) =
2λ r + 1/ kr − k D λ D − (2λ r + 1/ kr ) 2 − 2(2λ r + 1/ kr )k D λ D
2λ 2D
.
(15)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 5. Двухфакторные модели Даффи – Кана
71
Кривые доходности y(τ, r, D) и форвардные кривые f(τ, r, D) определяются через функции A(τ), Br(τ) и BD(τ) по формулам
y(τ, r, D) ≡ Y(Br(τ), BD(τ)) = kr[A(τ) − rBr(τ) − DBD(τ)]/ln[1 − krBr(τ)];
f(τ, r, D) ≡ F(Br(τ), BD(τ)) = r − (r − θ + 2λrD)krBr(τ) −
− [(kD(D − V) + 2λD δ(D − x)]BD(τ) − krDBr(τ)2 − δ(D − x)BD(τ) 2 .
Предельные свойства этих кривых такие:
при τ → 0 обе кривые стремятся к одинаковому пределу
y(0, r, D) = f(0, r, D) = r ;
при τ → + ∞ обе кривые также стремятся к общему пределу
y(∞, r, D) = f(∞, r, D) = θ + kD(V − x)BD(∞) − x(2λr + 1/kr).
Для того чтобы предельные доходности были положительными, должно выполняться неравенство
θ − x(2λr + 1/kr) > − kD(V − x)BD(∞),
или
θ − x(2λ r + 1/ kr )
V −x
.
>
2k D (2λ r + 1/ kr ) (k + 2λ δ) + (k + 2λ δ) 2 − 4δ(2λ + 1/ k )
D
D
D
D
r
r
(16)
Это неравенство следует рассматривать как условие, накладываемое на другие
параметры уравнения (10), чтобы обеспечить разумные результаты для долгосрочных доходностей. В этом случае в качестве варьируемого параметра модели
можно выбрать стационарное среднее V процесса D(t). Когда при описании динамики процентной ставки используется нейтральная к риску вероятностная мера
(λr = 0, λD = 0), неравенства (15) и (16) существенно упрощаются:
⎛1
1
δ ⎞
δ ≤ krkD2 /4, V < x + (krθ − x) ⎜ +
−
⎟.
4 kr k D2 ⎠
⎝2
На рис. 4 приведены графики функций Y(Br(τ), BD(τ)) и F(Br(τ), BD(τ)) от аргумента B = Br(τ) с учетом того, что τ = − ln[1 − krB]/kr и BD(τ) = BD(− ln[1 − krB]/kr).
0,08
0,06
0,04
0,02
0
Y
F
1
2
Предельное значение
3
4
5
T
6
7
В
Рис. 4. Кривые доходностей Y(B) (штриховые линии) и форвардные кривые F(B)
(сплошные линии) для различных значений дисперсий D: 0,01 (нижняя пара кривых); 0,005; 0 (верхняя пара кривых). Круглый маркер показывает предельное значение, одинаковое для всех кривых. Ромбовидные маркеры показывают метки реального времени Т через каждые 2 года для первых 20 лет. Другие параметры принимали следующие значения: kr = 0,1347; kD = 0,01347; r = θ = 0,0762; V = 0,002892;
x = 0,0001; S = 1,88×10−7; λr = 0,1; λD = 0,01. Bмакс = Br(∞) = 7,424
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
72
Когда весовые коэффициенты модели установлены так, что φr =1, φD = 0, краткосрочная ставка доходности в исходной точке y(r, D) = rφr + DφD = r определяется
только процентной ставкой r, а модель становится похожей на однофакторную.
Но отличия от однофакторной модели при этом сохраняются, так как даже при
φD = 0 функция временной структуры BD(τ) не равна нулю. На рис. 5 это различие
иллюстрируется графиками.
0,09
0,07
0,05
Y
F
Предельное значение
T
2
4
6
0,03
0
В
Рис. 5. Кривые доходностей Y(B) (штриховые линии) и форвардные кривые F(B)
(сплошные линии) для двухфакторной модели (верхняя пара кривых) при {φr =1,
φD = 0} и однофакторной модели (нижняя пара кривых). Круглый маркер показывает
предельные значения (0,0475 для двухфакторной и 0,0343 для однофакторной модели). Ромбовидные маркеры показывают метки реального времени Т через каждый
год до 10 лет и далее через 5 лет. Процентная ставка r = θ = 0,0762; Bмакс = Br(∞) =
= 7,4. Другие параметры принимали те же значения, что и для рис. 2
Выполнение неравенств (15) и (16) гарантирует, что параметры модели таковы, что предельные значения кривых доходности и форвардных кривых существуют и неотрицательны. Однако на вид этих кривых существенное влияние оказывают и исходные значения переменных состояния r = r(t) и D = D(t) в дату определения временной структуры. При этом возможны такие значения D, которые
приводят к отрицательным значениям доходностей для некоторых τ, что противоречит экономическому смыслу. На рис. 6 этот случай иллюстрируется графиками.
Для того чтобы этого не случалось, исходная дисперсия D процентной ставки
должна быть достаточна мала. Например, при параметрах модели, для которых
рассчитывались кривые рис. 6, доходности неотрицательны, если исходная дисперсия D удовлетворяет неравенству D < 0,01246. С другой стороны, процесс D(t),
порождаемый уравнением (10), имеет распределение гамма и с положительной
вероятностью может принимать значения, превышающие любое конечное число.
Для принятых значений параметров рассматриваемой двухфакторной модели выборочные значения процесса D(t) имеют распределение гамма с параметром формы (V − x)2/S = 41,42; параметром масштаба S/(V − x) = 0,0000674 и параметром
сдвига x = 0,0001. Это означает, что с вероятностью 0,999987 выборочное значение процесса D(t) не превышает величину 0,005. Так что вероятность нарушения
неравенства D < 0,01246 практически нулевая.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 5. Двухфакторные модели Даффи – Кана
73
0,08
0,06
0,04
0,02
0
2
–0,02
4
6
В
–0,04
–0,06
Y
F
Предельное значение
T
Рис. 6. Кривые доходностей Y(B) (штриховые линии) и форвардные кривые F(B)
(сплошные линии) для значений дисперсий D: 0,02 (нижняя пара кривых); 0,01246
(верхняя пара кривых). Круглый маркер показывает предельное значение, одинаковое для всех кривых. Ромбовидные маркеры показывают метки реального времени
Т через каждые 2 года для первых 20 лет. Другие параметры принимали те же значения, что и для рис. 4
Заключение
Однофакторная модель Даффи – Кана была расширена на двухфакторный случай [3] дополнением второй переменной состояния. В качестве версий дополнительных переменных рассматривались локальный (по времени) средний уровень
процентной ставки или ее мгновенная дисперсия. Получающиеся двухфакторные
модели сформулированы так, чтобы обеспечить аффинную временную структуру
доходности. Основное внимание уделяется свойствам кривой доходности и форвардной кривой, когда динамика краткосрочной процентной ставки описывается
двухфакторными моделями Даффи – Кана. Поскольку функции временной структуры для дополнительных переменных в аналитическом виде не могут быть получены, вид кривых в целом (для всего интервала изменения времени) анализируется с помощью численных расчетов, хотя свойства кривых на концах интервала
выясняются аналитически. Для модели «ставка – ее локальное среднее» оказалось, что предельные свойства долгосрочных доходностей определяются только
свойствами дополнительной переменной – локальным средним θ процентной
ставки r. Для модели «ставка – ее мгновенная дисперсия» выяснилось, что эта модель имеет экономический смысл только тогда, когда весовой коэффициент φD
мгновенной дисперсии при определении краткосрочной ставки доходности равен
нулю. Кроме того, существуют ограничения для значений параметров модели,
выполнение которых необходимо, чтобы модель имела экономический смысл.
Показано также, что при некоторых исходных значениях дисперсии процентной ставки доходности могут становиться отрицательными, что также противоречит экономическому смыслу. Однако для реальных процессов динамики процентных ставок вероятность получения отрицательных доходностей в рамках рассмотренных моделей может оказаться незначительной.
Сравнение кривых доходности и форвардных кривых для однофакторной и
двухфакторных моделей показывает, что при принятых параметрах эти кривые
заметно различаются. Поскольку значения весовых коэффициентов {φ} существенно влияют на поведение кривых доходности и форвардных кривых, они должны оцениваться наряду с рыночными параметрами цены риска {λ}.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
74
ЛИТЕРАТУРА
1. Медведев Г.А. О временной структуре доходности. 1. Модель Васичека // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 1(18). С. 102–111.
2. Медведев Г.А. О временной структуре доходности. 3. Однофакторная модель Даффи –
Кана // Вестник Томского государственного университета. Управление, вычислительная
техника и информатика. 2012. № 3(20). С. 71–80.
3. Медведев Г.А. О временной структуре доходности. 4. Двухфакторные модели Даффи –
Кана // Вестник Томского государственного университета. Управление, вычислительная
техника и информатика. 2012. № 4(21). С. 89–99.
4. Ahn D.-H., Gao B. A parametric nonlinear model of term structure dynamics // The Review of
Financial Studies. 1999. V. 12. Nо. 4. Р. 721–762.
Медведев Геннадий Алексеевич
Белорусский государственный университет
E-mail: MedvedevGA@cosmostv.by
Поступила в редакцию 29 августа 2012 г.
Medvedev Gennady A. (Belarusian State University. Minsk). On term structure of yield rates. 5.
The Duffie – Kan two factor model (continuation).
Keywords: yield interest rates, affine model, yield curve, forward curve, Duffie–Kan two factor
model.
Models of Daffie – Kan, describing dynamics of a short-term interest rate in a case when the
state of the financial market is characterized not only by level of the interest rate, but also one
more parameter changing in time are investigated. Two cases are considered. In the first in quality
of an additional state variable the local on time average value of a short-term interest rate is taken.
In the second case as an additional state variable the instant variance of an interest rate is accepted. Two-factor models are under construction so that they led to affine term structure of yield.
The main attention is given to properties of yield curve and a forward curve when dynamics of a
short-term interest rate is described by two-factor models of Daffie – Kan. Because functions of
term structure for additional variables in a closed form can't be received, the type of curves as a
whole (for entire interval of change of time) is analyzed by means of numerical calculations
though properties of curves on the ends of an interval become clear analytically. For model «a
rate – its local average» it is appeared that limiting properties of long-term yield are defined only
by properties of an additional variable – local average of interest rates. For model «a rate – its instant variance» it became clear that this model has economic sense only when the weight factor of
instant variance at determination of a short-term yield rate is equal to zero. Comparison of yield
curves and forward curves for one-factor model and two-factor models shows that at the accepted
parameters these curves considerably differ. As values of weight factors essentially influence behavior of yield curves and forward curves, they should be estimated along with market parameters
of the price of risk.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 2(23)
УДК 519.872
А.Н. Моисеев, А.А. Назаров
ИССЛЕДОВАНИЕ СИСТЕМЫ МАССОВОГО ОБСЛУЖИВАНИЯ
HIGI|GI|∝1
В работе представлено исследование системы массового обслуживания с
высокоинтенсивным рекуррентным входящим потоком, неограниченным
числом обслуживающих приборов и произвольным временем обслуживания.
Показано, что в условии неограниченного роста интенсивности входящего
потока стационарное распределение числа занятых приборов можно аппроксимировать нормальным распределением. Получены характеристики этого
распределения.
Ключевые слова: система массового обслуживания, высокоинтенсивный
рекуррентный поток, метод асимптотического анализа.
Модели теории массового обслуживания возникли [1] как адекватное математическое описание телекоммуникационных процессов и в настоящее время используются для описания и анализа процессов, возникающих в различных областях деятельности человека. Одной из важнейших областей применения моделей
массового обслуживания являются компьютерные сети [2]. В связи с бурным ростом телекоммуникационных технологий объемы данных, передаваемых по сетям
связи, очень велики и зачастую намного превышают возможности систем их обработки. В силу этого, нам представляется актуальным введение понятия «высокоинтенсивный поток» [3] и использование его для представления входящего потока требований в системе обработки информации, модель которой представлена
в виде системы массового обслуживания.
1. Постановка задачи. Метод просеянного потока
Рассмотрим систему массового обслуживания с неограниченным числом приборов [4], на вход которой поступает высокоинтенсивный рекуррентный (HIGI)
поток заявок [3]. Длины τ интервалов между последовательным поступлением
заявок из этого потока независимы и одинаково распределены. Функция распределения значений τ описывается следующим образом. Представим τ в виде
τ = ξ / N, где ξ – некоторая неотрицательная случайная величина с функцией распределения A(z), а параметр N > 0 имеет смысл большой величины (в теоретических исследованиях предполагается, что N → ∝). Тогда P{τ < x} = A(Nx).
Пусть η = M{τ} – средняя длина интервала между моментами поступления
заявок в систему, тогда интенсивность наступления событий во входящем потоке
равна 1 / η = Nλ, где
λ=
1
−1
⎡∞
⎤
= ⎢ ∫ (1 − A( z ) ) dz ⎥ .
M {ξ} ⎣⎢ 0
⎦⎥
1
Работа выполнена в рамках государственного задания Минобрнауки РФ на проведение научных исследований в Томском государственном университете на 2012−2014 годы, задание 8.4055.2011.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
76
А.Н. Моисеев, А.А. Назаров
Длительности интервалов обслуживания независимы, одинаково распределены и имеют функцию распределения B(x).
В данной работе воспользуемся методом просеянного потока [5]. Вкратце
изложим его суть. Зафиксируем некоторый момент времени T. Будем считать,
что заявка, поступившая в систему в момент времени t < T, с вероятностью
S(t) = 1 – B(T–t) формирует событие просеянного потока, а с вероятностью 1 – S(t)
не рассматривается. Введем следующие обозначения:
i(t) – число приборов, занятых в системе в момент времени t;
n(t) – число событий просеянного потока, наступивших к моменту времени t.
Основная идея метода просеянного потока заключается в следующем. Полагаем, что в начальный момент времени t0 система свободна (этого можно достичь,
взяв, например, в качестве начала отсчета момент времени t0 = –∝). Получаем [5],
что для момента времени T имеет место равенство
i(T) = n(T),
(1)
то есть число приборов, занятых в системе в момент времени T, равно числу событий просеянного потока, наступивших до момента T. Таким образом, найдя характеристики случайного процесса n(t) и полагая t = T, в силу (1) получим соответствующие характеристики сечения исследуемого процесса i(t) в момент времени T.
Для системы, функционирующей в стационарном режиме, полагая t0 = –∝, в
силу произвольности выбора момента T, в качестве результата получаем стационарное распределение для процесса i(t).
2. Вывод уравнения Колмогорова
Обозначим через z(t) длину интервала времени от момента t до момента поступления новой заявки входящего потока. Покажем, что двумерный случайный
процесс {n(t), z(t)} является марковским, так как для него выполняется основное
марковское свойство [6]: при фиксированном «настоящем» «будущее» и «прошлое» независимы.
Зафиксируем «настоящее», то есть положим n(t) = n, z(t) = z. В силу построения в течение интервала времени [t, t + z) значение компоненты n(t) этого процесса не меняется, а значение компоненты z(t) линейно убывает от величины z в момент времени t до нуля в момент времени t + z. В этот момент времени поступает
новая заявка входящего потока, которая с вероятностью 1 – S(t + z) не рассматривается, и в этом случае значение компоненты n(t) не меняется: n(t + z) = n. С вероятностью же S(t + z) данная заявка формирует событие просеянного потока и
компонента n(t) увеличивается на 1: n(t + z) = n + 1. Таким образом, значение
компоненты n(t) в любой момент времени t1 > t не зависит от значений n(t1) и z(t1)
для моментов t1 < t. Компонента z(t) в момент времени t + z принимает случайное
значение, равное длине интервала до момента наступления следующего события
во входящем потоке. Так как интервалы между наступлениями событий во входящем рекуррентном потоке являются независимыми случайными величинами, то
значения компоненты z(t) в моменты времени t1 > t также не зависят от значений
n(t1) и z(t1) для моментов t1 < t.
Таким образом, указанное выше основное марковское свойство для рассматриваемого двумерного процесса {n(t), z(t)} полностью выполняется, т.е. указанный процесс является марковским.
Обозначим распределение вероятностей значений этого процесса через
P(n, z , t ) = P {n(t ) = n, z (t ) < z / N } .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование системы массового обслуживания
77
Применяя формулу полной вероятности, для этого распределения можно записать
равенство
P(n, z, t + ∆t ) = P(n, z + N ∆t , t ) − P(n, N ∆t , t ) + P(n − 1, N ∆t , t ) A( z ) S (t ) +
+ P (n, N ∆t , t ) A( z ) − P(n, N ∆t , t ) A( z ) S (t ) + o(∆t ).
Отсюда получаем уравнение Колмогорова
1 ∂P(n, z , t ) ∂P(n, z , t ) ∂P(n, 0, t )
=
+
[ A( z ) − 1 − A( z ) S (t )] +
N
∂t
∂z
∂z
∂P(n − 1, 0, t )
A( z ) S (t )
+
∂z
∂P(n, 0, t ) ∂P (n, z , t )
=
∂z
∂z
(здесь и далее используется обозначение
(2)
).
z =0
Просуммируем уравнение (2) по n = 0, ∞ , получим
1 ∂ ∞
∂ ∞
∂ ∞
P(n, z , t ) = ∑ P (n, z , t ) + [ A( z ) − 1 − A( z ) S (t ) ] ∑ P (n, 0, t ) +
∑
N ∂t n = 0
∂z n =0
∂z n =0
+ A( z ) S (t )
∞
{
∂ ∞
∑ P(n − 1, 0, t ).
∂z n =1
(3)
}
z
– распределение вероятностей значений случайN
n =0
ного процесса z(t), которое в стационарном режиме обозначим через R(z). В результате в (3) получаем
dR ( z ) dR (0)
dR (0)
+
A( z ) S (t )
0=
[ A( z ) − 1 − A( z ) S (t )] +
dz
dz
dz
Здесь
∑ P(n, z, t ) = P
z (t ) <
dR ( z ) dR (0)
=
[1 − A( z )] .
dz
dz
или
(4)
z
R( z ) =
Отсюда
∞
причем R (∞) = 1 , а
dR (0)
(1 − A( x) ) dx .
dz ∫0
1
∫ (1 − A( x) ) dx = λ . В результате
0
dR (0)
= λ и решение уравнеdz
ния (4) имеет вид
z
R( z ) = λ ∫ (1 − A( x) ) dx .
0
3. Асимптотический анализ
Умножим левую и правую части уравнения (2) на величину e jun , где j = −1 , а
u – некоторая переменная, и просуммируем по n = 0, ∞ . Тогда, введя обозначение
∞
H (u , z , t ) = ∑ e jun P (n, z , t ) ,
n =0
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Н. Моисеев, А.А. Назаров
78
для этой функции получим
1 ∂H (u, z , t ) ∂H (u , z , t ) ∂H (u , 0, t )
∂H (u , 0, t )
A( z ) S (t ) =
=
+
[ A( z ) − A( z ) S (t ) − 1] + e ju
N
∂t
∂z
∂z
∂z
∂H (u, z , t ) ∂H (u , 0, t )
⎡ A( z ) − 1 + A( z ) S (t ) e ju − 1 ⎤ .
=
+
⎣
⎦
∂z
∂z
В этом уравнении выполним замену
(
)
t
⎧⎪
⎫⎪
H (u , z , t ) = H 2 (u , z , t ) exp ⎨ juN λ ∫ S ( x)dx ⎬ ,
t0
⎩⎪
⎭⎪
получим уравнение относительно функции H2(u, z, t):
1 ∂H 2 (u , z , t )
+ juλS (t ) H 2 (u , z , t ) =
N
∂t
∂H 2 (u , z , t ) ∂H 2 (u , 0, t )
⎡ A( z ) − 1 + A( z ) S (t ) e ju − 1 ⎤ .
(5)
=
+
⎣
⎦
∂z
∂z
Уравнение (5) будем решать методом асимптотического анализа [5]. Введем
1
обозначение ε 2 =
и выполним замены u = εw и H2(u, z, t) = F(w, z, t, ε). Тогда
N
уравнение (5) перепишется в виде
∂F ( w, z , t , ε)
ε2
+ jεwλS (t ) F ( w, z , t , ε) =
∂t
∂F ( w, z , t , ε) ∂F ( w, 0, t , ε)
⎡ A( z ) − 1 + A( z ) S (t ) e jεw − 1 ⎤ .
(6)
=
+
⎣
⎦
∂z
∂z
Докажем следующее утверждение.
Теорема. Предельное при ε → 0 значение F(w, z, t) решения F(w, z, t, ε) уравнения (6) имеет вид
(
(
⎧⎪ ( jw) 2
F ( w, z , t ) = R( z ) exp ⎨
⎪⎩ 2
)
)
t
⎡ t
⎤⎫⎪
⎢ λ ∫ S ( x)dx + κ ∫ S 2 ( x)dx) ⎥ ⎬ ,
⎥⎪
t0
⎣⎢ t0
⎦⎭
κ = λ 3 (σ 2 − a 2 ) ,
где
(7)
2
a и σ – математическое ожидание и дисперсия случайной величины с функцией
распределения A(x).
Доказательство выполним в три этапа.
Этап 1. Положим в (6) ε → 0, получим
∂F ( w, z , t ) ∂F ( w, 0, t )
+
[ A( z ) − 1] = 0 .
∂z
∂z
Это уравнение имеет такой же вид, как и (4), поэтому очевидно, что функция
F(w, z, t) может быть представлена как
F ( w, z, t ) = R( z ) Φ ( w, t ) ,
(8)
где Φ(w, t) – некоторая функция, не зависящая от z.
Этап 2. Решение уравнения (6) будем искать в виде разложения
F ( w, z , t , ε) = Φ ( w, t ) [ R( z ) + jεwS (t ) f ( z ) ] + O(ε 2 ) ,
(9)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование системы массового обслуживания
79
где f(z) – некоторая функция, O(ε2) – бесконечно малая величина порядка ε2. Подставим это выражение в (6), получим
dR( z )
df ( z )
dR(0)
jεwλS (t )Φ ( w, t ) R( z ) = Φ ( w, t )
+ j εw
S (t ) +
[ A( z ) − 1] +
dz
dz
dz
dR(0)
df (0)
+
jεwA( z ) S (t ) + jεw
S (t ) [ A( z ) − 1] + O(ε 2 )
dz
dz
{
}
(здесь было использовано разложение e jεw = 1 + jεw + O(ε 2 ) ). Учитывая (4), приведя подобные и сократив обе части на jεw, запишем
df ( z ) df (0)
λR ( z ) =
+
[ A( z ) − 1] + λA( z ) + O(ε) .
dz
dz
Отсюда при ε → 0 получаем дифференциальное уравнение относительно неизвестной функции f(z)
df ( z ) df (0)
=
[1 − A( z )] − λ [ A( z ) − R( z )] ,
dz
dz
решение которого дает следующий результат [3]:
df (0)
λ3
− λ f (∞ ) =
dz
2
∞
∫z
2
dA( z ) − λ =
0
κ
,
2
(10)
где величина κ определяется по формуле (7).
Этап 3. В (6) сделаем предельный переход при z → ∝. В силу способа построения функции F(w, z, t, ε) она является монотонно возрастающей и ограниченной сверху функцией по z. Следовательно,
∂F ( w, z , t , ε)
lim
=0.
z →∞
dz
( jεw) 2
+ O(ε3 ) , получаем:
2
⎛
⎞
∂F ( w, ∞, t , ε)
∂F ( w, 0, t , ε)
( jεw) 2
ε2
+ jεwλS (t ) F ( w, ∞, t , ε) =
S (t ) ⎜ jεw +
+ O (ε 3 ) ⎟ .
∂t
∂z
2
⎝
⎠
Учитывая это и применяя разложение e jεw = 1 + jεw +
Подставим сюда разложение (9) функции F(w, z, t, ε) при z = ∝, имеем
∂Φ ( w, t )
ε2
+ jεwλS (t )Φ ( w, t ) + ( jεw) 2 λS (t ) f (∞)Φ ( w, t ) =
∂t
⎛
df (0) ⎞
( jεw) 2
3
= Φ ( w, t ) S (t ) ⎜ jεwλ +
λ + ( jεw) 2 S (t )
⎟ + O(ε ).
dz
2
⎝
⎠
Приводя подобные и сокращая на ε2, получаем
∂Φ ( w, t ) ( jw) 2
df (0)
=
Φ ( w, t ) ⎡⎢ λS (t ) + 2 S 2 (t ) ⎛⎜
− λf (∞) ⎞⎤
⎟ + O (ε ) .
∂t
2
⎣
⎝ dz
⎠⎦⎥
Учитывая (10) и переходя к пределу при ε → 0, имеем дифференциальное уравнение относительно неизвестной функции Φ ( w, t ) :
∂Φ ( w, t ) ( jw) 2
=
Φ ( w, t ) ⎡⎣λS (t ) + κS 2 (t ) ⎤⎦ .
2
∂t
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Н. Моисеев, А.А. Назаров
80
Решение этого уравнения с учетом начального условия Φ(w, t0) = 1, которое получается из условия
R( z ) при n = 0,
P ( n, z , t 0 ) =
0
при n > 0,
{
имеет вид
⎧⎪ ( jw) 2
Φ ( w, t ) = exp ⎨
2
⎩⎪
t
⎡ t
⎤⎫⎪
⎢ λ ∫ S ( x)dx + κ ∫ S 2 ( x)dx ⎥ ⎬ ,
⎥⎪
t0
⎣⎢ t0
⎦⎭
где величина κ определяется формулой (7). Отсюда в силу (8)
⎧⎪ ( jw) 2
F ( w, z , t ) = R ( z ) exp ⎨
2
⎩⎪
t
⎡ t
⎤⎫⎪
⎢ λ ∫ S ( x)dx + κ ∫ S 2 ( x)dx ⎥ ⎬ ,
⎥⎪
t0
⎣⎢ t0
⎦⎭
что и требовалось доказать.
4. Стационарное распределение вероятностей
числа занятых приборов
Возвращаясь к функции H(u, z, t), получаем, что при достаточно больших значениях N
t
t
t
⎧⎪
⎤⎫⎪
( ju ) 2 ⎡
H (u , z , t ) ≈ R( z ) exp ⎨ juN λ ∫ S ( x)dx +
N ⎢λ ∫ S ( x)dx + κ ∫ S 2 ( x)dx ⎥ ⎬ .
2
⎥⎪
t0
t0
⎩⎪
⎣⎢ t0
⎦⎭
Функция h(u, t ) = lim H (u , z , t ) есть характеристическая функция для процесса
z →∞
n(t) – числа событий, наступивших в просеянном потоке к моменту времени t. При
достаточно больших значениях N она имеет вид характеристической функции гауссовского распределения:
t
t
t
⎧⎪
⎤⎫⎪
( ju ) 2 ⎡
h(u , t ) ≈ exp ⎨ juN λ ∫ S ( x)dx +
N ⎢λ ∫ S ( x)dx + κ ∫ S 2 ( x)dx ⎥ ⎬ ,
2
⎥⎪
t0
t0
⎩⎪
⎣⎢ t0
⎦⎭
то есть распределение для n(t) в момент времени t аппроксимируется нормальным
распределением с математическим ожиданием
t
N λ ∫ S ( x)dx
t0
и дисперсией
t
t
t0
t0
N λ ∫ S ( x)dx + N κ ∫ S 2 ( x)dx .
Полагая t = T, t0 = –∝, используя (1) и произвольность выбора момента T, получаем, что распределение вероятностей числа занятых приборов в рассматриваемой системе в стационарном режиме аппроксимируется нормальным распределением с математическим ожиданием Nλb и дисперсией (Nλb + Nκβ), где
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование системы массового обслуживания
T
∫
b=
−∞
81
∞
S ( x)dx = ∫ (1 − B(τ) ) d τ
0
есть среднее время обслуживания, а
T
β=
∫
−∞
∞
2
S 2 ( x)dx = ∫ (1 − B (τ) ) d τ .
0
5. Численные результаты
Наиболее интересным является вопрос применимости полученной гауссовской
аппроксимации на практике. Очевидно, что точность данной аппроксимации
определяется величиной параметра N и улучшается по мере его увеличения. Поскольку получение аналитических формул, явно выражающих или оценивающих
точность данного приближения, затруднено, будем производить сравнение асимптотических результатов с результатами имитационного моделирования. В качестве величины для оценки точности аппроксимации распределения выберем расстояние Колмогорова [7]
Dq = sup Fq ( x) − F ( x) .
x
Здесь q – объем выборки, полученной по результатам имитационного моделирования, Fq(x) – эмпирическая функция распределения для данной выборки, F(x) –
функция распределения для нормальной случайной величины с найденными выше характеристиками.
Указанное моделирование и расчеты были выполнены для различных примеров. Приведем здесь результаты для одного из них. Рассматривается система массового обслуживания с неограниченным числом приборов, на вход которой поступает высокоинтенсивный рекуррентный поток. Длины интервалов между поступлением заявок в этом потоке равны (см. п.1) τ = ξ / N, где ξ – случайная величина, имеющая гамма-распределение с математическим ожиданием равным 1 и
дисперсией равной 3. Время обслуживания заявки в системе является случайной
величиной, имеющей гамма-распределение с математическим ожиданием 1 и
дисперсией 2.
В таблице приведено сравнение результатов аналитических расчетов и имитационного моделирования для различных значений параметра N:
N
1
10
30
100
1000
10000
Аналитический расчет
среднее ср.кв. отклонение
1
1,442
10
4,559
30
7,896
100
14,42
1000
45,59
10000
144,2
Имитационное моделирование
среднее
ср.кв. отклонение
0,9887
1,330
9,908
4,392
30,15
7,824
100,3
14,55
1001
45,21
9986
143,1
Расстояние
Колмогорова
0,3604
0,0892
0,0399
0,0227
0,0119
0,0094
На графиках (рис. 1) представлено сравнение полигона относительных частот,
построенного по результатам имитационного моделирования, и ряда распределения, полученного на основе гауссовской аппроксимации, для значений N = 1, 10,
30, 100.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Н. Моисеев, А.А. Назаров
82
0,1
0,5
1
0,4
0,08
N= 1
1
N = 10
2
0,06
0,3
2
0,2
0,04
0,02
0,1
0
0
4
8
12
0
16
0,06
0
10
0,03
1
20
30
1
0,025
N = 30
0,04
2
0,02
N = 100
2
0,015
0,02
0,01
0,005
0
4
24
44
0
45
64
65
85
105 125 145 165
Рис. 1. Сравнение полигона относительных частот (1)
и аппроксимирующего ряда распределения (2)
График на рис. 2 демонстрирует убывание расстояния Dq в зависимости от параметра N.
Dq
0,3
0,2
0,1
0
1
10
100
1000
N
10000
Рис. 2. Изменение расстояния Колмогорова Dq
в зависимости от параметра N (шкала по N – логарифмическая)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование системы массового обслуживания
83
На основе сравнения полученных результатов можно сделать вывод, что полученные в работе асимптотические формулы дают достаточно хорошую (Dq < 0,05)
аппроксимацию при значениях параметра N от 30 и выше.
Заключение
Итак, в работе проведено исследование системы массового обслуживания с
неограниченным числом приборов, произвольным временем обслуживания и высокоинтенсивным входящим рекуррентным потоком. Показано, что в условии неограниченно растущей интенсивности входящего потока стационарное распределение числа занятых приборов аппроксимируется нормальным распределением,
получены характеристики этого распределения. Анализ результатов, полученных
по асимптотическим формулам и на основе имитационного моделирования, свидетельствует о достаточно низкой погрешности представленной в работе гауссовской аппроксимации при значениях N ≥ 30 .
ЛИТЕРАТУРА
1. Jackson J.R. Networks of waiting lines // Operations Research. 1957. Nо. 5. P. 518–521.
2. Вишневский В.М. Теоретические основы проектирования компьютерных сетей. М.: Техносфера, 2003. 512 с.
3. Moiseev A., Nazarov A. Investigation of high intensive general flow // Proc. IV International
Conference “Problems of Cybernetics and Informatics” (PCI’2012), September 12−14, 2012,
Baku, Azerbaijan. Baku: ANAS, 2012. P. 161–163.
4. Гнеденко Б.В., Коваленко И.Н. Введение в теорию массового обслуживания. Изд. 4-е,
испр. М.: Изд-во ЛКИ, 2007. 400 с.
5. Назаров А.А., Моисеева С.П. Метод асимптотического анализа в теории массового обслуживания. Томск: Изд-во НТЛ, 2006. 112 с.
6. Бочаров П.П., Печинкин А.В. Теория массового обслуживания. М.: Изд-во РУДН, 1995.
529 с.
7. Рыков В.В., Иткин В.Ю. Математическая статистика и планирование эксперимента: уч.
пособие. М.: МАКС Пресс, 2010. 308 с.
Моисеев Александр Николаевич
Назаров Анатолий Андреевич
Томский государственный университет
E-mail: alexander-moiseev@mail.ru; nazarov.tsu@gmail.com
Поступила в редакцию 14 декабря 2012 г.
Moiseev Alexander N., Nazarov Anatoly A. (Tomsk State University). Investigation of the
queuing system HIGI|GI|∝.
Keywords: queuing system, high intensive general independent flow, asymptotical analysis method.
Queuing system with high intensive recurrent input flow, infinite number of servers and arbitrary distributed service time is considered in the paper. Time periods τ between consecutive input
arrivals are defined by distribution function P{τ < x} = A(Nx), where N is a great number (N → ∝
in theory). Service time is a random variable with distribution function B(x).
The system was investigated under condition of unbound growth (N → ∝) of input rate by the
using of the asymptotical analysis and the dynamical screening methods. It was shown that stationary distribution of busy servers in condition when N is great enough can be approximated by
∞
normal distribution with mean Nλb and variance (Nλb + Nκβ), where b = ∫ (1 − B(τ) ) d τ is an
0
∞
2
∞
average service time, β = ∫ (1 − B (τ) ) d τ , λ = [ ∫ (1 − A( z ))dz ]−1 , κ = λ 3 (σ2 − a 2 ) , a is mean
0
0
and σ2 is variance of the random variable with distribution function A(x).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 2(23)
УДК 519.237
Т.В. Самаль
СРАВНИТЕЛЬНЫЙ ЧИСЛЕННЫЙ АНАЛИЗ ВРЕМЕННЫХ СТРУКТУР
ДОХОДНОСТИ В ЗАВИСИМОСТИ ОТ РАЗМЕРНОСТИ МОДЕЛИ
Рассматриваются математические модели форвардных ставок и их изменение в зависимости от роста сроков погашения, лежащих в основе облигаций,
на примере двухфакторной и трехфакторной моделей аффинной временной
структуры. Проводится сравнительное численное исследование поведения
форвардной кривой и кривой доходности в одно-, двух- и трехфакторных
моделях.
Ключевые слова: временная структура процентных ставок, стохастическое дифференциальное уравнение, кривая доходности, форвардные ставки,
факторные модели, форвардная кривая.
В моделях процентных ставок доходности обычно краткосрочная процентная
ставка (КПС) является единственной переменной состояния. Такие модели дают
возможность получить аналитические решения и обеспечивают относительно
простые вычисления. Однако однофакторные модели имеют один недостаток: вся
временная структура управляется единственным значением КПС, зафиксированным в начальный момент построения временной структуры, что кажется экономически не очень разумным. Цель настоящей статьи – сравнительный численный
анализ временных структур доходности для моделей с числом факторов 1, 2 и 3.
1. Аффинные модели временной структуры
Наиболее популярными являются аффинные временные структуры ставок доходности, которые позволяют получать решения в аналитическом виде. В этом
случае на рынке, состояние которого в текущий момент времени t характеризуется вектором факторов x, цена актива P со сроком погашения τ определяется формулой P(τ, x) = ехр{A(τ) − xТB(τ)}, где скалярная функция A(τ) и вектор B(τ) называются функциями временной структуры. Обычно интересуются процентной
ставкой доходности до погашения y(τ,x) или форвардной процентной ставкой f(τ,
x), которые вычисляются по формулам
x T B(τ) − A(τ)
dB(τ) dA(τ)
y (τ, x) =
, f (τ, x) = x T
−
.
(1)
τ
dτ
dτ
В этих формулах τ – скалярная переменная, а x – вектор параметров. Величины
y и f, рассматриваемые как функции переменной τ, называются соответственно
кривой доходности и форвардной кривой. Экономический смысл требует, чтобы
доходность до погашения y(τ,x) при τ → 0 сходилась к значению спот-ставки r,
называемой также безрисковой или краткосрочной ставкой, в текущий момент
времени t, т. е. при τ → 0 имеет место предельное соотношение y(τ,x) → xТφ = r,
где компоненты вектора φ определяются экономическим смыслом факторов. Когда краткосрочная ставка r используется в качестве одного из факторов, вектор φ
имеет только одну отличную от нуля компоненту, соответствующую ставке r и
равную 1.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнительный численный анализ временных структур доходности
85
В стохастической постановке вектор факторов x является реализацией в момент определения временной структуры векторного случайного процесса X(t), порождаемого системой стохастических дифференциальных уравнений, в финансовом анализе называемой моделью процентных ставок
dX(t) = μ(X(t)) dt + σ(X(t)) dW(t),
(2)
где вектор μ(x) и матрица σ(x) – соответственно функции дрейфа и волатильности, а W(t) – вектор независимых винеровских процессов.
Оказывается, что функции временной структуры A(τ) и B(τ) определяются
только функциями дрейфа и волатильности μ(x), σ(x) и рыночными ценами риска,
составляющими вектор λ(x). Согласно арбитражной теории, аффинная модель
временной структуры получается только тогда, когда эти функции связаны следующими соотношениями (здесь предполагается, что векторы X(t) и W(t) имеют
одинаковую размерность n) [1]:
μ(x) = K(θ − x),
σ(x)σ(x)Т = α +
n
∑ βi xi ,
i =1
σ(x)λ(x) = ξ +
n
∑ ηi xi .
(3)
i =1
Здесь K, α и βi − (n×n)-матрицы; θ, ξ и ηi − n-векторы, xi − компоненты вектора
x. Тогда вычисление функции A(τ) и компонент вектора B(τ) = (B1(τ), B2(τ), …,
Bn(τ)) сводится к решению следующей системы обыкновенных дифференциальных уравнений:
A′(τ) = (ξ − Kθ)ТB(τ) + B(τ)Тα B(τ)/2, A(0) = 0,
(4)
Bi′(τ) = φi − B(τ)Т(ηi + Ki) − B(τ)Тβi B(τ)/2, Bi(0) = 0.
В уравнении для Bi(τ) символ Ki обозначает i-й столбец матрицы K, 1 ≤ i ≤ n.
Аналитически решить эту систему уравнений для n > 1 не удается, так как она является нелинейной системой уравнений типа Риккати. Поэтому для сравнительного анализа кривых доходности и форвардных кривых приходится использовать
численный анализ.
Срок до погашения τ может принимать значения из интервала (0, ∞), поэтому
представить поведение кривой доходности во всей области изменения переменной целиком не представляется возможным. Вместе с тем, из свойств уравнений
для B(τ) выясняется, что компоненты этого вектора – гладкие монотонные функции, стартующие из нуля при τ = 0 и имеющие конечный предел при τ → ∞.
В связи с этим представляется предпочтительным вместо временной переменной
τ использовать одну из компонент вектора B(τ), например соответствующую основному фактору – краткосрочной процентной ставке r, Br(τ) ∈ (0, Br(∞)), Br(∞) < ∞.
Заметим, что Br(τ) имеет размерность времени и в финансовом анализе называется
«продолжительность (duration) влияния спот-ставки на цену актива». Ввиду монотонности Br(τ) такая замена временной переменной не влияет на взаимные
свойства кривой доходности и форвардной кривой. Преимущество такой замены
заключается в том, что на всем интервале времени кривые доходности в виде графика представить невозможно из-за неограниченности интервала времени, τ ∈ (0,
∞), в то время как этому неограниченному интервалу соответствует конечный интервал изменения дюрации Br. При такой замене получим следующее соответствие y(τ, x) = Y(Br(τ), x), f(τ, x) = F(Br(τ), x). При этом можно ожидать, что свойства функций Y(B, r) и F(B, r) могут оказаться проще. Другими словами, введем новую временную переменную преобразованием s = Br(τ) и будем рассматривать
вместо кривой доходности {y(τ, x), τ ∈ (0, ∞)}, заданной на неограниченном интервале, функцию {Y(s, x), s ∈ (0, Br(∞))}, определенную на конечном интервале.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.В. Самаль
86
Поскольку обе эти функции несут одну и ту же информацию о значениях доходности до погашения, функцию Y(s, x) также будем называть кривой доходности.
Аналогично поступим с форвардной кривой {f (τ, x), τ ∈ (0, ∞)}, вводя функцию
{F(s, x), s ∈ (0, Br(∞))}. Поскольку здесь x – это вектор факторов, фиксированный
в момент построения временной структуры, в дальнейшем мы рассматриваем его
как параметр и для краткости в обозначениях функций Y и F опускаем. Можно
показать, что обе кривые y(τ, x) и f (τ, x) при τ = 0 стартуют из одной точки
y(0, x) = f (0, x) = r и при τ → ∞ стремятся к одному и тому же пределу, не зависящему от x. Естественно, такие же свойства имеют функции Y(s) и F(s).
2. Факторные модели временной структуры
Для получения конкретных результатов примем, что модель процентных ставок (2) базируется на модели Кокса – Ингерсолла – Росса (модель CIR), которая
порождает процессы с неотрицательными значениями и поэтому часто используется для моделирования процентных ставок. В этом случае параметры модели,
определяемые соотношениями (3), задаются следующим образом.
Для однофакторной модели CIR состояние определяется только спот-ставкой
x = r. Функции дрейфа и волатильности скалярные и имеют вид μ(x) = k(θ − x),
σ(x) = σ x . Кривые Y(s) и F(s) для этого случая находятся в явном аналитическом виде и подробно исследованы в [2].
Состояние для двухфакторной модели определим вектором x = (x1, x2) = (r, l),
где l – локальное среднее спот-ставки r. Уравнение (2) принимает вид
dr (t ) = k1 (l (t ) − r (t ))dt + σ1 r (t )dW1 (t ) ,
dl (t ) = k2 (θ − l (t )) + σ 2 r (t )dW2 (t ) .
(5)
Для нахождения функций аффинной временной структуры A(τ) и B(τ) в двухфакторной модели можно вывести следующую систему дифференциальных уравнений:
A′(τ) = −θk2 B2 (τ) ,
1
B1′ (τ) = 1 − (k1 (1 + λ1σ1 ) B1 (τ) + k2λ 2 σ 2 B2 (τ)) − (k1σ12 B12 (τ) + k2σ 22 B22 (τ)) ,
2
B2′ (τ) = k1B1 (τ) − k2 B2 (τ) ,
(6)
с начальными условиями A(0) = B1(0) = B2(0) = 0. Ввиду нелинейности второго
уравнения явный вид функций A(τ), B1(τ) и B2(τ) найти не удается, но некоторые
их свойства можно выяснить. Например, при τ → ∞ величины k1B1(τ) и k2B2(τ)
имеют один и тот же предел, что позволяет определить предельные при τ → ∞
значения кривых доходности:
y(∞) = f (∞) = Y(∞) = F(∞) =
=θ
(
)
(1 + λ1σ1 − λ 2 σ 2 ) 2 + 2 σ12 / k1 + σ 22 / k2 − (1 + λ1σ1 − λ 2σ 2 )
σ12
/ k1 + σ22
/ k2
.
(7)
При переходе к переменной s преобразованием s = B1(τ) или τ = τ(s) функциям
A(τ) и B2(τ) будут соответствовать функции a(s) и b2(s), и мы получим относительно функций Y(s), F(s), a(s), τ(s) и b2(s) следующую нелинейную систему дифференциальных уравнений:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнительный численный анализ временных структур доходности
τ( s )Y ( s ) = rs + lb2 ( s ) − a ( s ),
87
db ( s ) da( s )
d τ( s )
−
F (s) = r + l 2
,
ds
ds
ds
da ( s )
d τ( s ) db2 ( s ) d τ( s )
=
= −θk2 b2 ( s )
[k1s − k2 b2 ( s )],
,
ds
ds
ds
ds
1
1
d τ( s )
(1 − k1 (1 + λ1σ1 ) s − k2 λ 2 σ 2 b2 ( s ) − k1σ12 s 2 − k2 σ 22 b22 ( s ))
=1.
2
2
ds
F, Y
(8)
А
0,075
0,070
0,065
0,060
0,0
0,2
0,4
0,6
F, Y
B1
Б
0,075
0,070
0,065
0,0
0,2
0,4
0,6
B1
Рис. 1. Взаимное расположение форвардной кривой F (сплошная линия)
и кривой доходности Y (пунктирная линия) при следующих значениях
параметров: σ1 = 0,0667; σ1 = 0,0067; λ1 = 0,1; λ2 = 0,05; k1 = 1; k2 = 0,4; θ =
= 0,0721; А) r = {0,06; 0,069; 0,08}; l = 0,07; Б) r = 0,071; l = {0,06; 0,069;
0,08}. При указанных значениях параметров f(∞) = y(∞) = 0,0715645.
Поскольку система не имеет решения в явном виде, исследовать ее решения
можно лишь численными методами. Для численного решения должны быть заданы параметры модели k1, k2, θ, σ1, σ2, параметры рыночной цены риска λ1 и λ2, а
также исходные значения факторов r и l. Подробный анализ численных решений
при изменении всего множества параметров здесь показать невозможно, поэтому
были рассмотрены только решения для случая, когда первые семь параметров
принимают фиксированные значения, обычно используемые в литератре для иллюстрации аналитических результатов. Здесь приведем только сведения о взаимном расположении форвардной кривой F(s) и кривой доходности Y(s) для различ-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.В. Самаль
88
ных исходных значений факторов r и l. Отметим, что эти кривые в зависимости от
значений r и l оказываются, как правило, либо выпуклыми, либо вогнутыми. Вид
кривых представлен на рис. 1.
Из рис. 1, А видно, что кривые доходности и форвардная при τ = 0 выходят из
одной точки F(0) = Y(0) = r и с ростом s стремятся к одному и тому же пределу (7).
При изменении параметра r можно проследить влияние спот-ставки на траекторию кривых. Если она больше θ, то кривые монотонно убывают к своему предельному значению, в противном случае – возрастают. Стоит также отметить, что
форвардные кривые располагаются ниже кривых доходности в первом случае и
выше – во втором.
На рис. 1, Б продемонстрировано взаимное расположение кривых при вариации параметра l, из рисунка можно сделать вывод, что при возрастании l кривые
меняют направление вогнутости и пересекаются. Остальные свойства сохраняются. Подобным образом выясняется влияние других параметров модели на взаимное расположение кривых, однако из-за ограниченности объема статьи этот анализ здесь опускается.
Состояние трехфакторной модели определим вектором x = (x1, x2, x3) = (r, l, v),
где l – локальное по времени среднее спот-ставки r, а v – ее локальная дисперсия.
Существует много способов распространений модели CIR на трехмерный случай.
Выберем чаще всего встречающийся подход – модель Чена [3]. В этом случае
уравнение (2) принимает вид
⎛ dr ⎞ ⎛ k1
⎜ dl ⎟ = ⎜ 0
⎜ ⎟ ⎜
⎝ dv ⎠ ⎝ 0
− k1
k2
0
0 ⎞⎛ l − r ⎞
⎛1 0
0 ⎟⎜ θ − l ⎟ dt + ⎜ 0 σ 2
⎟⎜
⎟
⎜
k3 ⎠⎝ V − v ⎠
⎝0 0
0 ⎞⎛ v
⎜
0 ⎟⎜ 0
⎟
σ3 ⎠ ⎜ 0
⎝
0
θ
0
0 ⎞ ⎛ dW1 ⎞
⎟
0 ⎟ ⎜ dW2 ⎟ ,
⎜
⎟
v ⎟⎠ ⎝ dW3 ⎠
где θ и V – стационарные математические ожидания факторов l и v, k1, k2, k3, σ2, σ3
– положительные константы; W = (W1, W2, W3)Т – вектор независимых процессов
броуновского движения.
Проведя рассуждения, аналогичные рассуждениям для двухфакторной модели,
при переходе к переменной s функциям A(τ), B2(τ) и B3(τ) будут соответствовать
функции a(s), b2(s) и b3(s), и мы получим относительно функций Y(s), F(s), a(s),
τ(s), b2(s) и b3(s) следующую нелинейную систему дифференциальных уравнений
для функций аффинной временной структуры вместе с уравнениями для кривой
доходности и форвардной кривой:
rs + lb2 ( s ) + νb3 ( s ) − a ( s )
Y ( s) =
,
τ( s )
⎛
σ2b2 ( s) ⎞
F ( s ) = r (1 − k1s ) + l ⎜1 + k1s − k2 b2 ( s ) − 2 2
⎟+
2
⎝
⎠
⎛
s 2 σ32 b32 ( s ) ⎞
+ ν ⎜⎜1 − k3b3 ( s ) − −
⎟⎟ + k2 θb2 ( s ) + k3Vb3 ( s ) + s (k1 − k2 )θ ,
2
2
⎝
⎠
k θb ( s ) + k3Vb3 ( s ) + s (k1 − k2 )θ
da ( s )
=− 2 2
,
ds
1 − k1s
db2 ( s )
=
ds
1 + k1s − k2 b2 ( s ) −
1 − k1s
σ22 b22 ( s )
2
,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнительный численный анализ временных структур доходности
db3 ( s )
=
ds
s 2 σ32 b32 ( s )
−
d τ( s )
1
2
2
=
.
,
ds
1 − k1s
1 − k1s
1 − k3b3 ( s ) −
89
(9)
Из системы видно, что основной сложностью является определение функций
a(s), b2(s) и b3(s), которые находятся лишь численными методами. Таким образом,
поведение форвардной кривой F(s) и кривой доходности Y(s) для трехфакторной
модели Чена можно исследовать, только решая систему численно. Модель задается семью параметрами k1, k2, k3, θ, V, σ2, σ3 и тремя фиксированными исходными
значениями факторов r, l и v. Так что пространство параметров системы оказывается десятимерным. Ввиду сложности системы рассматривался безрисковый случай, когда рыночные цены риска равны нулю λ1 = λ2 = λ3 = 0. Здесь приведем
лишь сведения о том, как влияют на форму кривых F(s) и Y(s) значения факторов
r и l (рис. 2).
F, Y
А
0,16
0,14
0,12
0,10
0,08
F, Y
0,18
0,1
0,2
0,3
0,4
B1
0,1
0,2
0,3
0,4
B1
Б
0,16
0,14
0,12
0,10
0,08
Рис. 2. Взаимное расположение форвардной кривой F (сплошная линия)
и кривой доходности Y (пунктирная линия) при следующих значениях
параметров: k1 = 2,19; k2 = 0,0757; k3 = 1,24; θ = 0,0416; V = 0,000206;
σ2 = 0,0503; σ3 = 0,0198; A) r = {0,03; 0,07; 0,12}; l = 0,04; ν = 0,0002;
Б) r = 0,03; l = {0,04; 0,08; 0,12}; ν = 0,0002
Поведение этих кривых аналогично их поведению в двумерном случае. Все кривые получались либо выпуклыми, либо вогнутыми. Как и ожидалось, оба графика
выходят из одной точки и стремятся к одному предельному значению, которое при
принятых значениях параметров равно 0,115707, при этом переменная s принимает
значения в интервале (0; 0,456621). Если r больше θ (рис. 2, А), то кривые монотонно убывают к своему предельному значению, если меньше – возрастают. Форвардные кривые располагаются ниже в первом случае и выше – во втором.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.В. Самаль
90
График на рис. 2, Б отражает влияние на поведение кривой доходности и форвардной кривой второго фактора l, имеющего интерпретацию локального математического ожидания КПС. Так же, как и в двухфакторной модели, с его ростом у
кривых появляется еще одна точка пересечения. Другие параметры модели тоже
оказывают существенное влияние на поведение кривых.
3. Сравнительный численный анализ факторных моделей
Представляет интерес выяснить, насколько сильно на поведение кривой доходности и форвардной кривой влияет количество используемых для их описания
факторов. Результаты такого исследования приведены на рис. 3 с описанием численного значения параметров для каждой модели. Чтобы графики кривых соответствовали реальным ситуациям, были взяты значения оценок общих параметров,
F, Y
0,075
0,070
0,065
А
0,060
0
1
2
3
4 B1
F, Y
0,4
0,3
0,2
0,1
0,0
Б
0,5
1,0
1,5
B1
Рис. 3. Взаимное расположение форвардной кривой F (сплошная линия)
и кривой доходности Y (пунктирная линия) при указанных выше значениях параметров. А) Однофакторная модель: r = 0,06; k = 0,2339;
θ = 0,0808; σ = 0,0854; D = 0,00126. Двухфакторная модель: σ1 = 0,854; σ2
= 0,0854; k1 = 0,2339; k2 = 0,4; l = 0,07; r = 0,06; θ = 0,0808. Трехфакторная
модель: k1 = 0,2339; k2 = 0,45; k3 = 1,24; θ = 0,08; V = 0,000206; σ2 = 0,854;
σ3 = 0,0854; r = 0,24; l = 0,34; ν = 0,002. Б) Однофакторная модель:
r = 0,06; k = 0,544; θ = 0,374; σ = 0,023; λ = −0,36; D = 0,00018. Двухфакторная модель: σ1 = 0,023; σ2 = 0,023; λ1 = −0,036; λ2 = 0,05; k1 = 0,544;
k2 = 4; l = 0,07; r = 0,06; θ = 0,374. Трехфакторная модель: k1 = 0,544;
k2 = 1; k3 = 1,24; θ = 0,374; V = 0,000206; σ2 = 0,023; σ3 = 0,19824; r = 0,024;
l = 0,034; ν = 0,002
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнительный численный анализ временных структур доходности
91
найденные CKLS [4] (рис. 3, А), по выборке 306 наблюдений годовой доходности
одномесячных векселей Казначейства США с июня 1964 по декабрь 1989 г., а
также найденные Duffie and Singleton [5] (рис. 3, Б), использовавших еженедельные данные о ценах облигаций Казначейства США с 4 января 1988 г. по 28 октября 1994 г.
Заключение
Из приведенных графических данных можно сделать заключение, что на вид
графиков, а соответственно и на поведение форвардных ставок и ставок доходности в зависимости от срока до погашения, в большей степени оказывают влияние
значения параметров моделей, а не количество факторов. В связи с этим может
возникнуть вопрос о целесообразности исследования модели с бóльшим числом
факторов, чем три, поскольку отличия поведения форвардных ставок и ставок доходности незначительные, а структура модели и особенно ее численный анализ
значительно усложняются.
ЛИТЕРАТУРА
1. Медведев Г.А. О временной структуре доходности. 1. Модель Васичека // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 1(18). С. 102–111.
2. Медведев Г.А. Стохастические процессы финансовой математики. Минск: БГУ. 2005.
3. Chen L. A Three Factor of the Affine Term Structure of Interest Rates and Its Application to
the Pricing of Interest Rate Derivatives. N.Y.: Blackwell Publishers, 1996.
4. Chan K.C., Karolyi G.A., Longstaff F.A., and Sanders A.S. An empirical comparison of alternative models of the short-term interest rate // J. Finance. 1992. V. 47. Р. 1209–1227.
5. Duffie D., Singleton K.J. An econometric model of the term structure of interest-rate swap
yields // J. Finance. 1997. V. 52. Р. 1287–1321.
Самаль Татьяна
Белорусский государственный университет (г. Минск)
E-mail: solesytto@gmail.com
Поступила в редакцию 24 января 2013 г.
Samal Tatiana V. (Belarus State University. Minsk). Comparative numerical analysis of temporal structure yield, depending on the dimension of the model.
Keywords: term structure of interest rates, the stochastic differential equation, the yield curve,
forward rates, factor models, the forward curve.
The paper presents the numerical analysis of the term structure of return interest rates in the
affine model. Special attention is paid to the form of curves yield, to maturity and the forward
curve of interest rates depending on the amount taken into account the model determinants of financial market. We consider one-, two-and three-factor model, based on the model of Cox – Ingersoll – Ross. It is shown that the dimension of the model affects the shape of the yield curves
less than the numerical values of the factors themselves.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 2(23)
УДК 519.24
Н.А. Сергеева, М.В. Цепкова
О НЕПАРАМЕТРИЧЕСКОМ МОДЕЛИРОВАНИИ
ДИНАМИЧЕСКИХ ПРОЦЕССОВ
Рассматривается задача идентификации линейной динамической системы
(ЛДС) на основе интеграла свертки с использованием оценки весовой функции. Весовая функция при этом получена в результате реакции ЛДС на
входное возмущающее воздействие в виде кусочно-постоянной аппроксимации δ-функции. Приводятся результаты численного моделирования непараметрических алгоритмов.
Ключевые слова: дискретно-непрерывные динамические процессы, весовая
функция, непараметрическая идентификация, интеграл Дюамеля.
Настоящая работа посвящена малоизученной проблеме идентификации динамических процессов в «широком» смысле в отличие, от широко распространенной параметрической идентификации или идентификации в «узком» смысле.
В частности, рассматривается построение модели линейной динамической системы, когда параметрическая структура объекта неизвестна. Непараметрическая
модель ЛДС основывается на соответствующей оценке интеграла Дюамеля, построенного по результатам экспериментов на исследуемом процессе.
1. Идентификация в «узком» и «широком» смыслах
На рис. 1 представлена схема исследуемого процесса с запаздыванием. Особенность постановки задачи состоит в том, что процесс построения модели линейной динамической системы осуществляется в условиях, когда параметрическая структура объекта неизвестна. Ниже приведем общепринятую схему идентификации динамической системы с той лишь разницей, что параметрическая модель, описывающая процесс, неизвестна.
ξ(t)
u(t)
Процесс
htu
x(t)
htx
ИУ
ИУ
uth
xth
Рис. 1. Схема динамической системы
Введены следующие обозначения: u(t) – входная переменная u (t ) ∈ R , x(t) –
выходная переменная процесса, которую без нарушения общности, можем считать скалярной, ξ(t) – случайное воздействие с ограниченной дисперсией:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О непараметрическом моделировании динамических процессов
93
D {ξ(t )} < Const и нулевым математическим ожиданием: M {ξ(t )} = 0 , htu , htx −
случайные помехи, действующие в каналах измерения входной и выходной переменных процесса, uth , xth − измерения входной и выходной переменных процесса
соответственно, ИУ – измерительное устройство. Для простоты записи будем
обозначать измерения входных и выходных переменных uth , xth через
{(ui , xi ), i = 1, s} = {us , xs },
где xs = ( x1 , x2 ...xs ), us = (u1 , u2 ...us ) − временные векторы
[1].
Таким образом, переменная x(t) может быть представлена в виде объективно
существующей зависимости
x(t ) = A(u (t − θ), ξ(t ), t ),
(1)
где А – неизвестный оператор процесса, θ – величина запаздывания.
Измерение переменных x(t) и u(t) осуществляется со случайными ошибками,
имеющими нулевое математическое ожидание и ограниченную дисперсию, плотность вероятности их неизвестна. Обозначим эти наблюдения xt, ut, t = 1,2…, здесь
t дискретное время.
Исследователь при моделировании подобных процессов преследует цель построения математической модели
xˆ(t ) = B(u (t − θ), t ),
(2)
где B – класс операторов, который определяется на основании имеющейся априорной информации, xˆ(t ) − выход модели. Ясно, что в этом случае стремятся к близости xˆ(t ) к x(t) в смысле принятого критерия оптимальности. Очевидно, что модель (2), описывающая процесс (1), может быть удовлетворительной, если класс
операторов B выбран удачно. Описанная ситуация является типичной не только
для разнообразных технологических процессов, но и для многих других. Проблема моделирования подобных процессов усугубляется недостатком априорной информации об операторе A, что приводит к необходимости рассматривать задачи
идентификации в «широком» смысле.
При моделировании разнообразных технологических процессов в настоящее
время доминирует теория идентификации в «узком» смысле [1]. Ее содержание
состоит в том, что на первом этапе каким-то образом на основе априорной информации определяется параметрический класс операторов B, например
xˆβ (t ) = Bβ (u (t − θ), β),
(3)
а на втором этапе осуществляется оценка параметров β на основе имеющейся вы-
{
}
борки xt , ut , t = 1, s , s – объем выборки. Успех решения задачи идентификации в
этом случае существенно зависит от того, насколько «удачно» определен оператор (3).
Идентификация в «широком» смысле предполагает отсутствие этапа выбора
параметрического класса оператора (3), если, конечно, для этого нет достаточных
априорных сведений. Часто оказывается значительно проще определить класс
операторов (2) на основе сведений качественного характера, например линейности процесса или типа нелинейности, однозначности либо неоднозначности и др.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.А. Сергеева, М.В. Цепкова
94
В этом случае задача идентификации состоит в оценивании этого оператора на
{
}
основе выборки xt , ut , t = 1, s в форме
xˆs (t ) = Bs (u (t − θ), xs , us ).
(4)
Для некоторых классов операторов теория идентификации в «широком» смысле
была развита на основе методов непараметрической статистики [2]. В этом случае
формулы типа (4) являются непараметрическими моделями процесса (1).
При моделировании дискретно-непрерывных процессов следует отличать запаздывание, присущее самому объекту, от задержки, необходимой для измерения
переменных объекта. В дальнейшем предполагается, что величина запаздывания θ
известна.
2. Непараметрические модели
Известно, что ЛДС может быть описана в виде интеграла Дюамеля, который
при ненулевых начальных условиях имеет следующий вид:
t
x(t ) = k (0)u (t ) + ∫ h(t − τ)u (τ)d τ,
(5)
0
где k(t) и h(t) – соответственно переходная и весовая функции системы. Ниже
приведен дискретный аналог интеграла свертки:
х (t ) = k (0)u (t ) +
t / ∆τ
∑ h(t − τi )u (τi )∆τ,
(6)
i =1
где ∆τ – шаг дискретизации по времени, τi = i∆τ − значения времени дискретизации. Вычисление выхода x (t ) при этом возможно, если известна переходная и
импульсная переходная функции системы.
При непараметрическом подходе требуется построить непараметрические
оценки переходной и весовой функций, связанных соотношением h(t ) = dk / dt
[3]. Основой для восстановления оценки переходной функции k(t) служат наблюдения реакции объекта на единичное возмущающее воздействие.
Пусть на вход ЛДС подано единичное возмущающее воздействие
1(t ), 0 < t < T , где T – время окончания переходного процесса, а 1(t) – функция Хэвисайда. Обозначим
{ xi = ki , ui = 1, i = 1, s} − реализацию
наблюдений «входа-
выхода» объекта, причем наблюдения выходной переменной x(t) осуществляются
в дискретном времени через интервал ∆t со случайной статистически независимой
помехой с нулевым математическим ожиданием и ограниченной дисперсией.
Непараметрической оценкой x(t) (непараметрической моделью ЛДС) будет
статистика [2]
t
xs (t ) = ks (0)u (t ) + ∫ hs (t − τ)u (τ)d τ,
0
где k s (t ) и hs (t ) – соответственно оценки переходной и весовой функций системы. Ранее [3] предлагалось восстанавливать весовую функцию объекта как производную переходной функции, полученной в результате измерения выхода объекта
при подаче на вход единичной функции.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О непараметрическом моделировании динамических процессов
95
Ниже предлагается подход, при котором в качестве входного воздействия используется аппроксимация δ-функции. В этом случае выходная переменная объекта представляет собой некоторое приближение к весовой функции системы.
В этой ситуации отсутствует необходимость оценивания производной переходной
функции и тем самым несколько упрощается задача статистического оценивания
весовой функции. В дальнейшем рассматриваются различные аппроксимации
δ-функции, которые обозначим как δ∆.
Для построения оценок весовой функции используется непараметрическая
оценка регрессии, построенная по выборке выходных значений динамического
процесса, полученных при входном воздействии u(t)=δ∆. Восстановление весовой
функции ht по наблюдениям с помехами осуществляется следующим образом:
s
⎛ t − ti ⎞
(7)
⎟,
⎝ Cs ⎠
i =1
здесь h – весовая функция системы, s – объем выборки, Cs – параметр размытости,
Н(z) – ядерная функция, обладающая известными свойствами сходимости [4], Т –
время установления переходного процесса.
В качестве непараметрической модели x(t) предлагаются непараметрические
статистики класса Н-аппроксимаций [4], вытекающих из оценок Надарая – Ватсона [5] при равномерной дискретизации аргумента t:
s
⎛ t − τi − t j ⎞
1 t / ∆τ
xs (t ) = k s (0)u (t ) + ∑
hi H ⎜
∑
⎟ u (τi )∆τ .
⎝ Cs
⎠
j =1 sCs i =1
hs (t ) =
T
sCs
∑ hi H ⎜
В качестве ядерной функции выбрано усеченное параболическое ядро. Вопросы оптимизации модели по параметру размытости рассмотрены в [3].
3. Вычислительные эксперименты
В ходе численного исследования рассматривается подход к идентификации
импульсной переходной (весовой) функции линейного динамического объекта
при входном возмущающем воздействии в виде δ∆. Исследуются модели вида (6)
при нулевых начальных условиях.
В вычислительном эксперименте исследуемый объект описывался уравнением
второго порядка
ax′′(t ) + bx′(t ) + cx(t ) = u (t )
(8)
или в разностном виде:
xt =
2a + b∆t
b
xt −1 +
xt − 2 +
∆t 2
ut .
b + a∆t + c∆t 2
b + a ∆t + c ∆ t 2
b + a ∆t + c∆t 2
Далее на вход объекта подавался сигнал u(t) = δ∆, а на выходе наблюдался хt – суть
– весовая функция ht объекта.
На практике невозможно подать δ-функцию на вход объекта, поэтому в вычислительном эксперименте в качестве δ∆ была принята система вида
N , t ∈ [0, ∆T + ∆t ],
u (t ) = δ∆ =
0, t ∉ [0, ∆T + ∆t ],
{
где N – высота ступени, ∆T – ширина интервала, ∆t – шаг дискретизации.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.А. Сергеева, М.В. Цепкова
96
На рис. 2, а изображен вид δ∆, на рис. 2, б – оценка весовой функции hs(t)
и ее аналитический аналог (решение дифференциального уравнения (8), когда
u(t) = δ(t)).
u(t)
а
N
h(t), hs(t)
б
2
1,5
1 – h(t)
2 – hs(t)
0
{
1
∆Т
0,0102 t
0
2
5 t
Рис. 2. Пример δ∆ и весовой функции: а – входное воздействие δ∆;
б – весовая функция
Представленная на рис. 2 оценка весовой функции в дальнейшем используются при моделировании объекта, так как при данной δ∆ она наиболее приближена к
аналитическому решению, что повышает точность моделирования.
В рамках данной работы рассматривалось два варианта приближения к δфункции. Способ задания входного воздействия влияет на известные начальные
параметры, на основе которых определяется δ∆.
Входное воздействие объекта можно задавать:
1. Через ширину интервала ∆T;
2. Через высоту ступени N.
Первый способ заключается в задании ширины интервала ∆T и в определении
через нее высоты ступени N. В этом случае δ∆ рассматривается в виде трапеции,
например как на рис. 2. Первоначально определяется шаг сетки, для этого вводится количество интервалов под ступенькой n, оно равно числу отрезков, на которое
делится ширина интервала:
∆T
∆t =
(9)
,
n
где n – количество интервалов под ступенькой.
Высота ступени рассчитывается из площади трапеции:
2
N=
,
(10)
(∆T + (∆T − 2∆t ))
где ∆t – шаг сетки, определяемый по формуле (9).
Второй способ заключается в вычислении ширины интервала ∆T через задаваемую высоту ступени N. При данном способе δ-образная функция принята в виде прямоугольника, ширина интервала соответственно рассчитывается из площади прямоугольника:
1
∆T = .
N
После того как определена ширина интервала или высота ступени, строиться
входное воздействие δ∆ на всем временном интервале [0, T], где T – время установления переходного процесса.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О непараметрическом моделировании динамических процессов
97
После получения весовой функции она оценивается по формуле (7). На рис.3
показана способность непараметрической оценки сглаживать влияние помех в
выборке. Показан случай, когда на объект действует помеха, распределенная по
нормальному закону с нулевым математическим ожиданием и среднеквадратическим отклонением σ = 0,03 (рис. 3, а) и σ = 0,1 (рис. 3, б). Принято обозначение:
х(t) – выход объекта, при входном воздействии δ∆, hs(t) – оценка весовой функции.
x(t), hs(t)
1
1,5
1 – x(t)
2 – hs(t)
2
0
а
5 t
2
x(t), hs(t)
1,5
1 – x(t)
2 – hs(t)
1
2
0
б
5 t
2
Рис. 3. Примеры весовой функции: а – помеха с σ = 0,03; б – помеха с σ = 0,1
По рис. 3 видно, что оценка весовой функции дает хорошее приближение выхода модели и объекта.
Для проверки адекватности полученной оценки считается ее относительная
ошибка на временном отрезке [0, T]. Формула для расчета ошибки имеет вид
ε=
1 s | h(ti ) − hs (ti ) |
⋅100%.
∑
s i =1 | hmax − hmin |
Рассмотрим влияние способа задания входного воздействия на оценку весовой
функции. Наблюдается величина относительной ошибки при различных значениях параметров δ∆.
Результаты исследований отражены в табл. 1 и 2, где значениям ширины интервала ∆Т и высоты ступени N соответствует относительная ошибка оценки весовой функции ε на временном отрезке [0;5]. Табл. 1 соответствует результатам
исследования при задании δ∆ через ширину интервала ∆Т, в табл. 2 приведены результаты при другом способе задания входного воздействия. Объем выборки составляет s = 150 точек, на объект действует помеха, распределенная по нормальному закону с нулевым математическим ожиданием и среднеквадратическим отклонением σ = 0,03.
Таблица 1
∆T
ε,%
N
0,01
0,52
111
0,076
0,85
14
0,1
1,11
13
0,3
2,57
3
0,9
5,45
1
Таблица 2
N
ε,%
∆T
110
0,62
0,001
13
1,86
0,076
10
2,15
0,1
3
3,84
0,3
1
5,6
1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.А. Сергеева, М.В. Цепкова
98
Сравнивая полученные результаты, можно заметить, что при близких параметрах δ∆ величина относительной ошибки ε в табл. 1 получается меньше, чем в
табл. 2. Поэтому при восстановлении весовой функции входное возмущающее
воздействие δ∆ рекомендуется задавать через ширину интервала ∆Т.
На рис. 4 представлена графическая интерпретация полученных результатов.
Введено обозначение h(t) – истинное значение весовой функции, hs(t) – оценка весовой функции. Истинным значением весовой функции называем аналитическое
решение дифференциального уравнения (8) при u(t)=δ(t).
h(t), hs(t)
1,5
1 – h(t)
2 – hs(t)
2
1
0
а
2
t
h(t), hs(t)
1,5
2
1
б
0
2
t
Рис. 4. Сравнение весовых функций: а – δ∆, заданная через ширину интервала;
б – δ∆, заданная через высоту ступени
На рис. 4, а аппроксимация задавалась через ширину интервала, на рис. 4, б
через высоту ступени. По графикам видно, что в первом случае (рис. 4, а) оценка
весовой функции более приближена к истинному значению, эти же результаты
подтверждает величина относительной ошибки, которая равна ε = 0,52 и 0,82 для
первого и второго случаев соответственно. При построении модели используется
оценка весовой функции, приведенная на рис. 4, а.
После того как определена оценка весовой функции, строится модель объекта,
основанная на дискретной форме интеграла Дюамеля при нулевых начальных условиях, которая имеет вид
xs (t ) =
t / ∆τ
∑ hs (t − τi )u (τi )∆τ ,
(11)
i =1
где hs(t) – это оценка весовой функции, u(τ) – входное воздействие, ∆τ – шаг дискретизации по времени, τi = i∆τ – значения времени дискретизации.
В вычислительных экспериментах был принят линейный динамический объект
второго порядка вида
xt = 1,67 xt −1 − 0,76 xt − 2 + 0,638ut .
На первом этапе входное возмущающее воздействие объекта рассматривается
в виде ut = δ∆. Для восстановления весовой функции используется δ∆ (вида рис. 2, а),
заданная через ширину интервала вышеописанным способом (10). После этого
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О непараметрическом моделировании динамических процессов
99
строится модель объекта (11) на основании наблюдений весовой функции ht. При
построении модели используется только та оценка весовой функции, которая максимально приближена к ее истинному значению. Когда модель построена на вход
объекта и модели подается входное воздействие в виде u (t ) = −4log(3,6t ) , объем
выборки s = 150 точек, на объект действует помеха, распределенная по нормальному закону со среднеквадратическим отклонением σ = 0,1, объект моделируется
на временном отрезке [0;5]. На рис. 5 приведена графическая интерпретация проведенного эксперимента. Введено обозначение х(t) – выход объекта, при произвольном входном воздействии u(t), хs(t) – модель объекта.
1 – x(t)
2 – xs(t)
x(t), xs(t)
2
1
0
а
5
2
1
t
h(t), hs(t)
1,5
1
1 – h(t)
2 – hs(t)
2
0
б
2
5 t
Рис. 5. Результат моделирования при u (t ) = −4log(3,6t ) :
а – модель объекта; б – оценка весовой функции
По результатам моделирования (рис. 5) видно, что модель практически повторяет поведение объекта, что также подтверждает величина относительной ошибки
0,07.
Изменим условия моделирования. Увеличим объем выборки s и используем в
качестве входного воздействия функцию u (t ) = 7sin(2,5t ) + 7 cos(t ) . Объем выборки составит s = 200 точек, помеха, действующая на объект, имеет нулевое математическое ожидание и среднеквадратическое отклонение σ = 0,07, объект моделируется на временном отрезке [0; 5],
Качество работы модели подтверждается величиной относительной ошибки
приближения выхода модели и выхода объекта, которая для этого случая составляет
0,074. По результатам моделирования можно сделать вывод, что непараметрическая
модель ЛДС (11) адекватна объекту при произвольных входных воздействиях.
В условиях реального функционирования объекта невозможно подать δ-функцию, так как она представляет собой бесконечный сигнал. При этом если использовать δ∆ в качестве входного воздействия объекта, то возможно снять на объекте
аналог весовой функции. Из проведенных экспериментов можно сделать вывод,
что модель, построенная с помощью аппроксимации весовой функции, снятой непосредственно на объекте, может быть адекватна ему.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.А. Сергеева, М.В. Цепкова
100
x(t), xs(t)
1 – x(t)
2 – xs(t)
2
10
1
0
а
2
5
t
h(t), hs(t)
1,5
2
0
1
1 – h(t)
2 – hs(t)
б
2
5 t
Рис. 6. Результат моделирования при u (t ) = 7sin(2,5t ) + 7 cos(t ) :
а – модель объекта; б – оценка весовой функции
Заключение
В заключение следует отметить, что настоящая работа посвящена малоизученному классу задач идентификации в «широком» смысле, т.е. в случае, когда априори параметрическая структура объекта не известна. Ранее непараметрическая
идентификация ЛДС осуществлялась по оценкам переходных функций [4].
В настоящей работе сделана попытка исследования вопроса о возможности
приближения δ-функции в виде δ-образной функции, подаваемой на объект. При
этом непараметрическая модель линейного динамического объекта строится по
наблюдениям с ошибками весовой функции объекта в отличие от [4, 5].
Важно отметить, что возможно построение непараметрической модели динамического объекта с запаздыванием, которое содержится в результатах наблюдения выходной переменной объекта х(t). Модель динамического объекта строится
на основании измерения весовой функции системы. Этот путь оказывается эффективным, так как нет необходимости в оценивании производной переходной
функции, что с точки зрения статистического оценивания является более трудной
задачей.
В данной работе приводились исследования получаемой весовой функции в
зависимости от вида дельтаобразной функции δ∆. Исследования показали, что при
задании δ∆ через ширину интервала весовая функция наиболее приближена к истинному значению, что повышает эффективность непараметрического моделирования дискретно-непрерывных процессов. Многочисленные вычислительные эксперименты показали эффективность предложенных непараметрических моделей.
Приведенные непараметрические модели ЛДС могут служить основанием для
настройки параметров ныне существующих и действующих стандартных регуляторов П, ПИ, ПИД [7], которыми оснащены многие технологические процессы и
объекты в различных отраслях промышленности.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О непараметрическом моделировании динамических процессов
101
ЛИТЕРАТУРА
1. Эйкхофф П. Основы идентификации систем управления. Оценивание параметров и состояния. М.: Мир, 1875. 681 с.
2. Medvedev A.V. Identification and control for linear dynamic systems of unknown order //
Techniques IFIP, Prague: Verlag, 1975. P. 48−55.
3. Sergeeva N.A. To nonparametric models of nonlinear dynamic systems // CDAM. V. 3. Minsk:
BSU, 2001. P. 92−97.
4. Медведев А.В. Непараметрические системы адаптации. Новосибирск: Наука, 1983. 174 с.
5. Надарая Э.А. Непараметрическое оценивание плотности вероятностей и кривой регрессии. Тбилиси: Изд-во Тбилисского университета, 1983. 193 с.
6. Хардле В. Прикладная непараметрическая регрессия. М. Мир, 1993. 349 с.
7. Ротач В.Я. Теория автоматического управления. 5-е изд. М.: Изд. дом МЭИ, 2008. 396 с.
Сергеева Наталья Александровна
Цепкова Мария Викторовна
Сибирский федеральный университет
E-mail: sergena@list.ru; kidahime@mail.ru
Поступила в редакцию 1 февраля 2013 г.
Tsepkova Maria V., Sergeeva Natalia A. (Siberian Federal University. Krasnoyarsk). About nonparametric modeling of dynamic processes.
Keywords: weight function, nonparametric identification, the Dirac delta function, the integral of
Duhamel.
The problem of non-parametric modeling of linear dynamic processes is discussed. Discrete
form of the Duhamel integral for zero initial conditions is used as the model:
xs (t ) =
t / ∆t
∑ hs (t − τi )u (τi )∆τ,
i =1
where hs(t) is the assessment of the weight function, u(τ) – input action, ∆τ – time-step discretization, τi = i∆τ – the value of time discretization.
As an estimate of the weight function is used nonparametric regression estimator. By definition: the weighting function is a reaction to the system input action in the δ-function form. In this
paper, as an approximation of δ-function system is used:
H , t ∈ [0, ∆T + ∆t ];
u (t ) =
0, t ∉ [0, ∆T + ∆t ].
Input effect can be given through the width of the interval оr through height of level. These
methods have different input δ∆ parameters, in the first case, the width of the interval is given and
height of level is defined, in the second case, the height of level is fixed and the width of the interval is defined. The accuracy of the weighting function depends on these parameters, so when
the input effect is defined with the width of the interval, weight function is closer to the true value
than the other way.
If the estimate of the weight function is used in the simulation, which is as close to the true
value, then the model is effective in determining the system response to arbitrary input action.
This method is applicable for modeling linear dynamic systems, without reference to the order of
equation of the describing system.
{
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 2(23)
УДК 004.392, 004.93’1
Н.Х. Фан, Т.Т. Буй, В.Г. Спицын
РАСПОЗНАВАНИЕ ЖЕСТОВ НА ВИДЕОПОСЛЕДОВАТЕЛЬНОСТИ
В РЕЖИМЕ РЕАЛЬНОГО ВРЕМЕНИ НА ОСНОВЕ ПРИМЕНЕНИЯ
МЕТОДА ВИОЛЫ – ДЖОНСА, АЛГОРИТМА CAMSHIFT, ВЕЙВЛЕТПРЕОБРАЗОВАНИЯ И МЕТОДА ГЛАВНЫХ КОМПОНЕНТ
Предложен новый алгоритм распознавания жестов на цифровых изображениях, основанный на совместном применении вейвлет-преобразования и метода главных компонент. Представлены результаты тестирования работы
предложенного алгоритма. Показано, что использование указанного алгоритма дает возможность эффективного распознавания жестов на цифровых
изображениях. Предложен оригинальный комплексный алгоритм, основанный на методе Виолы – Джонса, алгоритме CAMShift, вейвлет-преобразовании и методе главных компонент, предназначенный для распознавания жестов на видеопоследовательности. На основе проведенных численных экспериментов установлено, что предложенный алгоритм позволяет распознавать
жесты на видеопоследовательности в режиме реального времени.
Ключевые слова: Распознавание жестов, метод Виолы – Джонса, алгоритм CAMShift, вейвлет-преобразование, метод главных компонент.
Распознавание жестов является одной из наиболее сложных и актуальных задач в области обработки изображений. Системы распознавания жестов предназначены для идентификации определенных человеческих жестов с целью использования их для передачи информации или для управления различными устройствами. В данной работе рассматривается задача распознавания жестов на цифровых изображениях и видеопоследовательности в режиме реального времени.
Для решения задачи распознавания объектов на видеопоследовательности необходимо решить задачу поиска и отслеживания объектов. Метод Виолы – Джонса [1, 2] является самым популярным методом для поиска области объектов на
изображении, из-за его высокой скорости и эффективности. Детектор Виолы –
Джонса основан на трех главных идеях: интегральном представлении изображения, методе построения классификатора на основе алгоритма адаптивного бустинга (AdaBoost) и методе комбинирования классификаторов в каскадную структуру. Эти идеи позволяют построить детектор, способный работать в режиме реального времени. Информация о статистическом распределении цветовой информации изображения также нашла применение в алгоритмах отслеживания объектов. Так, в 1998 г. Гарри Брадски создал алгоритм CAMShift (Continuously Adaptive
MeanShift) [3], который на основе цветовой информации был способен отслеживать объекты.
Процесс распознавания объектов обычно состоит из двух этапов: первый этап
– извлечение и сохранение признаков известных объектов в базу данных, второй
этап – сравнение признаков объектов с признаками, находящимися в базе данных.
В настоящее время установлено, что вейвлет-преобразование является хорошим
способом для получения характеристик изображения. В данной работе используются вейвлет-преобразования Хаара и Добеши для извлечения признаков жестов
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Распознавание жестов на видеопоследовательности в режиме реального времени
103
на изображениях. В задаче распознавания объектов метод главных компонент успешно применяется в процессе сравнения компонент, характеризующих неизвестное изображение, с компонентами, соответствующими известным изображениям.
Целью данной работы являются создание нового алгоритма, основанного на
применении вейвлет-преобразования и метода главных компонент для распознавания жестов на цифровых изображениях, и разработка оригинального комплексного алгоритма, основанного на применении метода Виолы – Джонса, алгоритма
CAMShift, вейвлет-преобразования и метода главных компонент для распознавания жестов на видеопоследовательности в режиме реального времени.
1. Метод Виолы – Джонса
Метод был разработан и представлен в 2001 г. Полом Виолой и Майклом
Джонсом и до сих пор эффективен для поиска объектов на цифровых изображениях и видеопоследовательностях в режиме реального времени [1, 2]. Основной
его идеей является использование каскада простых классификаторов – детекторов
характеристик вместо одного сложного классификатора. На базе этой идеи возможно построение детектора, способного работать в режиме реального времени.
Характеристики используются вместо непосредственных значений пикселей по
многим причинам. Основной причиной является то, что характеристики могут
описывать те знания о классе объектов, которые трудно выявить на конечном
числе обучающих данных. Вторая важная причина использования характеристик:
системы, построенные на их основе, работают гораздо быстрее, чем системы, работающие напрямую с пикселями.
1.1. Интегральное представление изображений
Для того чтобы рассчитывать яркость прямоугольного участка изображения,
используется интегральное представление [4]. Оно часто используется и в других
методах, например в вейвлет-преобразованиях, Speeded up robust feature (SURF),
фильтрах Хаара и многих разработанных алгоритмах. Интегральное представление позволяет быстро рассчитывать суммарную яркость произвольного прямоугольника на данном изображении, причем время расчета не зависит от площади
прямоугольника.
Интегральное представление изображения представляет собой матрицу, совпадающую по размерам с исходным изображением. В каждом ее элементе хранится сумма интенсивностей всех пикселей, находящихся левее и выше данного
элемента. Элементы матрицы рассчитываются по следующей формуле:
I ( x, y ) =
∑
i ( x′, y ′),
x′≤ x , y ′≤ y
где I(x,y) – значение точки (x,y) интегрального изображения; i(x,y) – значение интенсивности исходного изображения. На основе применения интегрального представления изображения вычисление признаков одинакового вида, но с разными
геометрическими параметрами, происходит за одинаковое время.
Каждый элемент матрицы I(x,y) представляет собой сумму пикселей в прямоугольнике от i(0,0) до i(x,y), т.е. значение каждого элемента I(x,y) равно сумме
значений всех пикселей левее и выше данного пикселя i(x,y). Расчет матрицы занимает линейное время, пропорциональное числу пикселей в изображении, и его
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
104
Н.Х. Фан, Т.Т. Буй, В.Г. Спицын
можно производить по следующей формуле:
I ( x, y ) = i ( x, y ) − I ( x − 1, y − 1) + I ( x, y − 1) + I ( x − 1, y ).
Интегральное представление имеет интересную особенность. По интегральной
матрице можно очень быстро вычислить сумму пикселей произвольного прямоугольника.
1.2. Хаар-подобные характеристики
С точки зрения необходимости использования достаточно простых алгоритмов
получения признаков, перспективным является применение хаар-подобных характеристик (Haar wavelet-like features), представляющих собой результат сравнения яркостей в двух прямоугольных областях изображения. В частности, как уже
отмечалось выше, Виола и Джонс предложили использовать три вида характеристик. Значением характеристики из двух прямоугольников является разница между суммой пикселей в этих прямоугольных областях. Области имеют одинаковый
размер и форму и по горизонтали и по вертикали.
Предположим, что задано множество объектов A и множество допустимых ответов B. Пусть g:A→B называется решающей функцией. Решающая функция g
должна допускать эффективную компьютерную реализацию, по этой причине её
также называют алгоритмом. Признак (feature) f объекта a – отображение f:A→Df ,
где Df – множество допустимых значений признака. В частности, любой алгоритм
g:A→B также можно рассматривать как признак. Если задан набор признаков
f1,…, fn, то вектор x = (f1(a),…, fn(a)) называется признаковым описанием объекта
a∈A. Признаковые описания допустимо отождествлять с самими объектами. При
этом множество A = Df1×…×Dfn называют признаковым пространством [5].
Вычисляемым значением такого признака будет
F = U −V ,
где U – сумма значений яркостей точек, закрываемых светлой частью признака;
V – сумма значений яркостей точек, закрываемых темной частью признака. Для
их вычисления используется понятие интегрального изображения. Хаар-подобные
признаки описывают значение перепада яркости по оси X и Y изображения соответственно.
1.3. Метод построения классификатора
на основе алгоритма бустинга
Бустинг – комплекс методов, способствующих повышению точности аналитических моделей. Бустинг (boosting) означает дословно «усиление» «слабых» моделей – это процедура последовательного построения композиции алгоритмов
машинного обучения, когда каждый следующий алгоритм стремится компенсировать недостатки композиции всех предыдущих алгоритмов. Идея бустинга была
предложена Робертом Шапиро (Schapire) в конце 90-х гг. прошлого века [6], когда
надо было найти решение вопроса о том, каким образом, имея множество плохих
(незначительно отличающихся от случайных) алгоритмов обучения, получить
один хороший.
В результате работы алгоритма бустинга на каждой итерации формируется
простой классификатор вида
⎧1, если p j f j ( z ) < p j θ j ,
h j ( z) = ⎨
иначе,
⎩0,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Распознавание жестов на видеопоследовательности в режиме реального времени
105
где pj – показывает направление знака неравенства; θj – значение порога; fj(z) –
вычисленное значение признака; z – окно изображения размером 20×20 пикселей.
Полученный классификатор имеет минимальную ошибку по отношению к текущим значениям весов, задействованным в процедуре обучения для определения
ошибки.
Развитием данного подхода явилась разработка более совершенного семейства
алгоритмов бустинга AdaBoost (адаптивное улучшение), осуществленная Йоавом
Фройндом и Робертом Шапиро в 1999 г. В AdaBoost можно использовать произвольное число классификаторов и производить обучение на одном наборе примеров, поочередно применяя их на различных шагах. В методе Виолы – Джонса вариант AdaBoost используется как для выбора особенностей, так и для обучения
классификатора. В его оригинальной форме обучающий алгоритм AdaBoost используется для повышения эффективности классификации простого (иногда называемого слабым) обучающего алгоритма.
Для повышения скорости обнаружения используется каскадная структура, фокусирующая свою работу на наиболее информативных областях изображения.
Каскад состоит из слоев, которые представляют собой классификаторы, обученные с помощью процедуры бустинга.
2. Алгоритм отслеживания объекта CAMShift
Алгоритм CAMShift был создан Гарри Брадски в 1998 г. и способен отслеживать лица [3]. Он комбинирует алгоритм отслеживания объекта Mean Shift, основанный на карте вероятности цвета кожи, с адаптивным шагом изменения размера
области отслеживания. Вероятность цвета кожи каждого пикселя изображения
определяется методом Histogram Backprojection, основанным на цвете, представленном в виде цветового тона (Hue) модели HSV. Так как алгоритм CAMShift способен отслеживать лица на основе вероятности цвета кожи, то он может применяться для отслеживания руки.
Преимуществами данного алгоритма являются: низкие требования к вычислительным ресурсам, гибкие настройки точности позиционирования, возможность
работы в различных условиях освещенности. Также дополнительным преимуществом алгоритма является возможность работы в условиях частичного перекрытия
отслеживаемого объекта. Указанные выше свойства алгоритма обусловлены использованием модели объекта, построенной на основе гистограммы яркости и
цвета, а также использованием процедуры Mean Shift для точного позиционирования положения объекта.
3. Вейвлет-преобразование
Вейвлет-преобразование широко используется для анализа нестационарных
процессов. Оно показало свою эффективность для решения широкого класса задач, связанных с обработкой изображения. Коэффициенты вейвлет-преобразования содержат информацию об анализируемом процессе и используемом вейвлете. Поэтому выбор анализирующего вейвлета определяется тем, какую информацию необходимо извлечь из процесса. Каждый вейвлет имеет характерные особенности во временной и частотной областях, поэтому иногда с помощью разных
вейвлетов можно полнее выявить и подчеркнуть те или иные свойства анализируемого процесса.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
106
Н.Х. Фан, Т.Т. Буй, В.Г. Спицын
В работах [7, 8] представлены разложение изображения и извлечение его признаков для классификации изображений самолетов на основе применения вейвлет-преобразования Хаара и многослойной нейронной сети. В данной работе используются вейвлет-преобразования Хаара и Добеши для извлечения признаков
изображения жестов. Пример применения вейвлет-преобразования Добеши для
извлечения признаков изображения жеста представлен на рис. 1.
а
б
Рис. 1. Пример извлечения признаков жеста: исходное изображение жеста (а);
результат после применения вейвлет-преобразования Добеши (б)
4. Метод главных компонент
Метод главных компонент (Principal Component Analysis, PCA) – один из наиболее распространенных методов для уменьшения размерности данных, потери
наименьшего количества информации. Он заключается в линейном ортогональном преобразовании входного вектора P размерности N в выходной вектор Q размерности M, M<N. Компоненты вектора Q являются некоррелированными, и общая дисперсия после преобразования остаётся неизменной.
Вычисление главных компонент сводится к вычислению собственных векторов и собственных значений ковариационной матрицы, которая рассчитывается
для изображения. Сумма главных компонент, умноженных на соответствующие
собственные векторы, является реконструкцией изображения. Для каждого изображения объекта вычисляются его главные компоненты. Обычно берётся от 5 до
200 главных компонент. Остальные компоненты кодируют мелкие различия между объектами и шум. Процесс распознавания заключается в сравнении главных
компонент неизвестного изображения с компонентами всех известных изображений. Из базы данных выбираются изображения-кандидаты, имеющие наименьшее
расстояние от входного (неизвестного) изображения [9].
5. Алгоритм распознавания жестов на цифровых изображениях
Целью данной работы является распознавание жестов на цифровых изображениях. Для решения этой задачи предложен новый алгоритм, основанный на применении вейвлет-преобразования и метода главных компонент. Предложенный
алгоритм состоит из двух процессов: извлечения и сохранения признаков известных жестов в базе данных и распознавания жестов. Процесс извлечения и сохранения признаков известных жестов происходит следующим образом:
Шаг 1. Преобразование изображения области жеста в полутоновое изображение.
Шаг 2. Изменение размера области жеста до 64×64 пикселей.
Шаг 3. Применение к полученному на шаге 2 изображению вейвлет-преобразования для извлечения признаков жеста (вейвлет-коэффициентов).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Распознавание жестов на видеопоследовательности в режиме реального времени
107
Шаг 4. Сохранение извлеченных признаков в базе данных.
В процессе распознавания неизвестного жеста осуществляются шаги 1–3, затем полученные признаки сравниваются с признаками, хранящимися в базе данных, на основе применения метода главных компонент. Функциональная схема
предложенного алгоритма представлена на рис 2.
Процесс извлечения признаков жеста
Изображение
области жеста
Преобразование
в полутоновое
изображение
Изменение размера
до 64 x64 пикселей
ВейвлетИзвлечение признаков коэффициенты
(вейвлетпреобразование)
Процесс распознавания жеста
Изображение
области жеста
Процесс извлечения
признаков жеста
Сравнение подобия
признаков (метод главных
компонент)
База данных
Результат
Рис. 2. Функциональная схема предложенного алгоритма распознавания жестов
6. Алгоритм распознавания жестов на видеопоследовательности
В данной работе также рассматривается задача распознавания жестов на видеопоследовательности в режиме реального времени. Для решения этой задачи
предложен оригинальный комплексный алгоритм, основанный на применении метода Виолы – Джонса, алгоритма CAMShift, вейвлет-преобразования и метода
главных компонент. Процесс распознавания жестов на видеопоследовательности
происходит следующим образом:
Шаг 1. Запрос очередного видеофрейма. Преобразование видеофрейма в полутоновое изображение. Применение к полутоновому изображению метода Виолы – Джонса для поиска области руки.
Шаг 2. Если область руки обнаружена, то выполняется шаг 3. В обратном случае осуществляется возврат на шаг 1.
Шаг 3. Запрос очередного видеофрейма. Отслеживание области руки на основе применения алгоритма CAMShift.
Шаг 4. Если отслеживание осуществлено, то выполняется шаг 5. В обратном
случае происходит возврат на шаг 1.
Шаг 5. Выполнение процесса распознавания жеста (рис. 2).
Шаг 6. Возврат на шаг 3.
7. Эксперименты
Для тестирования работы предложенных алгоритмов создано программное
обеспечение на языке объектно-ориентированного программирования C# (Visual
studio 2010) с использованием библиотеки OpenCV. Программа протестирована на
ноутбуке с процессором Intel Core™2 Duo 2ГГц, объемом оперативной памяти
2 Гб, видеокамерой 1,3 Мп, передающей 30 кадров в секунду с разрешением
320×240.
При тестировании работы алгоритма распознавания жестов на цифровых изображениях используется часть базы данных Cambridge Gesture database [10]. Эта
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.Х. Фан, Т.Т. Буй, В.Г. Спицын
108
база изображений жестов состоит из 5 различных частей, изображения в которых
получены при различных условиях освещенности (рис. 3). В данной работе, все
жесты в базе данных делятся на 12 классов, представленных на рис. 4.
а
б
в
г
д
Рис. 3. Примеры изображений жестов каждой части базы данных для тестирования:
а – часть 1; б – 2; в – 3; г – 4; д – 5
Рис. 4. Примеры 12 классов, использующихся при распознавании жестов
на цифровых изображениях
Для каждой части создана база изображений жестов для тестирования, которая
содержит 200 изображений каждого класса (всего 12 × 200 = 2400 изображений).
Смещенная база изображений жестов из 5 частей для тестирования содержит 1000
изображений каждого класса (всего 12 × 1000 = 12000 изображений). Для каждой
части также создана база изображений жестов для обучения, которая содержит 20
изображений каждого класса (всего 12 × 20 = 240 изображений). Смещенная база
изображений жестов из 5 частей для обучения содержит 100 изображений каждого класса (всего 12 × 100 = 1200 изображений). В процессе тестирования применяются вейвлет-преобразования Хаара и Добеши. В таблице приведены результаты экспериментов по распознаванию жестов на цифровых изображениях.
Результаты распознавания жестов
База данных
Достоверность распознаваний жестов, %
База данных
Достоверность распознаваний жестов, %
Часть 1
Хаар
Добеши
Часть 2
Хаар
Добеши
Часть 3
Хаар
Добеши
94,63
90,96
89,46
93,67
90,17
87,58
Часть 4
Хаар
Добеши
Часть 5
Хаар
Добеши
Смещенная часть
Хаар
Добеши
92,33
90,17
93,30
90,79
87,63
92,57
При тестировании работы алгоритма распознавания жестов на видеопоследовательности используется 6 классов жестов, представленных на рис. 5. Примеры
результатов работы предложенного алгоритма представлены на рис. 6. Скорость
работы предложенного алгоритма составляет 30 кадров в секунду.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Распознавание жестов на видеопоследовательности в режиме реального времени
Рис. 5. Примеры 6 классов, использующихся при распознавании жестов
на видеопоследовательности
Рис. 6. Результаты работы предложенного алгоритма распознавания жестов
на видеопоследовательности
109
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
110
Н.Х. Фан, Т.Т. Буй, В.Г. Спицын
Заключение
Предложен и описан новый алгоритм на основе совместного применения
вейвлет-преобразования и метода главных компонент для распознавания жестов
на цифровых изображениях. Анализ результатов численных экспериментов позволяет сделать вывод об успешной работе созданного алгоритма, основанного на
применении вейвлет-преобразования и метода главных компонент, при распознавании жестов.
Предложен и описан оригинальный комплексный алгоритм, основанный на
применении метода Виолы – Джонса, алгоритма CAMShift, вейвлет-преобразования и метода главных компонент для распознавания жестов на видеопоследовательности. Результаты проведенных компьютерных экспериментов показали, что
предложенный оригинальный комплексный алгоритм позволяет эффективно распознавать жесты на видеопоследовательности в режиме реального времени.
ЛИТЕРАТУРА
1. Viola P., Jones M.J. Rapid object detection using a boosted cascade of simple features //
IEEE Conf. on Computer Vision and Pattern Recognition. Kauai, Hawaii, USA, 2001. V. 1.
P. 511–518.
2. Viola P., Jones M.J. Robust real-time face detection // International Journal of Computer
Vision. 2004. V. 57. No. 2. P. 137–154.
3. Bradski G.R. Computer vision face tracking for use in a perceptual user interface // Intel
Technology Journal. 1998, 2nd Quarter.
4. Гонсалес P., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2005. 1072 с.
5. Местецкий Л.М. Математические методы распознавания образов. М.: МГУ, ВМиК,
2002–2004. С. 42–44.
6. Freund Y., Schapire R.E. A Short introduction to boosting // J. Japanese Society for Artifical
Intelligence. September 1999. V. 14. No. 5. P. 771–780.
7. Буй Тхи Тху Чанг, Спицын В.Г. Разложение цифровых изображений с помощью двумерного дискретного вейвлет-преобразования и быстрого преобразования // Известия
Томского политехнического университета. 2011. Т. 318. № 5. С. 73–76.
8. Буй Тхи Тху Чанг, Фан Нгок Хоанг, Спицын В.Г. Алгоритмическое и программное обеспечение для классификации цифровых изображений с помощью вейвлет-преобразования Хаара и нейронных сетей // Известия Томского политехнического университета.
2011. Т. 319. № 5. С. 103–106.
9. Pearson K. On lines and planes of closest fit to systems of points in space // Philosophical
Magazine. 1901. V. 2. No. 6. P. 559–572.
10. Kim T.K., Wong S.F., Cipolla R. Cambrige Hand Gesture Data set. URL: http://www.iis.ee.ic.
ac.uk/~tkkim/ges_db.htm (дата обращения 10.02.2012).
Фан Нгок Хоанг, Буй Тхи Тху Чанг
Спицын Владимир Григорьевич
Томский политехнический университет,
E-mail: hoangpn285@gmail.com;
trangbt.084@gmail.com; spvg@tpu.ru
Поступила в редакцию 29 апреля 2012 г.
Phan N.H., Bui T.T.T., Spitsyn Vladimir G. (Tomsk Polytechnic University). Real-time hand gesture recognition base on Viola–Jones method, algorithm CAMShift, wavelet transform and
principal component analysis.
Keywords: Hand gesture recognition, method Viola–Jones, algorithm CAMShift, wavelet transform, principal component analysis.
The task of hand gesture recognition on digital images and in video sequence in real-time is
considered. A novel algorithm based on wavelet transform and principal component analysis is
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Распознавание жестов на видеопоследовательности в режиме реального времени
111
proposed for hand gesture recognition on digital images. The experiment results show that the
proposed algorithm has the high rate of hand gesture recognition.
A novel complex algorithm using Viola – Jones method, algorithm CAMShift, wavelet transform and principal component analysis is proposed for hand gesture recognition in video sequence. It is shown that use of the proposed algorithm has processing speed about 30 frames per
second and allows recognizing hand gesture video sequence in real time.
In this paper, a part of Cambridge Gesture database is used for testing the performance of
hand gesture recognition algorithm on digital images. This database consists of 5 parts. The contrast condition of each part is not the same. All the hand gestures are divided into 12 classes using
for recognition. For each part one hand gesture database, containing 200 images of each class
(summary 12×200 = 2400 images), is created for testing this algorithm. The combining testing
database of all 5 parts contains 1000 images of each class (summary 12×1000 = 12 000 images).
For each part one training database also is created. This training database contains 20 images of
each class (summary 12×20 = 240 images). The combining testing database of all 5 parts contains
100 images of each class (summary 12×100 = 1200 images). Testing results of the proposed algorithm show that the number of rightly recognized hand gestures is 94.63 %.
1/--страниц
Пожаловаться на содержимое документа