close

Вход

Забыли?

вход по аккаунту

?

379.Вестник Томского государственного университета. Управление, вычислительная техника и информатика №4 2013

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО
МИНИСТЕРСТВО
ОБРАЗОВАНИЯ УНИВЕРСИТЕТА
И НАУКИ РФ
Управление, вычислительная техника и информатика
2013
№ 4(25)
ВЕСТНИК
ТОМСКОГО
ГОСУДАРСТВЕННОГО
УНИВЕРСИТЕТА
УПРАВЛЕНИЕ,
ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА
И ИНФОРМАТИКА
TOMSK STATE UNIVERSITY
JOURNAL OF CONTROL AND COMPUTER SCIENCE
Научный журнал
2013
№ 4(25)
Свидетельство о регистрации: ПИ № ФС 77-29497
от 27 сентября 2007 г.
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2
Е.Д. Агафонов, Н.Ф. Орловская
РЕДАКЦИОННАЯ КОЛЛЕГИЯ ЖУРНАЛА
«ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА.
УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА»
Горцев А.М., д-р техн. наук, проф. (председатель); Смагин В.И., д-р техн. наук, проф.
(зам. председателя); Нежельская Л.А. канд. техн. наук, доц. (отв. секретарь); Агибалов Г.П.,
д-р техн. наук, проф.; Дмитриев Ю.Г., д-р физ.-мат. наук, проф.; Домбровский В.В.,
д-р техн. наук, проф.; Змеев О.А., д-р физ.-мат. наук, проф.; Евтушенко Н.В., д-р техн. наук, проф.; Конев В.В., д-р физ.-мат. наук, проф.; Костюк Ю.Л., д-р техн. наук, проф.; Кошкин Г.М., д-р физ.-мат. наук, проф.; Матросова А.Ю., д-р техн. наук, проф.; Назаров А.А.,
д-р техн. наук, проф.; Параев Ю.И., д-р техн. наук, проф.; Поддубный В.В., д-р техн.
наук, проф.; Сущенко С.П., д-р техн. наук, проф.; Тарасенко Ф.П., д-р техн. наук, проф.;
Enzo Orsingher, Prof., University of Rome (Italy); Paolo Prinetto, Prof., Polytechnic Institute
Turine (Italy); Yervant Zorian, PhD, Vice President & Chief Scientist, Virage Logic Corp.,
Fremont, CA (USA).
Научный журнал «Вестник Томского государственного университета. Управление, вычислительная техника и информатика» был выделен в самостоятельное периодическое издание из общенаучного журнала «Вестник Томского государственного университета» в
2007 г. Журнал зарегистрирован в Федеральной службе по надзору в сфере массовых коммуникаций, связи и охраны культурного наследия (свидетельство о регистрации ПИ № ФС
77-29497 от 27 сентября 2007 г.), ему присвоен международный стандартный номер сериального издания (ISSN 1998-8605). С 2010 г. журнал входит в Перечень ВАК. Журнал выходит ежеквартально и распространяется по подписке, его подписной индекс 44031 в объединённом каталоге «Пресса России».
В журнале «Вестник ТГУ. УВТиИ» публикуются результаты теоретических и прикладных исследований вузов, научно-исследовательских, проектных и производственных организаций в области управления, вычислительной техники и информатики в технических,
экономических и социальных системах.
Тематика публикаций журнала:
• УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
• МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
• ОБРАБОТКА ИНФОРМАЦИИ
• ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
• ДИСКРЕТНЫЕ ФУНКЦИИ И АВТОМАТЫ
• ПРОЕКТИРОВАНИЕ И ДИАГНОСТИКА ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
Правила оформления статей приведены на сайте: http://vestnik.tsu.ru/informatics/
Адрес редакции:
634050, г. Томск, пр. Ленина, д.36, корп. 2, к. 201
Электронный адрес: http://vestnik.tsu.ru
Контактный тел./факс: (3822) 529-599
E-mail: vestnik_uvti@mail.tsu.ru
ООО «Издательство научно-технической литературы»
634050, Томск, пл. Новособорная, 1, тел. (3822) 533-335
Редактор Т.С. Портнова
Верстка Д.В. Фортеса
Изд. лиц. ИД № 04000 от 12.02.2001. Подписано к печати 06.12.2013.
Формат 70 × 100 1/16. Бумага офсетная. Печать офсетная. Гарнитура «Таймс».
Усл. п. л. 11,13. Уч.-изд. л. 12,46. Тираж 300 экз. Заказ № 56.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
СОДЕРЖАНИЕ
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Агафонов Е.Д., Орловская Н.Ф. Моделирование процесса окисления гексадекана............ 5
ОБРАБОТКА ИНФОРМАЦИИ
Багрова И.А. О датчике случайных величин, имеющих устойчивое распределение с
характеристическим показателем больше единицы ........................................................... 16
Вражнов Д.А., Николаев В.В., Шаповалов А.В. Сравнительный анализ методов
повышения устойчивости алгоритмов слежения на видео ................................................ 23
Горцев А.М., Леонова М.А., Нежельская Л.А. Сравнение МП- и ММ-оценок длительности мертвого времени в обобщенном асинхронном потоке событий.................... 32
Иванов Д.В., Усков О.В. Рекуррентное оценивание билинейных ARX-систем с помехой наблюдения во входном сигнале ............................................................................... 43
Карелин А.Е., Светлаков А.А. Скелетные разложения прямоугольных матриц и их
применение в структурной регуляризации плохо обусловленных систем линейных алгебраических уравнений............................................................................................. 51
Науменко В.В., Маталыцкий М.А. Анализ сетей с положительными и отрицательными заявками в переходном режиме........................................................................... 61
Медведев Г.А. О временной структуре доходности. 7. Новая версия.................................... 71
Моисеева Е.А., Назаров А.А. Исследование RQ-системы MMPP|GI|1 методом
асимптотического анализа в условии большой загрузки ................................................... 84
Первушин В.Ф. О непараметрической идентификации линейных динамических
объектов................................................................................................................................... 95
Рюмкин В.И. Процедура непараметрического оценивания функционалов от распределений стационарных последовательностей и ее применение в экономических и технических приложениях....................................................................................... 105
Чимитова Е.В., Ведерникова М.А., Галанова Н.С. Непараметрические критерии
согласия в задачах проверки адекватности моделей надежности по цензурированным данным..................................................................................................................... 115
Щелканов Н.Н. Новый метод разделения физической величины на две компоненты...... 125
ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
Дружинин Д.В. Комбинированные алгоритмы сжатия ключевых кадров экранного
видео ...................................................................................................................................... 129
СВЕДЕНИЯ ОБ АВТОРАХ ....................................................................................................... 137
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
TOMSK STATE UNIVERSITY
2013
Journal of Control and Computer Science
No. 4(25)
CONTENTS
MATHEMATICAL MODELLING
Agafonov E.D., Orlovskaya N.F. Mathematical simulation of hexadecane oxidation
processes..................................................................................................................................... 5
DATА PROCESSING
Bagrova I.A. On the stable-number generator design with characteristic exponent greater
than one........................................................................................................................ 16
Vrazhnov D.A., Nikolaev V.V., Shapovalov A.V. Comparative analysis of methods for
video tracking algorithms improvement........................................................................... 23
Gortsev A.M., Leonova M.A., Nezhelskaya L.A. The comparison of maximum
likelihood estimation and method of moments estimation of dead time value in a
generalized asynchronous flow of events ......................................................................... 32
Ivanov D.V., Uskov O.V. Recursive estimation of bilinear ARX systems with input-error ....... 43
Karelin A.E., Svetlakov A.A. Skeleton decomposition of rectangular matrices and its application for structural regularization of ill-conditioned systems of linear algebraic
equations ...................................................................................................................... 51
Naumenko V.V., Matalytski M.A. Analysis of networks with positive and negative messages at transient behavior .............................................................................................. 61
Medvedev G.A. On term structure of yield rates. 6. The new version ...................................... 71
Moiseeva E.A., Nazarov A.A. Researching of Retrial Queueing system MMPP|GI|1 by
using asymptotic analysis method on heavy load condition ............................................... 84
Pervushin V.F. On nonparametric models of linear dynamic objects ...................................... 95
Rjumkin V.I. Procedure of a nonparametric estimation of terminal type functionals and
its application in economic and engineering applications ................................................ 105
Chimitova E.V., Vedernikova M.A., Galanova N.S. Nonparametric goodness-of-fit
tests in testing adequacy of reliability models for right censored data ............................... 115
Shchelkanov N.N. A new method for dividing a physical parameter into components ............ 125
INFORMATICS AND PROGRAMMING
Druzhinin D.V. Composite algorithms for screen video key frames compression ..................... 129
BRIEF INFORMATION ABOUT THE AUTHORS................................................................... 137
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
УДК 665.7.03
Е.Д. Агафонов, Н.Ф. Орловская
МОДЕЛИРОВАНИЕ ПРОЦЕССА ОКИСЛЕНИЯ ГЕКСАДЕКАНА
Исследован процесс жидкофазного окисления гексадекана, традиционной
модели нефтяных углеводородов. Определен состав продуктов окисления с
помощью газовой хроматографии с масс-спектрометрическим детектированием (ГХ/МС). На основании полученных результатов количественного
анализа построено семейство регрессионных динамических моделей протекания процесса окисления. Анализ моделей для диффузионного режима указывает на наличие «колебательной составляющей» процесса, которая связана со спонтанным разложением гидропероксидов и не может быть учтена в
рамках предложенного подхода.
Ключевые слова: высокотемпературное окисление, гексадекан, кислородсодержащие органические соединения, динамическая модель.
Последовательность окислительного превращения углеводородов можно представить следующей схемой (рис. 1) [1, с. 148].
Спирты
Углеводороды
Кислоты
Гидропероксиды
Лактоны
Карбонильные
соединения
Рис. 1. Превращения веществ в процессе окисления углеводородов
Границей перехода от начальных стадий цепного окисления углеводородов к
глубоким стадиям принято считать максимальное содержание гидропероксидов.
Однако накопление гидропероксидов в окисляющемся топливе может сопровождаться экзотермическими процессами их разложения.
В серии работ [2–4] было показано, что высокотемпературное (150–170 °С)
жидкофазное окисление н-гексадекана не является изотермической реакцией, а
протекает по механизму «теплового взрыва». Согласно полученным данным, на
ранних стадиях процесса (15–20 мин) температура реакционной среды может увеличиться со 170 до 230 °С, при этом концентрация гидропероксидов в системе
быстро падает практически на порядок, а затем снова восстанавливается до прежнего уровня [2, с. 144]. Колебания концентрации гидропероксидов наблюдались
при изучении высокотемпературного (180 °С) окисления реактивных топлив
[4, с. 103]. В ходе изучения кинетики жидкофазного инициированного окисления
н-гептадекана в замкнутой системе по изменению давления кислорода в реакторе
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
6
Е.Д. Агафонов, Н.Ф. Орловская
исследователи [4, с. 102] наблюдали периодическое кратковременное повышение
давления из-за выброса летучих продуктов. Дальнейшие исследования показали,
что режим импульсного газовыделения наступает как при инициированном, так
и при автоокислении в области максимальных концентраций гидропероксидов
[4, с. 104].
Таким образом, концентрация пероксидных соединений не всегда дает представление об истинной картине окисления.
Окисляемость углеводородов в лабораторных условиях оценивают, регистрируя количество поглощенного кислорода, или по кривым расходования исходного
углеводорода и накопления основных продуктов реакции [5, с. 87].
Представляло интерес исследовать динамику накопления продуктов окисления
топлив на разных стадиях окисления. Это позволило бы по образующимся продуктам окисления более точно оценить окислительную стабильность топлив и
прогнозировать изменения их эксплуатационных свойств, не принимая во внимание концентрацию гидропероксидов и несоблюдение изотермического протекания окисления.
Общая скорость жидкофазного окисления любого органического соединения
зависит в основном от двух факторов: реакционной способности этого соединения
и скорости растворения кислорода. Взаимодействие этих факторов приводит к установлению в процессе реакции определенной концентрации растворенного кислорода, которая влияет на общую скорость окисления.
Выделяют два режима реакции окисления [5, с. 84]. Если скорость окисления
углеводорода мала по сравнению со скоростью подвода кислорода в зону реакции, то она зависит только от кинетических свойств углеводорода. Такой режим
называется кинетическим. Концентрация растворенного кислорода в топливе считается достаточно большой при [О2] ≥ 0,1 ммоль/л. При большой скорости реакции окисления по сравнению со скоростями транспорта кислорода в зону реакции
она не зависит от кинетических свойств окисляемого соединения. Такой режим
называется диффузионным.
В случае кинетического режима переход к диффузионному режиму может
быть осуществлен путем уменьшения скорости подачи кислорода и скорости перемешивания [5, с. 85].
1. Экспериментальная часть
Нами проведена экспериментальная оценка динамики накопления продуктов
окисления н-гексадекана – модели среднедистиллятных топлив – в разных режимах окисления. Оценивалась также динамика убыли гексадекана. Качественно
продукты глубокого окисления гексадекана были исследованы с помощью ГХ/МС
ранее [7, с. 153]. Окисление проводилось в установке барботажного типа с воздушным термостатированием (170 °С), описанной в [7, с. 149], с отбором проб реакционной массы и конденсата.
С помощью газовой хроматографии с масс-спектрометрическим детектированием (ГХ/МС) на хроматографе Agilent 7890A получены сведения о составе продуктов окисления.
Полученные результаты подвергнуты дальнейшей обработке, идентифицированные вещества распределены по классам кислородсодержащих соединений и
количеству углеродных атомов. Для каждого идентифицированного соединения
определена молекулярная масса и количество атомов углерода. Затем рассчитаны
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование процесса окисления гексадекана
7
следующие показатели: масса вещества в граммах; количество молей вещества;
молярный процент вещества; моли углеродных атомов вещества.
Результаты расчетов представлены в виде диаграмм накопления продуктов
окисления и убыли н-гексадекана.
2. Результаты и их обсуждение
Окисление гексадекана в кинетическом режиме приводит к образованию
сложной смеси кислородсодержащих соединений различного строения и молекулярной массы. Спирты, карбонильные соединения, кислоты и лактоны являются
промежуточными продуктами окисления. Их концентрации в ходе окисления
проходят через максимумы, смещенные по времени друг относительно друга.
Первыми из определяемых соединений достигают максимума спирты, затем альдегиды и кетоны и, наконец, кислоты. Конечными из определенных продуктами
окисления являются лактоны.
Наряду с реакциями окисления протекают также реакции деструкции, в результате чего появляются вещества с меньшим числом углеродных атомов (рис. 2).
Моли углеродных атомов
2
1,6
1,2
Спирты
Карбонильные соединения
Кислоты
Лактоны
0,8
0,4
0
2
6
4
8
Время окисления, ч
Моли углеродных атомов
Рис. 2. Диаграмма динамики накопления кислородсодержащих продуктов
при окислении н-гексадекана с расходом воздуха 23 л/ч (кинетический режим)
0,6
Спирты
Карбонильные
соединения
0,4
0,2
0
2
4
6
8
Время окисления, ч
Рис. 3. Диаграмма динамики накопления кислородсодержащих продуктов
при окислении н-гексадекана с расходом воздуха 6 л/ч (диффузионный режим)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
8
Е.Д. Агафонов, Н.Ф. Орловская
При длительном хранении топлив окисление протекает в условиях недостатка
кислорода, поэтому подробно исследовался процесс окисления н-гексадекана с
расходом воздуха 6 л/ч при 170 °С (рис. 3). Для таких условий протекания реакции наблюдалось образование исключительно 1-гексадеканола и кетонов С12 –
С16 (реализовались короткие цепочки окисления).
Из литературных данных известно об ингибирующем действии спиртов на
процесс окисления. На наш взгляд, по концентрации спиртов можно судить о степени окисленности топлива.
Полученные данные по окислению гексадекана в диффузионном режиме позволили заметить, что начало увеличения скорости расходования гексадекана по
времени совпадает с ростом скорости накопления спиртов. Соотношение содержания спиртов и карбонильных соединений (табл. 1) в окисленном гексадекане
максимально в точке роста убыли гексадекана. Следовательно, при достижении
спиртами максимума концентрации необходимо введение в топливо присадокантиоксидантов.
Таблица 1
Отношение содержания спиртов и карбонильных соединений в гексадекане,
окисленном с расходом воздуха 6 л/ч
Время окисления, мин
Отношение содержания спиртов и
карбонильных соединений, МУА
20
40
60
80
100
120
180
2,345
2,722
3,526
3,481
3,175
2,657
2,380
3. Математическая модель процесса окисления н-гексадекана
Проблемы математического моделирования процессов окисления углеводородов и пути их решения затронуты в [7, с. 149]. В настоящей работе модели окисления гексадекана в лабораторных условиях созданы с использованием известных
принципов, а именно, реализованы линейные динамические модели регрессионного типа. При построении математических моделей учтены особенности протекания изучаемого процесса и характер выборочных данных, полученных в результате экспериментов. Для построения моделей использовались следующие
предположения:
1. Основная цель синтеза моделей – определение количества основных продуктов окисления – спиртов и карбонильных соединений – в зависимости от времени при определенном режиме реакции окисления, заданном интенсивностью
подачи воздуха (23 или 6 л/ч).
2. Модели реализуются в классе непрерывных операторов с заданной структурой с точностью до набора параметров. Это позволяет в дальнейшем с их помощью решать задачи интерполяции и экстраполяции, а также находить точки экстремума функций изменения количества гексадекана и продуктов его окисления.
3. Основная единица, характеризующая количество гексадекана и продуктов
окисления, – моль углеродных атомов (муа).
4. Убыль гексадекана и накопление продуктов окисления для кинетического и
диффузионного режимов протекают в соответствии с различными законами.
5. Выборки измерений количества веществ, участвующих в процессе окисления, малы, что вызвано дороговизной экспериментов, выражающейся в основном
в высокой стоимости реактивов и лабораторных методов исследования.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование процесса окисления гексадекана
9
6. Малое количество выборочных значений (5 измерений с интервалом в 2 часа для кинетического режима окисления и 13 измерений с переменным интервалом для диффузионного режима) оказывают прямое влияние на выбор метода построения модели и ее точность.
7. Основные превращения веществ, указанные на рис. 1, определяют логику и
последовательность построения динамических моделей.
8. Среди продуктов окисления гексадекана присутствуют неопределенные
прибором вещества, количество которых рассчитывается исходя из материального баланса.
Для построения моделей использовался пакет MATLAB, который представляет
собой программную среду для математических вычислений с богатыми функциональными возможностями и средствами графического отображения результатов.
4. Этапы построения модели
Исходными данными для построения модели стали выборочные данные, представляющие собой последовательные измерения количества соответствующих
веществ с указанием времени наблюдения: для гексадекана {ti , uih } , i = 1, 2,… , n ,
для спиртов {ti , xis } , i = 1, 2,… , n , для карбонильных соединений {ti , xik } ,
i = 1, 2,… , n .
На первом этапе построена эмпирическая модель убыли гексадекана для заданного режима окисления. Предложено описать этот процесс экспоненциальной
зависимостью количества гексадекана от времени:
uh ( t ) = ( uh ( 0 ) − a ) e −bt + a ,
(1)
где a1 − установившееся значение количества гексадекана, b1 − параметр, характеризующий интенсивность убыли гексадекана, uh ( 0 ) − начальное количество
гексадекана. Для кинетического режима окисления гексадекана приняты следующие значения коэффициентов: a = 1, 79 , b = 0,98 , uh ( 0 ) = 5, 66 .
Для кинетического режима измеренное количество гексадекана для t = 6 признано недостоверным, так как оно не согласуется с логикой химических превращений для описываемого процесса. Увеличение количества гексадекана с течением времени для этого процесса маловероятно.
Процесс изменения количества спиртов описывается обыкновенным дифференциальным уравнением 2-го порядка следующего вида:
d 2 xs ( t )
dt
2
+ c1
dxs ( t )
+ c2 xs ( t ) = c3uh ( t ) ,
dt
(2)
где xs ( t ) − количество молей углеродных атомов для спиртов, c1 , c2 , c3 − не зависящие от времени коэффициенты уравнения, определяемые в результате оптимизации критерия качества:
Ws =
1 n
,
∑ ( xs ( ti , c1 , c2 , c3 ) − xis )2 → c1min
,c2 ,c3
n i =1
(3)
где n – объем выборки (n = 5).
Для оптимизации критерия использовался стандартный генетический алгоритм, реализованный в математическом пакете MATLAB. Генетический алгоритм
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Е.Д. Агафонов, Н.Ф. Орловская
10
реализует стратегию случайного поиска с адаптацией и относится к интеллектуальным алгоритмам оптимизации, основанным на подражании эволюционным
процессам в популяциях живых организмов. В многоэкстремальной задаче генетический алгоритм способен получить хорошее приближение к глобальному минимуму, что в полной мере необходимо для решения задачи нахождения оптимальных параметров приведенного дифференциального уравнения.
Оптимизация критерия качества (3) относительно параметров модели (2) привела к следующим их значениям: c1 = 1,8201 , c2 = 1,5035 , c3 = 0,3412 . Оптимальное значение критерия Wsopt = 1,6538 ⋅10−5 . Траектория изменения количества
спиртов при оптимальных значениях параметров приведена на рис. 4, а.
0,7
Количество спиртов, муа
0,6
0,5
0,4
0,3
0,2
а
0,1
Количество карбонильных соединений, муа
0
2
4
6
8
10
Время, ч
2,5
2
1,5
1
б
0,5
0
2
4
6
8
10
Время, ч
Рис. 4. Модель изменения количества спиртов в кинетическом
режиме (а), модель изменения количества карбонильных соединений в кинетическом режиме (б)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование процесса окисления гексадекана
11
Для построения модели изменения количества карбонильных соединений
применялось уравнение
d 2 xk ( t )
+ c1
dxk ( t )
+ c2 xk ( t ) = c3uh ( t ) + c4 xs ( t ) .
dt
(4)
dt
Правая часть уравнения представляет собой линейную комбинацию процессов
изменения количества гексадекана и спиртов, которые рассматриваются как факторы, влияющие на процесс изменения количества карбонильных соединений.
Оптимизация проводилась с применением критерия
2
Wk =
1 n
.
∑ ( xk ( ti , c1 , c2 , c3 , c3 ) − xik )2 → c1 ,min
c2 ,c3 ,c3
n i =1
(5)
Модель при оптимальных параметрах c1 = 2,2297 , c2 = 0,0507 , c3 = 0,1317 ,
c4 = 0,5843 и значении критерия Wkopt = 0,0062 представлена на рис. 4, б.
Особый случай представляет моделирование процесса окисления гексадекана
в диффузионном режиме, когда подача воздуха была значительно меньше, чем в
кинетическом режиме, и составляла 6 л/ч. Процесс окисления в этом случае протекает с меньшей интенсивностью, что выражается в уменьшении порядка дифференциальных уравнений, описывающих процесс. Для описания процесса использование уравнений 2-го порядка не принесло значимого выигрыша в значениях критерия качества, поэтому в процессе построения моделей целесообразным
было применение уравнений 1-го порядка.
Экспоненциальная модель убыли гексадекана в диффузионном режиме реализована в виде (1) со следующими параметрами: a = 3,85 , b = 0,3 , uh ( 0 ) = 5, 66
(рис. 5, а).
Модель временной зависимости количества спиртов реализована следующим
оператором:
dxs ( t )
(6)
+ c1 xs ( t ) = c2 uh ( t ) .
dt
Критерий оптимизации модели совпадает с критерием (3) при учете количества параметров в модели и нового объема выборки. В результате оптимизации параметры модели и значение критерия приняли следующие значения: c1 = 0,1783 ,
c2 = 0, 0363 , Wsopt = 0,0022 (рис. 5, б).
Исследование моделей диффузионного режима привело к выводу, что измеренные данные в момент времени t = 7 недостоверны принятому способу построения модели. Это выражается в завышенном значении среднего квадрата
отклонения модели относительно выборочных данных. Предложено классифицировать измерение для t = 7 как выброс и исключить его из выборки. Оптимальная модель спиртов в диффузионном режиме с учетом уменьшенной выборки
с параметрами c1 = 0, 211 , c2 = 0, 0372 и значением критериальной функции
Wsopt = 9,7825 ⋅10−5 изображена на рис. 6, а. Точность построения модели по результатам анализа среднего квадрата отклонений возросла в случае исправленной выборки более чем в 20 раз.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Е.Д. Агафонов, Н.Ф. Орловская
12
Количество гексадекана, муа
6
5,5
б
5
4,5
4
3,5
0
2
4
6
8
10
Время, ч
Количество спиртов, муа
0,8
0,6
0,4
а
0,2
0
2
4
6
8
10
Время, ч
Рис. 5. Модель убыли гексадекана в диффузионном режиме (а),
модель спиртов в диффузионном режиме (б)
Модель изменения количества карбонильных соединений была построена в
соответствии со следующим уравнением:
dxk ( t )
(7)
+ c1 xk ( t ) = c2 uh ( t ) + c3 xs ( t ) .
dt
Критерий оптимизации модели совпал с критерием (5) с учетом количества
параметров в модели и объема выборки. В результате оптимизации параметры
модели и средний квадрат ошибок приняли следующие значения: c1 = 0.3684 ,
c2 = 0,0029 , c3 = 0,4369 , Wsopt = 0,0021 . Модель с оптимальными параметрами
представлена на рис. 6, б.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование процесса окисления гексадекана
13
0,7
Количество спиртов, муа
0,6
0,5
0,4
0,3
0,2
а
0,1
Количество карбонильных соединений, муа
0
2
4
6
8
10
Время, ч
0,8
0,6
0,4
0,2
0
б
2
4
6
8
10
Время, ч
Рис. 6. Модель спиртов в диффузионном режиме для уменьшенной выборки (12 точек) (а), модель карбонильных соединений в
диффузионном режиме для уменьшенной выборки (б)
Построенные модели для диффузионного режима окисления удовлетворительно описывают усредненное поведение процесса.
Заключение
В работе рассмотрен подход к построению регрессионных динамических моделей процесса окисления гексадекана. Осуществлена последовательная оценка
траекторий изменения количества гексадекана, спиртов и карбонильных соединений, выраженных в молях углеродных атомов. Для описания процессов использовались обыкновенные линейные дифференциальные уравнения первого и второго
порядков с последующим оцениванием параметров в результате оптимизации
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
14
Е.Д. Агафонов, Н.Ф. Орловская
среднеквадратического критерия качества генетическим алгоритмом. Модели
реализованы в математическом пакете MATLAB.
Основным препятствием для построения моделей стал недостаток измеренных
(выборочных) значений количества веществ в системе. Дороговизна химического
анализа явилась причиной измерений с большим временным интервалом. В результате достоверность полученных моделей может быть снижена, а их ценность
заключается не столько в «усреднении» экспериментальных фактов, сколько в
предоставлении гипотезы о характере протекания изучаемого процесса окисления
и его графической интерпретации.
Анализ построенных моделей (особенно для диффузионного режима, для которого мы располагали большим количеством измерений) указывает на наличие
«колебательной составляющей» процесса, которая связана со спонтанным разложением гидропероксидов в реакционной массе и не может быть учтена в рамках
предложенного подхода. Дальнейшие исследования предполагают расширение
представлений о характере протекания процесса.
Указанные предположения меняют логику и принципы построения моделей,
требуют применения других подходов и алгоритмов, что будет учтено в дальнейших исследованиях.
Итак, нашими исследованиями установлено, что образующиеся в результате
окисления углеводородов топлив спирты могут быть использованы в качестве
веществ-маркеров оценки степени окисленности топлив. Определение веществмаркеров в продуктах окисления углеводородных топлив позволяет оценить степень окисленности и прогнозировать необходимость введения присадкиантиоксиданта.
Изложенные закономерности важны для выяснения факторов, влияющих на
глубину окисления топлив.
ЛИТЕРАТУРА
1. Локтев С.М. и др. Высшие жирные спирты. М.: Химия, 1970. 328 с.
2. Паренаго О.П., Кузьмина Г.Н., Бакунин В.Н., Оганесова Э.Ю. Наноразмерные структуры
в процессе высокотемпературного окисления углеводородов смазочных масел // Российский химический журнал. 2008. № 4. С. 142−150.
3. Оганесова Э.Ю. и др. Влияние строения высших парафиновых углеводородов и их производных на механизм высокотемпературного жидкофазного окисления // Нефтехимия.
2009. Т. 49. № 4. С. 329−334.
4. Харитонов В.В. Влияние самоструктурирования реакционной среды на механизм глубокого окисления н-гептадекана // Нефтехимия. 2003. Т. 43. № 2. С. 97−104.
5. Березин И.В., Денисов Е.Т., Эммануэль Н.М. Окисление циклогексана. М.: Изд-во МГУ,
1962. 109 с.
6. Оганесова Э.Ю. и др. Влияние условий жидкофазного высокотемпературного окисления
гексадекана на механизм процесса // Нефтехимия. 2004. Т. 44. № 2. С. 119.
7. Безбородов Ю.Н., Орловская Н.Ф., Надейкин И.В., Шупранов Д.А. Изучение процессов
жидкофазного окисления реактивных топлив на моделях // Вестник Сибирского государственного аэрокосмического университета им. акад. Решетнева, 2009. № 4.
С. 149−153.
Агафонов Евгений Дмитриевич
Орловская Нина Федоровна
Сибирский федеральный университет, г. Красноярск
E-mail: agafonov@gmx.de, toigsming@mail.ru
Поступила в редакцию 5 мая 2012 г.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование процесса окисления гексадекана
15
Agafonov Evgeny D., Orlovskaya Nina F. (Siberian Federal University). Mathematical simulation of hexadecane oxidation processes
Keywords: high-temperature oxidation, hexadecane, oxygen-containing organic compounds, dynamic model.
It is considered that the boundary of the transition from initial stages of chain oxidation of hydrocarbons to the deep stages is a maximum of the hydroperoxides concentration. However, the
accumulation of the hydroperoxides may be accompanied by an exothermic process of their decomposition. Thus, the concentration of peroxide compounds gives not always an idea about the
true picture of oxidation.
Of interest is the dynamics of accumulation of oxidation products at different stages of oxidation. This would evaluate the oxidative stability of fuels depending on the composition of the oxidation products more accurately, and to predict what changes in their operational properties will
take place, not taking into account the concentration of hydroperoxides and non-isothermal flow
of oxidation.
Experimental estimation of the dynamics of the accumulation of products of oxidation of nhexadecane (as a model of middle-distillate petroleum fraction) in different modes oxidation at
170 Degrees was held. The dynamics of hexadecane loss was estimated also. We received the information about the products of oxidation by means of gas chromatography with mass spectrometric detection (GC/MS) by chromatograph Agilent 7890A.
Data oxidation of hexadecane in diffusion mode showed that the increase of the rate of loss of
hexadecane coincide with the growth of the speed of accumulation of the alcohols.
In our opinion, it is possible to judge about the degree of oxidation of the fuel by the concentrations of alcohols.
Based on the obtained results of the quantitative analysis, a family of regression dynamic
models of the process of oxidation is constructed. A sequential estimation of quantities (expressed
in molls of carbon atoms) of hexadecane, alcohols, and carbonyls, has been performed. For the
processes’ description ordinary linear differential equations of the 1st and 2nd order have been
used. One obtains equation parameters using genetic algorithm (GA) with MSE optimization criterion. Models and optimization procedure were implemented in MATLAB.
The complexity of modeling process is caused by small samples of hexadecane and oxidation
products. Indeed, the cost of the necessary reagents and laboratory analysis influence on the samples size (five measurement within 2-hour experiment duration in the kinetic mode, as well as 13
measurement for the diffusion mode). Therefore, the chosen modeling strategy and accuracy corresponds to samples limitation.
Analysis of the models for diffusion mode indicates the presence of a «oscillation part» of the
process, which is connected with the spontaneous decay of the hydroperoxides and cannot be
taken into account in the framework of the proposed approach.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
ОБРАБОТКА ИНФОРМАЦИИ
УДК 519.2
И.А. Багрова
О ДАТЧИКЕ СЛУЧАЙНЫХ ВЕЛИЧИН,
ИМЕЮЩИХ УСТОЙЧИВОЕ РАСПРЕДЕЛЕНИЕ
С ХАРАКТЕРИСТИЧЕСКИМ ПОКАЗАТЕЛЕМ БОЛЬШЕ ЕДИНИЦЫ
Описывается работа датчика, генерирующего устойчивые распределения.
В основу моделирования положена обобщенная ЦПТ. Предложены формулы
для определения параметров датчика.
Ключевые слова: моделирование случайной величины, устойчивые, распределения, распределение Парето.
При изучении и построении моделей различных явлений часто используется
нормальное распределение, зависящее от двух параметров, описывающих его.
Но нормальное распределение, в свою очередь, принадлежит к более широкому
классу устойчивых распределений, обладающих набором 4 параметров, благодаря
чему при их применении возможна более тонкая настройка модели под реальные
данные. Кроме того, использование нормального распределения не приводит к
удовлетворительным результатам для описания явлений, имеющих импульсный
характер, когда вероятность появления экстремального значения отлично от нуля.
Поэтому устойчивые распределения, главной особенность которых являются «тяжелые хвосты», нашли широкое применение во многих областях [1–3]. Например,
при описании и получении характеристик процессов в теории лазерного охлаждения атомов [4] и радиотехнике [5]. В [6] устойчивые распределения использовались для получения оптимального портфеля акций на основе методологии VaR.
В работе [7], применяя устойчивые распределения, авторы предлагают алгоритм
оценивания параметров регрессионных уравнений, обеспечивающий максимально
правдоподобное оценивание даже в ситуациях, когда распределение случайных
ошибок имеет большую дисперсию.
Таким образом, имеющаяся потребность построения моделей с использованием устойчивых распределений делает актуальной задачу разработки датчиков для
моделирования этих законов. Существует несколько подходов [8, 9] к моделированию одномерных устойчивых распределений. Наиболее часто применяется алгоритм, основанный на интегральном представлении Золотарева [10, 11]. Эти методы нельзя использовать для построения датчиков в многомерном случае, поскольку потребуется применение теоремы Коши в Z d, что является практически
невыполнимой задачей. Указанная проблема не возникает, если разработка датчика основана на обобщенной ЦПТ [5]:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О датчике случайных величин, имеющих устойчивое распределение
17
X 1 + ... + X n
d
⎯⎯
→ Y при n → ∞, α ∈ (1, 2) ,
(1)
bn1/ α
где Xj – центрированные независимые одинаково распределенные случайные величины со значениями из d-мерного евклидова пространства Rd, принадлежащие
области притяжения устойчивых законов, а нормирующий множитель b зависит
от формы параметризации устойчивой случайной величины Y.
Первым шагом в применении (1) является разработка датчика для одномерного случая. Таким образом, стоит задача получить такие значения параметра b,
чтобы распределение суммы Sn сходилась к распределению устойчивой случайной величины Y. Эту задачу можно решить через рассмотрение соответствующих
им характеристических функций. Характеристическая функция устойчивого распределения в форме (А) представляется следующим образом [3]:
πα
(2)
fY (t ) = exp −(σ A t )α ⎜⎛ 1 − iβ A tg
sign(t ) ⎞⎟ ,
2
⎝
⎠
Sn =
{
}
где Y – устойчивая случайная величина.
Следовательно, необходимо получить характеристическую функцию суммы Sn.
1. Характеристическая функция суммы Sn
Для моделирования двухстороннего устойчивого распределения использовалась смесь распределений Парето, которые являются наиболее простыми случайными величинами из области притяжения Y:
X j = pX +j + qX −j , p + q = 1 ,
где
(3)
X +j = X +j − MX + , X −j = X −j − MX − ,
а X +j и X −j имеют следующие функции распределения:
⎧
lα
⎧ rα
1
, x ≤ −l ,
−
⎪
⎪1 − , x ≥ r ,
α
FX + ( x) = ⎨ x α
и FX − ( x) = ⎨
x
⎪⎩0, x < r ,
⎪0, x > −l ,
⎩
где r и l – граничные значения, являющиеся параметрами масштаба.
Математические ожидания вычисляются по формулам
αr
αl
, MX − = −
.
MX + =
α −1
α −1
Так как Xj – независимые одинаково распределенные по Парето случайные
величины, то характеристическая функция их суммы равна произведению их характеристических функций fSn(t) = [fX(t/(bn1/α)]n. Поэтому сначала была вычислена
характеристическая функция нормированной суммы Sn из (1), в которой отцентрированные математическим ожиданием слагаемые Xj имеют вид (3)
n
t
t
f Sn (t ) = ⎡⎢ pf X + ⎛⎜ 1/ α ⎞⎟ + qf X − ⎛⎜ 1/ α ⎞⎤
⎟⎥ .
⎣
⎝ bn ⎠
⎝ bn ⎠⎦
Таким образом, было получено следующее выражение для характеристической
функции суммы Sn смеси распределений Парето:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
И.А. Багрова
18
tr
⎧ ⎛
⎞
(−itr )α Γ(2 − α, 1/ α ) −i t 2 r 2 π sign(t ) ⎟
2 2
⎪⎪ ⎜
t r
bn
2
f Sn (t ) = exp ⎨ p ⎜ 2
+
+
⎟+
2 (2 / α −1)
b 2 n(2 / α −1)
(α − 1)bα
⎟
⎪ ⎜⎜ 2b (α − 1) n
⎟
⎪⎩ ⎝
⎠
tl
⎛
⎞⎫
(itl )α Γ(2 − α, 1/ α ) i t 2 l 2 π sign(t ) ⎟⎪
⎜
t 2l 2
⎪
bn
2
+q ⎜ 2
+
+
⎟ ⎬ + Rn (t ),
2 (2 / α −1)
b 2 n(2 / α −1) ⎟ ⎪
(α − 1)bα
⎜ 2b (α − 1) n
⎜
⎟⎪
⎝
⎠⎭
где Γ(·,·) − верхняя неполная гамма-функция, а Rn(t) − остаточный член и Rn(t)→0
при n→∞.
2. Моделирование устойчивых случайных чисел в форме A
Теперь необходимо установить взаимосвязь между параметрами смеси распределений Парето и устойчивого закона. При n→∞ характеристическая функция
суммы Sn приобретает вид
− Γ(1 − α)
f Sn (t ) → exp
p (−itr )α + q (itl )α , n → ∞, ∀t ∈ R.
α
b
Применяя формулу для главного значения степени комплексного числа,
получим
πα α
⎧
⎫
α
α
⎞⎪
⎪ − Γ(1 − α) pr + ql cos 2 t ⎛
pr α − ql α πα
fY (t ) = exp ⎨
tg sign(t ) ⎟ ⎬ . (4)
⎜1 − i α
2
bα
pr + ql α
⎝
⎠⎪
⎪
⎩
⎭
Для того чтобы характеристическая функция суммы Sn имела в пределе вид
характеристической функции устойчивого распределения (2), необходимо определить параметр b следующим образом:
πα
⎛ pr α cos πα
⎞
ql α cos
⎟
t
r
t
l
1 ⎜
α
2 Γ(2 − α,
2 Γ(2 − α,
)+
)⎟ .
bk = α ⎜
(5)
1/
α
1/
α
1− α
σA ⎜ 1 − α
bk −1n
bk −1n
⎟
⎝
⎠
Как видно, параметр b зависит от t. Необходимо выбрать единственное значение b, поэтому потребовалось ввести меру качества аппроксимации fY(t) функцией
fSn(t). Размеры существенной области D = {t: t∈ [−tm, tm]}, в которой сравниваются
характеристические функции, находятся на основании равенства Парсеваля, применяемого в теории цифровой обработки сигналов [5], при этом должно выполняться
{
(
(
)
)}
γ(1/ α, 2σ A ⋅ tmα )
< 1 − ε tm ,
Γ(1/ α)
где γ(·, ·) – нижняя неполная гамма-функция, а параметр εtm выбран равным 10–3 и
отвечает за уровень энергии отброшенных высокочастотных составляющих
функции плотности fY(x). Значения границ существенной области помещены в
табл. 1.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О датчике случайных величин, имеющих устойчивое распределение
19
Таблица 1
Границы существенной области характеристической функции при σA= 1
α
tm
1,1
3
1,2
2,7
1,3
2,5
1,4
2,3
1,5
2,1
1,6
2
1,7
1,9
1,8
1,8
1,9
1,8
1,95
1,7
1,99
1,7
1,999
1,7
Порядок нахождения b следующий: для каждого tj из D по рекуррентной формуле (5) методом простой итерации до достижения точности εb=10–3 вычисляется
b(tj):
b = {bk* : |bk* − bk* −1| ≤ ε b }.
Затем из всех полученных b(tj) выбирается такое, которое удовлетворяет
bопт = arg min max f Sn (t j ) − fY (t j ) .
t j ∈D
b (t j )
Из (2) и (4) видно, что параметры смеси распределений Парето и параметры
устойчивого распределения связаны соотношениями
⎧ p + q = 1,
⎪ α
α
α
(6)
⎨ pr + ql = σ A ,
⎪ pr α − ql α = σ α ⋅ β .
⎩
A
A
3. Результаты моделирования
Для моделирования устойчивых случайных величин задаются следующие параметры: βA ∈ (−1; 1), σA > 0; p < 1. Можно показать, что разные p и q, r и l, удовлетворяющие системе (6), дают хорошее приближение для теоретической функции плотности.
При сравнении эмпирической и теоретической функций плотности fSn(x) и fY(x)
необходимо учитывать специфику поведения устойчивых распределений – «тяжелые хвосты». Поэтому было наложено следующее ограничение на диапазон
[xl, xr], в котором проверяется работа датчика. Граничные значения xl, xr должны
удовлетворять уравнению
fY ( x ) = ε f .
Параметр εf отвечает за размеры существенной области fY(x). При реализации
алгоритма был выбран уровень εf = 0,01. В этой области необходимо определить
шаг дискретизации. Для восстановления функции плотности в теории цифровой
обработки сигналов используют теорему Котельникова [5], которая устанавливает
границы для шага по оси x: ∆x ≤ 1/(2tm). Полагая ∆x = 1/(2tm), получим сетку значений {xj = xl + ∆x·j, j = 0,…,N}, где N = [(xr − xl)/∆x].
Для оценки качества аппроксимации fY(x) эмпирической функцией плотности
fSn(x) вычисляются следующие показатели:
1) максимальное отклонение функций
max AE = max fY ( x j ) − f Sn ( x j ) ;
xj
2) средняя абсолютная ошибка
MAE =
1 N
∑ fY ( x j ) − f S n ( x j ) ;
N + 1 j =0
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
И.А. Багрова
20
3) средняя абсолютная процентная ошибка
MAPE =
1 N fY ( x j ) − f S n ( x j )
⋅100 % .
∑
N + 1 j =0
fY ( x j )
В табл. 2 представлены параметры смеси распределений Парето и значения
функционалов ошибки для различных значений параметров α и βA при p = 0,5,
K = 105, n = 104. Отметим, что для отрицательных βA необходимо поменять местами значения r и l.
Таблица 2
Параметры смеси распределений Парето и значения функционалов ошибки
для различных значений параметров α и βA, σA=1, K = 105, n = 104,
p= 0,5 при β≠1, p=1 при β=1
α
β
r
l
b
maxAE
MAE
MAPE, %
1,2
0
0,25
0,75
1
1
1,204
1,594
1
1
0,787
0,315
-
1,6264
1,6263
1,6249
1,6265
0,009878
0,008067
0,009280
0,008247
0,001894
0,008067
0,002038
0,002122
0,0019
3,9253
3,4554
3,8062
1,5
0
0,25
0,75
1
1
1,16
1,452
1
1
0,825
0,397
-
1,7745
1,7735
1,7647
1,7745
0,010086
0,012438
0,013317
0,015652
0,003207
0,003472
0,004831
0,005233
4,7693
5,5148
4,9774
5,3763
1,7
0
0,25
0,75
1
1
1,140
1,390
1
1
1,140
0,442
-
1,8979
1,8957
1,8766
1,9031
0,011477
0,013808
0,024535
0,022852
0,003999
0,005252
0,008694
0,010870
4,8542
6,8994
7,9243
9,4221
0
0,25
0,75
1
0
0,25
0,75
1
1
1,125
1,343
1
1
1,121
1,332
1
1
0,859
0,482
1
0,863
0,491
-
2,0063
2,0027
1,9755
2,0495
2,0378
2,0338
2,0134
2,0889
0,019069
0,022860
0,032926
0,041990
0,013389
0,020848
0,042061
0,043147
0,008836
0,009066
0,015570
0,019988
0,007777
0,008471
0,018752
0,022561
7,6308
7,8948
11,0892
13,9168
6,5597
7,0071
12,4505
14,8206
1,9
1,95
Работа датчика продемонстрирована на рис. 1 и 2, где, кроме того, для сравнения представлена теоретическая функция плотности fY(x) и указана информация о
количестве слагаемых Xj − n, параметрах устойчивого закона, количестве сгенерированных устойчивых чисел K.
Из графиков, представленных на рис. 2, видно, что при α→2 предельные формулы для характеристической функции суммы Sn и полученное из них выражение
для поиска параметра b не дают необходимой точности аппроксимации, а следовательно, требуется уточнение формул при конечном n.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О датчике случайных величин, имеющих устойчивое распределение
β=0,25
0,3
0,3
а
β=0,75 →
б
←β =0
←β=0
β=1 →
0,2
Random
generator
Theoretical
σ=1
0,2
−4
−2
0
2
4
Random
generator
Theoretical
σ=1
β=0,75 →
0,1
0,1
0
−6
21
0
6 −6
β=1 →
−4
−2
0
2
4
6
Рис.1. График функций плотности сгенерированных чисел и устойчивой случайной
величины при разных βA в форме A при n = 104, K = 105, σA = 1; α = 1,2 (а), α = 1,5 (б)
0,3
0,3
а
0,2
б
Random
generator
Theoretical
σ=1
0,2
Random
generator
Theoretical
σ=1
0,1
0,1
0
−6
−4
−2
0
2
4
0
6 −6
−4
−2
0
2
4
6
Рис.2. График функций плотности сгенерированных чисел и устойчивой случайной
величины в форме A при n = 104, K = 105, βA = 0,75, σA = 1; α = 1,9 (а), α = 1,95 (б)
Заключение
В работе получены формулы для моделирования случайных величин, имеющих устойчивое распределение с характеристическим показателем α∈ (1,2) для
формы параметризации A. Работа датчика демонстрируется на графиках.
ЛИТЕРАТУРА
1. Золотарев В.М. Одномерные устойчивые распределения. М.: Наука, 1983. 304 с.
2. Rachev S., Mittnik S. Stable Paretian Models in Finance. Wiley, 2000. 855 p.
3. Samorodnitsky G. and Taqqu M.S. Stable Non-Gaussian Random Processes. New York:
Chapman and Hall, 1994. 632 p.
4. Барду Ф., Бушо Ж.-Ф., Аспе А., Коэн-Таннуджи К. Статистика Леви и лазерное охлаждение. Как редкие события останавливают атомы: пер. с англ. / под ред. В.П. Яковлева.
М.: ФИЗМАТЛИТ, 2006. 216 с.
5. Маслов О.Н. Устойчивые распределения и их применение в радиотехнике. М: Радио и
связь, 1994. 152 c.
6. Mittnik S., Rachev S., and Schwartz E. Value-at-risk and asset allocation with stable return
distributions // Allgemeines Statistisches Archiv. 2002. V. 86. No. 1. P. 53−68.
7. Денисов В.И., Тимофеев В.С. Устойчивые распределения и оценивание параметров регрессионных зависимостей // Известия Томского политехнического университета.
Томск: Изд-во ТПУ, 2011. Т. 318. № 2. С. 10−15.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
22
И.А. Багрова
8. Uchaikin V.V., Zolotarev V.M. Chance and Stability. Stable Distributions and their Applications. Utrecht: VSP, 1999. 594 p.
9. Janicki A., Weron A. Simulation and Chaotic Behavior of -Stable Stochastic Processes. New
York: Marcel Dekker, 1994. 355 p.
10. Chambers J., Mallows C., Stuck B. A method for simulating stable random variables // Journal
of the American Statistical Association. Theory and Methods Section. 1976. V. 71. No. 354.
P. 340−344.
11. Nolan J.P. Numerical calculation of stable densities and distribution functions // Commun.
Statist. Stochastic Models. 1997. V.13. P. 759−774.
Багрова Инна Александровна
Тверской государственный университет
E-mail: inna@tversu.ru
Поступила в редакцию 27 апреля 2012 г.
Bagrova Inna A. (Tver State University). On the stable-number generator design with characteristic exponent greater than one.
Keywords: modeling random variable, stable distributions, Pareto distribution.
The stable distribution random number generator with characteristic factor greater than one is
developed. Simulation algorithm is based on the General Central Limit Theorem according to that
stable distributions be limit distributions for normalised and centralised sum of independent and
identically distributed random variables from the domain of attraction for stable distributions:
X + ... + X
d
Sn = 1 1/ α n ⎯⎯
→ Y if n → ∞, α ∈ (1, 2) .
bn
As summands we use the Pareto mixtures whose carriers belong to the positive and negative
semi-axes. The limit equation for characteristic function of sum Sn was obtained. The relation for
parameters of stable distribution in (A) parameterization and Pareto distribution parameters was
obtained, as well as the expression for normalising factor b. Resulted characteristics – values for
three error functionals corresponding to Pareto mixtures with specified mixture parameters (r, l)
and (α, βA) parameters are given in the table. The simulation results are illustrated by the figures 1
and 2. Note that limit equations for Sn, , characteristic function and corresponding expression for b
when α→2 do not provide sufficient approximation accuracy.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
УДК 004.931;004.932
Д.А. Вражнов, В.В. Николаев, А.В. Шаповалов
СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ ПОВЫШЕНИЯ
УСТОЙЧИВОСТИ АЛГОРИТМОВ СЛЕЖЕНИЯ НА ВИДЕО
Проводится сравнительный анализ методов (на основе показателей Липшица, Ляпунова, критерия Forward – Backward) оценки качества работы алгоритмов слежения (Mean-Shift и Particle filter) для использования в задачах
видеонаблюдения. Исследуются потери объекта в видеопотоке, обусловленные перекрытием объекта слежения другими объектами или препятствиями;
схожестью по заданному признаку объекта и фона и др. Получены количественные оценки качества алгоритмов слежения.
Ключевые слова: алгоритмы слежения, Mean-Shift, Particle filter, видеонаблюдение.
Разработка трекеров – программно-аппаратных комплексов слежения за объектом на видеопоследовательности является одним из приоритетных направлений
в области компьютерного зрения [1]. Математически объект представляется некоторым набором числовых характеристик – вектором признаков, позволяющим обнаружить (детектировать) объект на одном из кадров видеоряда и затем осуществлять слежение за объектом в последующие моменты времени. Роль момента
времени в видеопоследовательности играет номер кадра.
Существует множество факторов, которые вносят искажения в характеристики
объекта на последовательных кадрах видеоряда и, тем самым, препятствуют непрерывному слежению за объектом. Такими факторами являются, например, изменение формы, размеров и цветовой гистограммы объекта, его освещенности и
др. В результате происходит потеря объекта и работа алгоритма слежения оказывается ненадежной.
Поясним смысл понятия надежности на примере алгоритма Mean-Shift [4].
В этом алгоритме характеристикой объекта является его цветовая гистограмма.
Поэтому если в какой-то момент времени гистограмма области вокруг объекта и
самого объекта становятся схожими – надежность слежения снижается. В этом
случае целесообразно переключиться на другой алгоритм слежения для увеличения времени надежного слежения за объектом, т.е. в идеальном случае от момента
его обнаружения на видео до выхода объекта из области наблюдения. Например,
можно использовать алгоритмы Particle filter [5], или KLT [6].
Для решения задачи увеличения времени надежного слежения, прежде всего,
необходимы критерии, позволяющие определять моменты времени, когда происходит сбой в процессе слежения.
В качестве критериев надежности используются пороговые условия при сравнении характеристик объекта в алгоритмах слежения. К внешним критериям отнесем критерий Forward – Backward (FB) [2], а также критерии, использующие
представление о трекере как о динамической системе. В работе [3] рассматривался критерий, основанный на условии существования траектории слежения за объектом. В этом критерии существенную роль играет аналог постоянной Липшица.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
24
Д.А. Вражнов, В.В. Николаев, А.В. Шаповалов
В данной работе в рамках представления трекера как динамической системы
предложен критерий надежности, использующий показатель Ляпунова. Проведено сравнение эффективности работы алгоритмов слежения particle filter и meanshift с помощью критерия FB и критериев, использующих показатель Липшица[3]
и показатель Ляпунова. Показано, что длительность непрерывного слежения может быть увеличена при соответствующем подборе критерия надежности для заданного алгоритма слежения.
Отметим, что оптимальная комбинация трекера и критерия надежности зависит от характеристик и особенностей видеоролика, а также от постановки задачи
слежения. Например, важную роль в системах видеонаблюдения играет скорость
работы алогритма. Для алгоритмов mean-shift и particle filter лучший результат в
определении момента сбоя в процессе слежения показали критерии, использующие показатель Липшица и показатель Ляпунова.
1. Постановка задачи
Пусть S = ( I t , I t +1..., I t + k ) – последовательность изображений, t – номер
кадра и x1(t) – участок изображения (объект) с набором характеристик
( x0 , y0 , R0 , G0 , B0 ) , определенный экспертом в момент времени t . Используя некоторый алгоритм слежения Tr ( x) , получаем координаты положения объекта на
следующих кадрах по правилу Tr ( x1 ) = ( x1 , y1 , R1 , G1 , B1 ) = x1 (t + 1) . С течением
времени объект может изменяться или перегораживаться другими объектами. С
точки зрения алгоритма слежение происходит за некоторой областью изображения с фиксированным либо непрерывно изменяющимся набором свойств, поэтому, если в рабочей области трекера появится область изображения со схожим набором свойств, без дополнительной информации об объекте трекер не сможет эти
области различить и произойдет коллизия (сбой). Наша задача состоит в том, чтобы предупредить коллизию и предпринять меры по коррекции работы трекера.
Для этого необходимо ввести некоторые критерии, характеризующие надежность
трекинга.
В данной статье будут рассмотрены 3 критерия надежности трекера:
1. Критерий Forward – Backward.
2. Показатель Липшица.
3. Критерий устойчивости Ляпунова.
На основе предложенных критериев изучим, как согласуются данные, что трекер стал ненадежным с наблюдениями эксперта.
1.1. Критерий Forward – Backward
Траекторию объекта представим в виде T f , k = ( xt , xt +1 ,..., xt + k ) , где индекс f
обозначает, что слежение производилось вперед (т.е. от кадра t до t + k ),
а индекс k указывает количество кадров, на которых отслеживался объект.
Наша цель заключается в оценке надежности траектории, заданной последовательностью изображений. Точка xt + k отслеживается назад до кадра t и
дает Tb, k = ( xˆt , xˆt +1 ,..., xˆt + k ) , где xˆt + k = xt + k . Ошибка FB (forward-backward –
вперед-назад) определяется как расстояние между этими двумя траекториями:
FB(T f , k | S ) = distance(T f , k , Tb, k ). Для сравнения траектории могут быть выбраны
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнительный анализ методов повышения устойчивости алгоритмов слежения
25
различные расстояния. Для простоты используется евклидово расстояние между
объектом в начальный момент времени и объектом, который покажет алгоритм
при слежении за объектом в обратном направлении:
distance(T f , k , Tb, k ) =|| xt − xˆt || .
Рис. 1. Способ расчета расстояния между траекториями (1)
Назовем distance (T f , k , Tb, k ) расстоянием FB.
1.2. Условие Липшица
Рассмотрим систему дифференциальных уравнений, описывающих алгоритм
слежения как динамическую систему:
x (t ) = f (t , x (t )) .
Решение этой системы описывает траекторию объекта на видеопоследовательности. Так как мы знаем точное положение объекта на первом кадре и при помощи алгоритма слежения можем отследить объект на последующие кадры – нам
известны x(t ) . В нашей задаче функция f определяется как малое приращение:
f (t , x (t )) ⇒
∂x (t ) x (t + ∆t ) − x (t ) ∆x (t )
=
=
∂t
∆t
∆t
где ∆t – разность номеров кадров, по которым вычисляются приращения ∆x (t ) .
Условие Липшица для трекера запишем в следующем виде:
| f (t , xi (t )) − f (t , x j (t )) | ≤ N | xi (t ) − x j (t ) | .
(2)
Здесь N − показатель Липшица (не зависит от времени и положений объектов);
разности имеют смысл расстояния между объектами.
Выразим аналог константы Липшица следующим образом:
| f (t , xi (t )) − f (t , x j (t )) |
N = max
.
| xi (t ) − x j (t ) |
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
26
Д.А. Вражнов, В.В. Николаев, А.В. Шаповалов
Условие (2) определяет надежность рассматриваемого алгоритма слежения.
Причем слежение надежно, если показатель Липшица N < 1 .
Рис. 2. Способ расчета показателя Липшица и показателя Ляпунова.
Здесь xt – объект, за которым ведется наблюдение, xj – область вокруг объекта
1.3. Условие Ляпунова
Как уже сказано выше, алгоритм слежения определяется как динамическая
система, в которой движущиеся объекты в видеоряде определяются координатами
xi (t ) , i = 1,..., I , где I – количество объектов;
x(t + 1) = f (t , x (t )) .
(2)
Введем для дискретного времени t систему в вариациях для (2) в виде
x (t ) = x0 (t ) + δx (t ) ,
где δx (t + 1) = L( x0 (t ))δx (t ) ; L( x0 (t )) – матрица 2 × 2 :
⎛ ∂X ( x )
⎞
L( x0 (t )) = ⎜⎜ α
x = x0 ( n ) ⎟
⎟,
⎝ ∂xβ
⎠
а x0 (t ) – «траектория» (закон движения) объекта, за которым ведется слежение.
Решение системы (2) устойчиво, если траектории с близкими начальными условиями остаются близкими с ростом времени. Показатель Ляпунова запишем в
виде
1
λ = lim sup log δx (t ) .
t →∞ δx (t ) t
0 0
Здесь δx (t ) – отклонение между исходным решением (объектом на кадре) и окрестностью объекта; t – время движения объекта. Таким образом, если λ < 0 , то
решение x0 (t ) динамической системы устойчиво.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнительный анализ методов повышения устойчивости алгоритмов слежения
27
2. Тестирование поведения критериев на различных данных
Тестирование критериев проводилось для алгоритмов слежения Mean-Shift и
Particle filter. Ниже на графиках отображены зависимости параметров, характеризующих надежность слежения от номера кадра (момента времени). Показатель
Липшица и расстояние FB нормированы на 2 для наглядности.
На рис. 3 и 4 приведены результаты тестов алгоритмов слежения за объектами,
Mean-Shift и Particle filter, для первого объекта на первом видеоролике.
Параметры надежности
2
1
0
–1
0
10
20
30
Номер кадра
40
50
Рис. 3. Зависимость параметров надежности от времени (номера кадра)
для алгоритма слежения Particle filter
Параметры надежности
2
1
0
–1
0
10
20
30
40
Номер кадра
Рис. 4. Зависимость параметров надежности от времени (номера кадра)
для алгоритма слежения Mean-Shift
50
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Д.А. Вражнов, В.В. Николаев, А.В. Шаповалов
28
Из рис. 3 видно, что показатели Липшица и Ляпунова говорят о надежном
слежении до 15 кадра. Расстояние FB показывает несколько пиков, первые из которых не соответствуют наблюдаемому. То есть расстояние FB принимает большие значения с самого начала, что соответствует нестабильному слежению, однако алгоритм слежения работал корректно. Алгоритм Mean-Shift потерял объект на
21 кадре, что соответствует скачку показателя Ляпунова на рис. 4.
На рис. 5−6 приведены результаты тестов алгоритмов слежения за объектами
Mean-Shift и Particle filter для второго объекта на втором видеоролике.
Параметры надежности
2
1,5
1
0,5
0
–0,5
0
10
20
30
40
50
Номер кадра
Рис. 5. Зависимость параметров надежности от времени (номера кадра)
для алгоритма слежения Particle filter
2
Параметры надежности
1,5
1
0,5
0
–0,5
–1
–1,5
0
10
20
30
40
Номер кадра
Рис. 6. Зависимость параметров надежности от времени (номера кадра)
для алгоритма слежения Mean-Shift
50
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнительный анализ методов повышения устойчивости алгоритмов слежения
29
Из рис. 5 следует, что алгоритм Particle filter на данном ролике работал некорректно, это сопровождается высокими рассматриваемыми в статье показателями
устойчивости. На рис. 6 показана корректность работы алгоритма Mean-Shift с
точки зрения критериев устойчивости. Расстояние FB показало надежное слежение до 7 кадра, а показатель Ляпунова и показатель Липшица до 13 кадра.
На рис. 7 и 8 приведены результаты тестов алгоритмов слежения за объектами
Mean-Shift и Particle filter для третьего объекта на третьем видеоролике.
2
Параметры надежности
1,5
1
0,5
0
–0,5
0
5
10
15
20
25
30
Номер кадра
Рис. 7. Зависимость параметров надежности от времени (номера кадра)
для алгоритма слежения Particle filter
Параметры надежности
2
1
0
–1
–2
0
5
10
15
20
25
Номер кадра
Рис. 8. Зависимость параметров надежности от времени (номера кадра)
для алгоритма слежения Mean-Shift
30
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
30
Д.А. Вражнов, В.В. Николаев, А.В. Шаповалов
Из рис. 7 видно, что алгоритм Particle filter на данном ролике работал некорректно начиная с третьего кадра, на что и указало высокое значение расстояния
FB. Поведение показателя Ляпунова и показателя Липшица говорят, что слежение
ненадежно начиная с четвертого кадра.
Для третьего объекта Mean-Shift следил надежно в течение 30 кадров. Показатель Ляпунова и постоянная Липшица принимают значения ниже пороговых, однако расстояние FB указывает на потерю объекта практически с самого начала,
что не соответствует действительности.
Заключение
В данной работе были проанализированы методы оценки (показатели Липшица, Ляпунова, критерий Forward – Backward) надежности алгоритмов слежения
за движущимися объектами и получены количественные характеристики данных
методов на различных видеороликах с камер видеонаблюдения. В качестве алгоритмов слежения были выбраны широко используемые Mean-Shift и Particle filter.
Из построенных зависимостей можно сделать вывод о том, что условие Липшица
и показатель Ляпунова позволяют определить момент начала неустойчивого трекинга, что необходимо при разработке програмных комплексов систем видеонаблюдения. Также следует отметить, что полученные характеристики устойчивости
для отдельных объектов коррелируют между собой (рис. 3), что может быть использовано для принятия коллективного решения в алгоритмах data fusion [7] с
целью повышения качества работы алгоритмов слежения.
Проведенные исследования показали, что критерий надежности нужно выбирать исходя из условий поставленной задачи – особенностей видеозаписи (например, степень контрастности объекта на фоне), а результат применения критерия
зависит от выбранного алгоритма слежения. Для алгоритмов Mean-shift и Particle
filter лучший результат в определении момента сбоя в процессе слежения показали критерии, использующие показатель Липшица и показатель Ляпунова.
ЛИТЕРАТУРА
1. Maggio E., Cavallaro A. Video Tracking: Theory and Practice. Somerset, San-Francisco:
Wiley&Sons, 2011.
2. Kalal Z., Mikolajczyk K., Matas J. Forward-backward error: automatic detection of tracking
failures // Int. Conf. on Pattern Recognition, 23−26 August, 2010. Istanbul, Turkey. P. 1−4.
3. Вражнов Д.А., Шаповалов А.В., Николаев В.В. О качестве работы алгоритмов слежения
за объектами на видео // Компьютерные исследования и моделирование. 2012. Т. 4.
№ 2. С. 303–313.
4. Comaniciu D., Ramesh V., Meer P Kernel-based object tracking // Transactions on Pattern
Analysis and Machine Intelligence (IEEE). 2003. V. 25. No. 5. P. 564−575.
5. Perez P., Hue C., Vermaak J., Gangnet M. Color-Based Probabilistic Tracking. ECCV, 2002.
6. Baker S. Matthews I. Lucas-Kanade. 20 years on: a unifying framework // Int. J. Computer Vision. 2004. V. 56. No. 3. P. 221–255.
7. Hall D.L., McMullen S.A.H. Mathematical Techniques in Multisensory Data Fusion Artech
House Inc., 2004.
Вражнов Денис Александрович
ООО «Томсклаб»
Николаев Виктор Владимирович
Шаповалов Александр Васильевич
Томский государственный университет
Е-mail: Vrazhnov@tomsklabs.com; shpv@phys.tsu.ru
Поступила в редакцию 5 июля 2013 г.
Vrazhnov Denis A. (Tomsklabs PTE LTD), Nikolaev Viktor V., Shapovalov Alexander V.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнительный анализ методов повышения устойчивости алгоритмов слежения
31
(Tomsk State University). Comparative analysis of methods for video tracking algorithms
improvement.
Keyword: video tracking, mean-shift, particle filter, dynamic systems
In this paper we made a comparative analysis of methods (based on Lipschitz index, Lyapunov index and Forward – Backward criterion) for evaluation of video tracking algorithms (MeanShift, Particle filter). Developing tracker – a software and hardware system for object tracking in
video sequence, is one of major tasks in computer vision. Mathematically, object is modeled by
set of numerical characteristics – feature vector, which allows detecting object on a video frame
and then tracking this object on further times.
We investigate object lost in video sequence, due to occlusions with another objects and/or
obstacles; similarity by feature vector of tracking object and background and etc. As criteria of
tracker reliability we suggest to use threshold conditions when comparing object’s feature vector
in tracking algorithms. Let’s call external Forward – Backward criterion and others, based on consideration tracker as dynamic system (Lipschitz index, Lyapunov index). Quantitative estimates
of tracking algorithms evaluations are obtained. These allow using suggested indices for combining different tracking algorithms and feature vectors in data fusion frameworks.
This research is done in Tomsklabs PTE LTD.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
УДК 519.21
А.М. Горцев, М.А. Леонова, Л.А. Нежельская
СРАВНЕНИЕ МП- И ММ-ОЦЕНОК ДЛИТЕЛЬНОСТИ МЕРТВОГО
ВРЕМЕНИ В ОБОБЩЕННОМ АСИНХРОННОМ ПОТОКЕ СОБЫТИЙ1
Изучается обобщенный асинхронный поток событий, являющийся одной из
адекватных математических моделей информационных потоков заявок в
цифровых сетях интегрального обслуживания (ЦСИО). Поток функционирует в условиях непродлевающегося мертвого времени, когда длительность
мертвого времени – неизвестная фиксированная величина. Проводится
сравнение качества получаемых (по наблюдениям за моментами наступления событий потока) оценок длительности мертвого времени методом максимального правдоподобия (МП-оценки) и методом моментов (ММ-оценки).
Ключевые слова: обобщенный асинхронный поток событий, непродлевающееся мертвое время, МП-оценки, ММ- оценки, длительность мертвого
времени.
Настоящая статья является продолжением исследований обобщенного асинхронного потока событий (далее – поток), начатых в статьях [1−5]. Изучаемый
поток относится к классу дважды стохастических потоков событий, интенсивность которых есть кусочно-постоянный случайный процесс с конечным числом
состояний, и является одной из адекватных математических моделей информационных потоков сообщений, функционирующих в ЦСИО [6]. Этот класс потоков
принято называть МС – потоками либо МАР – потоками событий. В [7] приведена
классификация МС-потоков событий и установлена связь между МС-потоками и
МАР-потоками событий. Наиболее полная литература по изучаемым типам МСпотоков приведена в [8].
В реальных ситуациях функционирование систем массового обслуживания, в
частности ЦСИО, осложнено тем, что последнее, как правило, происходит в условиях частичной либо полной неопределенности относительно параметров или состояний информационных потоков сообщений. В таких ситуациях наиболее рациональным является применение адаптивных систем массового обслуживания,
которые в процессе функционирования оценивают неизвестные параметры либо
состояния входящих потоков событий и изменяют дисциплины обслуживания в
соответствии с полученными оценками [9]. Вследствие этого возникают задачи
оценки состояний [10] и оценки параметров [11] по наблюдениям за моментами
наступления событий.
Одним из факторов, влияющим на потерю событий, в частности в ЦСИО, является мертвое время регистрирующих приборов [12], которое порождается зарегистрированным событием. Другие же события, наступившие в течение периода
мертвого времени, недоступны наблюдению (теряются). Можно считать, что этот
период продолжается некоторое фиксированное время (непродлевающееся мертвое время). В качестве примера приведем протокол CSMA/CD – протокол случай1
Работа выполнена в рамках государственного задания Минобрнауки РФ на проведение
научных исследований в Томском государственном университете на 2012−2014 годы, задание 8.4055.2011.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнение МП- и ММ-оценок длительности мертвого времени
33
ного множественного доступа с обнаружением конфликта, широко используемого
в компьютерных сетях. В момент регистрации (обнаружения) конфликта на входе
некоторого узла сети по сети рассылается сигнал «заглушки» («пробки»); в течение времени рассылки сигнала «заглушки» заявки, поступившие в данный узел
сети, получают отказ в обслуживании и направляются в источник повторных вызовов. Здесь время, в течение которого узел сети закрыт для обслуживания заявок,
поступающих в него после обнаружения конфликта, можно трактовать как мертвое время прибора, регистрирующего конфликт в узле сети.
Для того чтобы оценить потери событий потока, возникающие из-за эффекта
мертвого времени, необходимо оценить его длительность.
В настоящей статье производится сравнение оценок длительности мертвого
времени в обобщенном асинхронном потоке событий, полученных методом максимального правдоподобия (МП-оценки) и методом моментов (ММ-оценки).
1. Постановка задачи
Рассматривается обобщенный асинхронный дважды стохастический поток событий, интенсивность которого есть кусочно-постоянный случайный процесс λ(t)
с двумя состояниями λ1 и λ2 (λ1> λ2). В течение временного интервала, когда
λ(t) = λi , имеет место пуассоновский поток событий с интенсивностью λi , i = 1, 2.
Переход из первого состояния процесса λ(t) во второе (из второго в первое) может
осуществляться в произвольный момент времени. При этом длительность пребывания процесса λ(t) в i-м состоянии распределена по экспоненцильному закону с
параметром αi , i = 1, 2. При переходе процесса λ(t) из первого состояния во второе
инициируется с вероятностью p (0 ≤ p ≤ 1) дополнительное событие во втором состоянии (т.е. сначала осуществляется переход, а затем инициируется дополнительное событие). Наоборот, при переходе процесса λ(t) из второго состояния в
первое инициируется с вероятностью q (0 ≤ q ≤ 1) дополнительное событие в первом состоянии. При этом блочная матрица инфинитезимальных коэффициентов
примет вид
−(λ1 + α1 ) (1 − p )α1 λ1 pα1
= D0 D1 .
D=
(1 − q )α 2 −(λ 2 + α 2 ) qα 2 λ 2
Элементами матрицы D1 являются интенсивности переходов процесса λ(t) из
состояния в состояние с наступлением события. Недиагональные элементы матрицы D0 – интенсивности переходов из состояния в состояние без наступления
события. Диагональные элементы матрицы D0 – интенсивности выхода процесса
λ(t) из своих состояний, взятые с противоположным знаком. В сделанных предположениях λ(t) – марковский процесс. После каждого зарегистрированного в
момент времени ti события наступает время фиксированной длительности T
(мертвое время), в течение которого другие события исходного потока недоступны наблюдению. События, наступившие в течение мертвого времени, не вызывают продления его периода (непродлевающееся мертвое время). По окончании
мертвого времени первое наступившее событие снова создает период мертвого
времени T и т.д. Вариант возникающей ситуации показан на рис. 1, где 1, 2 – состояния случайного процесса λ(t); дополнительные события, которые могут наступать в момент перехода процесса λ(t) из состояния в состояние, помечены буквами p либо q; штриховка – периоды мертвого времени длительности T; t1, t2,… –
моменты наступления событий в наблюдаемом потоке.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.М. Горцев, М.А. Леонова, Л.А. Нежельская
34
1
2
α1
α2
α1
α2
α1
α2
α1
t
Процесс λ(t)
q
p
p
t
Обобщенный асинхронный поток
Т
t1
t
Т
Т
Т
Схема создания непродлевающегося мертвого времени
t2
t3
Наблюдаемый поток событий
t
t4
Рис. 1. Формирование наблюдаемого потока событий
Процесс λ(t) и типы событий (события пуассоновских потоков и дополнительные события) являются принципиально ненаблюдаемыми, а наблюдаемыми являются только временные моменты наступления событий t1, t2,… наблюдаемого
потока. Рассматривается установившийся (стационарный) режим функционирования наблюдаемого потока событий, поэтому переходными процессами на интервале наблюдения (t0, t), где t0 – начало наблюдений, t – окончание наблюдений,
пренебрегаем. Необходимо в момент окончания наблюдений (в момент времени t)
осуществить методом максимального правдоподобия и методом моментов оценку
Tˆ длительности мертвого времени и произвести сравнение получаемых оценок.
2. МП-оценка длительности мертвого времени
Обозначим τk = tk+1 – tk (k = 1,2,…) – значение длительности k-го интервала
между соседними событиями наблюдаемого потока (τk > 0). Так как рассматривается стационарный режим, то плотность вероятностей значений длительности k-го
интервала pT (τk) = pT (τ), τ ≥ 0, для любого k (индекс T подчеркивает, что плотность вероятностей зависит от длительности мертвого времени). В силу этого момент tk без потери общности можно положить равным нулю или, что то же самое,
момент наступления события наблюдаемого потока есть τ = 0. Тогда плотность
вероятностей примет вид [2]
z1 ⎡
1
⎤
z2 −
f (T ) ⎥ e − z1 ( τ−T ) −
⎢
z2 − z1 ⎣
α1 + α 2
⎦
z2 ⎡
1
⎤
z1 −
f (T ) ⎥ e − z2 ( τ−T ) , τ ≥ T ,
−
z2 − z1 ⎢⎣
α1 + α 2
⎦
pT (τ) = 0, 0 ≤ τ < T ; pT (τ) =
f (T ) = α + λψ (T )e − ( α1 +α 2 )T , ψ (T ) = 1 ⎡⎣ z1 z2 − ( λ1λ 2 − pqα1α 2 ) e− (α1 +α 2 )T ⎤⎦ ,
λ = α1α 2 ( λ1 + pα1 − λ 2 − qα 2 )( λ1 + qα1 − λ 2 − pα 2 ) ,
α = λ1α 2 + λ 2 α1 + ( p + q )α1α 2 ,
z1,2 = ⎡⎢λ1 + λ 2 + α1 + α 2 ∓ (λ1 − λ 2 + α1 − α 2 )2 + 4α1α 2 (1 − p )(1 − q ) ⎤⎥
⎣
⎦
0 < z1 < z2 .
2;
(1)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнение МП- и ММ-оценок длительности мертвого времени
35
В (1) принимается, что λ ≠ 0, (λ1λ 2 − pqα1α 2 ) ≠ 0. Подчеркнем, что (1) – одномерная плотность вероятностей.
Пусть τ1 = t2 – t1, τ2 = t3 – t2 , … , τk = tk+1 – tk – последовательность измеренных
(в результате наблюдения за потоком в течение интервала наблюдения (0, t)) значений длительностей интервалов между соседними событиями потока. Упорядочим величины τ1 , … , τk по возрастанию: τmin = τ(1) < τ(2) < … < τ(k). В силу предпосылок последовательность моментов наступления событий t1, t2,…, tk, … образует
вложенную цепь Маркова, т.е. наблюдаемый поток обладает марковским свойством, если его эволюцию рассматривать с момента tk , k = 1,2,… . Тогда [13] функция правдоподобия, с учетом (1), запишется в виде
L(λ i , αi , p, q, T | τ(1) ,..., τ( k ) ) = 0, 0 ≤ τmin < T ;
k
L(λ i , αi , p, q, T | τ(1) ,..., τ( k ) ) = ∏ pT (τ( j ) ), τmin ≥ T .
j =1
Так как поставленная задача заключается в построении оценки Tˆ длительности мертвого времени (в предположении, что остальные параметры потока λi, αi, i
= 1,2, p, q известны), то, согласно методу максимального правдоподобия, ее реализация есть решение оптимизационной задачи:
k
k
( j)
⎧ z ⎡
1
⎤
L(T | τ(1) ,..., τ( k ) ) = ∏ pT (τ( j ) ) =∏ ⎨ 1 ⎢ z2 −
f (T ) ⎥ e − z1 ( τ −T ) −
z
z
−
α
+
α
⎦
1 ⎣
1
2
j =1
j =1 ⎩ 2
−
( j)
z2 ⎡
1
⎤
⎫
z1 −
f (T ) ⎥ e − z2 ( τ −T ) ⎬ ⇒ max, 0 ≤ T < τmin ,
⎢
T
z2 − z1 ⎣
α1 + α 2
⎦
⎭
(2)
где z1, z2, f (T) определены в (1).
Значение T, при котором (2) достигает своего глобального максимума, есть
TˆМП – оценка максимального правдоподобия длительности мертвого времени.
В [5] аналитически строго решена оптимизационная задача (2): при любых
значениях параметров потока λ1 > 0, λ2 ≥ 0 (λ1 > λ2), 0 ≤ p ≤ 1, 0 ≤ q ≤ 1, αi > 0,
i =1,2, МП-оценка TˆМП = τmin . Таким образом, в процессе наблюдения (в течение
временного интервала (t, t0)) потока событий вычисляются величины τk , k = 1, n ,
после чего находится τmin = min τk ( k = 1, n ) и полагается TˆМП = τmin .
3. ММ-оценка длительности мертвого времени
В [2] показано, что обобщенный асинхронный поток событий, функционирующий в условиях мертвого времени, в общем случае является коррелированным потоком. Только в частных случаях [3] поток становится рекуррентным.
Пусть (tk , tk+1), (tk+1 , tk+2) – два смежных интервала в наблюдаемом потоке с
соответствующими значениями длительностей: τk = tk+1 – tk , τk+1 = tk+2 – tk+1; их
расположение на временной оси, в силу стационарности потока, произвольно. Тогда можно положить k = 1 и рассматривать соседние интервалы (t1, t2), (t2 , t3) с соответствующими значениями длительностей: τ1 = t2 – t1 , τ2 = t3 – t2; τ1 ≥ 0, τ2 ≥ 0.
При этом τ1 = 0 соответствует моменту t1 наступления события наблюдаемого потока; τ2 = 0 – моменту t2 наступления следующего события наблюдаемого потока.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.М. Горцев, М.А. Леонова, Л.А. Нежельская
36
Соответствующая совместная плостность вероятностей при этом есть pT (τ1, τ2),
τ1 ≥ 0, τ2 ≥ 0 [2]:
pT (τ1 , τ2 ) = 0; 0 ≤ τ1 < T , 0 ≤ τ2 < T ,
pT (τ1 , τ2 ) = pT (τ1 ) pT (τ2 ) +
+CT ⎡⎣ z1e − z1 ( τ1 −T ) − z2 e− z2 ( τ1 −T ) ⎤⎦ ⎡⎣ z1e− z1 ( τ2 −T ) − z2 e− z2 ( τ2 −T ) ⎤⎦ , τ1 ≥ T , τ2 ≥ T ,
CT = e− (α1 +α 2 )T
α1α 2 (λ1λ 2 − pqα1α 2 )(λ1 − λ 2 + pα1 − qα 2 )(λ1 − λ 2 + qα1 − pα 2 )
⎡( z2 − z1 )(α1 + α 2 )( z1 z2 − (λ1λ 2 − pqα1α 2 )e − ( α1 +α 2 )T ) ⎤
⎣
⎦
2
{
×
}
× z1 z2 − [2 z1 z2 − (α1 + α 2 )( z1 + z2 )]e − (α1 +α 2 )T + [ z1 z2 − (λ1 + λ 2 )(α1 + α 2 )]e−2(α1 +α 2 )T , (3)
где z1 , z2 , pT (τk) определены в (1) для τ = τk, k = 1, 2.
Теоретическая ковариация значений τ1 и τ2 запишется в виде
2
∞∞
⎡∞
⎤
cov(τ1 , τ2 ) = ∫ ∫ τ1τ2 pT (τ1 , τ2 )d τ1d τ 2 − ⎢ ∫ τpT (τ)d τ ⎥ .
⎣⎢ T
⎦⎥
TT
(4)
Подставляя (1), (3) в (4), находим явный вид теоретической ковариации:
2
⎛z −z ⎞
cov(τ1 , τ2 ) = ⎜ 2 1 ⎟ CT ,
⎝ z1 z2 ⎠
(5)
где CT определена в (3).
Пусть за время наблюдения (в течение временного интервала (t0, t)) реализовалось n интервалов (tk, tk+1) длительности τk , k = 1, n . Введем статистику
2
⎛1 n
⎞
1 n −1
cov(τ1 , τ2 ) =
τk τk +1 − ⎜ ∑ τk ⎟ ,
∑
n − 1 k =1
⎝ n k =1 ⎠
(6)
являющуюся оценкой теоретической ковариации (5). Тогда, согласно методу моментов [13], уравнение моментов, учитывающее коррелированность потока событий, запишется в виде
2
⎛ z2 − z1 ⎞
⎜
⎟ CT = cov(τ1 , τ2 ).
⎝ z1 z2 ⎠
(7)
Подставляя в (7) выражение CT из (3), вводя новую переменную x = e− (α1 +α 2 )T
и проделывая при этом необходимые преобразования, находим (7) в виде
ax3 + bx 2 + cx + d = 0,
a = h [ z1 z2 − (λ1 + λ 2 )(α1 + α 2 ) ] ;
{
2
}
b = − h [ 2 z1 z2 − (α1 + α 2 )( z1 + z2 ) ] + ( λ1λ 2 − pqα1α 2 ) cov(τ1 , τ 2 ) ;
2
с = z1 z2 ⎡⎣ h + 2 ( λ1λ 2 − pqα1α 2 ) cov(τ1 , τ2 ) ⎤⎦ ; d = − ( z1 z2 ) cov(τ1 , τ 2 );
h=
α1α 2
[ z1 z2 (α1 + α 2 )]2
(λ1λ 2 − pqα1α 2 )(λ1 − λ 2 + pα1 − qα 2 )(λ1 − λ 2 + qα1 − pα 2 ).
(8)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнение МП- и ММ-оценок длительности мертвого времени
37
Решение уравнения (8) определит три корня xi , i = 1, 2,3, которые, в свою очередь,
определят три ММ-оценки длительности мертвого времени
1
ln xi , i = 1, 2,3.
TˆММ (i ) = −
α1 + α 2
Алгоритм нахождения единственной оценки TˆММ следующий:
1) для определенного набора параметров λi, αi, i = 1,2, p, q, T ед. времени, осуществляется в течение Tm ед. времени имитационное моделирование наблюдаемого потока событий;
2) результатом работы имитационной модели является оценка теоретической
ковариации (6), где n принимает одно из целых значений (n ≥ 2) ;
3) решается кубическое уравнение (8), т. е. находятся корни x1 , x2 , x3 ;
=τ ;
4) если все корни комплексные, то Tˆ
ММ
min
5) выделяются вещественные корни; здесь возможны три случая:
5.1) вещественный корень один – x1 , тогда:
=τ ;
а) если x ≤ 0 , то Tˆ
1
ММ
min
б) если x1 > 0 , то б.1) TˆMM = τmin , если TˆММ (1) > τmin , б.2) TˆММ = TˆММ (1) , если
0 < TˆММ (1) ≤ τmin , б.3) TˆММ = τmin , если TˆММ (1) ≤ 0 ;
5.2) вещественных корня два – x1 , x2 ( x1 < x2 ) , тогда:
=τ ;
а) если x < x ≤ 0 , то Tˆ
1
2
ММ
min
б) если x1 ≤ 0 < x2 , то б.1) TˆММ = τmin , если TˆММ (2) > τmin , б.2) TˆММ = TˆММ (2) ,
если 0 < TˆММ (2) ≤ τmin , б.3) TˆММ = τmin , если TˆММ (2) ≤ 0 ;
в) если 0 < x1 < x2 , то в.1) TˆММ = τmin , если τmin < TˆММ (2) < TˆММ (1) ,
= Tˆ (2) , если 0 < Tˆ (2) ≤ τ < Tˆ (1) , в.3) Tˆ
= τ , если
в.2) Tˆ
ММ
ММ
ММ
TˆММ (2) ≤ 0 < τmin ≤ TˆММ (1) , в.4)
min
(
ММ
TˆММ = TˆММ (1) + TˆММ (2)
ММ
)
2 , если
min
0 < TˆММ (2) <
< TˆММ (1) ≤ τmin , в.5) TˆММ = TˆММ (1) , если TˆММ (2) ≤ 0 < TˆММ (1) ≤ τmin , в.6) TˆММ = τmin ,
если TˆММ (2) < TˆММ (1) ≤ 0 ;
5.3) вещественных корня три – x1 , x2 , x3 ( x1 < x2 < x3 ) , тогда:
=τ ;
а) если x < x < x ≤ 0 , то Tˆ
1
2
3
ММ
min
TˆММ = τmin , если
TˆММ (3) > τmin ,
(3)
≤ τmin , б.3) TˆММ = τmin , если TˆММ (3) ≤ 0 ;
ММ
ММ
ММ
в) если x1 ≤ 0 < x2 < x3 , то в.1) TˆММ = τmin , если τmin < TˆММ (3) < TˆММ (2) ,
= Tˆ (3) , если 0 < Tˆ (3) ≤ τ < Tˆ (2) ,
в.3) Tˆ
= τ , если
в.2) Tˆ
б) если
x1 < x2 ≤ 0 < x3 ,
= Tˆ (3) , если 0 < Tˆ
б.2) Tˆ
ММ
ММ
TˆММ (3) ≤ 0 < τmin ≤ TˆММ (2) ,
то
ММ
б.1)
min
(
ММ
в.4) TˆММ = TˆММ (2) + TˆММ (3)
< TˆММ (2) ≤ τmin ,
в.5)
TˆММ = TˆММ (2) ,
в.6) TˆММ = τmin , если TˆММ (3) < TˆММ (2) ≤ 0 ;
если
)
ММ
min
2 , если 0 < TˆММ (3) <
TˆММ (3) ≤ 0 < TˆММ (2) ≤ τmin ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.М. Горцев, М.А. Леонова, Л.А. Нежельская
38
г) если 0 < x1 < x2 < x3 , то г.1) TˆММ = τmin , если τmin < TˆММ (3) < TˆММ (2) < TˆММ (1) ,
г.2) TˆММ = TˆММ (3) , если 0 < TˆММ (3) ≤ τmin < TˆММ (2) < TˆММ (1) , г.3) TˆММ = τmin ,
если
(
TˆММ (3) ≤ 0 < τmin ≤ TˆММ (2) < TˆММ (1) ,
г.4) TˆММ = TˆММ (2) + TˆММ (3)
)
2,
если
0 < TˆММ (3) < TˆММ (2) ≤ τmin < TˆММ (1) , г.5) TˆММ = TˆММ (2) , если TˆММ (3) ≤ 0 < TˆММ (2) ≤
≤ τmin < TˆММ (1) , г.6) TˆММ = τmin , если TˆММ (3) < TˆММ (2) ≤ 0 < τmin ≤ TˆММ (1) ,
(
г.7) TˆММ = TˆММ (1) + TˆММ (2) + TˆММ (3)
г.8)
(
TˆММ = TˆММ (1) + TˆММ (2)
)
)
2,
3 , если
0 < TˆММ (3) < TˆММ (2) < TˆММ (1) ≤ τmin ,
если
TˆММ (3) ≤ 0 < TˆММ (2) < TˆММ (1) ≤ τmin ,
г.9) TˆММ = TˆММ (1) , если TˆММ (3) < TˆММ (2) ≤ 0 < TˆММ (1) ≤ τmin , г.10) TˆММ = τmin , если
TˆММ (3) < TˆММ (2) < TˆММ (1) ≤ 0 < τmin .
В результате работы алгоритма осуществляется один из описанных вариантов,
тем самым определится единственная ММ-оценка TˆММ длительности мертвого
времени.
4. Численное сравнение МП- и ММ-оценок
Для получения численных результатов разработан алгоритм вычисления МПи ММ-оценок. Программа расчета реализована на языке программирования С++ в
среде Builder 6. Первый этап расчета предполагает имитационное моделирование
(при заданных значениях параметров λi, αi, i = 1,2, p, q, T ед. времени и заданном
времени моделирования Tm ед. времени ) наблюдаемого потока событий. Описание алгоритма имитационного моделирования, хотя алгоритм достаточно трудоемок, здесь не приводится, так как никаких принципиальных трудностей алгоритм
не содержит. Результатом работы имитационной модели является последовательность значений длительностей временных интервалов τ1, τ2 ,…,τn (n = 2, 3, …).
Второй этап расчета – непосредственное вычисление МП-оценок и ММ-оценок.
Коротко опишем второй этап: 1) находится оценка TˆМП = τmin (τmin = min τk ,
k = 1, n) ; 2) вычисляется оценка (6); 3) решается уравнение (8); 4) осуществляется
алгоритм нахождения единственной оценки Tˆ ; 5) вычисляются величины
ММ
∆TˆМП = (TˆМП − T )2 , ∆TˆММ = (TˆММ − T ) 2 , где T – истинное значение длительности
мертвого времени, заданное на первом этапе расчета при осуществлении имитационного моделирования.
Для сравнения качества МП-оценок и ММ-оценок проведен статистический
эксперимент, состоящий из следующих этапов: 1) для заданного набора параметров λi, αi, i = 1,2, p, q, T ед. времени осуществляется моделирование наблюдаемого
потока событий для заданного Tm ед. времени (отдельный j-й эксперимент,
j = 1, 2, …); 2) осуществляется расчет оценок TˆМП ( j ) , TˆММ ( j ) для j-го эксперимента; 3) вычисляются величины ∆Tˆ ( j ) , ∆Tˆ ( j ) для j-го эксперимента; 4) осущеМП
ММ
ствляется повторение N раз ( j = 1, N ) шагов 1−3.
Результатом выполнения описанного алгоритма являются две выборки
ˆ
(TМП (1) , TˆМП (2) , ..., TˆМП ( N ) ), (TˆММ (1) , TˆММ (2) , ..., TˆММ ( N ) ) , на основании которых вы-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнение МП- и ММ-оценок длительности мертвого времени
39
числяются выборочные вариации получаемых оценок:
N
N
j =1
j =1
VˆМП = (1 N ) ∑ ∆TˆМП ( j ) , VˆММ = (1 N ) ∑ ∆TˆММ ( j ) .
Путем сравнения значений выборочных вариаций устанавливается, какая из
оценок при заданных параметрах лучше, какая хуже: если VˆМП ≤ VˆММ , то МПоценка лучше ММ-оценки, если наоборот, то ММ-оценка лучше МП-оценки. Отметим, что по определению МП – оценка при конечных Tm будет всегда смещенная ( τmin > T ); ее несмещенность реализуется только в асимптотическом случае
при Tm → ∞ .
Результаты статистического эксперимента приведены в табл. 1−8. В первой
строке таблиц указана длительность имитационного моделирования Tm (Tm =10,
20, …, 50 ед. времени в табл. 1−4; Tm = 600, 700, …, 1000 ед. времени в табл. 5−8).
Во второй и третьей строках таблиц для каждой длительности имитационного моделирования Tm приведены численные значения для VˆМП и VˆММ соответственно.
В четвертой строке таблиц для каждой длительности имитационного моделирования приведены численные значения разности VˆМП − VˆММ . Численные результаты
во всех таблицах получены для N = 100.
Таблица 1
Результаты статистического эксперимента
(λ1 = 2,1, λ2=0,5, α1=1, α2=0,9, p=0,1, q=0,1, T=0,4)
Tm
ˆ
VМП
10
20
30
40
50
0,01732
0,00488
0,00053
0,00047
0,00034
VˆММ
0,01717
0,00471
0,00030
0,00019
6·10−5
VˆМП − VˆММ
0,00015
0,00017
0,00023
0,00025
0,00028
Таблица 2
Результаты статистического эксперимента
(λ1 = 1, λ2=0,5, α1=0,1, α2=0,2, p=0,1, q=0,1, T=1)
Tm
ˆ
VМП
10
20
30
40
50
0,02553
0,00184
0,00089
0,00086
0,00046
VˆММ
0,02553
0,00184
0,00089
0,00086
0,00046
VˆМП − VˆММ
0
0
0
0
0
Таблица 3
Результаты статистического эксперимента
(λ1 = 1,9, λ2=0,7, α1=2,1, α2=0,15, p=0,4, q=0,7, T=0,4)
Tm
ˆ
VМП
10
20
30
40
50
0,00213
0,00141
0,00057
0,00048
0,00036
VˆММ
0,00201
0,00118
0,00031
0,00021
2,23·10−5
VˆМП − VˆММ
0,00012
0,00023
0,00026
0,00027
0,00034
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.М. Горцев, М.А. Леонова, Л.А. Нежельская
40
Таблица 4
Результаты статистического эксперимента
(λ1 = 2,1, λ2=0,3, α1=1,5, α2=0,1, p=0,2, q=0,9, T=0,4)
Tm
ˆ
VМП
10
20
30
40
50
0,00215
0,00101
0,00061
0,00057
0,00048
VˆММ
0,00204
0,00089
0,00036
0,00028
0,00016
VˆМП − VˆММ
0,00011
0,00012
0,00025
0,00029
0,00032
Таблица 5
Результаты статистического эксперимента
(λ1 = 2,1, λ2=0,5, α1=1, α2=0,9, p=0,1, q=0,1, T=0,4)
Tm
ˆ
VМП
4,215·10
2,185·10
VˆММ
5,39·10−5
VˆМП − VˆММ
−4,968·10−5
600
700
−6
800
−6
900
−6
1000
1,761·10
−7
3,346·10
1,065·10−7
5,15·10−5
3,745·10−5
1,879·10−5
1,155·10−5
−4,931·10−5
−3,569·10−5
−1,846·10−5
−1,144·10−5
Таблица 6
Результаты статистического эксперимента
(λ1 = 1, λ2=0,5, α1=0,1, α2=0,2, p=0,1, q=0,1, T=1)
Tm
VˆМП
600
700
800
900
1000
3,462·10−5
3,494·10−6
1,232·10−6
7,782·10−7
9,88·10−8
VˆММ
3,462·10−5
3,494·10−6
1,232·10−6
7,782·10−7
9,88·10−8
VˆМП − VˆММ
0
0
0
0
0
Таблица 7
Результаты статистического эксперимента
(λ1 = 2, λ2=1, α1=1, α2=0,5, p=0,8, q=0,7, T=1)
Tm
ˆ
VМП
600
700
800
900
1000
2,88·10−4
5,598·10−5
1,719·10−5
5,801·10−6
7,79·10−8
VˆММ
0,09551
0,07468
0,06269
0,05331
0,05206
VˆМП − VˆММ
−0,09522
−0,07462
−0,06267
−0,0533
−0,05206
Таблица 8
Результаты статистического эксперимента
(λ1 = 1,9, λ2=0,7, α1=2,1, α2=0,15, p=0,4, q=0,7, T=0,4)
Tm
ˆ
VМП
5,01·10
4,81·10
VˆММ
8,999·10−6
8,766·10−6
3,402·10−6
1,817·10−6
1,619·10−6
VˆМП − VˆММ
−3,989·10−6
−3,956·10−6
−3,052·10−6
−1,497·10−6
−1,489·10−6
600
700
−6
800
−6
900
−7
3,5·10
1000
−7
3,2·10
1,3·10−7
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнение МП- и ММ-оценок длительности мертвого времени
41
Анализ приведенных численных результатов показывает: 1) при малых временах наблюдения за потоком (при малых Tm =10, 20, …, 50 ед. времени)
ММ-оценки лучше МП-оценок (табл. 1, 3, 4) либо, по крайней мере, не хуже
МП-оценок (табл. 2), что является вполне естественным, так как при малых временах наблюдения оценка TˆМП может быть достаточно сильно смещенной относительно T; 2) при больших временах наблюдения за потоком (при больших Tm =
600, 700, …, 1000 ед. времени) МП-оценки лучше ММ-оценок (табл. 5, 7, 8) либо
не хуже ММ-оценок (табл. 6), что также является естественным, так как при
больших временах наблюдения смещение оценки TˆМП относительно T уменьшается.
Заключение
Результаты проведенного исследования МП-оценок и ММ-оценок длительности мертвого времени T показывают общую тенденцию, что при малых временах
наблюдения за потоком предпочтительнее применять оценку TˆММ , при больших
временах наблюдения – оценку Tˆ . Границу применимости той или иной оценМП
ки (при заданных значениях параметров λi, αi, i = 1,2, p, q) можно определить
только численно путем имитационного моделирования.
ЛИТЕРАТУРА
1. Gortsev A.M., Nezhelskaya L.A. An asynchronous double stochastic flow with initiation of
superfluous events // Discrete Mathematics and Applications. 2011. V. 21. Issue 3 (Jul).
P. 283–290.
2. Горцев А.М., Леонова М.А., Нежельская Л.А. Совместная плотность вероятностей длительности интервалов обобщенного асинхронного потока событий при непродлевающемся мертвом времени // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 4(21). С. 14–25.
3. Горцев А.М., Леонова М.А., Нежельская Л.А. Условия рекуррентности обобщенного
асинхронного потока событий при непродлевающемся мертвом времени // Queues:
Flows, Systems, Networks: Proc. of the Int. Conf. «Modern Probabilistic Methods for
Analysis, Design and Optimization of Information and Telecommunication Networks».
Minsk: BSU, 2013. P. 32–38.
4. Леонова М.А., Нежельская Л.А.Оценка максимального правдоподобия длительности
мертвого времени в обобщенном асинхронном потоке событий // Вестник Томского государственного университета. Управление, вычислительная техника и информатика.
2013. № 2(23). С. 54–63.
5. Леонова М.А., Нежельская Л.А.Оценка длительности непродлевающегося мертвого
времени в обобщенном асинхронном потоке событий // Изв. вузов. Физика. 2013. Т. 56.
№ 9/2. С. 220–222.
6. Дудин А.Н., Клименок В.И. Системы массового обслуживания с коррелированными потоками. Минск: Изд-во БГУ, 2000. 175 с.
7. Горцев А.М., Нежельская Л.А. О связи МС-потоков и МАР-потоков событий // Вестник
Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 1(14). С. 13−21.
8. Горцев А.М., Калягин А.А., Нежельская Л.А. Оптимальная оценка состояний обобщенного полусинхронного потока событий // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 2(11). С. 66−81.
9. Горцев А.М., Назаров А.А., Терпугов А.Ф. Управление и адаптация в системах массового
обслуживания. Томск: Изд-во Том. ун-та, 1978. 208 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
42
А.М. Горцев, М.А. Леонова, Л.А. Нежельская
10. Gortsev A.M., Nezhelskaya L.A., Soloviev A.A. Optimal state estimation in MAP event flows
with unextendable dead time // Automation and Remote Control. 2012. V. 73. No. 8.
P. 1316−1326.
11. Бушланов И.В., Горцев А.М., Нежельская Л.А. Оценка параметров синхронного дважды
стохастического потока событий // Автоматика и телемеханика. 2008. № 9. С. 76−93.
12. Апанасович В.В., Коляда А.А., Чернявский А.Ф. Статистический анализ случайных потоков в физическом эксперименте. Минск: Изд-во «Университетское», 1988. 254 с.
13. Шуленин В.П. Математическая статистика. Часть 1. Томск: Изд-во НТЛ, 2012. 540 с.
Горцев Александр Михайлович
Леонова Мария Алексеевна
Нежельская Людмила Алексеевна
Томский государственный университет
E-mail: gam@mail.fpmk.tsu.ru;
mleonova86@mail.ru; ludne@mail.ru
Поступила в редакцию 5 апреля 2013 г.
Gortsev Alexander M., Leonova Maria A., Nezhelskaya Lyudmila A. (Tomsk State University).
The comparison of maximum likelihood estimation and method of moments estimation of
dead time value in a generalized asynchronous flow of events.
Keywords: generalized asynchronous flow of events, unprolonging dead time, maximum
likelihood estimation, method of moments estimation, dead time value.
Generalized asynchronous flow of events which intensity is piecewise constant stochastic
process λ(t) with two states λ1 and λ2 (λ1 > λ2) and unprolonging dead time is considered. During
the time interval when λ(t) = λi , Poisson flow of events takes place with the intensity λi , i = 1,2.
Transition from the first state of process λ(t) into the second one (from the second state into the
first one) is carried out at any moment of time. The sojourn time in the i-th state is exponentially
distributed with parameter αi, i = 1,2. The process of transition λ(t) from the first state into the
second one initiates with probability p (0 ≤ p ≤ 1) extra event in the second state. Also the process
of transition λ(t) from the second state into the first one initiates with probability вероятностью q
(0 ≤ q ≤ 1) extra event in the second state.
The flow is functioning in conditions of unprolonging dead time (the value of dead time is
fixed). We solve the problem of estimation of dead time by using the likelihood function and the
method of moments. The comparison of the quality of estimation of dead time value shows which
estimator is better.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
УДК 519.254.1
Д.В. Иванов, О.В. Усков
РЕКУРРЕНТНОЕ ОЦЕНИВАНИЕ БИЛИНЕЙНЫХ ARX-СИСТЕМ
С ПОМЕХОЙ НАБЛЮДЕНИЯ ВО ВХОДНОМ СИГНАЛЕ
Предложен рекуррентный алгоритм для оценивания параметров билинейных
ARX с помехой наблюдения во входном сигнале. Доказана сильная состоятельность получаемых оценок параметров. Результаты моделирования подтвердили высокую эффективность предложенного алгоритма.
Ключевые слова: рекуррентное оценивание, стохастическая аппроксимация, помеха наблюдения, билинейные системы, метод наименьших квадратов.
Билинейные системы – это класс нелинейных систем с простой структурой.
Билинейные системы являются простейшим обобщением линейных динамических систем: выходной сигнал зависит не только от входных и выходных сигналов, но и от произведения входного сигнала на выходной. Моделирование физических процессов с помощью билинейных систем находит применение во многих
областях науки, таких, как ядерная физика, электрические сети, химическая кинетика, гидродинамика и т.д. [1].
Модели ошибки уравнения (ARX-модели) [2] – наиболее распространенный
вид моделей параметризации шума. Идентификация моделей ошибки уравнения
сводится к классической задаче регрессионного анализа и может быть решена методом наименьших квадратов. Однако во многих практических задачах помеха
содержится также и во входном сигнале, в этом случае классический метод наименьших квадратов не позволяет получать состоятельные оценки.
В настоящее время активно развиваются методы идентификации билинейных
динамических систем, такие, как инструментальные переменные [3], компенсирующий смещение метод наименьших квадратов [4], метод максимального правдоподобия [5] и методы на основе высших статистик [6]. Рекуррентные методы
идентификации билинейных систем, которые могут быть получены из рекуррентных методов идентификации линейных систем, приведены в [7]. Некоторые предложенные методы используют подход на основе рекуррентных методов идентификации систем с ошибкой в уравнении, модифицируя при этом функцию ошибки, например улучшенный метод наименьших квадратов [8].
В статье предложен рекуррентный алгоритм оценивания параметров билинейных ARX-систем с помехой во входном сигнале на основе стохастической аппроксимации.
1. Постановка задачи
Пусть билинейная динамическая система описывается стохастическими уравнениями с дискретным временем i = … − 1, 0,1… :
r
zi − ∑ b0( m ) zi − m =
m =1
r1
r2 r3 ( m )
∑ a0(m) xi −m + ∑ ∑ c0(mk ) xi −m zi −k + ξ1 (i),
m=0
m = 0 k =1
wi = xi + ξ 2 (i ), (1)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Д.В. Иванов, О.В. Усков
44
где xi , wi – ненаблюдаемая и наблюдаемая входные переменные; zi – наблюдаемая выходная переменная; ξ1 (i ) – помеха в уравнении; ξ2 (i ) – помеха наблюдения во входном сигнале;
Пусть выполняются следующие предположения:
10. Множество Β , которому априорно принадлежат истинные значения параметров устойчивой, управляемой и идентифицируемой билинейной системы, является компактным.
20. Помехи {ξ1 (i )} и {ξ2 (i )} статистически не зависят между собой:
E{ξ1 (i ) / Fi(1) } = 0, E{ξ2 (i ) / Fi(2) } = 0,
E{ξ12 (i ) / Fi(1) } ≤ Wi(1) < ∞, E{(ξ22 (i ) / Fi(2) } = Wi(2) < ∞,
где Fi(1) , Fi(2) – σ-алгебры, индуцированные семействами случайных величин
{ξ1 (t ), t ∈ Ti } и {ξ2 (t ), t ∈ Ti } , Ti = {t , t ≤ i, t ∈ Ζc } , Ζc – множество целых чисел,
(
)
(
)
Wi(1) , Wi(2) – случайные величины E Wi(1) ≤ πξ1 , E Wi(2) ≤ πξ2 , где E – оператор
математического ожидания.
30. {ξ1 (i )} , {ξ2 (i )} статически не зависят от {xi } .
40. Последовательности {xi } – стационарные в узком смысле с дробно-рациональной плотностью случайные сигналы с E{( xi ) 2 } = σ 2x > 0 . Для некоторых
π x > 0 : xi < π x п.н.
50. Априорно известно отношение дисперсий помех γ = σ12 σ22 .
2. Рекуррентный алгоритм идентификации
Уравнение (1) может быть представлено в форме линейной регрессии:
yi = ϕTi θ + εi ,
(2)
где
(
ϕi = φTz (i ) φTw (i ) φTwz (i )
(
φwz (i ) = wi zi−1,…, wi zi−r3 (0)
)
T
, φ z (i ) = ( zi −1 ,… zi − r ) , φw (i ) = ( wi −1 ,… wi − r1 ) ,
wi−1zi−1,…, wi−1zi−r3 (1) … wi−r2 zi−1,…, wi−r2 zi−r3 ( r2 )
( a0T c0T )
c0 = ( c0(11) … c0(1r (1))
T
θ0 = b0T
3
εi = ξ1 (i ) −
r1
T
T
(
, b0 = b0(1) ...b0( r )
)
T
(
)
))
)
, a0 = a0(1) ...a0( r1 )
c0(21) … c0(2 r3 (2)) … c0( r21) … c0( r2r3 ( r2
T
T
)
T
,
,
,
r2 r3 ( m )
∑ a0(m) ξ2 (i − m) − ∑ ∑ c0(mk ) zi −k ξ2 (i − m).
m =0
m = 0 k =1
Из предположений 10 и 20 следует, что обобщенная ошибка имеет нулевое
среднее значение и ее локальная дисперсия с вероятностью 1 будет равна
1
N →∞ N
σε2 = lim
N
∑ E ( ( εi (a0 , c0 , i) )2 ) = σ12 + σ22 a0T a0 + σ22σ2z с0T с0 =
i =1
= σ22 ( γ + a0T a0 + σ 2z с0T с0 ) = σ 22 ω(a0 , c0 ).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рекуррентное оценивание билинейных ARX-систем с помехой наблюдения
45
Определим оценку θˆ ( N ) неизвестных параметров θ из условия минимума
2
суммы взвешенных квадратов обобщённых ошибок ( εi (a0 , c0 , i ) ) с весом ω(a, c)
[9], т.е.
( yi − ϕTi θ )
N
min ∑
θ∈Β
i =1
γ+a
T
2
= min
a + σ2z сT с
θ∈Β
U N (b, a, c)
,
ω(a, c)
(3)
тогда оценки неизвестного вектора θ можно получить с помощью стохастически
градиентного алгоритма минимизации функции (3):
(
)
2
⎡
⎤
yi +1 − ϕTi +1θˆ (i )
⎥,
ˆθ(i + 1) = θˆ (i ) − α ∇ ⎢
i θ
⎢ γ + aˆ T ( i ) aˆ ( i ) + σ2 cˆT ( i ) cˆ ( i ) ⎥
z
⎢⎣
⎥⎦
где αi – последовательность, удовлетворяющая условиям
60.
70.
∞
∑ αi = ∞, αi ≥ αi +1 и
i =0
∞
∞
i =1
i =1
(4)
∞
∑ αli < ∞ at l > 1 ;
i =0
∑ αi ξ1 (i) < ∞, ∑ αi ξ2 (i) < ∞
п.н.
Теорема 1. Пусть динамическая система описывается уравнениями (1) и выполняются предположения 10–70, тогда оценки, определяемые алгоритмом (4), ли→ θ0 п.н., либо θˆ (i ) ⎯⎯⎯
→ ∞.
бо θˆ (i ) ⎯⎯⎯
i →∞
i →∞
Доказательство. Доказательство состоятельности получаемых с помощью (4)
оценок основывается на методе непрерывных моделей [10, 11]. Построим асимптотическую непрерывную детерминированную модель алгоритма (4). Минимизируемую в (3) функцию можно представить в виде
J ( θ) =
σ12
+
( θ − θ0 )T H ϕ ( θ − θ0 )
γ + aT a + σ2z сT с
(
H ϕ = lim E ⎡ϕi(0) ϕi(0)
i →∞ ⎢
⎣
где
(
ϕi(0) = ϕTz (i ) ϕTx (i ) ϕTxz (i )
(
φ xz (i ) = xi zi −1 ,…, xi zi −r3 (0)
)
T
)
T
,
⎤ > 0,
⎥⎦
T
, ϕ z (i ) = ( zi −1 ,… zi − r ) ,
xi −1 zi −1 ,…, xi −1 zi −r3 (1) … xi −r2 zi −1 ,…, xi −r2 zi−r3 ( r2 )
)
T
,
что следует из 10, 40.
В данном случае асимптотическая непрерывная детерминированная модель
имеет вид
•
θ = −∇ θ J ( θ ) .
(5)
Здесь точка означает производную по времени. Связь между уравнениями (4) и (5)
k −1
устанавливается с помощью фиктивного времени tk = ∑ αi [10, c. 89].
i =0
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Д.В. Иванов, О.В. Усков
46
Пусть функция Ляпунова
V ( θ) = J ( θ) ,
(6)
так как она непрерывно дифференцируема и
2
V ( θ ) = ∇Tθ V ( θ ) J ( θ ) = − ∇Tθ J ( θ ) ,
∇Tθ V ( θ ) J ( θ ) < 0,
(7)
}
{
то множество B = θ ∈ R r + r1 + r3 (0) +…+ r3 ( r2 ) + r2 + 2 : V ( θ ) = 0
состоит из стационарных
точек J ( θ ) [10, с.114].
Для перехода от (4) к непрерывной модели необходимо показать, что для
{ξ1 (i )} , {ξ2 (i )} и {α i } выполняется равенство [14, с.12]:
lim lim sup
T →0
n →∞
1
T
k ( n ,T )
∑
i=n
(
)
αi εi θˆ (i ), ξ1 (i ), ξ 2 (i ) = 0,
(8)
k
⎧
⎫
где для T > 0 k (n, T ) = max ⎨k : ∑ αi ≤ T ⎬ .
⎩ i=n
⎭
Для выполнения равенства (8) необходима ограниченность последовательности θˆ (i ) , что подразумевает ограниченность роста функции ∇ θ J ( θ ) при
{ }
θ → ∞. В нашем случае
lim ∇ θ J ( θ ) = 0.
θ →∞
Из ограниченности сумм в условии 70 и последовательности
∞
(
{θˆ (i)}
следует
)
ограниченность суммы ∑ αi εi θˆ (i ), ξ1 (i ), ξ 2 (i ) < ∞, откуда следует выполнение
i =1
(8).
Из теорем, приведенных в [10, с. 12, c. 292], следует, что при выполнении 10–70
и (7), (8) последовательность θˆ (i ) ограничена и при i → ∞ θˆ (i ) стремится к
{ }
{
точкам множества B = θ ∈ R
{ }
r + r1 + r3 (0) +…+ r3 ( r2 ) + r2 + 2
}
: V ( θ) = 0 .
Исследуем непрерывную модель (4): покажем, что
}
{
B∗ = θ ∈ R r + r1 + r3 (0) +…+ r3 ( r2 ) + r2 + 2 : θ = θ0 ,
т.е. множество B∗ состоит из одной единственной точки θ0 .
Для этого рассмотрим функцию
J ′ (u ) =
где
uT H ϕu
uT Du
,
u = (u1 ,..., ur + r1 + r3 (0) +…+ r3 ( r2 ) + r2 + 3 )T ∈ R r + r1 + r3 (0) +…+ r3 ( r2 ) + r2 + 3 ,
⎡⎛ − y ⎞
H ϕ = lim E ⎢⎜ i ⎟ − yi
i →∞ ⎣⎝ ϕi ⎠
(
⎤
ϕTi ⎥ ,
⎦
)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рекуррентное оценивание билинейных ARX-систем с помехой наблюдения
1
01×r
⎛
⎜
0r×1
0r×r
⎜
D =⎜
0r +1×1
0r +1×r
1
1
⎜
⎜ 0r (0)+…+r ( r )+r +1×1 0r (0)+…+r ( r )+r +1×r
3 2
2
3
3 2
2
⎝ 3
где
I r +1
и
I r3 (0) +…+ r3 ( r2 )
01×r +1
01×r (0)+…+r ( r )+r +1 ⎞
3
3 2
2
0r×r +1
0r×r (0)+…+r ( r )+r +1 ⎟
3
3 2
2
,
0r +1×r (0)+…+r ( r )+r +1 ⎟
1
⎟
1
1/ γ
1
0r (0)+…+r ( r )+r +1×r +1
3
47
3
2
2
1
3
3
2
⎟
2
σ 2z I r (0)+…+r ( r )+r +1 γ ⎟
3
3
2
⎠
2
– единичные матрицы размерностей
r+1 и
r3 (0) + … + r3 (r2 ) соответственно.
Очевидно, что
min J ( θ ) = min J ′ ( u ) = J ( θ0 ) = Λ min ,
θ
(9)
u
где Λ min – минимальное собственное число регулярного пучка форм (так как D –
положительно определенная матрица), т.е. Λ min – наименьший корень уравнения
det( H ϕ −ΛD) = 0.
Пусть Λ min = Λ (1) ≤ ...≤ Λ (
r +r1 +r3 (0)+…+r3 ( r2 )+r2 +3)
= Λ max и u1 ,...,ur +r1 +r3 (0)+…+r3 ( r2 )+r2 +3
какие-либо соответствующие им главные собственные векторы. Тогда Λ k , где
k = 1, r + r1 + r3 (0) + … + r3 (r2 ) + r2 + 3 , являются стационарными значениями функции J ′ ( u ) , которые достигаются при u , равных u1 ,..., ur + r1 + r3 (0) +…+ r3 ( r2 ) + r2 + 3 соответственно. Следовательно, стационарные значения функции
достигаются в точках
( r + r + r (0) +…+ r3 ( r2 ) + r2 + 3)
⎛ u (2)
u 1 3
θ1 = ⎜ 1(1) ,..., 1
⎜u
u1(1)
⎝ 1
J ( θ ) ; ∇θ J ( θ ) = 0
T
⎞
⎟⎟ ,...,
⎠
( r + r + r (0) +…+ r ( r ) + r + 3)
⎛ ur(2)
ur + r 1+ r 3(0) +…+ r 3( r 2) + r 2+ 3
+ r + r (0) +…+ r3 ( r2 ) + r2 + 3
3 2
2
θr + r1 + r3 (0) +…+ r3 ( r2 ) + r2 + 3 = ⎜ (1) 1 3
,..., (1)1 3
⎜ ur + r + r (0) +…+ r ( r ) + r + 3
ur + r + r (0) +…+ r ( r ) + r + 3
⎝
1 3
3 2
2
1 3
3 2
2
причем из (9) следует, что θ1 = θ .
Остается показать, что
∇2 J ( θ) ≥ 0
T
⎞
⎟ ,
⎟
⎠
(10)
лишь в одной стационарной точке θ = θ1 = θ0 .
Задача определения минимума функции J ( θ ) эквивалентна задаче на условный экстремум
min uT H ϕu , uT Du = 1.
(11)
Задача (11) может быть решена с помощью метода неопределенных множителей Лагранжа. Тогда необходимые условия запишутся в виде
( H ϕ − λD)u = 0, uT Du = 1,
(12)
где λ − неопределенный множитель Лагранжа. Множеством решений системы
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Д.В. Иванов, О.В. Усков
48
{
(12) являются λ ∈ Λ1 ,..., Λ r + r1 + r3 (0) +…+ r3 ( r2 ) + r2 + 3
}
и соответствующие им главные
собственные векторы u1 ,..., ur + r1 + r3 (0) +…+ r3 ( r2 ) + r2 + 3 .
Исследуем матрицу H ϕ − λD на положительную определенность. Из (12) следует, что
Λ (1) H ϕ < Λ (1) H ϕ ,
где Λ (1) H ϕ и Λ (1) H ϕ − минимальные собственные числа матриц H ϕ и H ϕ соответственно.
В свою очередь, по теореме Штурма [13, с. 146]
Λ (1) H ϕ ≤ Λ (2) H ϕ или Λ (1) H ϕ < Λ (2) H ϕ .
(13)
Из (13) следует, что матрица H ϕ − λD неотрицательно определена лишь при
λ = Λ min
и (10) выполняется в θ1 = θ0 , т.е для всех λ > Λ min
матрица
H ϕ − λD имеет отрицательные собственные значения, откуда непосредственно
следует (4).
В формуле (4) используется дисперсия выходного сигнала, которая обычно
неизвестна. Согласно теореме Манна – Вольда [14]: если случайная величина σˆ 2z
сходится почти наверное соответственно к постоянной σ2z , то любая непрерывная функция J (σˆ 2 ) сходится почти наверное к постоянной J (σ 2 )
z
z
п. н .
п. н.
σˆ 2z ⎯⎯⎯
→ σ2z , J (σˆ 2z ) ⎯⎯⎯
→ J (σ 2z ).
σ2z
(14)
σˆ 2z
Следовательно, если заменить в (3)
оценками
, оценки параметров θ̂
останутся сильно состоятельными. Состоятельная и несмещенная оценка дисперсии σˆ 2z может быть получена как
N
N
i =1
i =1
−1
σˆ 2z = ( N − 1) ∑ ( zi − z ) 2 , z = N −1 ∑ zi .
Вычисление дисперсии (13) может быть представлено в виде рекуррентной
процедуры:
zi +1 = zi + ( zi +1 − zi ) ( i + 1) ,
(
)
σˆ 2z (i + 1) = σˆ 2z (i + 1) + ( zi − zi ) 2 − σˆ 2z (i + 1) / i.
3. Результаты моделирования
Предложенный алгоритм (4) был реализован в Matlab и сравнен с рекуррентным алгоритмом наименьших квадратов и рекуррентным методом расширенных
инструментальных переменных. Динамическая система описывается уравнениями
zi − 0,7 zi −1 + 0, 4 zi −2 = 0,3 xi + 0,7 xi −1 + 0, 2 xi −2 + 0, 2 xi zi −1 + ξ1 (i ),
wi = xi + ξ 2 (i ).
(15)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рекуррентное оценивание билинейных ARX-систем с помехой наблюдения
49
На вход подавался входной сигнал:
xi + 0,5 xi −1 = ζ i + 0,8ζ i −1 + 0,6ζ i −2 ,
где ζ i – белый шум.
Отношение «помеха – сигнал»: σ1 σ z ≈ 0, 2 , σ 2 σ z ≈ 0,5.
Начальные значения параметров равны 0.
На рис. 1. представлены графики погрешности оценок параметров, определяемой по формуле
δθ = θˆ − θ
( θ ) ⋅100 %.
i
i
0
0
120
100
80
60
1
40
2
3
20
0
2000
4000
6000
8000
i
Рис. 1. График погрешности оценок параметров, %: 1 – рекуррентный метод наименьших квадратов; 2 – рекуррентный метод инструментальных переменных; 3 – алгоритм (4)
Заключение
В работе предложен рекуррентный алгоритм для оценивания параметров билинейной ARX-системы с помехой наблюдения во входном сигнале. Для получения сильно состоятельных оценок не требуется информация о законах распределения помех, достаточно знать отношение дисперсий помех. В среде Matlab создано программное обеспечение, результаты моделирования подтверждают эффективность работы предложенного алгоритма. Полученные результаты могут послужить основой для создания новых высокоэффективных автоматизированных
систем управления технологическими процессами (АСУТП). Дальнейшие исследования могут быть направлены на построение алгоритмов идентификации при
автокоррелированных помехах.
ЛИТЕРАТУРА
1. Mohler R.R. Bilinear Control Processes: with Applications to Engineering, Ecology, and
Medicine. New York: Academic Press, 1973.
2. Льюнг Л. Идентификация систем. Теория для пользователя. М.: Наука, 1991. 432 с.
3. Ahmed M.S. Parameter estimation in bilinear systems by instrumental variable methods // Int.
J. Control. 1986. V. 44. No. 4. P. 1177–1183.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Д.В. Иванов, О.В. Усков
50
4. Ekman M. Modeling and Control of Bilinear Systems: Application to the Activated Sludge
Process: PhD thesis, 2005.
5. Gabr M.M. Subba Rao T. On the identification of bilinear systems from operating records //
Int. J. Control. 1984. V. 40(1). P. 121−128.
6. Tsoulkas V., Koukoulas P., Kalouptsidis N. Identification of input-output bilinear systems
using cumulants // Proc. 6th IEEE Int. Conf. on Electronics, Circuits and Systems. Pafos,
Greece, 1999. P. 1105−1108.
7. Fnaiech F., Ljung L. Recursive identification of bilinear systems // Int. J. Control. 1987.
V. 45(2). P. 453−470.
8. Zhu Z., Leung H. Adaptive identification of bilinear systems // Proc. IEEE Int. Conf. on
Acoustics, Speech, and Signal Processing, Phoenix, Arizona (March), 1999. P. 1289−1292.
9. Кацюба О.А. Теория идентификации стохастических динамических систем в условиях
неопределенности: монография. Самара: СамГУПС, 2008. 119 с.
10. Chen H.F. Stochastic Approximation and Its Applications. Kluwer, Dordrecht, 2005.
11. Деревицкий Д.П., Фрадков А.Л. Прикладная теория дискретных адаптивных систем
управления. М.: Наука, 1991. 215с.
12. Беллман Р. Введение в теорию матриц. М.: Наука, 1989. 376 с.
13. Mann H.B., Wald A. On stochastic limit and order relationship // The Annals of Mathematical
Statistics. 1943. V.14(3). P. 217–226.
Иванов Дмитрий Владимирович
Усков Олег Владимирович
Самарский государственный университет путей сообщения
E-mail: dvi85@mail.ru; quentyn@bk.ru
Поступила в редакцию 3 мая 2012 г.
Ivanov Dmitriy V., Uskov Oleg V. (Samara State University of Transport). Recursive estimation
of bilinear ARX systems with input-error.
Keywords: recursive estimation, stochastic approximation, error-in-variable, bilinear systems,
least squares method
There is considered the problem of parameter estimation of bilinear ARX systems with noise
in the input signals, described by the equations:
r
zi − ∑ b0( m ) zi − m =
m =1
r1
r2 r3 ( m )
∑ a0(m) xi − m + ∑ ∑ c0(mk ) xi − m zi − k + ξ1(i),
m=0
m = 0 k =1
wi = xi + ξ2 (i ),
where xi , wi – unobserved and the observed input variables; zi − the observed output variable;
ξ1 (i ) – noise in the equation; ξ 2 (i ) – the noise in the input signal.
We propose a recursive algorithm for estimation of parameters, which is a generalization of
the method of least squares. It is proved that that under non-restrictive conditions on the signals
and noises, the proposed algorithm gives a strongly consistent estimators. The simulation results
confirmed the high efficiency of the algorithm.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
УДК 519.612.2
А.Е. Карелин, А.А. Светлаков
СКЕЛЕТНЫЕ РАЗЛОЖЕНИЯ ПРЯМОУГОЛЬНЫХ МАТРИЦ
И ИХ ПРИМЕНЕНИЕ В СТРУКТУРНОЙ РЕГУЛЯРИЗАЦИИ
ПЛОХО ОБУСЛОВЛЕННЫХ СИСТЕМ
ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ
Рассматривается новый метод регуляризации плохо обусловленных систем
линейных алгебраических уравнений (СЛАУ). Сущность предлагаемого метода заключается в изменении структурных характеристик решаемой СЛАУ
таким образом, чтобы решение измененной СЛАУ оказалось устойчивым к
изменениям ее исходных данных и пригодным для его дальнейшего использования.
Ключевые слова: плохо обусловленная СЛАУ, регуляризация, скелетное
разложение.
Пусть нам дана система линейных алгебраических уравнений
Ua = y .
(1)
Здесь y – правая часть СЛАУ – заданный n-мерный вектор, где n – некоторое ограниченное натуральное число больше 2; a – неизвестный n-мерный вектор – ее
решение, а U – заданная квадратная порядка n матрица коэффициентов данной
СЛАУ, которая является невырожденной, но плохо обусловленной матрицей, т.е.
такой, что ее ранг rU и число ее обусловленности cond U удовлетворяют следующим соотношениям:
rU = n , cond U >> 1 .
(2)
Здесь символ « >> » означает, что cond U существенно, т.е. в 100 и более раз
больше 1.
Как известно [1, 2], характерной особенностью подобных СЛАУ является
чрезмерно высокая чувствительность их решений a к различного рода изменениям их правых частей y и матриц коэффициентов U. Последнее означает, что даже
самые незначительные изменения ∆y вектора y и (или) ∆U матрицы U влекут за
собой столь значительные изменения ∆a решения a исходной СЛАУ (1), что вычисленное решение a = a + ∆a может оказаться сколь угодно далеким от интересующего нас решения a и не иметь с ним ничего общего. Получить пригодное для
практических приложений решение подобной СЛАУ оказывается возможным
только в случае применения для его вычисления того или иного метода регуляризации, позволяющего исправить решаемую СЛАУ таким образом, чтобы решение
регуляризированной (исправленной) СЛАУ оказалось менее чувствительным к
изменениям ее исходных данных и, вместе с тем, достаточно близким к решению
a и пригодным для дальнейшего его использования.
В настоящее время известен целый ряд методов регуляризации плохо обусловленных СЛАУ, основанных на различных идеях и подходах [1, 3]. Характерная
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
52
А.Е. Карелин, А.А. Светлаков
особенность данных методов состоит в том, что регуляризация решаемой СЛАУ
осуществляется с помощью так называемых параметров регуляризации, варьируя
которые удается добиться желаемой устойчивости вычисляемого решения к изменениям исходных данных СЛАУ и его приемлемой точности. Для их отличия
от метода регуляризации, рассматриваемого ниже, назовем и будем называть их
всюду далее, методами параметрической регуляризации плохо обусловленной
СЛАУ. Учитывая отмеченную выше особенность данных методов, можно видеть,
что предлагаемое их название представляется достаточно обоснованным и вполне
оправданным.
Целью данной работы является рассмотрение нового метода регуляризации
плохо обусловленных СЛАУ, названного и называемого нами далее методом
структурной регуляризации подобных СЛАУ. Сущность предлагаемого метода
заключается в изменении структурных характеристик решаемой СЛАУ таким образом, чтобы решение измененной СЛАУ оказалось устойчивым к изменениям ее
исходных данных и пригодным для его дальнейшего использования. При этом
под структурными характеристиками СЛАУ далее будем понимать размерности
строк и столбцов ее матрицы U и соответственно ее правой части y и решения a.
1. Определение и важнейшие свойства скелетных разложений
прямоугольных (m×n)-матриц
Предлагаемый метод структурной регуляризации плохо обусловленных СЛАУ
основан на использовании известных в теории матриц так называемых скелетных
разложений прямоугольных матриц и, таким образом, понятие «скелетное разложение прямоугольной матрицы» является для наших целей основополагающим.
Поэтому и для упрощения последующего описания предлагаемого метода в данном разделе приведем необходимые нам сведения о скелетных разложениях прямоугольных матриц и, чтобы не вводить в рассмотрение еще какую-либо матрицу,
сделаем это применительно к нашей матрице U, временно считая при этом, что
она является прямоугольной (m×n)-матрицей и ее ранг равен rU . Здесь m, n и rU
– соответственно число строк, число столбцов и ранг матрицы U – некоторые натуральные числа, такие, что m может быть как больше, так и меньше или равно n ,
а rU – не больше меньшего из m и n.
Как известно из теории матриц [4], скелетным разложением матрицы U принято называть равенство вида
U = SR .
(3)
Здесь S и R – прямоугольные ( m × rU ) - и ( rU × n ) -матрицы соответственно, ранги
rS и rR которых удовлетворяют соотношениям
rS = rU , rR = rU .
(4)
Данные равенства означают, что S и R являются так называемыми матрицами
полного или максимального ранга (их ранги равны их меньшим размерностям,
больше которых ранги матриц не могут быть по определению) или, что то же
самое, S является столбцово-невырожденной, а R – строчно-невырожденной матрицей.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Скелетные разложения прямоугольных матриц и их применение
53
Отметим свойства скелетных разложений матрицы U, являющиеся для наших
целей основополагающими.
1. Для любой матрицы U существует сколь угодно много скелетных разложений. В самом деле, пусть матрицы S и R удовлетворяют равенству (3). Тогда этому же равенству удовлетворяют и матрицы S ′ и R′ , определяемые равенствами
вида S ′ = SP , R′ = P −1 R , где P – некоторая невырожденная порядка rU матрица,
а P −1 – обратная к ней матрица. Составив произведение S ′R′ , можно видеть, что
оно также удовлетворяет равенству (3) и, таким образом, также является скелетным разложением матрицы U. Отсюда, учитывая, что невырожденных порядка
rU матриц P существует сколь угодно много и каждая из них позволяет получить
некоторое скелетное разложение матрицы U, можно заключить, что множество
возможных скелетных разложений данной матрицы является бесконечным несчетным множеством.
2. Представив матрицу U как совокупность векторов-столбцов, т.е. равенством
вида U = ( u1 u2 ... un ) , можно элементарными вычислениями убедиться в том, что
матричное равенство (3) вполне эквивалентно следующей совокупности векторно-матричных равенств:
rU
Sr j = ∑ sk rkj = u j , j = 1, n .
(5)
k =1
Непосредственно видно, что j-е равенство в данном случае является не чем иным,
как разложением j-го столбца u j матрицы U по столбцам sk , k = 1, rU матрицы S.
При этом коэффициентами данного разложения являются компоненты rkj
вектора-столбца r j матрицы R.
3. При любой заданной столбцово-невырожденной матрице S j-е равенство (5)
является СЛАУ относительно j-го столбца r j матрицы R, правая часть которой
равна j-му столбцу u j матрицы U, j = 1, n , и так как имеет место равенство (4а),
то данная СЛАУ оказывается совместной и имеет бесконечное множество
решений.
4. В случае, когда вместо точно заданной матрицы U приходится иметь дело с
матрицей U , удовлетворяющей равенству U = U + ∆U , где ∆U – прямоугольная
( m × n ) -матрица, элементами которой являются погрешности (ошибки) задания
элементов матрицы U, оказывается необходимым и возможным использовать
обобщенное или, что то же самое, условное скелетное разложение матрицы U ,
определяемое равенством вида
U ≈ SR ,
(6)
используя при этом в качестве количественной меры близости между его левой и
правой частями следующее условие:
|| U − SR ||≤ regU ,
(7)
где || ⋅ || – евклидова норма матриц, а regU – некоторое достаточно малое положительное число, выбираемое с учетом погрешностей задания матрицы U. Назо-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
54
А.Е. Карелин, А.А. Светлаков
вем и всюду далее будем называть данное число параметром структурной регуляризации скелетного разложения матрицы U .
Если параметр регуляризации regU = 0 , то, как вытекает из (7) и определения
нормы матриц, условное равенство (6) превращается в строгое равенство и, таким
образом, получаемое при этом обобщенное скелетное разложение матрицы U
оказывается не чем иным, как простым или классическим скелетным разложением данной матрицы, определяемым строгим равенством (3). В случае, когда
regU > 0 , получаемое скелетное разложение матрицы U оказывается ее обобщенным скелетным разложением, ранги rS и rR матриц S и R которого удовлетворяют соотношениям rS = rR < rU , при этом ранг rS существенно зависит от
выбранного значения regU и оказывается тем меньше, чем большее значение
имеет параметр регуляризации regU , изменяясь при этом в пределах от rS = r до
rS = 1 .
Отмеченные выше свойства простого и обобщенного скелетных разложений
матрицы U позволяют составить достаточно полное представление о их важнейших свойствах. Данные свойства, очевидно, в полной мере сохраняются и в случае любой квадратной порядка n матрицы. В частности, если данная матрица
оказывается плохо обусловленной, то использование ее обобщенного скелетного
разложения позволяет предложить целый ряд методов структурной регуляризации
плохо обусловленных СЛАУ.
2. Анализ возможностей и некоторых проблем построения
скелетных разложений (m×n)-матриц
Приведенные выше сведения о скелетных разложениях матрицы U позволяют
непосредственно видеть, что для получения какого-либо конкретного ее скелетного разложения необходимо и достаточно задать некоторую конкретную матрицу S
и, решая n СЛАУ вида (5), вычислить матрицу R.
Рассмотрим более детально возможности и некоторые проблемы скелетного
разложения (3) матрицы U, имея в виду при этом ее представление (5).
1. Для получения скелетного разложения (3) матрицы U необходимо прежде
всего задать ( m × rS ) -матрицу S ранга rS . Так как подобных матриц сколь угодно
много, то задать конкретную S можно, только учитывая те или иные дополнительные соображения и требования (минимальный объем вычислений, устойчивость решения, удобство программирования и т.п.).
2. При любой заданной матрице S построение скелетного разложения (3) матрицы U сводится к решению n систем линейных алгебраических уравнений вида
(5) относительно столбцов r j матрицы R. Поскольку ранги матриц U и S равны
rU и rU ≤ n , а правыми частями данных СЛАУ являются столбцы матрицы U, то
все эти СЛАУ оказываются совместными.
3. Трудоемкость решения данных СЛАУ и свойства их решений r j , j = 1, n ,
существенно зависят от выбранной и используемой матрицы S. В частности, если
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Скелетные разложения прямоугольных матриц и их применение
55
матрицу S выбрать в соответствии с равенством S = U1 , где U1 – ( m × rU ) матрица, составленная из rS линейно независимых столбцов матрицы U и этими
столбцами являются ее первые rS столбцов, то матрица R будет определяться ра-
венством вида R = ( ErS R1 ) , где блок ErS – единичная порядка rS матрица, а
блок R1 – прямоугольная ( rS × ( n − rS ) ) -матрица, являющаяся решением матричного уравнения U1 R1 = U 2 , правая часть U 2 которого является прямоугольной
( m × ( n − r ) ) –матрицей, составленной из остальных ( n − rS ) столбцов матрицы U,
линейно зависимых с ее первыми rS столбцами;
4. В случае, когда матрица S является столбцово-ортогональной матрицей,
удовлетворяющей равенству S T S = D , где S T – транспонированная матрица S, а
D – диагональная порядка rS матрица, диагональные элементы dii которой вычисляются по формулам
dii = ( si , si ) , i = 1, r S ,
(8)
сомножитель R скелетного разложения (3) имеет вид
R = D −1 S T U .
(9)
−1
Здесь D – обратная к D матрица. При этом, если столбцы матрицы S не только
попарно ортогональны, но и являются нормированными векторами и соответственно удовлетворяют равенствам || s j ||= 1,0, j = 1, r S , где || s j || – евклидова норма вектора s j , вычисляемая согласно равенству
1/ 2
⎛ m ⎞
|| s j ||= ⎜ ∑ sij2 ⎟ ,
⎝ i =1 ⎠
то равенства (8) и (9) предельно упрощаются и принимают следующий вид:
dii = 1,0, i = 1, rS , R = S T U .
Приведенные результаты позволяют видеть, что задача построения скелетных
разложений (3) матрицы U является существенно недоопределенной задачей.
Данная особенность задачи является, с одной стороны, благом, так как она открывает широкие возможности построения различных скелетных разложений (3).
С другой – она создает проблемы, обусловленные отсутствием в настоящее время
каких-либо критериев и правил, позволяющих строить данные разложения в тех
или иных конкретных условиях.
3. Построение робастного множителя S обобщенного
скелетного разложения плохо обусловленной матрицы U
Теперь мы откажемся от принятого выше временного допущения о том, что U
является прямоугольной ( m × n ) -матрицей и всюду далее будем считать, что она
является квадратной порядка n матрицей, а ее ранг rU и число обусловленности
condU удовлетворяют соотношениям (2). Рассматриваемое построение матрицы
S основано на использовании хорошо известного в линейной алгебре метода ортогонализации конечномерных векторов, называемого процедурой Грама –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Е. Карелин, А.А. Светлаков
56
Шмидта [3, 4]. Результатом его применения являются матрицы S и Q, где Q –
вспомогательная (n × n) – матрица, а его реализация сводится к выполнению следующих этапов.
1. Первые столбцы s1 , q1 и подматрицы S1 , Q1 матриц S и Q вычисляем в соответствии с равенствами
s1 = u1 || u1 || ; q1 = u1 ; S1 = s1 ; Q1 = q1 ; rS1 = rQ1 = 1 .
Здесь u1 – первый столбец матрицы U , который считаем неравным нулевому
1/ 2
n-мерному вектору 0n , а || u1 ||= ( u1 , u1 )
– евклидова норма столбца u1 . Полу-
ченный столбец s1 является нормированным вектором, т.е. таким, что его евклидова норма || s1 ||= 1, 0 .
2. Остальные столбцы sk , qk и подматрицы Sk , Qk матриц S и Q, а также их
ранги rSk и rQk , k = 2, n , формируем, выполняя при каждом значении k следующие операции.
2.1. Строим ортогональную проекцию pk столбца uk на линейную оболочку
L ( s1 , s2 ,..., sk −1 ) , натянутую на столбцы s1 , s2 ,..., sk −1 матрицы Sk −1 , вычисляя ее в
соответствии с соотношением
pk = Sk −1ck = c1k s1 + c2 k s2 + ... + ck −1, k sk −1 ,
(10)
где Sk −1 – ( m × ( k − 1) ) -матрица, составленная из k − 1 столбцов s1 , s2 ,..., sk −1 ,
сформированных на предшествующих k − 1 этапах; c1k , c2 k ,..., ck −1,k – коэффициенты, вычисляемые согласно равенствам
m
c jk = ( uk , s j ) = ∑ uik sij , j = 1, k − 1 .
(11)
i =1
Замечание 1. Непосредственными вычислениями нетрудно убедиться в том,
что совокупность данных равенств можно представить одним, эквивалентным им
векторно-матричным равенством вида ck = SkT−1uk , где SkT−1 – транспонированная
матрица Sk −1 .
Замечание 2. Пусть k = 2 . В этом случае (10) и (11) принимают следующий
вид:
m
p2 = S1c2 = c12 s1 , c12 = ( u2 , s1 ) = ∑ ui 2 si1 .
i =1
Воспользовавшись данными равенствами, легко проверить, что в случае, когда
столбцы u2 и s1 являются строго линейно зависимыми, то p2 = u2 , а в случае,
когда u2 и s1 являются ортогональными, p2 = 0n , где 0n – нулевой n-мерный
вектор-столбец.
2.2. Вычисляем вспомогательный вектор vk и его евклидову норму || vk || в соответствии с формулами
1/ 2
⎛ n
⎞
vk = uk − pk = uk − Sk −1ck ; || vk ||= ⎜ ∑ vik2 ⎟
⎝ i =1 ⎠
.
(12)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Скелетные разложения прямоугольных матриц и их применение
2.3. Проверяем неравенство вида
|| vk ||> regU ,
57
(13)
где regU – некоторое заданное положительное число – параметр структурной регуляризации СЛАУ (1).
2.4. Если данное неравенство выполняется, то формируем k-е столбцы sk , qk и
подматрицы Sk , Qk матриц S и Q согласно следующим равенствам:
sk = vk || vk || ; qk = uk ; Sk = ( Sk −1 sk ) ; Qk = ( Qk −1 qk ) ,
(14)
а их ранги rSk и rQk вычисляем в соответствии с соотношениями
rSk = rSk −1 + 1 , rQk = rQk −1 + 1 .
(15)
2.5. Если неравенство (13) не выполняется, то формируем матрицы Sk и Qk и
их ранги rSk и rQk в следующем виде:
Sk = ( Sk −1
0n ) , Qk = ( Qk −1
rSk = rSk −1 , rQk = rQk −1 .
0n ) ;
(16)
(17)
т.е. оставляем их равными матрицам Sk −1 и Qk −1 , сформированным на предшествующих k − 1 этапах.
2.6. Выполнив операции (10), (11), (12) – (17) при k = n , получаем матрицы
Sn и Qn и формируем необходимые нам матрицы S и Q согласно равенствам
S = Sn , Q = Qn .
Замечание 1. Полученная матрица S является прямоугольной ( n × rs ) -матрицей, ранг которой равен числу ее столбцов rs . При этом ее столбцы являются ортонормированными векторами-столбцами и, таким образом, она удовлетворяет
равенству
S T S = Ers ,
(18)
где S T – транспонированная матрица S, а Ers – единичная матрица порядка rs .
Замечание 2. Как и матрица S, полученная матрица Q является прямоугольной
( n × rS ) -матрицей и ее ранг rQ = rS и, таким образом, она оказывается столбцово-
невырожденной матрицей. При этом ее столбцы q j , j = 1, rQ , являются строго
линейно независимыми столбцами.
Замечание 3. Как будет видно ниже, выполняя операции (16), тем самым устраняем (выбрасываем) столбец uk матрицы U, а компоненту ak решения a СЛАУ
(1) полагаем равной 0 . Устранение uk и обнуление компоненты ak в данном
случае является, очевидно, вполне обоснованным. Действительно, в этом случае
выполняется противоположное неравенство || vk ||≤ regU , которое означает, что
между столбцом uk и предшествующими ему столбцами имеет место достаточно
тесная линейная зависимость и, следовательно, его можно изъять из матрицы U, а
соответствующую ему компоненту ak решения a СЛАУ (1) положить равной 0
и, тем самым, увеличить его устойчивость к ошибкам задания матрицы U.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
58
А.Е. Карелин, А.А. Светлаков
Замечание 4. Как видно из (10), (13) и (16), число столбцов матрицы существенно зависит от параметра регуляризации regU и, таким образом, изменяя его
значение, можно существенно изменять число rs . При этом, чем при большем
значении regU построена матрица S, тем она имеет меньшее число столбцов rs , и
наоборот. Более детально выбор значения regU при построении матрицы S рассмотрим ниже. Здесь же отметим только, что устраняя столбец uk матрицы U и
обнуляя соответствующую ему компоненту ak решения a СЛАУ (1) в соответствии с изложенным выше способом, тем самым осуществляем ее структурную регуляризацию. При этом ее результатом является регуляризированная СЛАУ, число столбцов матрицы коэффициентов и размерность решения которой оказываются согласованными и определяются используемым значением regU .
4. Построение регуляризированных скелетных разложений матрицы U
и регуляризированных решений СЛАУ (1)
Здесь и всюду далее под регуляризированным скелетным разложением матрицы U будем понимать ее скелетное разложение, определяемое равенством вида
Q = SR , где S – прямоугольная (n × rS ) – матрица, построенная в предыдущем
пункте и соответственно являющаяся не только столбцово невырожденной, но
и столбцово-ортогональной матрицей, а R – неизвестная нам прямоугольная
(rS × n) -матрица.
Построение данных разложений сводится к выполнению следующих операций.
1. Множитель R вычисляем согласно равенству
(
R = ST S
)
−1
ST Q .
Так как столбцы s j матрицы S являются ортонормированными векторами, то
матрица S удовлетворяет равенству (18), а равенство для определения R принимает следующий предельно простой вид:
R = Ers S T Q = S T Q .
2. Вычисляем матрицы Û и ∆U , а также евклидову норму || ∆U || матрицы
∆U в соответствии с равенствами
1/ 2
⎛ n
⎞
Uˆ = SR ; ∆U = U − Uˆ ; || ∆U ||= ⎜ ∑ ∆uij2 ⎟
⎜
⎟
⎝ i , j =1
⎠
.
3. Проверяем неравенство вида
|| ∆U ||≤ ∆ .
(19)
Здесь ∆ – некоторое заданное положительное число, выбираемое с учетом погрешностей задания матрицы U в (3), и если оно выполняется, то на этом процесс
построения скелетного разложения SR матрицы U заканчиваем.
4. Если данное неравенство не выполняется, то задаем новое значение параметра regU , определяя его равенством regU = 0,5regU , и строим новое скелетное
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Скелетные разложения прямоугольных матриц и их применение
59
разложение S1 R1 матрицы U, выполняя при этом рассмотренные выше 2-й и все
последующие этапы еще раз. Процесс построения данного разложения продолжаем до тех пор, пока не будет выполнено неравенство (19).
Из вышеизложенного следует, что решение СЛАУ (1) сводится к решению
СЛАУ вида
Qa = y ,
которая оказывается переопределенной СЛАУ. Поэтому в качестве решения данной СЛАУ используем ее псевдорешение a+ , вычисляемое согласно равенству
a+ = Q + y ,
где Q + – псевдообратная матрица к матрице Q.
При этом вычисление псевдообратной матрицы Q + реализуем в соответствии
с формулой
+
(
Q + = ( SR ) = R + S + = RT RRT
−1
) ( ST S )
−1
(
S T = RT RRT
)
−1
ST .
Как известно из линейной алгебры и теории матриц [3, 4], вычисленное в соответствии с данными формулами псевдорешение a СЛАУ (1) минимизирует евклидову норму || y − S + Ra || вектора y − S + Ra и имеет минимальную по сравнению со всеми другими решениями данной СЛАУ евклидову норму || a || и, таким
образом, из всех возможных ее решений оно оказывается наиболее устойчивым к
изменениям исходных данных (ошибкам задания ее правой части y и матрицы коэффициентов U).
Заключение
Основные результаты данной работы сводятся к следующему:
1. Предложен метод структурной регуляризации плохо обусловленных СЛАУ,
основанный на использовании скелетных разложений прямоугольных матриц.
2. Наличие в данном методе параметров regU и ∆ позволяет получить решение плохо обусловленной СЛАУ, устойчивое к ошибкам задания ее правой части
y и матрицы коэффициентов U.
ЛИТЕРАТУРА
1. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М.: Наука, 1979.
288 с.
2. Ильин В.А., Позняк Э.Г. Линейная алгебра. М.: Наука, 1974. 296 с.
3. Светлаков А.А. Традиционное и нетрадиционное оценивание неизвестных величин. Ч. 1.
Простейшие задачи оценивания неизвестных величин по результатам их экспериментальных измерений: учеб. пособие. Томск: Изд-во Томск. гос. ун-та систем упр. и радиоэлектроники, 2007. 550 с.
4. Гантмахер Ф.Р. Теория матриц. М.: Наука, 1988. 552 с.
Карелин Алексей Евгеньевич
Светлаков Анатолий Антонович
Томский государственный университет
систем управления и радиоэлектроники
E-mail: karelin_a@mail.ru, iit@fet.tusur.ru
Поступила в редакцию 30 июня 2013 г.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
60
А.Е. Карелин, А.А. Светлаков
Karelin Aleksei E., Svetlakov Anatoly .A. (Tomsk State University of Control Systems and Radioelectronics). Skeleton decomposition of rectangular matrices and its application for structural regularization of ill-conditioned systems of linear algebraic equations.
Keywords: ill-conditioned SLAE, regularization, skeleton decomposition.
The new method for regularization of ill-conditioned systems of linear algebraic equations
(SLAE) has been considered. The main idea of the method is the correction of structural characteristics of SLAE under consideration. In the paper we mean under “structural characteristics” of
a matrix the dimensions of rows and columns of a coefficient matrix. The structural regularization
of an ill-conditioned SLAE means here the searching of the values of abovementioned parameters, which provide stability of the solution of a SLAE with respect to variations of input data.
The proposed method has been based on the obtaining of skeleton decompositions of matrix by
means of Gram-Schmidt procedure of orthogonalization of finite-dimensional vectors.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
УДК 519.872
В.В. Науменко, М.А. Маталыцкий
АНАЛИЗ СЕТЕЙ С ПОЛОЖИТЕЛЬНЫМИ И ОТРИЦАТЕЛЬНЫМИ
ЗАЯВКАМИ В ПЕРЕХОДНОМ РЕЖИМЕ
Рассматривается сеть массового обслуживания в переходном режиме с положительными и отрицательными заявками, которая может использоваться
при моделировании поведения вирусов в информационно-телекоммуникационных системах и сетях. Выведена система разностно-дифференциальных
уравнений для вероятностей состояний сети. Для их нахождения предложена методика, основанная на использовании аппарата многомерных производящих функций. Получены приближенные выражения для определения вероятностей состояний в любой момент времени. Проводится также исследование такой сети с доходами, описана методика нахождения ожидаемых доходов систем сети.
Ключевые слова: G-сеть с отрицательными заявками, HM-сеть с положительными и отрицательными заявками, переходный режим.
Современные информационно-телекоммуникационные системы и сети становятся все более сложными, что обусловлено необходимостью повышения надежности передачи и обработки информации. Построение и исследование математических моделей для оценки качества их функционирования является важной задачей. Применение для этой цели классических моделей теории массового обслуживания (МО) не всегда дает адекватные результаты, поскольку необходимо, чтобы модели учитывали как характерные особенности систем, так и возможное
влияние различных дестабилизирующих факторов, как например, внезапные сбои,
попадание вирусов, потеря передаваемых или обрабатываемых данных.
Для учета подобных факторов была предложена концепция отрицательных
заявок и связанных с ними сетей и систем МО, принципиально новый класс сетей
МО был введен Е. Геленбе в [1]. Это G-сети, в которых помимо потоков обычных
(положительных) заявок рассматриваются также дополнительные пуассоновские
потоки отрицательных заявок. При поступлении в систему сети отрицательная заявка уничтожает одну положительную заявку, если таковая имеется в данной системе, тем самым уменьшая число положительных заявок в системе на единицу.
Затем отрицательная заявка исчезает из сети, не получив никакого обслуживания.
Например, в компьютерных сетях «положительными» заявками являются задания
(программы), а «отрицательными» – компьютерные вирусы. При поступлении в
компьютерную сеть вирус уничтожает или наносит вред, заражает одну из исполняемых программ, уменьшая количество действующих программ или запросов в
системе на единицу. Следует отметить, что исследование G-сетей в стационарном
режиме проведено в работах [2, 3].
При попадании вируса в информационную систему из-за потери информации
или ее искажения система и вся информационно-телекоммуникационная сеть несет некоторые расходы или убытки. При переходе положительной заявки из одной СМО в другую последняя СМО получает некоторый доход, а доход первой
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Науменко, М.А. Маталыцкий
62
СМО уменьшается соответственно на эту величину. Кроме того, учет этого можно
осуществить, применив в качестве модели сеть МО с доходами (HM-сеть) с положительными и отрицательными заявками. Во второй части данной статьи описана
методика нахождения ожидаемых доходов в системах такой сети. Методика анализа HM-сетей без учета отрицательных заявок и их применения при прогнозировании ожидаемых доходов различных объектов описаны в работе [4].
1. Постановка задачи
Рассмотрим открытую G-сеть МО с n однолинейными СМО. В СМО Si извне
(из системы S0) поступает поток положительных (обычных) заявок интенсивности
+
−
λ 0i
и пуассоновский поток отрицательных заявок интенсивности λ 0i
, i = 1, n .
Все поступающие в сеть потоки заявок являются независимыми. Длительности
обслуживания положительных заявок в СМО Si распределены экспоненциально с
параметром μi , i = 1, n . Отрицательная заявка, поступающая в некоторую систему сети, в которой имеется, по крайней мере, одна положительная заявка, мгновенно уничтожает одну из них и наносит убыток этой СМО. При предположении
экспоненциального распределения времени обслуживания положительных заявок
можно не заботиться о том, какая именно заявка уничтожается. После этого она
сама сразу же покидает сеть или уничтожается в замкнутой сети, не получая в
данной СМО никакого обслуживания. Таким образом, в каждой СМО-сети могут
обслуживаться только положительные заявки, поэтому в дальнейшем, говоря об
обслуживании положительных заявок, обычно для краткости называют их просто
заявками [1]. Положительная заявка при переходе из одной СМО в другую приносит последней системе некоторый доход и соответственно доход первой системы
уменьшается на эту величину.
Каждая положительная заявка направляется в СМО Si с вероятностью p0i+ ,
а отрицательная – с вероятностью p0i− ,
n
n
i =1
i =1
∑ p0+i = ∑ p0−i = 1 , i = 1, n . Положительная
заявка, обслуженная в СМО Si, с вероятностью pij+ направляется в СМО Sj как
положительная заявка, а с вероятностью pij− – как отрицательная заявка и с вероn
(
ятностью pi 0 = 1 − ∑ pij+ + pij−
j =1
i, j = 1, n .
Под
состоянием
)
уходит из сети во внешнюю среду (СМО S0),
сети
будем
понимать
вектор
k ( t ) = (k , t ) =
= (k1 , k2 ,..., kn , t ) , где ki – число заявок в момент времени t в системе Si , i = 1, n .
Пусть P ( k , t ) – вероятность состояния k в момент времени t.
Обозначим через vi (k , t ) – полный ожидаемый доход, который получает система Si за время t, если в начальный момент времени сеть находится в состоянии
k, и предположим, что эта функция дифференцируема по t; ri (k ) – доход системы
Si в единицу времени, когда сеть находится в состоянии k ; r0i (k + I i , t ) – доход
системы Si, когда сеть совершает переход из состояния (k , t ) в состояние
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ сетей с положительными и отрицательными заявками в переходном режиме
63
( k + I i , t + ∆t ) за время ∆t , где I i – вектор размерности n , состоящий из нулей, за
исключением компоненты с номером i , которая равна 1, i = 1, n ; − Ri 0 ( k − I i , t ) –
доход этой системы, если сеть совершает переход из состояния (k , t ) в состояние
( k − I i , t + ∆t ) ; rij+ ( k + I i − I j , t ) – доход системы Si (расход или убыток системы
Sj), когда сеть изменяет свое состояние из (k , t ) на ( k + I i − I j , t + ∆t ) за время ∆t ;
rij− ( k + I i + I j , t ) – доход системы Si (убыток системы S j ), когда сеть изменяет
свое состояние из (k , t ) на ( k + I i + I j , t + ∆t ) за время ∆t , i, j = 1, n .
Требуется найти вероятности состояний сети и ожидаемые (средние) доходы
систем сети за время t при условии, что нам известно ее состояние в начальный
момент t0 .
Теорема. Вероятности состояний рассматриваемой сети удовлетворяют системе разностно-дифференциальных уравнений (РДУ):
n
dP (k , t )
= −∑ ⎡⎣λ 0+i p0+i + λ 0−i p0−i + μi ⎤⎦ u ( ki )P (k , t ) +
dt
i =1
n
n ⎡
n
⎛
⎞⎤
+ ∑ λ 0+i p0+i u (ki )P(k − I i , t ) + ∑ ⎢λ 0−i p0−i + μi ⎜ pi 0 + ∑ pij− (1 − u ( k j ) ) ⎟ ⎥P ( k + I i , t ) +
⎜
⎟
i =1
i =1 ⎢
j =1
⎣
⎝
⎠⎦⎥
n
+ ∑ μi ⎡⎣ pij+ u ( k j ) P ( k + I i − I j , t ) + pij− P ( k + I i + I j , t ) ⎤⎦ ,
(1)
i , j =1
где u ( x ) =
{
1, x > 0
– функция Хевисайда.
0, x ≤ 0
Доказательство. В силу экспоненциальности времен обслуживания заявок
случайный процесс k (t ) = (k , t ) является цепью Маркова со счетным числом
состояний. Возможны следующие переходы в состояние (k , t + ∆t ) за время ∆t :
из состояния (k − I i , t ) с вероятностью λ 0+i p0+i u (ki )∆t + o ( ∆t ) , из состояния
(
)
(k + I i , t ) с вероятностью μi pi 0 + λ 0−i p0−i + μi pij− (1 − u ( k j ) ) ∆t + o(∆t ) , из состояния
(k + I i − I j , t ) с вероятностью
с
вероятностью
μi pij+ u
μi pij− ∆t + o(∆t ) ,
( k j ) ∆t + o(∆t ) , из состояния ( k + Ii + I j , t )
из
состояния
(k , t )
с
вероятностью
n
⎛
⎞
+ +
− −
⎜ 1 − ∑ ⎡⎣ λ 0i p0i + λ 0i p0i + μi ⎤⎦ u ( ki ) ⎟ ∆t + o ( ∆t ) , i = 1, n ; из остальных состояний с
⎝ i =1
⎠
вероятностью o(∆t ) .
Тогда, используя формулу полной вероятности, можно записать
n
P(k , t + ∆t ) = ∑ λ 0+i p0+i u (ki )P(k − I i , t )∆t +
i =1
n
+ ∑ ⎡⎣μi pi 0 + λ 0−i p0−i + μi pij− (1 − u ( k j ) ) ⎤⎦P ( k + I i , t ) ∆t +
i , j =1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Науменко, М.А. Маталыцкий
64
n
+ ∑ μi pij+ u ( k j ) P ( k + I i − I j , t )∆t +
i , j =1
n
∑
i , j =1
pij− P ( k + I i + I j , t )∆t +
n
⎛
⎞
+ ⎜ 1 − ∑ ⎡⎣λ 0+i p0+i + λ 0−i p0−i + μi ⎤⎦ u ( ki ) ⎟ ∆t + o ( ∆t ) .
⎝ i =1
⎠
Разделив обе части этого соотношения на ∆t и переходя к пределу при
∆t → 0, получим систему уравнений для вероятностей состояний сети (1).
2. Нахождение вероятностей состояний сети
Предположим, что все системы сети функционируют в режиме высокой нагрузки, т.е. ki ( t ) > 0 , ∀t > 0 , i = 1, n , тогда система РДУ (1) примет вид
n
dP (k , t )
= −∑ λ 0+i p0+i + λ 0−i p0−i + μi P (k , t ) +
dt
i =1
(
)
n
n
i =1
i =1
(
)
+ ∑ λ 0+i p0+i P(k − I i , t ) + ∑ μi pi 0 + λ 0−i p0−i P ( k + I i , t ) +
n
+ ∑ μi ⎡⎣ pij+ P ( k + I i − I j , t ) + pij− P ( k + I i + I j , t ) ⎤⎦ .
(2)
i , j =1
Обозначим через Ψ n ( z , t ) , где z = ( z1 , z2 ,..., zn ) , n-мерную производящую
функцию
Ψ n ( z, t ) =
∞
∞
∞
∑ ∑ ... ∑ P(k1 , k2 ,.., kn , t ) z1k z2k
1
k1 = 0 k2 = 0
=
2
kn = 0
∞
∞
∞
n
kn = 0
i =1
⋅ ... ⋅ znkn =
∑ ∑ ... ∑ P(k , t ) ∏ zik .
i
k1 = 0 k2 = 0
n
Умножив (2) на
∏ zlk
l
и просуммировав по всем возможным значениям kl от
l =1
1 до +∞ , l = 1, n , получим линейное неоднородное дифференциальное уравнение
(ДУ)
n
n
⎡n
d Ψ n ( z, t )
μ p + λ 0−i p0−i
= − ⎢ ∑ λ 0+i p0+i + λ 0−i p0−i + μi − ∑ λ 0+i p0+i zi − ∑ i i 0
−
dt
zi
i =1
i =1
⎣ i =1
(
)
n
zj
i , j =1
zi
− ∑ μi pij+
μi pi 0 + λ −0 i p −0 i
zi
i =1
n
zj
i , j =1
zi
− ∑ μi pij+
n
i , j =1
∑
k j =1
j =1, n , j ≠ i
∞
∑
km =1
m =1, n , m ≠ j
1 ⎤
⎥ Ψ n ( z, t ) −
i j⎥
⎦
∑ μi pij− z z
∞
n
−∑
−
n
P(k1 ,..., ki −1 , 0, ki +1.., kn , t )∏ zl l −
k
l =1
l ≠i
n
P (k1 ,..., ki −1 , 0, ki +1 ,..., kn , t )∏ zl l −
l =1
l ≠i
k
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ сетей с положительными и отрицательными заявками в переходном режиме
n
1
zi z j
− ∑ μi pij−
i , j =1
∞
n
∑
km =1
m =1, n , m ≠ j
P (k1 ,..., ki −1 , 0, ki +1 ,..., kn , t )∏ zl l .
k
65
(3)
l =1
l ≠i
Поскольку все СМО-сети функционируют в условиях высокой нагрузки, то последние три выражения в виде сумм в уравнении (3) будут равны нулю и оно становится однородным:
n
n
⎡n
d Ψ n ( z, t )
μ p + λ 0−i p0−i
= − ⎢ ∑ λ 0+i p0+i + λ 0−i p0−i + μi − ∑ λ 0+i p0+i zi − ∑ i i 0
−
dt
zi
i =1
i =1
⎣ i =1
(
)
n
zj
i , j =1
zi
− ∑ μi pij+
−
1 ⎤
⎥ Ψ n ( z, t ) .
i j⎥
⎦
n
∑ μi pij− z z
i , j =1
Решение его имеет вид
n
n
⎧ ⎡n
1
Ψ n ( z , t ) = Cn exp ⎨− ⎢ ∑ λ 0+i p0+i + λ 0−i p0−i + μi − ∑ λ 0+i p0+i zi − ∑
μi pi 0 + λ 0−i p0−i −
⎩ ⎣ i =1
i =1
i =1 zi
(
)
n
n
j =1
j =1
(
1
zj
−μi ∑ pij+ z j − μi ∑ pij−
⎞⎤
⎟⎟ ⎥
⎠⎦⎥
⎫⎪
t⎬ .
⎭⎪
Будем считать, что в начальный момент времени сеть находится в состоянии
(α1 , α 2 ,..., α n , 0), αi > 0 , i = 1, n ,
P(α1 , α 2 ,..., α n , 0) = 1,
P(k1 , k2 ,..., kn , 0) = 0,
∀αi ≠ ki , i = 1, n . Тогда начальным условием для последнего уравнения будет
n
n
Ψ n ( z , 0) = P(α1 , α 2 ,..., α n , 0)∏ zl l = ∏ zl l . Используя его, получаем Cn = 1 .
α
l =1
α
l =1
Таким образом, выражение для производящей функции Ψ n ( z , t ) с учетом разложения входящей в него экспоненты в ряд Маклорена имеет вид
∞
∞
Ψ n ( z , t ) = a0 (t ) ∑ ... ∑
l1 = 0
∞
∞
∞
∞
∞
∑ ... ∑ ∑ ... ∑ ∑ ... ∑ t
ln = 0 q1 = 0
qn = 0 r1 = 0
rn = 0 u1 = 0
r
⎡
⎞i
qi r + u ⎛ n
l
l
+
+
−
−
+
i
i
n
1
⎢ λ p0i μi pi 0 + λ 0i p0i μi
⎜⎜ ∏ pij ⎟⎟
n ⎢ 0i
⎝ j =1 ⎠
×∏ ⎢
!
!
!
!
l
q
r
u
i i i i
i =1 ⎣
(
∞
)
n
∑ ( li + qi + ri + ui )
i =1
×
un = 0
u
⎤
⎛ n −⎞ i
⎥
⎜⎜ ∏ pij ⎟⎟
⎝ j =1 ⎠ z αi + li − qi − ri + R −ui −U ⎥ ,
⎥
i
⎦
(4)
n
n
⎧ n
⎫
где R = ∑ ri , U = ∑ ui , a0 (t ) = exp ⎨−∑ λ 0+i p0+i + λ 0−i p0−i + μi t ⎬ . Вероятности со⎩ i =1
⎭
i =1
i =1
стояний P ( k , t ) являются коэффициентами разложения функции Ψ n ( z , t ) в мно-
(
)
гократный ряд по степеням zi , i = 1, n .
Пример. Пусть количество СМО в сети n = 5 . Интенсивности входного пото+
−
ка положительных и отрицательных заявок λ 0i
и λ 0i
равны соответственно:
+
+
+
+
+
−
−
−
−
−
λ 01
= 2 , λ 02
= 3 , λ 03
= 2 , λ 04
= 4 , λ 05
= 5 , λ 01
= 1 , λ 02
= λ 03
= λ 04
= 0 , λ 05
= 1.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Науменко, М.А. Маталыцкий
66
Интенсивности обслуживания заявок μi равны μ1 = μ 2 = μ3 = 2 , μ 4 = 1 , μ5 = 3 .
Пусть также вероятности p0i+ , с которыми положительная заявка направляется в
+
+
+
+
+
СМО Si , равны p01
= 2 /15 , p02
= 1/ 5 , p03
= 1/15 , p04
= 4 /15 , p05
= 1/ 3 , а
аналогичные
вероятности
для
отрицательных
заявок
−
p01
= 1/ 3 ,
равны
−
−
−
−
p02
= p03
= p04
= 0 , p05
= 2 / 3 . Вероятности pij+ того, что положительные заявки,
обслуженные в СМО Si, направятся в СМО Sj как положительные заявки,
+
+
+
+
+
+
+
+
+
+
+
+
+
= p13
= p14
= p21
= p23
= p24
= p31
= p32
= p34
=1/3 , p41
= p42
= p43
= p45
= 1/ 4 ,
равны: p12
+
p54
= 1/ 2 . C вероятностью p50 = 1/ 2 заявка уходит из сети во внешнюю среду.
{ }
71
− t
71
t =e 5 .
5
Пусть нам надо найти, например, вероятность состояния P(1,1,...,1, t ) . Она яв-
Тогда выражение a0 ( t ) примет вид a0 (t ) = exp −
ляется коэффициентом при z1 z2 ⋅ ... ⋅ zn в разложении функции Ψ n ( z , t ) в многократный ряд (4), поэтому степени при zi должны удовлетворять соотношению
αi + li − qi − ri + R − ui − U = 1 , i = 1, n , отсюда следует, что
qi
=
n
n
j =1
j ≠i
j =1
j ≠i
αi + li + ∑ r j − ∑ u j − 1 , i = 1, n ,
qi + ri + ui
li + qi + ri + ui
n
n
j =1
j =1
αi + li + ∑ r j − ∑ u j − 1 , i = 1, n ,
=
=
n
n
j =1
j =1
α i + 2li + ∑ r j − ∑ u j − 1 , i = 1, n ,
n
n
i =1
i =1
∑ ( li + qi + ri + ui ) = ∑ ( αi + 2li ) + n( R − U − 1) .
Тогда из соотношения (4) получаем, что
P(1,1,1,1,1, t ) = e
−
71 ∞
t
5
∞
∞
∞
∞
∞
∑ ... ∑ ∑ ... ∑ ∑ ... ∑ t
l1 = 0
ln = 0 r1 = 0
rn = 0 u1 = 0
n
∑ ( αi + 2li ) + n ( R −U −1)
i =1
r
n
n
⎡
⎞i
αi + li + ∑ r j − ∑ u j −1 r + u ⎛ n
l
l
+
+
+
−
−
+
i
i
n
1
⎢ λ p0i μi pi 0 + λ 0i p0i
j =1
j =1
μi
⎜⎜ ∏ pij ⎟⎟
j ≠i
j ≠i
n ⎢ 0i
⎝ j =1 ⎠
×∏ ⎢
n
n
⎛
⎞
i =1 ⎢
li !⎜ αi + li + ∑ r j − ∑ u j − 1⎟ !ri !u i!
⎢
j =1
j =1
⎜
⎟
⎢⎣
j ≠i
j ≠i
⎝
⎠
(
)
×
un = 0
u
⎛ n −⎞ i ⎤
⎜⎜ ∏ pij ⎟⎟ ⎥
⎝ j =1 ⎠ ⎥ , n = 5 .
⎥
⎥
⎥
⎦⎥
На рис. 1 изображен график данной вероятности при различных значениях t.
Отметим, что, зная вероятности состояний сети, можно, в принципе, найти выражения для любых средних характеристик рассматриваемой сети.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ сетей с положительными и отрицательными заявками в переходном режиме
67
P(1,1,1,1,1,t)
3⋅10–7
2,5⋅10–7
2⋅10–7
1,5⋅10–7
10–7
5⋅10–8
9,7⋅10–9
0
2
4
6
8
10
t
Рис. 1. График вероятности состояния P (1,1,1,1,1, t )
3. Анализ сети с доходами, когда доходы от переходов
между состояниями сети – детерминированные функции
Будем рассматривать теперь нашу сеть с учетом доходов и расходов СМО сети
при обслуживании положительных и отрицательных заявок. Рассмотрим случай,
когда доходы от переходов между состояниями сети являются детерминированными функциями, зависящими от состояний сети и времени. Возможные переходы между состояниями сети, вероятности переходов и доходы системы Si от этих
переходов указаны в таблице. Они находятся аналогично как в [4] для сети без отрицательных заявок.
Возможные переходы между состояниями сети, их вероятности и доходы системы Si
Возможные переходы
между состояниями сети
Вероятности переходов
Доходы системы Si
от переходов между
состояниями
n
( k ,t ) → (k ,t +∆t )
1− ∑ ⎡⎣λ 0+i p0+i +λ 0−i p0−i +μi ⎤⎦ ×
i=1
ri (k ) ∆t + vi (k ,t )
×u (ki )∆t + o(∆t )
( k ,t ) → (k + I j ,t +∆t ) , j ≠ i
(μ j p j 0 +λ0− j p0− j +
+μ j p −ji (1− u (ki )))∆t + o(∆t )
ri (k ) ∆t + vi (k + I j ,t )
( k ,t ) → (k − I j ,t +∆t ) , j ≠ i
λ 0+ j p0+ j u ( k j )∆t + o(∆t )
ri (k ) ∆t + vi (k − I j ,t )
( k ,t ) → ( k + I c − I s ,t +∆t ) , c, s ≠ i
+
μc pcs
u (ks )∆t + o(∆t )
ri (k )∆t + vi ( k + I c − I s ,t )
( k ,t ) → (k + I i ,t +∆t )
( k ,t ) → (k − I i ,t +∆t )
(
μi pi 0 +λ 0−i p0−i +
)
+μi pij− (1− u (k j )) ∆t + o(∆t )
λ 0+i p0+iu (ki )∆t + o(∆t )
r0i (k + I i ,t ) + vi (k + I i ,t )
− Ri 0 (k − I i ,t ) + vi ( k − I i ,t )
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Науменко, М.А. Маталыцкий
68
Окончание таблицы
Возможные переходы
между состояниями сети
Вероятности переходов
( k ,t ) → ( k + I i − I j ,t +∆t ) , j ≠ i
μi pij+u (k j )∆t + o(∆t )
( k ,t ) → ( k + I i + I j ,t +∆t ) , j ≠ i
μi pij− ∆t + o(∆t )
Доходы системы Si
от переходов между
состояниями
+
rij (k + I i − I j ,t ) +
+ vi ( k + I i − I j ,t )
rij− (k + I i + I j ,t ) +
+ vi ( k + I i + I j ,t )
Тогда, используя формулу полной вероятности для математического ожидания, получаем систему РДУ для дохода vi ( k , t ) :
dvi (k , t )
= − λ 0+i p0+i + λ 0−i p0−i + μi u ( ki ) vi (k , t ) +
dt
(
n
)
(
)
+ ∑ ⎡⎣ μ j p j 0 + λ 0− j p0− j + μ j p −ji (1 − u ( ki ) ) vi (k + I j , t ) + λ 0+ j p0+ j u (k j )vi (k − I j , t ) ⎤⎦ +
j =1
n
+ ∑ ⎡⎣μi pij+ u ( k j ) vi (k+I i −I j , t ) + μ j p ji+ u ( ki ) vi (k−I i +I j , t ) + μi pij− vi (k+I i +I j , t ) ⎤⎦ +
j =1
j ≠i
n
+ ∑ ⎡⎣μi pij+ u (k j ) rij+ (k + I i − I j ,t ) −μ j p +ji u (ki ) rij+ (k − I i + I j ,t ) + μi pij− rij− (k + I i + I j ,t )⎤⎦ +
j =1
j ≠i
n
(
)
+
+ ∑ μc pcs
u ( k s ) vi (k + I c − I s , t ) + μi pi 0 + λ 0−i p0−i + μi pij− (1 − u ( k j ) ) r0i (k + I i , t ) −
c , s =1
c, s ≠i
−λ 0+i p0+i u (ki ) Ri 0 (k − I i , t ) + ri (k ) .
(5)
Число уравнений в этой системе равно числу состояний сети, т.е. для открытой
сети равно ∞ . Формально система уравнений (5) может быть сведена к системе
счетного числа линейных неоднородных ОДУ с постоянными коэффициентами,
которая в матричной форме может быть записана в виде
dVi (t )
= Qi (t ) + AVi (t ) ,
dt
(6)
где ViT (t ) = ( vi (1, t ), vi (2, t ),..., vi (l , t ),...) – искомый вектор доходов системы Si . Решение системы (6) можно найти, используя прямой метод (с помощью матричной
экспоненты). Умножив обе части системы (6) на e − At , получим
e − AtVi' (t ) = e− At AVi (t ) + e− At Qi (t ) ,
откуда следует, что
t
Vi (t ) = e At Vi (0) + ∫ e A(t −τ) Qi (τ)d τ ,
0
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ сетей с положительными и отрицательными заявками в переходном режиме
где e At = I + At +
69
A2 t 2
Am t m
+… +
+ … – матричная экспонента, I – единичная
2!
m!
матрица. Для нахождения матрицы e At необходимо найти собственные значения
q1 , q2 ,… , ql ,... матрицы A и полную систему соответствующих им правых собственных векторов u (1) , u (2) ,… , u (l ) ,... , если это возможно [5]. Затем мы должны
воспользоваться представлением
e At = UB (t )U −1 ,
где U
– матрица, столбцами которой являются собственные векторы u (1) ,
u (2) ,…, u (l ) ,... ; B(t ) – диагональная матрица
⎛ e q1t
⎜
⎜ 0
B(t ) = ⎜
⎜
⎜ 0
⎜
⎝
e
0
0
q2t
0
0
e ql t
⎞
⎟
⎟
⎟.
⎟
⎟
⎟
⎠
Но из-за неограниченности размерности матриц A , Qi ( t ) на практике такой
способ можно применить только в частных случаях, когда они имеют специальный вид.
Для решения системы (5) можно применить метод многомерных z-преобразований, введя в рассмотрение многомерные z-преобразования для ожидаемых
доходов систем сети:
ϕi ( z , t ) =
∞
∞
∞
∑ ∑ … ∑ vi (k1 , k2 ,… , kn , t ) z1k z2k
1
k1 = 0 k2 = 0
kn = 0
{
2
⋅… ⋅ znkn =
∞
n
ki = 0,
i =1, n
l =1
∑ vi (k , t )∏ zlk
l
,
}
z ∈ ( z1 , z2 ,..., zn ) / zi < 1, i = 1, n ,
получив для них соотношения подобным образом, как в [4]. На основе этих соотношений можно предложить алгоритм вычисления ожидаемых доходов, но, как
показывает опыт [6, 7], такие алгоритмы являются довольно сложными для реализации. Для решения систем РДУ, подобных (5), в [4] также предложено использовать метод последовательных приближений, совмещенный с методом рядов.
Заключение
В работе предложена методика нахождения нестационарных вероятностей состояний сети МО с однолинейными СМО, положительными и отрицательными
заявками, основанная на использовании аппарата многомерных производящих
функций. Получены приближенные выражения для вероятностей состояний в условиях высокой нагрузки. Предложена также методика нахождения ожидаемых
доходов в СМО такой сети, зависящих от времени. Дальнейшие исследования в
этом направлении связаны с получением аналогичных результатов для сетей с
многолинейными СМО.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
70
В.В. Науменко, М.А. Маталыцкий
ЛИТЕРАТУРА
1. Gelenbe E. Product form queueing networks with negative and positive customers // J. Appl.
Prob. 1991. V. 28. P. 656−663.
2. Бочаров П.П., Вишневский В.М. G-сети: развитие теории мультипликативных сетей //
Автоматика и телемеханика. 2003. № 5. С. 46–74.
3. Gelenbe E., Schassberger R. Stability of product-form G-networks // Probab. Eng. and Inf. Sci.
1992. V. 6. P. 271–276.
4. Маталыцкий М.А. О некоторых результатах анализа и оптимизации марковских сетей с
доходами и их применении // Автоматика и телемеханика. 2009. № 10. С. 97–113.
5. Маталыцкий М.А., Тихоненко О.М., Колузаева Е.В. Системы и сети МО: анализ и применения. Гродно: ГрГУ, 2011. 817 с.
6. Маталыцкий М.А., Колузаева Е.В. Анализ ожидаемых доходов в открытой сети с помощью z-преобразований // Вестник ГрГУ. Сер. 2. 2008. № 1. С. 20–30.
7. Колузаева Е.В., Нахождение ожидаемых доходов в открытой двух узловой HM-сети с
помощью z-преобразований // Вестник ГрГУ. Сер. 2. 2010. № 3. С. 9–14.
Науменко Виктор Викторович
Маталыцкий Михаил Алексеевич
Гродненский государственный университет им. Я. Купалы
E-mail: victornn86@gmail.com; m.matalytski@gmail.com
Поступила в редакцию 7 июня 2013 г.
Naumenko Victor V., Matalytski Mikhail A. (Grodno State University). Analysis of networks
with positive and negative messages at transient behavior.
Keywords: G-network with negative messages, HM-network with positive and negative messages, transient behavior.
The object of research is queueing network with one-line systems, positive and negative messages which can be used to model the behavior of viruses in the information and telecommunication systems and networks. It is obtained a system of difference-differential equations for the nonstationary states probabilities of the network. To find the state probabilities of the network applied
a methodology based on the use of the apparatus of multidimensional generating functions. It is
obtained an expression for generating function.
Also is conducted an investigation of such a network with incomes (HM-networks). It is considered the case: when the incomes from the state transition networks are deterministic functions
depending on network states and time. It is obtained a system of difference-differential equations
for the expected incomes of systems in the network. It is proposed the ways of solving it.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
УДК 336:51
Г.А. Медведев
О ВРЕМЕННОЙ СТРУКТУРЕ ДОХОДНОСТИ. 7. НОВАЯ ВЕРСИЯ
В отличие от предыдущих статей серии при анализе временной структуры
процентных ставок предлагается рассматривать временную переменную не
как дюрацию краткосрочной процентной ставки (там временная переменная
зависит от параметров рассматриваемых моделей, что затрудняет сравнение
доходностей для одних и тех же реальных сроков до погашения), а как некоторое не зависящее от параметров модели нелинейное преобразование
временных сроков, позволяющее отображать всю временную ось на интервал единичной длины. Использование такого подхода проиллюстрировано
при анализе свойств кривой доходности и форвардной кривой для одно-,
двух- и трехфакторных моделей процентных ставок.
Ключевые слова: процентные ставки доходности, аффинная модель,
функции временной структуры, одно-, двух- и трехфакторные модели.
Будем считать, что для n-факторной модели аффинной доходности предполагается, что вектор состояния финансового рынка X(t) = (X1, X2, …, Xn)Т следует однородному по времени марковскому процессу, порождаемому стохастическим
дифференциальным уравнением
dX(t) = μ(X(t)) dt + σ(X(t)) dW(t)
с n-вектором дрейфа μ(x), (n×m)-матрицей волатильности σ(x) и m-вектором W(t)
независимых стандартных винеровских процессов [1]. При этом вектор дрейфа
μ(x) и матрица диффузии σ(x)σ(x)Т должны быть аффинными функциями относительно переменных x, а рыночные цены риска такими, что σ(x)λ(x) – n-вектор с
аффинными компонентами относительно переменных x:
μ(x) = K(θ − x),
σ(x)σ(x)Т = α +
n
∑ βi xi ,
i =1
σ(x)λ(x) = ξ +
n
∑ ηi xi .
(1)
i =1
Здесь K, α и βi − (n×n)-матрицы; θ, ξ и ηi − n-векторы, xi − компоненты вектора x.
Эти свойства для n-факторной модели аффинной доходности приводят к следующим обыкновенным дифференциальным уравнениям для функции A(τ) и компонент вектора B(τ) = (B1(τ), B2(τ), …, Bn(τ)), τ – срок до погашения:
A′(τ) = (ξ − Kθ)ТB(τ) + B(τ)Тα B(τ)/2, A(0) = 0;
(2)
Bi′(τ) = φi − B(τ)Т(ηi + Ki) − B(τ)Тβi B(τ)/2, Bi(0) = 0.
(3)
В уравнении для Bi(τ) символ Ki обозначает i-й столбец матрицы K, 1 ≤ i ≤ n. Если
среди переменных состояния имеется краткосрочная процентная ставка r, то компоненты вектора φ по экономическому смыслу доходности должны определяться
так, чтобы φr = 1, а остальные компоненты равны нулю. Кривая доходности y(τ, x)
и форвардная кривая f(τ, x) определяются через функции A(τ) и B(τ) по формулам
y (τ, x) =
x T B(τ) − A(τ)
dB(τ) dA(τ)
, f (τ, x) = x T
−
.
τ
dτ
dτ
(4)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
72
Вслед за функциями A(τ) и B(τ) доходности y(τ, x) и f(τ, x) определяются на неограниченном интервале сроков погашения τ ∈[0, ∞]. Поэтому их визуальный сравнительный анализ на всем интервале изменения сроков до погашения τ затрудняется этой неограниченностью. Для устранения этого недостатка в [1] предложено
в качестве временной переменной τ для измерения сроков до погашения использовать меру дюрации Br(τ) краткосрочной процентной ставки r. Тогда неограниченный интервал τ ∈ [0, ∞] будет отображаться в конечный интервал Br ∈ [0,
Br(∞)], Br(∞) < ∞. Такой подход описан в [1] для серии одно-, двух- и трехфакторных моделей. Он улучшает визуализацию сравнительного анализа кривых доходности, однако имеет существенный недостаток, заключающийся в том, что Br(∞)
зависит от всех параметров модели, что влечет зависимость длительности интервала [0, Br(∞)] от любого из этих параметров. Вследствие этого, изменение любого параметра модели приводит к изменению временной шкалы. Это хорошо иллюстрируется, например, рис. 3 из статьи 5 серии [1], где интервал изменения дюрации процентной ставки существенно меняется с изменением волатильности модели. В настоящей статье предлагается другое преобразование временной переменной, которое отображает неограниченный интервал изменения сроков погашения τ ∈ [0, ∞] в единичный интервал [0, 1] независимо от параметров модели.
Введем переменную u соотношением u = 1 − exp[−ρτ], где ρ − параметр преобразования, ρ > 0. При таком преобразовании шкалы изменения сроков до погашения τ неограниченный интервал [0, ∞] возможных значений сроков погашения
отображается в единичный интервал [0, 1] изменения переменной u. Заметим, что
введенное преобразование обеспечивает взаимно однозначное соответствие между переменными u и τ, когда всякому фиксированному сроку до погашения τk соответствует единственное значение переменной u = uk = 1 − exp[−ρτk], и наоборот,
всякому фиксированному значению переменной u = uk > 0 соответствует единственный срок до погашения τk = − ln(1 − uk)/ρ > 0.
Таким образом, используя преобразование переменной τ = − ln(1 − u)/ρ в соотношениях (4), вместо функций доходностей y(τ, x) и f(τ, x), заданных на неограниченном интервале τ ∈ [0, ∞], можно получить функции Y(u, x) и F(u, x), заданные
на конечном интервале u ∈ [0, 1]. Функции Y(u, x) и F(u, x) имеют практически те
же свойства, что и доходности y(τ, x) и f(τ, x), поэтому могут рассматриваться как
их эквиваленты.
Рассмотрим это более детально. Пусть значения τk и uk связаны соотношениями τk = − ln(1 − uk)/ρ и соответственно uk = 1 − exp[−ρτk].
По определению Y(uk, x) ≡ y(− ln(1 − uk)/ρ, x) = y(τk, x) для всех τk ∈ [0, ∞], uk =
= 1 − exp[−ρτk]. Поэтому область возможных значений Y(uk, x) полностью совпадает
с областью возможных значений y(τk, x), τk ∈ [0, ∞]. Заметим, что взаимоотношения
между функциями F(u, x) и f(τ, x) точно такие же, как и между функциями Y(u, x)
и y(τ, x). Так что достаточно рассмотреть только одну пару функций Y(u, x) и
y(τ, x), чтобы иметь представление о свойствах другой пары F(u, x) и f(τ, x).
Предельные значения функций Y(u, x) и y(τ, x) на границах области определения функций совпадают:
lim y (τ, x) = lim Y (u , x),
lim y (τ, x) = lim Y (u , x).
τ→0
u →0
τ→∞
u →1
Пусть y(τ, x) возрастает (убывает) в окрестности точки τ = τk. Вектор переменных состояния x рассматриваем здесь и всюду далее как набор фиксированных
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 7. Новая версия
73
параметров. Тогда функция Y(u, x) будет возрастать (убывать) в окрестности точки uk = 1 − exp[−ρτk]. Это следует из соотношений
∂Y (u , x) ∂y (τ, x) d τ ∂y (τ, x) d (− ln(1 − u ) / ρ)
1 ∂y (τ, x)
1
=
=
=
,
> 0,
∂u
∂τ du
∂τ
du
ρ(1 − u ) ∂τ
ρ(1 − u )
справедливых для всех ρ > 0 и 0 < u < 1. Заметим также, что справедливо следующее соотношение между производными
∂
∂
.
(5)
= ρ(1 − u )
∂τ τ=− ln(1−u ) / ρ
∂u
Если при некотором значении τ = τk функция y(τ, x) имеет максимум (минимум),
то функция Y(u, x) будет иметь максимум (минимум) в точке uk = 1 − exp[−ρτk].
К сожалению, свойство выпуклости функции y(τ, x) на некотором интервале
значений τ может не обеспечить выпуклости функции Y(u, x) на соответствующем
интервале значений переменной u, так как для выполнения неравенства
∂ 2Y (u , x)
∂u 2
необходимо, чтобы
=
⎛ ∂ 2 y (τ, x)
∂y (τ, x) ⎞
>0
+ρ
⎟
2
2 ⎜
2
∂τ ⎠ τ=− ln(1−u ) / ρ
ρ (1 − u ) ⎝ ∂τ
1
∂ 2 y (τ, x)
∂τ
2
> −ρ
∂y (τ, x)
, для чего недостаточно усло∂τ
2
∂ y (τ, x)
> 0, так как наклон кривой доходности y(τ, x) может быть и отрица∂τ2
тельным.
Если при некотором значении τ = τk имеет место неравенство y(τk, x) < f(τk, x)
(или y(τk, x) > f(τk, x)), то справедливо неравенство Y(uk, x) < F(uk, x) (или Y(uk, x) >
F(uk, x)) в точке uk = 1 − exp[−ρτk].
Основываясь на этих свойствах, можно полагать, что функции Y(u, x) и F(u, x)
достаточно хорошо отражают свойства кривых доходности, заданы на конечном
интервале переменной u, которая не связана с параметрами модели, и могут служить для описания свойств доходности на всем интервале изменения сроков погашения. В связи с этим в дальнейшем Y(u, x) и F(u, x) будут называться тоже
кривой доходности и форвардной кривой соответственно. Относительно параметра ρ, определяющего переменную u, заметим, что при изображении кривых на рисунках значением этого параметра можно устанавливать долю интервала [0, 1],
которую желательно выделить для представления интересуемых сроков погашения. Например, если желательно, чтобы на 90 % длины интервала [0, 1] были
представлены сроки до погашения, не превышающие T, значение параметра следует выбирать равным ρ = ln10/T.
Получим уравнения для определения функций Y(u, x) и F(u, x). Для этого естественно применить равенства (4), приспособленные для переменной u. Используем в (4) подстановку τ(u) = − ln(1 − u)/ρ и формулы дифференцирования (5), введя
обозначения a(u) ≡ A(τ(u)) и b(u) ≡ B(τ(u)). Тогда получим
вия
Y (u , x) = ρ
a (u ) − x T b(u )
,
ln(1 − u )
db(u ) da (u ) ⎞
F (u , x) = ρ(1 − u ) ⎛⎜ x T
−
⎟.
du
du ⎠
⎝
(6)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
74
Для определения функций a(u) и b(u) можно использовать уравнения (2) и (3),
что с помощью (5) приводит к уравнениям
(7)
ρ(1 − u)a′(u) = (ξ − Kθ)Тb(u) + b(u)Тαb(u)/ 2 , a(0) = 0;
ρ(1 − u)bi′(u) = φi − b(u)Т(ηi + Ki) − b(u)Тβi b(u)/ 2 , bi(0) = 0.
(8)
Определим теперь функции доходности Y(u, x) и F(u, x) для моделей, исследовавшихся в [1], и проанализируем их свойства. Приведенные ниже численные результаты, иллюстрирующие поведение функций доходности, основаны на наборе
параметров, найденных Д. Аном и Б. Гао [2], приспосабливавшим модель Даффи
– Кана для описания динамики процесса годовой ставки доходности одномесячных бумаг Казначейства США для периода наблюдения с января 1960 г. по февраль 1991 г.
1. Однофакторная модель Даффи – Кана
Модель Даффи – Кана использует процесс краткосрочной процентной ставки
r(t) в форме [1]
r (t ) − rinf
dW(t), r(0) > rinf,
(9)
dr(t) = k(θ − r(t))dt + 2kD
θ − rinf
где параметры θ и D являются константами, но позже при расширении модели до
двух- или трехфакторной они будут предполагаться диффузионными процессами
θ(t) и D(t).
Функции Y(u, x) и F(u, x) для этой модели находятся в аналитическом виде, а в
качестве переменной состояния x здесь используется краткосрочная процентная
ставка r = r(t):
−1
⎛
⎞
ε
b(u) = ⎜
+V ⎟ ,
−ε / ρ
−1
⎝ (1 − u )
⎠
b(u ) ζ − k ln(1 + vb(u )) vV ⎞
⎛k
Y(u, r) = rinf + (θ − rinf ) ⎜ + ε
,
ln(1 + vb(u )) − ln(1 − Vb(u )) ⎟⎠
⎝V
где
F(u, r) = r + (θ − rinf)[kb(u) − (V − v) ζ b(u) − vV ζ b(u)2],
2
ε = ( k + λσ ) + 2σ , v =
r − rinf
(ε − k − λσ)
(ε + k + λσ)
2kD
.
, V=
, σ=
, ζ=
θ − rinf
2
2
θ − rinf
Рыночная цена риска λ и нижняя граница процентной ставки rinf являются фиксированными параметрами модели. На рис. 1 представлены примеры функций доходности Y(u, r) и F(u, r) для набора параметров Ана – Гао:
k = 0,1347; θ = 0,0762; rinf = 0,03315 при r = 0,05, λ = 0,1.
Рис. 1 иллюстрирует монотонное уменьшение доходности с ростом волатильности процесса краткосрочной процентной ставки. Причем интересно отметить,
что для малых дисперсий форвардная доходность превышает ставку доходности
до погашения для любых сроков τ. Однако с ростом дисперсии картина меняется
и уже доходность до погашения доминирует над форвардной ставкой также для
любых сроков до погашения. Критическое значение дисперсии, меняющее картину, находится из равенства Vζ = k.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 7. Новая версия
75
Y(u), F(u)
0,065
0,055
0,045
0,035
0
0,2
0,4
0,6
u
0,8
Рис. 1. Функции доходности Y(u, r) (пунктирные линии) и F(u, r) (сплошные линии) для различных значений дисперсии процентных ставок r(t):
D = 0,0002 (верхняя пара кривых); 0,002892 (оценка Ана – Гао); 0,02; 0,2
(нижняя пара кривых). Маркеры горизонтальной оси обозначают реальную продолжительность срока до погашения: ромб – 1 год, треугольник –
10 лет, квадрат – 30 лет. Кружком отмечены предельные значения функций для τ = 0 (слева) и τ = ∞ (справа). Текущее состояние r(t) = r = 0,05
2. Двухфакторные модели
Для перехода к двухфакторной модели нужно выбрать дополнительную переменную состояния. Это можно сделать, предположив, что ею является либо параметр θ, либо параметр D. В первом случае θ рассматривается как стохастически
изменяющееся локальное (по времени) среднее θ(t) процентной ставки, а во втором – D становится стохастическим процессом D(t) ее локальной (по времени)
дисперсии. Рассмотрим оба этих варианта. В первом случае уравнение (5) однофакторной модели преобразуется в пару уравнений
dr(t) = kr(θ(t) − r(t))dt + 2kr Dr
r (t ) − rinf
dWr(t), r(0) > rinf;
θ0 − rinf
(10)
dθ(t) = kθ(θ0 − θ(t))dt + 2kθ Dθ
θ(t ) − rinf
dWθ(t), θ(0) > rinf.
θ0 − rinf
(11)
В этом случае вектор переменных состояния X(t) = (r(t), θ(t))Т, а параметры
системы, определяемые соотношениями (1), имеют представления
⎛k
μ(X(t)) = K(θ − X(t)) = ⎜ r
⎝0
σ(X(t))σ(X(t))Т = α +
− kr ⎞
kθ ⎟⎠
⎛ θ0 − r (t ) ⎞
⎜ θ − θ(t ) ⎟ ;
⎝ 0
⎠
n
∑ βi X i (t ) =
i =1
⎛ 2kr Dr rinf
⎜ θ −r
= − ⎜ 0 inf
⎜
0
⎜
⎝
0
2kθ Dθ rinf
θ0 − rinf
⎞
⎟ ⎛ 2kr Dr
⎟ + ⎜ θ0 − rinf
⎟ ⎜⎜
0
⎟ ⎝
⎠
⎛0
⎞
0⎟
r (t ) + ⎜
⎜⎜ 0
⎟
0 ⎟⎠
⎝
0
2kθ Dθ
θ0 − rinf
⎞
⎟ θ(t ) ;
⎟⎟
⎠
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
76
σ(X(t))λ(X(t)) = ξ +
n
∑ ηi X i (t ) =
i =1
⎛ 2kr Dr λ r rinf
⎜ θ −r
0
inf
= −⎜
⎜ 2kθ Dθ λ θ rinf
⎜ θ −r
⎝
0
inf
⎞
⎛ 2kr Dr λ r
⎟
⎟ + ⎜ θ −r
⎜⎜ 0 inf
⎟
0
⎝
⎟
⎠
0
⎛
⎞
⎟ r (t ) + ⎜ 2k D λ
⎜⎜ θ θ θ
⎟⎟
⎠
⎝ θ0 − rinf
⎞
⎟ θ(t ) .
⎟⎟
⎠
Поэтому уравнения для определения функций a(u) и b(u) согласно (7), (8)
принимают вид
2k D λ r ⎞
2k D λ r
⎛
ρ(1 − u)a′(u) = − r r r inf br (u ) − ⎜ kθ θ0 + θ θ θ inf ⎟ bθ (u ) −
θ0 − rinf
θ0 − rinf ⎠
⎝
−
k Dr
kr Dr rinf 2
br (u ) − θ θ inf bθ2 (u ) , a(0) = 0,
θ0 − rinf
θ0 − rinf
2k D λ
⎛
ρ(1 − u)br′(u) = 1 − ⎜ kr + r r r
θ0 − rinf
⎝
kr Dr
⎞
br2 (u ) , br(0) = 0,
⎟ br (u ) −
θ0 − rinf
⎠
k Dr
2k D λ ⎞
⎛
ρ(1 − u)bθ′(u) = kr br(u) − ⎜ kθ + θ θ θ ⎟ bθ (u ) − θ θ inf bθ2 (u ) , bθ(0) = 0.
θ0 − rinf
θ
−
r
⎝
0
inf ⎠
Уравнение для br(u) может быть решено аналитически
⎛
εr
br(и) = ⎜
−ε
⎝ (1 − u ) r
−1
⎞
+ Vr ⎟ ,
ρ
−1
⎠
2
2k D λ ⎞
4kr Dr
2k D λ ⎞
⎛
1⎛
ε r = ⎜ kr + r r r ⎟ +
, V = ⎜ ε r + kr + r r r ⎟ .
θ
−
r
θ
−
r
2
θ0 − rinf ⎠
⎝
⎝
0
inf ⎠
0
inf
Однако уравнение для bθ(u) и, следовательно, для a(u) можно решить только численно.
Функции доходности для текущего состояния (r(t) = r, θ(t) = θ) определяются
по формулам (6).
Рассмотрим теперь второй вариант перехода к двухфакторной модели. Он соответствует применению двухфакторной модели Васичека – Фонга [3], в которой
используется модель с квадратным корнем в форме Даффи – Кана. Примем, что в
дополнение к краткосрочной ставке r(t) состояние характеризует локальная по
времени дисперсия D(t): X(t) = (r(t), D(t))Т. Тогда случайный процесс динамики
переменных состояния описывается уравнениями
где
dr(t) = kr(θ0 − r(t))dt + 2kr D(t ) dWr(t);
dD(t) = kD(Dr − D(t))dt + 2k D S
D(t ) − Dinf
dWD(t), D(0) > D inf,
Dr − Dinf
(12)
(13)
где Dr и S – стационарные среднее и дисперсия процесса D(t) соответственно.
Поэтому соотношения (1) определяют структуру модели следующим образом:
0 ⎞ ⎛ θ0 − r (t ) ⎞
⎛k
μ(X(t)) = K(θ − X(t)) = ⎜ r
⎟⎜
⎟;
⎝ 0 k D ⎠ ⎝ Dr − D(t ) ⎠
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 7. Новая версия
σ(X(t))σ(X(t))Т = α +
n
0
∑ βi X i (t ) = − ⎛⎜⎝ 0
i =1
σ(X(t))λ(X(t)) = ξ +
0 ⎞ ⎛ 2k r
+
2δDinf ⎟⎠ ⎜⎝ 0
n
0
∑ ηi X i (t ) = − ⎛⎜⎝ 2δλ D Dinf ⎞⎟⎠
i =1
77
kD S
0⎞
D(t ) , δ ≡
;
2δ ⎟⎠
Dr − Dinf
⎛ 2k λ ⎞
+ ⎜ r r ⎟ D(t ) .
⎝ 2δλ D ⎠
Это позволяет написать уравнения (7) – (8) для функций a(u) и b(u) в следующем
виде
ρ(1 − u)a′(u) = − krθ0br(u) − (kDDr + 2δλDDinf)bD(u) − δDinf bD2 (u ) , a(0) = 0;
ρ(1 − u)br′(u) = 1 − krbr(u), br(0) = 0;
ρ(1 − u)bD′(u) = − 2λrkrbr(u) − (kD + 2δλD)bD(u) − kr br2 (u ) − δ bD2 (u ) , bD(0) = 0.
Как и в предыдущем случае, уравнение для br(u) может быть решено аналитически
1
(1 − (1 − u ) kr ρ ) ,
br(u) =
kr
но уравнения для bD(u) и соответственно для a(u) решаются только численно.
Функции доходности для текущего состояния X(t) = (r(t) = r, D(t) = D) определяются по формулам (6).
Результаты вычислений функций доходности Y(u) и F(u) для моделей (9), (10),
(11) и (12), (13) для сравнения представлены на рис. 2. Вычисления проводились
для параметров, обеспечивающих для всех моделей одинаковые значения стационарного среднего θ0, стационарной дисперсии Dr и параметра быстродействия kr
при следующих значениях переменных текущего состояния: r = 0,05; θ = 0,06;
D = 0,005.
Y(u), F(u)
0,060
0,055
0,050
0,045
0
0,2
0,4
0,6
0,8
u
Рис. 2. Функции доходности Y(u) (пунктирные линии) и F(u) (сплошные
линии) для различных моделей: модель (9) (верхняя пара кривых); модель
(10), (11) (средняя пара кривых); модель (12), (13) (нижняя пара кривых).
Маркеры горизонтальной оси обозначают реальную продолжительность
срока до погашения: ромб – 1 год, треугольник – 10 лет, квадрат – 30 лет.
Кружком отмечены предельные значения функций для τ = 0 (слева) и
τ = ∞ (справа)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
78
Из рис. 2 видно, что для выбранных параметров доходности, получающиеся из
однофакторной модели, доминируют над доходностями, определяемыми двухфакторными моделями для всех сроков до погашения.
3. Трехфакторные модели
При переходе к трехфакторным моделям переменными состояния становятся
краткосрочная ставка r(t), ее локальное (по времени) среднее θ(t) и ее локальная
(по времени) дисперсия D(t), X(t) = (r(t), θ(t), D(t))Т. Все эти компоненты состояния считаются диффузионными стохастическими процессами. Рассмотрим несколько возможных способов задания таких процессов. Первый может быть назван расширенной моделью Васичека – Фонга [3], второй использует модель Чена
в интерпретации Дэя – Синглтона [4], а третий представляет так называемую модель BDFS [5].
В расширенной модели Васичека – Фонга стохастическая дисперсия D(t) процесса краткосрочной ставки r(t) порождается однофакторной моделью Даффи –
Кана (в [3] использовалась модель Кокса – Ингерсолла – Росса), а стохастическое
среднее ставки r(t) – процессом с возвращением к среднему θ0 со стохастической
волатильностью, определяемой D(t). Так что уравнения для переменных состояния X(t) = (r(t), θ(t), D(t))Т имеют вид
dr(t) = kr(θ(t) − r(t))dt + 2kr D(t ) dWr(t);
(14)
dθ(t) = kθ(θ0 − θ(t))dt + σ 2kθ D(t ) dWθ(t);
(15)
dD(t) = kD(Dr − D(t))dt + 2k D S
D(t ) − Dinf
dWD(t), D(0) > Dinf ≥ 0.
Dr − Dinf
(16)
Здесь Dinf – нижняя граница для процесса дисперсии D(t) процентной ставки; Dr –
стационарное среднее процесса дисперсии D(t), а S – стационарная дисперсия процесса дисперсии D(t). Для более компактной записи в дальнейшем изложении
удобно ввести обозначение δ = k D S /( Dr − Dinf ).
Соотношения (1) имеют вид
⎛ kr − kr 0 ⎞ ⎛ θ0 − r (t ) ⎞
0 ⎟ ⎜ θ0 − θ(t ) ⎟ ;
μ(X(t)) = K(θ − X(t)) = ⎜ 0 kθ
⎟
⎜
⎟⎜
0 k D ⎠ ⎝ Dr − D(t ) ⎠
⎝0
σ(X(t))σ(X(t))Т = α +
0
⎛0 0
⎜
β
X
(
t
)
=
−
0
0
0
∑ i i
⎜
i =1
⎝ 0 0 2δDinf
n
⎞
⎟+
⎟
⎠
⎛ 2k r
⎜ 0
⎜
⎜ 0
⎝
0
2 kθ σ 2
0
0⎞
0 ⎟⎟ D(t ) ;
2δ ⎟⎠
⎛ 2k r λ r ⎞
⎜ 2k σ2 λ ⎟ D(t ) .
θ⎟
⎜ θ
⎜ 2δλ D ⎟
⎝
⎠
Это позволяет получить систему уравнений (7), (8) для функций a(u) и b(u):
0
⎛
⎜
0
σ(X(t))λ(X(t)) = ξ + ∑ ηi X i (t ) = −
⎜
i =1
⎝ 2δλ D Dinf
n
⎞
⎟+
⎟
⎠
ρ(1 − u)a′(u) = − kθθ0bθ(u) − (kDDr + 2δλDDinf)bD(u) − δDinf bD2 (u ) , a(0) = 0,
ρ(1 − u)br′(u) = 1 − krbr(u), br(0) = 0,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 7. Новая версия
79
ρ(1 − u)bθ′(u) = krbr(u) − kθbθ(u), bθ(0) = 0.
ρ(1 − u)bD′(u) = − 2krλrbr(u) − 2kθσ2λθbθ(u) − (kD + 2δλD)bD(u) −
2
− kr br2 (u ) − kθσ2 bθ (u ) − δ bD2 (u ) , bD(0) = 0.
Уравнения для br(u) и bθ(u) могут быть решены аналитически
br(u) =
bθ(u) =
1 − (1 − u ) kr
kr
ρ
,
k ρ
1 (1 − u ) kr ρ kr (1 − u ) θ
,
+
−
kθ
k r − kθ
kθ ( k r − kθ )
но уравнения для bD(u) и соответственно для a(u) решаются только численно.
Функции доходности Y(u) и F(u) для текущего состояния X(t) = (r(t) = r, θ(t) = θ,
D(t) = D) определяются по формулам (6).
В модели Чена переменные состояния удовлетворяют системе стохастических
дифференциальных уравнений:
dr(t) = kr(θ(t) − r(t))dt + 2kr D(t ) dWr(t);
θ(t ) − θinf
dWθ(t), θ(0) > θinf ≥ 0;
θ0 − θinf
(18)
D(t ) − Dinf
dWD(t), D(0) > Dinf ≥ 0.
Dr − Dinf
(19)
dθ(t) = kθ(θ0 − θ(t))dt + 2kθ Dθ
dD(t) = kD(Dr − D(t))dt + 2k D S
(17)
Заметим, что в этой модели процессы θ(t) и D(t) являются независимыми диффузионными процессами, описываемыми одномерными моделями Даффи – Кана.
Для недостижимости нижних границ θinf и Dinf процессов θ(t) и D(t) необходимо
выполнение известных условий Феллера (θ0 − θinf)2 > Dθ и (Dr − Dinf)2 > S. Для компактности далее будем также использовать обозначения
γ = kθ Dθ /(θ0 − θinf ) , δ = k D S /( Dr − Dinf ).
Соотношения (1) имеют вид
− kr
kθ
0
⎛ kr
μ(X(t)) = K(θ − X(t)) = ⎜ 0
⎜
⎝0
σ(X(t))σ(X(t))Т = α +
0 ⎞
0 ⎟
⎟
kD ⎠
⎛ θ0 − r (t ) ⎞
⎜ θ − θ(t ) ⎟ ;
⎜ 0
⎟
⎝ Dr − D(t ) ⎠
n
∑ βi X i (t ) =
i =1
0
⎛0
⎜
= − 0 2 γθinf
⎜
0
⎝0
σ(X(t))λ(X(t)) = ξ +
0
0
2δDinf
n
⎞ ⎛0 0 0⎞
⎟ + ⎜ 0 2 γ 0 ⎟ θ(t) +
⎟ ⎜
⎟
⎠ ⎝0 0 0⎠
⎛
0
∑ ηi X i (t ) = − ⎜⎜ 2γλθ θinf
i =1
⎝ 2δλ D Dinf
⎞
⎟+
⎟
⎠
⎛ 2k r
⎜ 0
⎜
⎝ 0
0 0⎞
0 0 ⎟ D(t ) ;
⎟
0 2δ ⎠
⎛ 0 ⎞
⎜ 2 γλ ⎟ θ(t ) +
θ
⎜
⎟
⎝ 0 ⎠
⎛ 2k r λ r ⎞
⎜ 0 ⎟ D(t ) .
⎜
⎟
⎝ 2δλ D ⎠
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
80
С учетом этого система уравнений (7), (8) для функций a(u) и b(u) получается
следующая:
ρ(1 − u)a′(u) = − (kθθ0 + 2γλθθinf)bθ(u) − (kDDr + 2δλDDinf)bD(u) −
− γθinf bθ2 (u ) − δDinf bD2 (u ) , a(0) = 0,
ρ(1 − u)br′(u) = 1 − krbr(u), br(0) = 0,
ρ(1 − u)bθ′(u) = krbr(u) − (kθ + 2γλθ)bθ(u) − γ bθ2 (u ) , bθ(0) = 0,
ρ(1 − u)bD′(u) = − 2krλrbr(u) − (kD + 2δλD)bD(u) − kr br2 (u ) − δ bD2 (u ) , bD(0) = 0.
К сожалению, из этих уравнений аналитически решается только уравнение для
br(u):
br(u) = [1 − (1 − u ) kr ρ ] / kr ,
остальные допускают только численное решение.
Для определения функций доходности Y(u) = Y(u | r, θ, D) и F(u) = F(u | r, θ, D)
используются формулы (6).
В модели BDFS используются переменные состояния X(t) = (r(t), θ(t), D(t))Т,
удовлетворяющие системе уравнений
dr(t) = kr(θ(t) − r(t))dt + 2kr D(t ) dWr(t);
(20)
dθ(t) = kθ(θ0 − θ(t))dt + 2kθ Dθ dWθ(t);
(21)
dD(t) = kD(Dr − D(t))dt + 2k D S
D(t ) − Dinf
dWD(t), D(0) > Dinf ≥ 0.
Dr − Dinf
(22)
Фактически, эта модель является частным случаем модели Чена, когда θinf →
−∞ (см. уравнение (18)). В этом случае γ → 0, но γθinf → − kθDθ, и мы имеем
⎛ kr − kr 0 ⎞ ⎛ θ0 − r (t ) ⎞
μ(X(t)) = K(θ − X(t)) = ⎜ 0 kθ
0 ⎟ ⎜ θ0 − θ(t ) ⎟ ;
⎟
⎜
⎟⎜
0 k D ⎠ ⎝ Dr − D(t ) ⎠
⎝0
σ(X(t))σ(X(t))Т = α +
0
⎛0
⎜
−
β
X
(
t
)
=
−
0
2
k
∑ i i
θ Dθ
⎜
i =1
0
0
⎝
n
0
0
2δDinf
⎞
⎟+
⎟
⎠
⎛ 2k r
⎜ 0
⎜
⎝ 0
0 0⎞
0 0 ⎟ D(t ) ;
⎟
0 2δ ⎠
⎛ 2k r λ r ⎞
⎜ 0 ⎟ D(t ) .
⎜
⎟
⎝ 2δλ D ⎠
Это позволяет получить уравнения для функций a(u) и b(u) в следующей форме:
ρ(1 − u)a′(u) = − (θ0 − 2λθDθ)kθbθ(u) − (kDDr + 2δλDDinf)bD(u) +
σ(X(t))λ(X(t)) = ξ +
0
⎛
⎞
⎜
⎟
−
λ
η
X
(
t
)
=
−
k
D
2
∑ i i
θ θ θ +
⎜
⎟
i =1
δλ
D
2
⎝
D inf ⎠
n
+ kθDθ bθ2 (u ) − δDinf bD2 (u ) , a(0) = 0,
ρ(1 − u)br′(u) = 1 − krbr(u), br(0) = 0,
ρ(1 − u)bθ′(u) = krbr(u) − kθbθ(u), bθ(0) = 0,
ρ(1 − u)bD′(u) = − 2krλrbr(u) − (kD + 2δλD)bD(u) − kr br2 (u ) − δ bD2 (u ) , bD(0) = 0.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 7. Новая версия
81
Здесь аналитически решаются только уравнения для br(u) и bθ(u):
br(u) =
bθ(u) =
1 − (1 − u ) kr
kr
ρ
,
k ρ
1 (1 − u ) kr ρ kr (1 − u ) θ
,
+
−
kθ
k r − kθ
kθ ( k r − kθ )
а остальные уравнения приходится решать численными методами.
Результаты вычислений функций доходности Y(u) и F(u) для моделей (14) –
(16), (17) – (19) и (20) – (22) представлены на рис. 3. Вычисления проводились
для параметров, обеспечивающих для всех моделей одинаковые значения стационарного среднего и стационарной дисперсии при следующих текущих значениях
переменных состояния: r = 0,05; θ = 0,06; D = 0,005.
Y(u), F(u)
0,05
0,04
0,03
0,02
0,01
0
0
0,2
0,4
0,6
0,8
u
Рис. 3. Функции доходности Y(u) (пунктирные линии) и F(u) (сплошные
линии) для трехфакторных моделей: модель (14) – (16) (верхняя пара
кривых); модель (17) – (19) (средняя пара кривых); модель (20) – (22)
(нижняя пара кривых). Маркеры горизонтальной оси обозначают реальную продолжительность срока до погашения: ромб – 1 год, треугольник –
10 лет, квадрат – 30 лет. Кружком отмечены предельные значения функций для τ = 0 (слева) и τ = ∞ (справа)
Из рис. 3 можно заключить, что для принятого набора параметров все три
трехфакторные модели практически определяют доходность одинаково. Исключение составляет область продолжительных сроков до погашения (более 30 лет), в
которой доходности существенно расходятся. При этом модель BDFS предусматривает резкий спад доходности для больших сроков до погашения. Это, видимо,
объясняется тем, что в этой модели локальное среднее краткосрочной процентной
ставки следует гауссовскому процессу, в принципе, допускающему наличие отрицательных значений процентной ставки, что может приводить к падению доходности. Для принятого набора параметров вероятность отрицательных значений
θ(t) в рассматриваемом случае равна 3,7·10−6. Сравнение рис. 2 и 3 позволяет заключить, что с увеличением размерности моделей определяемые ими ставки доходности уменьшаются.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
82
Г.А. Медведев
Заключение
В статье предлагается рассматривать временную переменную, описывающую
срок до погашения бескупонных облигаций, как результат не зависящего от параметров модели изменения процентной ставки нелинейного преобразования u(τ)
временных сроков, позволяющего отображать временную ось на интервал единичной длины. Этот способ имеет преимущества перед применением в качестве
меры времени дюрации B(τ) краткосрочной процентной ставки, поскольку при
применении дюрации временная переменная зависит от параметров рассматриваемых моделей, что затрудняет сравнение доходностей для одних и тех же реальных сроков до погашения. Показано, что функции доходности Y(u) и F(u) обладают практически теми же свойствами, что кривая доходности до погашения
y(τ) и форвардная кривая f(τ) соответственно, за исключением (в некоторых случаях) свойств, связанных со второй производной, так как они удобнее, поскольку
позволяют визуально анализировать доходности на всей оси времени. Использование такого подхода проиллюстрировано при анализе свойств кривой доходности и форвардной кривой для одно-, двух- и трехфакторных моделей процентных
ставок. Для этого сформулированы математические модели динамики переменных состояния для всех этих случаев (всего шесть различных моделей), выведены
уравнения для функций временной структуры и при возможности найдены
их аналитические решения. Поскольку большая часть уравнений может быть решена только численно, проведены численные расчеты для всех шести моделей и
проведены сравнения функций доходностей, характеризующих их временную
структуру. Расчеты проводились для набора параметров, основанных на оценках
Д. Ана и Б. Гао [2], приспосабливавших однофакторную модель Даффи – Кана
для описания динамики процесса годовой ставки доходности одномесячных бумаг
Казначейства США для периода наблюдения с января 1960 г. по февраль 1991 г.
Ими были получены следующие значения (в обозначениях настоящей статьи)
kr = 0,1347; θ0 = 0,0762; Dr = 0,002892; rinf = 0, 03315. Остальные параметры
моделей были приняты следующими: kθ = 0,01347; Dθ = 0,0002892; θinf = 0, 03315;
kD = 0,01347; S = 1,882×10−7; Dinf = 0,0001; λr = 0,1; λθ = λD = 0,1. Текущие значения
параметров состояния во всех случаях выбирались следующими: r = 0,05; θ = 0,06;
D = 0,005. Параметр преобразования временных сроков во всех случаях был ρ =
= 0,0767528. В этом случае короткие сроки до погашения (менее 1 года) занимают
7,4 % интервала, средние сроки от 1 года до 10 лет – 46,2 % интервала, сроки от
10 лет до 30 лет – 36,4 % и сроки, превышающие 30 лет, занимают 10 %. С увеличением параметра ρ перераспределение интервала происходит в пользу более коротких сроков.
ЛИТЕРАТУРА
1. Медведев Г. А. О временной структуре доходности. 1−6 // Вестник ТГУ. УВТиИ. 2012.
№ 1(18). С. 102–111; № 2(19). С. 102–111; № 3(20). С. 71–80; № 4(21). С. 89–99; 2013.
№ 2(23). С. 64–74; № 3(24). С. 113–122.
2. Ahn D.-H., Gao B. A parametric nonlinear model of term structure dynamics // The Review of
Financial Studies. 1999. V. 12. No. 4. P. 721–762.
3. Fong H.G., Vasicek O.A. Fixed-income volatility management // J. Portfolio Management.
1991. Р. 41–56.
4. Dai Q., Singleton K. Specification analysis of affine term structure models // J. Finance. 2000.
V. 55(5). P. 1943–1978.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 7. Новая версия
83
5. BDFS: Balduzzi P., Das S., Foresi S., Sundaram R. A simple approach to three factor affine
term structure models // J. Fixed Income. 1996. V. 6. P. 43–53.
Медведев Геннадий Алексеевич
Белорусский государственный университет
E-mail: MedvedevGA@cosmostv.by
Поступила в редакцию 19 августа 2013 г.
Medvedev Gennady A. (Belarusian State University). On term structure of yield rates. 6. The
new version.
Keywords: yield interest rates, affine model, yield curve, forward curve, Duffie–Kan one-factor
model, three factor model, Fong – Vasicek two-factor model, Chen three-factor model, BDFS
three-factor model.
In paper it is proposed to consider a time variable that describes term to maturity of zerocoupon bonds as result of nonlinear transformation of the temporary terms that are independent on
parameters of interest rate dynamics model, allowing to map the time numerical axis into an interval of unit length. This way has advantages before application as a measure of time of a duration of a short-term interest rate because at the duration application the time variable depends on
parameters of considered models that complicates a comparison of yields for the same real terms
to maturity. It is shown that resulting yield functions possess practically the same properties as a
yield to maturity curve and a forward curve, except for (in certain cases) properties connected
with the second derivative. At the same time they it is more convenient because allow to analyze
visually the yields on all time axis. Use of such approach is illustrated in the analysis of properties
of the yield curve and the forward curve for one-factor model of Duffie – Kan, Fong – Vasicek
two-factor model and three-factor models of interest rates: Fong – Vasicek expanded model, Chen
model and the BDFS model. In paper the mathematical models of dynamics of the state variables
for all these cases (six various models) are formulated, the equations for functions of term structure are deduced and (when it is possible) their analytical solutions are found. As the main part of
the equations can be solved only by calculations, numerical calculations for all six models are carried out and comparisons of yield functions characterizing their term structure are carried out.
Calculations were carried out for a set of the parameters based on estimates, published by D. Ahn
and B. Gao, fitting one-factor Duffie – Kan model for the description of dynamics of process of
an annualized one-month U.S. Treasury bill rate for the supervision period from January, 1960 to
February, 1991. Calculations showed that the increase of model dimension implies the decrease of
yield rate.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
УДК 519.872
Е.А. Моисеева, А.А. Назаров
ИССЛЕДОВАНИЕ RQ-СИСТЕМЫ MMPP|GI|1
МЕТОДОМ АСИМПТОТИЧЕСКОГО АНАЛИЗА
В УСЛОВИИ БОЛЬШОЙ ЗАГРУЗКИ1
Исследована математическая модель системы массового обслуживания
MMPP|GI|1 с источником повторных вызовов методом асимптотического
анализа в условии большой загрузки. Получена асимптотическая характеристическая функция числа заявок в источнике повторных вызовов.
Ключевые слова: RQ-система, источник повторных вызовов, метод асимптотического анализа, большая загрузка.
В связи с бурным развитием информационно-вычислительных систем, систем
коммуникаций, появлением и усложнением разнообразных технологических систем особый интерес с середины прошлого века получили исследования нового
класса систем массового обслуживания – системы с источником повторных вызовов (ИПВ) или Retrial Queuing System (RQ-системы).
Особенность таких систем [1] заключается в том, что имеют место ситуации
повторного обращения требований к обслуживающему прибору, если при входе в
систему попытка встать на обслуживание была неудачной (так как прибор был
занят).
В реальных информационных и экономических системах достаточно часто
встречаются такие процессы. Предположим, что на телефон (единственный) некоторого учреждения в случайном порядке поступают вызовы. Если в момент поступления вызова телефон свободен, то абонент обслуживается, причем разговор
длится в течение случайного времени, которое необходимо для обслуживания.
Если же телефон занят, тогда клиент через некоторое время пытается повторно
дозвониться в фирму.
Первые системы такого рода были рассмотрены Р.И. Вилкинсоном [2] и Дж.
Коэном [3]. Основные подходы к описанию систем с ИПВ были описаны Г. Гоштони [4] и А. Элдином [5]. Наиболее полное и глубокое исследование различных
процессов в системах с повторными вызовами проведено в работах Г. И. Фалина и
Дж. Артолехо [6, 7]. Ими получены характеристические функции для RQ-систем
M|M|1, M|GI|1, M|M|С и других систем с пуассоновским входящим потоком, а
также рассмотрены разнообразные методы для исследования таких систем. Многие из поставленных задач в моделях RQ-систем решались численно белорусскими учеными [8, 9].
В данной же работе применяется метод асимптотического анализа для исследования таких систем с непуассоновским входящим потоком.
1
Работа выполнена в рамках государственного задания Минобрнауки РФ на проведение
научных исследований в Томском государственном университете на 2012−2014 годы, задание 8.4055.2011.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование RQ-системы MMPP|GI|1 методом асимптотического анализа
85
1. Математическое описание
Рассмотрим (рис. 1) однолинейную RQ-систему с источником повторных вызовов, на вход которой поступает MMPP-поток (Markov Arrival Poisson Process)
заявок с матрицей условных интенсивностей ρλ , где параметр ρ и значения элементов матрицы λ будут определены ниже, и
σ
матрицей Q инфинитезимальных характеристик
σ
цепи Маркова n(t), управляющей MMPPσ
потоком, время обслуживания каждой заявки
имеет произвольную функцию распределения
B(x). Если поступившая заявка застает прибор
ρλ, Q
свободным, то она занимает его для обслуживаB(x)
ния. Если прибор занят, то заявка переходит в
ИПВ, где осуществляет случайную задержку,
продолжительность которой имеет экспоненци- Рис. 1. Однолинейная RQ-система
альное распределение с параметром σ. Из ИПВ
после случайной задержки заявка вновь обращается к обслуживающему прибору
с повторной попыткой его захвата. Если прибор свободен, то заявка из ИПВ занимает его для обслуживания, в противном случае заявка мгновенно возвращается в источник повторных вызовов для реализации следующей задержки.
Пусть i(t) – число заявок в ИПВ, n(t) – цепь Маркова, управляющая ММРPпотоком, z(t) – оставшееся время обслуживания, а k(t) – определяет состояние
прибора следующим образом:
0, если прибор свободен ,
k (t ) =
1, если прибор занят.
{
Обозначим P{k(t)=0, n(t)=n, i(t)=i}=P(0,n,i,t) – вероятность того, что прибор
свободен в момент времени t, управляющая МMPP-потоком цепь Маркова находится в состоянии n и в источнике повторных вызовов находится i заявок; а
P{k(t)=1, n(t)=n, i(t)=i, z(t)<z}=P(1,n,i,z,t) – вероятность того, что в момент времени t прибор занят, управляющая МMPP-потоком цепь Маркова − в состоянии n, в
источнике повторных вызовов находится i заявок и оставшееся время обслуживания меньше z.
Случайный процесс {k(t), n(t), i(t), z(t)} изменения состояний данной системы
во времени является марковским, поэтому для получения распределения вероятностей {P(0,n,i,t); P(1,n,i,z,t)} состояний рассматриваемой RQ-системы составим
систему дифференциальных уравнений Колмогорова:
⎧ ∂P(0, n, i, t ) = ∂P (1, n, i, 0, t ) − P (0, n, i, t )(λ + iσ − q ) +
∑ P(0, ν, i, t ) ⋅ qνn ,
n
nn
⎪
∂t
∂z
ν≠ n
⎪
⎪⎪ ∂P(1, n, i, z , t ) = ∂P (1, n, i, z , t ) − ∂P(1, n, i, 0, t ) + (−λ + q ) P (1, n, i, z , t ) +
n
nn
(1)
⎨
∂t
∂z
∂z
⎪+λ P (0, n, i, t ) B ( z ) + λ P(1, n, i − 1, z, t ) + σ(i + 1) ⋅ P(0, n, i + 1, t ) B( z ) +
n
⎪ n
⎪+ ∑ qνn P(1, ν, i, z , t ).
⎪⎩ ν≠ n
Обозначим
P (0 ,i ) = {P (0,1, i ) P(0, 2, i ) ... P (0, N , i )}
и
P (1 ,i, z ) = {P(1,1, i, z ) P (1, 2, i, z ) ... P (1, N , i, z )} .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Е.А. Моисеева, А.А. Назаров
86
В матричном виде в стационарном режиме система (1) примет вид
⎧ ∂P (1 ,i, 0) − P (0 ,i )(λ + iσI ) + P (0, i )Q = 0,
⎪
∂z
⎪
⎨ ∂P (1 ,i, z ) − ∂P (1, i,0 ) − λP (1, i, z ) + λP (0, i ) B( z ) + λP (1, i − 1, z ) +
⎪
∂z
∂z
⎪+σ(i + 1) ⋅ P (0, i + 1) B( z ) + P (1, i, z )Q = 0.
⎩
Получили систему двух матричных уравнений в конечных разностях.
Будем полагать, что матрица λ удовлетворяет равенству
R λ E b = 1,
(2)
где R – стационарное распределение вероятностей значения цепи Маркова,
управляющей входящим MMPP-потоком, Е − единичный вектор-столбец, b –
среднее время обслуживания.
Распределение вероятностей значения цепи Маркова, управляющей входящим
MMPP-потоком, можно получить из следующих выражений:
RQ = 0,
RE = 1.
{
Перед матрицей условных интенсивностей λ введем параметр ρ, характеризующий загрузку системы. Выполнение неравенства ρ < 1 представляет собой условие существование стационарного режима.
Тогда система (2) перепишется в виде
⎧ ∂P (1, i , 0) − P (0, i )(ρλ + iσI ) + P (0, i )Q = 0,
⎪
∂z
⎪
(3)
⎨ ∂P (1, i, z ) − ∂P (1, i , 0) − ρP (1, i, z )λ + ρP (0, i )λB ( z ) + ρP (1, i − 1, z )λ +
⎪
∂z
∂z
⎪+σ(i + 1) ⋅ P (0, i + 1) B( z ) + P (1, i , z )Q = 0.
⎩
Перейдем в системе (3) к характеристическим функциям:
H (1, u, z ) = ∑ e jui P (1, i, z ) и H (0, u) = ∑ e jui P (0, i ) ,
i
i
где j = −1 – мнимая единица.
∂
H (k , u , z ) = j ∑ ie jui P (k , i, z ) , система уравнений (3) для ха∂u
i
рактеристических функций перепишется в виде
∂H (0, u)
⎧ ∂H (1, u, 0)
+ H (0, u)(Q − ρλ ) + jσ
= 0,
⎪
∂z
∂u
⎪⎪∂H (1, u, z ) ∂H (1, u, 0)
(4)
−
+ H (1, u, z )Q + H (0, u)ρλB ( z ) +
⎨
∂z
∂z
⎪
∂H (0, u)
⎪
ju
− ju
B( z ) = 0.
⎪⎩+ (e − 1) H (1, u, z )ρλ − e jσ ∂u
Решим систему (4) методом асимптотического анализа в условии большой загрузки, характеризующемся предельным соотношением ρ ↑ 1 . Или, введя бесконечно малую величину ε = 1 − ρ > 0 , условие большой загрузки может быть опиУчитывая, что
сано условием ε ↓ 0 .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование RQ-системы MMPP|GI|1 методом асимптотического анализа
87
В системе (4) выполним замены
u = εw , H ( 0, u ) = εG ( w ,ε) , H (1, u, z ) = F ( w ,ε, z ) .
Получим
∂G ( w ,ε)
⎧ ∂F ( w ,ε, 0)
+ εG ( w ,ε)(Q − (1 − ε)λ ) + jσ
= 0,
⎪
∂z
∂w
⎪⎪∂F ( w ,ε, z ) ∂F ( w ,ε, 0)
−
+ F ( w ,ε, z )Q + (e jwε − 1)(1 − ε) F ( w ,ε, z )λ +
⎨
∂
∂
z
z
⎪
∂G ( w ,ε)
⎪
− jwε
jσ
B ( z ) = 0.
⎪⎩+ (1 − ε)εG ( w ,ε)λB ( z ) − e
∂w
(5)
2. Вывод асимптотических уравнений
1. В системе (5) совершим предельный переход при ε ↓ 0 , обозначив
F ( w, z ) = lim F ( w ,ε, z ) и G ( w ) = lim G ( w,ε) . Получим систему
ε→0
ε→ 0
⎧ ∂F ( w , 0) + jσ dG ( w ) = 0,
⎪ ∂z
dw
⎨
(
)
(
∂
F
w,
z
∂
F
w
, 0)
dG ( w )
⎪
−
+ F ( w, z )Q − jσ
B( z ) = 0.
⎩ ∂z
∂z
dw
Тогда справедливо следующее:
⎧ ∂F ( w , 0) + jσ dG ( w ) = 0,
⎪ ∂z
dw
⎨
(
,
)
(
, 0)
∂
F
w
z
∂
F
w
⎪
(1 − B ( z )) + F ( w , z )Q = 0.
−
⎩ ∂z
∂z
2. Запишем следующее разложения функций:
(6)
G ( w ,ε) = G ( w ) + ε ⋅ g ( w ) + O(ε 2 ) ,
(7)
F ( w ,ε, z ) = F ( w, z ) + ε ⋅ f ( w, z ) + O(ε 2 ) ,
(8)
где O(ε 2 ) – бесконечно малая величина порядка ε 2 .
Подставив разложения (7), (8) в систему (5), в результате несложных преобразований можно записать
⎧ ∂F ( w ,0) + ε ∂f ( w ,0) + εG ( w )(Q − (1 − ε)λ ) + ε 2 g ( w )(Q − (1 − ε)λ ) +
⎪ ∂z
∂z
⎪
d
(
)
dg ( w )
G
w
⎪ + jσ
+ jσε
= 0,
dw
dw
⎪
⎪
⎨ ∂F ( w,z ) + ε ∂f ( w, z ) − ∂F ( w ,0) − ε ∂f ( w ,0) + F ( w,z )Q + εf ( w,z )Q +
⎪ ∂z
∂z
∂z
∂z
⎪
2
λ
λ
(1
)
(
)
B
(
z
)
(1
)
(
)
B
(
z ) + jwε(1 − ε) F ( w,z ) ⋅ λ +
+
−
ε
ε
G
w
+
−
ε
ε
g
w
⎪
dG ( w )
dg ( w )
⎪
2
⎪⎩+ jwε (1 − ε) f ( w,z ) ⋅ λ − (1 − jwε) jσ dw B ( z ) − (1 − jwε) jσε dw B ( z ) = 0.
Учитывая (6), разделив на ε и раскладывая экспоненту в ряд Тейлора и совершив предельный переход при ε ↓ 0 , получим
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
88
Е.А. Моисеева, А.А. Назаров
⎧ ∂f ( w ,0) + G ( w )(Q − λ ) + jσ dg ( w ) = 0,
⎪ ∂z
dw
⎪⎪∂f ( w, z ) ∂f ( w ,0)
(9)
−
+ f ( w,z )Q + G ( w )λB( z ) + jwF ( w,z ) ⋅ λ +
⎨
∂z
⎪ ∂z
⎪+ jwjσ dG ( w ) B ( z ) − jσ dg ( w ) B( z ) = 0.
⎪⎩
dw
dw
В частности, при суммировании уравнений системы (9) по всем строкам и
предельном переходе при z → ∞ получим
⎧ ∂f ( w ,0) E − G ( w )λE + jσ dg ( w ) E = 0,
⎪ ∂z
dw
⎨
,0
(
)
∂
dG ( w )
dg ( w )
f
w
⎪−
E + G ( w )λE + jwF ( w,z ) ⋅ λE + jwjσ
E − jσ
E = 0.
⎩
∂z
dw
dw
Суммируя уравнения, получаем
dG ( w )
(10)
F ( w,z ) ⋅ λE + jσ
E = 0.
dw
3. Суммируем уравнения системы (5):
∂F ( w ,ε, z )
+ F ( w ,ε, z )Q + εG ( w ,ε)Q + (e jwε − 1)(1 − ε) F ( w ,ε, z ) ⋅ λ +
∂z
∂G ( w ,ε)
+(1 − ε)εG ( w ,ε)λ ( B( z ) − 1) + (1 − e − jwε B ( z )) jσ
= 0.
∂w
Совершим предельный переход при z → ∞ и суммируем уравнения по всем
строкам. Учитывая, что QE = 0 , получим
∂G ( w ,ε)
E = 0.
(11)
∂w
Подставим разложения (7), (8), учитывая (10), из выражения (11) имеем следующее уравнение:
dG ( w )
dg ( w )
−εF ( w ) ⋅ λE + (1 − ε)εf ( w ) ⋅ λE − jwεjσ
E + (1 − jwε)εjσ
E = O(ε 2 ).
dw
dw
Разделим уравнение на ε и совершим предельный переход при ε ↓ 0 :
dG ( w )
dg ( w )
− F ( w ) ⋅ λE + f ( w ) ⋅ λE − jwjσ
E + jσ
E = 0.
(12)
dw
dw
Объединив (6), (9), (10) и (12), получим следующую систему:
∂F ( w,z ) ∂F ( w ,0)
⎧ ∂F ( w ,0) + jσ dG ( w ) = 0,
−
(1 − B( z )) + F ( w,z )Q = 0,
⎪ ∂z
∂z
∂z
dw
⎪ ∂f ( w ,0)
dg ( w )
⎪
+ G ( w )(Q − λ ) + jσ
= 0,
dw
⎪ ∂z
⎪ ∂f ( w, z ) ∂f ( w ,0)
dG ( w )
−
+ f ( w,z )Q + G ( w )λB ( z ) + jwF ( w,z ) ⋅ λ + jwjσ
B( z ) −
⎪⎪
∂z
∂z
dw
(13)
⎨
⎪− jσ dg ( w ) B( z ) = 0,
⎪
dw
⎪
dG ( w )
E = 0,
⎪ F ( w ) ⋅ λE + jσ
dw
⎪
⎪− F ( w ) ⋅ λE + f ( w ) ⋅ λE − jwjσ dG ( w ) E + jσ dg ( w ) E = 0.
⎪⎩
dw
dw
(1 − ε) F ( w,ε ) ⋅ λE + e − jwε jσ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование RQ-системы MMPP|GI|1 методом асимптотического анализа
89
3. Исследование системы полученных уравнений
1. Будем искать F(w,z) в виде произведения:
F ( w, z ) = R ⋅ A( z ) ⋅ Φ ( w) .
(14)
Тогда из 2-го уравнения системы (13) можно записать
A '( z ) − A '(0)(1 − B ( z )) = 0.
Решение такого уравнения
z
A( z ) = A '(0) ∫ (1 − B( x))dx.
0
∞
Найдем A '(0) . Так как A(∞) = 1 , то A '(0) ∫ (1 − B( x))dx = 1. Отсюда A '(0) =
0
1
.
b
Тогда получаем
z
A( z ) =
1
(1 − B( x))dx.
b ∫0
(15)
Из 1-го уравнения можно записать
dG ( w )
1
∂F ( w ,0)
jσ
=−
= − R A '(0)Φ ( w) = − R Φ ( w) .
(16)
dw
∂z
b
Суммируя (16) по всем строкам, имеем
dG(w)
1
jσ
E = − A '(0)Φ ( w) = − Φ ( w) .
(17)
dw
b
dg ( w)
и подставим его в 4-е урав2. Выразим из 3-го уравнения системы (13)
dw
нение:
dG ( w )
∂f ( w, z ) ∂f ( w,0 )
B( z ) +
−
+ f ( w,z )Q + G ( w )λB( z ) + jwF ( w,z ) ⋅ λ + jwjσ
dw
∂z
∂z
∂f ( w ,0))
+
B ( z ) + G ( w )(Q − λ ) B ( z ) = 0.
∂z
В результате несложных преобразований можно записать следующее равенство:
∂f ( w, z ) ∂f ( w ,0)
−
(1 − B ( z )) + f ( w,z )Q + jwF ( w,z ) ⋅ λ +
∂z
∂z
dG ( w )
B ( z ) + G ( w )Q = 0.
+ jwjσ
(18)
dw
Перепишем уравнение при условии z → ∞ , обозначив F ( w ) = lim F ( w,z ) и
z→∞
f ( w ) = lim f ( w,z ) :
z→∞
dG ( w )
+ G ( w )Q = 0.
(19)
dw
Подставим в (19) выражения (15), (16). В ходе несложных преобразований получаем следующее уравнение:
1
{ f ( w ) + G ( w )}Q = jwΦ ( w) ⎛⎜ R − Rλ ⎞⎟ .
⎝b
⎠
f ( w )Q + jwF ( w ) ⋅ λ + jwjσ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Е.А. Моисеева, А.А. Назаров
90
Пусть {G(w) + f ( w )} = jwΦ ( w)V , где V – некоторый вектор, для которого выполняется
1
VQ = R ⎛⎜ I − λ ⎞⎟ .
(20)
⎝b
⎠
Для того чтобы существовало решение такой системы, необходимо, чтобы
ранг расширенной матрицы был равен рангу матрицы системы Q. Так как определитель Q = 0 , то и ранг расширенной матрицы должен быть меньше размерности
системы. Тогда достаточно выполнения следующего условия:
⎛ Rλ − 1 R ⎞ E = 0 .
⎜
⎟
b ⎠
⎝
Получаем RλE = 1/ b , что выполняется для данной системы массового обслуживания с выбранными параметрами в условии большой загрузки при ρ ↑ 1 .
Тогда решение системы (20) можно представить в виде
V = CR + Vчаст ,
где С – произвольная постоянная, Vчаст – частное решение системы, которое
можно найти из некоторых начальных условий, например VE = 0 .
Таким образом, из (19) можно записать
f ( w) = jwΦ ( w) ⋅V − G ( w) .
(21)
∂f ( w ,0)
= f ( w )v '(0). Рассмотрим уравне∂z
ние (18), суммированное по всем строкам:
dG ( w )
B( z ) E = 0 .
f ( w)v '( z ) E − f ( w)v '(0)(1 − B ( z )) E + jwF ( w,z ) ⋅ λE + jwjσ
dw
Разделим последнее выражение на f ( w) E . Учитывая (15) и (16), имеем
3. Пусть f ( w,z ) = f ( w )v( z ). Тогда
v '( z ) − v '(0)(1 − B ( z )) + jw ⋅ ( f ( w) E ) −1 ⋅ R ⋅ A( z ) ⋅ Φ ( w) ⋅ λE −
jw
−
⋅ ( f ( w) E ) −1 R ⋅ Φ ( w) B ( z ) E = 0.
b
z
Отсюда
z
v( z ) = v '(0) ∫ (1 − B ( x))dx −
0
jw −1
⋅ f ( w) E ⋅ Φ ( w) ∫ ( A( x) − B ( x))dx .
b
0
Из условия v(∞) = 1 получим
∞
v '(0)b = 1 +
jw
⋅ ( f ( w) E ) −1 ⋅ Φ ( w) ∫ ( A( x) − 1) + (1 − B ( x))dx .
b
0
∞
Было найдено, что интеграл
∫ (1 − A( x))dx =
0
∞
(22)
b
1
x(1 − B( x))dx = 2 . Подставляя
∫
b0
2b
это значение в (22), имеем конечное выражение для v'(0):
b
1 jw
v '(0) = + 2 ⋅ ( f ( w) E ) −1 ⋅ Φ ( w)(− 2 + b) .
b b
2b
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование RQ-системы MMPP|GI|1 методом асимптотического анализа
91
Тогда справедливо следующее выражение:
∂f ( w ,0)
1
jw
⎛ b
⎞
E = f ( w ) Ev '(0) = f ( w ) E + 2 ⋅ Φ ( w) ⎜ − 2 + b ⎟ .
∂z
b
⎝ 2b
⎠
b
(23)
4. Из 3-го уравнения системы (13), получим
jσ
dg ( w )
∂f ( w ,0)
=−
− G ( w )(Q − λ ) .
dw
∂z
(24)
5. Суммируем 5-е и 6-е уравнения системы (13):
dG ( w )
dg ( w )
f ( w ) λE + (1 − jw) jσ
E + jσ
E = 0.
dw
dw
Подставим в это выражение формулы (17), (21), (23) и (24):
b
1
1
jw
f ( w ) ⋅ λE − (1 − jw) Φ ( w) − f ( w ) E − 2 ⋅ Φ ( w)(− 2 + b) + G ( w )λE = 0.
b
b
2b
b
Учитывая (19), получим
b ⎞
1
1
1
jw
⎛
jwΦ ( w)V λE − (1 − jw) Φ ( w) − jw Φ ( w)VE + G ( w) E − 2 Φ ( w) ⎜ b − 2 ⎟ = 0.
b
b
b
2b ⎠
⎝
b
Продифференцируем последнее выражение и учтем (24):
b
b
1
1⎤
1
1 ⎤
⎡
⎡
Φ '( w) ⎢ jwV λE − jw VE + jw 23 − ⎥ + jΦ ( w) ⎢V λE − VE + 23 + 2 ⎥ = 0.
b
b
⎣
⎣
2b b ⎦
2b σb ⎦
b
1
Разделим левую и правую части уравнения на выражение V λE − VE + 23 :
b
2b
1
1
⎤ + jΦ ( w) ⎡1 +
⎤ = 0. (25)
Φ '( w) ⎡⎢ jw −
⎢
⎥
b2 ⎥
b
1
1
2
b(V λE − VE + 3 ) ⎥
⎢
⎢ σb (V λE − VE + 23 ) ⎥
b
b
⎣
⎣
2b ⎦
2b ⎦
Введем обозначения:
−1
−1
b ⎞
b ⎞
1⎛
1
1 ⎛
1
β = ⎜VλE − VE + 23 ⎟ , α = 1 + 2 ⎜ VλE − VE + 23 ⎟ .
b⎝
b
b
σb ⎝
2b ⎠
2b ⎠
Тогда формула (25) примет вид
Φ ( w) ⋅ jα = Φ '( w) ⋅ [β − jw] .
Решение такого уравнения
Φ ( w) = C ⋅ [ w + jβ]−α ,
(26)
где С – произвольная постоянная.
Из условия Φ (0) = 1 нетрудно найти значение постоянной C = [ jβ]α . Подставив полученное выражение в (26), имеем конечное выражение для искомой
функции
jw ⎤
⎡
Φ ( w) = ⎢1 − ⎥
β ⎦
⎣
Возвращаясь к (14), получим, что
−α
.
(27)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Е.А. Моисеева, А.А. Назаров
92
−α
jw ⎞
⎛
F ( w) = R ⎜ 1 −
⎟ .
β ⎠
⎝
Таким образом, функцию F(w) можно представить в виде характеристической
функции гамма-распределения с параметрами α и β, где
−1
b ⎞
1
1⎛
1
β = ⎜VλE − VE + 23 ⎟ , α = 1 + β .
b⎝
b
bσ
2b ⎠
Замечание. На множестве решений V = CR + Vчаст неоднородной системы линейных алгебраических уравнений (20) параметры α и β гамма-распределения не
зависят от значений постоянной С.
b
1
Доказательство. Рассмотрим выражение (VλE − VE + 23 ) . Подставим в
b
2b
него множество решений V = CR + Vчаст .
b
b
1
1
1
(CR + Vчаст )λE − (CR + Vчаст ) E + 23 = CRλE + Vчаст λE − CRE − Vчаст E + 23 .
b
b
b
2b
2b
Учитывая условия RE = 1 и 1/ b = RλE , получим
b
1
Vчаст λE − Vчаст E + 23 .
b
2b
b ⎞
1
⎛
Таким образом, выражение ⎜ VλE − VE + 23 ⎟ зависит только от частного
b
⎝
2b ⎠
решения системы (20). Выберем такое решение, для которого выполняется
VE = 0 .
Тогда параметры α и β гамма-распределения примут следующий вид:
−1
b ⎞
1
1⎛
β = ⎜VλE + 23 ⎟ , α = 1 + β .
b⎝
bσ
2b ⎠
Заключение
Таким образом, характеристическая функция H (u ) = H (1, u , ∞) + H (0, u ) в условиях большой загрузки может быть приближенно определена равенством
H (u ) ≈ h(u ) . Тогда, возвращаясь к переменной u = εw и параметру ρ в выражеjw ⎞
⎛
нии F ( w) = ⎜ 1 −
⎟
β ⎠
⎝
−α
, получим
−α
ju ⎞
⎛
h(u ) = F ( w / ε) = F ( w /(1 − ρ)) = ⎜1 −
⎟ .
⎝ β(1 − ρ) ⎠
Асимптотическое распределение P(i), характеристическая функция которого
ju −α
равна h(u ) = (1 −
) , может также быть найдено с помощью обратного
β(1 − ρ)
преобразования Фурье либо с использованием свойства гамма-распределения.
Представим в виде таблицы результаты численных исследований значений параметров α и β характеристической функции числа заявок в ИПВ при различных
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование RQ-системы MMPP|GI|1 методом асимптотического анализа
93
значениях параметров системы массового обслуживания MMPP|GI|1. Рассмотрим
случай, когда закон обслуживания имеет вид гамма-распределения с параметрами
α обсл и βобсл . Матрицы условных интенсивностей и инфинитезимальных характеристик входящего потока пусть имеют следующий вид:
0 ⎞
⎛ 0,3 0
⎛ −0,5 0, 2 0,3 ⎞
λ = ⎜ 0 0,8 0 ⎟ , Q = ⎜ 0,1 −0,3 0, 2 ⎟ ,
⎜
⎟
⎜
⎟
0 1, 2 ⎠
⎝ 0
⎝ 0,3 0, 2 −0,5 ⎠
Численное исследование параметров полученного распределения
α обсл
βобсл
1
1
1
0,1
0,1
10
100
1
1
1
0,1
0,1
15
50
σ
0,1
1
10
0,1
1
0,1
0,1
α
9,058
1,806
1,081
2,742
1,174
10,607
21,164
β
0,806
0,806
0,806
0,174
0,174
1,441
1,008
Таким образом, в работе была исследована математическая модель системы
массового обслуживания MMPP|GI|1 с источником повторных вызовов методом
асимптотического анализа в условии большой загрузки. Полученная асимптотическая характеристическая функция числа заявок в источнике повторных вызовов
имеет вид характеристической функции гамма-распределения.
ЛИТЕРАТУРА
1. Назаров А.А., Моисеева Е.А. Исследование RQ-системы MMPP|M|1 методом асимптотического анализа в условии большой загрузки // Известия ТПУ. 2013. Т. 322. № 2.
С. 19−23.
2. Wilkinson R.I. Theories for toll traffic engineering in the USA // The Bell System Technical
Journal. 1956. V. 35. No. 2. P. 421–507.
3. Коэн Дж., Бонсма О. Граничные задачи в теории массового обслуживания: пер. с англ.
А.Д. Вайнштейна. М.: Мир, 1987. 272 с.
4. Гоштони Г. Сравнение вычисленных и моделированных результатов для пучков соединительных линий при наличии повторных попыток установления связи // Материалы
8-й ITC, Сидней, 1977. № 1. С. 1−16.
5. Эллдин А. Подход к теоретическому описанию повторных попыток вызова // Ericssion
Technics. 1967. Т. 23. № 3. С. 345−407.
6. Falin G.L., Templeton J.G.C. Retrial Queues. London: Chapman & Hall, 1997. 328 р.
7. Artolejo J.R., Gomez-Corral A. Retrial Queueing Systems: A Computational Approach. Berlin: Springer, 2008. 267 p.
8. Дудин А.Н. Об одной системе с повторными вызовами и изменяемым режимом работы /
ред. журн. Известия АН СССР. Техническая киберенетика. М.: 1985. 10 с. Деп. в
ВИНИТИ 10.01.1985, № 10293-85.
9. Дудин А.Н., Медведев Г.А., Меленец Ю.В. Практикум на ЭВМ по теории массового обслуживания: учеб. пособие. Минск: Электронная книга БГУ, 2003. 166 с.
Моисеева Екатерина Александровна
Назаров Анатолий Андреевич
Томский государственный университет
E-mail: moiskate@mail.ru; nazarov.tsu@gmail.com
Поступила в редакцию 11 апреля 2013 г.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
94
Е.А. Моисеева, А.А. Назаров
Moiseeva Ekaterina A., Nazarov Anatoly A. (Tomsk State University). Researching of Retrial
Queueing system MMPP|GI|1 by using asymptotic analysis method on heavy load condition.
Keywords: Retrial queueing system, orbit, asymptotic analysis method, heavy load.
In the article we research the queueing system with the orbit (retrial queueing system) with
MMPP input flow, which diagonal matrix of the arrival rates associated with each state is ρλ and
generator matrix of Markov chain n(t) is Q, service time of a customer is distributed by general
independent law B(x). The task is to obtain probability distribution for the number of calls in the
orbit.
Let following notation: i(t) – stochastic process describing the number of calls in the orbit,
n(t) – Markov chain controlling ММРP input flow, z(t) – remaining service time and k(t) defines a
state of service.
The stochastic process with variable component number {1, n(t), i(t), z(t)}, {0, n(t), i(t)} of
the system states in time is Markov, thus the Kolmogorov system of differential equation was
written for obtaining probability distribution {P(0,n,i,t); P(1,n,i,z,t)} the RQ-system states.
The system was considered at stationary state in matrix form. The transition to the characteristic functions in the equations system was made, then the asymptotic analysis method on heavy
load condition was applied.
After mathematical transformations the asymptotic characteristic function of the calls number
ju −α
) , so it is characteristic function of gammain the orbit was obtained as: h(u ) = (1 −
β(1 − ρ)
−1
b
1
1
distribution with parameters β = ⎛⎜VλE + 23 ⎞⎟ , α = 1 + β , where b, b2 are first and second
bσ
b⎝
2b ⎠
1
moments of service distribution law, vector V is a solution of the system VQ = R( I − λ ) . Also
b
in the paper some numerical results of asymptotic distribution parameters researching are presented.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
УДК 519.87
В.Ф. Первушин
О НЕПАРАМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ
ЛИНЕЙНЫХ ДИНАМИЧЕСКИХ ОБЪЕКТОВ
Рассматриваются задачи идентификации стационарных линейных динамических объектов в условиях непараметрической неопределенности. Предлагается модифицированный метод временных характеристик, позволяющий
использовать гладкие входные воздействия для идентификации, а также модели объектов, основанные на результатах идентификационных экспериментов. Приводится пример использования непараметрических методов сглаживания в процессе идентификации. Описан процесс идентификации объектов в условиях проведения пассивных экспериментов.
Ключевые слова: пассивный эксперимент, идентификация, непараметрическая модель, динамический объект, переходный процесс.
В справочнике [1, т. 1, с. 232] описаны классические методы непараметрической идентификации линейных динамических систем. Одним из них является
метод временных характеристик. Он предполагает воздействие на объект идентификации таким образом, чтобы реакция объекта соответствовала одной из
временных характеристик объекта: переходной и импульсной переходной характеристикам. Однако авторы справочника замечают, что метод «не позволяет
обычно осуществлять идентификацию в реальном времени, не ориентирован на
использование естественных входных и выходных воздействий, не обладает повышенной помехоустойчивостью». Данная работа призвана описать подход к
идентификации стационарных линейных динамических объектов, использующий идею метода временных характеристик и не обладающий приведенными
выше недостатками.
1. Постановка задачи
Задача заключается в нахождении описания объекта, достаточно точно описывающего его поведение в условиях, когда исследователю известны только качественные характеристики его поведения. К таким характеристикам относится его
инертность, изменчивость во времени его структуры и другие. Отсутствие другой
априорной информации о структуре объекта, необходимой для построения модели объекта, может быть обусловлено необходимостью привлечения ресурсов, которыми исследователь не располагает (либо привлечение ресурсов нецелесообразно, негуманно и т.д.).
В настоящей работе рассматриваются объекты, которые относятся к классу
стационарных линейных динамических детерминированных объектов без запаздывания. Это означает:
- объект незначительно изменяется (изменения его внутренней структуры) в
течение времени его изучения;
- известные исследователю воздействия на объект и наблюдаемые исследователем реакции объекта на эти воздействия линейны. Изменение любого учтенного
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
96
В.Ф. Первушин
воздействия приведет к изменению реакций объекта на это изменение, причем реакции будут изменяться согласно линейному закону;
- состояние объекта в некоторый момент времени значительно зависит от воздействий, оказываемых на объект в этот момент времени и от состояния объекта в
предшествующие моменты времени;
- полученное в ходе исследования описание объекта учитывает все значимые
характеристики объекта, оказывающие влияние на его состояние;
- время воздействия на объект и время его реакции на это воздействие незначительно отличаются и им пренебрегается в модели.
Также в работе предполагается наличие аддитивных помех с априорно неизвестным распределением, которые действуют в каналах измерения характеристик
объекта. Другими словами, предполагается наличие погрешностей измерительных
приборов, используемых в идентификационных экспериментах, о которых пойдет
речь далее. Информации о погрешностях приборов исследователь априори не
имеет.
Для построения модели требуется информация о поведении объекта. Такую
информацию можно получить, наблюдая за поведением объекта, в некоторых
случаях воздействуя на объект. В настоящей работе рассматривается задача идентификации объектов при помощи проведения пассивных экспериментов с объектом, однако для объяснения принципа, используемого для решения поставленной
задачи, предварительно решается задача идентификации объекта на основании результатов активного эксперимента.
В работе предполагается возможность проведения исследователем активного
эксперимента с объектом при воздействии на объект и с последующим наблюдением за его реакцией. При отсутствии возможности проведения активных экспериментов, предполагается возможность пассивного наблюдения за поведением
объекта.
Описание объектов. Использование моделей динамических объектов в виде
свертки их временных характеристик наилучшим образом подходит для идентификации данных объектов. Этот подход не требует привлечения априорно неизвестной информации.
В работе рассматриваются модели объектов в виде интегралов Дюамеля (1) и
Коши – Лагранжа (2) (для наглядности ниже представлена скалярная запись данных интегралов с одной входной и одной выходной характеристиками объекта):
t
x ( t ) = ∫ h′ ( t − τ ) u ( τ ) d τ ;
(1)
t0
t
x ( t ) = f ( t − t 0 ) + ∫ h′ ( t − τ ) u ( τ ) d τ ,
(2)
t0
где t0 – момент времени начала наблюдения за объектом, x(t) – функция, описывающая выходную реакцию объекта, h(t) – функция, описывающая переходную
характеристику объекта, производная от которой h′ ( t ) описывает импульсную
переходную характеристику объекта, u(t) – функция, описывающая входное воздействие на объект, f (t) – функция, описывающая свободную составляющую
движения объекта.
Модели (1) и (2) отличаются возможностью учета нестабильного начального
состояния объекта. Для этого в интеграле Коши – Лагранжа используется свобод-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О непараметрической идентификации линейных динамических объектов
97
ная составляющая движения объекта, описывающая поведение объекта в этом нестабильном начальном состоянии.
Использование моделей (1) и (2) в настоящей задаче обусловлено тем, что они
не требуют наличия априорно неизвестной информации, кроме информации о
поведении характеристик h(t) и f (t). Эту информацию можно получить при проведении идентификационного эксперимента.
2. Эксперименты
Для идентификации характеристик объекта предлагается использовать метод
временных характеристик. Суть метода заключается в следующем:
• Для описания объекта в состоянии покоя на «вход» объекта подается воздействие, достаточно точно аппроксимируемое ступенчатой функцией Хэвисайда
1( t ) . На «выходе» объекта регистрируется его реакция, которая достаточно точно
аппроксимирует переходную характеристику объекта h(t). Также существует другой вариант эксперимента, в котором на «вход» объекта подают воздействие в виде δ-функции Дирака. На «выходе» объекта наблюдают подобие импульсной переходной характеристики h′ ( t ) .
• Чтобы описать объект в нестабильном состоянии, требуется наличие информации о двух характеристиках объекта h(t) (или h′ ( t ) ) и f (t). Для этого на
«вход» объекта, когда тот находится в интересующем состоянии, прекращают
воздействия. Таким образом, на «выходе» объекта наблюдается затухание реакции объекта, которое соответствует свободной составляющей движения объекта
f ( t ) . Далее, в момент времени, когда затухающий процесс можно считать прекратившимся, на «вход» объекта воздействуют так, как это описано в предыдущем пункте (в случае с объектом в состоянии покоя) и получают значения второй характеристики.
Данный метод является относительно простым с точки зрения реализации,
требует проведения значительно меньшего количества опытов с объектом по
сравнению с некоторыми другими непараметрическими методами идентификации, однако имеет и существенные недостатки. Использование тестовых сигналов, которые описываются функциями Хэвисайда и Дирака невозможно на практике, так как обе эти функции являются обобщенными и принимают сингулярные
значения. Это означает, что при использовании метода временных характеристик
исследователь заранее закладывает погрешность в результаты своего эксперимента, которая вызвана отклонением реального входного сигнала от его «идеального»
образа. В стремлении сократить данную погрешность исследователь тоже рискует, так как приближение реального сигнала к сигналу, который описывается сингулярными величинами, может быть губительно. При подаче на «вход» объекта
сигнала с достаточно большой амплитудой или скоростью может произойти поломка или даже разрушение самого объекта или его частей. Авторы справочника
[1, т. 1, с. 236] называют ещё один недостаток метода: «для получения значительного отклика, резко выделяющегося на фоне неизбежных в реальном объекте шумов, необходима большая величина («амплитуда») кратковременного импульса.
В реальных объектах это связано обычно с появлением «нелинейных искажений»
(проявлением нелинейностей)». Таким образом, можно сделать вывод, что использование сигналов, которые описываются обобщенными функциями и не реализуемы на практике неэффективно, а иногда даже вредно.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
98
В.Ф. Первушин
Предлагается использовать идею метода временных характеристик для идентификации объектов, используя гладкие и реализуемые на практике входные сигналы.
Для этого можно использовать модели объекта (1) и (2) и определить зависимость
характеристик объекта h(t) и f (t) от характеристик u(t) и x(t). Для решения данной
задачи предлагается использовать непрерывное преобразование Лапласа.
Преобразуем модель объекта в состоянии покоя (1) при помощи преобразования Лапласа, получим
X ( p ) = pH ( p )U ( p ) .
(3)
Здесь p – переменная преобразования, X ( p ) – изображение по Лапласу функции
x ( t ) , H ( p ) – изображение по Лапласу функции h ( t ) , U ( p ) – изображение по
Лапласу функции u ( t ) . Выразим из (3) изображение H ( p ) :
H ( p) =
X ( p)
.
pU ( p )
(4)
На основании выражения (4) можно получить описание поведения переходной
характеристики (или импульсной переходной характеристики) объекта в виде зависимости от выходной реакции объекта и определенного тестового входного
воздействия (его параметрического описания). Например, для входного сигнала,
описывающегося гладкой аппроксимацией функции Хэвисайда:
(
)
u ( t ) = c1 1 − ec2t ,
(5)
где u ( t ) – приведенный в качестве примера сигнал, c1 , c2 – параметры сигнала.
Изображение по Лапласу данного сигнала описывается выражением
−c c
(6)
U ( p) = 2 1 2 ,
p − c2 p
где U ( p ) – изображение по Лапласу сигнала u ( t ) .
Подставив полученное выражение (6) в (4), получим описание поведения изображения переходной характеристики объекта как реакции на сигнал (5):
1
1
H ( p) = X ( p) −
pX ( p ) ,
(7)
c1
c1c2
здесь X ( p ) – изображение по Лапласу реакции объекта на воздействие u ( t ) .
Во временной области поведение переходной характеристики объекта, соответствующее уравнению (7), записывается следующим образом:
1
1 d
h (t ) = x (t ) −
x (t ) ,
(8)
c1
c1c2 dt
где x ( t ) – реакция объекта на воздействие u ( t ) .
В результате можно говорить о том, что для идентификации характеристик
объекта можно подать на «вход» объекта сигнала u ( t ) , зарегистрировать реакцию
объекта x ( t ) на этот сигнал и, преобразовав эту реакцию согласно (8), получить
описание поведения переходной характеристики объекта.
Аналогично приведенным выше расчетам можно получить описание поведения переходной характеристики объекта (впрочем, как и импульсной переходной
характеристики) для любого входного сигнала, который интересует исследовате-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О непараметрической идентификации линейных динамических объектов
99
ля. Сигнал может быть реализован на практике с использованием имеющихся
средств управления и контроля. Если задача требует учета нестабильного начального состояния объекта, исследователю следует произвести аналогичные расчеты
на основе модели (2). В этом случае требуется идентификация пары характеристик ( h ( t ) , f ( t ) ) и проведение минимум пары экспериментов.
3. Непараметрическая идентификация
В ходе исследования предложенного метода был выявлен один существенный
его недостаток, который так же характерен для классического метода временных
характеристик. Недостаток данного метода – низкая помехоустойчивость. Использование оператора дифференцирования для оценки характеристик объекта
приводит к увеличению уровня случайных помех. Усиление помех тем больше,
чем выше степень производной, используемой при расчетах.
Для борьбы с низкой помехоустойчивостью предложенного метода в данной
работе предлагается использовать методы непараметрической статистики, и в частности непараметрические оценки регрессии Пристли [2]. Данная оценка, является аппроксимацией непараметрических оценок регрессии Надарая – Ватсона [3]
в условиях, когда закон распределения входных возмущений (стимулов) достаточно точно описывается равномерным законом распределения. Непараметрическая оценка регрессии Пристли записывается как
ys (t ) =
n
⎛ t j − tij ⎞
y
H
⎜
⎟.
∑ i∏
n
csj ⎠
j i =1
⎝
j =1
s ∏ cs
1
s
(9)
j =1
Здесь ys (t ) – непараметрическая оценка Пристли некоторой характеристики
y (t ) ; s – объем выборки
{( yi , ti )} , состоящей из пар значений этой характери-
стики yi и значений вектора независимых стимулов ti размерности n , состоящего из компонент tij ; cs – вектор параметров размытости оценки, csj -я компонента которого соответствует j-й компоненте вектора стимулов; H ( ⋅) – колоколообразная функция оценки. Параметры csj и функция H ( ⋅) из оценки (9) удовлетворяют условиям сходимости [4].
Непараметрические оценки типа (9) позволяют получить описание исследуемой зависимости, сокращая влияние случайных возмущений. Полученные оценки
являются гладкими. Степень гладкости оценки напрямую зависит от выбора её
параметров H ( ⋅) и cs .
Предлагается использовать непараметрические оценки Пристли для описания
выходных реакций объекта, а также их производных. Описание производных выходных реакций осуществляется при помощи непараметрических оценок производных. Так, для рассмотренного выше примера, непараметрическая модель переходной функции объекта может быть найдена следующим образом:
1
1 d
hs ( t ) = xs ( t ) −
xs ( t ) ,
(10)
c1
c1c2 dt
где hs ( t ) – непараметрическая оценка переходной характеристики объекта,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.Ф. Первушин
100
xs ( t ) – непараметрическая оценка выходной реакции объекта,
d
xs ( t ) – произdt
водная непараметрической оценки этой реакции:
xs ( t ) =
1
s ⋅ cs
s
⎛ t − ti ⎞
⎟;
⎝ cs ⎠
∑ x ( ti ) H ⎜
i =1
(11)
⎛ t − ti ⎞
d
1 s
xs ( t ) =
x ti H ⎜
⎟.
2 ∑
dt
s ⋅ cs i =1
⎝ cs ⎠
( )
(12)
( ) – значение выходной реакции объекта в момент времени ti ,
Здесь x ti
H ( ⋅) –
производная колоколообразной функции оценки. Необходимо отметить, что значение оптимальных параметров размытости в оценках (11) и (12) могут не совпадать, поэтому для каждой из этих оценок требуется проводить отдельную процедуру оптимизации параметров.
4. Численный эксперимент
Для иллюстрации предложенного метода был произведен численный эксперимент по идентификации характеристик объекта, описанного дифференциальным
уравнением
3 x ( t ) + x ( t ) + x ( t ) = u ( t ) , x ( 0 ) = 0, x ( 0 ) = 0 .
(13)
На «вход» объекта подавался сигнал, который описывается функцией
u ( t ) = 1 − e −t 4 .
(14)
В эксперименте на «вход» объекта подается воздействие с аддитивной помехой, величиной 5 % относительно полезного входного сигнала. На «выходе» объекта регистрируется реакция объекта на данное воздействие. Прибор контроля в
эксперименте имеет погрешность, составляющую 5 % относительно полезного
выходного сигнала. В результате эксперимента зарегистрировано 1000 значений
входных и выходных характеристик объекта, которые представлены на рис. 1 и
рис. 2 соответственно.
На рис. 1 и 2 непрерывными линиями изображены истинные входная и выходная характеристики объекта (неизвестные исследователю и приведенные здесь
для наглядности), а также значения этих характеристик с аддитивными помехами,
изображенные точками.
u
1
0,5
0
10
20
30
40
Рис. 1. Выборка значений входной характеристики u ( t )
t
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О непараметрической идентификации линейных динамических объектов
101
х
1
0,5
0
10
20
30
40
t
Рис. 2. Выборка значений выходной характеристики x ( t )
Далее были преобразованы значения выходной реакции объекта согласно
формуле (10), в которой использовались следующие параметры непараметрических оценок: колоколообразная функция H (t ) = [(cos (π⋅ t ) + 1) 2] ⋅[1(t + 1) −1(t −1)] ,
параметр размытости оценки выходной реакции cs = 0,05 , параметр размытости
оценки производной выходной реакции cs = 2 . Колоколообразная функция,
а также значения параметров размытости были выбраны исходя из наименьшей
среднеквадратической ошибки идентификации переходной характеристики. На
рис. 3 изображен результат преобразования.
h
1
0,5
0
10
20
30
40
t
Рис. 3. Выборка значений переходной характеристики h ( t )
На рис. 3 непрерывной линией изображена переходная характеристика объекта, значения которой требуется найти. Точками на рис.3 изображены значения переходной характеристики объекта, найденные в результате преобразования значений, полученных в эксперименте. Относительная ошибка идентификации в примере составила 5,25 %. Отметим, что ошибка соизмерима с погрешностью приборов контроля.
Полученные результаты, по мнению автора, могут являться удовлетворительными во многих задачах, требующих изучения объектов, относящихся к классу
линейных динамических объектов. Такой подход значительно расширяет возможности исследователей для изучения объектов, так как позволяет использовать
произвольные сигналы для идентификации объекта. Кроме того, метод позволяет
учитывать некоторые неточности, которые возникали при использовании классического метода временных характеристик. Предложенный метод также имеет
другие достоинства, которые описаны ниже.
Пассивные эксперименты. В настоящей работе приводится метод, предполагающий возможность непараметрической идентификации стационарных линей-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.Ф. Первушин
102
ных динамических объектов при помощи гладких и реализуемых на практике
сигналов. В предыдущем разделе работы приводится пример идентификации переходной характеристики объекта в условиях проведения активного эксперимента. Однако идея предлагаемого метода может быть распространена и на случай
пассивного эксперимента, в котором исследователь лишь наблюдает за входными
и выходными характеристиками объекта. В данном случае для идентификации
объекта исследователю достаточно получить параметрическое описание входных
возмущений. Полученное описание будет использоваться при определении преобразований выходных реакций, необходимых для идентификации объекта.
Параметрическое описание входных возмущений может быть получено при
помощи параметрических методов построения моделей, в частности метода наименьших квадратов, метода стохастической аппроксимации, методов, использующих эволюционный (генетический) подход, и т.д.
В качестве примера, иллюстрирующего возможности использования метода
для идентификации объекта в условиях проведения пассивного эксперимента,
рассматривается случай, когда на входе объекта наблюдается сигнал, изображенный на рис. 4. На «выходе» объекта регистрируется реакция на данное воздействие. График реакции также приведен на рис. 4.
2
1
0
u(t)
x(t)
–1
–2
0
2
4
6
8
t
Рис. 4. Наблюдаемые входная u(t) и выходная x(t) характеристики объекта
Поиск параметрической модели входной характеристики объекта было решено
производить в классе полиномов вида (15) при помощи метода наименьших квадратов.
n
us ( t ) = ∑ αi t i .
(15)
i =0
Здесь us ( t ) – параметрическая модель «входа» объекта, n – старшая степень полинома – модели «входа» объекта, αi – компоненты вектора α параметров модели, размерности n + 1 .
На основе наблюдений, полученных в результате пассивного эксперимента с
объектом, было принято решение использовать модель со следующими характеT
ристиками: n = 6 , α = (0,009 0,797 0,501 −0,587 0,153 −0,015 0,001) , где Т –
знак транспонирования.
Так, на основе предложенного метода было определено уравнение (16), позволяющее найти значения переходной характеристики объекта по результатам эксперимента.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О непараметрической идентификации линейных динамических объектов
103
t
h ( t ) = 105,57 x ( t ) + ∫ x ( t − τ ) ⎡⎣7,9e −3,25τ − 8894e82,8τ + 0, 254cos ( 0,175τ ) e0,55τ −
0
− 0,009sin ( 0,175τ ) e0,55τ + 0, 2e0,4 τ cos ( 0,54τ ) − 0,02e0,4 τ sin ( 0,54τ ) ⎤⎦ d τ.
(16)
Значения переходной характеристики объекта, восстановленные при помощи
(16) изображены на рис. 5. Полученный сигнал незначительно отличается от истинной переходной характеристики объекта и может быть использован исследователем
для изучения объекта и формирования гипотез относительно его поведения.
h
1
0,5
h(t)
0
2
4
6
8
t
Рис. 6. Результаты идентификации h ( t ) в условиях пассивного эксперимента
5. Непараметрические модели свертки
Полученные в данной работе результаты позволяют сделать вывод, что идентификация объектов при помощи различных тестовых сигналов с последующим
использованием моделей свертки его характеристик является достаточно «гибким» инструментом моделирования. Модели свертки могут быть преобразованы
так, чтобы учитывать непосредственно результаты экспериментов, минуя этап
идентификации характеристик объекта. Так, для рассмотренного примера исследователь мог бы получить непараметрическую оценку выходной реакции объекта,
подставить оценку (10) в модель (1) следующим образом:
t
t
⎡1 d
⎤
1 d2
xs ( t ) = ∫ hs′ ( t − τ )u ( τ ) d τ = ∫ ⎢
xs ( t ) −
x ( t )⎥ u ( τ ) d τ ,
2 s
c dt
c1c2 dt
⎦ t −τ
t0
t0 ⎣ 1
(17)
d2
xs ( t ) – непараметрическая оценка второй производной выходной реакции
dt 2
объекта на возмущение (5).
Непараметрические модели свертки, основанные на идентификационных экспериментах, записаны как
где
t
xs ( t ) = ϕ [ x1 ( t )] + ∫ ψ [ x2 ( t )]u ( τ ) d τ ,
(18)
t0
где ϕ [⋅] – преобразование реакции объекта x1 ( t ) на некоторое возмущение u1 ( t ) ,
соответствующее свободной составляющей движения; ψ [⋅] – преобразование ре-
акции объекта x2 ( t ) на входное возмущение u2 ( t ) , соответствующее импульсной переходной характеристике объекта.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
104
В.Ф. Первушин
Таким образом, можно говорить об обобщении моделей свертки (18) основанном на экспериментах и носящем прикладной характер. Такие модели могут быть
построены на основании результатов активных и пассивных идентификационных
экспериментов, минуя этап идентификации характеристик объекта.
Заключение
В заключение отметим, что поставленная в работе задача по идентификации
объектов в условиях непараметрической неопределенности решена. К научной
новизне проведенной работы можно отнести: описание характеристик объекта,
полученное путем воздействия на этот объект гладкими сигналами, а также путем
пассивного наблюдения за поведением объекта; предложенные в последнем разделе модели, основанные на результатах идентификации объектов, расширяют
класс моделей линейных динамических объектов. Практическая значимость приведенных результатов заключается: в снижении ошибок идентификации за счет
исключения погрешностей на этапе экспериментов; повышении помехоустойчивости за счет введения непараметрических оценок регрессии характеристик объекта, а также непараметрических оценок их производных.
ЛИТЕРАТУРА
1. Красовский А.А. Справочник по теории автоматического управления / под ред. А.А. Красовского. М.: Наука, 1987. 712 с.
2. Priestley M.B., Chao M.T. Nonparametric function fitting // J. Royal Statistical Society. Series
B. 1972. P. 385−392.
3. Надарая Э.А. Непараметрические оценки кривой регрессии // Труды ВУ АН ГрССР.
Вып. 5. Тбилиси, 1965. С. 55–68.
4. Медведев А.В. Непараметрические системы адаптации. Новосибирск: Наука, 1983. 174 c.
Первушин Владимир Фёдорович
Сибирский государственный аэрокосмический университет
им. акад. М.Ф. Решетнёва
E-mail: pervushin_vf@inbox.ru
Поступила в редакцию 29 апреля 2012 г.
Pervushin Vladimir F. (Siberian state aerospace university named after academician M.F. Reshetnev). On nonparametric models of linear dynamic objects.
Keywords: identification, model, convolution, transient.
The problem of identification of stationary linear dynamic objects in a non-parametric uncertainty is considered. One of the classical methods of nonparametric identification of the characteristics of objects is studied. A generalization of this method allowing the identification of the
characteristics of objects, with smooth, feasible in practice signals is proposed. The solution to the
problem of low noise-immunity of the method is proposed. The method is illustrated by the numerical experiment. The applicability of the method of objects being identified by means of passive experiments is considered. The models based on the results of identification experiments that
extend the class of models of stationary linear dynamic objects are proposed.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
УДК 519.8
В.И. Рюмкин
ПРОЦЕДУРА НЕПАРАМЕТРИЧЕСКОГО ОЦЕНИВАНИЯ
ФУНКЦИОНАЛОВ ОТ РАСПРЕДЕЛЕНИЙ СТАЦИОНАРНЫХ
ПОСЛЕДОВАТЕЛЬНОСТЕЙ И ЕЕ ПРИМЕНЕНИЕ
В ЭКОНОМИЧЕСКИХ И ТЕХНИЧЕСКИХ ПРИЛОЖЕНИЯХ
Построена процедура синтеза сходящихся в среднеквадратичном непараметрических ядерных оценок функционалов от неизвестных распределений по
стационарным выборкам слабозависимых случайных величин в условиях равномерно сильного перемешивания. Получены достаточные условия сходимости полученных оценок в среднеквадратичном. Показана асимптотическая
нормальность полученных оценок. Рассмотрена возможность применения
предложенной процедуры в экономических и технических приложениях.
Ключевые слова: непараметрическое оценивание, ядерные функции, стационарные выборки, функционал.
Для решения многих задач прикладной статистики в условиях отсутствия априорных сведений о функции распределения (ф.р.) F ( x ) наблюдаемых многомерных случайных величин требуется оценивание функционалов, представимых в
виде [1, 2]
H ( F ( x ), F (α1 ) ( x ),… , F (αs ) ( x )), x ∈ R m ,
(1)
где H : R s +1 → R1 – заданная функция, в качестве аргументов которой выступают
частные производные F
q = 1, s ,
функции
( αq )
α
( x) ≡
∂ q F ( x)
α
α
α
∂x1 q1 ∂x2 q 2 … ∂xmqm
распределения
F ( x)
в
порядка α q = α q1 + … + α qm ,
точке
x ∈ Rm .
Мультииндекс
αq = (α q1 ,… , α qm ) здесь и далее представляет собой целочисленный вектор с неотрицательными составляющими.
К функционалам типа (1) относится функция интенсивности
λ ( x) = F (1) ( x) /(1 − F ( x))
(теория надежности и массовое обслуживание [3, 4]), логарифмическая производная плотности
ψ ( x) = F (2) ( x) / F (1) ( x)
(проверка близких гипотез [5, 6], непараметрическая нелинейная фильтрация марковских процессов [7], оценивание кривой регрессии [8]), функционал потенциала
экономической системы [9]. Естественный и наиболее распространенный метод
оценивания состоит в подстановке вместо производных F
(α )
( αq )
( x ) их состоятель-
ных оценок F q ( x ) , q = 0, s . Однако прямое использование этого метода не всегда гарантирует получение оценок нужного качества, если, например, функция
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Рюмкин
106
H (⋅) в (1) имеет некоторые особенности (неограниченность, недифференцируемость и др.). В результате некорректной подстановки может получиться оценка,
не имеющая дисперсии или даже математического ожидания.
В данной работе предложена универсальная процедура получения сходящихся
в среднеквадратичном оценок функционалов (1) на основе использования непараметрических оценок ф.р. F ( x ) и ее производных F
( αq )
( x ) ядерного типа и опе-
рации усечения больших значений статистик H ( F ( x ), F (α1 ) ( x ),… , F (αs ) ( x )) , получаемых по методу прямой подстановки этих оценок в H (⋅) .
1. Обозначения и определения
Пусть { x ( j ) ∈ R m } − стационарная в узком смысле последовательность случайных величин, заданных на пространстве { X , BX , Px } ; F ( x ) = Px ( x ( j ) < x ) − ф.р.
элементов последовательности { x ( j )} . Будем говорить, что { x ( j )} удовлетворяет
условию равномерно сильного перемешивания (РСП), если ее коэффициент перемешивания ϕ x (τ) [10] удовлетворяет условию
⎧ P ( AB) − Px ( A) Px ( B )
⎫
x
ϕ x (τ) = sup ⎨ x
: A ∈ ℑ<x1 , B ∈ ℑ>τ
, Px ( A) ≠ 0 ⎬ ⎯⎯⎯
→ 0 . (2)
τ→∞
Px ( A)
A, B ⎩
⎭
ℑ<xk , ℑ>xk − алгебры,
Здесь
порожденные
соответственно
семействами
{ x ( τ) : τ < k } , { x ( τ ) : τ > k } .
(α )
(α )
При построении состоятельных оценок F q ( x ) неизвестных F q ( x ) , определяющих значение функционала (1), будем использовать оценки ядерного типа.
Для каждой оцениваемой величины
F
( αq )
( x)
рассмотрим т-мерное ядро
m
K q (u) ≡ ∏ K qi (ui ) , представляющее собой произведение заданных одномерных
i =1
ядерных вещественных функций K qi (ui ) : R1 → R1 .
В качестве состоятельных оценок F
оценки ядерного типа
F
( αq )
( αq )
( x ) = Fn
( x) ≡
1
( αq )
( x ) величин F
n
( αq ) ⎛
∑ Kq
α
nhq q j =1
⎜⎜
⎝
( αq )
x − x( j) ⎞
⎟⎟ ,
hq
⎠
( x ) рассмотрим
(3)
α
⎛ xi − xi ( j ) ⎞
x − x ( j ) ⎞ m ∂ qi
=
⎜⎜ h
⎟⎟ ∏ α qi K qi ⎜⎜
⎟⎟ есть произведение производных
hq
q
⎝
⎠ i =1 ∂xi
⎝
⎠
одномерных ядерных функций; hq – параметр размытости. Оценки строятся на
( αq ) ⎛
где K q
основе выборки X n ≡ ( x (1),… , x (n)) объема n из генеральной совокупности всех
последовательностей { x ( j )} . В (3) и везде далее: q = 0, s ; α ≡ (α1 , α 2 ,… , α m ) ;
α ≡ α1 + α 2 + … + α m ; если x ∈ R m и α ∈ R m , то тогда x α ≡ x1α1 x2α 2 … xmαm ; если
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Процедура непараметрического оценивания функционалов
x ∈ R1 и α ∈ R m , то тогда xα ≡ x α1 +α 2 +…+α m ; 0 ≡ (0,0,… ,0) ;
107
1 ≡ (1,1,… ,1) ;
x > y ⇔ xi > yi , i = 1, m ; ϕ(n) ≺ ψ (n) ⇔ ϕ(n) < ψ (n) ∀n > N ;
⎧ 1, x j > 0,
⎪
sgn( x ) ≡ (sgn( x1 ),sgn( x2 ),… ,sgn( xm )) , где sgn( x j ) = ⎨ 0, x j = 0,
⎪−1, x < 0.
j
⎩
Определение 1. Последовательность h ≡ h(n) положительных вещественных
чисел h ∈ H k , h ∈ H k ,ε , если она удовлетворяет соответственно условиям
lim ⎛⎜ h +
n →∞ ⎝
1
⎞ = 0,
⎟
nh 2 k −sgn( k ) ⎠
lim ⎛⎜ h +
n →∞ ⎝
1
⎞ = 0.
⎟
n1−ε h 2 k −sgn( k ) ⎠
Определение 2. Функция f ∈ N α ( x ) , если f ( x ) абсолютно непрерывна на
R
m
и имеет непрерывную производную
f (α ) ( x ) =
∂α f ( x)
∂x1α1 ∂x2α 2 … ∂xmα m
порядка α в точке x ; f ∈ N α+ ( x ) , если f ∈ Nα ( x ) и sup | f (ν ) ( x ) |< ∞ , 0 < v < α .
Записи f ∈ Nα ( R m ) и f ∈ Nα+ ( R m ) означают, что f ( x ) удовлетворяет соответственно условиям f ∈ Nα ( x ) и f ∈ Nα+ ( x ) при любых x ∈ R m .
Определение 3. Ядро K (u ) ∈ L1 , если оно измеримо по Борелю, причем
∫ | K (u ) | du < ∞ ;
K (u ) ∈ L1+ , если K (u ) ∈ L1 и, кроме того, sup | K (u ) |< ∞ .
K (u) ∈ L1 , если Ki (ui ) ∈ L1 , i = 0, m ;
K (u) ∈ L1+ , если Ki (ui ) ∈ L1+ , i = 0, m .
Определение 4. K (u ) ∈ Z s ,v , если
⎧⎧ 0, j = 0, s − 1, j ≠ v,
⎪⎨
j
K
(
u
)
u
du
=
j = v,
⎨⎩(−1)v v !,
∫
⎪ ω ≠ 0, j = s.
s ,v
⎩
K (u) ∈ Z s ,v , если Ki (ui ) ∈ Z si ,vi , i = 0, m .
Определение 5. Ядро K (u ) ∈ B , если K (u ) абсолютно непрерывно на R1 ,
K (u ) = K (−u ) ,
∫ K (u )du = 1 ,
K (u ) ∈ L1 ; K q (u) ∈ B , если K qi (ui ) ∈ B, i = 1, m ;
B + ≡ K ∩ L1 ; B + ≡ B ∩ L1 .
При написании данной работы везде далее рассматриваются стационарные последовательности с.в. из класса Seq p , коэффициент РСП ϕ(τ) которых с ростом
τ убывает не медленнее степенной функции (см. определение 6 и Замечание 1).
Определение 6. Последовательность РСП с.в. { x ( j )} ∈ Seq p , p > 0 , если
n
∑ (1 − τ / n )(ϕ x (τ))1/ p = O(1) .
τ=1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Рюмкин
108
Замечание 1 . Если ϕ x (τ) = с1τ− (1+ε ) , ε > 0 , то { x ( j )} ∈ Seq p , где p ∈ (0, 1 + ε) .
n
Действительно, в этом случае
∑ (1 − τ / n )(τ)−(1+ε) / p = O ( (n)1−(1+ε) / p ) + O(1) = O(1) ,
τ=1
если 0 < p ≤ 1 + ε .
Подтверждением того, насколько широкое распространение находят последовательности РСП с.в. класса Seq p в практических приложениях, служит следующий пример. Рассмотрим последовательность с.в. {x( j )} , где x( j ) представляет собой номер исхода в j-м испытании для однородной цепи Маркова с конечным числом состояний. Как показано ([10, c. 466–467]), «при достаточно широких
условиях» последовательность {x( j )} стационарна и удовлетворяет условию РСП
с
коэффициентом
перемешивания
ϕ x ( τ) ≤ K ρ τ , ρ < 1 .
Следовательно,
{x( j )} ∈ Seq p . Отметим, что марковские процессы широко используются в различных практических приложениях: радиофизике, автоматике, телемеханике,
ядерной физике [11,12], экономике [13] и др.
Рассмотрим последовательность с.в.
x − x( j) ⎞
(α ) ⎛ x − x ( j ) ⎞
ξ(jα ) ≡ K (α ) ⎛⎜
(4)
⎟ − EK ⎜
⎟,
h
h
⎝
⎠
⎝
⎠
порождаемую выборкой X n .
Введем неограниченно возрастающую числовую последовательность d n с помощью равенства
s
1
1
(5)
≡ ∑ 2α −sgn(α ) .
i
d n i =0 nhi i
В соответствии с (4) и (5) положим
⎛ n (α ) ⎞
1 1
D
⎜⎜ ∑ ξ j ⎟⎟ =
n→∞ n hsgn(α )
⎝ j =1
⎠
βα = lim
⎧
(α )
⎨ E ξ1
n→∞ hsgn( α ) ⎩
= lim
1
(
)
2
n −1
α) ⎫
+ 2∑ (1 − τ / n ) E ξ1(α ) ξ1(+τ
⎬,
⎭
τ=1
(
σα ≡ lim βα
n→∞
Обозначим ωμ,α ≡ ∫ (u)μ−α K (1) (u)du
dn
2α −sgn(α )
nhi
)
.
F (μ ) ( x )
.
(μ − 1)!
2. Усеченные оценки функционалов
Рассмотрим функционал H ( τ ( x )) , где τ ( x ) ≡ ( F ( 0) ( x ), F (α1 ) ( x ),…, F (α s ) ( x )) .
Положим
t n ( x ) ≡ ( t0 n ( x ),… , tsn ( x ) ) , tin ( x ) ≡ Fn(αi ) ( x ) ,
τ n ( x ) ≡ Et n ( x ) , τin ( x ) ≡ EFn(αi ) ( x ) .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Процедура непараметрического оценивания функционалов
109
Без ограничения общности везде далее
m
m
j =1
j =1
∑ α sj >∑ αij , если i ≠ s .
В некоторых случаях корректное использование прямого метода подстановки
при оценивании H ( τ ( x )) дает неудовлетворительный результат, так как наличие
особенностей функции H (⋅) приводит к «выбросам» и несостоятельности получаемых таким способом оценок H (t n ) .
Для избежания нежелательных эффектов такого сорта введем операцию усечения больших значений H (t n ) :
⎧⎪ H (t n ),
| H (t n ) |< Cd nγ ,
G (tn ) = ⎨
γ
γ
⎪⎩C sign( H (t n ))d n , | H (t n ) |≥ Cd n .
Здесь C , γ − положительные константы.
(6)
Определенная таким образом процедура усечения (6) задает класс PC , γ ( H ) зависящих от n функционалов, которые сходятся в среднеквадратичном к H (τ ( x ))
при n → ∞ . Следующая теорема дает условия, при которых усеченная оценка
G (t n ) ∈ PC ,θ ( H ) сходится в среднеквадратичном к H ( τ ( x )) при n → ∞ .
Теорема 1. Пусть элементы выборки X n взяты из последовательности слабо-
зависимых случайных величин
{ x ( j )} ∈ Seq p ,
p > 1 , причем
F ∈ Nμ+ ( x ) ,
μ k ≥ αik + 1, i = 0, s ; k = 1, m .
Пусть, кроме того,
1. h0 ∈ H 0 ; h j ∈ H α j ,δ j , δ j =
2.
2μ(μ − 1) − w j (2 w j − 1) + ws
(2μ − 1)(μ + w j − 1))
(
)
lim K 0 (u ) = 0 , lim u μi −α ki + j K α( j ) (u ) = 0 ,
u →−∞
|u |→∞
ki
, j ≥1;
j = 1, α ki − 1 ,
k = 1, s ; i = 1, m ;
K q(1) (u) ∈ B ; K q(1) (u) ∈ Zμ −α q ,0 ;
3. H ( z ) = H ( z0 , z1 ,… , zs ) − вещественная функция, которая в некоторой окрестности точки τ непрерывна и имеет непрерывные первые и вторые производные
по аргументам z j ∈ R1 , причем ∞ > H s ( τ ) > 0 ;
4. G (t n ) ∈ PC ,θ ( H ) , где
{
(α j )
C = max sup K j
j = 0, s
θ=
}
( u) ;
u
2μ − 1
.
2(μ − ws )
(7)
(8)
Тогда усеченная оценка G (t n ) ∈ PC ,θ ( H ) сходится к H s ( τ ) при n → ∞ в среднеквадратичном. При этом оптимальные последовательности параметров размытости {h j } имеют вид
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Рюмкин
110
μ− ws
⎧
⎪h∗ = Argmin u 2 (G (t )) ≈ o ⎛⎜ 1 ⎞⎟ μ (2μ−1) ,
n
⎪ 0
⎝n⎠
h0
⎪
μ+ ws −1
⎪
⎛ (2 ws − 1)μ !σ 2s ( x ) 1 ⎞ 2μ−1
⎪ ∗
2
×
⎨h j = Argmin u (G (t n )) = ⎜
⎟
2 (μ )
hj
⎝ 2(μ − ws ) κ s F ( x ) n ⎠
⎪
⎪
1
⎪ ⎛ (2 w j − 1)(μ − ws − 1)! H s ( τ ) κ s ⎞ μ+ w j −1
j = 1, s.
,
⎪× ⎜⎜
⎟
⎪⎩ ⎝ (2 ws − 1)(μ − w j − 1)! H j ( τ ) κ j ⎟⎠
(9)
а оптимальная СКО u 2 (G (t n )) равна
2
u 2 (G (t n )) ≡ E ( G (t n ) − H ( τ ) ) ≈
1
≈ ⎛⎜ f ( x ) ⎞⎟
⎝n
⎠
где
2(μ− ws )
2μ−1
Rμ, ws
⋅ Rμ, ws ⋅ ( σ rs )
( μ− ws )
2μ−1
⋅ ( κs )
2(2 ws −1)
2μ−1
(
⋅ H s2 ( τ ) ⋅ F (μ ) ( x )
⎛ 2μ − 1 ⎞ ⎛
2 2 ws − 1 ⎞
=⎜
⎟ ⋅ ⎜ ((μ − 1)!)
⎟
2(
w
)
2(μ − ws ) ⎠
μ
−
⎝
s ⎠ ⎝
−
2 ws −1
2μ−1
)
2(2 ws −1)
2μ−1
, (10)
−
не зависящая от ядерных функций константа,
(
)
2
κ s = ∫ (u)μ − 1 K s( α s ) (u)du ; σαs = ∫ K s( αs ) (u) du +
m
m
i=1
i =1
γ αs
f ( x)
.
В (9) и (10) μ = ∑ μi , ws = ∑ α si .
Следующая теорема устанавливает асимптотическую нормальность оценок
усеченного типа.
Теорема 2. В условиях теоремы 1
( (
)
(
d n G Fn( 0) ( x ),… , Fn(α s ) ( x ) − G F ( 0) ( x ),… , F (α s ) ( x )
где
λ n = H s ( τ ) d n ⋅ ∫ ( u ) μ − α K ( 1 ) ( u ) du
F ( μ ) ( u) ∗
⋅ hs
(μ − 1)!
μ− ws
( )
;
) ) (⇒ N1 (λn ;
ρ) ,
ρ = H s2 ( τ )σαs ( x ) .
Теорема 1 является конструктивной и дает способ построения оценок
G (t n ) ∈ PC ,θ ( H ) функционала H (τ ) , сходящихся в среднеквадратичном к его истинному значению. Как следует из (10), асимптотическая СКО u 2 (G (t n )) таких
оценок мажорируется степенной функцией, которая при увеличении параметра
гладкости μ ф.р. F ( x ) неограниченно сближается с функцией 1/ n :
u 2 (G (t n )) ≺ C ⋅ Rμ, ws ( n )
−
2(μ− ws )
2μ−1
.
Здесь C не зависит от μ и s .
Известно, что скорость сходимости СКО ≈ 1/ n имеет место в параметрической постановке задачи оценивания [1, 5]. Тот факт, что скорость сходимости
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Процедура непараметрического оценивания функционалов
111
СКО предлагаемых усеченных непараметрических оценок при соблюдении некоторых условий регулярности (условия 2 и 3 теоремы 1) неограниченно сближается
с нижней границей сходимости СКО в параметрической постановке, говорит о
перспективности процедуры усечения (6).
3. Применение «усеченной» процедуры непараметрического оценивания
функционалов от распределений стационарных последовательностей в
экономических и технических приложениях
Предложенная в разделе 2 процедура усеченного непараметрического оценивания терминальных функционалов может быть реализована при решении различных задач экономики и техники. Одной из таких задач является задача распознавания пространственно распределенных объектов. Задачи распознавания пространственно распределенных объектов возникают в многих приложениях экономики, техники, метеорологии (лесных пожаров, посевных площадей, объектов загрязнения, затопления, тайфунов, ледниковых полей и т.д.). Описанная выше
процедура оценивания в сочетании с процедурой функционального шкалирования
[14] может быть использована для решения подобных задач.
Пусть каждому объекту s ∈ S из множества S однозначно соответствует вектор количественных дискрипторов xs ∈ ℑ ⊆ R n ; причем для любого x ∈ ℑ существует вероятность PA ( x ) его принадлежности к классу A и вероятность
PB ( x ) = 1 − PA ( x ) принадлежности к классу B .
Пусть E = {ei ∈ S , i = 1, n} ⊆ S − выборочное множество объектов, совокупность дескрипторов x (i ) = { x j (i ), j = 1, m} которых образует обучающую выборку
{ x (n) ∈ R m } слабозависимых случайных величин с неизвестной функцией распределения F ( x ) ; о каждом из объектов ei ∈ E сообщается, к какому классу он
принадлежит. Требуется восстановить функцию достоверности PA ( x ) .
Рассмотрим функцию
1, x ∈ A,
I (x) =
0, x ∈ B,
{
которая в точке x равна 1 с вероятностью PA ( x ) и 0 – с вероятностью PB ( x ) . Ее
математическое ожидание равно PA ( x ) , т.е. той функции, которую надо восстановить. Пусть G ( y, z ) = y − z – «опорная» функция двух вещественных переменных, которая вместе с I ( x ) определяет на исходном множестве S матричную
структуру Q =|| qik ||m×m , элементы которой определяются следующим образом:
qik = G ( I ( x (i )), I ( x (k ))) = I ( x (i )) − I ( x (k )) .
Предположим, что I ( x ) есть информация о значениях PA ( x ) , сообщаемая с
помехой ξ( x ) , математическое ожидание которой равно нулю:
I ( x ) = PA ( x ) + ξ( x ) ,
E[ I ( x )] = PA ( x ) .
Аппроксимируем искомую функцию PA ( x ) некоторой неизвестной параметризо-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Рюмкин
112
ванной функцией-шкалой ϕ( x , b) из заданного класса вещественных функций
Φ = {ϕ( x , b)} :
⎧ z = ϕ( x , b),
⎪
PA ( x ) = ⎨0, z ≤ 0,
⎪⎩1, z ≥ 1.
0 < z < 1,
Здесь b ∈ R p – неизвестный векторный параметр.
Точность шкалы ϕ( x , b) определяется некоторым терминальным функционалом [14]
J (ϕ( x , b)) = J (ϕ( x , b), F ( x ), Q, D( PA ( x )) ,
ставящим в соответствие каждой шкале число, отражающее степень близости заданной структуры Q и матричной структуры D( PA ( x )) =|| dik ||m×m , порожденной
шкалой ϕ( x , b) . Элементы матрицы D( PA ( x )) равны dik = PA ( x (i )) − PA ( x (k )) .
Искомая функция достоверности при этом будет определяться оптимальной
шкалой ϕ* ( x ) = ϕ( x , b∗ ) , для которой значения функционала J (ϕ( x , b)) минимально, а искомые значения параметров шкалы при этом будут являться функционалами, зависящими от неизвестного распределения F ( x ) :
bi* = Gi ( F ( x )) = Argmin{J (ϕ( x , b∗ ) || bi ), F ( x ), Q, D( PA ( x ))}, i = 1, p .
bi
Здесь (b* || bi ) = (b1* , b2* ,… , bi*−1 , bi , bi*+1 ,… , b*p ) .
В качестве базовой оценки Fn ( x ) плотности распределения F ( x ) выборки
X n рассмотрим непараметрическую оценку ядерного типа (3)
Теорема 3. Пусть элементы выборки X n взяты из последовательности слабозависимых случайных величин
{ x ( j )} ∈ Seq p ,
p > 1 , причем
F ∈ N μ+ ( x ) ,
μ k ≥ αik + 1, i = 0, s ; k = 1, m . Пусть, кроме того, справедливы условия 1–3 теоремы 1. Тогда оценки bin = Gi ( Fn ( x )) ∈ PC , γ ( F ) функционала Gi ( F ( x )) асимптотически нормальны и сходятся в среднеквадратичном при n → ∞ , причем для среднеквадратичной ошибки справедливо
1
E (bi* − Gi ( Fn ( x ))) 2 ≅ O ⎛⎜ ⎞⎟
⎝n⎠
2(μ−1) / 2μ
, n → ∞, i = 1, p .
Утверждение теоремы означает, что при определенных условиях регулярности,
накладываемых на F ( x ) , скорость сходимости среднеквадратичного отклонения
искомых параметров шкалы может быть как угодно близкой к 1/ n , где n − объем
выборки X n , что в итоге гарантирует хорошее качество распознавания.
Заключение
Предложена процедура, реализующая двухшаговую схему непараметрического оценивания функционалов от распределений стационарных последовательностей. На первом шаге с помощью операции усечения (6) исходному функционалу
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Процедура непараметрического оценивания функционалов
113
(1) ставится в соответствие функционал G ( F ( x ), F ( α1 ) ( x ),… , F (αs ) ( x )) из класса
«усеченных» функционалов G (t n ) ∈ PC , γ ( H ) ; на втором – производится подстановка многомерной статистики t n ≡ ( Fn ( x ), Fn( α1 ) ( x ),… , Fn(αs ) ( x )) на место τ в
функционал G ( τ ) . Получены достаточные условия сходимости полученных оценок в среднеквадратичном. Показана их асимптотическая нормальность.
Наиболее важной характеристикой предложенной процедуры оценивания является ее универсальность, поскольку она не зависит от конкретного вида отображения H : R s +1 → R1 и распределения исходной выборки.
Рассмотрена возможность применения предложенной процедуры в экономических и технических приложениях. Предложена процедура распознавания пространственно распределенных стохастических объектов на основе функционального шкалирования [14] и непараметрического оценивания плотности распределения выборки дескрипторов наблюдаемых объектов [15]. Предполагается, что на
исходном допустимом множестве объектов существует парное качественное отношение, определяющее его структуру как множества, состоящего из двух подмножеств-классов. В предлагаемой процедуре распознавания заданное внешнее
качественное отношение аппроксимируется количественным, на основе которого
производится построение оптимальной шкалы – интегрального агрегирующего
показателя распознаваемых объектов, определяющей в итоге искомую процедуру
распознавания.
ЛИТЕРАТУРА
1. Васильев В.А., Добровидов А.В., Кошкин Г.М. Непараметрическое оценивание функционалов от распределений случайных последовательностей. M.: Наука, 2004. 508 с.
2. Рюмкин В.И. Непараметрическое оценивание одного класса функционалов // Обозрение
прикл. и промышл. матем. 2003. Т.10. Вып. 3. С. 735.
3. Вопросы математической теории надежности / под ред. Б.В. Гнеденко. М.: Радио и
связь, 1983. 376 с.
4. Гнеденко Б.В., Коваленко И.Н. Введение в теорию массового обслуживания. М.: Наука,
1987. 336 с.
5. Боровков А.А. Математическая статистика. М.: Наука, 1984. 472 с.
6. Кушнир А.Ф. Асимптотически оптимальные критерии для регрессионной задачи проверки гипотез // Теория вероятностей и ее применения. 1968. Т. 13. Вып. 4. С. 682−700.
7. Добровидов А.В. Асимптотически ε-оптимальная непараметрическая процедура нелинейной фильтрации стационарных последовательностей с неизвестными статистическими характеристиками // Автоматика и телемеханика. 1984. № 12. С. 40−49.
8. Надарая Э.А. Непараметрическое оценивание плотности вероятностей и кривой регрессии. Тбилиси: Изд-во Тбилисского университета, 1983. 192 с.
9. Беленький В.З. О понятии потенциала экономической системы // ЭНСР. 2006. № 1(32).
С. 17−28.
10. Ибрагимов И.А., Линник Ю.В. Независимые и стационарно связанные величины. М.:
Наука, 1965. 524 с.
11. Кошкин Г.М., Рюмкин В.И. Оптимальные непараметрические алгоритмы выделения
сигналов на фоне стационарной слабозависимой помехи // Математическое и программное обеспечение анализа данных. Минск, 1990. С. 114.
12. Тихонов В.И., Миронов М.А. Марковские процессы. М.: Советское радио, 1977. 488 с.
13. Дынкин Е.Б., Юшкевич А.А. Управляемые марковские процессы и их приложения. М.:
Наука, 1977. 172 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Рюмкин
114
14. Авен П.О., Мучник И.Б., Ослон А.А. Функциональное шкалирование. М.: Наука, 1988.
182 с.
15. Рюмкин В.И. Процедура функционального шкалирования пространственно распределенных объектов // Обозрение прикл. и промышл. матем. 2004. Т. 11. Вып. 4.
C. 916−917.
Рюмкин Валерий Иванович
Томский государственный университет
E-mail: vir@mail.tomsknet.ru
Поступила в редакцию 12 мая 2012 г.
Rjumkin Valeriy I. (Tomsk state university). Procedure of a nonparametric estimation of terminal type functionals and its application in economic and engineering applications.
Keywords: nonparametric estimation, kernel functions, stationary samplings, functional.
The problem of an estimation of functionals of terminal type H ( τ( x )) ≡ H ( F (0) ( x ),
F ( r1 ) ( x ),…, F ( rs ) ( x ))
on samples of stationary random quantities is considered. Here
H : R s +1 → R1 is a known function, and x ∈ R m − is fixed, on stationary sampling weekly dependent random quantities with an unknown distribution function F ( x ) .
The procedure implementing the two-step plan of a nonparametric estimation of the given
functional is proposed. On the first step by means of truncation operation to an initial functional
G ( F (0) ( x ), F ( r1 ) ( x ),… , F ( rs ) ( x )) puts in correspondence a functional from a class of "sectional"
functionals G (tn ) ∈ PC , γ ( H ) ; on second – statistics substitution tn ≡ ( Fn(0) ( x ), Fn( r1 ) ( x ),…
…, Fn( rs ) ( x )) into place τ in a functional G ( τ) is produced. Convergence in mean square of estimates is proved. Velocity of convergence СКО of proposed sectional nonparametric estimates at
observance of some regularity conditions superimposed on H : R s +1 → R1 and F ( x ) , beyond all
bounds approaches with lower bound of convergence СКО in parametric setting.
The most important performance of the proposed procedure of an estimation is its scalability
as it does not depend on a specific view of mapping and allocation of initial sampling. The given
procedure can be used for the solution of various practical problems of economy and technics.
As an example the recognition problem spatially distributed stochastic objects on the basis of
functional scaling and a nonparametric estimation of a density function of sampling of descriptors
of observable objects is considered.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
УДК 519.2
Е.В. Чимитова, М.А. Ведерникова, Н.С. Галанова
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ
В ЗАДАЧАХ ПРОВЕРКИ АДЕКВАТНОСТИ МОДЕЛЕЙ НАДЕЖНОСТИ
ПО ЦЕНЗУРИРОВАННЫМ ДАННЫМ
В работе рассматриваются вопросы применения непараметрических критериев согласия типа Колмогорова, Крамера – Мизеса – Смирнова и Андерсона – Дарлинга при проверке адекватности моделей пропорциональных интенсивностей Кокса и ускоренных испытаний на основе анализа выборок остатков. Предложен алгоритм корректного применения рассматриваемых непараметрических критериев в случае цензурированных данных, в том числе
случайно цензурированных данных.
Ключевые слова: непараметрические критерии, модифицированный критерий Колмогорова, Крамера – Мизеса – Смирнова, Андерсона – Дарлинга,
модель пропорциональных интенсивностей Кокса, модель ускоренных испытаний, цензурированные данные.
Задачи, связанные с исследованием надежности, анализом выживаемости, в
которых оперируют данными типа времени жизни, рассматриваются во многих
областях науки и техники, в медицине, биологии, в актуарных расчетах и т.п.
В инженерных расчетах это могут быть времена отказов некоторых приборов или
технических систем. В медицине такие данные могут представлять собой время
до изменения некоторых биохимических показателей, время до ремиссии после
определенного вида лечения или время жизни пациентов. Целью подобных исследований является установление взаимосвязи между значениями факторов (ковариат) и вероятностью наступления исследуемого события в течение некоторого
периода времени. Наиболее популярными моделями в теории надежности являются модель ускоренных испытаний (AFT-модель) [1, 2] и модель пропорциональных интенсивностей Кокса [3]. Несмотря на рост числа серьезных публикаций, имеется множество подводных камней, связанных с построением таких моделей, с вычислением оценок параметров моделей по цензурированным данным в
условиях, как правило, небольших объемов выборок, а главное, существуют проблемы с проверкой адекватности построенных моделей.
Основным подходом к проверке согласия с регрессионными моделями надежности является подход, основанный на анализе распределения так называемых остатков. Гипотезу о согласии остатков с предполагаемым законом распределения
можно проверить с помощью непараметрических критериев согласия, таких как
критерий Колмогорова, критерий Крамера – Мизеса – Смирнова и критерий Андерсона – Дарлинга. В случае полных данных без объясняющих переменных данные критерии подробно исследовались в работах Б.Ю. Лемешко [4−12]. В [4−7,
10] построены вероятностные модели, аппроксимирующие распределения статистик непараметрических критериев относительно широкого спектра законов распределения, с которыми проверяется согласие.
В теории надежности и анализе выживаемости полученные в ходе эксперимента данные, как правило, оказываются цензурированными, например, в связи с
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
116
Е.В. Чимитова, М.А. Ведерникова, Н.С. Галанова
ограниченностью эксперимента по времени. Задачи проверки простых гипотез о
согласии по цензурированным I и II типа данным рассмотрены в работах [13, 14].
Распределения статистик и мощность критериев типа Колмогорова, Крамера –
Мизеса – Смирнова и Андерсона – Дарлинга при проверке сложной гипотезы исследованы в работе [15]. Для случайно цензурированных данных в литературе обсуждается возможность модификации непараметрических критериев, основанной
на использовании вместо эмпирического распределения непараметрической оценки Каплана – Мейера [16–20]. Однако определенных результатов относительно
распределений статистик модифицированных критериев не получено. Основной
сложностью является то, что распределение моментов цензурирования на практике, как правило, неизвестно. Кроме того, в случае регрессионных моделей распределение моментов цензурирования может зависеть от факторов, представленных в
выборке. Единственный выход видится в применении методов компьютерного
моделирования и анализа статистических закономерностей.
Таким образом, целью данной работы является разработка алгоритма корректного применения критериев типа Колмогорова, Крамера – Мизеса – Смирнова и
Андерсона – Дарлинга по цензурированным данным для проверки адекватности
AFT-модели и модели пропорциональных интенсивностей Кокса.
1. Модель пропорциональных интенсивностей Кокса и AFT-модель
Пусть Tx – неотрицательная случайная величина, определяющая системное
событие (время работы до отказа объекта или время жизни пациента), которое заT
висит от вектора ковариат x = ( x1 , x2 ,..., xm ) .
Функция выживаемости (надежности) определяется соотношением
S x ( t ) = P (Tx ≥ t ) = 1 − Fx ( t ) ,
а кумулятивная функция риска – выражением
t
Λ x ( t ) = ∫ λ x ( u ) du = − ln ( S x ( t ) ) .
0
Главной особенностью данных типа времени жизни является наличие цензурированных справа наблюдений, которые можно представить в виде
( t1 , x1 , δ1 ) , ( t2 , x2 , δ2 ) ,..., ( tn , xn , δn ) ,
где n – объем выборки, xi – вектор ковариат i-го объекта, ti – время жизни до наступления системного события или момента цензурирования, δi – индикатор цензурирования, который принимает значение 1, если наблюдение полное, и 0, если
цензурированное.
Существует три основных типа цензурирования. Цензурирование первого типа возникает в ситуации, когда заранее фиксируется время наблюдения за объектами. При цензурировании второго типа наблюдение за объектами прекращается
по наступлению заранее определенного количества системных событий. При цензурировании третьего типа, или случайном цензурировании, времена жизни T и
моменты цензурирования C принадлежат законам распределения вероятностей
F ( t ) и F C ( t ) соответственно и являются независимыми. Наблюдение, соответствующее i-му объекту определяется следующим образом:
ti = min (Ti , Ci ) , δi = 1{Ti ≤ Ci } , i = 1,..., n .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Непараметрические критерии согласия в задачах проверки адекватности моделей
117
Модель пропорциональных интенсивностей, предложенная Коксом [3], определяется следующим соотношением:
Λ x ( t ; β ) = r ( x; β ) ⋅ Λ 0 ( t ) ,
(1)
где β – вектор параметров регрессии, r ( x; β ) – неотрицательная функция от ковариат, Λ 0 ( t ) – базовая кумулятивная функция риска. В данной работе будем рассматривать логарифмически линейную форму функции от ковариат вида
r ( x; β ) = exp ( β′ ⋅ x ) .
Если в (1) не вводится предположение относительно закона распределения
времен жизни, модель называется полупараметрической. Если же вводится параметризация как для функции воздействий, так и для базовой кумулятивной функции риска Λ 0 ( t ; θ ) , модель считается параметрической.
Оценки неизвестных параметров модели пропорциональных интенсивностей
находятся методом максимального правдоподобия. В случае полупараметрической модели максимизируют логарифм функции частичного правдоподобия [3]:
n
⎡
⎛ n
ln ( Lˆ ( x; β ) ) = ∑ δi ⎢ln r xi ; β − ln ⎜ ∑ r x j ; β
⎜ j:t ≥t
i =1
⎣⎢
⎝ j i
((
))
(
⎞⎤
) ⎟⎟⎥⎥ .
⎠⎦
В случае параметрической модели логарифмическая функция правдоподобия
имеет вид
n
( (
)
) (
)
ln ( L ( x; β, θ ) ) = ∑ ⎡⎣δi ln r xi ; β + ln λ 0 ( ti ; θ ) − r xi ; β Λ 0 ( ti ; θ ) ⎤⎦ .
i =1
Модель ускоренных испытаний (Accelerated Failure Time model) или AFTмодель надежности может быть задана следующим образом:
⎛t
ds ⎞
,
S x (⋅) ( t ) = S0 ⎜ ∫
⎜ r ( x ( s ) ) ⎟⎟
⎝0
⎠
(2)
где S0 ( t ) = 1 − F0 ( t ) – базовая функция надежности, r ( x; β ) – неотрицательная
функция от воздействий. В данной работе будем рассматривать логлинейную модель вида r ( x; β ) = exp ( β0 + β1 x ) .
В случае, когда мы обладаем некоторой априорной информацией о законе распределения отказов, то базовая функция S0 ( t ) выбирается из некоторого параметрического семейства распределений, и в данном случае мы получаем параметрическую AFT-модель. Оценки параметров модели находят, максимизируя
логарифм функции правдоподобия:
n
ln L( x; β, θ) = ∑ ( δi ln f x ( ti ) + (1 − δi ) S x ( ti ) ) .
i =1
Если информация о виде S0 ( t ) неизвестна, то мы получаем полупараметрическую модель ускоренных испытаний. Оценки параметров данной модели получают, минимизируя функцию вклада
n
{
}
U ( β ) = ∑ δi xi ( ti ) − x ( fi ( ti ; β ) ; β ) ,
i =1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
118
Е.В. Чимитова, М.А. Ведерникова, Н.С. Галанова
n
где
x ( u; β ) = ∑ x j ( g j ( u; β ) ) Y j ( g j ( u; β ) )
j =1
t
(
n
∑ Y j ( g j ( u; β ) ) ,
j =1
)
fi ( t ; β ) = ∫ r −1 x j ( u ) ; β du , Y j ( t ) = 1{ti ≥ t} ,
0
а g j ( u; β ) – обратная к f j ( u; β ) функция по первому аргументу.
2. Проверка гипотезы о согласии по выборкам остатков
После вычисления оценок неизвестных параметров необходимо проверить
адекватность полученной модели. Универсальным подходом к проверке адекватности регрессионных моделей является анализ распределения остатков.
Для модели пропорциональных интенсивностей Кокса рассчитывают остатки
Кокса – Снелла вида [21]
(
)
zi = Λ 0 ( ti ) ⋅ r xi ; β .
Если модель верна, остатки распределены по стандартному экспоненциальному закону. Таким образом, можно сформулировать сложную гипотезу о согласии
H 0 : zi Exp ( 0,1) .
Для параметрической модели ускоренных испытаний остатки имеют следующий вид:
z = t r xi ; βˆ .
i
i
(
)
Если данные хорошо описываются построенной моделью, остатки должны
принадлежать базовому закону распределения отказов F0 t ; θˆ , стандартизован-
( )
ному по параметру масштаба (параметр масштаба равен 1), то есть проверяемая
гипотеза имеет вид
H 0 : zi F0 t ; θˆ .
( )
Для проверки данных гипотез о принадлежности выборки остатков предполагаемому закону распределения при наличии цензурированных наблюдений можно
воспользоваться модифицированными критериями согласия типа Колмогорова,
Крамера – Мизеса – Смирнова и Андерсона – Дарлинга, в которых вместо эмпирической функции распределения используется непараметрическая оценка Каплана – Мейера [22].
Статистика критерия согласия типа Колмогорова с поправкой Большева [23]
имеет вид
S KC = ( 6nDn + 1) 6 n ,
где
Dn = sup Fˆn ( t ) − F ( t ) ,
t ≤τ
статистика критерия типа Крамера – Мизеса – Смирнова имеет вид
τ
2
ω2n = n ⋅ ∫ ( F ( t ) − Fˆn ( t ) ) dF ( t ) ,
0
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Непараметрические критерии согласия в задачах проверки адекватности моделей
119
статистика критерия типа Андерсона – Дарлинга определяется выражением
Ω n2
τ
= n⋅∫
0
( F ( t ) − Fˆn ( t ) )
2
F ( t ) ⋅ (1 − F ( t ) )
dF ( t ) ,
где F ( t ) – функция распределения, соответствующая гипотезе H 0 : функция распределения стандартного экспоненциального закона для модели пропорциональных интенсивностей или базовая функция распределения F0 t ; θˆ для AFT-
( )
модели, Fˆn ( t ) – оценка Каплана – Мейера, вычисленная по выборке остатков, τ –
время последнего полного наблюдения.
Следует заметить, что проверяемая гипотеза является сложной, так как проверка гипотезы осуществляется по той же выборке, по которой были оценены параметры модели. В этом случае непараметрические критерии согласия даже в
случае полных данных теряют свойство свободы от распределения [4], и распределения G ( S H 0 ) статистик S непараметрических критериев согласия зависят от
вида предполагаемого базового распределения F0 ( t ; θ ) , количества оцениваемых
по выборке параметров, метода оценивания параметров и других факторов. Помимо этого, в случае цензурированных данных распределения статистик модифицированных непараметрических критериев зависят от типа, степени цензурирования [15] и распределения моментов цензурирования для случайно цензурированных выборок.
При проверке гипотез о согласии с регрессионными моделями надежности непараметрические критерии исследовались авторами настоящей работы в [24–26].
Показано, что в случае полных данных распределения статистик критериев согласия с моделями надежности согласуются с аппроксимациями, построенными для
данных без ковариат. Заметим, что в случае цензурированных I и II типа выборок
распределения статистик при проверке согласия с моделями надежности отличаются от распределений статистик при проверке согласия по цензурированным
выборкам без ковариат. Это объясняется тем, что выборка остатков, по которой
проверяется гипотеза о согласии при проверке адекватности регрессионной модели для цензурированных данных первого или второго типа, оказывается многократно цензурированной. Поэтому единственной возможностью обеспечить проверку соответствующей сложной гипотезы является моделирование распределений статистик критериев в условиях справедливости проверяемой гипотезы и определение достигнутого уровня значимости по смоделированному распределению
статистики.
Алгоритм проверки гипотезы
о согласии с регрессионными моделями надежности
1. Задается уровень значимости α .
2. Моделируются значения времен жизни t1 ,..., tn в соответствии с проверяемой моделью F t ; βˆ , θˆ , где β̂ и θ̂ – оценки максимального правдоподобия
x
(
)
(ОМП) параметров, полученные по исходным данным.
3. Если исходная выборка была цензурированной, полная выборка t1 ,..., tn
преобразуется в цензурированную.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
120
Е.В. Чимитова, М.А. Ведерникова, Н.С. Галанова
4. По полученной выборке оцениваются параметры модели β и θ , находится
выборка остатков и вычисляются значения статистик критериев согласия Sn* .
5. Пункты 1–3 повторяются N раз.
6. По эмпирическому распределению статистики критерия GN ( Sn | H 0 ) оце-
(
)
нивается достигнутый уровень значимости критерия α n = 1 − GN Sn* | H 0 .
7. Гипотеза H 0 отвергается, если α n ≤ α .
Описанный алгоритм позволяет проверить адекватность вероятностных моделей надежности на основе моделирования эмпирического распределения статистики, по которому определяется достигнутый уровень значимости. Однако при
моделировании распределений статистик сталкиваемся с необходимостью моделировать цензурированные выборки. В случае первого и второго типов цензурирования данная задача не представляет особых трудностей, так как данные схемы
цензурирования являются достаточно простыми и воспроизводимыми, тогда как
моделирование случайно цензурированных выборок может вызвать сложности,
так как на практике закон распределения моментов цензурирования F C ( t ) обычно неизвестен. Кроме того, распределение выбытий (моментов цензурирования)
может зависеть от факторов, при которых проводится испытание, и для достоверного моделирования необходимо учитывать это влияние. Подбирать некоторую
параметрическую модель для моментов цензурирования не представляется разумным, поскольку эта задача вновь сопряжена с проблемой проверки адекватности
по случайно цензурированной выборке. Поэтому в данной работе был разработан
непараметрический способ моделирования случайно цензурированных данных на
основе непараметрической оценки функции риска по цензурированным наблюдениям.
3. Алгоритм моделирования случайно цензурированных выборок
Предположим, что вид зависимости моментов цензурирования от ковариат соответствует регрессионной модели, с которой проверяется согласие. Так, при проверке адекватности модели пропорциональных интенсивностей для моделирования случайно цензурированных данных строим полупараметрическую модель
Кокса по исходным данным, в которых цензурированные наблюдения рассматриваются как полные и наоборот. Таким образом, непараметрическая оценка базовой функции риска для моментов цензурирования имеет вид
n
ˆ C (t ) =
Λ
0
∑ (1 − δi )
i:ti ≤t
n
∑ (
r x ; βˆ C
j:t j ≥ti
j
)
,
(3)
где βˆ C – ОМП параметров, полученные по исходным данным, в которых цензурированные наблюдения рассматриваются как полные и наоборот.
При проверке согласия с AFT-моделью для моделирования цензурированных
наблюдений будем строить полупараметрическую AFT-модель, и непараметрическая оценка функции риска для некоторого значения ковариаты x запишется как
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Непараметрические критерии согласия в задачах проверки адекватности моделей
ˆ C (t ) =
Λ
x
⎛
∑
( )
i:ti ≤t ⋅
r ( x;βˆ C )
r xi ;βˆ C
(1 − δi ) l n ⎜1 − 1
⎜
⎝
(
(
⎧⎪
r x j ; βˆ C
1
t
t
≥
⋅
⎨
∑ j i r xi ; βˆ C
j =1 ⎩
⎪
n
121
) ⎫⎞
⎪
⎬⎟ .
) ⎭⎠
⎪⎟
(4)
Разработанный алгоритм моделирования случайно цензурированной выборки
имеет следующий вид:
1. Моделируются
значения
(
⎛ 1 r ( xi ;βˆ ) ⎞
Ti = F0−1 ⎜ ξi
⎟
⎝
⎠
)
Ti = F0−1 ( ξi ) ⋅ r xi ; βˆ для AFT-модели, ξi
2. Моделируются значения Λ i0 = −
ln ( ηi )
r xi ; βˆ C
(
)
для
модели
Кокса
и
Uniform ( 0,1) , i = 1,..., n ;
для модели Кокса и Λ ixi = −ln ( ηi )
для AFT-модели, ηi Uniform ( 0,1) , i = 1,..., n ;
3. Далее вычисляются значения Ci :
3.1. Для модели Кокса: обозначим через c1 < c2 < ... < c p значения моментов
ˆ C ( c ) ≤ Λi < Λ
ˆ C ( c ) , то
цензурирования в исходной выборке. Если Λ
0
0
0
k
k +1
i
C
ˆ
c
−
c
⋅
Λ
−
Λ
c
( k +1 k ) 0 0 ( k )
ˆ C ( c ) или
Ci = ck +
, k = 1,..., p − 1 . Если Λ i0 < Λ
0
1
ˆ C (c ) − Λ
ˆ C (c )
Λ
0
0
k +1
k
(
(
)
)
(
)
ˆ C ( c ) , то C = c ⋅ Λ i Λ
ˆ C ( c ) или C = c + c ⋅ Λ i − Λ
ˆ C ( c ) соΛ i0 ≥ Λ
0
p
1
0
0
1
0
0
i
i
p
p
p
ответственно,
ˆC
Λ
0
( ck ) вычисляются по формуле (3).
3.2. Для AFT-модели: обозначим через c1 < c2 < ... < cq значения наблюдений
ˆ Ci ( c ) − Λ
ˆ Ci ( c ) ≠ 0
исходной выборки, такие, что Λ
k +1
k
x
x
ˆ Ci ( c ) ≤ Λ i i < Λ
ˆ Ci ( c ) , то C = c +
Если Λ
k
k +1
i
k
x
x
x
∀k = 1,..., q − 1 .
( ck +1 − ck ) ⋅ ( Λixi − Λˆ Cxi ( ck ) )
( Λˆ Cx ( ck +1 ) − Λˆ Cx ( ck ) )
i
ˆ Ci ( c ) или Λ i i ≥ Λ
ˆ Ci ( c ) , то C = c ⋅ Λ i i Λ
ˆ Ci ( c )
Если Λ ixi < Λ
1
1
1
q
i
x
x
x
x
x
(
ˆ Ci ( c )
Ci = cq + cq ⋅ Λ ixi − Λ
q
x
)
.
i
или
ˆ Ci ( c ) вычисляются по
соответственно, Λ
k
x
формуле (4).
4. ti = min (Ti , Ci ) , δi = 1{Ti ≤ Ci } , i = 1,..., n .
Использование предложенного алгоритма моделирования случайно цензурированных выборок делает возможным применение вышеописанного алгоритма
проверки адекватности регрессионных моделей по цензурированным данным.
При проверке согласия по случайно цензурированной выборке замена пунктов 2 и
3 алгоритма проверки адекватности на алгоритм моделирования случайно цензурированных выборок приведет к получению корректного результата проверки гипотезы.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
122
Е.В. Чимитова, М.А. Ведерникова, Н.С. Галанова
Заключение
В работе рассмотрены вопросы проверки адекватности регрессионных моделей ускоренных испытаний и моделей пропорциональных интенсивностей. Решение об адекватности построенной модели может быть принято по результатам
проверки гипотезы о принадлежности выборки остатков предполагаемому закону
распределения. Такая проверка может осуществляться с использованием непараметрических критериев согласия. В случае полных данных (при отсутствии цензурированных наблюдений) в качестве предельных распределений статистик модифицированных критериев Колмогорова, Крамера – Мизеса – Смирнова и Андерсона – Дарлинга можно использовать модели, построенные в [4–7, 10] для
классических критериев в условиях проверки сложных гипотез.
Для случая цензурированных данных типа времени жизни в работе сформулирован интерактивный алгоритм проверки гипотезы о согласии с использованием
методов статистического моделирования. Данный алгоритм не вызывает сложностей в случае наличия цензурированных наблюдений первого или второго типа в
силу простоты реализации данных схем цензурирования. Для случая третьего типа цензурирования в работе предложен алгоритм непараметрического моделирования случайно цензурированной выборки, основанный на использовании полупараметрических моделей надежности для моментов цензурирования: полупараметрическая модель пропорциональных интенсивностей Кокса и полупараметрическая модель ускоренных испытаний.
ЛИТЕРАТУРА
1. Bagdonavicius V., Nikulin M. Accelerated life models: modeling and statistical analysis //
Boca Raton, Florida: Chapman & Hall/CRC. 2002. 334 p.
2. Meeker W.Q., Escobar L. Statistical Methods for Reliability Data. New York: John Wiley and
Sons. – 1998.
3. Cox D.R., Roy J. Regression models and life tables (with Discussion) // J. Royal Statistical
Society. 1972. Series B. V. 34. P. 187−220.
4. Лемешко Б.Ю., Лемешко С.Б., Постовалов С.Н., Чимитова Е.В. Статистический анализ
данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход: монография. Новосибирск: Изд-во НГТУ, 2011. 888 с.
5. Лемешко Б.Ю., Лемешко С.Б., Никулин М.С., Сааидиа Н. Моделирование распределений статистик непараметрических критериев согласия при проверке сложных гипотез
относительно обратного гауссовского закона // Автоматика и телемеханика. 2010. № 7.
С. 83−102.
6. Лемешко Б.Ю., Лемешко С.Б. Модели распределений статистик непараметрических
критериев согласия при проверке сложных гипотез с использованием оценок максимального правдоподобия. Ч. I // Измерительная техника. 2009. № 6. С. 3−11.
7. Лемешко Б.Ю., Лемешко С.Б. Модели распределений статистик непараметрических
критериев согласия при проверке сложных гипотез с использованием оценок максимального правдоподобия. Ч. II // Измерительная техника. 2009. № 8. С. 17−26.
8. Лемешко Б.Ю., Лемешко С.Б., Постовалов С.Н. Сравнительный анализ мощности критериев согласия при близких альтернативах. II. Проверка сложных гипотез // Сибирский журнал индустриальной математики. 2008. Т. 11. № 4(36). С. 78−93.
9. Лемешко Б.Ю., Лемешко С.Б., Постовалов С.Н. Мощность критериев согласия при
близких альтернативах // Измерительная техника. 2007. № 2. С. 22−27.
10. Лемешко Б.Ю., Маклаков А.А. Непараметрические критерии при проверке сложных гипотез о согласии с распределениями экспоненциального семейства // Автометрия. 2004.
№ 3. С. 3−20.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Непараметрические критерии согласия в задачах проверки адекватности моделей
123
11. Лемешко Б.Ю., Постовалов С.Н. О зависимости распределений статистик непараметрических критериев и их мощности от метода оценивания параметров // Заводская лаборатория. 2001. Т. 67. № 7. С. 62−71.
12. Лемешко Б.Ю., Постовалов С.Н. Применение непараметрических критериев согласия
при проверке сложных гипотез // Автометрия. 2001. № 2. С. 88−102.
13. Barr D.M., Davidson T. A Kolmogorov – Smirnov test for censored samples // Technometrics. 1973. V. 15. No. 4.
14. Koziol J.A., Green S.B. A Cramer – von Mises statistic for randomly censored data // Biometrika. 1976. V. 63. No. 3. P. 465−474.
15. Лемешко Б.Ю., Чимитова Е.В., Плешкова Т.А. Проверка простых и сложных гипотез о
согласии по цензурированным выборкам // Научный вестник НГТУ. 2010. № 4(41).
С. 13−28.
16. Kac M., Kiefer J., Wolfowitz J. On tests of normality and other tests of goodness of fit based
on distance methods // Annals of Mathematical Statistics. 1955. V. 26. P. 189–211.
17. Hjort N.L. On Inference in Parametric Survival Data // International Statistical Review. 1992.
V. 60. No. 3. P. 355−387.
18. Nair V. Plots and tests for goodness of fit with randomly censored data // Biometrika. 1981.
V. 68. P. 99−103.
19. Reineke D., Crown J. Estimation of Hazard, Density and Survival Functions for Randomly
Censored Data // J. Applied Statistics. 2004. V. 31. No. 10. P. 1211−1225.
20. Nikulin M., Lemeshko B., Chimitova E., Tsivinskaya A. Nonparametric goodness-of-fit tests
for censored data // Proc. of the 7th Int. Conf. «Mathematical Methods in Reliability: Theory.
Methods. Applications». Beijing, China, 2011. P. 817−823.
21. Lawless J.F. Statistical Models and Methods for Lifetime Data. New Jersey: John Wiley and
Sons, Inc., Hoboken. 2003. 630 p.
22. Kaplan E.L., Meier P. Nonparametric estimation from incomplete observations // J. American
Statistical Association. 1958. V. 53. P. 457−481.
23. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука. 1983. 416 с.
24. Chimitova E., Chuyanova E., Galanova N., Vedernikova M. Computer approach to the choice
of parametric ALT-models // Proc. of the Third Int. Conf. «Accelerated Life Testing, Reliability-Based Analysis and Design». Clermont-Ferrand, 2010. P. 111−116.
25. Chimitova E., Galanova N. Application of the computer simulation technique for investigating problems of parametric AFT-model construction // Stochastic Modeling Techniques and
Data Analysis Int. Conf.: Proc. Chania, Crete, Greece, 2010. P. 177−185.
26. Чимитова Е.В., Ведерникова М.А. Проверка адекватности модели пропорциональных
интенсивностей Кокса по случайно цензурированным выборкам // Сборник научных
трудов НГТУ. Новосибирск: Изд-во НГТУ, 2010. № 4(62). С. 103−108.
Чимитова Екатерина Владимировна
Ведерникова Мария Александровна
Галанова Наталья Сергеевна
Новосибирский государственный технический университет
E-mail: ekaterina.chimitova@gmail.com
Поступила в редакцию 7 мая 2012 г.
Chimitova Ekaterina V., Vedernikova Mariya A., Galanova Natalia S. (Novosibirsk State Technical University). Nonparametric goodness-of-fit tests in testing adequacy of reliability models
for right censored data.
Keywords: nonparametric goodness-of-fit tests, Kolmogorov, Cramer-von Mises-Smirnov and
Anderson-Darling tests, Cox proportional hazards model, accelerated failure time model, right
censored data
The problem of testing goodness-of-fit with the failure time model (AFT-model) model and
the Cox proportional hazards model by censored samples is considered. Testing goodness-of-fit
with considered models is carried out on the basis of the residual samples analysis. The hypothesis of goodness-of-fit with proposed distribution law is tested by using the nonparametric Kol-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
124
Е.В. Чимитова, М.А. Ведерникова, Н.С. Галанова
mogorov, Cramer-von Mises-Smirnov and Anderson-Darling tests. It has been shown that in the
case of complete data the test statistics distributions for testing goodness-of-fit with the reliability
models coincide with approximations, obtained for data without covariates. In the case of type I
or type II censored data the statistics distributions for testing goodness-of-fit with the reliability
models differ from the statistics distributions for testing goodness-of-fit by censored data without
covariates. Therefore, the only way to support testing goodness-of-fit of the corresponding composite hypothesis is the application of the developed algorithm of simulation of the test statistics
distributions and then estimation of the significance level by the simulated distribution. The
simulation of the statistics distributions for the type I or type II censoring schemes is not complicated, as these censoring schemes are reproducible. But the simulation of randomly censored
samples may cause difficulties, because in practice the distribution law of the censoring times is
usually unknown. In addition, the censoring time distribution may depend on the covariates and it
is necessary to take into account this dependence. To do this, the nonparametric algorithm of
simulation of the randomly censored samples by using the semiparametric proportional hazards or
accelerated failure time models has been developed.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
УДК 519.233.5
Н.Н. Щелканов
НОВЫЙ МЕТОД РАЗДЕЛЕНИЯ ФИЗИЧЕСКОЙ ВЕЛИЧИНЫ
НА ДВЕ КОМПОНЕНТЫ
Предложен новый метод нахождения коэффициентов линейной регрессии
уравнения Z = K0+K1X+K2Y с учетом случайных погрешностей физических
величин Z, X и Y. Метод позволяет получать устойчивые и физически корректные коэффициенты регрессии K0 , K1 и K2 вне зависимости от используемого массива данных.
Ключевые слова: итерационный метод, линейная регрессия, случайные погрешности.
Обычно для разделения физической величины Z на две компоненты (X и Y) используется статистический метод, основанный на линейном множественном регрессионном анализе массива экспериментальных данных [1]. В этом случае уравнение регрессии для величины Z записывается в виде
Z = K0 + K1X + K2Y,
(1)
где K0, K1, K2 – эмпирические коэффициенты, определяемые по статистическим
характеристикам массивов Z, X, и Y.
Однако статистический метод, основанный на линейном множественном регрессионном анализе, имеет существенные недостатки. Во-первых, даже при отсутствии случайных погрешностей во входных величинах X и Y коэффициенты
регрессии зависят от их диапазона изменчивости. Во-вторых, наличие случайных
погрешностей во входных величинах X и Y приводит к занижению коэффициентов регрессии K1, K2 и завышению K0, причем чем больше эти величины случайных погрешностей, тем меньше K1, K2 и больше K0.
В [2–4] представлена обобщенная формула, позволяющая находить коэффициенты регрессии линейного уравнения Y = K0 + K1 X для общего случая, когда разброс точек в корреляционной связи величин X и Y обусловлен как их случайными
погрешностями измерений, так и неконтролируемыми физическими факторами.
Формула имеет вид
K1 =
где
σY B 1
σ X A 2ρ XY
A = 1 − ρ XY
2
⎧⎪⎛ A B ⎞
⎛ A B⎞
2
⎨⎜ − ⎟ + ⎜ − ⎟ + 4ρ XY
⎝ B A⎠
⎪⎩⎝ B A ⎠
1 − δ2X σ2X
1 − δY2
σY2
, B = 1 − ρ XY
⎫⎪
⎬,
⎪⎭
1 − δY2 σY2
1 − δ2X σ2X
(2)
,
(3)
σX и σY – среднеквадратические отклонения величин X и Y; ρXY – коэффициент
корреляции между X и Y; δX и δY – случайные среднеквадратические погрешности
измерения X и Y для рассматриваемого массива данных.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.Н. Щелканов
126
1. Постановка задачи
Решается задача нахождения коэффициентов K0 K1, K2 уравнения (1), в котором Z = Z0+z, X = X0+x, Y = Y0+y, где Z0, X0 и Y0 – случайные величины не подверженные случайным погрешностям, z, y и x – случайные погрешности. Разброс точек в корреляционной связи величин Z, X и Y обусловлен как случайными погрешностями, так и неконтролируемыми параметрами. Случайные погрешности z,
y и x имеют СКО равные δZ, δY и δX, которые представляют собой случайные
среднеквадратические погрешности величин Z, Y и X. Предполагается, что величины Z, Y и X не коррелируют с погрешностями z, y и x; погрешности z, y и x не
коррелируют между собой.
2. Новый метод разделения на компоненты
В предлагаемом методе разделения на компоненты используется обобщенная
формула линейной регрессии (2). Для нахождения коэффициентов регрессии
уравнения (1) применяется численный итерационный метод [5–7]. Процедура вычисления коэффициентов регрессии заключается в следующем.
Задается один из коэффициентов регрессии уравнения (1), например K1, и находится среднеквадратическое отклонение разницы β = Z − K1X − K0
σβ = σ2Z + K12 σ2X − 2 K1σ Z σ X ρ ZX ,
где σZ и σX – среднеквадратические отклонения величин Z и X, а ρZX – нормированный коэффициент корреляции между Z и X.
Далее находится нормированный коэффициент корреляции β c Y
ρ σ − K1ρ XY σ X
,
(5)
ρβY = ZY Z
σβ
где ρZY и ρXY – нормированные коэффициенты корреляции между ZY и XY.
Затем вычисляется случайная среднеквадратическая погрешность величины β
δβ = δ2Z + K12 δ2X
(6)
и коэффициент регрессии
K2 =
где
σβ B1 1
σY A1 2ρβY
A1 = 1 − ρβY
2
⎧⎛ A B ⎞
⎛ A1 B1 ⎞
⎪ 1
2
1
⎨⎜ − ⎟ + ⎜ − ⎟ + 4ρβY
B
A
B
A
⎝
⎠
⎝
⎠
1
1
1
1
⎪⎩
1 − δY2 σY2
1 − δβ2 σβ2
, B1 = 1 − ρβY
⎫
⎪
⎬,
⎪⎭
1 − δβ2 σβ2
1 − δY2 σY2
(7)
,
(8)
δY – случайная среднеквадратическая погрешность измерения величины Y, σY –
среднеквадратическое отклонение величины Y.
Полученное значение коэффициента регрессии K2 используется для нахождения среднеквадратического отклонения разницы μ = Z – K2Y − K0
σμ = σ 2Z + K 22 σY2 − 2 K 2 σ Z σY ρ ZY ;
коэффициента корреляции μ c X
(9)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Новый метод разделения физической величины на две компоненты
ρμX =
127
ρ ZX σ Z − K 2ρYX σY
;
σμ
(10)
случайной среднеквадратической погрешности величины μ
δμ = δ2Z + K 22 δY2
(11)
и коэффициента регрессии
K1 =
где
σμ B2 1
σ X A2 2ρμX
A2 = 1 − ρμX
2
⎧⎛ A B ⎞
⎛ A2 B2 ⎞
⎪ 2
2
2
−
+
−
⎨⎜
⎟
⎜
⎟ + 4ρμX
B
A
B
A
⎝ 2
2 ⎠
2 ⎠
⎪⎩⎝ 2
1 − δ2X σ2X
1 − δμ2 σμ2
, B2 = 1 − ρμX
⎫
⎪
⎬,
⎪⎭
1 − δμ2 σμ2
1 − δ2X σ2X
(12)
,
(13)
δX – случайная среднеквадратическая погрешность измерения величины X .
Затем полученное значение коэффициента регрессии K1 подставляется в (4) и
процедура нахождения коэффициентов K1 и K2 продолжается до выполнения условий
K1,m−1 − K1,m ≤ θ1 , K 2,m−1 − K 2,m ≤ θ2 ,
(14)
где θ1 и θ2 − некоторые наперед заданные числа, определяющие погрешность вычисления коэффициентов K1 и K2, m − количество итераций.
Далее находится коэффициент регрессии K0 по известной формуле
K 0 = Z − K1 X − K 2Y ,
(15)
где Z , X , Y − средние значения физических величин Z, X и Y.
Заключение
Предложен новый метод разделения физической величины на компоненты с
учетом случайных погрешностей измеряемых величин, который позволяет получать устойчивые и физически корректные коэффициенты регрессии независимо
от используемого массива данных. Предложенный метод может быть использован
в работах [8−12].
ЛИТЕРАТУРА
1. Крамер Г. Математические методы статистики. М.: Мир, 1975. 648 с.
2. Щелканов Н.Н. Построение регрессионной зависимости между аэрозольными оптическими толщами атмосферы с учетом их случайных погрешностей // II заседание Рабочей группы проекта «Аэрозоли Сибири». Тез. докл. Томск: ИОА СО РАН, 1995. С. 16.
3. Щелканов Н.Н. Обобщенный метод построения линейной регрессии и его применение
для построения однопараметрических моделей аэрозольного ослабления // Оптика атмосферы и океана. 2005. Т. 18. № 1−2. С. 86−90.
4. Щелканов Н.Н. Новый метод нахождения коэффициентов линейной регрессии между
двумя физическими величинами // Вестник ТГУ. Управление, вычислительная техника
и информатика. 2010. № 4 (13). С. 91−96.
5. Щелканов Н.Н. Итерационный метод разделения коэффициентов ослабления на две
компоненты // Аэрозоли Сибири. XIII Рабочая группа: тез. докл. Томск: Изд-во ИОА
СО РАН, 2006. С. 58.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
128
Н.Н. Щелканов
6. Shchelkanov N.N. Iterative method of separation of the extinction coefficients into two components // Proc. of SPIE – The International Society for Optical Engineering. 2006. V. 6522.
65221O. 5p.
7. Shchelkanov N.N. Comparison of two methods of separation of the extinction coefficients into
components // XIV Int. Symp. «Atmospheric and Ocean Optics. Atmospheric Physics»: Abstracts. Tomsk: IAO SB RAS, 2007. P. 159, 160.
8. Рублев А.Н., Григорьев Г.Ю., Удалова Т.А., Журавлева Т.Б. Регрессионные модели для
оценки углеродного обмена в бореальных лесах // Оптика атмосферы и океана. 2010.
Т. 23. № 01. С. 21−26.
9. Лысенко С.А., Кугейко М.М. Методика определения концентрации респирабельной
фракции атмосферного аэрозоля по данным трехчастотного лидарного зондирования //
Оптика атмосферы и океана. 2010. Т. 23. № 02. С. 149−155.
10. Лысенко С.А., Кугейко М.М. Восстановление оптических и микрофизических характеристик поствулканического стратосферного аэрозоля из результатов трехчастотного
лидарного зондирования // Оптика атмосферы и океана. 2011. Т. 24. № 04. С. 308−318.
11. Афонин С.В. Апробация способа восстановления АОТ над сушей по спутниковым измерениям MODIS в ИК-диапазоне спектра // Оптика атмосферы и океана. 2011. Т. 24.
№ 08. С. 703−705.
12. Абдуллаев С.Ф., Назаров Б.И., Салихов Т.Х., Маслов В.А. Корреляции температуры приземной атмосферы и оптической толщи аридного аэрозоля по данным AERONET // Оптика атмосферы и океана. 2012. Т. 25. № 05. С. 428−433.
Щелканов Николай Николаевич
Институт оптики атмосферы им. В.Е. Зуева СО РАН, Томск
E-mail: snn@iao.ru
Поступила в редакцию 25 мая 2012 г.
Shchelkanov Nikolai N. (Zuev Institute of Atmospheric Optics of the SBRAS). A new method for
dividing a physical parameter into components.
Keywords: iterative method, linear regression, random errors.
A new method is proposed for determining the linear regression coefficients of the equation
Z = K0+K1X+K2Y taking into account random errors of the physical parameters Z, X and Y. The
method allows obtaining the stable and physically correct regression coefficients K0, K1 and K2
independently on the considered data array.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
УДК 004.627: 004.932.2
Д.В. Дружинин
КОМБИНИРОВАННЫЕ АЛГОРИТМЫ СЖАТИЯ
КЛЮЧЕВЫХ КАДРОВ ЭКРАННОГО ВИДЕО
Представлен комбинированный алгоритм сжатия, разработанный для изображений, являющихся кадрами экранного видео. Этот алгоритм на первом
этапе использует гибридный алгоритм, ранее разработанный автором, а на
втором этапе – библиотеку zlib. Приведены результаты практического сравнения с комбинированным алгоритмом, использующим на первом этапе
гибридный алгоритм, а на втором – алгоритм LZO, а также некоторые другие алгоритмы сжатия.
Ключевые слова: экранное видео, сжатие изображений, быстрые алгоритмы сжатия.
Экранное видео – это видео происходящего на экране пользователя. Экранное
видео возникает в результате фиксации активности пользователя: движения курсора мыши, скроллинг, сворачивание и открытие свёрнутого окна, перемещение
окна, ввод текста и т. д.
Сжатие видео – одна из наиболее трудоёмких по времени задач, которые приходится решать не только профессионалам, но и рядовым пользователям. Одним
из типов видеоданных, сжатие которых необходимо осуществлять в режиме реального времени, является экранное видео. Как правило, это видео высокого разрешения. Причём зачастую о полезности программ, осуществляющих сжатие и
запись на жёсткий диск этого типа видеоданных, можно говорить только в том
случае, когда их можно запустить в фоновом режиме.
Поскольку при сжатии видео ключевые кадры кодируются независимо от других кадров, существует необходимость в быстрых алгоритмах сжатия изображений. В соответствии с классификацией изображений, приведённой в [1], кадры
экранного видео относятся к дискретно-тоновым изображениям. Для сжатия таких изображений, как правило, используются алгоритмы без потерь информации,
так как при сжатии дискретно-тоновых изображений даже небольшой процент
потерь может привести к значительному визуальному ухудшению качества изображения. К таким алгоритмам можно отнести RLE (Run-length encoding) и семейство алгоритмов LZ (Lempel-Ziv). Для сжатия экранного видео в режиме реального времени зачастую используется алгоритм LZO (Lempel-Ziv-Oberhumer),
так как позволяет быстро сжимать дискретно-тоновую графику, обеспечивая при
этом приемлемую степень сжатия [2, 3]. Алгоритмы семейства zlib применяются
для перекодирования экранного видео, так как обеспечивают высокую степень
сжатия, хотя и требуют значительных временных затрат [4]. Гибридный алгоритм
версии 2, предназначенный для сжатия дискретно-тоновых изображений, был
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Д.В. Дружинин
130
разработан автором и подробно описан в [5]. Также в [5] был представлен комбинированный алгоритм сжатия, использующий гибридный алгоритм на первом
этапе и LZO на втором этапе.
1. Схема комбинированного алгоритма сжатия, использующего zlib
Был предложен следующий комбинированный алгоритм сжатия. На первом
этапе исходное изображение обрабатывается гибридным алгоритмом версии 2. На
выходе получается 3 массива:
1. Массив флагов.
2. Массив байтов сдвигов и количеств. В этом массиве также содержатся различные служебные данные (кроме флагов), используемые гибридным алгоритмом. Все данные, попадающие в этот массив, имеют однобайтовую природу.
3. Массив пикселей. Будем называть этот массив остаточным изображением.
Это те пиксели исходного изображения, которые не были заменены в ходе кодирования гибридным алгоритмом некоторыми служебными данными.
На втором этапе все 3 массива, получаемых на выходе гибридного алгоритма,
сжимаются по отдельности алгоритмом zlib с уровнем 9. Имеет смысл применять
zlib к различным типам результирующих данных гибридного алгоритма по отдельности, так как каждый тип данных обладает специфическим типом избыточности. Оказалось, что zlib способен существенно сжать массив флагов (в среднем
на 20 % для zlib уровня 9), в то время как применение LZO и алгоритма Хаффмана к этому типу данных практически не давало эффекта.
Исходные
данные
Гибридный алгоритм версии 2
Массив
сдвигов и
количеств
Массив
флагов
Пиксели
остаточного
изображения
ZLIB
Сжатые
данные
Результирующие данные
Рис. 1. Схема комбинированного алгоритма,
использующего zlib
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Комбинированные алгоритмы сжатия ключевых кадров экранного видео
131
Замечание: Чем выше используемый уровень (от 1 до 9) алгоритма zlib, тем
выше степень сжатия и временные затраты. Для LZO применяется тот же набор
уровней.
2. Результаты тестирования
Были протестированы следующие алгоритмы: LZO_X_1, LZO_X_999 с уровнем сжатия 1, 4, 6, 9; zlib с уровнем сжатия 1, 4, 6, 9; гибридный алгоритм второй
версии, комбинированный алгоритм, использующий LZO_X_999 с уровнем сжатия 6, 9; комбинированный алгоритм, использующий zlib с уровнем сжатия 6, 9;
реализация FastAC арифметического сжатия [7]; реализация Main Concept JPEG
2000 [8]; реализации Microsoft алгоритмов JPEG, JPEG Lossless; реализация
CharLS алгоритма JPEG_LS [9]. Также в тестировании принимала участие реализация алгоритма, соответствующего стандарту Deflate [6, с. 95], от Microsoft.
Для алгоритмов семейства LZO приведены также время финального сжатия
алгоритмом Хаффмана, а также размер закодированного изображения после финального сжатия (табл. 1 − 3).
Таблица 1
Усреднённые данные о сжатии изображений, типичных для Windows XP
Алгоритм / Параметр
1. LZO_X_999 уровень 1
2. LZO_X_999 уровень 4
3. LZO_X_999 уровень 6
4. LZO_X_999 уровень 9
5. LZO_X_1
6. Гибридный алгоритм v. 2
7. Комбинированный алгоритм,
использующий LZO_X_999 уровень 6
8. Комбинированный алгоритм,
использующий LZO_X_999 уровень 9
9. Deflate
10. zlib уровень 1
11. zlib уровень 4
12. zlib уровень 6
13. zlib уровень 9
14. Комбинированный алгоритм,
использующий zlib уровень 6
15. Комбинированный алгоритм,
использующий zlib уровень 9
16. Алгоритм Хаффмана
17. Арифметическое сжатие
18. JPEG 2000 (без потерь)
19. JPEG 2000 (с уровнем потерь 0,1)
20. JPEG Lossless
21. JPEG (с уровнем потерь 0,1)
22. RLE
23. JPEG-LS
Время кодиро- Размер после
вания / декодиосновного
рования (мс)
сжатия
56 / 11
147886,6
56, 6 / 10
129921,8
67,7 / 9
120198,5
370,6 / 8,8
113822,4
11,2 / 11,7
159182,3
54,2 / 33,5
117388
58,1 / 24,6
91029,1
64,1 / 23,1
90679
48,6 / 12
15 / 5
32 / 4
38 / 4
89 / 4
157206,5
135744
110946,3
104116,6
99733,9
56 / 22
80693,2
57 / 22
80672,7
78 / 66
35 / 74
437 / 361
44 / 32
41 / 54
34 / 43
4/4
25 / 23
1389133,1
1378388,1
298352
229817
358629
171425
342721
210390
Размер после
сжатия алгоритмом Хаффмана
124405
112427,4
106388,6
101859,9
142159
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Д.В. Дружинин
132
Таблица 2
Усреднённые данные о сжатии изображений,
значительную часть которых занимает текст
Алгоритм / Параметр
1. LZO_X_999 уровень 1
2. LZO_X_999 уровень 4
3. LZO_X_999 уровень 6
4. LZO_X_999 уровень 9
5. LZO_X_1
6. Гибридный алгоритм V. 2
7. Комбинированный алгоритм,
использующий LZO_X_999 уровень 6
8. Комбинированный алгоритм,
использующий LZO_X_999 уровень 9
9. Deflate
10. zlib уровень 1
11. zlib уровень 4
12. zlib уровень 6
13. zlib уровень 9
14. Комбинированный алгоритм,
использующий zlib уровень 6
15. Комбинированный алгоритм,
использующий zlib уровень 9
16. Алгоритм Хаффмана
17. Арифметическое сжатие
18. JPEG 2000 (без потерь)
19. JPEG 2000 (с уровнем потерь 0,1)
20. JPEG Lossless
21. JPEG (с уровнем потерь 0,1)
22. RLE
23. JPEG-LS
Время кодиро- Размер после
вания / декодиосновного
рования (мс)
сжатия
56,1 / 10,9
164025,4
57,4 / 9,6
133731,6
72,6 / 8,5
110345,4
880 / 7,8
94430,6
11,8 / 11
176658,4
62,4 / 33
98180,3
62,5 / 26,7
89682,6
65 / 26,8
89578
50,6 / 10,9
15 / 5
32 / 4
43 / 4
249 / 4
126848,4
122339,75
94714,5
83749,25
76921,5
66 / 25
73976,5
69 / 25
73857,4
52 / 42
31 / 68
481 / 390
46 / 31
38 / 50
40 / 49
3/3
24 / 20
880449,75
841289,5
384686
235785
475470
289965
286454
184841
Размер после
сжатия алгоритмом Хаффмана
118184,1
102429,1
91106,8
81288,4
138447,3
Таблица 3
Усреднённые данные о сжатии изображений, содержащих графики и диаграммы
Алгоритм / Параметр
1. LZO_X_999 уровень 1
2. LZO_X_999 уровень 4
3. LZO_X_999 уровень 6
4. LZO_X_999 уровень 9
5. LZO_X_1
6. Гибридный алгоритм V. 2
7. Комбинированный алгоритм,
использующий LZO_X_999 уровень 6
8. Комбинированный алгоритм,
использующий LZO_X_999 уровень 9
9. Deflate
10. zlib уровень 1
Время кодиро- Размер после
вания / декодиосновного
рования (мс)
сжатия
53,9 / 9,1
124239,5
55,4 / 8,7
113404,2
65,4 / 8,6
107833,9
293,5 / 7,6
103002,1
10,1 / 10,3
136494,8
60,2 / 32
112324,1
62,5 / 27,6
94742,1
68,2 / 26,6
94522,5
47,1 / 10,9
14 / 4
145175,6
122351,1
Размер после
сжатия алгоритмом Хаффмана
106542,4
98963,6
95126,4
91764,1
124248,7
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Комбинированные алгоритмы сжатия ключевых кадров экранного видео
133
Окончание табл. 3
Алгоритм / Параметр
11. zlib уровень 4
12. zlib уровень 6
13. zlib уровень 9
14. Комбинированный алгоритм,
использующий zlib уровень 6
15. Комбинированный алгоритм,
использующий zlib уровень 9
16. Алгоритм Хаффмана
17. Арифметическое сжатие
18. JPEG 2000 (без потерь)
19. JPEG 2000 (с уровнем потерь 0,1)
20. JPEG Lossless
21. JPEG (с уровнем потерь 0,1)
22. RLE
23. JPEG-LS
Время кодиро- Размер после
вания / декодиосновного
рования (мс)
сжатия
32 / 4
101396,2
36 / 4
95471,7
77 / 4
90687,5
62 / 27
82764,7
62 / 25
82762,6
70 / 59
34 / 73
456 / 375
45 / 32
45 / 56
34 / 43
4/4
27 / 24
1232763,2
1216817,4
315728
235824
348097
163521
316114
239670
Размер после
сжатия алгоритмом Хаффмана
При тестировании каждое изображение имело разрешение 1024×768 и глубину
цвета в 32 бита. Таким образом, размер исходного изображения составляет
1024×768×4 байтов. Тестирование проводилось на платформе со следующими характеристиками: процессор Intel Core 2 Duo E6750 2,66 ГГц; оперативная память
DDR2 2Гб; операционная система Windows XP. На момент написания данной работы тестовая платформа находится в среднем сегменте по производительности.
Замечание: для гибридного алгоритма второй версии данные о размере сжатого изображения и времени сжатия приведены с учётом финальной обработки методом Хаффмана. Для этого все результирующие данные гибридного алгоритма
объединяются в один массив.
Для тестирования использовались скриншоты трёх типов:
1. Изображения, типичные для Windows XP (10 штук).
2. Изображения, значительную часть которых занимает текст (8 штук).
3. Изображения, содержащие графики, диаграммы (10 штук).
Эти скриншоты доступны по ссылке [10]. Рис. 2 − 4 представляют собой
уменьшенные копии некоторых тестовых изображений. Комбинированный алгоритм, использующий zlib уровня 9, обеспечил наивысшую степень сжатия на всех
трёх типах изображений при допустимых временных затратах. Комбинированный
алгоритм, использующий zlib уровня 6, показал близкие результаты (чуть меньшую степень сжатия при незначительно меньшем времени сжатия). Сам по себе
гибридный алгоритм демонстрирует меньшую степень сжатия по сравнению с
комбинированным алгоритмом, построенном на его основе.
Сравним комбинированный алгоритм, использующий zlib уровня 9, с zlib
уровня 9. Комбинированный алгоритм обеспечивает на 23,5 % более высокую
степень сжатия для изображений, типичных для Windows XP, при близком времени выполнения. Преимущество комбинированного алгоритма при сжатии изображений, содержащих текст, составляет 4 %. При этом комбинированный алгоритм
выполняется почти в 4 раза быстрее. При сжатии изображений, содержащих графики и диаграммы, комбинированный алгоритм демонстрирует на 9,5 % более
высокую степень сжатия при близком времени выполнения.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
134
Д.В. Дружинин
Рис. 2. Уменьшенная копия изображения WinXP_0.bmp
Рис. 3. Уменьшенная копия изображения text_4.bmp
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Комбинированные алгоритмы сжатия ключевых кадров экранного видео
135
Рис. 4. Уменьшенная копия изображения diagram_0.bmp
Как видно по результатам тестирования, комбинированный алгоритм, использующий zlib уровня 9, превосходит по степени сжатия комбинированный алгоритм, использующий LZO и алгоритм Хаффмана. Алгоритмы JPEG-LS, JPEG
2000, JPEG показали степень сжатия значительно ниже, чем лидеры тестирования,
так как эти алгоритмы ориентированы на сжатие фотографий (непрерывнотоновой графики), а не дискретно-тоновой графики.
Заключение
Представленный в данной работе комбинированный алгоритм, основанный на
гибридном алгоритме и zlib, подтвердил свою эффективность при тестировании.
Такой комбинированный алгоритм позволяет значительно увеличить степень сжатия кадров экранного видео по сравнению с алгоритмами семейства LZO и zlib (на
23,5 % в случае изображений, типичных для Windows XP по сравнению с zlib с
уровнем сжатия 9). При этом удалось увеличить скорость сжатия по сравнению с
zlib с уровнем сжатия 9 до 4 раз (при сжатии изображений, содержащих текст).
Поэтому представленный комбинированный алгоритм может быть использован на
практике для сжатия кадров экранного видео.
На данный момент комбинированный алгоритм встроен в кодек для обработки
экранного видео Butterfly Screen Video Codec, ориентированный на минимизацию
использования процессорного времени при сохранении высокой степени сжатия.
Представленный комбинированный алгоритм используется не только при сжатии
ключевых кадров, но и при сжатии изменившихся частей промежуточных кадров.
Поэтому разработка представленного в данной работе комбинированного алгоритм является очередным шагом в оптимизации по уровню использования системных ресурсов и степени сжатия кодека Butterfly Screen Video Codec.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
136
Д.В. Дружинин
ЛИТЕРАТУРА
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Сэломон Д. Сжатие данных, изображений и звука. М.: Техносфера, 2006. 365 с.
LZO. [Электронный ресурс]. URL: http://www.oberhumer.com/opensource/lzo.
Camstudio. [Электронный ресурс]. URL: http://camstudio.org.
ZLIB. [Электронный ресурс]. URL: http://zlib.net.
Дружинин Д.В. Комбинированный алгоритм сжатия ключевых кадров экранного видео.
// Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 3. С. 67−77.
Ватолин Д. Методы сжатия данных. Устройство архиваторов, сжатие изображений и
видео. М.: Диалог-МИФИ, 2003. 384 с.
FastAc. [Электронный ресурс]. URL: http://www.cipr.rpi.edu/research/SPIHT/spiht3.html
Main Concept. [Электронный ресурс]. URL: http://www.mainconcept.com
CharLS. [Электронный ресурс]. URL: http://charls.codeplex.com
Скриншоты. [Электронный ресурс] / Д. В. Дружинин. URL: https://docs.google.com/
file/d/0B_2xi7pVvd23RzAyNVJWWDJBSUU/edit?usp=sharing
Дружинин Денис Вячеславович
Томский государственный университет
E-mail: dendru@rambler.ru
Поступила в редакцию 7 мая 2013 г.
Druzhinin Denis V. (Tomsk State University). Composite algorithms for screen video key
frames compression.
Keywords: screen video, image compression, fast compression algorithms.
Video compression is one of the most time-taking problems, which are solved not only by
professionals, but also by ordinary users. Screen video is one of the video data types, which must
be compressed in real-time mode. Often it is necessary to compress screen video in background
mode at that. There is a necessity in fast image compression algorithms, because during video
compression key frames are encoded independently. Screen video frames are referred to discretetone images. As a rule algorithms without information loss are used to compress such images, because while compressing such images even a small information loss percent can result in significant visual image degradation. RLE and family of LZ algorithms can be referred to such algorithms. LZO is actively used in screen video compression (for example, it is used in freeware
screen video recorder CamStudio).
Composite algorithm for screen video key frames compression is introduced in this paper.
This algorithm uses hybrid algorithm, developed by the author earlier, on the first step and zlib library on the second step. The paper also contains results of practical comparison with composite
algorithm, which uses hybrid algorithm on the first step and LZO algorithm on the second step,
and with several other algorithms. Three types of screenshots were used for testing:
1. Pictures, typical for Windows XP (10 pieces);
2. Pictures with text (8 pieces);
3. Pictures with graphics, diagrams (10 pieces).
Introduced in this paper composite algorithm, based on hybrid algorithm and zlib, confirmed
its effectiveness. This composite algorithm demonstrates higher degree of compression (at the average 23,5 % more for pictures, typical for Windows XP comparing to zlib level 6). Meanwhile,
introduced composite algorithm demonstrates higher compression speed (at the average 4 times
faster comparing to zlib level 9 for pictures with text). Therefore, introduced combined algorithm
can be used in practice for screen video frames compression.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 4(25)
СВЕДЕНИЯ ОБ АВТОРАХ
АГАФОНОВ Евгений Дмитриевич − кандидат технических наук, доцент кафедры топливообеспечения и горюче-смазочных материалов Института нефти и газа Сибирского федерального университета (г. Красноярск). E-mail: agafonov@gmx.de
БАГРОВА Инна Александровна − аспирантка кафедры математической статистики и
системного анализа факультета прикладной математики и кибернетики Тверского государственного университета. E-mail: inna@tversu.ru
ВЕДЕРНИКОВА Мария Александровна − аспирантка кафедры прикладной математики
Новосибирского государственного технического университета. E-mail: vedernikova.m.a@
gmail.com
ВРАЖНОВ Денис Александрович – инженер-программист ООО «Томсклаб». E-mail:
Vrazhnov@tomsklabs.com
ГАЛАНОВА Наталья Сергеевна − аспирантка кафедры прикладной математики Новосибирского государственного технического университета. E-mail: natalia.galanova@gmail.com
ГОРЦЕВ Александр Михайлович – профессор, доктор технических наук, декан факультета прикладной математики и кибернетики Томского государственного университета.
E-mail: gam@fpmk.tsu.ru
ДРУЖИНИН Денис Вячеславович − аспирант кафедры теоретических основ информатики факультета информатики Томского государственного университета. E-mail: dendru@
rambler.ru
ИВАНОВ Дмитрий Владимирович − кандидат физико-математических наук, старший
преподаватель кафедры мехатроники в автоматизированных производствах электротехнического факультета Самарского государственного университета путей сообщения. E-mail:
dvi85@list.ru
КАРЕЛИН Алексей Евгеньевич − кандидат технических наук, доцент кафедры электронных средств автоматизации и управления Томского государственного университета
систем управления и радиоэлектроники. E-mail: karelin_a@mail.ru
ЛЕОНОВА Мария Алексеевна – аспирантка кафедры исследования операций факультета
прикладной математики и кибернетики Томского государственного университета. E-mail:
mleonova86@mail.ru
МАТАЛЫЦКИЙ Михаил Алексеевич − профессор, доктор физико-математических наук,
заведующий кафедрой стохастического анализа и эконометрии факультета математики и
информатики Гродненского государственного университета имени Я. Купалы (г. Гродно,
Беларусь). E-mail: m.matalytski@gmail.com
МЕДВЕДЕВ Геннадий Алексеевич – профессор, доктор физико-математических наук,
профессор факультета прикладной математики и информатики Белорусского государственного университета (г. Минск, Беларусь). E-mail: MedvedevGA@cosmostv.by
МОИСЕЕВА Екатерина Александровна − магистрантка Томского государственного
университета. E-mail moiskate@mail.ru
НАЗАРОВ Анатолий Андреевич – профессор, доктор технических наук, заведующий кафедрой теории вероятностей и математической статистики факультета прикладной математики и кибернетики Томского государственного университета. Е-mail: anazarov@ fpmk.tsu.ru
НАУМЕНКО Виктор Викторович − аспирант факультета математики и информатики
Гродненского государственного университета имени Я. Купалы (г. Гродно, Беларусь).
E-mail: victornn86@gmail.com
НЕЖЕЛЬСКАЯ Людмила Алексеевна – кандидат технических наук, доцент кафедры исследования операций факультета прикладной математики и кибернетики Томского государственного университета. E-mail: ludne@mail.ru.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
138
Сведения об авторах
НИКОЛАЕВ Виктор Владимирович – студент физического факультета Томского государственного университета. E-mail: Vrazhnov@tomsklabs.com
ОРЛОВСКАЯ Нина Федоровна − кандидат химических наук, профессор кафедры топливообеспечения и горюче-смазочных материалов Института нефти и газа Сибирского федерального университета (г. Красноярск). E-mail: togsming@mail.ru
ПЕРВУШИН Владимир Федорович − магистрант Сибирского государственного аэрокосмического университета им. акад. М.Ф. Решетнёва (г. Красноярск). E-mail: pervushin_vf
@inbox.ru
РЮМКИН Валерий Иванович − кандидат физико-математических наук, доцент кафедры
математических методов и информационных технологий в экономике экономического факультета Томского государственного университета. E-mail: vir@mail.tomsknet.ru
СВЕТЛАКОВ Анатолий Антонович − профессор, доктор технических наук, профессор
кафедры электронных средств автоматизации и управления Томского государственного
университета систем управления и радиоэлектроники. E-mail: iit@fet.tusur.ru
УСКОВ Олег Владимирович − аспирант кафедры мехатроники в автоматизированных
производствах электротехнического факультета Самарского государственного университета путей сообщения. E-mail: quetyn@bk.ru
ЧИМИТОВА Екатерина Владимировна − кандидат технических наук, доцент кафедры
прикладной математики Новосибирского государственного технического университета.
E-mail: ekaterina.chimitova@gmail.com
ШАПОВАЛОВ Александр Васильевич – профессор, доктор физико-математических наук, заведующий кафедрой теоретической физики физического факультета Томского государственного университета. E-mail: shpv@phys.tsu.ru
ЩЕЛКАНОВ Николай Николаевич – кандидат физико-математических наук, старший
научный сотрудник лаборатории оптики аэрозоля Федерального государственного бюджетного учреждения науки «Институт оптики атмосферы им. В.Е. Зуева» СО РАН
(г. Томск). E-mail: snn@iao.ru
1/--страниц
Пожаловаться на содержимое документа