close

Вход

Забыли?

вход по аккаунту

?

430.Вестник Томского государственного университета. Управление, вычислительная техника и информатика №3 2013

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО
МИНИСТЕРСТВО
ОБРАЗОВАНИЯ УНИВЕРСИТЕТА
И НАУКИ РФ
Управление, вычислительная техника и информатика
2013
№ 3(24)
ВЕСТНИК
ТОМСКОГО
ГОСУДАРСТВЕННОГО
УНИВЕРСИТЕТА
УПРАВЛЕНИЕ,
ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА
И ИНФОРМАТИКА
TOMSK STATE UNIVERSITY
JOURNAL OF CONTROL AND COMPUTER SCIENCE
Научный журнал
2013
№ 3(24)
Свидетельство о регистрации: ПИ № ФС 77-29497
от 27 сентября 2007 г.
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2
V.V. Dombrovskii
РЕДАКЦИОННАЯ КОЛЛЕГИЯ ЖУРНАЛА
«ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА.
УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА»
Горцев А.М., д-р техн. наук, проф. (председатель); Смагин В.И., д-р техн. наук, проф.
(зам. председателя); Нежельская Л.А. канд. техн. наук, доц. (отв. секретарь); Агибалов Г.П.,
д-р техн. наук, проф.; Дмитриев Ю.Г., д-р физ.-мат. наук, проф.; Домбровский В.В.,
д-р техн. наук, проф.; Змеев О.А., д-р физ.-мат. наук, проф.; Евтушенко Н.В., д-р техн. наук, проф.; Конев В.В., д-р физ.-мат. наук, проф.; Костюк Ю.Л., д-р техн. наук, проф.; Кошкин Г.М., д-р физ.-мат. наук, проф.; Матросова А.Ю., д-р техн. наук, проф.; Назаров А.А.,
д-р техн. наук, проф.; Параев Ю.И., д-р техн. наук, проф.; Поддубный В.В., д-р техн.
наук, проф.; Сущенко С.П., д-р техн. наук, проф.; Тарасенко Ф.П., д-р техн. наук, проф.;
Enzo Orsingher, Prof., University of Rome (Italy); Paolo Prinetto, Prof., Polytechnic Institute
Turine (Italy); Yervant Zorian, PhD, Vice President & Chief Scientist, Virage Logic Corp.,
Fremont, CA (USA).
Научный журнал «Вестник Томского государственного университета. Управление, вычислительная техника и информатика» был выделен в самостоятельное периодическое издание из общенаучного журнала «Вестник Томского государственного университета» в
2007 г. Журнал зарегистрирован в Федеральной службе по надзору в сфере массовых коммуникаций, связи и охраны культурного наследия (свидетельство о регистрации ПИ № ФС
77-29497 от 27 сентября 2007 г.), ему присвоен международный стандартный номер сериального издания (ISSN 1998-8605). С 2010 г. журнал входит в Перечень ВАК. Журнал выходит ежеквартально и распространяется по подписке, его подписной индекс 44031 в объединённом каталоге «Пресса России».
В журнале «Вестник ТГУ. УВТиИ» публикуются результаты теоретических и прикладных исследований вузов, научно-исследовательских, проектных и производственных организаций в области управления, вычислительной техники и информатики в технических,
экономических и социальных системах.
Тематика публикаций журнала:
• УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
• МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
• ОБРАБОТКА ИНФОРМАЦИИ
• ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
• ДИСКРЕТНЫЕ ФУНКЦИИ И АВТОМАТЫ
• ПРОЕКТИРОВАНИЕ И ДИАГНОСТИКА ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
Правила оформления статей приведены на сайте: http://vestnik.tsu.ru/informatics/
Адрес редакции:
634050, г. Томск, пр. Ленина, д.36, корп. 2, к. 201
Электронный адрес: http://vestnik.tsu.ru
Контактный тел./факс: (3822) 529-599
E-mail: vestnik_uvti@mail.tsu.ru
ООО «Издательство научно-технической литературы»
634050, Томск, пл. Новособорная, 1, тел. (3822) 533-335
Редактор Т.С. Портнова
Верстка Д.В. Фортеса
Изд. лиц. ИД № 04000 от 12.02.2001. Подписано к печати 06.09.2013.
Формат 70 × 100 1/16. Бумага офсетная. Печать офсетная. Гарнитура «Таймс».
Усл. п. л. 11,61. Уч.-изд. л. 13,0. Тираж 300 экз. Заказ № 40.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
СОДЕРЖАНИЕ
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
Dombrovskii V.V. Adaptive data-driven portfolio optimization in the non-stationary
financial market under constraints.............................................................................................. 5
Приступа М.Ю., Смагин В.И. Прогнозирующее управление выходом нестационарной дискретной системы при ограничениях на управление ........................................ 14
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Дмитренко А.Г., Уринов Р.И. Моделирование электромагнитного рассеивания на
трех импедансных телах ........................................................................................................ 24
Толстуха С.А., Филимонов В.А. Веб-приложения для моделирования динамических систем и субъектов с рефлексией ................................................................................ 34
ОБРАБОТКА ИНФОРМАЦИИ
Бондаренко А.Н., Гунькин А.Ю. Критические явления на самоподобных решётках........ 40
Верховин А.В., Гуменюк А.С. О средствах формального анализа структуры музыкальных текстов ...................................................................................................................... 47
Гультяева Т.А., Попов А.А. Классификация последовательностей с использованием скрытых марковских моделей в условиях неточного задания их структуры ............. 57
Зенкова Ж.Н., Краковецкая И.В. Непараметрическая оценка Тёрнбулла для интервально-цензурированных данных в маркетинговом исследовании спроса на
биоэнергетические напитки................................................................................................... 64
Зорин А.В. Оптимизация параметров управления конфликтными потоками в классе
циклических алгоритмов ....................................................................................................... 70
Кокшенев В.В., Михеев П.А., Сущенко С.П. Анализ селективного режима отказа
транспортного протокола в нагруженном тракте передаче данных.................................. 78
Лапко А.В., Лапко В.А. Обобщённая непараметрическая регрессия и её свойства ............ 95
Любина Т.В., Назаров А.А. Исследование динамической и адаптивной RQ-систем
с входящим ММРР-потоком заявок.................................................................................... 104
Медведев Г.А. О временной структуре доходности. 6. Трехфакторные модели ................ 113
Неделько В.М. Некоторые вопросы оценивания качества методов построения решающих функций ................................................................................................................. 123
Цициашвили Г.Ш. Эргодичность одноканальной системы массового обслуживания в случайной среде.......................................................................................................... 133
ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
Приступа А.В. Имитационная модель перекрестка с двухфазным светофорным регулированием ........................................................................................................................ 138
СВЕДЕНИЯ ОБ АВТОРАХ ....................................................................................................... 143
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
TOMSK STATE UNIVERSITY
2013
Journal of Control and Computer Science
No. 3(24)
CONTENTS
CONTROL OF DYNAMICAL SYSTEMS
Dombrovskii V.V. Adaptive data-driven portfolio optimization in the non-stationary financial market under constraints ................................................................................................ 5
Pristupa M.Yu., Smagin V.I. Model predictive control of the output time-varying discrete systems with constraints on the control .......................................................................... 14
MATHEMATICAL MODELLING
Dmitrenko A.G., Urinov R.I. Simulating of electromagnetic scattering from three impedance bodies.......................................................................................................................... 24
Tolstukha S.A., Filimonov V.A. Web-applications for dynamic systems and subjects
with reflection modeling........................................................................................................... 34
DATА PROCESSING
Bondarenko A.N., Gunkin A.Y. Critical phenomena on self-similar lattices.............................. 40
Verkhovin A.V., Gumenyuk A.S. About means of formal analysis of the structure of
musical text............................................................................................................................... 47
Gultyaeva Tatyana A., Popov Alexander A. Classification of sequences with use hidden
markov models in the conditions of the inexact task of their structure.................................... 57
Zenkova Zh.N., Krakovetckaia I.V. Nonparametric Turnbull estimator for intervalcensored data in the marketingresearch of the demand of bio-energy drinks .......................... 64
Zorine A.V. Optimization of conflicting flows control parameters in the class of cyclic
algorithms ................................................................................................................................. 70
Mikheev P.A., Kokshenev V.V., Sushchenko S.P. Transport protocol selective acknowledgements analysis in loaded transmission data path..................................................... 78
Lapko A.V., Lapko V.A. The generalized nonparametric regression and its properties .............. 95
Lyubina T.V., Nazarov A.A. Research of the dynamic and adaptive retrial queue systems with input MMPP-process requests ............................................................................... 104
Medvedev G.A. On term structure of yield rates. 6. The three factor model .............................. 113
Nedelko V.M. Some aspects of estimating a quality of decision functions construction
methods................................................................................................................................... 123
Tsitsiashvili G.Sh. Ergodicity of one server queuing systems in random environment.............. 133
INFORMATICS AND PROGRAMMING
Pristupa A.V. Crossroad simulation model with the two-phase traffic signal control................ 138
BRIEF INFORMATION ABOUT THE AUTHORS................................................................... 143
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
УДК 519.865.5
V.V. Dombrovskii
ADAPTIVE DATA-DRIVEN PORTFOLIO OPTIMIZATION IN THE
NON-STATIONARY FINANCIAL MARKET UNDER CONSTRAINTS1
In this work we propose a novel methodology for optimal dynamic allocation of a
portfolio of risky financial assets under hard constraints on trading volume
amounts. Our approach is direct in that it uses directly the observed historical data
to construct an adaptive algorithm for online portfolio selection. The problem of
portfolio optimization is stated as a dynamic problem of tracking a financial
benchmark. We use the model predictive control (MPC) methodology in order to
solve the problem. The main features of our approach are (a) the ability to adapt to
non-stationary market environments by dynamically incorporating new information into the decision process; (b) no stochastic assumptions are needed about the
stock prices, and (c) the flexibility of dealing with portfolio constraints. We also
present the numerical modeling results, based on futures traded on the Russian
Stock Exchange FORTS that give evidence of capacity and effectiveness of proposed approach.
Keywords: investment portfolio, non-stationary financial market, adaptive optimization, model predictive control.
The investment portfolio (IP) management is an area of both theoretical interest and
practical importance. The basis of the current classical theory of optimal portfolio allocation problem is the single-period “mean variance” approach suggested by Markowitz
[1] and the Merton dynamic IP model [2] in continuous time. At present, there exists a
variety of models and approaches to the solution of the IP optimization problem, but
most of them are the complications and extensions of the Markowitz and Merton approaches to various versions of stochastic models of the prices of risky and risk-free securities and utility functions. The review of the main trends existing in the modern theory of stochastic control in finance is given in [3].
Most existing methods need some statistical models of the asset returns (prices). To
implement portfolios based on these models in practice, one needs to estimate the parameters of these models (typically, the means and covariance of asset returns). The
portfolio optimization is divided into two steps: 1) observed historical data is first used
to compute estimates of the parameters; 2) then a suitable optimization problem is
solved using of the estimated quantities in place of the true ones. Each of these steps involves restrictive assumptions on the return process such as i.i.d. (independent, identically distributed) and stationarity hypotheses. Moreover, one needs an ergodic property
of returns to ensure that the time average of a quantity converges to its expectation. But
1
Работа выполнена в рамках государственного задания Минобрнауки РФ на проведение научных исследований в Томском государственном университете на 2012–2014 годы, задание 8.4055.2011.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
6
V.V. Dombrovskii
the market statistics shows that the return processes are non-stationary and non-ergodic
[4]. So the result of optimization will be sensitive to errors in the estimation. Due to estimation error, the portfolios that rely on the sample estimates typically perform poorly
out of sample. Moreover, the most of the results presented in the literature are limited to
the cases without explicit constraints on the trading volume amounts. However it’s wellknown that realistic investment models must include ones.
In this work, we take an absolutely different route to dynamic portfolio optimization
under constraints. The method developed in this paper that is described below does not
treat estimation and optimization separately. Our route is direct in that it does not rely
on a two stages (estimation/optimization) approach and no stochastic assumptions are
made about the stock prices. Therefore, unlike related models in the literature no statistical characteristics are needed about the stock prices and no statistical estimation techniques are used to compute the parameters of the portfolio model. Instead, parameters
are treated as adjustable variables and directly obtained from the observed historical
data to optimize the objective function. We leverage on the methodology of model predictive control (also known as receding horizon control) in order to design feedback
portfolio optimization strategy [5].
MPC proved to be an appropriate and effective technique to solve the dynamic control problems subject to input and state/output constraints. MPC have begun to be used
with success in financial applications such as portfolio optimization and dynamic
hedging. Some of the recent works on this subject can be found, for instance, in [6][10]. In all these papers authors assume the hypothesis of serially independent returns
and consider the explicit form of the model describing the price process of the risky assets (e.g. geometric Brownian motion, e.t.c.). The problem of MPC for discrete-time
systems with dependent random parameters and its application to IP optimization is
considered in [11, 12].
The main contribution of this paper is to propose a framework for the computation of
dynamic trading strategies subject to hard constraints on the trading volume amounts that
are adaptive to input data. Adaptive algorithms have the ability to adapt to the underlying
data by dynamically incorporating new information into the decision process and they are
naturally more suitable for non-stationary environments, such as those in finance. The
method developed in this work based on the idea of moving horizon prediction that is to
predict the portfolio state using a moving and fixed-size window of data. When a new
measurement becomes available, the oldest measurement is discarded and the new measurement is added. The motivation is within the context of algorithmic trading, which demands fast and recursive updates of portfolio allocations, as new data arrives.
We present the numerical modeling results, based on futures, traded on the Russian
Stock Exchange FORTS (Futures & Options on RTS), that give evidence of capacity
and effectiveness of proposed approach. Numerical examples based on real market have
shown that our approach is a theoretically sound and computationally efficient method.
1. Portfolio optimization problem
Consider the investment portfolio consisting on the n risky assets and one risk-free
asset (e.g. a bank account or a government bond). Let ui(k) (i = 0, 1,2, ..., n) denote the
amount of money invested in the ith asset at time k; u0(k)≥0 is the amount invested in a
risk-free asset. Then the wealth process V(k) satisfies:
n
V (k ) = ∑ ui (k ) + u0 (k ).
i =1
(1)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Adaptive data-driven portfolio optimization in the non-stationary financial market
7
Notice, that if ui(k)<0 (i = 1, 2, ..., n), then we use short position with the amount of
shorting | ui(k)|.
Let ηi(k+1) denote the return of the ith risky asset per period [k, k + 1]. It is a stochastic unobservable at time k value defined as
P (k + 1) − Pi (k )
ηi (k + 1) = i
,
Pi (k )
where Pi(k) denotes the market value of the ith risky asset at time k.
By considering the self-finance strategies (self-financing means that we do not allow
wealth to be added to or extracted from the portfolio), the wealth process V( • ) at the
time k+1 is given by:
n
V (k + 1) = ∑ [1 + ηi (k + 1) ] ui (k ) + [1 + r ] u0 (k ),
(2)
i =1
n
where r is a risk-free interest rate of the risk-free asset, here u0 (k ) = V (k ) − ∑ ui (k ) .
i =1
Using (1) we can rewrite (2) as follows (see [11]):
V (k + 1) = [1 + r ]V (k ) + (η(k + 1) − en r )u (k ),
(3)
T
Where u(k)=[u1(k), …,un(k)] is the vector of control inputs, η(k)=[η1(k) η2(k) … ηn(k)]
is the vector of risky asset returns, en is n-dimensional vector with unit elements.
We impose the following constraints on the control actions [11]
ui min (k ) ≤ ui (k ) ≤ ui max (k ), (i = 1, n),
(4)
n
u0 min (k ) ≤ V (k ) − ∑ ui (k ) ≤ u0 max (k ).
(5)
i =1
If uimin(k)<0 (i=1,2,…,n), so we suppose that the amounts of the short-sale are restricted
by |uimin(k)|; if the short-selling is prohibited then uimin(k)≥0 (i=1,2,…,n). The amounts
of long-sale are restricted by uimax(k) (i=1,2,…,n); u0max(k)≥0 defines the amount we
can invest in the risk-free asset; u0min (k ) ≤ 0 determines the maximum volume of a loan
over the risk-free asset. Note, that values uimin(k) (i=0,1,…,n), uimax(k) (i=0,1,…,n) are
often depend on common wealth of portfolio in practice. So that we can write uimin(k) =
γi'V(k), uimax(k) = γi''V(k), where γi', γi'' are constant parameters.
Our objective is to control the investment portfolio, via dynamics asset allocation
among the n stocks and the bond, as closely as possible tracking the deterministic
benchmark
V 0 (k + 1) = [1 + μ 0 ]V 0 (k ) ,
(6)
where μ0 is a given parameter representing the growth factor, the initial state is
V0(0)=V(0).
Let the only source of information at instant k be the history of securities and current
values of V (k). Notice that variable V 0 (k ) is known for all time instant k=1,2,… and
may be considered as a pre-chosen parameter. Thereby, the optimal portfolio appears to
be dependent on the current values of the portfolio and the history of securities and
changed by new information. This type of reasoning is standard for the control theory
under uncertainty and gives the basis of feedback type control laws.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
V.V. Dombrovskii
8
We use the MPC methodology in order to define the optimal control portfolio strategy. The main concept of MPC is to solve an open-loop constrained optimization problem with receding horizon at each time instant and implement only the initial optimizing
control action of the solution, that leading to the following optimization:
2
⎧m
J (k + 1/ k ) = E ⎨∑ ⎡⎣V (k + i / k ) − V 0 (k + i ) ⎤⎦ +
u ( k ),...,u ( k + m −1)
⎩ i =1
T
+u (k + i − 1) R (k , i − 1)u (k + i − 1) / V (k ), η(k ), η(k − 1),..., η(k − N ) ,
min
}
(7)
where m is the prediction horizon, u(k+i)=[u1(k+i), …,un(k+i)]T is the predictive control
vector, R(k,i)>0 is a positive symmetric matrix of control cost coefficients,
V(k+i/k)(i=1,…,m) are the predicted values of portfolio, N is a depth of history taken
into account. The performance criterion (7) is composed by a quadratic part, representing the quadratic error between the portfolio value and a benchmark. So our portfolio is minimized against an ideal benchmark portfolio that has positive deterministic returns for each time step and is riskless.
2. Model predictive control strategies design
Criterion (9) can be transformed into equivalence form
⎧m
J (k + m / k ) = E ⎨∑ V 2 (k + i / k ) − 2V (k + i / k )V 0 (k + i ) +
⎩ i =1
T
+ u (k + i − 1) R (k , i − 1)u (k + i − 1) / V (k ), η(k ),..., η(k − N ) ,
}
(8)
where we eliminated the term that is independent of control variables. Define prediction
value of the portfolio by the equation
V (k + i / k ) = AiV (k ) + Ai −1 B[θ(k )]u (k ) + Ai − 2 B[θ(k )]u (k + 1) + ...
... + B[θ(k )]u (k + i − 1), (i = 1, m)
(9)
where
A=(1+r), B [ θ(k ) ] = [ θ(k ) − en r ] ,
θ(k ) = α1η(k ) + α 2 η(k − 1) + ... + α N η(k − N + 1), α1 , α 2 ,..., α N
are some pre-chosen parameters. These parameters are determined so as to achieve the
best results when the model (9) is used for the decision making. It must be emphasized
that no assumptions are made about these parameters. In this context is not required that
the sum of parameters be less or equal of unity (as, for example, required about the parameters of AR models). Moreover, the linearity on parameters is supposed only for the
sake of simplicity. We emphasize that equation (3) determine the evolution of the materialized portfolio whereas equation (9) define the predicted value of the portfolio. So
unlike related model in the literature we don't forecast future returns but we predict the
future value of the portfolio. Model calibration method is described below in section 3.
If at time instant k we observe an actual value of the portfolio and realization of the returns by looking at a stream of N historical data for the returns then the observed return
sequence becomes deterministic, and (9) would return a deterministic vector V(k+i/k)
(i=1,…,m) (however, before we get to observe returns this vector remain uncertain and
random). So we optimize the future inputs as deterministic variables (i.e., variables de-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Adaptive data-driven portfolio optimization in the non-stationary financial market
9
termined by V(k) and η(k ), η(k − 1), η(k − 2),..., η(k − N ) ) . We can re-express (8) as
follows
with
J (k + m / k ) = W T (k + 1)W (k + 1) − ∆1 (k + 1)W (k + 1) + U T (k )∆ (k )U (k ),
(10)
W (k + 1) = ΨV (k ) + Φ[θ(k )]U (k ),
(11)
where
⎡ V (k + 1/ k ) ⎤
⎡ u (k ) ⎤
⎢ V (k + 2 / k ) ⎥
⎢ u (k + 1) ⎥
W (k + 1) = ⎢
⎥ ,U (k ) = ⎢
⎥,
...
...
⎢
⎥
⎢
⎥
⎣⎢V (k + m / k ) ⎦⎥
⎣⎢u (k + m − 1) ⎦⎥
0n×2
⎡ A⎤
⎡ B[θ(k )]
⎢ A2 ⎥
⎢ AB[θ(k )]
B[θ(k )]
Ψ = ⎢ ⎥ , Φ[θ(k )] = ⎢
...
...
⎢ ... ⎥
⎢
m −1
m−2
⎢ Am ⎥
⎢
θ
[
(
)]
[θ(k )]
A
B
k
A
B
⎣
⎣ ⎦
...
...
...
0n×2
0n×2
...
⎤
⎥
⎥,
⎥
... B[θ(k )]⎥⎦
∆1 (k + 1) = 2 ⎡⎣V 0 (k + 1) V 0 (k + 2) ... V 0 (k + m) ⎤⎦ .
⎡ R(k , 0) 0n×n
⎢ 0
R(k ,1)
∆ (k ) = ⎢ n×n
...
⎢ ...
0n×n
⎣⎢ 0n×n
...
0 n× n ⎤
...
0 n× n ⎥
⎥
...
...
⎥
... R(k , m − 1) ⎦⎥
.
Using (11) we can write (10) as follows
J (k + m / k ) = V 2 (k )ΨT Ψ + ⎡⎣ 2V (k )Ψ T − ∆1 (k + 1) ⎤⎦ Φ[θ(k )]U (k ) +
+U T (k ) ⎡⎣ΦT [θ(k )]Φ[θ(k )] + ∆ (k ) ⎤⎦ U (k ).
(12)
Denote the following matrices
H (k ) = ΦT [θ(k )]Φ[θ(k )] + ∆ (k ), G (k ) = Ψ T Φ[θ(k )], F ( k ) = ∆1 (k + 1)Φ[θ(k )].
Thus we have that the problem of minimizing the criterion (12) subject to (4), (5) is
equivalent to the quadratic program problem with criterion
Y (k + m / k ) = [ 2V (k )G (k ) − F (k ) ]U (k ) + U T (k ) H (k )U (k )
subject to constrains (element-wise inequality)
U min (k ) ≤ S (k )U (k ) ≤ U max (k ),
where
T
U min (k ) = [umin
(k ), 0 n +1×1 ,..., 0 n +1×1 ]T ,
T
U max (k ) = [umax
(k ), 0 n +1×1 ,..., 0 n +1×1 ]T ,
T
umin (k ) = ⎡⎣u1min (k ), ... un min (k ), u0 min (k ) − V (k ) ⎤⎦ ,
T
umax (k ) = ⎡⎣u1max (k ), ... un max (k ), u0max (k ) − V (k ) ⎤⎦ ,
S (k ) is the block matrix of the form S (k ) = diag( S (k ), 0n +1×n ,..., 0n +1×n )
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
V.V. Dombrovskii
10
⎡ 1 0 ... 0 ⎤
⎢ 0 1 ... 0 ⎥
⎢
⎥
S (k ) = ⎢ ... ... ... ... ⎥ ,
⎢ 0 0 ... 1 ⎥
⎢⎣ −1 −1 ... −1⎥⎦
The MPC policy with receding horizon m for each instant k is defined by the equation:
u (k ) = [ I n 0n
0n ]U (k ),
where I n is n-dimensional identity matrix; 0n is n-dimensional zero matrix. Therefore
we obtain the desired result.
3. Numerical examples
This section tests the proposed approach. We want to assess the performance of our
model under real market conditions by computing the portfolio wealth over a long period of time. To this end, we consider the real security returns in the period from July
2007 to May 2013 and conduct a backtest. We consider the situation of an investor who
has to allocate his wealth among five risky assets and one risk-free asset. The updating
of the portfolio is executed once every trading day. We used five futures traded on the
Russian Stock Exchange FORTS (Futures & Options on RTS): RTS, Gazprom,
LUKOIL, Sberbank, GOLD. We tested the results on daily actual closing prices over a
period of time from July 20, 2007 to May 22, 2013. The risk-free asset considered here
as bank account with risk-free rate r = 0 per annum. We set the tracking target to return
0.3% per day (μ0=0.003). For our portfolio, we assumed an initial wealth of
V(0)=V0(0)=1.The weight coefficients are set as R = diag(10−4, …,10−4). We impose
hard constraints on the tracking portfolio problem with parameters γi' = 4/5, γi'' = 4 (i = 1,
…,5), γ0' = 4. For the on-line finite horizon problems MPC we used a prediction horizon
of m = 10, and numerically solved it in MATLAB by using the quadprog.m function.
First we need to tune the required model parameters. Lacking an analytical solution,
we tune the parameters and the value data window length N based on an initial training
data period to minimize the objective function. Our method includes the recalculation of
the MPC trading strategies with different parameters. All these different versions of the
parameters become the input of the MPC algorithm. We compute the portfolio wealth
over the training period for each of the set of parameters and select the one that generates the best results of tracking. To reduce the number of tuning parameters we will
simplify the model. Let
α1 = α 2 = ... = α N1 = α (1) ; α N1 +1 = α N1 + 2 = ... = α N1 + N 2 = α (2) ; N1 + N 2 = N .
Then
N1
θ(k ) = α (1) ∑ η(k − t + 1) + α (2)
t =1
N2
∑
t = N1 +1
η( N1 − t + 1).
Thus the simplified model include only two parameters α (1) , α (2) and two values of
data lengths windows N1 , N 2 . The number of observations for training and test datasets are 200 and 1200 , respectively. The following values of parameters were selected: α (1) = 0, 7 ; α (2) = 0,3 and length N1 = 15 , N 2 = 10 . These parameters are as-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Adaptive data-driven portfolio optimization in the non-stationary financial market
11
sumed to be stationary over the investment horizon and equal to the initial empirical
values, based on backwards data. The results are summarized in three figures. Figure 1
plots portfolio (bold line) and benchmark values (dotted line). In figure 2 we have investments in the RTS futures. Figure 3 illustrates the evolution of daily RTS futures returns.
V, V0
60
40
20
0
400
800
1200
k
Fig. 1. Performance of benchmark tracking
(V – bold line, V0 – dotted line)
u
120
80
40
0
–40
0
400
800
1200
k
Fig. 2. Invested amount in RTS futures
We find that on actual data the proposed approach is reasonable. The value of the
portfolio is effectively tracked the benchmark and respected the constraints. It is important to acknowledge that, even in this example, where we use simple unsophisticated
approach to tune the parameters, the tracking performance appears to be rather efficient.
The obvious appeal of our approach is its simplicity and the fact that it is not oriented to
a special class of forecasting schemes.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
V.V. Dombrovskii
12
η
0,4
0,2
0
–0,2
0
400
800
1200
k
Fig. 3. Daily returns of RTS Stock Exchange Index futures
Conclusion
In this paper we studied a discrete-time portfolio selection problem subject to constraints on trading volume amounts. The optimal open-loop adaptive portfolio control
strategy with using MPC methodology is derived. We also present the numerical modeling results, based on stocks (futures) traded on the Russian Stock Exchange FORTS
that give evidence of capacity and effectiveness of proposed approach.
The main features of our approach are (a) the ability to adapt to non-stationary market environments by dynamically incorporating new information into the decision process; (b) no stochastic assumptions are needed about the stock prices; (c) it is not oriented to a special class of forecasting schemes, and (d) the flexibility of dealing with
portfolio constraints.
REFERENCES
1. Marcowitz H.M. Portfolio selection // J. Finance. 1952. V. 7. Nо. 1. P. 77−91.
2. Merton R.C. Continuous-time finance. Cambridge: Blackwell, 1990.
3. Runggaldier W.J. On stochastic control in finance, in Mathematical systems Theory in Biology, Communication, Computation and Finance, D. Gilliam and J. Rosental, Eds., NewYork: Springer, 2002.
4. Cont R. Empirical properties of asset returns: stylized facts and statistical issues // Quantitative Finance. 2001. V. 1. P. 223−236.
5. Rawlings J. Tutorial: model predictive control technology // Proc. Amer. Control Conf. San
Diego. California. June 1999. P. 662−676.
6. Dombrovskii V.V., Dombrovskii D.V., and Lyashenko E.A. Predictive control of randomparameter systems with multiplicative noise. Application to investment portfolio optimization
// Automation and Remote Control. 2005. V. 66. Nо. 4. P. 583−595.
7. Dombrovskii V.V., Ob’edko T.Yu. Predictive control of systems with Markovian jumps under
constraints and its application to the investment portfolio optimization //Automation and Remote Control. 2011. V. 72. Nо. 5. P. 989−1003.
8. Herzog F., Dondi G, Geering H.P. Stochastic model predictive control and portfolio optimization // Int. J. Theoretical and Applied Finance. 2007. V. 10. Nо. 2. P. 203−233.
9. Primbs J.A., Sung C.H. A stochastic receding horizon control approach to constrained index
tracking // Asia-Pacific Finan Markets. 2008. V. 15. P. 3−24.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Adaptive data-driven portfolio optimization in the non-stationary financial market
13
10. Bemporad A., Puglia T., Gabriellini T. A Stochastic model predictive control approach to dynamic option hedging with transaction costs // Proc. American Control Conference, San
Francisco, CA,USA, June 29 – July 01, 2011. P. 3862−3867.
11. Dombrovskii V.V., Dombrovskii D.V., Lyashenko E.A. Model predictive control of systems
with random dependent parameter under constraints and It’s application to the investment
portfolio optimization // Automation and Remote Control. 2006. V. 67. Nо. 12. P. 1927−1939.
12. Dombrovskii V.V., Ob’edko T.Yu. Portfolio optimization in the financial market with serially
dependent returns under constraints //Вестник Томского государственного университета.
Управление, вычислительная техника и информатика. (Tomsk State University Journal of
Control and Computer Science). 2012. № 2 (19). С. 5−13.
Dombrovskii Vladimir V.
Tomsk State University
E-mail: dombrovs@ef.tsu.ru
Поступила в редакцию 12 марта 2013 г.
Домбровский В.В. (Томский государственный университет). Адаптивная управляемая
данными оптимизация инвестиционного портфеля на нестационарном финансовом
рынке при ограничениях.
Ключевые слова: инвестиционный портфель, нестационарный финансовый рынок, адаптивная оптимизация, управление с прогнозирующей моделью.
В работе предлагается новая методология динамического управления инвестиционным
портфелем с учетом ограничений на объемы торговых операций. Разработан адаптивный
алгоритм, основанный на прямом использовании исторических данных в процессе управления без статистического оценивания параметров модели. Задача оптимизации портфеля
формулируется как динамическая задача слежения за некоторым эталонным портфелем,
которая решена с использованием метода прогнозирующего управления. Приведены результаты численного моделирования с использованием реальных данных российского финансового рынка. Основными преимуществами предложенного подхода являются: а) возможность адаптироваться к изменяющимся рыночным условиям путем введения новой
информации в процесс управления; б) не требуется каких-либо предположений относительно вероятностных свойств цен финансовых активов; в) алгоритм управления не использует статистических методов оценивания параметров модели; г) возможность учета
ограничений.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
УДК 519.2
М.Ю. Приступа, В.И. Смагин
ПРОГНОЗИРУЮЩЕЕ УПРАВЛЕНИЕ ВЫХОДОМ НЕСТАЦИОНАРНОЙ
ДИСКРЕТНОЙ СИСТЕМЫ ПРИ ОГРАНИЧЕНИЯХ НА УПРАВЛЕНИЕ1
Рассматривается задача синтеза прогнозирующего управления, построенного на основе слежения за выходом системы для нестационарного линейного
объекта с учетом ограничений на управление. Прогнозирование осуществляется на основе оценок состояний нестационарного объекта, построенных с
использованием экстраполятора Калмана и оценок неизвестного входа.
Ключевые слова: дискретные нестационарные системы, прогнозирующее
управление, управление выходом.
При синтезе управлений широко используется метод управления динамическими объектами с применением прогнозирующих моделей – Model Predictive
Control (MPC) [1, 2]. Область применения метода MPC охватывает задачи управления производственными системами, управление запасами и финансовую математику [3−8].
В данной работе рассмотрено прогнозирующее управление нестационарным
объектом, модель поведения которого описывается линейными разностными
уравнениями. На объект наложены ограничения, которые представлены в виде
неравенств. Синтез управления с прогнозирующей моделью осуществляется на
основе управления выходом объекта. Целевая функция, представленная через выпуклую квадратичную функцию, предполагает отслеживание заданного сигнала и
пересчитывается в каждый текущий момент времени. Настоящая статья является
продолжением работ авторов [7−10].
1. Постановка задачи
Пусть модель нестационарного объекта, канала наблюдений и управляемого
выхода описываются следующими соотношениями:
xt +1 = At xt + Bt ut + wt , xt |t = 0 = x0 ;
(1)
где xt ∈ R
n
ψ t = H t xt + vt ;
(2)
yt = Gt xt ,
(3)
− состояние объекта, ut ∈ R
m
− управляющее воздействие (известный
l
вход), ψ t ∈ R − наблюдения, выход системы контроля, yt ∈ R p − управляемый
выход, At , Bt , H t , Gt – матрицы соответствующих размерностей. Уравнение (2)
является моделью системы контроля за состоянием объекта.
Далее будем полагать, что случайные возмущения wt и шумы измерения vt
подчиняются гауссовскому распределению с нулевым средним и с соответствую1
Работа выполнена в рамках государственного задания Минобрнауки РФ на проведение научных исследований в Томском государственном университете на 2012-2014 годы, задание 8.4055.2011.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прогнозирующее управление выходом нестационарной дискретной системы
15
щими ковариациями W, V, то есть
M{wt } = 0 , M{vt } = 0 , M{wt wkΤ } = Wt δt ,k , M{vt vkΤ } = Vt δt ,k , M{wt vkΤ } = 0 .
(4)
В (1) вектор начальных условий x0 является случайным, некоррелированным
с величинами wt и vt и определяется следующими характеристиками:
M{x0 } = x0 , M{( x0 − x0 )( x0 − x0 )Τ } = Px0 .
(5)
Ограничения на управление представляются в виде следующих неравенств:
a1 (t ) ≤ Sut ≤ a2 (t ) ,
(6)
где S – структурная матрица полного ранга, состоящая из нулей и единиц, определяющая компоненты вектора ut, на которые накладываются ограничения; a1 (t ) ,
a2 (t ) – заданные вектор-функции соответствующих размерностей.
Кроме того, предполагается, что пара матриц At , Bt управляема, а пара матриц At , H t полностью наблюдаема.
Модель (1)–(3) реализует прогноз поведения объекта на некоторый период, который называется горизонтом прогнозирования и обозначается N, используя информацию об управлении ut и векторе наблюдений ψt до текущего момента времени t.
Задача состоит в том, чтобы по наблюдениям ψt определить стратегию управления, при которой вектор выхода системы yt будет близок к заданному вектору
yt с учетом ограничений (6).
2. Прогнозирующая модель
Поскольку случайные возмущения wt и шумы измерения vt имеют гауссовское
распределение, то можно выполнить оптимальное прогнозирование поведения
объекта и вектора выхода, используя экстраполятор Калмана [11]:
xˆt +1|t = At xˆt |t −1 + Bt ut + Kt (ψ t − H t xˆt |t −1 ) , x̂0|−1 = x0 ;
(7)
yˆt +1|t = Gt xˆt +1|t ;
(8)
−1
Kt = At Pt H t Τ ( H t Pt H t Τ + Vt ) ;
−1
Pt +1 = Wt + At Pt At Τ − At Pt H t Τ ( H t Pt H t Τ + Vt ) H t Pt At Τ , P0 = Px0 ,
(9)
(10)
где xˆt +1|t и yˆt +1|t − оценки состояния и вектора выхода в момент времени t+1,
уравнение для Pt (10) известно как разностное уравнение Риккати с дискретным
временем, Px0 − начальное значение дисперсионной матрицы.
Для реализации модели прогнозирующего управления необходимо иметь возможность вычислять оценки вектора состояния на моменты времени t+1, t+2, …,
t+N, основываясь на информации, имеющейся в момент времени t. Из уравнений
(7)−(10) можно получить xˆt +1|t , а также оптимальные оценки для моментов
t+2,…, t+N:
xˆt+i+1|t = At + i xˆt+i|t + Bt + i ut+i|t , x̂1|0 = x0 , i = 1, N − 1 ;
(11)
yˆt+i|t = Gt + i xˆt+i|t , i = 1, N .
(12)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Ю. Приступа, В.И. Смагин
16
Здесь обозначение ut+i|t используется для того, чтобы отличать действующее
управление в момент t+i ut+i от тех, которые используются с целью прогнозирования − ut+i|t.
Управляющие воздействия, используемые с целью прогнозирования, ищутся
на горизонте управления М, а прогнозирование состояния объекта проводится на
большем промежутке N ( M ≤ N ). Для расчета xˆt+M + 2|t ,…, xˆt+N|t в (11) в качестве ut+M +1|t ,…, ut+N −1|t используется ut+M |t и держится на достигнутом постоянном уровне.
Уравнение (11) может быть записано через начальное состояние xˆt+1|t и будущие управляющие воздействия ut+i|t следующим образом:
xˆt+ 2|t = At +1 xˆt+1|t + Bt +1ut+1|t ,
xˆt + 3|t = At + 2 xˆt + 2|t + Bt + 2 ut + 2|t = At + 2 ( At +1 xˆt +1|t + Bt +1ut +1|t ) + Bt + 2 ut + 2|t =
= At + 2 At +1 xˆt +1|t + At + 2 Bt +1ut +1|t + Bt + 2 ut + 2|t ,
............................
i −1 k −1
⎛ i −1
⎞
⎛
⎞
xˆt + i|t = ⎜ ∏ At + i − k ⎟ xˆt +1|t + ∑ ⎜ ∏ At + i −l ⎟ Bt + i − k ut + i − k |t , i = 2, N .
⎝ k =1
⎠
⎠
k =1 ⎝ l =1
(13)
Аналогично может быть преобразовано уравнение (12):
yˆt+1|t = Gt +1 xˆt+1|t ,
yˆt + 2|t = Gt + 2 xˆt + 2|t = Gt + 2 ( At +1 xˆt +1|t + Bt +1ut +1|t ) = Gt + 2 At +1 xˆt +1|t + Gt + 2 Bt +1ut +1|t ,
yˆt + 3|t = Gt + 3 xˆt + 3|t = Gt + 3 ( At + 2 At +1 xˆt +1|t + At + 2 Bt +1ut +1|t + Bt + 2 ut + 2|t ) =
= Gt + 3 At + 2 At +1 xˆt +1|t + Gt + 3 At + 2 Bt +1ut +1|t + Gt + 3 Bt + 2 ut + 2|t = ,
............................
i −1
i −1
⎛
⎞
⎛ k −1
⎞
yˆt + i|t = Gt + i ⎜ ∏ At + i − k ⎟ xˆt +1|t + ∑ Gt + i ⎜ ∏ At + i −l ⎟ Bt + i − k ut + i − k |t , i = 2, N .
⎝ k =1
⎠
⎝ l =1
⎠
k =1
(14)
Уравнения для прогнозируемых векторов состояния и выхода могут быть
представлены в векторно-матричном виде. Для этого введем следующие обозначения:
⎡ xˆt +1|t ⎤
⎡ yˆt +1|t ⎤
⎡ ut +1|t ⎤
⎢
⎥
⎥, U =⎢
⎥,
Xˆ t =
, Yˆt = ⎢
t
⎢
⎥
⎢
⎥
⎢
⎥
⎢⎣ xˆt + N |t ⎥⎦
⎢⎣ yˆt + N |t ⎥⎦
⎢⎣ut + M |t ⎥⎦
En
Gt +1
⎡
⎤
⎡
⎤
⎢ At +1 ⎥
⎢ Gt + 2 At +1
⎥
⎢
⎥
⎢
⎥
A
A
G
A
A
t + 3 t + 2 t +1 ⎥
t + 2 t +1 ⎥
, Λt = ⎢
.
Ψt = ⎢
⎢
⎥
⎢
⎥
⎢ N −1
⎥
⎢
⎥
N −1
⎢ ∏ At + N − k ⎥
⎢Gt + N ∏ At + N − k ⎥
⎣⎢ k =1
⎦⎥
⎣⎢
⎦⎥
k =1
(15)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прогнозирующее управление выходом нестационарной дискретной системы
17
В случае, когда горизонт управления не равен горизонту прогнозирования
( M < N ), матрицы Ρt и Φ t вводятся следующим образом:
0
0
⎡
⎢
Bt +1
0
⎢
⎢
At +2 Bt +1
Bt +2
⎢
⎢
⎢⎛ M −1
⎞
⎛ M −2
⎞
⎢⎜ ∏ At +M −k +1 ⎟ Bt +1 ⎜ ∏ At +M −k +1 ⎟ Bt +2
⎠
⎝ k =1
⎠
Ρt = ⎢⎝ k =1
⎢ M
M −1
⎞
⎛
⎞
⎢⎛ A
B
A
B
⎢⎜ ∏ t +M −k +2 ⎟ t +1 ⎜ ∏ t +M −k +1 ⎟ t +2
⎝
⎠
⎝
⎠
k =1
k =1
⎢
⎢
⎢ N −2
⎞
⎛ N −3
⎞
⎢⎛
A
B
⎜
⎟
⎜ ∏ At + N −k ⎟ Bt +2
∏
+
−
+
1
t
N
k
t
⎢
⎠
⎝ k =1
⎠
⎣ ⎝ k =1
0
0
⎡
⎢
Gt +2 Bt +1
0
⎢
⎢
Gt +3 At +2 Bt +1
Gt +3 Bt +2
⎢
⎢
⎢
⎛ M −1
⎞
⎛ M −2
⎞
⎢Gt +M +1⎜ ∏ At +M −k ⎟ Bt +1 Gt +M +1⎜ ∏ At +M −k ⎟ Bt +2
⎝ k =1
⎠
⎝ k =1
⎠
Φt = ⎢
⎢
M
M −1
⎛
⎞
⎛
⎞
⎢G
A
B G
A
B
⎢ t +M +2 ⎜ ∏ t +M −k ⎟ t +1 t +M +2 ⎜ ∏ t +M −k ⎟ t +2
⎝
⎠
⎝
⎠
k =1
k =1
⎢
⎢
⎢
⎛ N −2
⎞
⎛ N −3
⎞
⎢
B
G
G
A
⎜
⎟
⎜
∏
∏ At+ N −k ⎟ Bt+2
t
t
N
+
1
+
t
+
N
t
+
N
−
k
⎢
⎝ k =1
⎠
⎝ k =1
⎠
⎣
0
0
⎤
⎥
⎥
⎥
⎥
0
⎥
⎥
⎥
Bt + M
⎥,
⎥
⎥
At +M +1Bt + M
⎥
⎥
⎥
⎥
p
N
M
−
−
1
⎛
⎞
⎥
⎜⎜ ∑ ∏ At + N −k ⎟⎟ Bt +M ⎥
⎝ p k =1
⎠
⎦
0
0
⎤
⎥
⎥
⎥
⎥
0
⎥
⎥
⎥
Gt + M +1Bt + M
⎥.
⎥
⎥
Gt + M +2 At + M +1Bt + M
⎥
⎥
⎥
⎥
p
N
M
−
−
1
⎛
⎞
⎥
Gt + N ⎜ ∑ ∏ At + N −k ⎟ Bt + M ⎥
⎜
⎟
p
=
1
k
=
1
⎝
⎠
⎦
(16)
В случае равенства горизонта управления горизонту прогнозирования
( M = N ) в качестве Ρt и Φ t берутся матрицы следующего вида:
0
0
⎡
⎢
Bt +1
0
⎢
A
B
B
t + 2 t +1
t +2
Ρt = ⎢
⎢
⎢⎛ N − 2
⎞
⎛ N −3
⎞
⎢⎜ ∏ At + N − k ⎟ Bt +1 ⎜ ∏ At + N − k ⎟ Bt + 2
⎢ k =1
⎣⎝
⎠
⎝ k =1
⎠
0
0
0
0
0
⎡
⎢
Gt + 2 Bt +1
0
⎢
G
A
B
G
t + 3 t + 2 t +1
t + 3 Bt + 2
Φt = ⎢
⎢
⎢
⎛ N −2
⎞
⎛ N −3
⎞
⎢Gt + N ⎜ ∏ At + N − k ⎟ Bt +1 Gt + N ⎜ ∏ At + N − k ⎟ Bt + 2
⎢⎣
⎝ k =1
⎠
⎝ k =1
⎠
Bt + N −1
0⎤
0⎥
⎥
0⎥
,
⎥
⎥
0⎥
⎦⎥
0
0
0
Gt + N Bt + N −1
0⎤
0⎥
⎥
0⎥
.(17)
⎥
⎥
0⎥
⎦⎥
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Ю. Приступа, В.И. Смагин
18
Таким образом, прогнозирующая модель опишется следующей системой:
Xˆ t = Ψ t xˆt+1|t + ΡtU t ;
(18)
Yˆt = Λ t xˆt+1|t + Φ tU t .
(19)
Ограничение (6) может быть также преобразовано в векторно-матричном виде:
⎡ a1 (t + 1) ⎤ ⎡ Sut +1|t ⎤ ⎡ a2 (t + 1) ⎤
⎥≤⎢
⎢
⎥≤⎢
⎥.
(20)
⎥ ⎢
⎢
⎥ ⎢
⎥
⎣ a1 (t + N ) ⎦ ⎢⎣ Sut + M |t ⎥⎦ ⎣ a2 (t + N ) ⎦
Введем обозначения:
⎡ a1 (t + 1) ⎤
⎡ a2 (t + 1) ⎤
⎥ , a2 (t ) = ⎢
⎥ , S = diag( S ,… , S ) .
a1 (t ) = ⎢
⎢
⎥
⎢
⎥
M
⎣ a1 (t + N ) ⎦
⎣ a2 (t + N ) ⎦
Тогда ограничения (20) для прогнозирующей модели (18)–(19) запишется следующим образом:
a1 (t ) ≤ S U t ≤ a2 (t ) .
(21)
3. Синтез прогнозирующего управления
В качестве целевой функции выберем критерий следующего вида:
J ( xˆt +1|t , U t ) =
1 N
∑ yˆt + k |t − yt + k
2 k =1
2
Ct
+
1 M
∑ ut + k |t − ut + k −1|t
2 k =1
2
Dt
,
(22)
где yt + k – вектор значений отслеживаемого сигнала в момент времени t + k , Ct и
Dt – симметричные положительно определенные матрицы.
Отметим, что критерий (22) является классическим в задачах синтеза прогнозирующего управления [1, 2]. Квадратичная форма
yˆt − yt
2
Ct
= ( yˆt − yt )Τ Ct ( yˆt − yt )
обеспечивает механизм, допускающий взвешивания выходов.
Аналогично расписывается квадратичная форма ut + k |t − ut + k −1|t
ut + k |t − ut + k −1|t
2
Dt
2
Dt
:
= (ut + k |t − ut + k −1|t )Τ Dt (ut + k |t − ut + k −1|t ) ,
что предусматривает штрафы для управлений.
В случае, когда желаемая отслеживаемая траектория yt + k не известна для
k ≥ 0, целесообразно считать yt + k = yt , то есть предполагать, что заданный уровень держится на протяжении всего времени управления постоянным.
Введем вектор Yt :
⎡ yt +1 ⎤
⎥.
Yt = ⎢
⎢
⎥
⎣ yt + N ⎦
(23)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прогнозирующее управление выходом нестационарной дискретной системы
19
Тогда первое слагаемое в (22) преобразуется следующим образом:
1 N
∑ yˆt + k |t − yt + k
2 k =1
2
Ct
=
1 ˆ
Yt − Yt
2
2
Ct
=
1
= U tΤ Φ tΤ Ct Φ tU t + U tΤ ⎡⎣Φ tΤ Ct Λ t xˆt +1|t − Φ tΤ Ct Yt ⎤⎦ + α1t .
2
(24)
Здесь α1t – постоянная составляющая, которая не зависит от Ut и xˆt +1|t , а Ct имеет
вид
⎡Ct
⎢0
Ct = ⎢
⎢
⎣⎢ 0
0
Ct
0⎤
0⎥
⎥.
⎥
Ct ⎦⎥
0
(25)
Вторая часть критерия (22) может быть преобразована следующим образом:
M
∑ ut + k |t − ut + k −1|t
k =1
= ut +1|t − ut |t
2
Dt
+ ut + 2|t − ut +1|t
2
Dt
2
Dt
=
+ … + ut + M |t − ut + M −1|t
2
Dt
=
= utΤ+1|t Dt ut +1|t − 2utΤ+1|t Dt ut + utΤ Dt ut +
+utΤ+ 2|t Dt ut + 2|t − utΤ+ 2|t Dt ut +1|t + utΤ+1|t Dt ut +1|t − utΤ+1|t Dt ut + 2|t +
+utΤ+ 3|t Dt ut + 3|t − utΤ+ 3|t Dt ut + 2|t + utΤ+ 2|t Dt ut + 2|t − utΤ+ 2|t Dt ut + 3|t +
..............................
+utΤ+ M |t Dt ut + M |t
− utΤ+ M |t Dt ut + M −1|t + utΤ+ M −1|t Dt ut + M −1|t − utΤ+ M −1|t Dt ut + M |t .
Путем группировки слагаемых полученное выражение может быть записано в
виде
M
∑ ut + k |t − ut + k −1|t
k =1
2
Dt
= utΤ Dt ut − 2utΤ+1|t Dt ut +
+2utΤ+1|t Dt ut +1|t − utΤ+1|t Dt ut + 2|t −
−utΤ+ 2|t Dt ut +1|t + 2utΤ+ 2|t Dt ut + 2|t − utΤ+ 2|t Dt ut + 3|t +
..............................
−utΤ+ M −1|t Dt ut + M − 2|t
+ 2utΤ+ M −1|t Dt ut + M −1|t − utΤ+ M −1|t Dt ut +M |t −
−utΤ+ M −1|t Dt ut + M |t + 2utΤ+ M |t Dt ut + M |t .
В векторно-матричном виде второе слагаемое квадратичной функции может
быть записано так:
1 M
∑ ut + k |t − ut + k −1|t
2 k =1
2
Dt
1
= U tΤ DtU t − utΤ+1|t Dt ut + α t2 ,
2
(26)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
20
М.Ю. Приступа, В.И. Смагин
где αt2 – постоянная, не зависящая от ut + k |t (k = 1, M ); Dt – блочная матрица вида
⎡ 2 Dt
⎢ − Dt
⎢
Dt = ⎢
⎢ 0
⎢ 0
⎣
− Dt
2 Dt
0
− Dt
0 ⎤
0 ⎥
⎥
(27)
⎥.
− Dt 2 Dt − Dt ⎥
0
− Dt 2 Dt ⎥⎦
Таким образом, с учетом сделанных преобразований целевая функция запишется следующим образом:
1
J ( xˆt +1|t , U t ) = U tΤ FtU t + U tΤ ft + α t ,
(28)
2
где αt есть линейная комбинация α1t и αt2 ,
⎡ Dt ut ⎤
ˆ
x
⎡ t +1|t ⎤ ⎢ 0 ⎥
Τ
Τ
Ft = Φ tΤ Ct Φ t + Dt , ft = Γt ⎢
(29)
⎥ , Γt = ⎡⎣Φ t Ct Λ t −Φ t Ct ⎤⎦ .
⎥−⎢
Y
⎣ t ⎦ ⎢
⎥
⎢⎣ 0 ⎥⎦
Аналитическое решение данной задачи без учета ограничений можно получить из условия
∂J ( xˆt +1|t , U t )
=0
(30)
∂U t
с использованием формул векторно-матричного дифференцирования [12]
y Τ Ay = trAyy Τ ,
dtrAXB
dtrAX Τ B
= ATBT,
= BA.
dX
dX
(31)
В результате получится:
Τ
Τ
∂J ( xˆt +1|t , U t )
∂ ⎡1 Τ
⎤ = 1 ∂ (trFtU tU t ) + ∂ (U t ft ) =
Τ
=
U
F
U
+
U
f
+
c
t t t
t t
t⎥
∂U t
∂U t ⎢⎣ 2
∂U t
∂U t
⎦ 2
1 T
⎡ Ft U t + FtU t ⎤⎦ + ft = 0 .
2⎣
В силу симметричности матрицы Ft уравнение (32) перепишется в виде
=
(32)
FtU t + ft = 0 .
Аналитическое решение этого уравнения имеет вид
⎛ Dt ut ⎞
⎜ 0 ⎟
U t* = − Ft −1 ft = −(Φ tΤ Ct Φ t + Dt ) −1 (Φ tΤ Ct Λ t xˆt +1|t − Φ tΤ Ct Yt ) − ⎜
(33)
⎟,
⎜⎜
⎟⎟
⎝ 0 ⎠
следовательно, оптимальное прогнозирующее управление записывается в следующем виде:
ut*+1|t = ( En
0
0)U t* .
(34)
Учет ограничения (20) может быть выполнен численно, например, используя
для оптимизации (28) процедуру quadprog системы Matlab.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прогнозирующее управление выходом нестационарной дискретной системы
21
4. Моделирование
В данном разделе приведен пример синтеза управления нестационарным объектом второго порядка с прогнозирующей моделью на основе слежения за выходом:
0,85 + 0, 05sin(0,8t )
0 ⎤
0,15 ⎤
0
xt +1 = ⎡⎢
x +⎡
u , x =⎡ ⎤;
(35)
0,8
0,95⎦⎥ t ⎣⎢0, 25⎦⎥ t 0 ⎣⎢ 0 ⎦⎥
⎣
1 0⎤
ψ t = ⎡⎢
xt + vt ;
⎣0 1 ⎥⎦
(36)
yt = [1 0] xt ,
(37)
где xt ∈ R 2 – вектор состояния, ut ∈ R1 – управление, ψ t ∈ R 2 – вектор наблюдений, yt ∈ R1 – вектор выхода, шумы измерения vt являются гауссовскими величинами с нулевым средним и ковариационной матрицей
0, 0005
0 ⎤
.
V = ⎡⎢
0, 0005⎥⎦
⎣ 0
В данном примере ограничения на управление представлены следующими неравенствами:
−0,5 ≤ ut ≤ 0,5 .
(38)
Моделирование проведено на временном промежутке в 100 единиц в предположении равенства горизонтов управления и прогнозирования ( M = N = 10 ).
Цель моделирования – определить такую последовательность управления, при
которой будет отслеживаться следующая траектория:
⎧ 0,3 при t ≠ 31, 70;
y1,t = ⎨
(39)
⎩−0,3 при t = 31, 70
В качестве весовых коэффициентов выхода объекта и управления (в данном
случае используются именно коэффициенты, а не матрицы, поскольку размерности векторов выхода yt и управления ut равны единице, то есть
dim( yt ) = dim(ut ) = 1 ) использованы Ct = Dt = 1 .
На рис. 1 представлена динамика поведения первой (отслеживаемой) компоненты вектора состояния.
x1,t
0,2
1
2
0
yt
–0,2
–0,4
0
20
40
60
80
t
Рис. 1. Динамика первой компоненты состояния:
1 – заданная траектория (желаемая), 2 – первая компонента состояния
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Ю. Приступа, В.И. Смагин
22
На рис. 2 приведен график управляющих воздействий на объект.
ut
umax
1
0,5
2
0
–0,5
1
umin
–1
0
20
40
60
80
t
Рис. 2. Динамика управления объектом:
1 – ограничения на управление, 2 – управление
Из рис. 1 видно, что желаемая траектория отслеживается, при этом ограничения на управление соблюдаются (рис. 2).
Заключение
Разработаны алгоритмы синтеза прогнозирующего управления выходом дискретных нестационарных объектов со случайными возмущениями в условиях косвенных наблюдений за состоянием при ограничениях на управляющие воздействия.
ЛИТЕРАТУРА
1. Camacho E.F., Bordons C. Model predictive control. London: Springer-Verlag, 2004. 405 p.
2. Maciejowski J.M. Predictive control with constraints. Prentice Hall, 2002. 331 p.
3. Перепелкин Е.А. Прогнозирующее управление экономической системой производства,
хранения и поставок товара потребителям // Экономика и математические методы.
2004. Т. 40. № 1. С. 125−128
4. Домбровский В.В., Домбровский Д.В., Ляшенко Е.А. Управление с прогнозирующей моделью системами со случайными зависимыми параметрами при ограничениях и применение к оптимизации инвестиционного портфеля // Автоматика и телемеханика.
2006. № 12. C. 71–85.
5. Смагин В.И., Смагин С.В. Управление запасами по двум критериям с учетом ограничений // Вестник Томского государственного университета. 2006. № 290. С. 244−246.
6. Смагин В.И., Смагин С.В. Адаптивное управление запасами с учетом ограничений и
транспортных запаздываний // Вестник Томского государственного университета.
Управление, вычислительная техника и информатика. № 3(4). 2008. С. 19−26.
7. Киселева М.Ю., Смагин В.И. Управление производством, хранением и поставками товаров на основе прогнозирующей модели выхода системы // Вестник Томского государственного университета. Управление, вычислительная техника и информатика.
2009. № 2(7). С. 24–31.
8. Приступа М.Ю., Смагин В.И. Прогнозирующее управление дискретными системами с
неизвестным входом и его применение к задаче управления экономическим объектом //
Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 1(18). С. 5–15.
9. Киселева М.Ю., Смагин В.И. Управление с прогнозирующей моделью с учетом запаздывания по управлению // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 2(11). С. 5–12.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прогнозирующее управление выходом нестационарной дискретной системы
23
10. Kiseleva M.Y., Smagin V.I. Model predictive control of discrete systems with state and input
delays // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 1(14). С. 5–12.
11. Kalman R.E., Busy R. A new results in linear filtering and prediction theory // Trans. ASME
J. Basic Engr. 1961. V. 83. P. 95–108.
12. Амосов А.А., Колпаков В.В. Скалярно-матричное дифференцирование и его применение
к конструктивным задачам теории связи // Проблемы передачи информации. 1972. № 1.
С. 3–15.
Приступа Марина Юрьевна
ООО «Битворкс» (г. Томск)
Смагин Валерий Иванович
Томский государственный университет
E-mail: kiselevamy@gmail.com; vsm@mail.tsu.ru
Поступила в редакцию 25 февраля 2013 г.
Pristupa Marina Yu., Smagin Valery I. (Bitworks software company, Tomsk State University).
Model predictive control of the output time-varying discrete systems with constraints on the
control.
Keywords: discrete time-dependent systems, model predictive control, output control.
The problem of synthesis of predictive control, built on the basis of monitoring the output of
the system for non-stationary linear object within the constraints on the control is considered.
Forecasting is based on the calculation of time-dependent state estimates of the object using
Kalman extrapolation and estimates of an unknown input.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
УДК 537.874.6
А.Г. Дмитренко, Р.И. Уринов
МОДЕЛИРОВАНИЕ ЭЛЕКТРОМАГНИТНОГО РАССЕИВАНИЯ
НА ТРЕХ ИМПЕДАНСНЫХ ТЕЛАХ1
Метод дискретных вспомогательных источников использован для моделирования в резонансной частотной области электромагнитного рассеяния на
трех импедансных телах. Приведены некоторые результаты моделирования,
касающиеся влияния величины и типа поверхностного импеданса на сечения
рассеяния одной из возможных структур, состоящих из трех эллипсоидов.
Ключевые слова: электромагнитное рассеяние, импедансное тело, метод
дискретных источников, сечение рассеяния.
Изучение электромагнитных полей, рассеянных структурами, состоящими из
нескольких тел, размеры которых сравнимы с длиной волны падающего на структуру поля, имеет большое значение для решения ряда практически важных проблем, например таких, как радиолокационная заметность, идентификация объектов, электромагнитная совместимость и др. Особый интерес представляет случай,
когда расстояние между телами структуры много меньше длины волны.
Корректная (с учётом электромагнитного взаимодействия тел) постановка исследований подобного рода приводит к необходимости решения граничных задач
теории рассеяния на системах тел. Для задач рассматриваемого класса речь идёт о
нахождении решений уравнений Максвелла, удовлетворяющих заданным граничным условиям на поверхностях тел и условиям излучения на бесконечности.
В подавляющем большинстве случаев получить аналитическое решение таких задач не удаётся, поэтому используются различные численные методы. Например, в
[1] для решения задачи электромагнитного рассеяния на двух и трёх диэлектрических сферах использован метод граничных элементов, а в [2] для решения подобной задачи использован метод интегральных уравнений.
В последние годы применительно к решению задач электромагнитного рассеяния (в том числе и на группах тел) существенно развит метод дискретных источников. В этом методе неизвестное поле в рассматриваемой области и на её
границах представляют в виде конечной линейной комбинации полей некоторой
системы источников, размещённых вне этой области. Такая конструкция удовлетворяет системе уравнений Максвелла и условиям излучения (где это необходимо). Коэффициенты линейной комбинации определяются путём удовлетворения
граничным условиям на поверхностях рассеивателей. В силу своей идейной про1
Работа выполнена в рамках государственного задания Минобрнауки РФ на проведение научных исследований в Томском государственном университете на 2012-2014 годы, задание 8.4055.2011.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование электромагнитного рассеивания на трех импедансных телах
25
стоты метод удобен в качестве основы для построения решений задач электромагнитного рассеяния как на одиночных телах, так и на системах тел. В частности, в работе [3] предложен вариант метода дискретных источников для численного решения задач электромагнитного рассеяния на структурах, составленных из
конечного числа трёхмерных импедансных тел, ограниченных гладкими поверхностями произвольной формы.
В данной работе предложенный ранее в [3] вариант метода дискретных источников использован для моделирования электромагнитного рассеяния на трех
трехмерных импедансных телах. Приведены некоторые результаты моделирования, касающиеся влияния величины и типа поверхностного импеданса на сечения
рассеяния одной из возможных структур, состоящих из трех эллипсоидов.
1. Формулировка задачи
Геометрия структуры показана на рис. 1. Будем рассматривать стационарную
(зависимость от времени выбрана в виде exp(−iωt ) ) задачу дифракции электромагнитного поля {E0 , H 0 } на структуре, состоящей из трех непересекающихся
импедансных тел Dq , ограниченных гладкими поверхностями Sq (q = 1, 2,3) .
Структура размещена в однородной среде De с диэлектрической и магнитной
проницаемостями εe и μe в декартовой системе координат Oxyz . Требуется найти рассеянное поле {Ee , H e } в области De .
Рис. 1. Геометрия задачи
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Г. Дмитренко, Р.И. Уринов
26
Математическая постановка задачи имеет вид
∇ × Ee = iωμe H e , ∇ × H e = −iωε e Ee
в De ;
(1)
nq × Ee − Z q (nq × (nq × H e )) = − nq × E0 + Z q (nq × (nq × H 0 )) на Sq , q = 1, 2,3 ; (2)
{ εe Ee ; μe H e } × R / R + { μ e H e ; − εe Ee } = O( R −1 ), R → ∞,
(3)
1
где nq – единичные векторы нормалей к поверхностям Sq; R = ( x 2 + y 2 + z 2 ) 2 ;
a × b – векторное произведение, Zq – поверхностный импеданс соответствующего
тела, Re Z q ≥ 0 (q = 1, 2,3) .
2. Модель рассеянного поля
Модель рассеянного поля строится следующим образом. Введем (см. рис. 1)
внутри каждого из рассеивателей Dq вспомогательную поверхность Se, q = K e,q S q ,
подобную поверхности рассеивателя Sq в смысле гомотетии с центром в точке Oq.
Если поверхность Sq является центральной, центр гомотетии выбираем так, чтобы
он совпадал с центром поверхности. Коэффициенты гомотетии (подобия) K e, q
характеризуют удаление вспомогательных поверхностей от поверхностей соответствующих тел, их значения лежат в интервале 0 < K e, q < 1 (при
K e,q = 0 вспомогательная поверхность стягивается в точку, при K e, q = 1 она совпадает с поверхностью соответствующего тела).
Выберем на каждой из вспомогательных поверхностей Se, q конечную совоN
купность точек {M n, q }n =q1 и в каждой точке M n, q разместим пару независимых
вспомогательных
pτn, q
1
=
pτn, q eτn, q ,
1
1
элементарных
pτn, q
2
=
pτn, q eτn, q ,
2
2
электрических
диполей
с
моментами
q = 1, 2,3 , ориентированными вдоль единичных на-
правлений eτn, q , eτn, q , выбранных в плоскости, касательной к Se, q в точке M n, q , и
1
2
излучающих в однородную среду с параметрами εe и μe . Представим неизвестное рассеянное поле {Ee , H e } в De в виде суммы полей введенных вспомогательных диполей
3 Nq
3 Nq
q =1 n =1
q =1 n =1
Ee ( M ) = (i / ωεe )∑∑ ∇ × (∇ × Π n, q ), H e ( M ) =∑∑ ∇ × Π n, q ,
Π n, q = Ψ e ( M , M n,q ) pτn, q , Ψ e ( M , M n, q ) = exp(ike RMM n , q ) /(4πRMM n , q ),
(4)
pτn,q = pτn, q eτn,q + pτn, q eτn,q , M ∈ De .
1
1
2
2
Здесь ke = ω εe μe – волновое число в среде De ; RMM n , q – расстояние от точки
M n, q на Se, q до точки M в De ; Ψ e ( M , M n, q ) – фундаментальное решение урав-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование электромагнитного рассеивания на трех импедансных телах
27
нения Гельмгольца в области De ; pτn, q , pτn, q (q = 1, 2,3, n = 1, N q ) – неизвестные
1
2
комплексные постоянные (дипольные моменты); Nq – число точек размещения
диполей на вспомогательной поверхности Se, q .
Поле (4) удовлетворяет уравнениям Максвелла (1) и условиям излучения (3)
в области De . Для того чтобы удовлетворить граничным условиям (2), необходимо соответствующим образом выбрать значения дипольных моментов
pτn, q , pτn, q (q = 1, 2,3, n = 1, N q ) . Используем для этого метод коллокаций. Пусть
1
2
M j ( j = 1, Lq ) – точки коллокации на поверхности Sq; Lq – число точек коллокации
на Sq. Тогда для определения неизвестных pτn, q , pτn, q (q = 1, 2,3, n = 1, N q ) получим
1
2
следующую систему линейных алгебраических уравнений с комплексной матрицей размером 2( L1 + L2 + L3 ) × 2( N1 + N 2 + N3 ) :
nqj × Eej,q − Z q (nqj × (nqj × H ej, q ×)) =
= − nqj × E0,j q + Z q (nqj × (nqj × H 0,j q ×)), q = 1, 2,3, j = 1, Lq ,
(5)
где nqj , Eej, q , H ej, q и E0,j q , H 0,j q – значения векторов нормали и компонент рассеянного (4) и возбуждающего полей в точке j на поверхности тела с номером q. Решение системы (5) определяем путём минимизации функции
3 Lq
Φ = ∑∑ | nqj × ( Eej, q + E0,j q ) − Z q (nqj × (nqj × ( H ej, q + H 0,j q ))) |2 .
(6)
q =1 j =1
После решения задачи минимизации (определения неизвестных дипольных
моментов pτn, q , pτn, q (q = 1, 2,3, n = 1, N q ) ) необходимые характеристики рассеянно1
2
го поля определяем из (4). В частности, для компонент рассеянного поля в дальней зоне имеем
Ee,θ ( M ) = (μe / εe )1/ 2 H e,ϕ ( M ) = (exp(ike R ) / ke R) Dθ (θ, ϕ) + O( R −2 ) ,
Ee,ϕ ( M ) = −(μe / εe )1/ 2 H e,θ ( M ) = (exp(ike R ) / ke R) Dϕ (θ, ϕ) + O( R −2 ) ,
(7)
где компоненты диаграммы рассеяния Dθ (θ, ϕ) и Dϕ (θ, ϕ) определены выражениями
3 Nq
Dθ (θ, ϕ) = (iωke μe / 4π)∑∑ Gnq (θ, ϕ)[(cos θ cos ϕ cos α1n, q + cos θ sin ϕ cos β1n, q −
q =1 n =1
− sin θ cos γ1n, q ) pτn, q
1
+ (cos θ cos ϕ cos α1n, q + cos θ sin ϕ cos β1n, q − sin θ cos γ1n, q ) pτn, q ],
1
Dϕ (θ, ϕ) =
i ωk e μ e
4π
3 Nq
∑∑ Gnq (θ, ϕ) ×
q =1 n =1
×[(cos ϕ cos β1n, q − sin ϕ cos α1n, q ) pτn, q + (cos ϕ cos βn2,q − sin ϕ cos α n2,q ) pτn,q ] ,
1
Gnq (θ, ϕ) = exp{−ike (sin θ cos ϕxn,q + sin θ sin ϕyn, q + cos θzn,, q )},
2
(8)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
28
А.Г. Дмитренко, Р.И. Уринов
в которых cos α1n, q , cos β1n, q , cos γ1n, q и cos α n2, q , cos β2n, q , cos γ 2n, q – направляющие косинусы единичных векторов eτn, q и eτn, q ; xn, q , yn,q , zn,q – декартовы координаты
1
2
точки M n, q ; θ и ϕ – общепринятые угловые сферические координаты точки наблюдения M.
Контроль точности модели (4) осуществляем путём вычисления относительного значения функции (6) на сетке точек, промежуточных по отношению к точкам
коллокации, выбираемых на поверхностях Sq всех тел, входящих в систему:
3 Lq′
∆ = (Φ ′ / Φ 0 )1/ 2 , Φ 0 = ∑∑ | nqj × E0,j q − Z q (nqj × (nqj × H 0,j q )) |2 ,
(9)
q =1 j =1
где Φ ′ – значение функции (6) на указанной выше совокупности точек; Φ 0 – значение соответствующей нормы падающего поля на этой же совокупности точек;
Lq′ – число промежуточных точек на поверхности рассеивателя с номером q .
3. Численные результаты
На основании изложенной выше модели создана программа для расчёта компонент рассеянного поля и контроля точности полученного решения. Предполагается, что тела, образующие рассеивающую структуру, являются трёхосными эллипсоидами. Входными величинами программы являются координаты центров
эллипсоидов и ориентация осей эллипсоидов в глобальной системе координат, величины полуосей (в длинах волн), значения нормированных импедансов эллипсоидов Z q′ ( Z q′ = Z q /(μe / εe )1/ 2 ) , возбуждающее поле {E0 , H 0 } , параметры подобия K e, q , числа точек размещения диполей Nq и точек коллокации Lq для каждого
из эллипсоидов, образующих исследуемую структуру.
Координаты точек размещения вспомогательных диполей и точек коллокации,
а также направляющие косинусы касательных направлений, вдоль которых ориентируются диполи и ставятся граничные условия, первоначально вычисляются в
локальной системе координат, связанной с соответствующим эллипсоидом, а затем осуществляется пересчёт этих величин для глобальной системы отсчёта.
Минимизацию функции (6) осуществляем методом сопряжённых градиентов;
итерационный процесс останавливается при условии, если относительное изменение функции на каждой из десяти последних итераций не превышает 0,001. При
помощи данной программы выполнена серия вычислительных экспериментов,
направленных на изучение влияния величины и типа поверхностного импеданса
на сечения рассеяния различных структур. Ниже представлены результаты для
одной из исследованных структур.
Структура состоит из трех эллипсоидов. Центр первого эллипсоида совмещён
с началом декартовой системы координат, центр второго эллипсоида размещен в
точке с координатами (3,628, 0, 0) , а центр третьего – в точке с координатами
(−3, 628, 0, 0) , т.е. центры второго и третьего эллипсоидов расположены на оси
x симметрично относительно центра первого эллипсоида. Полуоси эллипсоидов
ke a, ke b, ke c ориентированы вдоль осей x, y, z соответственно и принимают значения ke a1 = 1, 0, ke b1 = 1,5, ke c1 = 2, 0 для первого эллипсоида и ke a2 = ke a3 = 2, 0,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование электромагнитного рассеивания на трех импедансных телах
29
ke b2 = ke b3 = 1,5, ke c2 = ke c3 = 1, 0 для второго и третьего. Легко видеть, что наименьшее расстояние ∆l между точками поверхностей эллипсоидов равно 0,1λ ,
где λ – длина волны возбуждающего поля. Эллипсоид, с которым связана система координат, считается идеально проводящим ( Z ′ = 0) , второй и третий эллипсоиды предполагаются импедансными. В качестве возбуждающего поля выбрана
линейно поляризованная плоская волна. Предполагается, что волна падает на
структуру таким образом, что вектор ke лежит в плоскости xz и образует с осью
z угол ψ .
Рис. 2. Исследованная структура
При решении задачи параметры метода для каждого эллипсоида выбраны одинаковыми: K e,1 = K e,2 = K e,3 = 0, 6, N1 = N 2 = N 3 = 168, L1 = L2 = L3 = 336 . В локальных системах координат с центрами в центрах эллипсоидов точки размещения диполей и точки коллокации распределены следующим образом. В каждом из
четырнадцати полусечений ϕ = const , отстоящих друг от друга на угловое расстояние ∆ϕ = 25, 7 , равномерно по углу θ выбраны двенадцать точек размещения диполей. Для точек коллокации алгоритм их расположения по углу θ выбран
таким же, как и для точек размещения диполей, но выбирают их как в полусечениях ϕ = const , определённых для точек размещения диполей, так и посередине
между ними.
На рис. 3, 4 представлены бистатические сечения рассеяния в E -плоскости
описанной выше структуры, возбуждаемой плоской волной, падающей под углом
ψ = 0 , при различных значениях нормированного поверхностного импеданса
второго и третьего эллипсоидов. E -плоскость – это плоскость, в которой лежат
векторы E0 и ke возбуждающей волны; в сферической системе координат эта
плоскость состоит из двух полуплоскостей: ϕ = 0 и ϕ = 180 . По оси абсцисс отложено значение угла θ в градусах, по оси ординат – значение сечения рассеяния
σ(θ, ϕ) = lim 4πR 2 [| Ee,θ (θ, ϕ) |2 + | Ee,ϕ (θ, ϕ) |2 ] / | E0 |2 ,
R →∞
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Г. Дмитренко, Р.И. Уринов
30
нормированное на квадрат длины волны и выраженное в децибелах. В выбранной
форме представления результатов направлению прямого рассеяния соответствует
угол θ = 0 , направлению обратного рассеяния – угол θ = 180 .
σ/λ2, дБ
ϕ = 0°
1 2
ϕ = 180°
0
–10
3 4
–20
–30
–40
150
100
50
0
50
100
θ, град
Рис. 3. Бистатические сечения рассеяния в E -плоскости при различных
значениях нормированного комплексного индуктивного импеданса второго и третьего эллипсоидов
σ/λ2, дБ
ϕ = 0°
3
4
0
ϕ = 180°
–10
2
1
–20
–30
150
100
50
0
50
100
θ, град
Рис. 4. Бистатические сечения рассеяния в E -плоскости при различных
значениях нормированного реактивного емкостного импеданса второго и
третьего эллипсоидов
Рис. 3 относится к случаю, когда второй и третий эллипсоиды характеризуются комплексным индуктивным импедансом (величина реальной части импеданса
определяет поглощение электромагнитной энергии рассеивателем). Кривая 1 – это
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование электромагнитного рассеивания на трех импедансных телах
31
бистатическое сечение рассеяния структуры, в которой второй и третий эллипсоиды также являются идеально проводящими ( Z 2′ = Z 3′ = 0 ), кривые 2−4 – бистатические сечения рассеяния структуры, в которой поверхностные импедансы Z 2′
и Z3′ второго и третьего эллипсоидов равны и соответственно принимают значения 0,1 − 0,1i , 0,3 − 0,3i и 0,5 − 0,5i . Рис. 4 относится к случаю, когда второй и
третий эллипсоиды исследуемой структуры характеризуются реактивным ёмкостным поверхностным импедансом. Кривые 1−4 на этих рисунках – это бистатические сечения рассеяния структуры, в которой поверхностные импедансы Z 2′ и Z3′
второго и третьего эллипсоидов соответственно принимают значения 0, 0,1i, 0,3i и
0,5i.
Рис. 5 и 6 характеризуют зависимость сечения обратного рассеяния σобр рассматриваемой структуры от угла ψ падения плоской волны. Рис. 5 относится к
структуре, в которой импедансы второго и третьего эллипсоидов являются комплексными и индуктивными, а рис. 6 – к структуре, в которой импедансы второго
и третьего эллипсоидов являются чисто реактивными и емкостными. Кривая 1 на
рис. 5 – это сечения обратного рассеяния структуры, в которой все три эллипсоида являются идеально проводящими; кривые 2 и 3 – сечения обратного рассеяния
структуры, в которой нормированные поверхностные импедансы Z 2′ и Z3′ второго и третьего эллипсоидов равны и соответственно принимают значения 0,1 − 0,1i
и 0,5 − 0,5i . Кривая 1 на рис. 6 – это также сечения обратного рассеяния структуры,
в которой все три эллипсоида являются идеально проводящими, а кривые 2 и 3 –
сечения обратного рассеяния этой же структуры, в которой нормированные поверхностные импедансы Z 2′ и Z3′ также равны, но соответственно принимают
значения 0,1i и 0,5i.
σ/λ2, дБ
0
2
1
3
–10
–20
–30
0
50
100
150
ψ, град
Рис. 5. Зависимость сечения обратного рассеяния от угла падения плоской
волны при различных значениях комплексного индуктивного импеданса
второго и третьего эллипсоидов
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Г. Дмитренко, Р.И. Уринов
32
σ/λ2, дБ
2
0
1
–10
3
–20
–30
0
50
100
150
ψ, град
Рис. 6. Зависимость сечения обратного рассеяния от угла падения плоской
волны при различных значениях реактивного емкостного импеданса второго и третьего эллипсоидов
На рис. 5 и 6 по оси абсцисс отложено значение угла падения ψ плоской волны
в градусах, по оси ординат – значение сечения обратного рассеяния, нормированное на квадрат длины волны и выраженное в децибеллах.
Анализ результатов, представленных на рис. 3 − 6, позволяет сделать следующие выводы. Замена в рассматриваемой структуре двух идеально проводящих
рассеивателей на рассеиватели с теми же геометрическими параметрами, но характеризуемые комплексными индуктивными импедансами приводит к уменьшению сечения обратного рассеяния при любых рассмотренных углах падения плоской волны. Например, при падении плоской волны нормально линии, на которой
расположены центры тел структуры, сечение обратного рассеяния уменьшается
на 10 дБ. Этого нельзя сказать для ситуации, когда те же рассеиватели характеризуются чисто реактивными емкостными импедансами. В этом случае (см. рис. 6)
для ряда углов падения волны имеет место увеличение сечения обратного рассеяния, а при падении волны нормально линии, на которой расположены центры тел
структуры, сечение обратного рассеяния изменяется не более чем на 1 дБ.
Заключение
Таким образом, в данной работе методом дискретных вспомогательных источников построен численный алгоритм решения задачи электромагнитного рассеяния
на трех импедансных телах. Алгоритм реализован как компьютерная программа для
расчета компонент рассеянного поля. Приведены некоторые результаты численных
расчетов, касающиеся влияния величины и типа поверхностного импедаса на сечения рассеяния одной из структур, состоящей из трех эллипсоидов.
ЛИТЕРАТУРА
1. Hall W.S., Mao X.Q. Boundary element method calculation for coherent electromagnetic
scattering from two and three dielectric spheres // Engineering Analysis with Boundary
Elements. 1995. V. 15. P. 313−320.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Моделирование электромагнитного рассеивания на трех импедансных телах
33
2. Ewe W.-B., Li L.-W., Leong M.-S. Solving mixed dielectric/conducting scattering problem
using adaptive Integral method // Progress in Electromagnetic Research, PIER 46. 2004.
P. 143−163.
3. Дмитренко А.Г., Уринов Р.И. Рассеяние электромагнитной волны на структуре из конечного числа трехмерных импедансных тел // Известия вузов. Радиофизика. 2012.
Т. 55. № 4. С. 299−308.
Дмитренко Анатолий Григорьевич
Уринов Радик Истамович
Томский государственный университет
E-mail: dmitr@fpmk.tsu.ru; rad_d@sibmail.com
Поступила в редакцию 20 марта 2013 г.
Dmitrenko Anatoly G., Urinov Radik I. (Tomsk State University). Simulating of electromagnetic
scattering from three impedance bodies.
Keywords: electromagnetic scattering, impedance body, discrete sources method, scattering crosssection.
The problem of electromagnetic scattering from a structure consisting of three impedance
bodies is solved in the resonance frequency range by means of the discrete sources method. The
gist of the used method is the following. The unknown scattered field is represented as a sum of
the fields of auxiliary elementary electric dipoles located on the auxiliary surfaces introduced
inside each body. The form of auxiliary surface is similar to the form of body’s surface, and
electric dipoles are oriented tangentially to the auxiliary surfaces. The chosen representation of
the scattered field satisfies to the Maxwell’s equations and radiation conditions. To find the
unknown dipole moments of the auxiliary dipoles we use the boundary conditions on the surfaces
of the impedance bodies which are satisfied according to the collocation method. Based on the
method described above we developed a computer code for calculating the scattered-field
components. We present some results of scattering cross-section calculations for structure
consisting of three ellipsoids characterized by different values of impedance for different angles
of plane wave incidence.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
УДК 681.3.004.8
С.А. Толстуха, В.А. Филимонов
ВЕБ-ПРИЛОЖЕНИЯ ДЛЯ МОДЕЛИРОВАНИЯ ДИНАМИЧЕСКИХ
СИСТЕМ И СУБЪЕКТОВ С РЕФЛЕКСИЕЙ
Использование кросс-технологий ситуационного центра предусматривает
оперативное обеспечение проектной группы средствами анализа, моделирования и визуализации. Эти функции реализуются планшетистами сервисной
команды с помощью соответствующих программных компонентов. Особые
требования к компонентам – простота и прозрачность их использования для
членов проектной группы. Рассмотрены прототипы компонентов статистического моделирования и рефлексивного анализа.
Ключевые слова: ситуационный центр, статистическое моделирование,
гомеостатика, рефлексивный анализ.
В работах [1, с. 24−31; 2, с. 156–159] поставлена задача создания оперативного
обеспечения проектной группы ситуационного центра (СЦ) средствами анализа,
моделирования и визуализации. Эти функции реализуются планшетистами сервисной команды СЦ с помощью соответствующих программных компонентов.
Особые требования к компонентам – простота и прозрачность их использования
для членов многодисциплинарной проектной группы, которые не имеют достаточной квалификации использования информационных технологий. Компоненты,
существующие в настоящее время в большинстве СЦ, этим требованиям, как правило, не отвечают. Решение задачи начато с создания прототипов [3, с. 133−135;
4, с. 66−67]. Прототипы позволяют осуществлять статистическое моделирование
динамических систем на основе подхода, предложенного в [5], и рефлексивного
анализа на основе подхода [6]. Одна из особенностей способа решения заключается в том, что результатом работы являются соответствующие Web-приложения,
объединенные в «Моделирующий комплекс ситуационного центра» (МКСЦ).
Реализация компонент в виде Web-приложений позволяет пользователю не заботиться об установке и совместимости программного обеспечения – для работы такого приложения достаточно только браузера. При этом все полученные результаты сохраняются на сервере, что приводит к независимости данных от конкретного компьютера.
1. Web-приложение «МКСЦ: Синергетика»
Web-приложение «МКСЦ: Синергетика» предназначено для построения различных математических моделей, структуру которых можно представить в виде
графа, в вершинах которых находятся вычислительные блоки, а ребра – каналы
передачи данных. Некоторые блоки являются входными (получают данные из
внешней среды), один из блоков – выходной (возвращает данные). С помощью
приложения также возможно построение систем с обратной связью и наличием
пороговых эффектов, что существенно расширяет ряд моделей, которые можно
построить с помощью этой системы. В частности, возможно построение моделей,
описывающих катастрофические процессы с позиций синергетики и гомеостатики
[7, с. 159–162].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Веб-приложения для моделирования динамических систем и субъектов с рефлексией
35
Особенностью данного приложения является фактически бесконечная память
системы, которая достигается благодаря хранению данных по каждой итерации и
по каждому блоку в нереляционной БД. С помощью этих сохраненных данных
возможно использование в модели «длинной обратной связи», а также анализ
данных на любом этапе и на любом узле работающей системы. Такой способ хранения данных позволяет обращаться к ним очень быстро.
Анализ выходных результатов может осуществляться разными способами –
визуальным (графики), статистическим (обработка данных в статистических пакетах) и другими. В частности, интересные результаты можно получить с помощью
статистики экстремальных значений. Результаты анализа данных можно будет
представить не только в «табличном» или «графическом» виде, но и средствами
когнитивной графики.
От планшетиста требуется также умение разъяснять пользователям смысл полученных результатов. Особенно это касается интерпретации результатов статистического анализа. Различные исследования, например [8], показывают, что
обеспечение понимания полученных статистических результатов требует серьёзных усилий и от планшетиста, и от заказчиков – членов проектной группы.
2. Web-приложение «МКСЦ: Рефлексия»
В качестве базового аппарата нами принят рефлексивный анализ [4]. Общую
схему подхода можно представить следующим образом.
1. Единицей («клеточкой») рассмотрения является субъект, модель сознания
которого может быть представлена рекурсивной системой, действующей в соответствии с законами термодинамики.
2. Операндами (переменными величинами, входами и выходами) модели являются характеристики, которые могут быть интерпретированы как влияние, давление, принуждение, намерение и т.п.
3. Значениями операндов модели являются, как правило, булевские величины
«0» и «1», которые могут быть интерпретированы, в частности, как «зло» и «добро» соответственно. В отдельных случаях («золотое сечение», категоризация) эти
величины могут принимать значения из дискретного или непрерывного интервала
вещественных чисел, а также из дискретного множества символьных значений.
4. Операторами модели являются операции «сложение/вычитание» (±) , «умножение» (•), «отрицание» ( ⎯ или ¬ ). Используется также символ равенства (=).
Задаётся система правил (аксиом) результатов выполнения операций и определения их последовательности.
5. Базовым компонентом структуры модели является функция f(a,b), иногда
называемая в литературе обратной импликацией:
f ( a, b ) ≡ a ← b или a + b или a b .
6. Техническим приёмом при описании моделей является параллельное использование эквивалентных представлений: линейная запись с использованием
скобок и запись в виде степенных многочленов, табличное и графическое представление структуры взаимодействия субъектов.
Концептуальную схему теории рефлексивных игр с учётом приведённого выше текста можно представить следующим образом:
1. Единицей («клеточкой») рассмотрения здесь является группа субъектов,
структура которой задаётся графом, где узлами являются субъекты, а рёбрами –
отношения между субъектами.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
36
С.А. Толстуха, В.А. Филимонов
2. Отношения между субъектами могут быть представлены в терминах состояний отношений из заданного дискретного множества таких состояний. В рассматриваемой модели таких состояний два: «союз» и «конфликт».
3. Квалификация отношений производится с точки зрения внешнего наблюдателя. Субъекты могут иметь собственную интерпретацию этих отношений.
4. Каждый субъект потенциально может:
- сделать выбор альтернативы – подмножества действий из приписанного
группе универсального множества действий;
- принять решение «не выбирать сейчас» (выбор пустой альтернативы);
- оказаться в ситуации невозможности выбора, в том числе пустой альтернативы, что интерпретируется как состояние фрустрации (полезные здесь синонимы
термина «фрустрация» – «безвыходность», «безысходность»).
5. Состоянию фрустрации конкретного субъекта (см. выше) соответствует отсутствие решения у модели ментального выбора этого субъекта.
6. Наличие у модели субъекта единственного «пустого» решения (т.е. решения
«не решать, не выбирать») интерпретируется как нахождение субъекта в пассивном состоянии. Наличие непустого решения (возможно, вместе с «пустым») интерпретируется как нахождение в активном состоянии.
7. Для каждой альтернативы в результате вычислений определяется, принадлежит ли она к множеству W допустимых (выгодных) для индивида альтернатив.
Аналогично определяется её принадлежность к множеству P альтернатив, допустимых (выгодных) для группы. В модели предполагается отсутствие шкалы предпочтений альтернатив для каждого субъекта и группы в целом и соответственно
отсутствие оценок для таких предпочтений.
8. Следствием принятой структуры модели является «Принцип запрета эгоизма», который формулируется следующим образом: субъект не может наносить
ущерб группе, членом которой он является, если это является выгодным лично
для него. Принцип не исключает жертвенного поведения, при котором выбранный
вариант действия невыгоден как группе, так и самому субъекту.
9. В модели различаются процессы выбора и реализации. В частности, выбранные субъектом действия и/или их комбинации могут быть им реализованы
совместно, но могут существовать варианты действий, реализация которых является взаимоисключающей. Такие варианты не могут входить в одну альтернативу.
Процедура перехода к аналитической записи описывается последовательностью шагов, перечисленных ниже, в результате которых формируются следующие
конструкции:
• Граф (декомпозируемый по стратам – отношениям одного типа, причём могут существовать недекомпозируемые варианты).
• Дерево декомпозиции (чередование уровней=слоёв).
• Грамматическое дерево (линейная скобочная запись дерева).
• Дерево полиномов: замена символов отношений «союз» и «конфликт» на
символы операций (•, +) , а также интерпретация букв (символов конкретных
субъектов) соответствующими данному субъекту подмножествами альтернатив.
• Диагональная форма, которая является картинкой (схемой), изображающая
субъекта с его внутренним миром.
• Экспоненциальная формула, которая является вычислительной моделью
процесса принятия решения субъектом (напомним, что модель может предсказать
невозможность принятия решения).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Веб-приложения для моделирования динамических систем и субъектов с рефлексией
37
Ниже перечислены основные этапы работы с приложением «МКСЦ: Рефлексия».
1. Перечисление (ввод) действующих лиц – субъектов взаимодействия. Результат – список персонажей.
2. Перечисление действий с указанием их свойств (возможность совместной
реализации). Результат – список действий.
3. Формирование (вычисление) альтернатив, включая пустую альтернативу и
альтернативу, содержащую универсальное множество действий. Результат – список альтернатив.
4. Перечисление отношений между субъектами. Результат – матричное и графическое представление анализируемой группы.
5. Задание для каждого субъекта наборов альтернатив, к выбору которых его
склоняет каждый из остальных субъектов, а также и интенция (намерение) самого
субъекта. Результат: матрица влияний.
6. Контроль и редактирование введённой информации. Результат: подтверждение пользователем заданной конфигурации.
7. Запрос на анализ.
Результаты:
• список альтернатив, соответствующий заданной конфигурации, для каждого
субъекта;
• список P альтернатив, допустимых (выгодных) для группы.
Инструментом для создания приложения выбран фреймворк PHP Symfony.
Этот фреймворк уже имеет встроенные модули для работы с базой данных, учетными записями пользователей, формами и другие, что позволило упростить разработку приложения.
Отметим проблемы, возникающие при интерпретации результатов. Так, сообщение планшетиста, о том, что граф в данной задаче является недекомпозируемым, приводит в ступор представителей гуманитарных направлений. Соответственно необходимо дополнительное разъяснение того, как работать с этически неизмеримыми ситуациями в рамках данной модели.
3. Тестирование компонентов
Авторы с признательностью отмечают, что компонент рефлексивного анализа
был протестирован в октябре 2011 г. Владимиром Александровичем Лефевром;
его замечания позволили исправить некоторые ошибки. Нами была заявлена возможность открытого бесплатного доступа к приложению, реализующему рефлексивный анализ по адресу: http://reflection.sergal.ru [9, c. 251−253]. Однако реально
им воспользовался только наш коллега С.С. Тарасенко [10, с. 93−101] , который
ранее разработал собственный вариант реализации теории рефлексивных игр, являющийся собственностью фирмы, в которой он работает.
С целью выявления недостатков в текущих версиях приложений, а также определения направлений их модернизации было проведено тестирование с привлечением группы студентов старших курсов математического факультета ОмГУ и
прикладной информатики ОГИС.
Тестирование приложения «МКСЦ: Рефлексия» было проведено в пять этапов.
На первом этапе студентам читалась короткая лекция, в которой были описаны
основные положения теории рефлексивных игр В.А. Лефевра и класс задач, решаемых при помощи приложения. Длительность первого этапа составила 30 минут.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
38
С.А. Толстуха, В.А. Филимонов
На втором этапе группа студентов исполняла роль проектной группы СЦ.
Группой была поставлена задача, в которой рассматривалась ситуация необходимости выбора линии поведения субъектами (людьми), между которыми существуют эмоциональные взаимоотношения.
На третьем этапе группа выступила уже в качестве сервисной команды СЦ.
Студенты формализовали поставленную ранее задачу в терминах теории рефлексивных игр. Был составлен граф взаимоотношений субъектов, список альтернатив, матрица влияний субъектов друг на друга. Продолжительность второго и
третьего этапов вместе составила 15 минут.
Четвертый этап был посвящен непосредственно тестированию приложения.
Студенты ввели в программу полученные на предыдущем этапе данные. Система
вернула результат решения задачи, который был быстро и корректно интерпретирован группой студентов. Дальнейшая работа с приложением велась следующим
образом: в упрощенном виде повторялись второй, третий и четвертый этапы тестирования, то есть изменялись (либо добавлялись) условия задачи, соответственно уточнялась модель входных данных, приложение возвращало новый результат.
По окончании этапа (длительностью 30 минут), студенты уже имели навык работы с приложением, они легко составляли новые задачи и быстро интерпретировали результаты, выданные приложением.
На пятой, заключительной, части тестирования был проведен обмен впечатлениями с группой студентов об использовании приложения «МКСЦ: Рефлексия».
Студенты отметили, что пользоваться приложением было интересно, придумать и
формализовать задачи было достаточно легко. Тем не менее были выявлены недостатки приложения: не очень удачный дизайн; недостаточность визуализации
(не изображен в графическом виде граф взаимоотношений, не представлены в
табличном виде матрицы влияний); неудобная навигация (необходим одношаговый переход на любую стадию введения данных задачи и просмотра её результата); не разграничены множества альтернатив по отдельным участникам; отсутствует мультиязыковая поддержка. Продолжительность заключительной части тестирования – 15 минут.
В целом, тестирование приложения прошло успешно: студенты, до этого не
знакомые с теорией рефлексивных игр, после полуторачасового тестирования
легко интерпретируют условия и решения существующих задач, а также составляют новые, совмещая в себе роли как проектной группы СЦ-центра, так и его
сервисной команды.
Заключение
Представлен прототип системы коллективного многодисциплинарного исследования, инфраструктурой которой является ситуационный центр, а программное
обеспечение ориентировано на «облачную» реализацию. Оба описанных компонента системы предназначены для моделирования, однако математический аппарат компонентов существенно различается. Отмечена необходимость сопровождения математического арсенала исследования средствами объяснения процедур
и результатов представителям различных профессиональных коллективов.
ЛИТЕРАТУРА
1. Филимонов В.А. Исследовательский комплекс «Ген-Гуру» (эскиз многодисциплинарного проекта) // «Знания – Онтологии – Теории» (ЗОНТ-07): материалы Всероссийской
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Веб-приложения для моделирования динамических систем и субъектов с рефлексией
2.
3.
4.
5.
6.
7.
8.
9.
10.
39
конференции с междунар. участием. 14−16 сентября 2007, Новосибирск. Новосибирск:
Ин-т математики им. С.Л.Соболева СО РАН, 2007. Т. 1. С. 24−31.
Филимонов В.А. Учебно-исследовательский ситуационный центр – полигон для команды системных аналитиков // Вестник Сибирского государственного аэрокосмического
университета. 2010. № 5. С. 156−159.
Полляк Ю.Г., Филимонов В.А. Статистическое машинное моделирование средств связи.
М.: Радио и связь, 1988. 176 с.
Толстуха С. А., Филимонов В.А. Прототип реализации теории рефлексивных игр // Материалы Ершовской конференции по информатике (PSI’11). Секция «Информатика образования»: доклады и тезисы. Новосибирск: Институт систем информатики, 2011.
С. 133−135.
Толстуха С.А. Программный комплекс для планшетиста ситуационного центра // «Молодежь, наука, творчество – 2012». X Межвузовская научно-практическая конференция
студентов и аспирантов: сб. статей. Омск: Омский государственный институт сервиса,
2012. С. 59−61.
Лефевр В.А. Лекции по теории рефлексивных игр. М.: Когито-Центр, 2003. 218 с.
Сугоняк В.В., Филимонов В.А. Управление человеческими ресурсами для коллективного исследования и обучения // Вестник Сибирского гос. аэрокосмического ун-та. 2010.
№ 5. С. 159 – 162.
Канеман Д., Словик П., Тверски А. Принятие решений в неопределённости: Правила и
предубеждения. Харьков: Гуманитарный центр, 2005. 632 с.
Филимонов В.А. Рефлексивный анализ и технологии ситуационного центра // Рефлексивные процессы и управление: сб. материалов VIII Междунар. симпозиума. М.: Когито-Центр, 2011. С. 251−253.
Тарасенко С.С. Моделирование многоэтапного процесса принятия решений при помощи теории рефлексивных игр // Рефлексивные процессы и управление. 2010. Т. 10.
№ 1−2. С. 93−101.
Сергей Александрович Толстуха
Вячеслав Аркадьевич Филимонов
Омский государственный институт сервиса,
Омский филиал Института математики им С.Л.Соболева СО РАН
E-mail: letters@sergal.ru; filimono@ofim.oscsbras.ru
Поступила в редакцию 30 апреля 2012 г.
Tolstukha Sergey A., Filimonov Vyacheslav A. (Omsk State Institute of Service, Sobolev Institute
of Mathematics of the Siberian Branch of the RAS Omsk branch). Web-applications for
dynamic systems and subjects with reflection modeling.
Keywords: situation center, static modeling, homeostatics, reflection analysis.
General task is to create support system of collective multi-discovery research with situation
center as infrastructure and «cloud-oriented» software. Specific task is to create prototype of
operational support system for project teams in situation center. Prototype technology has been
used on the «easiest system version containing most difficult element» principle. Components are
implemented as Web-applications.
«MCSC: Synergetics» application designed for simulation mathematics models builds with
structure which can presents as a graph. Vertexes of the graph are computing units and edges are
data transfer channels. Discrete digital signal processing apparatus is used. This component helps,
in particular, to model homeostatic models and to explore evolution of catastrophic processes.
«MCSC: Reflection» application implements models of Lefebrve reflection games theory. It
serves to describe and predict actions and relationships between subjects in group. Components
was testing with involving senior students.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
ОБРАБОТКА ИНФОРМАЦИИ
УДК 519.2
А.Н. Бондаренко, А.Ю. Гунькин
КРИТИЧЕСКИЕ ЯВЛЕНИЯ НА САМОПОДОБНЫХ РЕШЁТКАХ1
Рассмотрены методы комбинаторного вычисления высокотемпературного
разложения для самоподобных решёток в модели Изинга. Актуальность
темы связана с методами неразрушающего контроля усталости металлов.
Ключевые слова: самоподобные решётки, высокотемпературное разложение, метод Фабио.
Не так давно перед учеными встала задача разработки методов неразрушающего контроля усталости металлов. Выяснилось, что система трещин в металле
может успешно моделироваться самоподобными решётками [1]. На таких решётках может быть построена модель Изинга, которая позволяет смоделировать интересующие нас свойства ферромагнетиков, кроме того, позволяет вычислить
температуру, называемую температурой Кюри, при нагревании до которой происходит фазовый переход и потеря веществом способности к спонтанному намагничиванию. Исходя из значения температуры для рассматриваемого металла, можно
сделать вывод о его усталости.
Обзор «The American Physical Society» позволил найти две статьи [5, 7], в которых было описано как применить метод высокотемпературного разложения
магнитной восприимчивости к конкретному ковру Серпинского бесконечного порядка ветвления. За основу для написания программы была взята статья
D.A. Fabio «High-temperature series expansion for Ising-like systems on fractals» [7],
используя идеи которой были созданы конкретные алгоритмы для решения задачи.
Невозможность применения формул, предложенных в статье [7], сделала необходимым корректировку данных формул и разработку новых, которые приведены в тексте этой статьи.
1. Модель Изинга
В качестве энергии состояния или конфигурации σ двумерной модели Изинга
назовём функционал
E (σ) = − J ∑ σ x σ y − H ∑ σ x .
(1)
( x, y )
x
В первом слагаемом суммирование ведётся по всем парам соседних узлов (x, y),
во втором – по всем узлам решётки x. При этом J, H – некоторые параметры.
1
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований
(код проекта 11-01-00105 а) и Междисциплинарного интеграционного проекта СО РАН № 14 «Обратные задачи и их приложения: теория, алгоритмы, программы».
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Критические явления на самоподобных решётках
41
Если J и H в выражении (1) положительны, то модель Изинга описывает
идеализированную физическую систему – двумерный ферромагнетик. Решётка
модели соответствует кристаллической решётке магнетика, спины изображают
магнитные моменты атомов кристалла. Параметрам J и H можно придать физический смысл: H – это напряженность внешнего магнитного поля, перпендикулярного плоскости решётки, а J характеризует взаимодействие магнитных моментов. В основном состоянии все спины направлены в одну сторону, что приводит к возникновению ненулевого магнитного момента всего кристалла.
Рассмотрим случай J > 0 . Величина
⎛
⎞
Z N = ∑ e− E (σ) / T = ∑ exp ⎜ K ∑ σ x σ y + h∑ σ x ⎟ ,
⎜
⎟
x
σ
σ
⎝ ( x, y )
⎠
(2)
где K = J / T , h = H / T , T – абсолютная температура, называется статистической
суммой или статсуммой. Суммирование ведётся по всем возможным состояниям
системы.
Точно были решены лишь одномерная модель Изинга с учётом влияния внешнего магнитного поля [2] и двумерная модель Изинга вне присутствия внешнего
магнитного поля [3]. Также было доказано [4], что для модели, выполненной на
самоподобной решётке, можно построить точное решение, если эта решётка имеет конечный порядок ветвления, то есть распадается на две части путём совершения конечного числа разрезов по рёбрам. В этом случае фазового перехода не будет, так как ферромагнитные свойства не проявляются и, как следствие, критическая температура – нулевая. Соответственно ни трехмерная модель Изинга,
ни модель на самоподобной решётке бесконечного порядка ветвления решена не
была.
Попытка построить приближенное решение для самоподобной решётки, оперируя непосредственно со статистической суммой и используя разложения, полученные в решении двумерной модели, не удалась из-за низкой точности результатов. Отсюда был сделан вывод, что исследовать надо не саму статсумму, а некую
производную от неё функцию.
Наиболее точным для любых видов самоподобных решёток является метод
высокотемпературного разложения. Данный метод позволяет непосредственно
получить частичную сумму ряда, в которую разлагается магнитная восприимчивость χ ферромагнетика.
2. Высокотемпературное разложение для магнитной восприимчивости
Известно, что магнитная восприимчивость задаётся следующим выражением:
χ
∂ 2 ⎛ ln( Z N ) ⎞
=
⎜
⎟,
kT ∂H 2 ⎝ N ⎠
(3)
где
Z N ( ν, τ ) = (ch β J ) 2 N (ch β H ) N ∑∏ (1 + νσi σ j )∏ (1 + τσ k ) .
{σ} <ij >
Здесь ν = th ( βJ ) , τ = th ( βH ) , β =
1
.
kT
k
(4)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Н. Бондаренко, А.Ю. Гунькин
42
Переходя к термодинамическому пределу и используя разложение в ряд Тейлора при τ = 0 , получаем
lim
N →∞
1
1
ln Z N ( ν, τ ) = ln Z ( ν ) + τ2 χ ( ν ) + ... ,
2
N
(5)
где χ ( ν ) – магнитная восприимчивость при нулевом внешнем магнитном поле.
Используя тот же способ выделения путей на решётке, что и ранее, и учитывая
тот факт, что
∑ σ = 0 , ∑ σ2 = 2 ,
(6)
χ ( ν ) = 1 + ∑ dr νr ,
(7)
σ=±1
получаем
σ=±1
r ≥1
где
dr =
∑ 2Γ ( g )Wr ( g ) .
(8)
g∈Gr
Здесь Gr – множество незамкнутых графов длины r , Wr ( g ) – вес графа или количество его не совмещаемых наложением симметрий, Γ ( g ) – количество вложений графа в бесконечную самоподобную решётку, приходящихся на один узел.
3. Метод Фабио
Рассмотрим ковёр Серпинского, характеризуемый параметрами b и m . Самоподобная решётка на l-м шаге формируется посредством b 2 − m воспроизведений
фрактала на предыдущем шаге l − 1 с исключением m квадратов в середине.
Число вложений G ( l ) конкретного графа в решётке на шаге l даётся выражением
где
G ( l ) = (b 2 − m)G ( l − 1) + H ( l − 1) ,
(9)
H ( l − 1) = H1 ( l − 1) + H 2 ( l − 1) .
(10)
Здесь H1 ( l − 1) и H 2 ( l − 1) представляют собой число вложений графа, которые
пересекают одно и более чем одно перекрытие между воспроизведёнными на l-м
шаге итерациями фрактала шага ( l − 1) .
Теперь, для этого конкретного графа, рассмотрим минимальный шаг l0 , на котором решётка его вмещает, и далее выполним следующие пункты:
- Вычислим общее количество возможных вложений графа на шаге l0 . Это
будет G ( l0 ) .
- Рассмотрим два соседних воспроизведения шага l0 и посчитаем общее количество вложений, которые пересекают границу между ними. Это даст нам H1 ( l0 ) .
- Рассмотрим три или четыре соседних воспроизведения фрактального шага l0
и такие вложения графа, которые пересекают между ними две или более границы.
Если говорить более точно, с учётом того, что граф может располагаться на самой
границе, существуют такие конкретные вложения графа, которые используют три
или четыре соседних блока и не могут использовать меньшее их количество. Таким образом мы получим H 2 ( l0 ) .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Критические явления на самоподобных решётках
43
Несложно видеть, что
H1 ( l − 1) = bH1 ( l − 2 ) + ( b − 1) C1 ;
(11)
H 2 ( l − 1) = H 2 (l0 ) = C2 ,
(12)
где C1 и C2 зависят только от вложения графа на шаге l0 и геометрических
свойств генератора фрактала. C1 представляет собой те вложения графа, которые
используют на l0 + 1 шаге ровно два блока, построенных на шаге l0 и вылезающих за внешнюю граница фрактала шага l0 + 1 .
Проведя итерацию формулы (11) и используя (9), получаем
H (l − 1) = D1bl −1 + D2 ,
(13)
H1 ( l0 ) + C1
, D2 = H 2 ( l0 ) − C1 .
(14)
bl0
И, наконец, используя (9) и (13) можно получить конкретное выражение для
G (l ) в виде
D1 =
где
G (l ) = A(b 2 − m)l + Bbl + C ,
(15)
где A , B , C есть функции от [C1 , H1 ( l0 ) , H 2 ( l0 ) , G ( l0 )] ;
⎡
⎤
D1bl0
D2
+
+
G
l
(
)
⎢
⎥.
0
l
2
2
b − b − m b − m − 1⎦
(b 2 − m) 0 ⎣
Оказывается, что формула (15) верна и для числа узлов N ( l ) , то есть
A=
1
N (l ) = A '(b 2 − m)l + B ' bl + C ' ;
A' =
N (1)
2
(b − m)
−
Lν (1)b
2
2
(b − m)(b − m − b)
B' =
C'=
+
Lν (1)
2
(b − m − b)
Lν (1) − N ν (1)
(b 2 − m − 1)
N ν (1) − Lν (1)
2
(b − m)(b 2 − m − 1)
;
(16)
(17)
;
(18)
(19)
,
(20)
где N (1) – число всех узлов шаблона, N ν (1) – число внутренних узлов шаблона,
Lν (1) – число внутренних связей. Отсюда, распределение конкретного графа на
бесконечной фрактальной решётке задается через
G (l ) A
=
.
(21)
g = lim
l →∞ N (l )
A'
Из формулы (21) можно точно получить коэффициенты в магнитной восприимчивости при степени соответствующего порядка путём рассмотрения вкладов
всех графов.
Метод, предложенный в работе Фабио, можно протестировать с помощью
численного моделирования. Для этого рассмотрим конкретный пример решётки и
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Н. Бондаренко, А.Ю. Гунькин
44
⎛ J ⎞
для неё вычислим критический параметр ν c = th ⎜
⎟ , где Tc – критическая
⎝ kTc ⎠
температура.
Для ковра Серпинского, с b = 3, m = 1 , было проведено компьютерное моделирование для вычисления высокотемпературного разложения магнитной восприимчивости вплоть до девятого коэффициента. Полученные значения d n согласуются со значениями, полученными в работе [5]. Однако значения критического
параметра ν c отличаются от представленных в работе [7]. Это различие может
быть обусловлено наличием графов специфического типа, для которых требуется
уточнение формул (9) − (12), предложенных в работе Фабио.
Рассмотрим сначала граф, который представляет собой участок прямой. Тогда
в формуле (9) он будет посчитан дважды каждый раз, когда вложение будет оказываться на границе между соседними блоками-итерациями. Таких границ на каждом шаге будет [b(b − 1) − (m + 1)m] , а на самой границе граф может быть размещен bl −1 + 1 − size , где size – его длина. Отсюда поправка для (9) выглядит следующим образом:
G ( l ) = (b 2 − m)G ( l − 1) + H ( l − 1) − [b(b − 1) − (m + 1)m] × [bl −1 + 1 − size] .
(22)
Обозначим
D = [b(b − 1) − (m + 1)m] × [bl −1 + 1 − size] .
(23)
Далее, если рассматривать вложения графа, которые дают вклад в
H1 (l ) = H (l ) , то те из них, которые попадут на границу, также будут посчитаны
дважды. Для каждого пересечения раздела между соседними итерациями таких
вложений будет ( size − 1) .
H ( l − 1) = bH (l − 2) − sign H (l0 ) × (b − 1) × (b(b − 1) − m(m + 1)) × ( size − 1) .
(24)
Аналогично, как и раньше, из (24) получаем
H ( l − 1) = D1bl −1 + D2 ,
(25)
где
D1 =
H1 (l0 ) − Aˆ
bl0
,
(26)
D2 = Aˆ = sign H (l0 ) × (b(b − 1) − m(m + 1)) × ( size − 1) .
(27)
G ( l ) = b 2 G ( l − 1) + D1bl −1 + E ,
(28)
Отсюда
где E = Aˆ − D = D2 − D .
Теперь, сделав итерацию для (28), получаем
G ( l ) = A(b 2 − m)l + Bbl + C ,
(29)
но коэффициенты уже другие:
A=
⎡
⎤
D1bl0
E
+
+ 2
G
l
(
)
⎥.
0
l0 ⎢
2
2
b − b − m b − m − 1⎦
(b − m) ⎣
1
(30)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Критические явления на самоподобных решётках
45
Теперь заметим следующее: в формуле (12) H 2 (l − 1) = H 2 (l0 ) = const , однако,
это не верно для тех графов, которые могут «обходить центральную дырку». Этот
обход имеется только на шаге l0 + 1 и на следующих шагах, в связи с увеличением размера дырки, не сохраняется.
В связи с этим
G ( l ) = (b 2 − m − δ(l0 + 1))G (l − 1) + H (l − 1) .
(31)
Если привести эту формулу к виду (15), то коэффициент A примет следующий вид:
⎡
⎤
G (l0 )
D1bl0
D
+
+
+ 2 2
G
l
(
)
⎥,
0
l0 ⎢
2
2
2
b − m b − b − m b − m − 1⎦
(b − m) ⎣
причем H 2 нужно будет взять на единицу меньше.
A=
1
(32)
Заключение
В данной работе показано, что коэффициенты высокотемпературного разложения магнитной восприимчивости модели Изинга для фрактальных решеток
бесконечного порядка ветвления удается получить с использованием комбинаторного метода Фабио. Данный способ вычисления критических значения модели
Изинга позволяет получить высокую точность интересующих показателей. В частном случае рассмотрены примеры графов для фрактальных решеток, для которых формулы, предложенные в методе Фабио, не корректны. Для этих случаев
были выведены соответствующие выражения. Для проверки предложенных формул использовалась написанная нами программная разработка, позволяющая находить критические значения самоподобных решёток на основе метода высокотемпературного разложения. Правильность полученных результатов проверялась
с помощью численного алгоритма Монте-Карло, а также данных, опубликованных в литературе [5].
ЛИТЕРАТУРА
1. Бондаренко А.Н., Селезнев В.А., Харбанова Е.В. Спектральная асимптотика фрактальных
решёток и задачи определения степени усталости материала // Научый вестник НГТУ.
Новосибирск: Из-во НГТУ, 2003. № 2. С. 97−106.
2. Белавин А.А., Кулаков А.Г., Усманов Р.А. Лекции по теоретической физике. М.:
МЦНМО. 2001. 224 с.
3. Фейнман Р. Лейтон Р. Фейнмановские лекции по физике. М.: Едиториал УРСС. 2004.
439 с.
4. Гулд Х. Тобочник Я. Компьютерное моделирование в физике. М.: Мир, 1992. 518 с.
5. Bonnier B. Leroyer Y. Myers C. High-temperature expansions on Sierpinski carpets // Phys.
Rev. 1989. V. 40. No. 13. P. 8961−8966.
6. Yang Z.R. Solvable Ising model on Sierpinski carpets: The partition function // Phys. Rev.
1994. V. 49. No. 3. P. 2457 – 2460.
7. Fabia Aarao Reis D.A., Riera R. High-temperature series expansion for Ising-like systems on
fractals // Phys. Rev. 1994. V. 49. No. 4. P. 2579−2587.
Бондаренко Анатолий Николаевич
Гунькин Андрей Юрьевич
Новосибирский государственный технический университет
E-mail: bondarenkoan1953@mail.ru; shamrock24@mail.ru
Поступила в редакцию 30 апреля 2012 г.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
46
А.Н. Бондаренко, А.Ю. Гунькин
Bondarenko A.N., Gunkin A.Y. (Novosibirsk State Technical University). Critical phenomena on
self-similar lattices.
Keywords: self-similar lattices, high-temperature expansion, Fabio method.
Recently, methods for computing the number of embeddings of graphs in self-similar
structures were proposed, allowing the use of the series-expansion technique for statistical
systems on these geometries. In comparison to other techniques, the series-expansion method
provides the most reliable results whose accuracy can be improved in a systemic way by
increasing the order of the series.
The graph counting method can be used in a fairly general family of self-similar deterministic
fractals which are obtained by the iteration of a fixed rule of construction. It enables one to obtain
the behavior of statistical system on fractal lattices which have the same fractal dimension but
different lacunarities, allowing a complete study of those system on non-Euclidean lattices. In this
paper, we apply the graph counting method to find the coefficients of the high-temperature series
expansions for the susceptibility of the Ising model on Sierpinski carpets.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
УДК 004.89:78
А.В. Верховин, А.С. Гуменюк
О СРЕДСТВАХ ФОРМАЛЬНОГО АНАЛИЗА СТРУКТУРЫ
МУЗЫКАЛЬНЫХ ТЕКСТОВ
Описан алгоритм выделения элементарных мотивов, представляющих «естественные» группировки нот в музыкальных текстах. Вводится новый абстрактный объект – строй музыкального текста и числовые характеристики
для его описания. Для выборки из 106 музыкальных текстов сформирован
частотный словарь; для всех текстов получены значения характеристик
строя. В работе ставилась цель описать разрабатываемый инструментарий и
продемонстрировать некоторые его возможности.
Ключевые слова: музыкальный текст, Ф-мотив, строй цепи, числовые характеристики.
Нотная запись музыкального произведения является продуктом мыследеятельности, осуществляемой, как правило, отдельным человеком. Ноты всегда однозначно отображают акустические образы. Кроме того, они наиболее формализованы, так как нота представляет две физические величины (высоту и длительность звучания). В сравнении с музыкальными, литературные тексты менее формализованы, так как буквы и слова не представляют числовые величины; сами же
отдельные слова не всегда однозначно отображают денотаты. Поэтому для обнаружения функций мышления следует шире использовать нотные записи как наиболее абстрактные объекты исследования. Однако в настоящее время практически
отсутствуют адекватные средства анализа структуры музыкальных текстов, так
как их компоненты обычно выделяются аналитиками-музыковедами субъективно.
Кроме того, системный методологический подход предполагает определять такие
компоненты нотного текста, которые представляли бы «акустические единицы»,
являющиеся естественными частями целого музыкального произведения [1]. Простейшие информационные элементы текста – отдельные ноты и паузы – занимают
на протяжении такта все его доли. Профессионалы выделяют в музыкальном тексте некоторые более сложные компоненты текста, называемые субмотивами, мотивами, фразами, фигурами, темами и т.п., способы и, тем более, алгоритмы выявления которых строго не определены [2, 3]. Для анализа структуры музыкальных текстов очевидно применение статистических средств математической лингвистики, которые, однако, также требуют выделения компонентов. Кроме того,
при сравнении структуры музыкальных текстов применим сложностной подход
на основе «редакционного расстояния» [4], который, в настоящее время, формально реализуем только с опорой на ноты.
По мнению авторов, существующие подходы и модели в математической лингвистике почти не уделяют внимания закономерностям «конкретного расположения всех знаков или слов, составляющих отдельную символьную последовательность». На первый взгляд, написание лингвистических текстов допускает небольшие вариации в расположении слов при сохранении смысла фразы. Однако ори-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
48
А.В. Верховин, А.С. Гуменюк
гинальное расположение компонентов музыкального текста таких вариаций не
допускает, так как представляет цепь упорядоченных во времени акустических
событий. Недостаток внимания (прикладной математики и теоретической информатики) к оригинальному расположению компонентов в цепи в некоторой степени объясняется отсутствием формализма для этого абстрактного объекта и названного «строем или построением цепи» [5]. По нашему мнению, именно «строй
музыкального текста» наиболее адекватно отображает его структуру. При этом,
как отмечалось выше, для системного описания музыкального произведения требуется выделять естественные компоненты, сформированные из нот. Таким образом, наряду с определением строя музыкального текста, выделение его естественных компонентов является особой проблемой. Как показано Ю. Орловым и
М. Бородой, наличие таких компонентов позволяет статистическими средствами
выявлять «целостно-завершенные музыкальные тексты» [1].
1. Выделение и описание элементарных компонентов
в музыкальных текстах
Известно, что в музыкальном тексте самыми элементарными знаковыми компонентами являются ноты, в которых закодирована высота и длительность звука.
Музыкальный текст одноголосного произведения, в котором не выделяются специальными символами «слова» и нет пробелов даже между отдельными его частями, читается как непрерывная цепочка нот (и пауз). Как отмечает М. Борода,
«в распоряжении исследователя нет однозначно определенных элементарных музыкальных единиц крупнее интервала» [6, с. 1]. Интервалом называется сочетание
двух звуков, взятых последовательно или одновременно.
С позиций системного подхода на основе разработок Ю. Орлова множество
естественных компонентов музыкального текста (словарь формальных мотивов)
[6] должно удовлетворять трем условиям: фактическое частотно-ранговое распределение компонентов соответствует закону Ципфа – Мандельброта; мощность
собственного алфавита текста определяется его длиной; самые редкие компоненты встречаются по одному разу. Выполнение этих условий задает критерий «целостности и завершенности» текста, названный критерием Ю. Орлова [1]. М. Борода разработал естественный компонент музыкального текста, который отвечает
критерию Ю. Орлова и, кроме того, является «однозначно определенной единицей, обладающей цельностью (нерасчленимостью) и законченностью с метрической либо с ритмической стороны» [6, с. 2]. При этом метрическая составляющая позволяет различать ноты по метрической силе, определяемой конкретной
позицией любой ноты в такте. Ритмическая составляющая представляет формирование цепи временных интервалов звучания нот в музыкальном тексте. Насколько
известно авторам, других разработок естественных компонентов музыкального
текста в настоящее время не имеется.
Формальным мотивом (Ф-мотивом) М. Борода назвал отрезок мелодии в пределах: а) формального такта – полного или частичного минимального такта (ПМТ
или ЧМТ на рис. 1, d); б) возрастающей последовательности (ВП на рис. 1, d);
в) формального такта, с последнего звука которого начинается возрастающая последовательность (ПМТ+ВП, ЧМТ+ВП). В некотором смысле Ф-мотив является
аналогом слова в тексте. Подробное определение формального мотива, формального такта, возрастающей последовательности и процедура его выделения пред-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О средствах формального анализа структуры музыкальных текстов
49
ставлены в [6]. Эта процедура позволяет разбить одноголосную мелодию любого
музыкального текста (с тактовой системой) на Ф-мотивы.
Предложенная М. Бородой процедура выделения Ф-мотивов в нотной записи
содержит некоторые неоднозначно интерпретируемые действия. Часть действий
описана лишь в общих чертах. Кроме того, эту процедуру необходимо дополнить
действиями, не рассмотренными М. Бородой.
На основе проделанного нами анализа и детальной проработки данной процедуры выделения элементарных мотивов (Ф-мотивов) [7], разработан алгоритм их
автоматического распознавания в музыкальном тексте [8]. При описании данного
алгоритма удобно рассматривать три его последовательных этапа:
• определение приоритетов всех нот по метрической силе (на основе разбиения музыкального текста на такты и микротакты);
• последовательное выделение в музыкальном тексте Ф-мотивов (на основе
распознавания одного из пяти типов их структуры);
• идентификация и выделение одинаковых Ф-мотивов (на основе сравнения
структуры и состава Ф-мотивов).
На первом этапе, поочередно в каждом такте нотной записи (рис. 1, a) определяются приоритеты нот (относительные силы долей такта, на которых располагаются ноты – рис. 1, b). Для этого предлагается построить «маску приоритетов»
для очередного такта, в котором определяются метрические силы нот. Такое построение осуществляется путем разбиения такта на равные доли, указанные в его
размере на рис. 1, a. Первой доле такта назначается наивысший приоритет «1»
(наивысшая метрическая сила), оставшимся долям назначается приоритет на уровень ниже – «2». После этого путем деления данных долей такта на две равные
части, выделяются более мелкие доли такта, для которых назначается приоритет
еще ниже на уровень – «3». Такое деление долей «на два» и назначение приоритетов происходит до тех пор, пока длительность новых долей не будет равной минимальной длительности среди нот оригинального такта. На следующем этапе
происходит «наложение» маски приоритетов на очередной такт музыкального
текста, во время чего каждой ноте из оригинального такта назначается приоритет
доли из маски приоритетов, начало которой совпадает с началом данной ноты.
На втором этапе происходит последовательное выделение Ф-мотивов в музыкальном тексте путем распознавания одного из пяти типов их структуры (на
рис. 1, d изображено разбиения фрагмента музыкального текста на Ф-мотивы с
указанием их типа). Для этого данный музыкальный текст переписывается в оригинальной последовательности без указания границ тактов. Длительность каждой
паузы прибавляется к длительности предшествующего звука, а сами паузы из текста устраняются. После этого проводится операция по замене последовательностей нот, объединенных знаком лиги, на ноты с соответствующей суммарной длительностью и метрической силой равной метрической силе первой ноты из последовательности лигованных нот. Далее в музыкальном тексте без границ тактов,
пауз и знаков лиги, выполняется цикл действий, в ходе которых происходит выделение очередного элементарного мотива путем постепенного распознавания заданных типов структуры Ф-мотива, подробно описанных в [6]. Такой цикл действий повторяется до тех пор, пока музыкальный текст не будет разделен на Фмотивы полностью. В результате этого исходный музыкальный текст отображается последовательностью Ф-мотивов.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
50
А.В. Верховин, А.С. Гуменюк
В начале третьего этапа, на основе полученной последовательности формируется словарь Ф-мотивов. Стоит принять во внимание, что одинаковыми Фмотивами являются те, у которых длительности соответствующих нот равны, а их
высоты звучания соответственно либо совпадают, либо отличаются на одну и ту
же величину в пределах всего Ф-мотива (на рис. 1, c одинаковыми являются первый и четвертый по счету Ф-мотивы – обозначены «1»; второй и пятый – обозначены «2»; седьмой и восьмой – обозначены «5»). Отношения между высотами
звучания нот в пределах сравниваемых Ф-мотивов одинаковы, поэтому и информации внутри каждого Ф-мотива одинаковы, даже если эти Ф-мотивы состоят из
кортежей разных нот. После формирования словаря поочередно идентифицируются и нумеруются все Ф-мотивы этой последовательности (рис. 1, e).
a
b
c
d
e
Рис. 1. Фрагмент музыкального текста разбитый на Ф-мотивы (a – фрагмент нотной записи; b – приоритеты долей тактов; c – график «высота звучания – длительность»; d – разбиение по типам Ф-мотивов данного фрагмента; e – строй фрагмента музыкального текста)
2. Определение строя произвольной знаковой цепи
Рассмотрим определение абстрактного объекта, который отображает конкретное расположение всех знаков или слов, составляющих отдельную символьную
последовательность произвольной природы [5].
Строй цепи событий (сообщений, знаков и т.д.) определен как кортеж (упорядоченное множество), в котором каждому компоненту данной цепи поставлено в
соответствие натуральное число, причем идентичные по выбранному признаку
компоненты отображены одним и тем же числом. Самый первый компонент такого кортежа – единица, а все остальные первые встречные – разные натуральные
числа (представляющие вместе с единицей алфавит строя) возрастают на единицу.
В соответствии с теоретико-множественным определением вектора такой специфически сформированный (организованный) кортеж назван «вектором строя».
Разложим полную неоднородную символьную последовательность (без свободных мест на ее позиции) на m неполных «однородных» кортежей, в которых
заняты только некоторые места данной позиции одинаковыми знаками (как это
представлено на рис. 2, c). Аналогом однородной последовательности является
поток однородных событий, рассматриваемый в теории массового обслуживания,
при этом значение интервала между соседними событиями рассматривается как
реализация случайной величины.
Определим «интервал» ∆ij как расстояние от i-го до (i+1)-го вхождения данного компонента в j-й однородной цепи в направлении просмотра (рис. 2, c). Значение интервала ∆ij – это модуль разности номеров мест (на позиции кортежа) i-го и
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О средствах формального анализа структуры музыкальных текстов
51
(i+1)-го вхождений компонента j. На рис. 2, c однородная цепь «1» представлена
кортежем интервалов <3,5,2,2>.
a
b
c
∆11 = 3
∆21 = 5
∆31 = 2
∆41 = 2
Рис. 2. Отображение знаковых цепей в строй: a – три неоднородные знаковые цепи;
b – строй (вектор строя) данных цепей; с – однородная цепь и ее интервалы
3. Числовые характеристики строя знаковой цепи
Используем понятие однородной знаковой последовательности и ее векторное
отображение в виде кортежа интервалов для определения некоторых числовых
характеристик строения текста [5]. Формулы для этих характеристик компактно
представлены в табл. 1, в которой используются следующие обозначения: j – номер знака в алфавите или номер однородной цепи; ∆ij – интервал между i-м и
(i+1)-м вхождениями знака j в однородной цепи; log∆ij – удаленность (i+1)-го
вхождения знака j относительно его i-го вхождения; nj – число вхождения знака j
в цепи; m – мощность алфавита знаков цепи; n – длина полной знаковой цепи,
равная числу всех мест ее позиции; ∆aj, ∆gj – соответственно средний арифметический и средний геометрический интервалы строя j-й однородной цепи; Vj – абсолютный объем строя j-й однородной цепи; Gj – глубина расположения строя j-й
однородной цепи; log ∆gj – средняя удаленность знака j в строе однородной цепи;
V – абсолютный объем строя; G – глубина расположения строя; ∆g – средний геометрический интервал строя; g – средняя удаленность любого элемента строя; D –
число информаций, используемых (по Мазуру) для описания некоторого знака
цепи; I – число информаций, используемых (по Мазуру) для дихотомической
идентификации отдельного знака; τj – периодичность (следования знаков) в строе
j-й однородной цепи; r – регулярность (следования любого элемента) строя.
Таблица 1
Числовые характеристики строя
nj
V j = ∏ ∆ ij
i =1
∆ gj =
nj
nj
Vj
G j = ∑ log 2 ∆ ij
i =1
m
V = ∏V j
∆ aj =
j =1
∆g =
n
V
τj =
m
G = ∑Gj
j =1
n
1
=
n j Pj
r=
∆ gj
∆ aj
∆g
D
≤1
m
∆g = ∏
nj
∆ gjn
j =1
m
g =∑
j =1
nj
n
log ∆ gj
g = log ∆ g
nj
m
D = ∏ ∆ ajn
j =1
nj
m
I =∑
j =1
n
m
log ∆ aj
H = −∑ Pj log Pj
j =1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.В. Верховин, А.С. Гуменюк
52
4. Отображение музыкального текста строем его компонентов
(строй нот и строй Ф-мотивов)
Определим некоторые понятия и характеристики строя цепи применительно
к музыкальному тексту. Строй музыкального текста – это строй цепи событий,
в качестве которых выступают символы (или их группировки) нотной записи.
В данной работе при рассмотрении строя музыкального текста будут различаться
интервалы двух видов: ∆нij – интервал между i-м и (i+1)-м вхождениями ноты j-й
однородной цепи, ∆Фij – интервал между i-м и (i+1)-м вхождениями Ф-мотива j-й
однородной цепи. Соответственно обозначим удаленности этих элементов: для
ближайших выделенных нот log∆нij, для Ф-мотивов – log∆Фij. Кроме того, будем
различать средние геометрические интервалы ∆нgj в однородных цепях нот, ∆Фgj в
однородных цепях Ф-мотивов и соответственно – их удаленности нот log∆нgj и Фмотивов log∆Фgj и, наконец, средние геометрические интервалы в строе музыкального текста ∆нg между любыми двумя ближайшими одинаковыми нотами, и ∆Фg
между любыми двумя ближайшими одинаковыми Ф-мотивами, и соответственно
удаленности нот log∆нg и Ф-мотивов log∆Фg.
5. Характеристики зависимости однородных цепей
В работе модифицированы представленные в [9] характеристики зависимости
пары однородных цепей (j-й и l-й), взятых из состава данной неоднородной цепи.
В этой модификации для учета частоты встречи выделенного события «причина –
следствие» (l/j) в данной знаковой цепи длиной n коэффициент частичной зависимости K1(l/j) [9] следует умножить на эту частоту. В результате получим нормированный коэффициент частичной зависимости в виде
K1н ( l / j ) = (n ( l / j ) / nl ) ⋅ υ ( l j ) ⋅
n (l / j )
2n 2 ( l / j )
⋅ υ (l j ) .
или K1н ( l / j ) =
n2
nl ⋅ n
Для демонстрации адекватности значений коэффициента K1н определена полная матрица зависимости пронумерованных Ф-мотивов (табл. 2) для специально
сконструированной нотной записи (рис. 3), в которой выделена пара наиболее зависимых Ф-мотивов (Ф1,Ф2).
Таблица 2
Матрица нормированных коэффициентов зависимости Ф-мотивов
Ф1
Ф2
Ф3
Ф4
Ф5
Ф6
Ф1
0
0,115
0,0313
0,0365
0,0333
0
Ф2
0,4134
0
0,0238
0,0298
0,0208
0
Ф3
0,1333
0,15
0
0
0
0
Ф4
0,1111
0,1296
0,1481
0
0
0
Ф5
0,1111
0,1389
0,0556
0,0833
0
0
Ф6
-0,167
0
-1,333
-1,167
-0,667
0
Рис. 3. Нотная запись с выделенными наиболее зависимыми Ф-мотивами
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О средствах формального анализа структуры музыкальных текстов
53
6. Словарь Ф-мотивов
Для демонстрации некоторых возможностей представленного выше инструментария были специально отобраны 106 нотных записей одноголосных музыкальных произведений. Для каждой из них выполнена автоматическая сегментация и получен собственный словарь Ф-мотивов. На основе множества словарей
Ф-мотивов данных текстов построен общий частотный словарь. Мощность общего словаря – 1866 Ф-мотивов; общая длина 106 нотных записей 24764 Ф-мотива;
относительное число встреч самого частого Ф-мотива на множестве всех текстов
составляет 5,8%. Для примера приводится частотный словарь (рис. 4) одного небольшого музыкального произведения «Русская пляска». На этом рисунке представлены обозначения Ф-мотивов, их числа вхождений и нотные записи.
Рис. 4. Частотный словарь Ф-мотивов одноголосного произведения «Русская пляска»
Все музыкальное произведение записано строем Ф-мотивов ниже:
Ф1 Ф2 Ф1 Ф3 Ф1 Ф2 Ф4 Ф1 Ф2 Ф1 Ф3 Ф1 Ф2 Ф5 Ф6 Ф7 Ф8 Ф9
Ф10 Ф11 Ф12 Ф9 Ф13 Ф7 Ф12 Ф5 Ф10 Ф7 Ф7 Ф14 Ф15 Ф16 Ф2
Ф17 Ф18 Ф15 Ф19 Ф2 Ф20 Ф21 Ф22 Ф22 Ф22 Ф15 Ф15 Ф10
Ф20 Ф23 Ф24 Ф20 Ф17 Ф5 Ф24 Ф17 Ф25 Ф9 Ф7 Ф7 Ф5 Ф26
7. Значения характеристик строя и их распределения
для выборки музыкальных текстов
Для данных 106 одноголосных музыкальных произведений вычислены значения характеристик, представляющих структуру (состав и строй) музыкальных
текстов. Ниже приведена таблица значений этих характеристик для 7 музыкальных текстов (табл. 3).
Таблица 3
Значения характеристик 7 музыкальных текстов
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
54
А.В. Верховин, А.С. Гуменюк
В табл. 3 используются следующие обозначения: Lnote, L – длина музыкального текста соответственно в нотах, Ф-мотивах; Max P – частота встречи самого
частого Ф-мотива в тексте; Vp, Vt – фактическая и расчетная [1] мощности собственных словарей Ф-мотивов данного текста; ∆V % – различие Vp и Vt в процентах
к Vt; g – средняя удаленность любого Ф-мотива строя текста; H – (безусловная)
энтропия или количество идентифицирующих информаций Ф-мотива; G – глубина расположения строя текста; r – регулярность строя текста.
В работе получено распределение выборки 106 музыкальных произведений в
пространстве двух характеристик g и r. Изучение расположения точек на плоскости, представляющих отдельные музыкальные произведения, показывает очевидное отсутствие корреляционной (статистической) зависимости между характеристиками g и r. Кроме того, данное распределение представлет множество совершенно оригинальных пар числовых характеристик строя, которые очень компактно и однозначно описывают весьма сложные структуры отдельных музыкальных
произведений.
8. Изменения значений характеристик строя
при вариациях взаимного расположения Ф-мотивов
в отдельном музыкальном тексте (без изменения его состава)
Для примера выбран текст «Никколо Паганини – Каприз № 5», имеющий длину 460 Ф-мотивов. При малой деформации строя данного текста, когда менялись
местами два соседних разных Ф-мотива, фиксируются заметные различия значений глубины измененных однородных цепей этих Ф-мотивов (с G1=113,483 на
G1' = 112,705 и с G2 = 110,821 на G2' = 110,7655) и значений глубины строя для
всего текста (с G = 1138,853 на G' = 1137,901). Также произошли небольшие
изменения средней удаленности Ф-мотивов строя всего текста с g = 2,476 на
g' = 2,473, при этом энтропия текста не изменилась, так как не изменился его состав (H = H' = 3,744).
При большей деформации строя этого же текста, когда случайно менялись
местами первые 92 Ф-мотива (20 % текста), фиксировались заметные различия интегральных характеристик строя текста (глубина с G = 1138,853 на G' = 1179,353;
средняя удаленность с g = 2,476 на g' = 2,564), при этом энтропия текста не изменилась, так как не изменился его состав (H = H' = 3,744). Также произошли заметные изменения значений характеристик Gj для всех однородных цепей, попавших
в интервал деформации строя. Заметим, что любые деформации строя текста (без
изменения его состава) не приводят к изменению частотно-рангового распределения Ф-мотивов.
Заключение
Процедура сегментации нотной записи, предложенная М. Бородой, полностью
формализована и представлена алгоритмом. На его основе разработан и апробирован программный инструментарий, позволяющий в автоматическом режиме
отображать исходную нотную запись в музыкальный текст, составленный из
формальных мотивов.
Разработан и апробирован инструментарий для формального анализа строя
одноголосных музыкальных текстов, который предназначен для обнаружения
закономерностей построения (композиции) одноголосных музыкальных произведений. Данный инструментарий предполагается использовать как основу при
разработке средств анализа структуры полифонических текстов.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О средствах формального анализа структуры музыкальных текстов
55
Множество построенных собственных словарей 106 музыкальных текстов
представляет задел для формирования словаря формальных мотивов «языка» одноголосных музыкальных текстов.
Определены значения энтропийных характеристик и числовых характеристик
строя музыкальных текстов данной выборки. Множество значений последних является данными, отображающими новые свойства музыкальных произведений.
По нашему мнению, результаты представленных разработок дополнят неформальные средства при сочинении музыкальных произведений и при их подготовке
музыкантами к исполнению, а также при обучении музыке в музыкальных школах, училищах и консерваториях.
На наш взгляд, музыкальные произведения являются наиболее абстрактными
продуктами мышления отдельного человека, поэтому исследование и обнаружение закономерностей их построения (цепей акустических событий) следует использовать в области искусственного интелекта, в том числе для открытия функции мышления.
ЛИТЕРАТУРА
1. Орлов Ю.К. Частотные структуры конечных сообщений в некоторых естественных информационных системах: дис. ... канд. физ.-мат. наук. Тбилиси: Академия наук Грузинской ССР, 1974.
2. Зарипов Р.Х. Решение задач по гармонии и анализ гармонизации на цифровой вычислительной машине // Проблемы кибернетики: сб. М: Наука, 1967. № 18. С. 91–128.
3. Виноград А. Гиперметрическая регулярность в ритме смены гармонических функций на
примерах И.С. Баха // Музыкальный журнал «Израиль XXI»: Электронный научный
журнал. URL: http://21israel-music.com/Bach_Harmony.htm.
4. Левенштейн В.И. Двоичные коды с исправлением выпадений, вставок и замещений
символов // ДАН СССР. 1965. № 4. С. 845–848.
5. Gumenyuk A., Kostyshin A., Simonova S. An approach to the research of the structure of
linguistic and musical texts // Glottometrics. 2002. No. 3. С. 61–69.
6. Борода М.Г. К вопросу о метроритмической элементарной единице в музыке // Сообщение Академии наук Грузинской ССР. 1973. № 3. С. 71–72.
7. Верховин А.В., Гуменюк А.С. Об условиях формализации способа выделения элементарных мотивов в музыкальных текстах // Информационные технологии и автоматизация
управления: материалы научно-практической конференции (24−27 апр. 2012 г.). Омск,
2012. С. 129–132.
8. Верховин А.В. Алгоритм распознавания элементарных мотивов в музыкальных текстах //
Информационные технологии и автоматизация управления: материалы научно-практической конференции (24−27 апр. 2012 г.). Омск, 2012. С. 133–135.
9. Гуменюк А.С., Морозенко Е.В., Родионов И.Н. Формализация анализа строя знаковых
цепей // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 2(15). С. 15–23.
Верховин Антон Викторович
Гуменюк Александр Степанович
Омский государственный технический университет
E-mail: 007vav@mail.ru; gumas45@mail.ru
Поступила в редакцию 1 декабря 2012 г.
Verkhovin Anton V., Gumenyuk Alexander S. (Omsk State Technical University). On means of
formal analysis of the structure of musical text.
Keywords: musical text, F-motive, order of elements, characteristics.
Now practically there are no means of the formal analysis of structure of the musical text
which, in our opinion, is most naturally displayed by the original sequence of the elementary
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
56
А.В. Верховин, А.С. Гуменюк
motives representing the organized whole. Known methods of the analysis of structure of the
musical text usually consider features of structure of its components which are, as a rule, allocated
subjectively. Object of our research are musical texts, representing "natural" groups of notes –
elementary motives. There is proposed the algorithm of nselectio and recognition of such musical
components, constructed on the basis of the proposed by M. Borodoy procedure. Definition of a
system of any sign chain representing an original sequence of its elements is given. The new
abstract object – an order of the musical text, and numerical characteristics for its description is
entered. For research 106 musical texts have been specially selected, for each of them values of
order characteristics are obtained; dependences of a relative positioning of different elementary
motives are defined and revealed. The general frequency vocabulary for this sample of texts is
created. The program complex for research of an order of musical texts is constructed.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
УДК 519.217.2
Т.А. Гультяева, А.А. Попов
КЛАССИФИКАЦИЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
С ИСПОЛЬЗОВАНИЕМ СКРЫТЫХ МАРКОВСКИХ МОДЕЛЕЙ
В УСЛОВИЯХ НЕТОЧНОГО ЗАДАНИЯ ИХ СТРУКТУРЫ
Рассматривается задача классификации последовательностей с использованием методологии скрытых марковских моделей. Классификация проводится как с использованием стандартного подхода, так и с использованием
классификатора k ближайших соседей и метода опорных векторов в пространстве признаков, инициированных скрытыми марковскими моделями.
Исследовалось поведение классификаторов при ошибках в спецификации
структуры марковской модели.
Ключевые слова: скрытые марковские модели, производные от логарифма
функции правдоподобия, классификатор k ближайших соседей, метод опорных векторов.
Скрытые марковские модели (СММ) широко используются в задачах моделирования различных процессов, демонстрируя при этом хорошие описательные
способности. Построенные на обучающих выборках СММ используются также и
для задач классификации. Однако на этих задачах СММ не всегда показывают необходимый уровень дискриминирующих свойств.
В работе в качестве объектов классификации рассматривается множество смоделированных последовательностей, порожденных двумя близкими по своим параметрам СММ. Параметризация СММ проводится в соответствии с выбранной
их структурой, под которой будем понимать число скрытых состояний и размер
словаря наблюдаемых символов. В реальных ситуациях априорная информация о
структуре СММ, как правило, отсутствует. Задача структурной идентификации в
этом случае может быть поставлена, но на практике, как правило, она не решается
в полном объеме. Рассматривается возможность использования традиционного
классификатора на основе СММ, классификатора k ближайших соседей (kNN) и
метода опорных векторов (SVM) в пространстве признаков, инициированных обученными скрытыми марковскими моделями в условиях их структурной неопределенности.
1. Постановка задачи
СММ – это случайный процесс с ненаблюдаемой стационарной марковской
цепью. СММ описывается следующими параметрами [1]:
1. Вектор вероятностей начальных состояний
Π = {πi } , i = 1, N ,
где πi = P {q1 = i} , q1 – скрытое состояние в начальный момент времени t = 1 ; N –
количество скрытых состояний в модели.
2. Матрица вероятностей переходов
A = {aij } , i, j = 1, N ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.А. Гультяева, А.А. Попов
58
где aij = P {qt = j qt −1 = i} , t = 2, T , где T – длина наблюдаемой последовательности.
3. Матрица вероятностей наблюдаемых символов выглядит следующим образом:
B = {bi ( t )} , i = 1, N ,
где bi ( t ) = P {ot qt = i} , ot – символ, наблюдаемый в момент времени t = 1, T .
Рассматривается случай, когда функция распределения вероятностей наблюдаемых символов описывается смесью нормальных распределений
M
bi (t ) = ∑ τij
j =1
(
2πσij
)
−1 −( ot −μij )2 2σij2
e
, i = 1, N , t = 1, T ,
где τij – это вес j-й компоненты смеси в i-м скрытом состоянии, i = 1, N , j = 1, M ,
M – это количество смесей. Параметры μij и σij2 являются соответственно математическим ожиданием и дисперсией j-й компоненты смеси в i-м скрытом состоянии, i = 1, N , j = 1, M .
Таким образом, СММ полностью описывается матрицей вероятностей переходов, а также вероятностями наблюдаемых символов и вероятностями начальных
состояний: λ = ( A, B, π ) .
В работе рассматривает поведение традиционного классификатора, основанного на отношении логарифмов функций правдоподобия, классификаторов kNN и
SVM в условиях структурной неопределенности СММ. Один из возможных вариантов такой неопределенности заключатся в том, что исследователю точно не известно число скрытых состояний модели.
Метод ближайших соседей основан на оценивании сходства объектов. Классифицируемый объект относится к тому классу, которому принадлежит большинство из его соседей – k ближайших к нему объектов обучающей выборки. Этот
классификатор достаточно подробно описан, например в [2].
Основная идея метода опорных векторов – это перевод исходных векторов в
пространство более высокой размерности и поиск разделяющей гиперплоскости с
максимальным зазором в этом пространстве. Этот классификатор описан в [3].
2. Пространства признаков
В качестве пространств признаков, в которых производится классификация,
рассматриваются пространства первых производных от логарифма функции правдоподобия по различным параметрам СММ.
Приведем формулы для вычисления первых производных от логарифма функции правдоподобия по некоему параметру η (более подробно вывод формул приведен в [4−6]):
∂ ln L ( O λ ) K ⎛ T k −1 ∂ctk ⎞
= ∑ ⎜⎜ ∑ ct
⎟,
∂η
∂η ⎟⎠
k =1 ⎝ t =1
( )
где O = {O1 , O 2 , … , O K } , O k – k-я наблюдаемая последовательность длиной T,
K – количество последовательностей, ctk – параметр масштаба для последовательности Ok. В дальнейшем индекс k будем опускать для удобства.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Классификация последовательностей с использованием скрытых марковских моделей
59
−1
⎛ N
⎞
Учитывая, что ct = ⎜ ∑ αt (i ) ⎟ , формула для вычисления производной от па⎝ i =1
⎠
раметра масштаба по параметру η имеет вид
N
∂ct
∂α (i )
= −ct2 ∑ t ,
∂η
i =1 ∂η
где αt (i ) , t = 1, T , i = 1, N , – так называемая прямая переменная с масштабом [6].
Для вычисления производных
∂αt (i ) ∂αt (i )
∂αt (i )
,
и
, x, z = 1, N , y = 1, M ,
∂axz
∂μ xy
∂σ2xy
используются следующие формулы:
∂b (1)
∂α1 (i )
1 шаг.
= πi i
, i = 1, N ;
∂η
∂η
⎛ N
⎞ ∂b ( t + 1)
∂αt (i ) ⎛ N ∂αt′−1 ( j ) ⎞
,
a ji ⎟ bi ( t ) + ⎜ ∑ αt′−1 ( j )a ji ⎟ i
= ⎜∑
⎜
⎟
⎜
⎟
∂η
∂η
⎝ j =1 ∂η
⎠
⎝ j =1
⎠
∂αt′−1 ( j ) ∂сt −1
∂α ( j )
где
=
αt −1 ( j ) + t −1 ct −1 , i = 1, N , t = 1, T − 1 .
∂μ
∂μ
∂μ
∂b ( t )
Производные i
в зависимости от аргумента η имеют вид
∂η
2 шаг.
ot − μ xy
∂bi ( t )
∂bi ( t )
=0;
= τim
∂a xz
∂μ xy
σ2xy
где δim ( x, y ) =
{
1,
0,
∂bi ( t )
∂σ2xy
(
2πσim
)
−1 −( o −μ )2 2σ2
t
im
im
e
δim ( x, y ) ,
если i = x и m = y,
иначе;
=
τim
2 2πσim
( ot − μ xy )
2
σ4xy
− σ2xy
e −( ot −μim )
2
2
2σim
δim ( x, y ) .
3. Результаты
Исследования проводились при следующих условиях. Для моделирования последовательностей была выбрана цепь с N = 4 скрытыми состояниями. Рассматривалась задача двухклассовой классификации с моделями λ1 и λ 2 , определенными на одинаковых по структуре скрытых марковских цепях и различающимися
только в матрицах переходных вероятностей. Параметры моделей будем отличать
по их верхнему индексу.
Aλ1
⎛ 0.2 + d A
⎛ 0.2 0.5 0.3 0.05 ⎞
⎜
⎜ 0.2 0.25 0.5 0.05 ⎟
λ2
⎜ 0.2
A
=⎜
,
=
⎟
0.5
0.25
0.2
0.05
⎜ 0.5 − d A
⎜⎜
⎟⎟
⎜
0.2
0.25
0.5
0.05
⎝
⎠
⎝ 0.2
0.5 − d A
0.25 + d
0.25
0.25
A
0.3
0.5 − d
A
0.2 + d A
0.5
0.05 ⎞
⎟
0.05 ⎟
.
0.05 ⎟
⎟
0.05 ⎠
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.А. Гультяева, А.А. Попов
60
Параметры гауссовских распределений для модели λ1 и λ2 выбирались одинаковыми для каждой модели. Параметр dA, который можно варьировать в определенных пределах, определял степень близости конкурирующих моделей.
Таким образом, последнее скрытое состояние являлось своего рода шумовым:
вероятность перейти в него и остаться в нем очень мала.
Обучающие и тестовые последовательности моделировались по методу Монте-Карло. Для проведения экспериментов было сгенерировано по 5 обучающих
наборов последовательностей для каждого класса. К каждому набору этих последовательностей моделировалось по 500 тестовых последовательностей. Результаты классификации усреднялись.
Число скрытых состояний и количество компонент гауссовых смесей при моделировании последовательностей будем обозначать параметрами N и M, а параметры
рабочих моделей, используемых при обучении и тестировании, – как Nl и Ml.
На рис. 1 − 3 приведены графики, отражающие результаты классификации:
- для kNN в пространстве первых производных от логарифма функции правдоподобия по элементам матрицы переходных вероятностей имеют пунктирную линию;
- для SVM в этом же пространстве – имеют штриховую линию с короткими
штрихами;
- для SVM в объединенном пространстве (включаются все пространства по различным параметрам модели) – имеют штриховую линию с длинными штрихами;
- графики для традиционного подхода – сплошную линию.
%
%
90
90
80
80
70
70
60
50
0,0
60
а
0,1
0,2
0,3
dA
0,4
50
0,0
%
%
90
90
80
80
70
70
60
50
0,0
0,2
0,3
0,4
0,1
0,2
0,3
dA
50
0,0
dA
0,4
60
в
0,1
б
г
0,1
0,2
0,3
0,4
dA
Рис. 1. Зависимость среднего процента верно классифицированных последовательностей от параметра близостей моделей dA при M = 2 и при
Nl = M l = 2 (а); N l = M l = 3 (б); Nl = M l = 4 (в); Nl = M l = 6 (г)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Классификация последовательностей с использованием скрытых марковских моделей
61
На рис. 1 приведены зависимости среднего процента верно классифицированных последовательностей от параметра близостей моделей dA для случая, когда
моделирование производилось при N = 4 и M = 2 . Для рабочих моделей при
обучении и тестировании выбирались различные параметры Nl и Ml. На рис. 2 и 3
приведены аналогичные зависимости для M = 4 и M = 6 соответственно.
По рис. 1 можно отметить, что уже при Nl = M l = 3 у SVM- и kNN-классифика-
торов наблюдаются примерно такие же результаты, как Nl = M l = 6 , в то время как
традиционный классификатор показывает худшие результаты. Аналогичная картина наблюдается и на рис. 2 и 3 при Nl = M l = 4 . Таким образом, для классификации по производным, по всей видимости, не нужны особо точные оценки, в то время как для традиционного классификатора этот момент является критическим.
%
90
%
а
90
80
80
70
70
60
60
50
0,0
0,1
0,2
0,3
dA
0,4
50
0,0
%
%
90
90
80
80
70
70
60
50
0,0
0,2
0,3
0,4
0,1
0,2
0,3
dA
50
0,0
dA
0,4
60
в
0,1
б
г
0,1
0,2
0,3
0,4
dA
Рис. 2. Зависимость разности среднего процента верно классифицированных
последовательностей от параметра близостей моделей dA при M = 4 и при
N l = M l = 2 (а); N l = M l = 3 (б); N l = M l = 4 (в); N l = M l = 6 (г)
При увеличении параметра dA заметна общая тенденция к уменьшению выигрыша от использования классификаторов в пространстве производных. Это связано с тем, что традиционный классификатор при достаточном различии моделей
уже сам показывает хорошие результаты, близкие к 100 %. В то же время анализ
рис. 1 − 3 говорит о том, что чувствительность классификаторов kNN и SVM к
ошибкам спецификации структуры СММ несколько ниже, чем у традиционного
классификатора. Выигрыш от их использования составил: на рис. 1, а – до 14 %,
на рис. 2, а – до 18 %, на рис. 3, в – до 40 %. Общая тенденция такова: чем меньше
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.А. Гультяева, А.А. Попов
62
взято количество Nl и M l , тем больший выигрыш в точности классификации
можно получить, используя kNN или SVM.
%
90
%
а
90
80
80
70
70
60
60
50
0,0
0,1
0,2
0,3
0,4
dA
%
90
50
0,0
0,1
0,2
0,3
0,4
dA
0,1
0,2
0,3
0,4
dA
%
в
90
80
80
70
70
60
60
50
0,0
б
0,1
0,2
0,3
0,4
dA
50
0,0
г
Рис. 3. Зависимость среднего процента верно классифицированных последовательностей от параметра близостей моделей dA при M = 6 и при
N l = M l = 2 (а); N l = M l = 3 (б); N l = M l = 4 (в); N l = M l = 6 (г)
Традиционный классификатор показывает хорошие результаты, когда выбираются количества скрытых состояний и смесей Nl и M l большие, чем истинные
значения N и M.
Таким образом, когда нет возможности провести структурную идентификацию
СММ можно рекомендовать использовать классификатор kNN или SVM в пространстве первых производных от логарифма функции правдоподобия в силу их
меньшей чувствительности к такой ошибки спецификации структуры как недобор
числа скрытых состояний и компонент гауссовых смесей.
При выборе пространства производных по тому параметру, по которому генерирующие последовательности модели отличаются, выигрыш в сравнении с использованием объединенного пространства, получается максимально 4 % (рис. 1, а), 3%
(рис. 2, в), 6 % (рис. 3, б).
Классификатор SVM всегда показывает лучшие результаты, чем kNN в пространстве первых производных по элементам матрицы переходных вероятностей:
до 10 % (рис. 1, а), 16 % (рис. 2, б), 8 % (рис. 3, а). Кроме того, по рис. 2, а, б, 3, в
видно, что kNN при некоторых значениях параметра d A проигрывает традиционному классификатору.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Классификация последовательностей с использованием скрытых марковских моделей
63
Заключение
Исследования показали, что в условиях структурной неопределенности использование классификатора k ближайших соседей и классификатора, основанного на методе опорных векторов, приводит к повышению качества классификации
в сравнении с традиционным подходом, основанным на отношении логарифмов
функций правдоподобия. При этом прирост процентов верной классификации в
рассмотренной двухклассовой задаче в сравнении с традиционным подходом в
ряде случаев может достигать 40 % как для kNN, так и для SVM. Последний показывает более точные результаты в сравнении с kNN. Максимальное улучшение
достигает около 18 %.
ЛИТЕРАТУРА
1. Rabiner L.R. A tutorial on hidden markov models and selected applications in speech
recognition // Proc. IEEE. 1989. V. 77(2). P. 257−285.
2. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. Новосибирск: Изд-во Института математики, 1999. 270 с.
3. Platt J.C. Sequential minimal optimization: a fast algorithm for training support Vector
Machines [Электронный ресурс]: Technical Report MSR-TR-98-14; Microsoft Research.
URL: http://luthuli.cs.uiuc.edu/~daf/courses/Optimization/Papers/smoTR.pdf.
4. Гультяева Т.А. Вычисление первых производных от логарифма функции правдоподобия
для скрытых марковских моделей // Сб. научных трудов НГТУ. Новосибирск: Изд-во
НГТУ, 2010. № 2(60). С. 39−46.
5. Гультяева Т.А. Особенности вычисление первых производных от логарифма функции
правдоподобия для скрытых марковских моделей при длинных сигналах // Сб. научных
трудов НГТУ. Новосибирск: Изд-во НГТУ, 2010. № 2(60). С. 47−52.
6. Гультяева Т.А., Попов А.А. Классификация зашумленных последовательностей, порожденных близкими скрытыми марковскими моделями // Научный вестник НГТУ. Новосибирск: Изд-во НГТУ, 2011. № 3(44). С. 3−16.
Гультяева Татьяна Александровна
Попов Александр Александрович
Новосибирский государственный технический университет
E-mail: gult_work@mail.ru, alex@fpm.ami.nstu.ru
Поступила в редакцию 12 апреля 2012 г.
Gultyaeva Tatyana A., Popov Alexander A. (Novosibirsk State Technical University). Classification of sequences with use of hidden Markov models under conditions of the inexact task
of their structure.
Keywords: hidden Markov models, derivative of log likelihood function, classifier of k nearest
neighbors, support vector machines.
The problem of sequences classification with use of methodology of hidden Markov models
(HMM) is considered. Classification is spent both with use of the standard approach, and with
classifier of k nearest neighbors (kNN), and a support vector machines in space of the signs
initiated by HMM. The behavior of qualifiers was investigated while errors in the structure
specification of HMM are presented.
Researches have shown that under conditions of structural uncertainty use of qualifiers of k
nearest neighbors and the classifier based on a SVM, leads to improvement of classification
quality in comparison with the traditional approach based on the ratio of logarithms of likelihood
function. Thus the gain in correct classification in the considered two-class problem in
comparison with the traditional approach in some cases can reach 40 % both for kNN, and for
SVM. The last shows more exact results in comparison with kNN. The maximum improvement
reaches about 18 %.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
УДК 519.2
Ж.Н. Зенкова, И.В. Краковецкая
НЕПАРАМЕТРИЧЕСКАЯ ОЦЕНКА ТЁРНБУЛЛА
ДЛЯ ИНТЕРВАЛЬНО-ЦЕНЗУРИРОВАННЫХ ДАННЫХ
В МАРКЕТИНГОВОМ ИССЛЕДОВАНИИ СПРОСА
НА БИОЭНЕРГЕТИЧЕСКИЕ НАПИТКИ1
С помощью непараметрического алгоритма Тёрнбулла по интервальноцензурированным данным оценивается ожидаемая цена спроса на биоэнергетический напиток, выводимый на рынок томским предприятием НПК
«САВА». Диапазоны цен для анализа получены в результате масштабного
маркетингового исследования, включающего в себя несколько фокус-групп
и опросов. Работа носит междисциплинарный прикладной характер.
Ключевые слова: интервальное цензурирование, непараметрический алгоритм Тёрнбулла, маркетинговые исследования, ценообразование.
В процессе вывода нового продукта на рынок очень важно определить ту цену,
с которой производитель готов выйти на массового потребителя. При этом возникает ряд проблем, связанных с тем, что он не обладает достаточной информацией
о возможном уровне цен, так как предприятие не имеет накопленной статистики
по продажам, что вынуждает маркетологов пользоваться так называемым историческим методом, когда в основу анализа ложатся данные о продажах схожего по
свойству товара, уже выпускаемого фирмой. Нередко предприятие пытается организовать производство принципиально нового для него продукта, при этом основным, а зачастую и единственным ориентиром, является себестоимость конечного изделия. Однако этой информации явно недостаточно для определения рыночной цены. Тогда производитель вынужден прибегать к дорогостоящим инструментам маркетинговых исследований, таких, как фокус-группы, опросы, анкетирование потенциальной целевой группы потребителей и пр.
Полученные в итоге данные носят стохастический характер и требуют качественной статистической обработки. Особенно в случаях, когда наблюдения являются цензурированными, при этом использование классических методов приводит к неадекватным некорректным результатам.
В данной работе рассматривается вопрос определения цены потребительского
спроса на товар-новинку, в основу исследования положены интервальные данные
об ощущаемой ценности товара для потребителя, полученные в процессе многоэтапного маркетингового исследования. По результатам анализа фирме даны рекомендации о возможном уровне цены.
1. Непараметрическая оценка Тёрнбулла
для интервально-цензурированных данных
Неполные данные часто встречаются в медицинских, биологических, социальных и экономических исследованиях, в страховании, а также в инженерных задачах,
1
Работа выполнена в рамках государственного задания Минобрнауки РФ на проведение научных исследований в Томском государственном университете на 2012-2014 годы, задание 8.4055.2011.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Непараметрическая оценка Тёрнбулла для интервально-цензурированных данных
65
например при анализе надежности и времени отказа технических устройств [1−6].
Здесь рассматриваются интервально-цензурированные данные, возникающие при
проведении маркетинговых исследований, в частности в процессе работы фокусгрупп, при опросах и анкетировании, когда опрашиваемый не может или не хочет
указывать конкретное значение исследуемого показателя, например своего дохода,
а оперирует лишь некоторым промежутком. При этом нередко маркетологи обрабатывают полученные цензурированные выборки некорректно, игнорируя цензурированные значения или ориентируясь на одну из границ интервала, что в итоге приводит к неадекватным результатам, которые используются как основа при принятии
управленческих решений, чреватых финансовыми потерями.
Рассмотрим случайную величину (с.в.) τ > 0 с функцией распределения (ф.р.)
F ( x) = P(τ ≤ x) . Исходная выборка объема N состоит из интервалов вида
( Li , U i ] , i = 1, N , т.е. известно, что i-е наблюдение попало в промежуток ( Li , U i ] ,
но его точное значение неизвестно. Для оценивания ф.р. F ( x) рассмотрим разбиение 0 < τ0 < τ1 < … < τm , состоящее из всех неповторяющихся упорядоченных
границ интервалов Li и U i , i = 1, N . Заметим, что m ≤ 2N – 1. При этом m = 2N−1,
если все левые и правые границы интервалов не совпадают друг с другом.
Для j = 1, m и i = 1, N определяем вес
⎪⎧1, если ( τ j −1 , τ j ) ⊆ ( Li , U i ] ,
αij = ⎨
⎪⎩0, если ( τ j −1 , τ j ) ⊄ ( Li ,U i ].
Алгоритм Тернбулла заключается в следующем [1]: для произвольного шага
алгоритма k≥ 0
1. Вычисляем вероятность попадания с.в. τ в интервал ( τ j −1 , τ j ⎤⎦ по формуле
p kj = S ( k ) ( τ j −1 ) − S ( k ) ( τ j ) , j = 1, m .
2. Находим значение
N
⎛
d kj = ∑ ⎜ αij p kj
i =1 ⎝
m
⎞
∑ αis p k ⎟ ,
s
s =1
⎠
j = 1, m .
3. Для j = 1, m определяем
m
Y jk = ∑ d sk .
s= j
4. Производим перерасчет значения вероятности S ( k +1) ( τ j ) по формуле Каплана – Мейера [2]
j
Yik − d ik
i =1
Yik
S k +1 ( τ j ) = ∏
, j = 1, m ,
при этом S k +1 ( τ0 ) = 1 .
Алгоритм повторяем до тех пор, пока для всех j = 1, m не выполнится условие
S ( k +1) ( τ j ) − S ( k ) ( τ j ) ≤ 10−7 .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ж.Н. Зенкова, И.В. Краковецкая
66
Начальное значение p 0j , j = 1, m , определим как
p 0j =
1
.
m
В итоге значение ф.р. F(x) в точке τ j , j = 0, m , можно оценить как
FN ( τ j ) = 1 − S ( k +1) ( τ j ) .
Таким образом, для x ∈ ( τ j −1 , τ j ⎤⎦ , j = 1, m ,
FN ( x ) = FN ( τ j ) ,
(1)
для x ∈ [ 0, τ0 ] FN ( x ) = 0 .
Полученная оценка ф.р. является непараметрической и равномерно строго состоятельной [7] , т.е.
P sup FN ( x) − F ( x) → 0 = 1 .
{
N →+∞
x∈(0, +∞ )
}
Найдем оценку среднего значения исследуемого показателя
+∞
Eτ =
∫ xdF ( x)
(2)
0
методом подстановки в интеграл (2) оценки (1). Получим
Eˆ τ =
+∞
∫
0
m
xdFN ( x) =∑ τi ( FN ( τi ) − FN ( τi −1 ) ) .
(3)
i =1
Оценка (3) является асимптотически несмещенной.
2. Исследование рынка биоэнергетических напитков
и проблема коммерциализации нового продукта НПК «САВА»
В 2010 г. Сибирский ботанический сад Томского государственного университета (ТГУ) и компания ТПК «САВА» создали малое инновационное предприятие
«Научно-производственная компания (НПК) "САВА"». Основной целью компании является вывод на рынок нового натурального биоэнергетического напитка
на основе фитоадаптогенов, которые относятся к конкурентоспособным продуктам питания с высокой пищевой и биологической ценностью [8].
В ходе маркетинговых исследований выявлен портрет потенциальных потребителей – это молодые люди, в основном мужчины (80 %) в возрасте 16−35 лет,
жители средних и больших городов, ведущие активный образ жизни, занятые в
различных сферах деятельности: менеджеры, специалисты отраслей, требующих
повышенной концентрации внимания, спортсмены, автомобилисты и студенты.
Несмотря на рост рынка энергетиков в целом [9], рынок натуральных энергетических напитков в России в настоящее время находится в стадии становления,
поэтому на нем можно наблюдать такой большой разброс цен – от 33 до 1600 руб.
за литр.
Заметим, при установлении цены на новые товары существует определенный
диапазон цен, внутри которого может действовать производитель [6]. Нижняя его
граница определяется себестоимостью товара, а верхняя – платежеспособным
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Непараметрическая оценка Тёрнбулла для интервально-цензурированных данных
67
спросом. Один из простейших методов ценообразования на новые товары – предложение товара потребителям «на пробу» с последующим опросом их в отношении приемлемой цены.
3. Применение алгоритма Тёрнбулла для исследования цены
потребительского спроса на биоэнергетический напиток НПК «САВА»
В процессе фокус-группы было проведено анкетирование потенциальных потребителей продукции НПК «САВА». Участникам предлагалось указать диапазон
для цены, которую они готовы заплатить за биоэнергетический напиток. В результате были получены данные по ценовым предпочтениям. Исходные интервалы представлены в табл. 1. С помощью алгоритма Тёрнбулла были вычислены вероятности pj. Полученные значения pj и соответствующие им интервалы (τ j −1 , τ j ]
представлены в табл. 2.
Таблица 1
Исходные интервальные данные по ценам
№
Левая граница
Правая граница
цены Li , руб./шт. цены U i , руб./шт.
1
2
3
4
5
6
7
8
9
10
11
12
13
18
25
48
28
23
29
28
18
28
25
48
16
28
22
29
52
32
27
33
32
22
32
29
52
20
32
№
Левая граница
Правая граница
цены Li , руб./шт. цены U i , руб./шт.
14
15
16
17
18
19
20
21
22
23
24
25
26
48
48
58
48
43
28
48
58
48
38
48
38
46
52
52
62
52
47
32
52
62
52
42
52
42
50
Таблица 2
Значения вероятностей и соответствующие им временные интервалы
τ j −1
τj
pj
FN ( τ j )
18
20
23
25
28
29
38
43
46
48
50
58
20
22
25
27
29
32
42
46
47
50
52
62
0,085
0,021
0,01
0,052
0,173
0,089
0,077
0,012
0,036
0,251
0,067
0,077
0,085
0,106
0,116
0,168
0,341
0,430
0,507
0,519
0,555
0,806
0,873
0,950
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ж.Н. Зенкова, И.В. Краковецкая
68
График оценки ф.р. F ( x) приведен на рис. 1.
F(x)
0,8
0,6
0,4
0,2
0
0
10
20
30
40
Цена товара, руб./шт.
50
60
70
Рис. 1. График оценки ф.р. F ( x)
Используя полученную оценку ф.р., по формуле (3) найдем выборочную среднюю цену напитка Eˆ τ = 36,87 руб./шт.
Заключение
В результате проделанной работы получена оценка ощущаемой ценности биоэнергетического напитка НПК «САВА» потенциальными потребителями с помощью непараметрического алгоритма Тёрнбулла на основе интервально-цензурированных данных. Зная, что в процессе подобных исследований цена неизбежно
занижается, производитель должен ориентироваться не столько на себестоимость
товара, сколько на полученное значение потребительской цены, скорректированной с учетом рыночного коэффициента k > 1 , при этом значение коэффициента
выявляется в ходе дальнейшего исследования рынка с помощью пробного маркетинга [11]. Таким образом, в работе была получена минимальная рекомендованная рыночная цена нового биоэнергетического напитка НПК «САВА».
Заметим, что российские маркетологи зачастую ошибочно применяют статистический инструментарий, в итоге это приводит к искаженному пониманию многих экономических и социальных процессов и, следовательно, к финансовым потерям предприятия за счет «плохих» управленческих решений. Рассмотренный
подход может устранить этот пробел в отношении оценивания многих показателей, базирующихся на интервально-цензурированных данных, и найти широкое
применение в бизнес-практике, позволяя адекватно оценить не только предпочитаемую потребителями цену, но и другие важные количественные характеристики, используемые в маркетинге.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Непараметрическая оценка Тёрнбулла для интервально-цензурированных данных
69
ЛИТЕРАТУРА
1. Giolo S.R., Turnbull’s N. Estimator for interval-censored data // Technical Report, August,
2004.
2. Klein J.P., Moeschberger M.L. Survival Analysis: Techniques for Censored and Truncated
Data. Springer, 2010. 551 p.
3. Анализ надежности технических систем по цензурированным выборкам / В.М. Скрипник, А.Е. Назин, Ю.Г. Приходько, Ю.Н. Благовещенский. М.: Радио и связь, 1988.
184 с.
4. Zhao, Guolin M.A. Nonparametric and parametric survival analysis of censored data with
possible violation of method assumptions // Thesis Submitted to the Faculty of the Graduate
School at the University of North Carolina at Greensboro in Partial Fulfillment of the
Requirements for the Degree Master of Arts. Greensboro, 2008. 55 p.
5. Franses Ph..H., Paap R. Quantitative Models in Marketing Research. Cambridge University
Press, 2001. 206 p.
6. Blattberg R.C., Kim P., Kim B., Neslin S.A. Database Marketing: Analyzing and Managing
Customers. Springer, 2008. 871 p.
7. Chang M.N., Yang G.L. Strong consistency of a nonparametric estimator of the survival
function with doubly censored data // The Annals of Statistics. 1987. V. 15. No. 4.
P. 1536−1547.
8. НПК «Сава» готовится к производству натуральных биоэнергетических напитков.
http://incubator.tsu.ru/taxonomy/term/1?page=1 [режим доступа – свободный]
9. Анализ рынка энергетических напитков в России в 2005−2010 гг., прогноз на 2011−
2014 гг. Отчет о результатах маркетингового исследования компании BusinesStat.
http://marketing.rbc.ru [режим доступа – свободный]
10. Mapeнкoв Н. Особенности установления цен на новые товары. http://www.inventech.ru/
lib/cost/cost-0014/ [режим доступа – свободный]
11. Панкрухин А.П. Маркетинг: учебник. М.:ИКФ Омега-Л, 2002. С. 272−273.
Зенкова Жанна Николаевна
Краковецкая Инна Валентиновна
Томский государственный университет,
Томский политехнический университет
E-mail: thankoff@fpmk.tsu.ru; inna_krakov@mail.ru
Поступила в редакцию 5 мая 2012 г.
Zenkova Zh.anna N., Krakovetckaia Inna V. (Tomsk State University, Tomsk Polytechnic
University). Nonparametric Turnbull estimator for interval-censored data in the marketing
research of the demand of bio-energy drinks.
Keywords: interval-censored data, the nonparametric Turnbull algorithm, marketing research,
price formation
Using the nonparametric Turnbull algorithm for interval-censored data there is estimated the
expected price of the demand for bio-energy drink that will be commercialized by Tomsk’s firm
«SAVA». The price ranges for the analysis are the result of large-scale marketing research, which
includes several focus groups and surveys. The lower bound of recommended price of the new
product has been obtained.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
УДК 519.21
А.В. Зорин
ОПТИМИЗАЦИЯ ПАРАМЕТРОВ УПРАВЛЕНИЯ КОНФЛИКТНЫМИ
ПОТОКАМИ В КЛАССЕ ЦИКЛИЧЕСКИХ АЛГОРИТМОВ1
Рассматривается процесс управления с потерями конфликтными потоками в
классе циклических алгоритмов с динамическим выбором длительностей состояний прибора. Качество функционирования системы оценивается по скорости роста средней стоимости пребывания всех требований в системе. Построена математическая модель системы в виде управляемой цепи Маркова
с доходами. С помощью вычислительных экспериментов изучаются свойства оптимального управления.
Ключевые слова: конфликтные входные потоки, управляющая система
массового обслуживания, управляемая цепь Маркова с доходами.
Входные потоки многих реальных систем массового обслуживания являются
конфликтными. На содержательном уровне конфликтность означает, что требования различных потоков не могут обслуживаться одновременно и что путем сложения входных потоков нельзя существенно уменьшить их число. Для управления конфликтными потоками в настоящее время используется много разнообразных алгоритмов: циклические, пороговые, циклические с продлениями, с динамическими приоритетами и т.д. [1 – 11]. С целью разрешения конфликтности в процесс функционирования обслуживающего устройства вводятся этапы переналадок, во время которых требования не обслуживаются.
Для управления конфликтными транспортными потоками на регулируемых
перекрестках во многих странах мира используются целые компьютеризированные комплексы, включающие в себя детекторы, видеонаблюдение, и т.д., Такой
комплекс способен как осуществлять мониторинг текущей ситуации на дорогах
(моменты прибытия машин к стоп-линиям, число ожидающих переезда машин по
каждой полосе, и т.д.), так и выбирать один из нескольких возможных алгоритмов
управления, наиболее подходящий к текущей дорожной ситуации. С теоретической точки зрения важно уметь генерировать такие алгоритмы в ходе теоретического решения некоторых оптимизационных модельных задач. В работе [1] постановка и решение этой задачи искались в классе алгоритмов с динамическими
приоритетами. Экономический критерий задавал среднее время пребывания всех
требований в системе за один такт.
В некоторых реальных системах массового обслуживания важно, чтобы поведение управляющего устройства было предсказуемым с точки зрения требований.
Например, участники дорожного движения ожидают, что светофор предоставляет
возможность проезда последовательно каждому из потоков и отклонения от такой
последовательности может быть воспринято как поломка светофора и, вследствие
этого, стать причиной дорожно-транспортных происшествий. Следовательно,
1
Работа была выполнена в рамках госбюджетных НИР ННГУ «Математические моделирование и создание новых методов анализа эволюционных систем и систем оптимизации» (№ государственной регистрации НИР 01201252499) и проекта РФФИ № 12-01-90409 «Моделирование и анализ систем
управления взаимодействующими транспортными потоками высокой интенсивности».
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимизация параметров управления конфликтными потоками
71
представляет интерес изучения циклических алгоритмов с переменными длительностями обслуживаний и переналадок. В качестве экономического критерия естественно рассматривать среднее время пребывания всех требований в системе за
один цикл.
1. Постановка задачи
Пусть в систему массового обслуживания с потерями поступают m < ∞ конфликтных входных потоков Π1, Π2, …, Πm. В течение промежутка времени ∆,
0 < ∆ <∞, с вероятностью λ j поступает одно требование потока Π j, а с вероятностью
1 − λ j требование не поступает, j = 1, 2, …, m. Непосредственно момент поступления требования не наблюдается. Требования потока Π j помещаются в накопитель
O j конечной емкости Nj < ∞. Обслуживающее устройство имеет 2m состояний Γ(1),
Γ(2), …, Γ(2m). В состоянии Γ(2j − 1) обслуживаются только требования потока Π j, что и
означает конфликтность потоков; в состоянии Γ(2j) требования не обслуживаются и
осуществляется переналадка. За промежуток времени ∆ в состоянии Γ(2j − 1) завершается обслуживание одного требования из очереди O j с вероятностью β j и обслуженное требование покидает систему, причем момент окончания обслуживания тоже не наблюдается непосредственно либо с вероятностью 1 − β j обслуживание не
завершается. Обслуживающее устройство сменяет состояния по циклическому закону: Γ(1) → Γ(2) → → … → Γ(2m) → Γ(1) → … . Обслуживающее устройство может
функционировать в одном из n режимов. В режиме r, r = 1,2,…,n, длительность
пребывания прибора в состоянии Γ(s), s = 1, 2, …, 2m, не случайна и равна Ts,r ∆.
Промежуток времени, в течение которого обслуживающее устройство последовательно проходит через все состояния от Γ(1) до Γ(2m) включительно, называется циклом. Режим выбирается в начале цикла, то есть в момент времени 0 и в момент смены состояния с Γ(2m) на Γ(1). Правило выбора нового режима определяется отображением u(⋅) целочисленной решетки X = {0, 1, …, N1} × {0, 1, …, N2} × … × {0, 1, …,
Nm} во множестве {1, 2, …, n}. Если длины очередей описываются вектором (x1, x2,
…, xm) ∈ X, то выбирается режим с номером r = u(x). Таким образом, в данной задаче возможно лишь конечное число различных управлений. Определим потери системы за промежуток времени ∆ как суммарное время пребывания в системе всех
требований на этом промежутке. Требуется выбрать такое управление, которое минимизирует предельную скорость роста суммарных потерь за i >> 1 промежутков
при неограниченном времени функционирования системы (т.е. при i → ∞). Другие
задачи оптимизации при циклическом управлении рассматривались, например, в [4,
8, 9, 12].
Приведенное выше формализованное
описание управляемой системы массового
обслуживания может быть проиллюстрировано следующим примером. Рассмотрим регулируемое светофором пересечение транспортных магистралей, изображенное на
рис. 1. В этом частном случае m = 2. Входные потоки Π1, Π2 автомобилей являются
конфликтными. Для разрешения конфликтности в режиме переналадки используется
желтый свет светофора. Также естественно Рис. 1. Перекресток автомагистралей,
предположить, что перед стоп-линиями имеуправляемый светофором
ется лишь конечное число мест ожидания.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.В. Зорин
72
2. Построение математической модели
Будем наблюдать систему в дискретные моменты времени 0, ∆, 2∆, …. Пусть
случайная величина κj,i задает число требований в накопителе O j в момент i ∆,
случайная величина ηj,i – число требований потока Π j, поступивших за промежуток времени (i ∆, (i + 1) ∆], случайная величина ξj,i – виртуальное число обслуженных требований из накопителя O j за промежуток времени (i ∆, (i + 1) ∆] в
предположении наличия достаточного числа ожидающих требований в очереди, а
случайный элемент Γi ∈ {Γ(1), Γ(2), …, Γ(2m)} – состояние обслуживающего устройства на промежутке ((i − 1) ∆, i ∆]. Введем также случайные вектор
κi = (κ1,i, κ2,i, …, κm,i). Из постановки задачи на содержательном уровне следует,
что динамика формирование очереди O j из потока Π j на интервале времени
(i ∆, (i + 1) ∆] задается следующим рекуррентным соотношением:
κj,i + 1 = min{Nj, max{0, κj,i + ηj,i − ξj,i }}.
Обозначим T(r) = T1,r + T2,r + … + T2m,r. Пусть τ(0) = 0 и τ(i + 1) = τ(i) + T(r) при
u(κτ(i)) = r. Тогда имеет место равенство Γi = Γ(s), если для целого θ имеют место
неравенства
τ(θ) + T1,r + T2,r + … + Ts−1,r ≤i < τ(θ) + T1,r + T2,r + … + Ts,r .
Более того, случайные элементы Γτ(i), i = 0, 1, …, совпадают. Входные потоки и
потоки насыщения удобно задавать с помощью свойств условных распределений
точечных процессов {(i ∆, ηj,i); i = 0, 1, …} и маркированных точечных процессов
{(i ∆, ξj,i, νi); i = 0, 1, …} с меткой νi = Γi требований на интервале (i ∆, (i + 1) ∆].
Случайная величина ηj,i принимает значение δ ∈ {0, 1} с вероятностью
λjδ(1 − λj)1−δ; величины ηj,0, ηj,1, … независимы. Случайная величина ξj,i принимает значение δ ∈ {0, 1} с вероятностью βjδ(1 − βj) 1−δ если Γi = Γ(2j − 1), а в остальных
случаях ξj,i = 0.
Теорема. При заданном распределении вектора κ0 последовательность
(1)
{κτ(i); i = 0, 1, …}
является однородной цепью Маркова
Сделаем следующие обозначения:
при k = l = 0,
⎧1 − λ j + λ j β j
⎪(1 − λ )(1 − β ) + λ β при k = l = 1, 2 , … , N − 1,
j
j
j j
j
⎪
⎪
(1
−
λ
)
β
при
−
1
=
=
0,
1
,
,
k
l
N j − 1,
…
j
j
pk( ,jl) = ⎨
при k + 1 = l = 1, 2 , … , N j ,
⎪λ j (1 − β j )
⎪1 − β j + λ j β j
при k = l = N j ,
⎪
при k ≠ l и k ≠ l ± 1;
⎩0
qk( ,jl)
⎧1 − λ j
⎪λ
⎪
=⎨ j
⎪1
⎪⎩0
при k = l = 0, 1 , … , N j − 1,
при k + 1 = l = 1, 2 , … , N j ,
при k = l = N j ,
при k ≠ l и k ≠ l − 1.
Здесь величина pk( ,jl) есть вероятность выполнения равенства κj,i + 1 = l при условии
κj,i = k и Γi = Γ(2j − 1), а величина qk( ,jl) есть вероятность выполнения равенства
κj,i + 1 = l при условии κj,i = k и Γi ≠ Γ(2j − 1). Пусть, например, k = l = 0 и Γi = Γ(2j − 1),
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимизация параметров управления конфликтными потоками
73
тогда равенство 0 = min{Nj, max{0, ηj,i − ξj,i }} может иметь место в одном из двух
случаев: либо ηj,i = 0, либо ηj,i = ξj,i = 1. Соответствующая вероятность есть
1 − λj + λjβj. Остальные случаи доказываются аналогично. Обозначим через P(j),
Q(j) матрицы чисел pk( ,jl) , qk( ,jl) . Пусть P(j)(a), Q(j)(a) суть a-е степени матриц P(j) и
Q(j) соответственно, a = 0, 1, … . Тогда переходная вероятность цепи Маркова (1)
для x ∈ X, u(x) = r и w = (w1, w2, …, wm) ∈ X имеет вид
m
(
P({ω : κ τ(i +1) = w} | {ω : κ τ(i ) = x}) = ∏ ⎡⎣ Q ( j ) (T1, r + T2, r + … + T2 j − 2,r ) ×
j =1
×P ( j ) (T2 j −1, r )Q ( j ) (T2 j , r + T2 j +1, r + … + T2 m, r )
) x ,w ⎤⎥⎦ ,
j
(2)
j
где запись (⋅)k,l обозначает элемент k-й строки и l-го столбца указанной в скобках
матрицы. Из вида переходных вероятностей (2) следует, что состояния цепи
Маркова (1) принадлежат единственному эргодическому классу при любом
управлении.
Пусть случайная величина ζj,i измеряет время пребывания всех требований в
очереди Oj на промежутке времени (i ∆, (i + 1) ∆]. Математическое ожидание времени пребывания всех требований в системе за промежуток времени (τ(i),
τ(i + 1)], заключающий в себе один цикл работы обслуживающего устройства, и
при условии κτ(i) = x определяется выражением
m T ( r ) −1
zi ( x) = ∑
∑
j =1 t = 0
E(ζ j , τ(i ) | {ω : κ τ( s ) = x}) ,
r = u(x).
С экономической точки зрения время ожидания представляет потери управляемой
системы массового обслуживания. Поскольку моменты поступления требований и
моменты окончания обслуживания требований непосредственно не наблюдаются,
будем считать их равномерно распределенными в соответствующих интервалах.
Поэтому ниже речь будет идти, на самом деле, об оценках для соответствующих
экономических показателей обслуживания. Итак, для вычисления величин zi(x),
x ∈ X, обозначим
при k = l = 1, 2, … , N j ,
⎧k ∆
⎪
( j)
g k ,l (∆ ) = ⎨k ∆ + ∆ / 2 при k + 1 = l = 1, 2, … , N j ,
⎪0
при k ≠ l , k ≠ l − 1 или k = l = 0;
⎩
⎧λ j β j ∆ / 4(1 − λ j + λ j β j )
⎪k ∆
⎪⎪
hk( ,jl) (∆) = ⎨k ∆ + ∆ / 2
⎪k ∆ − ∆ / 2
⎪
⎩⎪0
Здесь величина
g k( ,jl) (∆ )
при k = l = 0,
при k = l = 1, 2, … , N j ,
при k + 1 = l = 1, 2, … , N j ,
при k − 1 = l = 0 , 1, … , N j − 1,
при k ≠ l , k ≠ l ± 1.
есть математические ожидание времени, проведенного в
системе требованиями из очереди Oj и поступившим требованием из потока Πj за
промежуток времени вида (i ∆, (i + 1) ∆] при условии, что за этот промежуток
число требований в очереди сменилось с k на l и очередь Oj не обслуживалась.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.В. Зорин
74
Величина hk( ,jl) (∆) есть математические ожидание времени, проведенного в системе требованиями из очереди Oj и поступившим требованием из потока Πj за промежуток времени вида (i ∆, (i + 1) ∆] при условии, что за этот промежуток число
требований в очереди сменилось с k на l и очередь Oj обслуживалась. Пусть
T(r) = {1, 2, …, T(r)}, T(j,r) = {T2j,r + T2j+1,r + … +T2m,r +1, T2j,r + T2j+1,r + … + T2m,r + 2,
…, T2j−1,r + T2j,r + T2j+1,r + + … +T2m,r}. Определим последовательно
Hl(j,r)(0) = 0,
H l( j , r ) (i ) =
(r)
при i ∈ T \ T
Nj
∑ ql(,kj ) ( gl(,kj ) (∆) + H k( j ,r ) (i − 1) )
k =0
(j,r)
,
H l( j , r ) (i ) =
Nj
∑ pl(,kj ) ( hl(,kj ) (∆) + H k( j ,r ) (i − 1) )
k =0
при i ∈ T(j,r). Тогда, в силу марковского свойства,
m
zi ( x) = ∑ H x( j , r ) (T ( r ) ) , u(x) = r.
j =1
j
(3)
Рекуррентные соотношения (2) и (3) задают марковскую цепь с доходами [13].
Известно [13], что потери за in шагов имеют асимптотическое выражение
α(x) + g i + o(1),
где o(1) → 0 при i → ∞, константа α(x) зависит от начального состояния x ∈ X.
Величина g не зависит от начального состояния и называется предельными одношаговыми потерями. Для отыскания оптимальной функции переключения u(⋅) естественно воспользоваться алгоритмом Ховарда [13].
3. Результаты численных экспериментов
Для проведения численных экспериментов использовался язык высокого
уровня Octave [14]. Была написана программа, реализующая алгоритм Ховарда.
В экспериментах изучался случай двух конфликтных входных потоков (m = 2) и
тремя режимами (d = 3). Были выбраны следующие значения числовых параметров: λ1 = 0,1, λ2 = 0,05, β1 = 0,6, β2 = 0,65, T1,1 = 6, T2,1 = T4,1 = 4, T3,1 = 10, T1,2 = 10,
T2,2 = T4,2 = 4, T3,2 = 6, T1,3 = T3,3 = 8, T2,3 = T4,3 = 4. При таком выборе длительностей
состояний прибора общая длина цикла 24 остается постоянной, а среднее число
поступивших требований за цикл по каждому потоку не превосходит среднего
числа требований потока насыщения: λ j T < β j T2j−1,r . Оптимальные правила
выбора управления при переменных размерах (N1 = N2 = 10, N1 = N2 = 20,
N1 = N2 = 40) накопителей представлены на рис. 2 и 3. Кружок белого цвета означает выбор при данных длинах очередей первого режима, кружок черного цвета –
второго режима, треугольник серого цвета – третьего режима. Хотя интенсивности входных потоков различаются в два раза, границы смены режимов на всех
трех рисунках близки к линейным и проходят вблизи биссектрисы первого квадранта. Кроме того, третий режим рекомендуется включать, только если длины
очередей практически равны. Целевая функция (предельная скорость роста потерь) в указанных трех случаях оказалась приближенно равна 27,842. Интересно,
что если отказаться от третьего режима (d = 2), то значение целевой функции ока-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимизация параметров управления конфликтными потоками
75
зывается равным 27,899. Однако использование только третьего режима (d = 1)
дает предельные потери в размере 31,717, что на 13,7 % хуже оптимального.
Можно заключить о достаточности двух режимов обслуживания при данных интенсивностях входных потоков и интенсивностях обслуживания.
x2
0
x2
x1
0
x1
Рис. 2. Вид оптимального управления при емкостях накопителей N1 = N2 = 10 (слева),
N1 = N2 = 20 (справа). Остальные параметры указаны в тексте
x2
0
x2
x1
Рис. 3. Вид оптимального управления при
емкостях накопителей N1 = N2 = 40 (остальные параметры указаны в тексте)
0
x1
Рис. 4. Вид оптимального управления при
емкостях накопителей N1 = N2 = 40, интенсивных входных потоках и двух режимах с
оптимальными длительностями (остальные
параметры указаны в тексте)
Естественно поставить задачу о выборе оптимальных параметров режимов T1,1,
…, Tm,d . Рассмотрим случай двух режимов (d = 2). Пусть входные потоки характеризуются параметрами λ1 = 0,2, λ2 = 0,15, длительность цикла T(r) = T постоянна, а длительности переналадок равны между собой, T2,1 = T4,1 = T2,2 = T4,2. Пусть,
далее, в первом меньше времени отдается на обслуживание первого потока, а во
втором режиме – на обслуживание второго потока (неравенства нестрогие). Тогда
перебором значений T1,1 в диапазоне от 1 до T − 2T1,2 и значений T3,2 в диапазоне
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
76
А.В. Зорин
от 1 до T − 2T2,2 можно установить такие, при которых величина g принимает
наименьшее значение. В частности, при λ1 = 0,1, λ2 = 0,05, указанных выше значениях интенсивностей обслуживания, при длине цикла T = 24 и длительностях переналадки T2,1 = T4,1 = T2,2 = T4,2 = 4 оптимальными оказываются значения T1,1 = 7,
T3,1 = 9, T1,2 = 11, T3,2 = 5. Вид оптимальной функции переключения в этом случае
приведен на рис. 4, а значение g = 144,35. Замечательно, что в первом режиме
среднее число поступивших за цикл требований из первого потока λ1 T = 4,8
больше среднего числа требований потока насыщения β 1T1,1 = 4,2, а во втором
режиме аналогичная ситуация имеет место для второго потока:
λ2 T = 3,6 > β 2T3,2 = 3,25, то есть очереди оказываются перегруженными. Тем не
менее эта комбинация режимов является квазиоптимальной. Первый режим выбирается, когда длина первой очереди мала по сравнению с длиной второй очереди, а второй режим выбирается, когда мало число требований во второй очереди.
С другой стороны, поведение оптимального правила переключения в правом
верхнем углу рис. 4 является результатом влияния границ: заполненность одной
очереди становится дополнительным источником контроля. Наконец, стоит отметить, что рис. 4 отличается от рис. 2 и 3 существенно отличной от линейной
формой границы, что часто наблюдалось нами при высокоинтенсивных входных
потоках.
Заключение
В данной работе была построена математическая модель и разработаны программные средства оптимизации режимов обслуживания конфликтных потоков в
классе циклических алгоритмов. Основной результат работы состоит в демонстрации того, что наличие нескольких наборов параметров циклического алгоритма
обслуживания может снизить среднее время пребывания требований конфликтных потоков в системе за цикл.
ЛИТЕРАТУРА
1. Неймарк Ю.И., Федоткин М.А., Преображенская А.М. Работа автомата с обратной
связью, управляющего уличным движением на перекрестке // Изв. АН СССР. Cер.
Техническая кибернетика. 1968. № 5. C. 129–141.
2. Кувыкина Е.В., Федоткин М.А. Изучение предельных свойств процесса управления
конфликтными потоками Бартлетта в классе однородных алгоритмов с ориентацией и
переналадками // Тез. докл. VII Белорусской зимней школы-семинара «Сети связи и сети ЭВМ как модели массового обслуживания». Минск: БГУ, 1991. C. 80, 81.
3. Кувыкина Е.В. Исследование систем управления конфликтными потоками Бартлетта в
классе однородных алгоритмов с упреждением. Горький: ГГУ, 1990. 56 с. Деп. в
ВИНИТИ, № 2972-В90.
4. Куделин А.Н., Федоткин М.А. Управление конфликтными потоками в случайной среде
по информации о наличии очереди. Нижегородский государственный университет им.
Н.И. Лобачевского. Н. Новгород, 1996, 22 с. Деп. в ВИНИТИ, № 1717-В96.
5. Куделин А.Н., Федоткин М.А. Предельные теоремы для систем управления потоками в
случайной среде в классе алгоритмов с упреждением. Нижегородский государственный университет им. Н.И. Лобачевского. Н. Новгород, 1996. 40 с. Деп. в ВИНИТИ,
№ 2593-В96.
6. Литвак Н.В., Федоткин М.А. Вероятностная модель адаптивного управления конфликтными потоками // Автоматика и телемеханика. 2000. № 5. C. 67–76.
7. Пройдакова Е.В., Федоткин М.А. Управление выходными потоками в системе с циклическим обслуживанием и переналадками // Автоматика и телемеханика. 2008. № 4.
C. 96–106.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оптимизация параметров управления конфликтными потоками
77
8. Федоткин М.А., Федоткин А.М. Анализ и оптимизация выходных процессов при циклическом управлении конфликтными транспортными потоками Гнеденко – Коваленко
// Автоматика и телемеханика. 2009. № 12. C. 92–108.
9. Голышева Н.М. Построение и исследование математической модели управления потоками в классе алгоритмов с дообслуживанием // Вестник Нижегородского университета им. Н.И. Лобачевского. 2010. № 6. C. 164–171.
10. Голышева Н.М. Оптимальное управление периодическими потоками Пуассона в случае
произвольного количества потоков // Вестник Нижегородского университета им.
Н.И. Лобачевского. № 1. 2011. C. 188–192.
11. Zorine A. Study of Queues' sizes in tandem intersections under cyclic control in random
environment // Modern Probabilistic Methods for Analysis of Telecommunication Networks.
Communications in Computer and Information Science. 2013. V. 356. P 206−215.
12. Зорин А.В. О среднем времени пребывания требований при циклическом управлении с
фиксированным ритмом // Материалы XI Международного семинара «Дискретная математика и ее приложения», посвященного 80-летию со дня рождения академика
О.Б. Лупанова (Москва, МГУ, 18−23 июня 2012 г.) / под ред. О.М. Касим-Заде. М.: Издательство механико-математического факультета МГУ. 2012. С. 122–125.
13. Ховард Р. Динамическое программирование и марковские процессы. М.: Сов. радио,
1964. 190 c.
14. Eaton J.W., Bateman D., Hauberg S. GNU Octave Manual Version 3. Network theory, Ltd,
2008. (http://www.octave.org/)
Зорин Андрей Владимирович
Нижегородский государственный университет
им. Н.И. Лобачевского
E-mail: zoav1602@gmail.com
Поступила в редакцию 7 марта 2013 г.
Zorine Andrei V. (N.I. Lobachevsky State University of Nizhni Novgorod). Optimization of
conflicting flows control parameters in the class of cyclic algorithms.
Keywords: conflicting input flows, queueing control system, controlled Markov chain with
incomes
A loss queueing control system is considered. The input flows of the system are conflicting.
We assume that one customer arrives from the j-th flow with probability λ j during a fixed-length
time slot ∆ and with probability 1 − λ j no customer arrives from this flow. When the j-th queue
is served, during a time slot ∆ either one customer from the queue leaves the system with
probability β j or with probability 1 − β j the service is not finished. The control is conducted in a
class of cyclic algorithms with dynamical choice of durations regime based on the queues lengths
at the beginning of a cycle. After each service period a re-adjustment period takes place. Both the
service period durations and the readjustment period durations are assumed multiples of ∆..
Arrival instants and exit instants are not directly observed. The control performance metric is the
mean growth rate of time losses from customers sojourn. A mathematical model is constructed as
a controlled Markov chain with incomes. A well-known Howard's algorithm is used to select the
optimal switching scheme for the cycle regimes. An optimization problem the for cycle
parameters is solved numerically.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
УДК 681.324
В.В. Кокшенев, П.А. Михеев, С.П. Сущенко
АНАЛИЗ СЕЛЕКТИВНОГО РЕЖИМА ОТКАЗА ТРАНСПОРТНОГО
ПРОТОКОЛА В НАГРУЖЕННОМ ТРАКТЕ ПЕРЕДАЧЕ ДАННЫХ
Предложена модель асинхронной процедуры управления виртуальным соединением транспортного протокола в режиме селективного отказа в виде
двумерной марковской цепи с дискретным временем, учитывающая влияние
протокольных параметров размера окна и длительности тайм-аута ожидания
сквозных квитанций, вероятности искажения пакетов в отдельных звеньях
тракта передачи данных и длин очередей в транзитных узлах от «внешних»
потоков на пропускную способность виртуального соединения. Проведен
анализ зависимости пропускной способности управляющей процедуры от
протокольных параметров, уровня ошибок в каналах связи, длины тракта
передачи данных, распределения размеров очередей в транзитных узлах.
Ключевые слова: транспортный протокол, нагруженный тракт передачи
данных, математическая модель, цепь Маркова, быстродействие виртуального соединения, размер окна, длительность сквозного тайм-аута.
В современных сетях, осуществляющих передачу компьютерных данных и
мультимедийного абонентского трафика через единую сетевую инфраструктуру,
существенно повышаются требования к наличию доступной полосы пропускания
и, как следствие, к повышению эффективности ее использования. Важнейшей
операционной характеристикой виртуального соединения, управляемого транспортным протоколом компьютерной сети, является его пропускная способность.
Данный показатель определяется не только скоростью и достоверностью передачи данных в информационных каналах транспортного соединения, но и интенсивностью внешних по отношению к данному соединению потоков, имеющих с ним
часть общего маршрута. Основным индикатором «внешней» нагрузки на тракт, в
котором проложено исследуемое виртуальное соединение, являются размеры очередей перед единицами потока (сегментами, инкапсулируемыми на сетевом уровне в пакеты, которые на канальном уровне инкапсулируются в кадры) рассматриваемого соединения в транзитных узлах. Очевидно, что мониторинг такого индикатора позволяет оценить распределение длин очередей в транзитных узлах от
внешних по отношению к анализируемому соединению сетевых потоков и использовать при расчете операционных характеристик соединения и выборе протокольных параметров на время сеанса связи между заданной парой абонентов. Известные модели асинхронных управляющих процедур отдельного звена передачи
данных и транспортного протокола [1−7] не позволяют учитывать нагрузку на
разделяемые сетевые ресурсы (пропускная способность отдельных межузловых
каналов), обеспечиваемую соседством с другими виртуальными соединениями,
агрегируемыми на различных участках пути в отдельных звеньях маршрута данного межабонентского соединения, и проявляющуюся в виде «внешних» очередей
в транзитных узлах. В данной работе предложена математическая модель виртуального соединения, управляемого транспортным протоколом в режиме селективного отказа, учитывающая кроме фактора искажений в прямом и обратном
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ селективного режима отказа транспортного протокола
79
трактах передачи данных и механизмов повторных передач, обусловленных искажениями и истечением тайм-аута неприема ответа от получателя потока информации, еще и очереди от «внешних» межабонентских соединений.
1. Математическая модель транспортного протокола
Рассмотрим обмен данных между абонентами, соединенными многозвенным
трактом передачи данных. Предположим, что выполняются следующие допущения. Узлы тракта соединены дуплексными каналами связи, имеющими одинаковые пропускные способности в обоих направлениях. Длина тракта передачи данных, выраженная в количестве участков переприема, равна D. Обратный канал, по
которому доставляются подтверждения отправителю о корректности приема последовательности сегментов данных, также имеет длину D. Заданы вероятности
искажения сегмента в канале связи для прямого Rn (d ), d = 1, D, и обратного –
R0 (d ), d = 1, D, направлений передачи каждого участка переприема. Тогда достоверности передачи сегментов данных вдоль тракта от источника до адресата и обD
D
d =1
d =1
ратно составят Fn = ∏ (1 − Rn (d ) ); F0 = ∏ (1 − R0 (d ) ) . Время обработки сегментов
в узлах тракта одинаково. Взаимодействующие абоненты имеют неограниченный
поток сегментов для передачи, а обмен выполняется сегментами одинаковой длины. Подтверждения получателя о корректности приема принимаемых данных переносятся в сегментах встречного потока. Полагаем, что повторная передача сегментов организована в соответствии с селективной процедурой отказа [1]. Считаем, кроме того, что потерь сегментов из-за отсутствия буферной памяти в узлах
тракта не происходит. Задана функция вероятностей bn , n = 0, N , того, что каждый сегмент из потока анализируемого соединения в транзитном узле встретит
очередь размером n ≤ N, где N – максимальный размер очереди, определяемый
емкостью буферных пулов транзитных узлов.
Тайм-аут длительности S запускается перед началом передачи первого сегмента последовательности и фиксируется для всех сегментов в пределах ширины окна. Будем считать, что размер окна управляющего протокола определяется величиной W, а S>W – задает длительность тайм-аута ожидания подтверждения корректности доставки данных. После передачи очередного сегмента, протокол копирует его в очередь переданных, но не подтвержденных данных и запускает
тайм-аут. Как только размер очереди становится равным ширине окна W, управляющий протокол приостанавливает передачу в ожидании получения квитанции
или истечения тайм-аута S ожидания подтверждения. При получении подтверждения из очереди удаляются сегменты, дошедшие до адресата без искажений.
При истечении тайм-аута S соответствующий сегмент передается повторно, и
тайм-аут запускается вновь. Будем называть тактом время t, необходимое для вывода сегмента в линию. Такт определяется суммой времени вывода сегмента в линию, времени распространения сигнала в канале связи и времени обработки сегмента принимающим узлом. Тогда время получения отправителем сквозной квитанции распределено по геометрическому закону с параметром F0 и длительностью такта дискретизации t.
Динамика очереди переданных, но не подтвержденных сегментов на узлеотправителе для различных режимов функционирования управляющего протоко-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
80
В.В. Кокшенев, П.А. Михеев, С.П. Сущенко
ла в силу марковости дискретного процесса получения квитанций может быть
описана двумерной цепью Маркова с дискретным временем и числом состояний
по одному измерению равным длительности сквозного тайм-аута S, а по другому
– увеличенной на единицу максимальной длине очереди: N+1. Очевидно, что длительность тайм-аута должна быть достаточной для того, чтобы пакет с сегментом
данных по прямому каналу достиг адресата и подтверждение получателя по обратному каналу было принято отправителем потока. Отсюда следует, что размер
тайм-аута, выраженный в длительностях тактов t, должен быть не меньше суммы
двойной длины пути и размера встреченной очереди в транзитном узле S ≥ 2D+n.
С учетом возможных повторных передач сегментов основного (прямого) потока и
сегментов с подтверждениями во встречном потоке из-за искажений в отдельных
звеньях тракта размер тайм-аута S целесообразно выбирать с «запасом» на повторные передачи.
Квитанция на первый сегмент последовательности может поступить отправителю спустя время s ≥ 2D интервалов длительности t, необходимых для достижения первым сегментом адресата и возвращения отправителю подтверждения о
корректности его приема. Если при передаче последовательности сегментов отправителем или переносе подтверждения пакет с сегментом в прямом тракте (или
подтверждением в обратном) встретил очередь размера n, то время для получения
квитанции (подтверждения) возрастает на размер встреченной очереди n и составит s ≥ 2D+n.
Процесс переноса информационного потока транспортным протоколом в однозвенном виртуальном канале моделируется марковской цепью [4]. Обобщение
данной модели для пустого многозвенного тракта передачи данных выполнено в
[5]. Функционирование виртуального соединения, управляемого транспортным
протоколом, в нагруженном многозвенном тракте передачи данных с очередями
сегментов перед отправляемыми данными или подтверждениями может быть
описано марковизированным процессом, в котором размер очереди перед прямым
или обратным потоком данных исследуемого соединения является дополнительной переменной марковского процесса. В состоянии цепи Маркова (i,n) источник
отправил последовательность размера i-n сегментов, которая в процессе переноса
в одном из звеньев встретила очередь длиной n сегментов. Значениям координаты
i = 0, W + n, n = 0, N , состояний цепи Маркова соответствует количество переданных, но не подтвержденных получателем сегментов и время от начала передачи последовательности, а значениям i = W + n + 1, S − 1, n = 0, N , – время, в течение которого отправитель не активен и ожидает получение квитанции о корректности приема переданной последовательности из W сегментов. Обозначим через
P(i, n), i = 0, S − 1, n = 0, N , – вероятности состояний цепи Маркова. Тогда последовательность переданных, но не подтвержденных сегментов данных рассматриваемого виртуального соединения при очереди нулевой длины растет до состояния цепи Маркова с координатами (2 D − 1, 0) с вероятностью b0 . Дальнейший
рост размера этой последовательности происходит с вероятностью b0 (1 − F0 ) . В
состояниях (i, n), i = 2 D − 1 + n, S − 1, n = 0, N , возможно получение отправителем
квитанции, и в зависимости от результатов доставки отправитель передает новые
сегменты (при положительной квитанции) либо повторно – искаженные. Поскольку отправленная последовательность сегментов исследуемого виртуального
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ селективного режима отказа транспортного протокола
81
соединения может встретить очередь ненулевой длины в любой момент процесса
передачи (на пути последовательности до адресата или при переносе подтверждения отправителю информационного потока), то переход из состояния (i, 0),
i = 0, S − 2, в состояние (i, n), i = 0, S − 2, n = 1, N , происходит с вероятностью bn .
Обозначим через πinjm переходные вероятности цепи Маркова, где (i,n) – координаты исходного, а (j,m) – измененного состояний цепи. Тогда динамику процесса передачи информационного потока в режиме селективного отказа можно задать следующими значениями переходных вероятностей:
πinjm
⎧b0 , i = 0, 2 D − 2, n = 0; j = i + 1, m = 0;
⎪
⎪b0 (1 − F0 ), i = 2 D − 1, S − 2, n = 0; j = i + 1, m = 0;
⎪b , i = 0, S − 2, n = 0; j = i, m = 1, N ;
⎪ m
⎪b0 F0 , i = 2 D − 1, W − 1, n = 0; j = 2 D − 1, m = 0;
⎪
⎪b0 F0 , i = W , W + 2 D − 2, n = 0; j = W + 2 D − 2 − i, m = 0;
⎪⎪b F , i = W + 2 D − 1, S − 2, n = 0; j = 0, m = 0;
=⎨ 0 0
⎪1, i = S − 1, n = 0, N ; j = 0, m = 0;
⎪1, i = 0, 2 D − 2 + n, n = 1, N ; j = i + 1, m = n;
⎪
⎪1 − F0 , i = 2 D − 1 + n, S − 2, n = 1, N ; j = i + 1, m = n.
⎪
⎪ F0 , i = 2 D − 1 + n, W − 1 + n, n = 1, N ; j = 2 D − 1, m = 0;
⎪ F , i = W + n, W + n + 2 D − 2, n = 1, N ; j = W + n + 2 D − 2 − i, m = 0;
⎪ 0
⎩⎪ F0 , i = W + n + 2 D − 1, S − 2, n = 1, N ; j = 0, m = 0.
(1)
Пропускная способность виртуального соединения, управляемого транспортным протоколом, определяется как отношение среднего объема данных, передаваемых между двумя последовательными получениями квитанций, к среднему
времени получения квитанции [4, 5]. Вклад в быстродействие виртуального соединения дают те состояния цепи Маркова, для которых возможно получение
квитанции. Нормированная на единицу пропускная способность виртуального соединения в нагруженном тракте определяется отношением среднего количества
сегментов данных, передаваемых отправителем между поступлениями двух последовательных квитанций, к среднему времени между поступлениями квитанций, выраженному в количестве интервалов длительности t: Z (W , S ) = V T . Поскольку квитанции переносятся в каждом сегменте независимо и поступают к отправителю каждый такт t при условии, что они не искажены на пути длины D от
получателя до отправителя информационного потока, то среднее время между
приходами квитанций распределено по геометрическому закону с параметром F0
и составит T = 1 F0 . Средний объем передаваемых между поступлениями квитанций данных с учетом того, что каждый сегмент исследуемого соединения с вероятностью bn , n = 0, N , встречает очередь размера n и дает вклад в объем переданной информации обратно пропорциональный величине n + 1 , задается обобщением соотношения, приведенного в работе [4]:
N
S −1
⎤
1 ⎡W + 2 D − 2 + n
(
,
)
V =∑
lP
l
n
+
W P (l , n) ⎥ .
∑
⎢ ∑
⎦
n = 0 n + 1 ⎣ l = 2 D −1+ n
l =W + 2 D −1+ n
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Кокшенев, П.А. Михеев, С.П. Сущенко
82
Величины l и W определяются средним количеством сегментов, достигших адресата при селективной процедуре организации повторных передач искаженных
сегментов: l = (l − 2 D − n + 2) Fn , W = WFn . Окончательно зависимость пропускной способности виртуального соединения от протокольных параметров ширины
окна W и длительности сквозного тайм-аута S примет вид
S −1
⎤
1 ⎡W + 2 D − 2 + n
P(l , n) ⎥ . (2)
∑
⎢ ∑ (l − 2 D + 2 − n) P(l , n) + W
⎦
n = 0 n + 1 ⎣ l = 2 D −1+ n
l =W + 2 D −1+ n
N
Z (W , S ) = Fn F0 ∑
2. Анализ процесса передачи в однозвенном тракте
В стационарных условиях система уравнений равновесия, описывающая процесс переноса данных в виртуальном канале для тракта длины D = 1 , ширины окна W ≥ 1 и длительности тайм-аута S > W , S ≥ N + 2 , согласно переходным вероятностям (1) имеет следующий вид:
N S −2
⎡ S −2
⎤ N
P(0, 0) = F0 ⎢b0 ∑ P (i, 0) + ∑ ∑ P(i, n) ⎥ + ∑ P( S − 1, n);
⎣ i =W
⎦ n=0
n =1 i =W + n
N W −1+ n
⎡ W −1
⎤
P(1, 0) = b0 P (0, 0) + F0 ⎢b0 ∑ P (i, 0) + ∑ ∑ P(i, n) ⎥ ;
⎣ i =1
⎦
n =1 i = n +1
(3)
P(i, 0) = b0 (1 − F0 ) P(i − 1, 0), i = 2, S − 1;
(4)
P(0, n) = bn P (0, 0), n = 1, N ;
(5)
P(i, n) = bn P(i, 0) + P (i − 1, n), i = 1, n + 1, n = 1, N ;
(6)
P(i, n) = bn P(i, 0) + (1 − F0 ) P (i − 1, n), i = n + 2, S − 2, n = 1, N ;
(7)
P( S − 1, n) = (1 − F0 ) P( S − 2, n), n = 1, N .
(8)
Найдем решение данной системы уравнений. Из уравнения (4) получаем
i−1
P(i,0) = P (1,0)[b0 (1 − F0 )] , i = 1, S − 1. Согласно (5), (6) и полученному выражению
⎡
1 − ⎡b0 (1 − F0 )i ⎤⎦ ⎤
⎥ , i = 0, n + 1, n = 1, N .
для P (i, 0) , имеем P(i, n) = bn ⎢ P (0, 0) + P (1, 0) ⎣
1 − b0 (1 − F0 ) ⎥
⎢⎣
⎦
С учетом данного соотношения из (7) и (8) для произвольного n ≥ 1 находим
P (i, n) = bn (1 − F0 )i −1 ×
⎧⎪ P(0, 0)
⎡
⎤⎫⎪
b0i
F0 b0n +1
1
×⎨
+
P
(1,
0)
−
+
⎢
⎥⎬,
n
n
⎩⎪ (1 − F0 )
⎣ [1 − b0 (1 − F0 ) ] (1 − F0 ) 1 − b0 (1 − b0 ) [1 − b0 (1 − F0 ) ] ⎦⎭⎪
i = n + 1, S − 2 ;
P( S − 1, n) = bn (1 − F0 ) S − 2 ×
⎡
⎤⎫⎪
b0S − 2
F0 b0n +1
1
⎪⎧ P(0, 0)
×⎨
+
P
(1,
0)
−
+
⎢
⎥⎬ .
n
n
⎩⎪ (1 − F0 )
⎣ [1 − b0 (1 − F0 ) ] (1 − F0 ) 1 − b0 (1 − b0 ) [1 − b0 (1 − F0 ) ] ⎦⎭⎪
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ селективного режима отказа транспортного протокола
83
Подставляя найденные соотношения в (3), получаем выражение для P (1, 0) :
P(1, 0) =
P(0, 0) E
(1 − F0 )W −1
,
(1 − b0 ) (1 − b0 (1 − F0 ) ) ⎡⎣1 − (1 − b0 )(1 − F0 )W −1 ⎤⎦
где E =
(1 − b0 ) ⎡⎣1 − b0 +
F0 b0W
(
⎤⎦ + b0 F0 1 − b0W −1
N
) ∑ bn ( b0 (1 − F0 ) )
.
n
n =1
Из условия нормировки находим вероятность начального состояния (0,0):
⎡3 − 2(1 + b0 − F0 ) + b0 (1 − F0 ) N ⎛ (1 − F0 ) S −n−1 ⎞⎤
⎪⎧
+ ∑bn ⎜⎜ n −
P(0,0) = (1 − F0 )W −1 ⎨(1 − F0 )W −1 ⎢
⎟⎟⎥ +
F0
F0
⎪⎩
n=1 ⎝
⎣
⎠⎦
⎡2 − (1 + b0 − F0 )[1 − 2b0 (1 − F0 )] − b0 (1 − F0 )[3 + b0 (1 − F0 )] (b0 (1 − F0 )) S −2 (1 − b0 )
+E ⎢
−
+
2
1 − b0 (1 − F0 )
F0 (1 − b0 (1 − F0 ))
⎢⎣
−1
⎡
(1 − F0 ) S −n−1
b0n+1 (1 − F0 ) S −1 ⎤⎤⎫⎪
(b (1 − F0 ))n+1
n
+ ∑bn ⎢
−
+ 0
−
⎥⎥⎬ .
2
n=1 ⎢
⎣1 − b0 (1 − F0 ) F0 (1 − b0 (1 − F0 )) (1 − b0 (1 − F0 )) (1 − b0 )(1 − b0 (1 − F0 ))⎥⎥⎪
⎦⎦⎭
Проанализируем полученное решение в ряде частных случаев. Пусть внешняя
очередь в узлах отсутствует ( b0 = 1 ). Тогда получаем известный результат [5]:
N
P(0, 0) =
P(i, 0) =
F0 (1 − F0 )W −1
1 + (1 − F0 )W −1 ⎡⎣ F0 − (1 − F0 ) S −W ⎤⎦
F0 (1 − F0 )i −1
1 + (1 − F0 )W −1 ⎡⎣ F0 − (1 − F0 ) S −W ⎤⎦
,
, i = 1, S − 1 ,
P(i, n) = 0, i = 0, S − 1, n = 1, N .
Предположим, что поток исследуемого виртуального соединения всегда
встречает очередь ненулевой длины ( b0 = 0 ). При этом вероятность начального
состояния и состояния (1, 0) цепи Маркова принимает вид
F0 (1 − F0 )W −1
P(0, 0) =
W −1
1 + F0 ⎣⎡1 + N ⎦⎤ + (1 − F0 )
P(1, 0) =
N
⎡
S −W − n ⎤
⎢ F0 − ∑ bn (1 − F0 )
⎥
⎣
⎦
n =1
P(0, 0) ⎡⎣1 − (1 − F0 )W −1 ⎤⎦
(1 − F0 )W −1
,
,
(9)
N
где N = ∑ nbn . В случае очереди детерминированной длины ( bn = 1, n ≥ 1 ) для
n =1
начального состояния получаем
P(0, 0) =
F0 (1 − F0 )W −1
1 + (n + 1) F0 + (1 − F0 )W −1 ⎡⎣ F0 − (1 − F0 ) S −W − n ⎤⎦
.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
84
В.В. Кокшенев, П.А. Михеев, С.П. Сущенко
При неограниченной ширине окна (W = ∞ ), а следовательно, и длительности
тайм-аута S начальное состояние является невозвратным ( P(0, 0) = 0 ), а вероятность состояния (1, 0) принимает вид
⎡
⎢ 2− (1 + b0 − F0 ) [1 − 2b0 (1 − F0 ) ] −
⎣
2
P (1, 0) = F0 [1 − b0 (1 − F0 ) ]
N
n +1 ⎤
−b0 (1 − F0 ) [3 + b0 (1 − F0 ) ] + NF0 [1 − b0 (1 − F0 ) ] + F0 ∑ bn [b0 (1 − F0 ) ]
⎥ . (10)
⎦
Если при этом соединение всегда соперничает за полосу пропускания с конкурентами ( b0 = 0 ), то вероятность данного состояния преобразуется к
n =1
P(1, 0) =
F0
.
1 + F0 (1 + N )
(11)
Для абсолютно надежного обратного канала связи ( F0 = 1 ), длительности
тайм-аута, превышающей максимальный размер очереди на удвоенную длину пути ( S ≥ N + 2 ), и старт-стопной управляющей процедуры ( W = 1 ) множество вероятных состояний (i, n) определяется значениями индексов i = 0, n + 1, n = 0, N и
имеет вид
1
(12)
, P(i, n) = bn P(0, 0) .
P(0, 0) =
2
3 − b0 + (1 + b0 ) N
В тех же условиях при W ≥ 2
(i, n), i = 1, n + 1, n = 0, N :
P(0, 0) = 0 , P(1, 0) =
значимыми будут только состояния
1
, P(i, n) = bn P(1, 0), i = 1, n + 1, n = 1, N .
2 − b0 + N
(13)
3. Анализ процесса передачи в многозвенном тракте
В случае тракта произвольной длины аналитические зависимости для вероятностей состояний цепи Маркова при произвольной длительности тайм-аута
S > W получить не удается. Аналитическое решение удается найти в двух случаях: во-первых, при выполнении условия S = W + 1, W ≥ 2 D + N и, во-вторых, если
b0 = 0 . Система уравнений равновесия, описывающая процесс переноса данных в
виртуальном канале для тракта произвольной длины D для указанных в первом
случае соотношений между протокольными параметрами S и W , длиной тракта
D и максимальным размером очереди N , в соответствии с переходными вероятностями (1) принимает вид
N
P(0, 0) = ∑ P(W , n);
n =0
P(i, 0) = b0 P (i − 1, 0), i = 1, 2 D − 2;
P(2 D − 1, 0) = b0 P(2 D − 2, 0) +
W −1
∑
i = 2 D −1
N
b0 F0 P(i, 0) + ∑
W −1
∑
n =1 i = 2 D −1+ n
F0 P(i, n);
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ селективного режима отказа транспортного протокола
85
P(i, 0) = b0 (1 − F0 ) P(i − 1, 0), i = 2 D, W ;
P(0, n) = bn P (0, 0), n = 1, N ;
P(i, n) = P(i − 1, n) + bn P(i, 0), i = 1, 2 D − 1 + n, n = 1, N ;
P(i, n) = (1 − F0 ) P(i − 1, n) + bn P(i, 0), i = 2 D + n, W − 1, n = 1, N ;
P(W , n) = (1 − F0 ) P(W − 1, n), n = 1, N .
Аналитическое решение данной системы уравнений равновесия определяется
соотношениями
P(i, 0) = P (0, 0)b0i , i = 1, 2 D − 2;
i − 2 D +1
P(i, 0) = P (2 D − 1, 0) [b0 (1 − F0 ) ]
P(i, n) = P (0, 0)bn
, i = 2 D − 1, W ;
1 − b0i +1
, i = 0, 2 D − 2, n = 1, N ;
1 − b0
i−2 D+2
P(i, n) = P (0, 0)bn
1 − b02 D −1
1 − [b0 (1 − F0 ) ]
+ P (2 D − 1, 0)bn
1 − b0
1 − b0 (1 − F0 )
,
i = 2 D − 1, 2 D − 1 + n, n = 1, N ;
P (i, n) = P(0,0)bn
1 − b02 D−1
(1 − F0 )i−2 D−n+1 + P(2 D − 1,0)bn (1 − F0 )i−2 D+1 ×
1 − b0
⎡
⎤
b0i−2 D+2
b0n+1 F0
1
×⎢
−
+
⎥ , i = 2 D + n,W − 1, n = 1, N ;
n
1
−
b
(1
−
b
)
1
−
b
(1
−
F
)
0
0 [
0
0 ]⎦
⎣(1 − F0 ) [1 − b0 (1 − F0 )]
P(W , n) = P(0, 0)bn
1 − b02 D −1
(1 − F0 )W − 2 D − n +1 + P(2 D − 1, 0)bn (1 − F0 )W − 2 D +1 ×
1 − b0
⎡
⎤
b0W − 2 D +1
b0n +1 F0
1
×⎢
−
+
⎥ , n = 1, N ;
n
1
−
b
(1
−
b
)
1
−
b
(1
−
F
)
0
0 [
0
0 ]⎦
⎣ (1 − F0 ) [1 − b0 (1 − F0 ) ]
P(2 D − 1, 0) =
P (0, 0) K
(1 − F0 )W − 2 D +1
N
⎪⎧
,
⎪⎫
⎬
n =1 (1 − F0 ) ⎪
⎭,
[1 − b0 (1 − F0 )] ⎨1 − b0 − (1 − b02 D −1 )(1 − F0 )W − 2 D +1 ∑
где K =
⎪⎩
N
⎡ 1− b
⎤
⎣
⎦
bn
n
∑ bn ⎢ (1 − F 0)n + F0b0n+1 ⎥
n =1
0
P(0,0) = (1 − F0 )W −2 D+1 ×
⎧⎪
⎡
1 − (1 + F0 )b02 D−1 1 − b02 D−1 N ⎛ (1 − F0 )W −2 D+2−n ⎞⎤
× ⎨(1 − F0 )W −2 D+1 ⎢2 D +
+
∑bn ⎜ n −
⎟⎟⎥ +
F0
1 − b0 n=1 ⎝⎜
F0
⎪⎩
⎣
⎠⎦
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Кокшенев, П.А. Михеев, С.П. Сущенко
86
⎡2 − (1 + b0 − F0 )[1 − 2b0 (1 − F0 )] − b0 (1 − F0 )[3 + b0 (1 − F0 )] (b0 (1 − F0 ))W −2 D+1 (1 − b0 )
+K ⎢
−
+
2
1 − b0 (1 − F0 )
F0 (1 − b0 (1 − F0 ))
⎢⎣
−1
n+1
N
⎡
(1 − F0 )W −2 D−n+2 (b0 (1 − F0 ))
b0n+1 (1 − F0 )W −2 D+2 ⎤⎤⎫⎪
n
+ ∑bn ⎢
−
+
−
⎥⎥⎬ .
2
⎢1 − b0 (1 − F0 ) F0 (1 − b0 (1 − F0 )) (1 − b0 (1 − F0 )) (1 − b0 )(1 − b0 (1 − F0 ))⎦⎦⎭
⎥⎥⎪
n=1 ⎣
Рассмотрим найденное решение в ряде частных случаев. Нетрудно видеть, что
данное решение при D = 1 совпадает с решением, полученным при рассмотрении
однозвенного тракта для протокольных параметров, связанных соотношением
W = S − 1 . При отсутствии внешней очереди в узлах ( b0 = 1 ) получаем (известный
результат [4]):
P(0, 0) =
F0 (1 − F0 )W −1
W − 2 D +1
1 + (1 − F0 )
[ 2 DF0 − 1]
, P(2 D − 1, 0) =
P(0, 0)
(1 − F0 )W − 2 D +1
.
Если поток анализируемого виртуального соединения всегда встречает очередь
ненулевой длины ( b0 = 0 ), то вероятности состояний цепи Маркова определяются
зависимостями
N
P(0, 0) =
∑ bn (1 − F0 )W −2 D −n+1
n =1
1 ⎛
1 ⎞ N
1+ N +
+ ⎜ 2 D − ⎟ ∑ bn (1 − F0 )W − 2 D − n +1
F0 ⎝
F0 ⎠ n =1
;
N
⎡
⎤
P(0, 0) ⎢1 − ∑ bn (1 − F0 )W − 2 D − n +1 ⎥
⎣ n =1
⎦;
P(2 D − 1, 0) =
N
∑ bn (1 − F0 )W −2 D −n+1
n =1
P(i, 0) = 0, i = 1, 2 D − 2, 2 D, W ; P(i, n) = bn P(0, 0), i = 0, 2 D − 2, n = 1, N ;
P(i, n) = bn [ P(0, 0) + P(2 D − 1, 0) ] , i = 2 D − 1, 2 D − 1 + n, n = 1, N ;
P(i, n) = bn [ P(0, 0) + P(2 D − 1, 0) ] (1 − F0 )i − 2 D − n +1 , i = 2 D + n,W , n = 1, N .
(14)
При неограниченной ширине окна (W = ∞ ) состояния (i, n), i = 0, 2 D − 2,
n = 0, N ,
являются невозвратными
( P(i, n) = 0 )
и вероятность состояния
(2 D − 1, 0) цепи Маркова принимает вид (10), что свидетельствует об инвариантности вероятности данного состояния к длине тракта передачи данных в указанных условиях. При этом для очереди детерминированной длины ( bn = 1, n > 0 ) вероятности значимых состояний цепи Маркова, определяющих доступную межабонентскому соединению полосу пропускания тракта передачи данных, задаются
F0
F (1 − F0 )i−2 D−n+1
и P(i, n) = 0
, i ≥ 2 D −1 + n .
зависимостями P(2 D − 1,0) =
1 + F0 (n + 1)
1 + F0 (n + 1)
Для детерминированного обратного тракта ( F0 = 1 ) и ширины окна, превышающей максимальный размер очереди на удвоенную длину пути ( W ≥ N + 2 D ), про-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ селективного режима отказа транспортного протокола
87
странство значимых состояний (i, n) образует плоскость равнобедренного по координатам i и n треугольника i = 2 D − 1, 2 D − 1 + n, n = 0, N :
P(2 D − 1, 0) =
1
, P(i, n) = bn P(2 D − 1, 0), i = 2 D − 1, 2 D − 1 + n, n = 1, N .
2 − b0 + N
(15)
Найдем решение для случая, когда поток анализируемого соединения всегда
встречает очередь ( b0 = 0 ),протокольные параметры связаны между собой, а также с максимальным размером очереди и длиной тракта передачи данных неравенствами S > W + N и W ≥ 2 D . Система уравнений равновесия при этом в соответствии с (1) имеет вид
N
S −2
⎡
⎤
P(0, 0) = ∑ ⎢ P ( S − 1, n) +
∑ F0 P(i, n) ⎥;
⎦
n =1 ⎣
i =W + 2 D + n − 2
N
P(i, 0) = ∑ F0 P(W + 2 D + n − 2 − i, n), i = 1, 2 D − 2, n = 1, N ;
n =1
N
P(2 D − 1, 0) = ∑
W −1
∑
n =1 i = 2 D −1+ n
F0 P(i, n);
P(0, n) = bn P (0, 0), n = 1, N ;
P(i, n) = P (i − 1, n) + bn P(i, 0), i = 1, 2 D − 1, n = 1, N ;
P(i, n) = P (i − 1, n), i = 2 D, 2 D − 1 + n, n = 1, N ;
P(i, n) = (1 − F0 ) P(i − 1, n), i = 2 D + n, S − 1, n = 1, N .
Для вероятностей состояний отсюда находим аналитическое решение:
P (0, 0) F0
P(i, 0) =
, i = 1, 2 D − 2;
(1 − F0 )i
P(2 D − 1, 0) = P(0, 0)
P(i, n) =
P(i, n) =
(1 − F0 )i
P (0, 0)bn
(1 − F0 )W −1
P(i, n) = P (0, 0)
P(0, 0) =
P(0, 0)bn
1 − (1 − F0 )W − 2 D +1
(1 − F0 )W −1
;
, i = 0, 2 D − 2, n = 1, N ;
, i = 2 D − 1, 2 D + n − 1, n = 1, N ;
bn (1 − F0 )i − 2 D − n +1
(1 − F0 )W −1
, i = 2 D + n, S − 1, n = 1, N ;
F0 (1 − F0 )W −1
N
1 + F0 ( N + 1) + (1 − F0 )W − 2 D +1 ⎡⎣1 − (1 − F0 ) 2 D −1 ⎤⎦ − ∑ bn (1 − F0 ) S − 2 D − n +1
n =1
.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Кокшенев, П.А. Михеев, С.П. Сущенко
88
При D = 1 отсюда получаем (9), для детерминированного обратного тракта с
учетом b0 = 0 – (15), а при W = ∞ – приходим к
P(i, n) = 0, i = 0, 2 D − 2, n = 0, N ,
P(2 D − 1, 0) =
P(i, n) =
F0
,
1 + F0 (1 + N )
bn F0
, i = 2 D − 1, 2 D + n − 1, n = 1, N ,
1 + F0 (1 + N )
P(i, n) =
bn F0 (1 − F0 )i − 2 D − n +1
, i ≥ 2 D + n, n = 1, N .
1 + F0 (1 + N )
4. Анализ процесса передачи в многозвенном тракте
с детерминированным обратным каналом связи
В предыдущих разделах найдены вероятностно-временные характеристики для
виртуального соединения при W ≥ 2 D . Остается открытым вопрос анализа быстродействия виртуального канала в случае W < 2 D , соответствующем «недогруженному» соединению. Уравнения равновесия, описывающие динамику очереди
переданных, но не подтвержденных пакетов данных, при этом принимают вид
P(0, 0) =
S −2
∑
N
i = 2 D − 2 +W
b0 F0 P(i, 0) + ∑
S −2
∑
n =1 i = 2 D − 2 + n +W
N
F0 P(i, n) + ∑ P( S − 1, n), W = 1, 2 D − 1;
n=0
N
P(i, 0) = b0 P (i − 1, 0) + b0 F0 P(2 D − 2 + W − i, 0) + ∑ F0 P(2 D − 2 + n + W − i, n),
n =1
i = 1, W − 1, W = 2, 2 D − 1;
P(i, 0) = b0 P(i − 1, 0), i = W , 2 D − 1, W = 1, 2 D − 1;
P(i, 0) = b0 (1 − F0 ) P (i − 1, 0), i = 2 D, S − 1;
P(0, n) = bn P (0, 0), n = 1, N ;
P(i, n) = P(i − 1, n) + bn P(i, 0), i = 1, 2 D − 1 + n, n = 1, N ;
P(i, n) = (1 − F0 ) P(i − 1, n) + bn P(i, 0), i = 2 D + n, S − 2, n = 1, N ;
P( S − 1, n) = (1 − F0 ) P( S − 2, n), n = 1, N .
Найдем решение данной системы уравнений для абсолютно надежного обратного тракта ( F0 = 1 ), определяющего потенциально достижимый виртуальным
каналом уровень быстродействия при недогрузке виртуального соединения, обусловленной малым размером окна ( W < 2 D ). Из приведенных уравнений в данных условиях нетрудно видеть, что состояния (i, n), i = 0,W − 2, n = 0, N являются
невозвратными ( P (i, n) = 0 ). Для значимых состояний из системы уравнений равновесия получаем
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ селективного режима отказа транспортного протокола
89
P(i, 0) = P (W − 1, 0)b0i −W +1 , i = W − 1, 2 D − 1, W = 1, 2 D − 1;
P(i, n) = P (W − 1, 0)bn
i −W +1
∑
j =0
b0j = P(W − 1, 0)bn
1 − b0i −W + 2
,
1 − b0
i = W − 1, 2 D − 1, n = 1, N , W = 1, 2 D − 1;
P(i, n) = P (W − 1, 0)bn
(16)
1 − b02 D −W +1
,
1 − b0
i = 2 D − 1, 2 D − 1 + n, n = 1, N , W = 1, 2 D − 1.
Из условия нормировки находим
1
P(W − 1, 0) =
2D − W
+ 2 − b02 D −W +1
1 − b02 D −W +1
+
N
1 − b0
.
(17)
Нетрудно убедиться, что при W = 1 , D = 1 отсюда получаем найденное ранее
решение (12).
5. Исследование доступной полосы пропускания
Анализ процесса передачи информационного потока в виртуальном канале,
управляемого транспортным протоколом, показывает, что индекс быстродействия
виртуального соединения при абсолютно надежных каналах связи в отдельных
звеньях обратного тракта ( F0 = 1 ) и достаточной длительности тайм-аута согласно (2) и найденных вероятностей состояний цепи Маркова (12) для однозвенного
тракта ( D = 1 ) при W = 1 определится соотношением
N
⎡
b ⎤
Fn ⎢b0 + (1 + b0 )∑ n ⎥
n
⎣
n =1 + 1 ⎦
,
Z (1, S ) =
2
3 − b0 + (1 + b0 ) N
а при W ≥ 2 в соответствии с (13) составит
N
bn ⎤
⎡
1
(18)
+
⎢ ∑
⎥.
⎣ n =1 n + 1 ⎦
Для случая, когда поток исследуемого однозвенного виртуального соединения
всегда встречает очередь ненулевой длины ( b0 = 0 ), его быстродействие согласно
(2) и (9) определится выражением
Z (W , S ) =
Fn
2 − b0 + N
N
Z (W , S ) = Fn
bn
⎡⎣1 − (1 − F0 )W − WF0 (1 − F0 ) S − n −1 ⎤⎦
+
1
n
n =1
F02 ⎡⎣1 − (1 − F0 )W −1 ⎤⎦ + ∑
W −1
1 + F0 (1 + N ) + (1 − F0 )
N
− (1 − F0 ) − ∑ bn (1 − F0 )
W
.
S − n −1
n =1
В случае многозвенного тракта передачи данных ( D ≥ 1 ) при b0 = 0 , S = W + 1
и W ≥ 2 D + N в соответствии с найденными вероятностями состояний цепи Маркова (14) из (2) получаем
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Кокшенев, П.А. Михеев, С.П. Сущенко
90
Z (W ,W + 1) =
⎡
⎤
b
F02 ⎢1 − ∑ bn (1 − F0 )W −2 D−n+1 ⎥ + ∑ n 1 − (1 − F0 )W −2 D−n+2 [1 − F0 (W − 2 D − n + 2)]
n
.
⎣ n=1
⎦ n=1 + 1
N
= Fn
N
{
}
N
1 + F0 (1 + N ) + (2 DF0 − 1)∑ bn (1 − F0 )W −2 D−n+1
n=1
Если протокольные параметры удовлетворяют неравенствам
W ≥ 2 D , то доступная полоса пропускания составит
S >W + N ,
N
Z (W , S ) = Fn
bn
⎡⎣1 − (1 − F0 )W − WF0 (1 − F0 ) S − 2 D − n +1 ⎤⎦
n =1 n + 1
F02 ⎡⎣1 − (1 − F0 )W − 2 D +1 ⎤⎦ + ∑
W − 2 D +1
1 + F0 (1 + N ) + (1 − F0 )
N
− (1 − F0 ) − ∑ bn (1 − F0 )
W
.
S − 2 D − n +1
n =1
Если W ≥ 2 D и F0 = 1 , то вероятности состояний марковской цепи задаются
выражением (15) и доступная виртуальному соединению доля полосы пропускания оказывается инвариантной к длине тракта и совпадает с зависимостью (18).
Если же при этом еще и очередь имеет детерминированную длину ( bn = 1, n > 0 ),
то доля пропускной способности многозвенного тракта (2), доступная виртуальF
ному соединению составит Z (W , S ) = n . Согласно найденному решению (16),
n +1
(17) при F0 = 1 и W < 2 D быстродействие виртуального канала (2) определяется
соотношением
b02 D −W +
Z (W , S ) = Fn
2D − W
1 − b02 D −W +1 N bn
∑ n +1
1 − b0
n =1
+ 2 − b02 D −W +1
1 − b02 D −W +1
+
N
1 − b0
.
(19)
Для постоянной очереди ненулевой длины ( bn = 1, n > 0 ) получаем Z (W , S ) =
=
Fn
, а при W = 1, D = 1, b0 = 1 приходим к известному ре(n + 1)[2 D − W + 2 + n]
Fn
. Таким образом, потенциально достижимая скорость
2
передачи в виртуальном канале, проложенном в тракте передачи данных, за ресурсы которого соперничают множество сетевых абонентов, определяется соотношениями (18) и (19) при W ≥ 2 D и W < 2 D соответственно. Численные исследования показывают, что доступная виртуальному соединению полоса пропускания для W ≥ 2 D и прочих равных условиях практически инвариантна к длине
тракта передачи данных (см. рис 1), ощутимо снижаясь от области насыщения
лишь при W = 2 D и F0 < 1 . В случае же W < 2 D доступная полоса пропускания
недогружена, и эффективная скорость передачи данных значительно снижается
(см. рис. 2 и 3). С ростом конкуренции между абонентами за полосу пропускания
тракта передачи данных размер очереди увеличивается и скорость информационного переноса быстро падает (см. рис. 4). Зависимость быстродействия от достоверности передачи подтверждений в обратном канале связи приведена на рис. 5.
зультату [3]: Z (1, S ) =
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ селективного режима отказа транспортного протокола
91
От достоверности доставки данных в прямом канале связи индекс быстродействия
имеет линейную зависимость.
Z(W,S)
F0 = 1
F0 = 0,8
F0 = 0,5
F0 = 0,3
0,4
0,2
0
1
4
7
10
13
D
Рис. 1. Зависимость доступной полосы пропускания
от длины тракта передачи данных при S=35, W=16, b1 = 1, Fп = 1
Z(W,S)
0,16
0,12
0,08
0,04
0
F0 = 0,5
F0 = 0,3
F0 = 0,2
F0 = 1
F0 = 0,8
1
3
5
7
9
W
Рис. 2. Зависимость быстродействия виртуального соединения
от ширины окна при S=30, D=1, b5 = 1, Fп = 1
Z(W,S)
0,16
0,12
0,08
F0 = 1
F0 = 0,8
F0 = 0,5
F0 = 0,3
0,04
0
1
3
5
7
9
W
Рис. 3. Зависимость быстродействия виртуального соединения
от ширины окна при S=30, D=2, b5 = 1, Fп = 1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Кокшенев, П.А. Михеев, С.П. Сущенко
92
Z(W,S)
F0 = 1
F0 = 0,8
F0 = 0,5
F0 = 0,3
0,8
0,6
0,4
0,2
0
2
4
6
N
8
Рис. 4. Зависимость быстродействия виртуального соединения
от длины очереди при S=30, W=1, D=4, bN = 1, Fп = 1
Z(W,S)
0,5
0,4
0,3
W = 12
W=8
W=1
0,2
0,1
0
0,2
0,4
0,6
0,8
1
F0
Рис. 5. Зависимость доступной полосы пропускания от достоверности
передачи данных в обратном канале при S=30, D=4, b1 = 1, Fп = 1
При неограниченном росте размера окна, а следовательно, и тайм-аута доступная абонентскому соединению доля пропускной способности тракта (2) имеет
вид
Z (∞, ∞ ) =
Fn ⎡⎣1 + (n + 1) F02 ⎤⎦
( n + 1) [1 + (n + 1) F0 ]
.
Отсюда для F0 = 0 и F0 = 1 получаем одинаковые значения доступной полосы
Z (∞, ∞ ) =
а в точке F0 =
минимума:
Fn
,
n +1
n + 2 −1
показатель доступной полосы пропускания достигает
n +1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анализ селективного режима отказа транспортного протокола
Z (∞, ∞) = Fn
2 n+2 −2
( n + 1)2
93
.
Заключение
Проведенный анализ направлен на исследование доступной полосы пропускания виртуального соединения в тракте передачи данных, разделяемом конкурирующими абонентами. Предложена математическая модель нагруженного тракта
при заданном распределении длин очередей протокольных блоков данных абонентов-соперников в виде цепи Маркова, описывающей динамику объема переданных, но не подтвержденных данных исследуемого виртуального соединения.
Найдены распределения состояний марковской цепи при различных соотношениях между протокольными параметрами и характеристиками тракта. Получены
аналитические зависимости быстродействия виртуального соединения для различных условий его функционирования. Численные исследования быстродействия виртуального канала в селективном режиме повторной передачи показали,
что скорость передачи в виртуальном соединении в значительной мере определяется интенсивностью потерь данных, распределением размера очередей в транзитных узлах, а также соотношением между длиной тракта и размером окна. Очевидно при этом, что длительность сквозного тайм-аута должна превосходить
сумму удвоенной длины тракта и совокупной длины очередей перед информационным потоком взаимодействующих абонентов виртуального соединения. Полученные результаты позволяют утверждать, что при заданном размере окна показатель пропускной способности виртуального соединения возрастает с увеличением
длительности тайм-аута ожидания сквозного подтверждения и практически достигает теоретического предела при насыщении по протокольному параметру W
для значений S, превосходящих ширину окна на 3−5 тактов длительности t.
ЛИТЕРАТУРА
1. Богуславский Л.Б. Управление потоками данных в сетях ЭВМ. М.: Энергоатомиздат,
1984. 168 c.
2. Gelenbe E., Labetoulle J., Pugolle G. Performance evaluation of the HDLC protocol //
Comput. Networks. 1978. V. 2. P. 409−415.
3. Боровихин Е.А., Коротаев И.А. Анализ функционирования и оптимизация протокола
HDLC // Автоматика и вычисл. техника. 1993. № 2. C. 47−51.
4. Сущенко С.П. Аналитические модели асинхронных процедур управления звеном передачи данных // Автоматика и вычисл. техника. 1988. № 2. C. 32−40.
5. Кокшенев В.В., Сущенко С.П. Анализ быстродействия асинхронной процедуры управления звеном передачи данных // Вычислительные технологии. 2008. Т. 13. № 5. С. 61−65.
6. Nimbe L. Ewald, Andrew H. Kemp. Analytical model of TCP new reno through CTMC //
Computer Performance Engineering, Proc. 6th European Performance Engineering Workshop,
EPEW 2009; London, UK, July 9−10, 2009. P. 183−196.
7. Padhye J., Firoiu V., Towsley D.F., et al. Modeling TCP Reno Performance: A Simple Model
and Its Empirical Validation // IEEE/ACM Transactions on Networking, April 2000. V. 8.
Nо. 2. P. 133−145.
Михеев Павел Андреевич
Кокшенев Владимир Владимирович
Сущенко Сергей Петрович
Томский государственный университет
E-mail: doka-patrick@mail.ru;
vladimir_finf@mail.ru; ssp@inf.tsu.ru
Поступила в редакцию 12 февраля 2013 г.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
94
В.В. Кокшенев, П.А. Михеев, С.П. Сущенко
Mikheev Pavel A., Kokshenev Vladimir V., Sushchenko Sergey P. (Tomsk State University).
Transport protocol selective acknowledgements analysis in loaded transmission data path.
Keywords: transport protocol, transmission data path with queues, mathematical model, Markov
chain, transport connection throughput, window size, through time out, packet loss.
A mathematical model of the transport protocol with selective acknowledgements for multihop transmission data path with queues is proposed. The protocol behavior is modeled through
the two-dimensional Discrete-Time Markov chain which is used for estimation of transport connection throughput. The model takes into account the influence of window size, retransmission
time out, probability of packet loss and queue size on transport connection throughput. Probabilities of Markov chain states are found. Analytical expressions of bandwidth available for transport
connection in different load conditions were obtained. Analysis of transport protocol throughput
for different protocol parameters and transmission data path conditions has been conducted.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
УДК 519.7
А.В. Лапко, В.А. Лапко
ОБОБЩЁННАЯ НЕПАРАМЕТРИЧЕСКАЯ РЕГРЕССИЯ И ЕЁ СВОЙСТВА
Рассматривается методика синтеза и анализа обобщённой непараметрической регрессии. Идея рассматриваемого подхода состоит в построении упрощённых параметрических моделей относительно некоторого набора точек
из обучающей выборки с последующей их интеграцией на основе методов
непараметрической статистики. Исследуются свойства полученной аппроксимации.
Ключевые слова: непараметрическая регрессия, коллективное оценивание,
упрощённые аппроксимации, асимптотические свойства
На современном этапе развития теории обучающихся систем настойчиво обсуждается и разрабатывается идея о совместном использовании разнотипных моделей – как средства наиболее полного учета априорной информации. Известно
яркое высказывание профессора В. Хардле [1]: «Совмещение параметрических и
непараметрических составляющих может даже привести к построению лучшей
модели, чем непараметрический или параметрический подход!». Получены первые успешные результаты исследований в данном направлении, к которым можно
отнести методы локальной аппроксимации [2], гибридные модели [3−5], полупараметрические и частично линейные модели [1].
Разработан новый класс непараметрических моделей коллективного типа для
решения задач восстановления стохастических зависимостей [6], распознавания
образов [7] и анализа временных процессов [8]. Синтез подобных моделей сводится к непараметрическому оцениванию функционалов от семейства регрессий,
построенных относительно системы «опорных» точек из экспериментальных данных. Их применение позволяет в наиболее полном объёме использовать информацию обучающей выборки, содержащуюся в её элементах, и взаимосвязи между
ними.
Цель данной работы стоит в развитии методики синтеза обобщённой непараметрической регрессии, основанной на сочетании преимуществ параметрических
и локальных аппроксимаций восстанавливаемой функции и исследовании её
свойств.
1. Синтез обобщённой непараметрической регрессии
(
)
Пусть дана выборка V = xi , y i , i = 1, n из статистически независимых наблюдений значений y i неизвестной однозначной зависимости
y = F ( x ) ∀ x ∈ Rk
i
(1)
и её аргументов x .
Полагается, что элементы выборки V проверены на наличие ошибок контроля
и последние удалены. Причём соблюдается условие y i ≠ 0, i = 1, n , необходимое
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.В. Лапко, В.А. Лапко
96
при использовании относительной ошибки аппроксимации восстанавливаемой
зависимости.
(
Поставим в соответствие некоторым точкам xi , y i
)
обучающей выборки V ,
условно назовём их опорными, упрощённые аппроксимации ϕi ( x, α ) зависимости (1), параметры α которых удовлетворяют условиям
(
)
y i = ϕi xi , αi ,
αi = arg min
αi
1 n
∑ y j − ϕi x j , αi
n − 1 j =1
(
(
))
2
, i = 1, N .
(2)
j ≠i
(
)
Упрощённые аппроксимации ϕi x, αi , например линейные, проходят через
опорные точки
( xi , yi , i = 1, N )
и близки в среднеквадратическом к остальным
элементам обучающей выборки V .
Примем в качестве статистической модели зависимости (1) процедуру условного усреднения
N
(
)
ϕ ( x ) = ∑ ϕi x, αi λ i ( x ) ,
i =1
(3)
(
где положительная функция λ i ( x ) определяет «вес» правила ϕi x, αi
)
при фор-
мировании решения в ситуации x . Причём сумма λ i ( x ) , i = 1, N , равна единице.
Примером функции λ i ( x ) является «весовая» функция
⎛ xv − xvi ⎞
Φ
∏ ⎜ c ⎟
v
⎠ ,
i
λ ( x ) = v =1 ⎝
N k
⎛ xv − xvi ⎞
∑∏ Φ ⎜ c ⎟
v
i =1 v =1
⎝
⎠
k
составленная из положительных, нормированных и симметричных «ядерных»
⎛ x − xi ⎞
функций cv−1 Φ ⎜⎜ v v ⎟⎟ , на основе которых строятся непараметрические моде⎝ cv ⎠
ли [9].
(
)
В этом случае при ϕi x, αi = y i и N = n статистика (3) преобразуется в традиционную непараметрическую регрессию
n
y = ϕ ( x ) = ∑ yi λi ( x ) .
i =1
Проведём анализ обобщённой непараметрической регрессии (3) для линейных
упрощённых аппроксимаций
(
)
k
ϕi x, αi = ∑ αiv xv + βi , i = 1, N .
v =1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Обобщённая непараметрическая регрессия и её свойства
97
Заметим, что в соответствии с методикой синтеза статистики ϕ ( x ) (3)
k
βi = y i − ∑ αiv xvi ,
v =1
а параметры
αiv
, i = 1, N , определяются из условия минимума критерия (2). Тогда
(
k
)
(
)
ϕi x, αi = y i + ∑ αiv xv − xvi , i = 1, N .
v =1
(4)
Подставляя упрощённые аппроксимации (4) в выражение (3), получим
N
N
k
i =1
i =1 v =1
(
)
ϕ ( x ) = ∑ y i λ i ( x ) + ∑∑ αiv xv − xvi λ i ( x ) .
(5)
Первое слагаемое в выражении (5) представляет собой непараметрическую
регрессию, обладающую свойствами асимптотической сходимости к условному
математическому ожиданию – оптимальной модели (1) в среднеквадратическом
смысле [10, 11].
Вторая составляющая (5) играет роль поправочного члена и отражает условную взаимосвязь между точками обучающей выборки. Его значения, в соответствии с особенностями первого слагаемого (5), снижаются по мере роста объёма исходной информации, что подтверждается результатами аналитических исследований [11]. Наличие поправочного члена делает статистику (3) схожей с гибридными моделями, а слабая зависимость её свойств от вида опорных функций – с непараметрической регрессией.
Для синтеза обобщённой непараметрической регрессии разработана итерационная процедура формирования системы опорных точек. Идея предлагаемого метода основывается на последовательном анализе относительных расхождений
между значениями восстанавливаемой зависимости и строящейся обобщённой
непараметрической регрессии Ψ t ϕ j ( x ) , j = 1, t :
(
W (i ) =
)
( ( )
y i − Ψ t ϕ j xi , j = 1, t
y
i
) , i∈I
t
,
где I t = I \ I t – множество номеров точек, не входящих в число опорных с номерами из множества I t , а I – множество номеров точек исходной выборки. Если
( ( )
)
модель Ψ t ϕ j xi , j = 1, t в некоторой точке xi имеет максимальное расхождение с экспериментальным значением y i , то естественно принять эту точку
( xi , yi ) в качестве опорной при построении ( t + 1) упрощённой аппроксимации.
Процедура формирования опорных точек заканчивается на t -й итерации, когда ошибка аппроксимации
1
W Ψ t ϕ j ( x ) , j = 1, t =
∑ W (i ) < W
I t i∈I t
( (
))
меньше заданного порога W , удовлетворяющего пользователя. Здесь I t – количество элементов множества I t .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.В. Лапко, В.А. Лапко
98
2. Модификация обобщённой непараметрической регрессии
Для повышения аппроксимационных свойств обобщённой непараметрической
регрессии предлагается учитывать статистические оценки эффективности W i уп-
(
)
рощённых параметрических аппроксимаций ϕi x , αi , i ∈ I . Здесь I – множество номеров опорных точек из выборки V . В качестве показателя эффективности i-й аппроксимации может выступать среднеквадратический критерий
Wi =
1 n
∑ y j − ϕi x j , αi
n − 1 j =1
(
(
))
2
, i∈I .
j ≠i
Учёт эффективности целесообразно осуществить, вводя в «весовую» функцию
λ ( x ) ядерную меру близости между значением W i и её минимальным значением (нулём). В результате полученная модификация обобщённой непараметрической регрессии (3) с учётом оценок эффективности упрощённых параметрических
аппроксимаций имеет вид
k
⎛ x − xi ⎞ ⎛ 0 − W i ⎞
∑ ϕi x , αi ∏ Φ ⎜ v c v ⎟ Φ ⎜ c ⎟
v
i∈I
⎝
⎠ ⎝ w ⎠
v =1
ϕ( x) =
,
i
k
⎛ xv − xv ⎞ ⎛ 0 − W i ⎞
∑ ∏Φ⎜ c ⎟ Φ⎜ c ⎟
v
i∈I v =1
⎝
⎠ ⎝ w ⎠
i
(
)
⎛ 0 −W i ⎞
где cw – параметр ядерной функции Φ ⎜
⎟ , который характеризует область
⎝ cw ⎠
её определения.
3. Асимптотические свойства обобщённой непараметрической регрессии
Для удобства последующего анализа предположим, что x – скаляр и закон
распределения p ( x ) известен. Тогда обобщённая непараметрическая регрессия
типа (3) будет иметь вид
N
⎛ x − xi ⎞
1
(6)
ϕ( x) =
ϕi x, αi Φ ⎜
⎟.
∑
Ncp ( x ) i =1
⎝ c ⎠
(
)
Если принять
ϕi ( x, α ) = αi x + βi ,
то при выполнении условия (2) её прохождения через опорную точку
βi = y i − αi xi .
При этом упрощённая аппроксимация ϕi ( x, α ) соответствует выражению
(
)
ϕi ( x, α ) = y i + αi x − xi .
Тогда модель (6) запишется в виде статистики
ϕ( x) =
N
N
⎛ x − xi ⎞
⎛ x − xi ⎞
1
1
αi x − xi Φ ⎜
yi Φ ⎜
⎟+
⎟.
∑
∑
Ncp ( x ) i =1
⎝ c ⎠ Ncp ( x ) i =1
⎝ c ⎠
(
)
(7)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Обобщённая непараметрическая регрессия и её свойства
99
Теорема. Пусть 1) кривая регрессии ϕ ( x ) и плотности вероятностей p ( x, y ) ,
p ( x ) , характеризующие распределения переменных x , y исходных статистических данных и опорных точек обобщённой непараметрической регрессии, являются ограниченными и непрерывными со всеми своими производными до второго
порядка включительно; 2) ядерные функции Φ ( u ) являются положительными,
симметричными и нормированными; 3) объём исходных статистических данных
n → ∞ ; 4) последовательность c = c ( N ) → 0 при N → ∞ , а Nc → ∞ .
Тогда:
смещение
A ( x, y ) + A ( x, y )
M ( ϕ ( x ) − ϕ ( x )) ~ c2 1
;
(8)
2 p ( x)D ( x)
квадратическое отклонение
ϕ2 ( x ) Φ ( u )
M ( ϕ ( x ) − ϕ ( x )) ~
Ncp ( x )
2
2
(
( 2)
⎡
c4 ⎢ ( ϕ ( x ) p ( x ))
+
p ( x) ⎢
4 p ( x)
⎢⎣
)
2
+
⎛ A ( x, y )
⎞⎤
×⎜
+ A 1( x, y ) ⎟ ⎥ ,
⎝ 4 p ( x) D ( x)
⎠⎦
A ( x, y )
×
D ( x)
(9)
где M – знак математического ожидания; A ( x, y ) , A 1( x, y ) – нелинейные функционалы от ϕ ( x ) , p ( x, y ) , p ( x ) и их производных; D ( x ) – дисперсия опорных
точек; Φ ( u )
2
= ∫ Φ 2 ( u ) du . Здесь и далее бесконечные пределы интегрирования
опускаются.
Из выражений (8), (9) при выполнении условий теоремы следует асимптотическая несмещённость, сходимость в среднеквадратическом и состоятельность
обобщённой непараметрической регрессии.
Для доказательства данных утверждений используется технология преобразований, предложенная В.А. Епанечниковым при исследовании асимптотических
свойств непараметрической оценки плотности вероятности [12] и развитая в работах [13−15].
В исследуемую модель (7) подставляются оптимальные значения параметров
n
(
αi = ∑ y i − y j
j =1
j ≠i
n
)( xi − x j ) ∑ ( xi − x j )
2
, i = 1, N ,
j =1
j ≠i
минимизирующих критерий (2).
При выполнении последующих преобразований учитывается, что элементы исходной статистической выборки V и множества опорных точек являются значениями одних и тех же случайных величин ( t , y ) с плотностью вероятности p ( t , y ) .
Определим кривую регрессии
ϕ ( t ) = ∫ y p ( y / t ) dy
и проведём замену переменных ( x − t ) c −1 = u в составляющих M ( ϕ ( x ) − ϕ ( x ) ) и
2
M ( ϕ ( x ) − ϕ ( x )) .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.В. Лапко, В.А. Лапко
100
Разложим функции ϕ ( x − c u ) , p ( x − c u ) в ряды Тейлора в точке x и произведём интегрирование полученных выражений с учётом свойств ядерных
функций.
Далее, проводя достаточно громоздкие вычисления и отбросив составляющие
высших порядков малости при n → ∞ , N → ∞ получим приведённые асимптотические выражения смещения (8) и квадратического отклонения (9).
Установлено, что асимптотические свойства обобщённой непараметрической
регрессии несущественно зависят от объёма выборки, используемой при идентификации упрощённых аппроксимаций. Эффективность предлагаемой модели в
основном определяется законом распределения системы опорных точек и их количеством.
Сравнение аппроксимационных свойств исследуемой модели y = ϕ ( x ) и традиционной непараметрической регрессии y = ϕ ( x ) осуществляется путём анализа
отношения соответствующих им среднеквадратических критериев
2
R=
M ∫ ( ϕ ( x ) − ϕ ( x ) ) dx
2
M ∫ ( ϕ ( x ) − ϕ ( x ) ) dx
при n → ∞ и N → ∞ .
При выполнении условия R > 1 имеет место преимущество ϕ ( x ) над ϕ ( x ) .
Поэтому ставится задача поиска условий синтеза обобщённой непараметрической
регрессии, обеспечивающих выполнение данного требования.
Используемая схема исследований предполагает выполнение следующих действий.
Проинтегрируем выражение (9) и обозначим его через W . Определим оптимальное значение коэффициентов размытости c , c ядерных функций статистик
ϕ ( x ) и ϕ ( x ) , минимизирующих соответственно W и асимптотическое выражение среднеквадратического критерия [15]
W=
Φ (u )
nc
2
−1
2
∫ ϕ ( x ) p ( x ) dx +
c4
4
∫( p
−1
( x ) ( ϕ ( x ) p ( x ) )( 2) ) dx .
2
Вычислим минимальное значение W , W выражений W , W при оптимальных c , c . Проведём анализ отношения R =
W
и установим условия, при котоW
рых R > 1 .
Для равномерных законов распределения аргументов восстанавливаемой зависимости и опорных точек это условие определяется неравенством
2
2
4
(1)
(1)
(1)
⎛ N ⎞ > 11⎛ ymax ⎞ + 7 ⎛ ymax ⎞ + 4 ymax + 2 ymax ymax ,
⎜⎜
⎟⎟
⎜ ⎟
⎜
⎟
D ( x ) 3 D2 ( x )
⎝n⎠
⎝ D ( x) ⎠
⎝ D ( x) ⎠
(1)
где ymax , ymax
– максимальные значения восстанавливаемой зависимости и её
производной.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Обобщённая непараметрическая регрессия и её свойства
101
4. Анализ результатов вычислительных экспериментов
Проведём сравнение аппроксимационных свойств традиционной и обобщённой непараметрических регрессий при восстановлении стохастической зависимости
(
F ( x ) = 1 − x + exp −20 ( x − 0,5 )
приведённой в работе [1].
2
(
),
)
При формировании исходных данных V = xi , y i , i = 1, n объёма n значения
x ∈ [ 0; 1] определялись с равномерным законом распределения, а на значения
функции накладывалась помеха в соответствии с выражением
( ) (
) ( )
y i = F xi + 2 0,5 − εi F xi r , i = 1, n .
Здесь r ∈ [ 0; 1] – уровень помех; εi ∈ [ 0; 1] – случайная величина с равномерным
законом распределения.
В статистике (3) при k = 1 упрощённые аппроксимации принимались линейными, а функции Φ ( u ) соответствовали оптимальным в среднеквадратическом
смысле ядрам В.А. Епанечникова [12]. В качестве показателя эффективности
сравниваемых моделей использовалась среднеквадратическая ошибка типа
W=
1 n
∑ F (x j ) − ϕ x j
n j =1
(
( ))
2
,
которая вычислялась по контрольной выборке объёма n = 1000 . При её оценивании для каждого условия эксперимента проводилось 50 имитаций обучающих выборок, а полученные результаты усреднялись.
При формировании обобщённой регрессии (3) опорные точки выбирались из
исходной выборки V с равномерным законом распределения.
~
W
0,03
1
0,02
2
0,01
0
0,05
0,1
0,15
0,2
0,25
r
Рис. 1 Зависимость среднеквадратической ошибки W от уровня
помех r при объёме исходных данных n = 20 и отношении
N n = 0,5 . Кр. 1, 2 соответствуют традиционной непараметрической регрессии и исследуемой статистике (3)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
102
А.В. Лапко, В.А. Лапко
Установлено, что точность аппроксимации обобщённой непараметрической
регрессии в основном зависит от количества опорных точек, закона их распределения и уровня помех r . Исследуемая статистика обладает преимуществом над
традиционной непараметрической регрессией при относительно малых объёмах
исходных данных ( N ≤ 100 в условиях N / n ∈ ( 0, 2; 0,5 ) и r < 0, 2 ). При больших
значениях n эффективность сравниваемых моделей сопоставима, что согласуется
с результатами аналитических исследований. С ростом уровня помех качество аппроксимации исследуемой статистики снижается. Вместе с тем двойное сглаживание, используемое при синтезе модели (3), обеспечивает её преимущество над
непараметрической регрессией, что особенно проявляется при малых значениях
уровня помех (рис. 1).
Заключение
Обобщённая непараметрическая регрессия для решения задач восстановления
стохастических зависимостей занимает промежуточное положение между локальными и параметрическими методами аппроксимации функций и использует их
преимущества. Структуру изучаемого класса моделей составляют семейство упрощенных параметрических аппроксимаций исследуемой функции, каждая из которых строится относительно системы опорных ситуаций из обучающей выборки.
Объединение упрощенных аппроксимаций осуществляется с помощью непараметрической оценки оператора условного математического ожидания.
Установлено, что асимптотические свойства обобщённой непараметрической
регрессии слабо зависят от вида упрощённых аппроксимаций и объёма выборки в
задаче их идентификации. Эффективность предлагаемых моделей в значительной
степени определяется законом распределения системы опорных точек и их количеством.
Исследуемая статистика обладает преимуществом над традиционной непараметрической регрессией при относительно малых объёмах исходных данных. При
больших значениях n эффективность сравниваемых моделей сопоставима, что
согласуется с результатами аналитических исследований.
ЛИТЕРАТУРА
1. Хардле В. Прикладная непараметрическая регрессия. М.: Мир, 1993. 349 с.
2. Катковник В.Я. Линейные и нелинейные методы непараметрического регрессионного
анализа // Автоматика. 1979. № 5. С. 165−170.
3. Лапко А.В., Лапко В.А., Ярославцев С.Г. Разработка и исследование гибридных алгоритмов в задачах распознавания образов // Автометрия. 2006. № 1. С. 32−39.
4. Лапко В.А., Лапко В.А. Гибридные модели стохастических зависимостей // Автометрия.
2002. № 5. С. 38−48.
5. Лапко А.В., Лапко В.А., Саренков А.В. Синтез и анализ линейных гибридных решающих функций в задаче распознавания образов // Системы управления и информационные технологии. 2012. № 1 (47). С. 66−69.
6. Лапко В.А. Синтез и анализ непараметрических моделей коллективного типа // Автометрия. 2001. № 6. С. 98−106.
7. Lapko V. A. Nonparametric models of pattern recognition of collective type // Pattern
Recognition and Image Analysis. 2002. V. 12. No. 4. P. 354−361.
8. Лапко В.А. Непараметрические модели временных зависимостей, основанные на методе двойного коллективного оценивания // Автометрия. 2002. № 1. С. 42−50.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Обобщённая непараметрическая регрессия и её свойства
103
9. Parzen E. On estimation of a probability density function and mode // Ann. Math. Statistic.
1962. V. 33. No. 3. P. 1065−1076.
10. Надарая Э.А. Замечания о непараметрических оценках плотности вероятности и кривой регрессии // Теория вероятностей и её применение. 1970. Т. 15. № 1. С. 139−142.
11. Лапко А.В., Лапко В.А. Анализ асимптотических свойств многомерной непараметрической регрессии // Вестник СибГАУ. 2012. № 2 (42). С. 41−44.
12. Епанечников В.А. Непараметрическая оценка многомерной плотности вероятности //
Теория вероятности и ее применения. 1969. Т. 14. № 1. С. 156−161.
13. Лапко А.В., Лапко В.А. Анализ асимптотических свойств непараметрической оценки
уравнения разделяющей поверхности в двуальтернативной задаче распознавания образов // Автометрия. 2010. Т. 46. № 3. С. 48 – 53.
14. Лапко А.В., Лапко В.А. Анализ непараметрических алгоритмов распознавания образов
в условиях пропуска данных // Автометрия. 2008. № 3. С. 65−74.
15. Лапко А.В., Лапко В.А. Коллектив многомерных непараметрических регрессий, основанный на декомпозиции обучающей выборки по её объёму // Вестник СибГАУ. 2012.
3 (43). С. 42−46.
Лапко Александр Васильевич
Лапко Василий Александрович
Институт вычислительного моделирования СО РАН,
Сибирский государственный аэрокосмический
университет им. академика М.Ф. Решетнева
E-mail: lapko@icm.krasn.ru
Поступила в редакцию 5 марта 2013 г.
Lapko Alexandr V., Lapko Vasily A.. (Institute of Computational Modeling, Siberian Branch of
Russian Academy of Sciences; Reshetnev Siberian State Aerospace University). The generalized
nonparametric regression and its properties.
Keywords: nonparametric regression, collective estimation, simplified approximations, asymptotic properties.
The technique of synthesis and analysis of the generalized nonparametric regression for solution of problems of restoration of stochastic associations under conditions of the incomplete information is proposed. The idea of the considered approach consists in construction of a set of the
simplified parametrical models concerning system of reference points of a learning sample. Their
subsequent integration into the generalized model is carried out on the basis of methods of a nonparametric statistician. Properties of the generalized nonparametric regression are investigated.
Results of its comparison with a traditional nonparametric regression are analyzed. Conditions of
their competence are defined.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
УДК 519.872
Т.В. Любина, А.А. Назаров
ИССЛЕДОВАНИЕ ДИНАМИЧЕСКОЙ И АДАПТИВНОЙ RQ-СИСТЕМ
С ВХОДЯЩИМ ММРР-ПОТОКОМ ЗАЯВОК1
Проводится исследование динамической и адаптивной RQ-систем с входящим ММРР-потоком заявок методом асимптотического анализа в условии
большой загрузки. Показана эквивалентность представленных RQ-систем.
Приводятся численные результаты проведенных исследований.
Ключевые слова: RQ-система, пропускная способность, метод асимптотического анализа, коррелированный поток.
Построению и исследованию RQ-систем (Retrial Queue) [1, 2] в настоящее
время посвящается достаточно большое количество научных работ, например работы Г.И. Фалина [3], В.И. Клименок [4], А.Н. Дудина [5], А.А. Назарова [6, 7],
поскольку считается важным оценить производительность и спроектировать телефонные сети, локальные вычислительные сети с протоколами случайного множественного доступа, широковещательные радиосети, мобильные сотовые радиосети. Наличие повторных попыток получить обслуживание является неотъемлемой чертой этих систем, игнорирование данного эффекта может привести к значительным погрешностям при принятии инженерных решений.
Методы теории массового обслуживания [8−10] являются наиболее результативными в исследовании RQ-систем. Наиболее эффективным является метод
асимптотического анализа [11], которым воспользуемся при проведении исследования динамической и адаптивной RQ-систем с ММРР-потоком заявок.
1. Математическая модель динамической RQ-системы
В данной работе динамической RQ-системой c входящим ММРР-потоком заявок будем называть систему массового обслуживания (СМО) с источником повторных вызовов (ИПВ) и входящим марковски-модулированным пуассоновским
потоком (ММРР-потоком) заявок, управляемую динамическим протоколом доступа [12].
На вход RQ-системы поступает MMРP-поток заявок из внешнего источника,
определяемый диагональной матрицей Λ условных интенсивностей λ n и матрицей Q инфинитезимальных характеристик qνn цепи Маркова n(t ) , управляющей
ММРР-потоком. Заявка, заставшая прибор свободным, занимает его для обслуживания в течение случайного времени, распределенного по экспоненциальному закону с параметром μ . По завершении обслуживания заявка покидает прибор. Если во время обслуживания заявки поступает другая, то поступившая заявка переходит в ИПВ. Из ИПВ после случайной задержки заявка с динамической (завися1
Работа выполнена при поддержке РФФИ, проект № 12-01-90810-мол_рф_нр и в рамках государственного задания Минобрнауки РФ на проведение научных исследований в Томском государственном
университете на 2012-2014 годы, задание 8.4055.2011.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование динамической и адаптивной RQ-систем с входящим ММРР-потоком заявок 105
щей от состояния ИПВ) интенсивностью γ / i вновь обращается к прибору с повторной попыткой его захвата, i – число заявок в ИПВ. Если прибор свободен, то
заявка становится на обслуживание, если же он занят, то возвращается в ИПВ.
Состояние системы в момент времени t определяется трехмерной цепью
Маркова {k (t ), n(t ), i (t )} , где i (t ) – число заявок в ИПВ, n(t ) – значения цепи
Маркова, управляющей ММРР-потоком, а k (t ) определяет состояние прибора
следующим образом: k (t ) = 0 , если прибор свободен, и k (t ) = 1 , если прибор
занят.
Обозначим P {k (t ) = k , n(t ) = n, i (t ) = i} = P(k , n, i, t ) – вероятность того, что в
момент времени t прибор находится в состоянии k , цепь Маркова в состоянии n
и в ИПВ i заявок. Таким образом, распределение вероятностей P(k , п, i, t ) удовлетворяет следующей системе дифференциальных уравнений Колмогорова для
распределения вероятностей P(k , n, i, t ) :
⎧ ∂P(0, n, i, t ) = −(λ + γ ) P (0, n, i, t ) + μP (1, n, i, t ) + P(0, ν, i, t )q
∑
n
νn
⎪
∂t
ν
⎪
⎪ ∂P(1, n, i, t )
= −(λ n + μ) P (1, i, t ) + γP(0, n, i + 1, t ) + λ n P (0, n, i, t ) +
⎨
∂t
⎪
⎪+λ n P (0, n, i − 1, t ) + ∑ P (1, ν, i, t )qνn .
⎪
ν
⎩
(1)
Решение системы уравнений Колмогорова (1) достаточно полно определяет
функционирование динамической RQ-системы с входящим ММРР-потоком заявок. Допредельное исследование проведем методом производящих функций.
2. Исследование динамической RQ-системы
методом производящих функций
Будем полагать, что система функционирует в стационарном режиме, то есть
P(k , n, i, t ) ≡ P(k , n, i ) . Запишем систему (1) для стационарного распределения в
матричном виде. Обозначив вектор-строки
P (k , i ) = { P(k ,1, i ), P(k , 2, i ),..., P (k , N , i )} ,
получим
P (0, 0)(Q − Λ) + P (1, 0)μ = 0 , i = 0,
P (1, 0)(Q − Λ − μI ) + P (0, 0) Λ + P (0,1) γ = 0 , i = 0,
P (0, i )(Q − Λ − γI ) + P (1, i )μ = 0 , i ≥ 1 ,
(2)
P (1, i )(Q − Λ − μI ) + P (0, i ) Λ + P (1, i − 1) Λ + P (0, i + 1) γ = 0 , i ≥ 1 .
Чтобы решить систему (2), определим векторные производящие функции
∞
G (k , x) = ∑ xi P(k , i ) , k = 0, 1.
(3)
i =0
Из системы (2), с учетом равенства (3), получаем следующую систему для
функций G (k , x) :
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.В. Любина, А.А. Назаров
106
{
G (0, x)(Q − Λ − γI ) + G (1, x)μ = −γP (0, 0),
G (0, x)( Λx + γI ) + G (1, x)(Q + ( x − 1) Λ − μI ) x = γP (0, 0).
(4)
Из системы (4) получаем выражения для G (0, x) и G (1, x) :
{
γ
⎧
⎫
G (0, x) = P (0, 0) ⎨ γI + x ( Q + ( x − 1) Λ − μI ) ⎬ (1 − x) γI + xQ
μ
⎩
⎭
−1
1
⎫
− ( Q − Λ − γI )( Q + ( x − 1) Λ) x ⎬ ,
μ
⎭
G (1, x) = −
(5)
1
[ γP (0, 0) + G (0, x)(Q − Λ − γI )] .
μ
Обозначим матрицы
А( x) = γI +
γ
x ( Q + ( x − 1) Λ − μI ) ,
μ
x
B ( x) = (1 − x) γI + xQ − ( Q − Λ − γI ) ( x − 1) ( Q + Λ) ,
μ
тогда равенство (5) перепишется в следующем виде:
G (0, x) = P (0, 0) A( x) B −1 ( x) .
Производящая функция G (0, x) определена для всех значений x ∈ [ 0,1] , но
матрица B ( x) вырождена при x = xν , где xν – корни уравнения B ( x) = 0 , при-
надлежащие рассматриваемому интервалу [ 0, 1] .
Обратную матрицу B −1 ( x) запишем в виде B −1 ( x) =
1
DT ( x) , где элеменB ( x)
тами D( x) n1n2 матрицы D( x) являются алгебраические дополнения к элементам
B( x) n1n2 матрицы B ( x) .
Из равенства нулю определителя B ( xν ) = 0 следует, что компоненты вектора
P (0, 0) удовлетворяют однородной системе линейных алгебраических уравнений
P (0, 0) A( xν ) B T ( xν ) = 0 .
Эта система определяет значения компонент вектора P (0, 0) с точностью до
мультипликативной постоянной, значение которой определяется условием нормировки. Таким образом, удалось найти выражения (5) для производящих функций G (k , x)
3. Исследование динамической RQ-системы
методом асимптотического анализа
Нахождение явного выражения (5) для производящей функции в математических моделях RQ-систем является исключительной ситуацией, поэтому требуется
разработка других методов анализа таких моделей. Наиболее плодотворным в
этом направлении является метод асимптотического анализа, изложение которого
выполним для данной модели. Это позволит выявить эффективность разработан-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование динамической и адаптивной RQ-систем с входящим ММРР-потоком заявок 107
ного метода путем сравнения асимптотических результатов с допредельными
[13], а также позволит сравнить их с асимптотическими результатами, полученными для адаптивной RQ-системы.
Систему (4) модифицируем следующим образом:
⎧ H (0, u )(Q − ρΛ − γI ) + H (1, u )μ = −γP (0, 0),
(6)
⎨
− ju
ju
− ju
⎩ H (0, u )(ρΛ + e γI ) + H (1, u )(Q + (e − 1)ρΛ − μI ) = e γP (0, 0),
где ρ – параметр, который используется для получения предельного условия
большой загрузки RQ-системы, а функция H (k , u ) = G (k , e ju ) = G (k , x) .
Систему (6) будем решать методом асимптотического анализа в условии
большой загрузки ρ ↑ S1 , где S1 – пропускная способность динамической RQсистемы [14]. Обозначив ε = S1 − ρ , будем полагать также ε → 0 и систему (6)
будем решать при выполнении этого условия. В системе (6) выполним замены
ρ = S1 − ε , u = εw , H k (u ) = Fk ( w, ε) , P (0, 0) = εΠ (ε)
и перепишем в виде
(7)
⎧⎪ F0 ( w, ε ) ( Q − ( S1 − ε ) Λ − γI ) + F1 ( w, ε ) μ = −γεΠ (ε),
⎨
− j εw
j εw
− j εw
γI + F1 ( w, ε ) Q + e − 1 ( S1 − ε ) Λ − μI = e
γεΠ (ε).
⎪⎩ F0 ( w, ε ) ( S1 − ε ) Λ + e
(
(
)
(
)
)
Теорема 1. Значение S1 пропускной способности динамической RQ-системы с
входящим ММРР-потоком заявок равно значению корня уравнения
γR0 E − S1 R1 ΛE = 0 ,
(8)
где вектор-строка Rk – совместное распределение вероятностей состояний
прибора и значений цепи Маркова, управляющей входящим ММРР-потоком, которое определяется равенствами
−1
R0 ( S1 ) = μR {( μ + γ ) I + S1 Λ − Q} ,
{
−1
R1 ( S1 ) = R I − μ [( μ + γ ) I + S1 Λ − Q ]
}.
(9)
Доказательство. Доказательство этой теоремы выполним в два этапа.
Этап 1. Обозначим lim Fk ( w, ε) = Fk ( w) , выполнив в (7) указанный предельε→0
ный переход, получим систему
⎧ F0 ( w )( Q − S1 Λ − γI ) + F1 ( w ) μ = 0,
⎨
⎩ F0 ( w )( S1 Λ + γI ) + F1 ( w )( Q − μI ) = 0.
(10)
Решение Fk ( w) системы (10) будем искать в виде
Fk ( w) = Rk Φ ( w) ,
(11)
где функция Φ ( w) на бесконечности равна нулю, а Rk – распределение вероятностей состояний прибора, определяемое системой
⎧ R0 ( Q − S1 Λ − γI ) + R1μ = 0,
(12)
⎨
⎩ R0 ( S1 Λ + γI ) + R1 ( Q − μI ) = 0.
Нетрудно показать, что ( R0 + R1 ) Q = 0 , то есть RQ = 0 , где R = R0 + R1 и
удовлетворяет условию нормировки RE = 1 , тогда R0 и R1 , зависящие от S1 ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.В. Любина, А.А. Назаров
108
определяются равенствами
−1
R0 ( S1 ) = μR {( μ + γ ) I + S1 Λ − Q} ,
{
−1
R1 ( S1 ) = R I − μ [( μ + γ ) I + S1 Λ − Q ]
},
совпадающими с (9).
Этап 2. Переписав (7) в виде
( )
⎧⎪ F0 ( w, ε )( Q − S1 Λ − γI + εΛ) + F1 ( w, ε ) μ = −γεΠ (ε) + O ε 2 ,
⎨
2
⎪⎩ F0 ( w, ε )( S1 Λ + γI − ε( Λ + jwγI ) ) + F1 ( w, ε )( Q − μI + jεwS1 Λ) = γεΠ (ε) + O ε ,
( )
просуммируем по k и n все уравнения полученной системы и получим уравнение
F0 ( w, ε ) εjwγE − F1 ( w, ε ) jεwS1 ΛE = 0 ,
из которого имеем
F0 ( w, ε ) γE − F1 ( w, ε ) S1 ΛE = 0 .
Используя (11), получим равенство
R0 Φ ( w) γE − R1Φ ( w) S1 ΛE = 0 ,
откуда получаем выражение
γR0 E − S1 R1 ΛE = 0 ,
которое совпадает с (8) и определяет значение пропускной способности S-й динамической RQ-системы.
4. Математическая модель адаптивной RQ-системы
Рассмотрим однолинейную СМО с ИПВ и входящим ММРР-потоком, управляемую адаптивным протоколом доступа [15]. Такую систему будем называть
адаптивной RQ-системой с входящим ММРР-потоком.
На вход системы поступает ММРР-поток заявок [7], определяемый диагональной матрицей ρΛ условных интенсивностей ρλ n и матрицей Q инфинитезимальных характеристик qνn цепи Маркова n(t), управляющей ММРР-потоком. Заявка,
заставшая прибор свободным, занимает его для обслуживания в течение случайного времени, распределенного по экспоненциальному закону с параметром µ. По
завершении успешного обслуживания заявка покидает прибор. Если во время обслуживания заявки поступает другая, то поступившая заявка переходит в ИПВ. Из
ИПВ после случайной задержки заявка, с интенсивностью 1/ T , где T – состояние адаптера в текущий момент времени, которое определим ниже, вновь обращается к прибору с повторной попыткой его захвата. Если прибор свободен, то заявка становится на обслуживание, если занят – возвращается в ИПВ.
Состояние системы в момент времени t определяется четырехмерным процессом Маркова {k (t ), n(t ), i (t ), T (t )} [5, 6], где k(t) определяет состояние прибора
следующим образом: k (t ) = 0 , если прибор свободен, и k (t ) = 1 , если прибор занят; n(t) – значения цепи Маркова, управляющей ММРР-потоком; i(t) – число заявок в ИПВ; адаптер с течением времени t свои состояния T (t ) меняет следующим
образом: T (t + ∆t ) = T (t ) − α∆t ,
если
k (t ) = 0 , и T (t + ∆t ) = T (t ) + β∆t ,
если
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование динамической и адаптивной RQ-систем с входящим ММРР-потоком заявок 109
k (t ) = 1 , где величины α > 0 , β > 0 – параметры адаптера, значения которых заданы [11].
Исследования данной адаптивной RQ-системы были выполнены методом
асимптотического анализа в условии большой загрузки при определении величины S2 пропускной способности адаптивной RQ-системы как точной верхней границы тех значений ρ , для которых существуют стационарные режимы функционирования рассматриваемой математической модели RQ-системы и при выполнении асимптотического условия ρ ↑ S2 . Результаты данного исследования опубликованы авторами в работе [16]. В ходе этих исследований была сформулирована и
доказана следующая теорема.
Теорема 2. Значение S2 пропускной способности адаптивной RQ-системы с
входящим ММРР-потоком заявок определяется системой уравнений
⎧ γR0 E − S2 R1 ΛE = 0,
(13)
⎨
⎩αR0 E − βR1 E = 0,
где α , β – параметры адаптера, значения которых заданы, γ – некоторая положительная постоянная, также определяемая этой системой, Rk – распределение вероятностей состояний прибора, которое определяется равенствами
−1
R0 ( S2 , γ ) = μR {( μ + γ ) I + S2 Λ − Q} ,
{
−1
R1 ( S2 , γ ) = R I − μ [( μ + γ ) I + S2 Λ − Q ]
}.
(14)
Из вида первого уравнения системы (13) для нахождения пропускной способности адаптивной RQ-системы и уравнения (8) для нахождения пропускной способности динамической RQ-системы следует, что пропускная способность адаптивной RQ-системы S2 равна пропускной способности динамической RQсистемы S1 , то есть S1 = S2 .
Вид равенств (14) для нахождения распределений вероятностей состояний
прибора адаптивной RQ-системы также совпадает с равенствами (9) для нахождения распределений вероятностей состояний прибора динамической RQ-системы.
5. Численный анализ динамической RQ-системы
Векторную характеристическую функцию H (u ) для распределения вероятностей P (i ) = P (0, i ) + P (1, i ) числа заявок в ИПВ запишем в виде
1
⎛
⎞ γ
H (u ) = H (0, u ) + H (1, u ) = H (0, u ) ⎜ I − (Q − Λ − γI ) ⎟ − P (0, 0).
μ
⎝
⎠ μ
Тогда распределение вероятностей p (i ) = P (i ) E числа заявок в ИПВ определяется обратным преобразованием Фурье от скалярной характеристической
функции h(u ) = Me jui (t ) = ∑ e jui p (i ) = H (u ) E :
i
π
p (i ) =
1
− jui
∫ e h(u )du .
2π −π
(15)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Т.В. Любина, А.А. Назаров
110
Для заданных значений параметров μ = 1 , γ = 3 и матриц
⎛ −0.7 0.4 0.3 ⎞
⎛1 0 0⎞
⎛ 1⎞
⎛1
⎜
⎟
⎜
⎟
⎜
⎟
Q = 0.1 −0.4 0.3 , Λ = 0 2 0 , E = 1 , I = ⎜ 0
⎜
⎟
⎜
⎟
⎜ ⎟
⎜
⎝ 0.4 0.5 −0.9 ⎠
⎝0 0 4⎠
⎝ 1⎠
⎝0
определяющих h(u ) , численным интегрированием (15) получим
0 0⎞
1 0⎟ ,
(16)
⎟
0 1⎠
распределение
вероятностей числа заявок в ИПВ p (i ) (табл. 1).
Таблица 1
Распределение вероятностей p( i ) числа заявок в ИПВ, i = 0, 1, 2,…
i
p (i )
0
0,220
1
0,094
2
0,082
3
0,072
4
0,063
5
0,056
6
0,049
7
0,043
…
…
δi
0,425
0,872
0,878
0,880
0,881
0,881
0,882
0,882
…
Особенность данного распределения заключается в том, что последовательность отношения δi = p (i + 1) / p (i ) достаточно быстро стабилизируются и при
i ≥ 3 принимает постоянное значение с точностью до двух знаков после запятой.
Аналогичные результаты имеют место и для других значений параметров μ ,
γ и матриц Λ и Q . При приведенных значениях параметров и матриц значение
пропускной способности динамической RQ-системы равно S1 = 0, 790 .
6. Численный анализ адаптивной RQ-системы
При заданных параметрах адаптивной RQ-системы определим значения пропускной способности S2 и величины γ . Пусть значения параметров будут определены в виде μ = 1 , β = 1 , а значения матриц в виде (16).
Решая относительно S2 и γ систему (13) получим следующие численные результаты (табл. 2).
Таблица 2
Значения величин S2 и γ при различных α
α
S2
γ
0,2
0,167
0,036
0,4
0,286
0,121
0,6
0,375
0,236
0,8
0,444
0,369
1
0,5
0,516
2
0,667
1,355
3,768
0,790
3
5
0,833
4,187
10
0,909
9,105
100
0,99
99,01
По данным табл. 2 можно сделать вывод, что при увеличении α β значение
пропускной способности S2 увеличивается, при этом значительно увеличивается
и значение величины γ .
В табл. 3 при α = 3, 768 пропускная способность адаптивной RQ-системы
S2 = 0.790 и γ = 3 , что соответствует пропускной способности динамической
RQ-системы S1 = 0, 790 при γ = 3 , что подтверждает асимптотическую эквивалентность адаптивной и динамической RQ-систем с входящим MMPP-потоком
заявок.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Исследование динамической и адаптивной RQ-систем с входящим ММРР-потоком заявок 111
Заключение
Вв данной статье проведены исследования динамической и адаптивной RQсистемы с входящим ММРР-потоком заявок методом асимптотического анализа в
условии большой загрузки. В результате исследования динамической RQ-системы
получены распределение вероятностей числа заявок в ИПВ p (i ) , уравнение (8)
для нахождения пропускной способности S1 . При исследовании адаптивной RQсистемы получена система уравнений (13) для нахождения пропускной способности S2 и значения величины γ . Было показано, что S1 и S2 совпадают.
Далее все полученные аналитические результаты были представлены численно. Также было показано равенство пропускных способностей S1 и S2 при заданных параметрах.
ЛИТЕРАТУРА
1. Artalejo J.R., Gomez-Corral A. Retrial Queueing Systems: a Computational Approach.
Springer, 2008. 309 p.
2. Назаров А.А., Судыко Е.А. Метод асимптотических семиинвариантов для исследования
математической модели сети случайного доступа // Проблемы передачи информации.
2010. № 1. С. 94−111.
3. Falin G. I. A Survey of retrial queues // Queuing Systems. 1990. V. 7. P. 127−167.
4. Klimenok V.I. Optimization of dynamic management of the operating mode of data systems
with repeat calls // Automatic Control and Computer Sciences. 1993. V. 24. Issue 1. P. 23−28.
5. Dudin A.N., Klimenok V.I., Kim C.S., Lee M.H. The SM/PH/N queueing system with
broadcasting service // Proc. 13th Int. Conf. on Analytical and Stochastic Modeling
Techniques and Applications. Bonn, Germany, 2006. P. 8–13.
6. Назаров А.А., Семенова И.А. Исследование RQ-систем методом асимптотических семиинвариантов // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 3 (12). С. 85–96.
7. Гарайшина И.Р., Моисеева С.П., Назаров А.А. Методы исследования коррелированных
потоков и специальных систем массового обслуживания. Томск: Изд-во НТЛ, 2010. 204 с.
8. Назаров А.А., Терпугов А.Ф. Теория массового обслуживания: учебное пособие. 2-е
изд., испр. Томск: Изд-во НТЛ, 2010. 228 с.
9. Гнеденко Б.В., Коваленко И.И. Введение в теорию массового обслуживания. Изд. 3-е,
испр. и доп. М.: КомКнига, 2005. 400 с.
10. Саати Т.Л. Элементы теории массового обслуживания и ее приложения. М.: Сов. радио, 1971. 519 с.
11. Назаров А.А., Моисеева С.П. Метод асимптотического анализа в теории массового обслуживания. Томск: Изд-во НТЛ, 2006. 112 с.
12. Любина Т.В., Назаров А.А. Исследование немарковской модели компьютерной сети
связи, управляемой динамическим протоколом доступа // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 1
(18). С. 16−27.
13. Любина Т.В., Назаров А.А. Исследование марковской динамической RQ-системы с
конфликтами заявок // Вестник Томского государственного университета. Управление,
вычислительная техника и информатика. 2010. № 3 (12). С. 73−84.
14. Любина Т.В., Назаров А.А. Исследование немарковской динамической RQ-системы с
конфликтами заявок // Вестник Кемеровского государственного университета. 2012.
№ 1 (49). С. 38−44.
15. Назаров А.А., Кузнецов Д.Ю. Адаптивные сети случайного доступа. Томск: ТПУ, 2002.
256 с.
16. Любина Т.В., Назаров А.А. Исследование адаптивной RQ-системы с входящим ММРРпотоком заявок методом асимптотического анализа // Информационные технологии и
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
112
Т.В. Любина, А.А. Назаров
математическое моделирование (ИТММ-2012): материалы XI Всерос. науч.-практич.
конф. с междунар. участием (г. Анжеро-Судженск, 23–24 нояб. 2012 г.). Кемерово:
Практика, 2013. Ч. 2. С. 94−99.
Любина Татьяна Викторовна
Филиала Кемеровского государственного университета в г. Анжеро-Судженске
Назаров Анатолий Андреевич
Томский государственный университет
Е-mail: lyubina_tv@mail.ru; anazarov@fpmk.tsu.ru
Поступила в редакцию 29 ноября 2012 г.
Lyubina Tatiana V., Nazarov Anatoly A. (Anjero-Sudjensk branch of the Kemerovo State University, Tomsk State University). Research of the dynamic and adaptive retrial queue systems
with input MMPP-process requests.
Keywords: retrial queue system, traffic capacity, method of asymptotical analysis, correlated
flow.
Research of dynamic and adaptive retrial queue systems with input MMPP-process requests is
carried out in this paper.
Using method of generating functions there is found the probability distribution of number of
requests in the source of repeated calls of a dynamic RQ-system asthea the inverse Fourier transform. By method of asymptotic analysis under condition of high load there is obtained an equation for throughput and stationary probability distribution of status signals of the dynamic RQsystem.
Investigation of adaptive RQ-system is scheduled in the asymptotic heavy load conditions, as
a result of which is determined the capacity and value of γ for the RQ-system. We show the asymptotic equivalence of presented RQ-systems. Numerical results of the research are given.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
УДК 336:51
Г.А. Медведев
О ВРЕМЕННОЙ СТРУКТУРЕ ДОХОДНОСТИ.
6. ТРЕХФАКТОРНЫЕ МОДЕЛИ
Исследуются модели Даффи – Кана, описывающие динамику краткосрочной
процентной ставки в случае, когда состояние финансового рынка характеризуется не только уровнем самой процентной ставки, но и еще двумя изменяющимся во времени параметрами. Рассматривается три версии расширения однофакторной модели до трехфакторной, позволяющие получать аффинную временную структуру доходности. Эти версии предполагают, что
параметры однофакторной модели – уровень возвращения процентной ставки и ее волатильность – являются не постоянными величинами, а диффузионными процессами. В первой версии волатильность процесса уровня возвращения процентной ставки не зависит от самого уровня и является стохастической. Во второй версии процесс уровня возвращения процентной ставки
является процессом «с квадратным корнем». В третьей версии волатильность процесса уровня возвращения процентной ставки не зависит от самого
уровня и является детерминированной. Основное внимание уделяется свойствам кривой доходности и форвардной кривой, когда динамика краткосрочной процентной ставки описывается описанными трехфакторными моделями.
Ключевые слова: процентные ставки доходности, аффинная модель,
функции временной структуры, трехфакторные модели.
Напомним, что для n-факторной модели аффинной доходности предполагается, что вектор состояния финансового рынка X(t) = (X1, X2, …, Xn)Т следует однородному по времени марковскому процессу, порождаемому стохастическим дифференциальным уравнением
dX(t) = μ(X(t)) dt + σ(X(t)) dW(t)
с n-вектором дрейфа μ(x), (n×m)-матрицей волатильности σ(x), и m-вектором W(t)
независимых стандартных винеровских процессов [1]. При этом вектор дрейфа
μ(x) и матрица диффузии σ(x)σ(x)Т должны быть аффинными функциями относительно переменных x, а рыночные цены риска такими, что σ(x)λ(x) – n-вектор с
аффинными компонентами относительно переменных x:
μ(x) = K(θ − x),
σ(x)σ(x)Т = α +
n
∑ βi xi , σ(x)λ(x) = ξ +
i =1
n
∑ ηi xi .
(1)
i =1
Здесь K, α и βi − (n×n)-матрицы; θ, ξ и ηi − n-векторы, xi − компоненты вектора x.
Эти свойства для n-факторной модели аффинной доходности приводят к следующим обыкновенным дифференциальным уравнениям для функции A(τ) и компонент вектора B(τ) = (B1(τ), B2(τ), …, Bn(τ)), τ – срок до погашения:
A′(τ) = (ξ − Kθ)ТB(τ) + B(τ)Тα B(τ)/2, A(0) = 0;
(2)
(3)
Bi′(τ) = φi − B(τ)Т(ηi + Ki) − B(τ)Тβi B(τ)/2, Bi(0) = 0.
В уравнении для Bi(τ) символ Ki обозначает i-й столбец матрицы K, 1 ≤ i ≤ n. Кри-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
114
вая доходности y(τ, x) и форвардная кривая f(τ, x) определяется через функции
A(τ) и B(τ) по формулам
x T B(τ) − A(τ)
dB(τ) dA(τ)
y (τ, x) =
, f (τ, x) = x T
−
.
τ
dτ
dτ
Отправным пунктом нашего анализа является однофакторная модель Даффи –
Кана [2]:
r (t ) − x
dW(t), r(0) > х,
(4)
dr(t) = k(θ − r(t))dt + 2kD
θ− x
в которой параметры θ и D будут предполагаться диффузионными процессами
θ(t) и D(t).
1. Стохастическая волатильность процесса θ(t)
В этом случае уровень θ, к которому возвращается процентная ставка r(t) (в
однофакторной модели он совпадает с ее стационарным средним), рассматривается как стохастический процесс диффузионного типа θ(t), подобный процессу
краткосрочной ставки одномерной модели r(t), но с фиксированным уровнем возвращения θ0 и волатильностью, зависящей только от стохастической дисперсии
D(t). Процентная ставка r(t) имеет волатильность, также пропорциональную D(t).
Поскольку процессы r(t) и θ(t) в этом случае не являются процессами «с квадратным корнем», то их нижняя граница не определяется (или, что эквивалентно,
нижняя граница этих процессов удаляется в минус бесконечность).
dr(t) = kr(θ(t) − r(t))dt + 2kr D(t ) dWr(t);
(5)
dθ(t) = kθ(θ0 − θ(t))dt + σ 2kθ D(t ) dWθ(t);
(6)
D(t ) − x
(7)
dWD(t), D(0) > х ≥ 0.
V −x
Здесь х – нижняя граница для процесса дисперсии D(t) процентной ставки; V –
стационарное среднее процесса дисперсии D(t), а S – стационарная дисперсия процесса дисперсии D(t). Для удобства записи в дальнейшем изложении удобно ввести обозначение δ = k D S /(V − x).
Уравнения (2), (3) в этом случае приобретают вид
A′(τ) = − kθθ0Bθ(τ) − (kDV + 2λD xδ)BD(τ) − δxBD(τ) 2 , A(0) = 0;
dD(t) = kD(V − D(t))dt + 2k D S
Br′(τ) = φr − krBr(τ), Br(0) = 0;
Bθ′(τ) = φθ + krBr(τ) − kθBθ(τ), Bθ(0) = 0;
BD′(τ) = − (kD + 2λD δ)BD(τ) − 2λrkrBr(τ) − 2σλθkθBθ(τ) − krBr(τ)2 −
– σkθBθ(τ)2 − δBD(τ) 2 , BD(0) = 0.
Заметим, что функция A(τ) не зависит от функции Br(τ) и определяется интегрированием, если функции Bθ(τ) и BD(τ) будут найдены. Второе и третье уравнения
для Br(τ) и Bθ(τ) легко решаются:
Br(τ) = φr (1 − e − kr τ ) / kr ; Br(τ) → φr/kr при τ → ∞.
Bθ(τ) =
k − φ θ k θ − kθ τ
φr
1
+
e − kr τ + r
e ; Bθ(τ) → 1/kθ при τ → ∞.
kθ k r − kθ
kθ ( kθ − k r )
(8)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 6. Трехфакторные модели
115
При получении этих решений было учтено, что из экономических соображений
[5] весовой коэффициент φD должен быть равен нулю, φD = 0, а φr + φθ = 1. Что касается уравнения для BD(τ), то оно является уравнением Риккати с переменным
свободным коэффициентом, что не позволяет выразить его решение в аналитическом виде и его приходится решать численно. Однако предельное значение функции BD(τ) при τ → ∞ может быть выражено аналитически в виде
−(k D + 2λ D δ) + (k D + 2λ D δ) 2 − 4δ(2λ r φr + φr2 / kr + 2σλ θ + σ / kθ )
.
2δ
Заметим, что этот предел будет существовать только в том случае, если параметры модели удовлетворяют неравенству
(9)
(kD + 2λD δ)2 ≥ 4δ(2λrφr + φr2/kr + 2σλθ + σ/kθ).
Если это неравенство не выполняется, функция BD(τ) будет неограниченно убывать, что приведет к попаданию доходности в отрицательную область при некотором конечном τ. Фактически неравенство (9) определяет область значений параметра δ, определяющего волатильность процесса D(t) в уравнении (7), при которых существует предельное значение BD(∞).
Кривые доходности y(τ, r, θ, D) и форвардные кривые f(τ, r, θ, D) определяются через функции A(τ), Br(τ), Bθ(τ) и BD(τ) по формулам
y(τ, r, θ, D) ≡ Y(Br(τ), Bθ(τ), BD(τ)) =
BD(∞) =
= kr[A(τ) − rBr(τ) − θBθ(τ) − DBD(τ)]/ln[1 − krBr(τ)/φr];
(10)
f(τ, r, θ, D) ≡ F(Br(τ), Bθ(τ), BD(τ)) =
= rφr + θφθ − (r − θ + 2λrD)krBr(τ) − (θ − θ0 + 2σλθD)kθBθ(τ) +
(11)
+ [(kD(D − V) + 2λD δ(D − x)]BD(τ) − krDBr(τ)2 − σkθDBθ(τ)2 − δ(D − x)BD(τ) 2 .
Предельные свойства этих кривых такие:
при τ → 0 обе кривые стремятся к одинаковому пределу
y(0, r, θ, D) = f(0, r, θ, D) = rφr + θφθ;
при τ → + ∞ обе кривые также стремятся к общему пределу
y(∞, r, θ, D) = f(∞, r, θ, D) = θ0 + kD(V − x)BD(∞) − x(2λrφr + φr2/kr + 2σλθ + σ/kθ).
Для того чтобы предельные значения кривых при τ → + ∞ были положительными,
должно выполняться неравенство
θ0 − x(2λrφr + φr2/kr + 2σλθ + σ/kθ) > − kD(V − x)BD(∞),
или
θ0 − x(2λ r φr + φr2 / kr + 2σλ θ + σ / kθ )
>
2k D (2λ r φr + φr2 / kr + 2σλ θ + σ / kθ )
V −x
>
(k D + 2λ D δ) + (k D + 2λ D δ) 2 − 4δ(2λ r φr + φr2 / kr + 2σλ θ + σ / kθ )
.
(12)
Это неравенство также следует рассматривать как условие, накладываемое на
параметры уравнения (7), чтобы обеспечить разумные результаты для долгосрочных доходностей. В этом случае в качестве варьируемого параметра модели можно выбрать стационарное среднее V процесса D(t). Когда при описании динамики
процентной ставки используется нейтральная к риску вероятностная мера (λr = 0,
λθ = 0, λD = 0), неравенства (9) и (12) существенно упрощаются:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
116
δ≡
k D2
kD S
1
≤
;
V −x
4 φ2r / kr + σ / kθ
⎛
⎞⎛ 1
θ0
1 δ ⎛ φ2r σ ⎞ ⎞
− x ⎟⎟ ⎜ +
−
V < x + ⎜⎜ 2
⎜ + ⎟ ⎟.
4 k D2 ⎝ kr kθ ⎠ ⎟
⎝ φ r / k r + σ / kθ
⎠ ⎜⎝ 2
⎠
Заметим, что при определении области пространства параметров {S, V}, обеспечивающих существование положительных предельных значений доходностей,
участвуют все параметры модели.
На рис. 1 представлены графики функций Y(Br) и F(Br), вычисленные по формулам (10) и (11), характеризующие доходности трехфакторной модели (5) – (7) с
ключевыми параметрами, соответствующими найденным Д. Аном и Б. Гао [6],
приспосабливавшим модель Даффи – Кана для описания динамики процесса годовой ставки доходности одномесячных бумаг Казначейства США для периода
наблюдения с января 1960 г. по февраль 1991 г..
0,08
0,06
Y
F
Т
Предельное значение
0,04
0,02
0
1
2
3
4
B
Рис. 1. Кривые доходностей Y(B) (штриховые линии) и форвардные кривые F(B)
(сплошные линии) в случае, когда параметры принимали следующие значения:
kr = 0,1347; kθ = 0,01347; kD = 0,1; θ0 = 0,0762; V = 0,002892; σ = 0,1; x = xD = 0,0001;
S = 6×10−6; λr = 0,1; λθ = 0,1; λD = 0,1; φr = 0,6; φθ = 0,4. r = 0,08; θ = 0,07; D = 0,0028;
Bмакс = Br(∞) = 4,454. Круглый маркер показывает предельное значение, одинаковое
для обоих кривых. Ромбовидные маркеры показывают метки реального времени Т
через каждый год для первых 10 лет, а далее − через 5 лет
2. Процесс θ(t) с квадратным корнем
В этом случае уровень θ, к которому возвращается процентная ставка r(t),
рассматривается как стохастический процесс θ(t) диффузионного типа, подобный процессу краткосрочной ставки одномерной модели r(t), с фиксированным
уровнем возвращения θ0 и волатильностью, пропорциональной квадратному
корню из θ(t) − xθ, где xθ − нижняя граница уровня возвращения. Оба других
уравнения системы (5) остаются прежними. Определенная таким образом трехфакторная модель по своей структуре близка к модели Чена [3] в интерпретации
Дэя и Синглтона [4].
dr(t) = kr(θ(t) − r(t))dt + 2kr D(t ) dWr(t);
dθ(t) = kθ(θ0 − θ(t))dt + σ 2kθ
θ(t ) − xθ
dWθ(t), θ(0) > хθ ≥ 0;
θ0 − xθ
(13)
(14)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 6. Трехфакторные модели
dD(t) = kD(V − D(t))dt + 2k D S
117
D(t ) − xD
dWD(t), D(0) > хD ≥ 0.
V − xD
(15)
Заметим, что в этой модели процессы θ(t) и D(t) являются независимыми диффузионными процессами «с квадратным корнем». Свойства таких процессов подробно исследованы в литературе. Для того чтобы нижние границы хθ и хD процессов θ(t) и D(t) были недостижимыми, т.е. чтобы эти процессы не принимали отрицательных значений, необходимо выполнение условий Феллера (θ0 − хθ)2 > σ2 и (V
− хD)2 > S.
Уравнения для функций временной структуры A(τ), Br(τ), Bθ(τ) и BD(τ) в этом
случае составляют систему
A′(τ) = − (kθθ0 + 2λθγxθ)Bθ(τ) − (kDV + 2λDδxD)BD(τ) − δxDBD(τ) 2 − γxθBθ(τ) 2 , A(0) = 0;
Br′(τ) = φr − krBr(τ), Br(0) = 0;
Bθ′(τ) = φθ + krBr(τ) − (kθ + 2λθγ)Bθ(τ) − γBθ(τ) 2 , Bθ(0) = 0;
2
(16)
2
BD′(τ) = − (kD + 2λD δ)BD(τ) − 2λrkrBr(τ) − krBr(τ) − δBD(τ) , BD(0) = 0,
(17)
2
где для краткости обозначено δ = k D S /(V − xD ) , γ = kθ σ /(θ0 − xθ ).
Решение уравнения для функции Br(τ) найти легко:
Br(τ) = φr (1 − e − kr τ ) / kr ; Br(τ) → φr/kr при τ → ∞.
Функции A(τ), Bθ(τ) и BD(τ) могут быть определены только численно. Заметим,
что функция A(τ) не зависит от Br(τ). Предельные значения функций Bθ(τ) и BD(τ)
определяются выражениями
2
Bθ(∞) =
,
2
(kθ + 2 γλ θ ) + 4 γ + (kθ + 2γλ θ )
BD(∞) = −
2(2λ r φr + φr2 / kr )
(k D + 2δλ D ) 2 − 4δ(2λ r φr + φr2 / kr ) + (k D + 2δλ D )
.
(17)
Для того чтобы предельное значение BD(∞) существовало, необходимо, чтобы параметры модели удовлетворяли неравенству
(kD + 2λD δ)2 ≥ 4δ(2λrφr + φr2/kr).
(18)
Кривые доходности y(τ, r, θ, D) и форвардные кривые f(τ, r, θ, D) определяются через функции A(τ), Br(τ), Bθ(τ) и BD(τ) по формулам
y(τ, r, θ, D) ≡ Y(Br(τ), Bθ(τ), BD(τ)) =
= kr[A(τ) − rBr(τ) − θBθ(τ) − DBD(τ)]/ln[1 − krBr(τ)/φr];
(19)
f(τ, r, θ, D) ≡ F(Br(τ), Bθ(τ), BD(τ)) = rφr + θφθ − (r − θ + 2λrD)krBr(τ) −
– [kθ(θ − θ0) + 2γλθ(θ − xθ)]Bθ(τ) − [(kD(D − V) + 2λD δ(D − xD)]BD(τ) −
– krDBr(τ)2 − γ(θ − xθ)Bθ(τ)2 − δ(D − xD)BD(τ) 2 .
Предельные свойства этих кривых такие:
при τ → 0 обе кривые стремятся к одинаковому пределу
y(0, r, θ, D) = f(0, r, θ, D) = rφr + θφθ;
при τ → + ∞ обе кривые также стремятся к общему пределу
y(∞, r, θ, D) = f(∞, r, θ, D) =
= kθ(θ0 − xθ)Bθ(∞) + kD(V − x)BD(∞) + xθ − xD(2λrφr + φr2/kr).
(20)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
118
Для того чтобы этот предел был положительным, необходимо выполнение неравенства
(21)
kθ(θ0 − xθ)Bθ(∞) + xθ − xD(2λrφr + φr2/kr) > − kD(V − x)BD(∞).
Неравенства (18) и (21) определяют область значений параметров {S, V} уравнения (15), гарантирующих существование и положительность предельных значений доходностей при τ → + ∞. К сожалению, запись этих неравенств в явной
форме довольно громоздка, поэтому приведем явную форму только для случая,
когда при описании динамики процентной ставки используется нейтральная к
риску вероятностная мера (λr = 0, λθ = 0, λD = 0)
δ≡
kD S
k k2
≤ r 2D ;
V − xD
4φr
⎛
2kθ (θ0 − xθ )
φ2 ⎞ ⎛ k (k + k D2 − 4δφr2 / kr ) ⎞
⎟.
− xD r ⎟ ⎜ r D
V < xD + ⎜ xθ +
2
2
⎟
⎜
kr ⎟ ⎜
2
k
φ
k
k
4
+
+
γ
D r
⎠
⎝
⎠⎝
θ
θ
На рис. 2 представлены графики функций Y(Br) и F(Br), вычисленные по формулам (19) и (20), характеризующие доходности трехфакторной модели (13) – (15)
с ключевыми параметрами, соответствующими найденным Д. Аном и Б. Гао [6].
0,08
0,06
0,04
Y
F
Т
Предельное значение
0,02
0
1
2
3
4
B
Рис. 2. Кривые доходностей Y(B) (штриховые линии) и форвардные кривые F(B)
(сплошные линии) в случае, когда параметры принимали те же значения, что и на
рис. 1, и дополнительно xθ = 0,033. Круглый маркер показывает предельное значение, одинаковое для обоих кривых. Ромбовидные маркеры показывают метки реального времени Т через каждый год для первых 10 лет, а далее − через 5 лет
3. Гауссовский процесс θ(t)
Такая модель близка к модели BDFS [7], где уровень θ, к которому возвращается процентная ставка r(t), рассматривается как стохастический процесс θ(t)
диффузионного типа, подобный процессу краткосрочной ставки одномерной модели r(t), с фиксированным уровнем возвращения θ0 и фиксированной волатильностью. Оба другие уравнения системы (5) остаются прежними:
Dr(t) = kr(θ(t) − r(t))dt + 2kr D(t ) dWr(t);
(22)
dθ(t) = kθ(θ0 − θ(t))dt + 2kθ σ2 dWθ(t);
(23)
dD(t) = kD(V − D(t))dt + 2k D S
D(t ) − xD
dWD(t), D(0) > хD ≥ 0.
V − xD
(24)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 6. Трехфакторные модели
119
Модель (22) – (24) фактически является частным случаем модели (13) – (15),
когда нижняя граница процесса θ(t) удаляется на – ∞, xθ → –∞. При этом γ → 0,
γxθ → – kθσ2. Если учесть эти изменения, то получается следующая система уравнений для функций временной структуры A(τ), Br(τ), Bθ(τ) и BD(τ):
A′(τ) = − kθ(θ0 – 2λθσ2)Bθ(τ) − (kDV + 2λDδxD)BD(τ) − δxDBD(τ) 2 + kθσ2Bθ(τ) 2 ,
A(0) = 0;
(25)
Br′(τ) = φr − krBr(τ), Br(0) = 0;
Bθ′(τ) = φθ + krBr(τ) − kθ Bθ(τ), Bθ(0) = 0;
BD′(τ) = − (kD + 2λD δ)BD(τ) − 2λrkrBr(τ) − krBr(τ)2 − δBD(τ) 2 , BD(0) = 0.
Второе и третье уравнения решаются аналитически, как это показано выше; их
решения представляются формулами (8). Предельное значение решения третьего
уравнения при τ → +∞ существует, если выполняется неравенство (18). Особенность этой модели состоит в том, что процесс θ(t) является гауссовским и порождается уравнением, совпадающим с тем, которое известно как модель Васичека.
Поэтому все особенности этой модели проявляются здесь. В частности, последнее
слагаемое в правой части уравнения (25) для A(τ) оказывается положительным и
возрастающим с увеличением τ, так что при τ → +∞ производная A′(τ) может
стать тоже положительной. Но поскольку предельные доходности определяются
именно производной функции A(τ), так как y(∞, r, θ, D) = f(∞, r, θ, D) = − A′(∞),
они могут стать отрицательными, что будет противоречить экономическому
смыслу доходности. Отсюда возникает еще одно ограничение на волатильность
процесса θ(t) для этой модели:
σ2 < kθ[θ0 + (kDV + 2λDδxD)BD(∞) + δxDBD(∞) 2 ]/ (1 + 2kθλθ).
(26)
Кривые доходности y(τ, r, θ, D) и форвардные кривые f(τ, r, θ, D) определяются через функции A(τ), Br(τ), Bθ(τ) и BD(τ) по формулам
y(τ, r, θ, D) ≡ Y(Br(τ), Bθ(τ), BD(τ)) =
= kr[A(τ) − rBr(τ) − θBθ(τ) − DBD(τ)]/ln[1 − krBr(τ)/φr];
(27)
f(τ, r, θ, D) ≡ F(Br(τ), Bθ(τ), BD(τ)) =
= rφr + θφθ − kr(r − θ + 2λrD)Br(τ) − kθ(θ − θ0 + 2λθσ2)Bθ(τ) −
– [(kD(D − V) + 2λD δ(D − xD)]BD(τ) − krDBr(τ)2 − kθσ2Bθ(τ)2 − δ(D − xD)BD(τ) 2 .(28)
Предельные свойства этих кривых такие:
при τ → 0 обе кривые стремятся к одинаковому пределу
y(0, r, θ, D) = f(0, r, θ, D) = rφr + θφθ;
при τ → + ∞ обе кривые также стремятся к общему пределу
y(∞, r, θ, D) = f(∞, r, θ, D) = θ0 + kD(V − xD)BD(∞) − xDφr(φr + 2krλr)/kr.
Здесь величина BD(∞) вычисляется по формуле (17). Поскольку BD(∞) – величина
отрицательная, для достижения положительной доходности необходимо также,
чтобы выполнялось следующее неравенство, ограничивающее сверху стационарную дисперсию V процесса D(t):
kD(V − xD)|BD(∞)| < θ0 − xDφr(φr + 2krλr)/kr.
(29)
Выполнение перечисленных условий обеспечивает существование положительных предельных значений кривых y(τ) и f(τ) при τ → +∞. Вместе с тем значения
параметров модели будут обеспечивать ее работоспособность в полной мере, если
будут выполняться также неравенства y(τ) > 0 и f(τ) > 0 для любых τ > 0. К сожа-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.А. Медведев
120
лению, записать эти неравенства в явной форме не удается, поскольку аналитический вид функции BD(τ) не определяется. Однако можно сказать, что для выполнения неравенств y(τ) > 0 и f(τ) > 0 для любых τ > 0 нужно ограничить сверху волатильность процесса D(t), иначе говоря, установить верхнюю границу для параметра S, что удается сделать только численно.
На рис. 3 представлены графики функций Y(Br) и F(Br), вычисленные по формулам (27) и (28), характеризующие доходности трехфакторной модели (22) – (24)
с ключевыми параметрами, соответствующими найденным Д. Аном и Б. Гао [6].
0,08
0,07
Y
F
T
Предельное значение
0,06
0
1
2
3
B
4
Рис. 3. Кривые доходностей Y(B) (штриховые линии) и форвардные кривые F(B)
(сплошные линии) в случае, когда параметры принимали те же значения, что и на
рис. 1, и дополнительно σ = 0,003. Круглый маркер показывает предельное значение, одинаковое для обоих кривых. Ромбовидные маркеры показывают метки реального времени Т через каждый год для первых 10 лет, а далее − через 5 лет.
Заключение
Здесь, а также в предыдущих статьях [3, 5], последовательно рассмотрены модели аффинных доходностей с различным числом факторов. С увеличением числа
факторов модели и их анализ существенно усложняются, и получение результатов
в аналитической форме становится невозможным. Численный анализ также усложняется, поскольку число параметров моделей растет. Поэтому всестороннего
сравнения моделей, их преимуществ и недостатков в рамках статьи осуществить
не удается. Приводится только характер доходностей для одного набора параметров, найденных Д. Аном и Б. Гао [6] при обработке реальных финансовых данных. Более широкое сравнение моделей предстоит еще сделать в будущем.
В табл. 1 сведены данные о том, какие и сколько параметров используется для построения рассмотренных моделей. Тип модели обозначен двумя цифрами: первая
Таблица 1
Параметры, использующиеся в моделях с различным числом факторов
Тип
модели
1_1
2_1
2_2
3_1
3_2
3_3
Факторы
r
r, θ
r, D
r, θ, D
r, θ, D
r, θ, D
kr
+
+
+
+
+
+
θ0
+
+
+
+
+
+
Dr
+
+
xr
+
+
+
Параметры
kθ Dθ kD
+
+
+
+
+
+
+
+
+
+
+
+
V
S
xD
+
+
+
+
+
+
+
+
+
+
+
+
Количество
параметров
4
6
6
8
9
8
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
О временной структуре доходности. 6. Трехфакторные модели
121
цифра означает число факторов, а вторая – номер раздела соответствующей статьи, в котором эта модель анализируется. Плюс обозначает использование параметра в соответствующей модели.
В интервале изменения времени до погашения τ от нуля до бесконечности
кривые доходности y(τ, r, θ, D) и форвардные кривые f (τ, r, θ, D) для всех моделей стартуют из общей точки – текущего значения спот-ставки r(t) = r и стремятся
к соответствующим пределам, зависящим от параметров модели, но не зависящим
от значений текущего уровня переменных состояния r, θ, D. Эти предельные значения в общем случае определяются не только параметрами, указанными в таблице, но и наборами весовых коэффициентов {φ} и параметров цен риска {λ}, что
заметно усложняет формулы. Однако если считать, что краткосрочная ставка доходности актива определяется только спот-ставкой r (т.е. φr = 1, φθ = 0, φD = 0),
стохастические процессы r(t), θ(t) и D(t) нейтральны к риску (т.е. λr = 0, λθ = 0,
λD = 0), а нижние границы для процентной ставки и ее дисперсии равны нулю
(xr = 0, xD = 0), то формулы для вычисления доходностей сильно упрощаются.
В табл. 2 приводятся их явные аналитические выражения при этих предположениях. В первой строке табл. 2 приводятся обозначения моделей, во второй – формулы для соответствующих предельных доходностей, а в третьей строке – результаты вычислений по этим формулам для оценок параметров, найденных в [6].
Таблица 2
Предельные значения доходностей
1
2_1
2_2
3_1
krBr(∞)θ0
kθBθ(∞)θ0
θ0 − kD |BD(∞)|V
θ0 − kD |BD(∞)|V
0,061991
0,051994
0,053899
0,031849
3_2
3_3
kθBθ(∞)θ0 −
θ − kD |BD(∞)|V
– kD |BD(∞)|V 0
0,021274
0,049687
Заметим, что предельные значения доходностей могут рассматриваться как
доходности долгосрочных ценных бумаг и что они не зависят от текущего значения переменных состояния r, θ, D, а зависят только от параметров модели. Заметим также, что функции Bθ(τ) и BD(τ) для различных моделей вычисляются по
различным формулам и имеют различные предельные значения Bθ(∞) и BD(∞). Из
табл. 2 видно, что для рассмотренного числового примера предельные значения
доходностей уменьшаются с увеличением числа факторов. Более обоснованные
выводы могут быть сделаны после исследования доходностей во всей допустимой
области десятимерного пространства параметров. Кроме того, предстоит сравнительное исследование взаимного поведения кривых доходностей и форвардных
кривых во всем интервале 0 < τ < ∞ сроков до погашения актива во всей допустимой области параметров.
ЛИТЕРАТУРА
1. Медведев Г.А. О временной структуре доходности. 1. Модель Васичека // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 1(18). С. 102–111.
2. Медведев Г.А. О временной структуре доходности. 3. Однофакторная модель Даффи –
Кана // Вестник Томского государственного университета. Управление, вычислительная
техника и информатика. 2012. № 3 (20). С. 71−80.
3. Chen L. A Three Factor of the Affine Term Structure of Interest Rates and its Application to
the Pricing of Interest Rate Derivatives. N.Y.: Blackwell Publishers, 1996.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
122
Г.А. Медведев
4. Dai Q., Singleton K. Specification analysis of affine term structure models // J. Finance. 2000.
V. 55(5). P. 1943–1978.
5. Медведев Г.А. О временной структуре доходности. 4. Двухфакторные модели Даффи –
Кана // Вестник Томского государственного университета. Управление, вычислительная
техника и информатика. 2012. № 4 (21). С. 89−99.
6. Ahn D.-H., Gao B. A parametric nonlinear model of term structure dynamics // The Review of
Financial Studies. 1999. V. 12. No. 4. 721–762.
7. BDFS: Balduzzi P., Das S., Foresi S., Sundaram R. A simple approach to three factor affine
term structure models // J. Fixed Income. 1996. V. 6. P. 43–53.
Медведев Геннадий Алексеевич
Белорусский государственный университет
E-mail: MedvedevGA@cosmostv.by
Поступила в редакцию 30 июня 2012 г.
Medvedev Gennady A. (Belarusian State University). On term structure of yield rates. 6. The
three factor model.
Keywords: yield interest rates, affine model, yield curve, forward curve, three factor model.
Models of Duffie – Kan, describing dynamics of a short-term interest rate in a case when the
condition of the financial market is characterized not only level of the most interest rate, but also
two more the time variable parameters are investigated. Three versions of expansion of one-factor
model to three-factor, allowing to get affine term structure of yield are considered. These versions
assume that parameters of one-factor model – level of return of an interest rate and its volatility –
are not constants, and diffusion processes. In the first version volatility of process of level of
return of an interest rate doesn't depend on the level and is stochastic. In the second version
process of level of return of an interest rate is process «with a square root». In the third version
volatility of process of level of return of an interest rate doesn't depend on the level and is
determined. The main attention is given to properties of the yield curve and the forward curve
when dynamics of a short-term interest rate is described by the described three-factor models.
With increase in number of factors of model, their analysis essentially become complicated,
and receiving of results in an analytical form becomes impossible. The numerical analysis also
becomes complicated, as the number of parameters of models grows. Therefore it is not possible
to carry out all-round comparison of models, their advantages and lacks in a volume of article.
Properties of yields for one set of the parameters found D. An and B. Gao at processing of real
financial data is given only. Wider comparison of models should be made in the future. Data on
what and how many parameters are used for creation of the considered models are provided.
In the interval of time to maturity change from zero to indefinitely the yield curves and the
forward curves for all models start from the single points – the current value a spot rate and
converge to the corresponding limits depending on parameters of model, but not depending on
values of the current level of state variables. These limiting values generally are defined not only
model parameters, but also sets of weight factors and parameters of the prices of risk that
considerably complicates formulas. However if to consider that the short-term rate of yield of an
asset is defined only a spot rate, stochastic processes of a rate and its instant variance are neutral
to risk, and the bottom borders for an interest rate and its variance are equal to zero, formulas for
calculation of yield strongly become simpler. Their explicit analytical expressions are given at
these assumptions.
Limiting values of yield can be considered as yield of long-term securities. They don't depend
on the current value of state variables, and depend only on model parameters. For the considered
numerical example the limiting values of yields decrease with increase in number of factors. More
valid conclusions can be made after research of yield in all admissible area of ten-measured space
of parameters. Comparative research of mutual behavior of yield curves and forward curves in all
intervals of terms to maturities asset in all admissible area of parameters is necessary.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
УДК 519.246
В.М. Неделько
НЕКОТОРЫЕ ВОПРОСЫ ОЦЕНИВАНИЯ КАЧЕСТВА МЕТОДОВ
ПОСТРОЕНИЯ РЕШАЮЩИХ ФУНКЦИЙ
Работа посвящена проблеме оценивания качества методов построения решающих функций в задачах классификации. Исследуется возможность использования подхода, основанного на задании эталонного набора тестовых
задач, а также связь данной проблемы с проблемой оценивания риска в задаче классификации, в частности нахождения распределений, при которых
погрешность оценки риска максимальна. Предлагается метод использования
полученных ранее результатов о максимальном смещении эмпирического
риска для гистограммного классификатора для получения эмпирических
оценок риска.
Ключевые слова: распознавание образов, машинное обучение, решающая
функция, вероятность ошибочной классификации, эмпирический риск.
Решение задач построения решающих функций (интеллектуальный анализ
данных, машинное обучение, статистические решения, распознавание образов,
классификация с учителем) остаётся в настоящее время слабоформализованной
областью, в которой качество получаемых решений существенно зависит от опыта и интуиции исследователя. Такое положение вызвано тем, что существует
большое число различных методов решения, подходящих для одних и тех же задач, и в то же время практически отсутствуют формализованные рекомендации по
выбору метода для заданной задачи.
Рассмотрим следующую общую схему решения прикладной задачи анализа
данных:
1. Определение класса задач, к которому принадлежит задача, требующая решения.
2. Установление методов, подходящих для решения данного класса задач. Методы следует упорядочить по перспективности.
3. Применение метода, выглядящего наиболее перспективным.
4. Оценивание качества полученного решения.
5. Если полученное качество неудовлетворительно, выбираем следующий метод и возвращаемся к 3.
Как можно заметить, ни один из приведённых шагов до настоящего времени
не систематизирован в достаточной степени. Более того, существуют противоположные точки зрения на то, как их следует проводить.
Проанализируем каждый из этапов.
Задачи анализа данных можно классифицировать по разным признакам.
Наиболее очевидная классификация по «техническим» характеристикам: число переменных, типы переменных, объём данных и т.п. Понятно, что подобные
особенности задачи в некоторой мере определяю выбор метода, но получаемые
классы задач и соответственно классы подходящих методов остаются слишком
широкими.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
124
В.М. Неделько
Более плодотворной выглядит классификация по наличию и виду априорной
информации о модели данных. Если есть основания считать данные выборкой из
распределения заданного параметрического семейства, то естественно выбирать
метод, специализированный для данного случая. Вместе с тем, в большинстве
прикладных задач нет оснований предполагать определённый класс распределений и параметрические методы неприменимы.
В настоящей работе будем основываться на подходе, предложенном в системе
«Полигон» в 80-х годах [1]. Идея подхода заключается в следующем принципе
формирования набора тестовых задач: для каждого алгоритма подбираются задачи, которые этим алгоритмом эффективно решаются (на которые этот метод ориентирован), и все методы тестируются на объединённом наборе таких задач.
Подход основан на естественном постулате, что существование метода оправдано тогда и только тогда, когда существуют задачи, на которых данный метод
работает лучше других, либо если метод является универсальным, т.е. на широком классе задач работает достаточно хорошо, хотя, возможно, хуже специализированных методов. Чтобы обосновать метод при таком подходе как раз нужно подобрать задачи, на которые он ориентирован, и исследовать, не окажется ли на
этих задачах лучшим некоторый другой метод.
Для следующего шага требуется упорядочить методы по ожидаемому качеству
их работы на заданном классе задач. Данный пункт требует объёмных исследований: оценить эффективность каждого метода на каждом классе задач. Кроме того,
выбор критерия качества метода в данном случае не очевиден, поскольку на разных задачах одного класса эффективность одного и того же метода разная.
В качестве показательного примера можно привести задачу распознавания
двух образов в предположении нормальности распределений характеристик. Эта
классическая задача рассматривается в числе первых в любом учебнике по дискриминантному анализу. Однако даже для этого класса задач неизвестен лучший
метод решения (понятие лучшего метода тоже строго не введено, но здесь достаточно неформального представления). Действительно, если объём выборки относительно велик, мы можем с достаточной точностью оценить все параметры распределений и построить квадратичную разделяющую поверхность, которая будет
вполне приемлемым решением. Однако известно, что если объём выборки мал, то
лучше строить линейную разделяющую функцию, даже если нет оснований предполагать матрицы ковариаций в действительности равными. При этом нет убедительной аргументации, какой метод лучше использовать: дискриминант Фишера,
метод опорных векторов или другие. Кроме того, при переходе от квадратичной к
линейной функции происходит резкий скачок сложности решения, хотя интуитивно понятно, что «хороший» метод должен позволять плавно регулировать
сложность решения в зависимости от объёма выборки.
Применение выбранного метода представляется наиболее понятным шагом,
хотя и здесь могут быть затруднения, связанные с наличием у алгоритмов настраиваемых параметров.
Оценивание качества полученного решения – проблема, активно исследуемая
в течение более полувека [2–6]. При всём разнообразии и богатстве полученных
результатов для практического применения чаще всего выбирается метод скользящего контроля. Однако ряд исследований свидетельствует, что качество решения по обучающей выборке можно оценивать точнее, чем методом скользящего
контроля.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Некоторые вопросы оценивания качества методов построения решающих функций
125
Наконец, последний шаг – критерий останова – также неочевиден. До каких
пор стоит пробовать новые методы в расчёте получить решение лучшего качества
и когда следует остановиться – однозначных ответов не существует.
В данной работе обсуждается ряд идей и результатов, касающихся рассмотренных проблем и их взаимосвязи.
1. Постановка задачи
Для введения основных понятий рассмотрим общую постановку задачи построения решающих функций.
Пусть X – пространство значений переменных, используемых для прогноза,
а Y – пространство значений прогнозируемых переменных, и пусть C – множество
всех вероятностных мер на заданной σ-алгебре подмножеств множества
D = X × Y . При каждом c ∈ C имеем вероятностное пространство D, B, Pc , где
B – σ-алгебра, Pc – вероятностная мера. Параметр c будем называть стратегией
природы.
Решающей функцией назовем соответствие λ : X → Y .
Качество принятого решения оценивается заданной функцией потерь:
L : Y 2 → [ 0, ∞ ) .
Под риском будем понимать средние потери
R ( c, λ ) = ∫ L ( y, λ ( x ) ) Pc ( dx ) .
D
В данной работе будем рассматривать задачу классификации, когда Y = {1, 2} ,
и функцию потерь в виде индикатора ошибочной классификации. В этом случае
риск есть вероятность ошибочной классификации.
Пусть VN =
{ ( xi , y i ) ∈ D
}
i = 1, N – случайная независимая выборка из распре-
N
деления Pc , V ∈ D . В большинстве случаев объём выборки N будет фиксированным, поэтому этот параметр в обозначении выборки обычно будем опускать.
Эмпирический риск определим как средние потери на выборке:
R ( v, λ ) =
1
N
N
∑ L ( y i , λ ( xi ) ) .
i =1
N
Пусть Q : D → Λ – алгоритм построения решающих функций, а λ Q ,V ∈ Λ –
функция, построенная по выборке V алгоритмом Q, Λ – заданный класс решающих функций.
Для фиксированного метода Q определён средний риск F ( c ) = E R ( c, λ Q ,V ) .
Метод Q , минимизирующий эмпирический риск, есть λ Q ,V = arg min R (V , λ ) .
λ∈Λ
2. Полигон тестовых задач
В 80-х годах была разработана, насколько известно автору, первая в СССР
программная система для сравнения алгоритмов распознавания [1]. Данная система называлась «Полигон» и позволяла сравнивать качество решений, получаемых
разными алгоритмами, на наборе тестовых задач.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
126
В.М. Неделько
Важной идеей, заложенной в системе, было то, что тестовый набор формировался из задач, на решение которых были ориентированы исследуемые алгоритмы. Таким образом, можно было оценивать, как алгоритм работает на «своих» и
на «чужих» задачах.
В настоящее время существует и активно развивается новый проект [7] по разработке системы сравнения методов классификации на репозитории задач. Особенностью данного проекта можно назвать ориентацию на использование в качестве тестовых широкого набора реальных задач распознавания образов, собранных из открытых источников (в частности, известного репозитория UCI), а также
задач, присланных непосредственно их постановщиками. Другая особенность –
вычисление большого числа разнообразных (как известных ранее, так и оригинальных) характеристик для оценивания качества решений. В этом проекте под
задачей понимается таблица данных с указанием целевой переменной (и, опционально, других параметров задачи).
Использование реальных задач в качестве тестовых является, безусловно, достоинством этого подхода, но в то же время обуславливает ряд ограничений, в частности затрудняет статистический анализ результатов и ограничивает в наборе
исследуемых характеристик. Ограничения связаны с тем, что в статистической
постановке таблица данных является лишь частным набором прецедентов, в то
время как для детального анализа нужна полная (вероятностная) модель. Кроме
того, используемая в этом подходе оценка скользящего экзамена имеет относительно большую дисперсию, поэтому любой метод может на некоторых задачах
случайно получить хорошие оценки, которые не означают, что построенное решение действительно хорошее.
Таким образом, не уменьшая важности тестирования методов на реальных задачах, следует отметить актуальность разработки методов исследования алгоритмов на синтетических данных.
Первым нетривиальным моментом в этом направлении является выбор тестовой единицы (т.е. объекта, на котором тестируется метод).
Основным требованием к такому выбору выдвинем возможность введения понятия оптимального на данной тестовой единице метода классификации, так чтобы это понятие было содержательным.
Понятно, что для одной выборки даже понятие оптимального решающего правила не является содержательным.
На первый взгляд, напрашивается в качестве тестовой единицы использовать
распределение. Однако при заданном распределении определено понятие оптимального (байесовского) решающего правила, но понятие оптимального метода
обучения будет вырожденным: оптимальным будет, очевидно, метод, который независимо от обучающей выборки будет давать в качестве результата байесовское
решающее правило.
Понятие оптимального метода обучения становится содержательным, только
если рассматривать в качестве тестовой единицы целый класс распределений.
Заметим, что при проведении, например, конкурсов по анализу данных, наилучший метод определяется не по классу распределений и даже не по распределению, а по частной выборке. Но это возможно только потому, что есть скрытая
информация (тестовая часть выборки), которую разработчики методов не знают.
Однако в нашем случае метод обучения – это всего лишь некоторое отображение
множества выборок во множество решений, и непонятно как требование «метод
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Некоторые вопросы оценивания качества методов построения решающих функций
127
не должен знать ответов для тестовой выборки» задать в виде формальных ограничений на класс отображений из D N в Λ .
Итак, под тестовой единицей будем понимать класс распределений.
Естественным критерием качества метода на заданном распределении является средний риск. Чтобы определить качество метода на классе распределений,
нужно решить проблему многокритериальности: на разных распределениях метод
имеет разное качество. Поскольку вводить какую-либо меру на распределениях
нет оснований, усреднять качество нет возможности, то напрашивается использовать минимаксный подход. Применить последний непосредственно также не получится, так как полученная величина будет отражать только качество методов на
«худшем» распределении, что неинформативно.
Один из вариантов решения данной проблемы – это приписать каждому распределению некоторую величину b ( c ) – назовём её базовым уровнем риска.
Тогда в качестве содержательной меры качества метода на классе распределений C ⊆ C можно использовать, например, величину sup ( F ( c ) − b ( c ) ) .
c∈C
Таким образом, в роли тестовой единицы выступает пара C , b ( ⋅) .
Класс распределений может конструироваться на основе класса решающих
правил, которыми оперирует рассматриваемый метод. Например, для методов,
основанных на решающих деревьях, будет естественным рассмотреть классы кусочно-постоянных распределений, с областями постоянства из разбиений, задаваемых случайными деревьями.
3. Оценивание риска
Одним из важнейших направлений в области машинного обучения являются
исследования по проблеме переобучения, которая заключается в том, что при ограниченном объёме выборки относительно сложные методы построения решающих функций проигрывают по качеству более простым [3]. Для выбора адекватной сложности метода требуется оценивать качество решения (вероятность ошибочной классификации, или риск), не используя при этом контрольную выборку.
Существуют точечные и интервальные оценки риска. К первым относятся эмпирический риск, оценка скользящего экзамена, bootstrap и др. Качество точечных
оценок естественно характеризовать средним квадратом отклонения от оцениваемой величины. Однако такая характеристика позволяет сравнивать оценки друг с
другом, выбирая лучшую, но не даёт достаточной информации, к какой мере
можно полагаться на полученное численное значение оценки риска в конкретной
задаче. Последнее требует построения интервальных оценок. Наиболее известной
интервальной оценкой риска является оценка Вапника – Червоненкиса [2].
В настоящей работе развивается подход, основанный на явном нахождении
распределений, при которых погрешность оценок максимальна. Это, однако, не
означает, что мы будем ориентироваться на «худший случай» с точки зрения
ожидаемого качества классификации, поскольку большая погрешность оценки
риска не означает большое значение риска, и распределения, при которых погрешность оценки максимальна, ни в коей мере не являются «плохими» Скорее
наоборот, на действительно «плохих» распределениях можно очень точно оценить вероятность ошибочной классификации.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.М. Неделько
128
Заметим, что оценки Вапника – Червоненкиса являются чрезмерно пессимистичными именно из-за того, что они «ориентированы на худший случай». Но
здесь играет роль не то, что предполагается «худшее» распределение [8], а, в частности, то, что допускаются любые методы классификации, в том числе методы,
у которых классификаторы максимально различны (не учитывается эффект
«сходства классификаторов» [9]).
Как будет показано далее, распределение, доставляющее максимальное смещение эмпирического риска для гистограммного классификатора (а смещение
этой оценки даёт основной вклад в её погрешность) является вполне типичным.
Смещением эмпирического риска является величина S ( c ) = F ( c ) − F ( c ) , где
F ( c ) = E R ( c, λ Q ,V ) , F ( c ) = E R ( c, λ Q ,V ) .
Задача нахождения максимального смещения эмпирического риска состоит в
вычислении
Sˆ ( F0 ) = max S ( c ) .
(1)
c: F ( c ) = F0
Здесь нас интересует не безусловно максимальное значение смещения, а максимальное смещение при условии заданного значения ожидаемого эмпирического
риска. Такая постановка объясняется тем, что на практике нас интересует значение риска при известном (полученном на исследуемой таблице данных) значении
эмпирического риска.
Очевидно, что
Sˆ ( F0 ) = Fˆ ( F0 ) − F0 , где Fˆ ( F0 ) = max F ( c ) ,
c: F ( c ) = F0
F̂
и
−1
( F0 ) = F ( F0 ) , где F ( F0 ) = min F ( c ) .
c: F ( c ) = F0
Последнее соотношение полезно тем, что для функции F ( F0 ) для рассмотренной ниже задачи получено простое приближённое выражение.
Рассмотрим метод, называемый «гистограммный классификатор», который
удобен для исследования тем, что позволяет делать аналитические выкладки [5], а
также простотой метода классификации и отсутствием в методе каких-либо характеристик, учёт которых мог бы уточнить оценки [9, 10].
Пусть X дискретно, то есть X = {1, …, k}. Тогда вероятностная мера c ∈ C задается набором вероятностей
{
c = ςωj = P ( x = j , y = ω)
}
j = 1, k , ω = 1, 2 .
Обозначим
α j = P ( x = i ) = ς1j + ς 2j , p j = P ( y = 1 x = i ) , q j = 1 − p j , c j = ( α j , p j ) .
Будем рассматривать алгоритм Q , который минимизирует эмпирический риск
независимо в каждой точке x пространства X, т.е. приписывает образ с наибольшей выборочной частотой в этой точке и принимает равновероятно значения 1 и 2
при равенстве частот. Метод Q называется гистограммным классификатором.
Пусть N ≥ k . Оказывается [9], что распределение, на котором достигается
значение смещения, не более чем на 1/k отличающееся от максимального, имеет
следующий вид:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Некоторые вопросы оценивания качества методов построения решающих функций
α j = α′ ,
p j = p′ ,
j = 1,..., k − 1 , α k = 1 − kN−1 ,
129
pk = 0 .
Иными словами, «наихудшее» распределение является равномерным, за исключением одной «ячейки», куда помещается «излишек» вероятности.
Значения α ′ и p ′ определяются следующим образом. При F0 ≤ FT имеем
α′ =
1
N
, а p ′ вычисляется на основе F0 . При F0 ≥ FT имеем p ′ = 0,5 , а α ′ вы-
числяется на основе F0 . Здесь FT – математическое ожидание эмпирического
риска при α ′ =
1
N
, p ′ = 0,5 .
На рис. 1 левая диаграмма показывает максимальное смещение эмпирического
риска в зависимости от относительного объёма выборки M = Nk .
Представляет интерес сравнение полученных для гистограммного классификатора точных оценок смещения эмпирического риска со сложностными оценками
Вапника–Червоненкиса. Такое сравнение показывает, что для гистограммного
классификатора оценки Вапника–Червоненкиса завышают смещение эмпирического риска в 2 – 3 раза [8].
Оказывается, что для функции максимального смещения выполняется приближённое соотношение
⎛
θ
F ( F0 ) ≈ F0 ⎜⎜1 −
1 + 4 F0 M
⎝
⎞
⎟⎟ ,
⎠
F0 M ≥ 1 ,
2
где θ = (1 − 2Θ ) ⋅ 3 , а Θ ≈ 0,163 .
Хотя последнее выражение получено для гистограммного классификатора,
практика показывает, что оно может использоваться как оценка смещения эмпирического риска и в других задачах. Для этого нужно в качестве M использовать
M* =
2
⎞
1 ⎛⎛ θ ⎞
− 1⎟⎟ ,
⎜⎜ ⎜
⎟
*
2 ⎝ ⎝ 1 − 2F ⎠
⎠
где F * – среднее значение эмпирического риска, полученное при статистическом
моделировании на распределениях с пересекающимися классами (при «нулевой»
гипотезе).
4. Численные эксперименты
В случае непрерывного пространства переменных можно задать распределения, «похожие» на распределение, доставляющее максимальное смещение эмпирического риска для гистограммного классификатора.
Проанализируем распределения, доставляющие максимальное смещение эмпирического риска. Эти распределения можно получить, максимизируя ожидаемый риск при фиксированном F0 либо минимизируя ожидание эмпирического
риска при фиксированном среднем риске F0 .
Рассмотрим, как меняется экстремальное распределение при изменении F0 .
При F0 = 0,5 минимум F достигается на равномерном распределении в D, т.е.
когда все α j = 1k , p j = 0,5 .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.М. Неделько
130
При уменьшении F0 все p j остаются равными 0,5, за исключением одного,
например последнего, которое становится равным 0 или, что эквивалентно, 1. При
этом вероятность перераспределяется в эту «ячейку», т.е. α j увеличивается соответственно уменьшению F0 .
При дальнейшем уменьшении F0 перераспределение вероятности продолжается до тех пор, пока α ′ не уменьшится до
1
N
. После этого α ′ не меняется, а на-
чинает меняться p ′ .
^
S
0,3
0,2
0,1
0
0,1
0,2
0,3
~
R0
^
S
0,16
0,12
0,08
0,04
0
0,05
0,1
0,15
0,2
0,25
~
F0
Рис. 1. Максимальное смещение эмпирического риска.
Оценка смещения эмпирического риска методом статистического моделирования
Легко заметить, что полученные распределения характеризуются тем, что пространство X оказывается разбитым на две подобласти: в одной из которых байесовский уровень ошибки нулевой, а в другой – значительный. Подобную особенность распределения легко обеспечить в непрерывном случае.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Некоторые вопросы оценивания качества методов построения решающих функций
131
Пусть X = [ 0,1] n – n-мерный гиперкуб, на котором задано равномерное распределение.
Чтобы полностью определить меру P , осталось задать g ( x ) = P ( y = 1 x ) –
условную вероятность первого класса при попадании в точку x. Будем задавать
g ( x ) в виде
x j < δ, j = 1,..., n,
⎧g
g ( x ) = ⎨ 1,
иначе,
⎩ g2 ,
1
δ = ϑт .
Иными словами, g ( x ) является кусочно-постоянной, первая область постоянства есть гиперкуб объёма ϑ , вторая – дополнение внутреннего гиперкуба до
единичного.
Первое семейство распределений (назовём его моделью A) зададим следующим образом: параметр ϑ положим равным некоторой константе ϑ0 , g 2 ≡ 1 , а
параметр g1 изменяется от 0 до 0,5; далее полагаем g1 ≡ 0,5 , а ϑ изменяем
от ϑ0 до 0. Заметим, что данное семейство задано в некотором смысле «по подобию» распределений, доставляющих максимум смещения эмпирического риска
для гистограммного классификатора.
Для сравнения будем рассматривать также другое семейство распределений
(назовём его моделью B), которое задаётся следующим образом: ϑ ≡ 0,5 , g1 = g ′ ,
g1 = 1 − g ′ , где g ′ задаёт байесовский уровень ошибки и изменяется от 0 до 0,5.
На правой диаграмме рис. 1 приведены результаты статистического моделирования для метода направленного построения деревьев решений. Обозначения: 1 –
оценка Ŝ ( ⋅) при M = 4 , 2 – моделирование на стратегии A с параметром
ϑ0 = 0,83 , 3 – моделирование на стратегии B.
Значение параметра сложности M можно подобрать с помощью моделирования на равномерном распределении.
Заключение
Таким образом, рассмотрена проблема создания полигона тестовых задач для
исследования качества методов построения решающих функций.
Предложено в качестве тестовых единиц в таком полигоне использовать специальным образом подобранные классы распределений. Классы распределений
подбираются так, чтобы статистическое моделирование на них по возможности
полно отражало особенности тестируемого метода обучения. Это, в частности,
означает, что класс распределений должен являться параметрическим семейством, один из параметров которого есть наименьшее достигаемое значение риска в
заданном классе решающих правил.
Другим важным параметром является величина смещения эмпирического риска.
Установлено, что для гистограммного классификатора «наихудшее» распределение (для которого смещение эмпирического риска максимально) является смесью равномерного (по X) распределения и распределения, сосредоточенного в одной точке.
Подобного вида распределения легко могут быть заданы и в непрерывном
пространстве переменных. Результаты статистического моделирования для задачи
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
132
В.М. Неделько
классификации с помощью деревьев решений позволяют предположить, что на
таких распределениях будет достигаться максимальное смещение эмпирического
риска и для других (помимо гистограммного) методов классификации.
ЛИТЕРАТУРА
1. Лбов Г.С., Старцева Н.Г. Сравнение алгоритмов распознавания с помощью программной системы «Полигон» // Анализ данных и знаний в экспертных системах. Новосибирск. Вычислительные системы. 1990. Вып.134. С. 56–66.
2. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. М.: Наука, 1974. 415 с.
3. Лбов Г.С. Выбор эффективной системы зависимых признаков // Вычислительные системы. Новосибирск., 1965. Вып. 19. C. 21–34.
4. Лбов Г.С., Старцева Н.Г. Логические решающие функции и вопросы статистической
устойчивости решений. Новосибирск: Институт математики СО РАН, 1999. 211 с.
5. Braga-Neto U. and Dougherty E.R. Exact performance of error estimators for discrete
classifiers // Pattern Recognition, Elsevier Ltd. 2005. V. 38. Nо. 11. P. 1799–1814.
6. Langford J. Quantitatively tight sample complexity bounds. Carnegie Mellon Thesis. 2002.
http://citeseer.ist.psu.edu/langford02quantitatively.html. 130 p.
7. Воронцов К.В., Ивахненко А.А., Инякин А.С. и др. «Полигон» − распределённая система
для эмпирического анализа задач и алгоритмов классификации // Всерос. конференция
«Математические методы распознавания образов-14». М.: МАКС Пресс, 2009. С. 503–
506.
8. Неделько В.М. О точности интервальных оценок вероятности ошибочной классификации, основанных на эмпирическом риске // Всерос. конференция «Математические методы распознавания образов-14». М.: МАКС Пресс, 2009. С. 56–59.
9. Неделько В.М. Точные и эмпирические оценки вероятности ошибочной классификации. // Научный вестник НГТУ. Новосибирск: Изд-во НГТУ, 2011. № 1(42). С. 3–16.
10. Nedelko V.M. Estimating a quality of decision function by empirical risk // LNAI 2734.
Machine Learning and Data Mining in Pattern Recognition. Third International Conference,
MLDM 2003, Leipzig. Proceedings. Springer-Verlag. P. 182–187.
11. Лемешко Б.Ю., Лемешко С.Б., Постовалов С.Н. Сравнительный анализ мощности критериев согласия при близких альтернативах. II. Проверка сложных гипотез // Сибирский журнал индустриальной математики. 2008. Т.11. № 4(36). С. 78–93.
12. Неделько В.М. Оптимизация оценки вероятности ошибочной классификации в дискретном случае // Classification, Forecasting, Data Mining. Int. Book Series «Information
Science and Computing», Nо. 8. Supplement to the Int. J. «Information Technologies and
Knowledge», V. 3. ITA, FOI ITHEA, Sofia, 2009. P. 47–54.
Неделько Виктор Михайлович
Институт математики СО РАН (г. Новосибирск)
E-mail: nedelko@math.nsc.ru
Поступила в редакцию 15 мая 2012 г.
Nedelko Victor M. (Institute of Mathematics SB RAS. Novosibirsk). Some aspects of estimating
a quality of decision functions construction methods.
Keywords: pattern recognition, machine learning, decision function, misclassification probability,
empirical risk.
The paper is devoted to a problem of estimating a quality of decision functions construction
methods in classification (pattern recognition) task. An approach based on constructing some
special set of testing tasks is investigated. As the testing tasks the distributions delivering the
maximal bias of empirical risk are, in particular, used. The statistical modeling performed allows
to evaluate an applicability of the results obtained.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
УДК 519.2/6
Г.Ш. Цициашвили
ЭРГОДИЧНОСТЬ ОДНОКАНАЛЬНОЙ СИСТЕМЫ МАССОВОГО
ОБСЛУЖИВАНИЯ В СЛУЧАЙНОЙ СРЕДЕ
В работе строятся модификации одноканальной системы массового обслуживания в случайной среде, для которых можно в явном виде получить критерии эргодичности. Эти модификации основаны на использовании жидкостной модели и модели одноканальной системы обслуживания с дискретным
временем.
Ключевые слова: одноканальная система обслуживания, критерий эргодичности, жидкостная модель обслуживания, дискретное время.
Математическим моделям систем и сетей массового обслуживания в случайной среде уделяется большое внимание в теории массового обслуживания (см.,
например, [1, с. 76] и содержащиеся в статье ссылки) в связи с обилием разнообразных приложений к транспортным моделям [2, с. 430−432, 438], и системам с
гистерезисной стратегией управления [3, с. 42−61; 4, с. 24, 25].
Однако вопросы эргодичности в моделях этого типа как правило получили
решение в виде только достаточных, а не необходимых и достаточных условий [1,
теорема 1, формула (2)]. Поэтому работа в данном направлении остается актуальной, несмотря на обилие результатов, в которых даются формулы и алгоритмы
вычисления предельных распределений в данных системах. В настоящей работе
вопросы получения критериев эргодичности решаются не усилением известных
результатов по расчету предельных распределений для систем обслуживания в
случайной среде, а построением достаточно общих стохастических моделей этих
систем обслуживания, которые удобно сводить к известным теоремам эргодичности для одноканальных моделей обслуживания типа цепочки Линдли [5, с. 20−36].
В рамках этого подхода рассматриваются жидкостные модели обслуживания
[6, с. 3−5], [7, с. 8−12], для которых определяется количество жидкости в системе
в моменты изменения режима ее функционирования или строится модель обслуживания с дискретным временем, описываемая числом заявок в системе. При таком подходе вместо времени ожидания начала обслуживания в моменты прихода
заявок удобным оказалось моделировать и анализировать на эргодичность динамику числа заявок, находящихся в системе. Данная модель может быть легко распространена на случай, когда случайная последовательность t1,t2,…, характеризующая интервалы между приходом заявок в систему, является стационарной и
известно математическое ожидание Mti.
1. Жидкостная одноканальная модель обслуживания в случайной среде
В этом разделе будет рассматриваться следующая жидкостная модель одноканальной системы массового обслуживания M|M|1. Разобьем неотрицательную полуось t ≥ 0 на полуинтервалы [T0 , T1 ) , T0 = 0 , T1 = T0 + t1 , [T1 , T2 ) , T2 = T1 + t2 ,… .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.Ш. Цициашвили
134
Здесь независимые случайные величины t1,t2 ,…, имеют показательное распределение
P ( tn > t ) = exp ( −λt ) , t ≥ 0 , n > 0 .
Предположим, что на полуинтервале [Tn −1 , Tn ) , n > 0, в некий резервуар закачивается жидкость с интенсивностью an > 0 и выкачивается жидкость с интенсивностью bn > 0 , если объем жидкости больше нуля. Если объем жидкости равен нулю, то при an < bn интенсивность оттока жидкости становится равной интенсивности ее притока an, причем начальное количество жидкости в системе
равно w0 ≥ 0 . Далее полагаем, что характеристики случайной среды
{ ( an , bn ) , n > 0} образуют последовательность независимых и одинаково распределенных случайных величин.
Обозначим wn ≥ 0, n > 0, объем жидкости в момент Tn , тогда в силу сделанных предположений объем жидкости в резервуаре в момент Tn +1 удовлетворяет
равенству
+
wn +1 = ( wn + ξ n ) , d + = max ( 0, d ) , −∞ < d < +∞ , ξn = ( an − bn ) tn , n ≥ 0 . (1)
Далее полагаем, что независимые последовательности независимых случайных векторов { ( an , bn ) , n > 0} , { tn , n > 0} с неотрицательными компонентами
удовлетворяют равенствам
⎛
⎞
P ⎜ an = αi , bn = βi ⎟ = pi , αi > 0 , βi > 0 , i = 1,..., I , n > 0 ,
⎝
⎠
I
∑ pi = 1 .
i =1
По аналогии с [8, гл. II, §4,лемма 3] определим
I
an − bn = ∑ χ ( an = α i , bn = βi ) ( α i − βi ) .
k =1
Здесь χ ( C ) – индикаторная функция случайного события C. В силу [5, § 3, теорема 7] необходимым и достаточным условием эргодичности случайной последовательности wn , n ≥ 0, является неравенство
I
M ξn = ∑
i =1
pi ( αi − βi )
< 0.
λ
(2)
Замечание 1. В случае системы G1|M|1, если случайная последовательность
{ tn , n ≥ 1} состоит из независимых и одинаково распределенных случайных величин и, следовательно, порождает рекуррентный входной поток, а случайные последовательности { tn , n ≥ 1} , { ( an − bn ) , n ≥ 1} независимы, то условие эргодичности (2) должно быть заменено на
I
M ξn = Mtn ∑ pi ( αi − βi ) < 0 .
(3)
i =1
Причем, пользуясь формулами (1), удобно марковскую цепочку wn , n ≥ 0, промоделировать методом Монте-Карло и исследовать на устойчивость ее предельные и
допредельные распределения при вариации закона распределения случайных величин tn , n ≥ 1 .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Эргодичность одноканальной системы массового обслуживания в случайной среде
135
2. Одноканальная модель обслуживания с дискретным временем
в случайной среде
Перейдем теперь к одноканальной системе массового обслуживания с дискретным временем. Пусть в моменты времени t = 0,1,… в системе находится xt
заявок, x0 ≥ 0. Пусть в момент t система массового обслуживания функционирует
в режиме γ t , где γ t = i с вероятностью πi > 0 , i = 1,…,m,
m
∑ πi = 1 , а случайные
i=1
величины γ t , t ≥ 0 , независимы.
Замечание 2. События, связанные с пребыванием процесса γ t в состоянии i,
удовлетворяют равенствам P ( γ t = i,..., γ t + k −1 = i ) = πik , k > 0.
Если γ t = i, то полагаем, что с вероятностью p1,i в момент времени t+1 в систему поступит одна новая заявка входного потока и с вероятностью q1,i = 1 − p1,i
никаких заявок не поступит. Наряду с этим в момент t+1 с вероятностью p2,i из
системы уйдет одна (фиктивная, если в системе заявок нет) заявка, а с вероятностью q2,i = 1 − p2,i этого не произойдет. Приход новой заявки входного потока и
уход из нее заявки (быть может, фиктивной) предполагаются независимыми событиями.
Определим
независимые
случайные
последовательности
{ηt+,i , t ≥ 0} ,
{ηt−,i , t ≥ 0} , i = 1,..,m , состоящие из независимых случайных величин с распределениями:
⎧ 1, с вeроятностью p1,i , − ⎧−1, с вeроятностью p2,i ,
ηt ,i = ⎨
ηt+,i = ⎨
⎩ 0, с вероятностью q2,i ,
⎩0, с вероятностью q1,i ,
тогда сумма независимых случайных величин ηt ,i = ηt+,i + ηt−,i имеет распределение
⎧+1, с вeроятностью p1,i q2,i ,
⎪
ηt ,i = ⎨−1, с вeроятностью p2,i q1,i ,
⎪ 0, с вeроятностью p p + q q ,
1,i 2,i
1,i 2,i
⎩
А случайная последовательность xt, t > 0, удовлетворяет рекуррентному соотношению
+
m
xt +1 = ( xt + ηt ) , t ≥ 0 , ηt = ∑ χ ( γ t = i ) ηt ,i .
(4)
i =1
Предположим, что случайные последовательности
{ γ t , t ≥ 0} ,
{ ( ηt+,i , ηt−,i ) , t ≥ 0} , i = 1,..., m,
независимы.
Тогда в силу [5, §3, теорема 7] необходимым и достаточным условием эргодичности случайной последовательности xt, t > 0, является неравенство
m
M ηt = ∑ πi ( p1,i q2,i − p2,i q1,i ) < 0 .
i =1
(5)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Г.Ш. Цициашвили
136
Замечание 3. Условие на случайную последовательность γ t , t ≥ 0 , при котором справедлив критерий эргодичности (5), можно ослабить, полагая последовательность γ t , t ≥ 0, стационарной в узком смысле. В частности, можно предполо-
жить, что γ t , t ≥ 0, является эргодической обратимой [9, p. 6, Definition 1.4] цепью
Маркова с предельным распределением πi , i = 1,..., m , причем P ( α 0 = i ) = πi ,
i = 1,..., m .
Замечание 4. Еще одним обобщением данной модели является предположе-
(
)
ние, что определенные выше случайные вектора ηt+,i , ηt−,i , s > 0 , r > 0 , t ≥ 0 ,
i = 1,..., m , имеют распределения
((
)
)
P ηt+,i , ηt−,i = ( s, r ) = U i ( s, r ) , t ≥ 0 , i = 1,..., m .
Замечание 5. Рассмотренная в настоящем параграфе модель массового обслуживания может быть также распространена на случай, когда вместо моментов
времени t = 0,1,… берутся случайные моменты 0, T1 = τ1 , T2 = T1 + τ2 ,..., где слу-
чайные величины τt , t > 0, независимы, неотрицательны и одинаково распределены, а случайная последовательность xt, t > 0, определяется в не в моменты
t = 0,1,..., а в моменты Tt , t > 0. Причем случайные последовательности
{ ηt , t ≥ 0} , { Tt , t ≥ 0} независимы. В этом случае случайная последовательность
{ ηt , t ≥ 0} может рассматриваться как цепь Маркова, вложенная в случайные моменты времени { Tt , t ≥ 0} .
Заключение
Предлагаемые в статье приемы получения критериев эргодичности для систем
массового обслуживания в случайной среде можно распространить с одноканальной системы на другие системы. К ним можно, в частности, отнести многофазную
систему массового обслуживания. Такие способы переопределения моделей обслуживания также позволяют существенно расширить ограничения на модель одноканальной системы в случайной среде. Более того, появляется возможность не
только сконструировать критерии эргодичности, но и построить удобные алгоритмы расчета предельных распределений в этих моделях как аналитическими
методами, так и методом Монте-Карло.
ЛИТЕРАТУРА
1. Дудин А.Н., Клименок В.И. Расчет характеристик однолинейной системы обслуживания,
функционирующей в синхронной случайной среде // Автоматика и телемеханика. 1997.
№ 1. С. 74−84.
2. Афанасьева Л.Г., Руденко И.В. Системы обслуживания GI|G|∞ и их приложения к анализу транспортных моделей // Теория вероятностей и ее применения. 2012. № 3.
С. 427−452.
3. Гайдамака Ю.В., Зарипова Э.Р., Самуйлов К.Е. Модели обслуживания вызовов в сети
сотовой подвижной связи: учебно-методическое пособие. М.: РУДН. 2008. 72 c.
4. Самочернова Л.С., Петров Е.И. Оптимизация системы массового обслуживания с гистерезисной стратегией управления однотипным резервным прибором // Известия Томского политехнического университета. 2011. Т. 319. № 5. С. 24−27.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Эргодичность одноканальной системы массового обслуживания в случайной среде
137
5. Боровков А.А. Вероятностные процессы в теории массового обслуживания. М.: Наука,
1971. 368 c.
6. Рыбко А.Н., Столяр А.Л. Об эргодичности случайных процессов, описывающих функционирование открытых сетей массового обслуживания // Проблемы передачи информации. 1992. Т. 28. Вып. 3. С. 3–26.
7. Адаму А., Гайдамака Ю.В., Самуйлов А.К. К анализу состояния буфера пользователя одноранговой сети с потоковым трафиком // T-comm – Телекоммуникации и транспорт.
2011. № 7. С. 8−12.
8. Ширяев А.Н. Вероятность. М.: Наука, 1989. 640 c.
9. Serfozo R. Introduction to Stochastic Networks. NewYork: Springer-Verlag, 1999. 300 p.
Цициашвили Гурами Шалвович
ИПМ ДВО РАН (г. Владивосток)
Е-mail:guram@iam.dvo.ru
Поступила в редакцию 22 мая 2013 г.
Tsitsiashvili Guram Sh. (IAM, FEB RAS, Vladivostok). Ergodicity of one server queuing
systems in random environment.
Keywords: one server queuing system, ergodicity criterion, fluid queuing model, discrete time.
Mathematical models of queuing systems and networks in random environment are
intensively investigated in queuing theory because of manifold applications in transport models
and systems with hysteresis strategy of control.
But problems of an ergodicity in these models as a rule are solved by only sufficient, not
necessary and sufficient conditions. So investigations in this direction are actual in spite of
manifold results connected with formulas and algorithms for calculations of limit distributions in
these systems. In this paper problems of an obtaining of ergodicity criteria are solved not by a
gain of known results but by a construction of special stochastic models which may be reduced to
one server queuing systems in a form of Lindely chain.
In a frame of such approach fluid queuing models are used. In these models waiting times are
replaced by dynamics of numbers of customers in these systems.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
УДК 519.876.5:004.94
А.В. Приступа
ИМИТАЦИОННАЯ МОДЕЛЬ ПЕРЕКРЕСТКА С ДВУХФАЗНЫМ
СВЕТОФОРНЫМ РЕГУЛИРОВАНИЕМ
Рассматривается задача поиска оптимального режима работы светофоров на
регулируемом перекрестке двух автомобильных дорог при управлении потоками транспортных средств с заданными интенсивностями. В качестве
критерия оптимальности выбрано минимальное время проезда перекрестка.
Ключевые слова: имитационная модель, перекресток, светофор.
Постоянно растущее количество автомобилей на городских улицах, а также
плотная застройка, не позволяющая расширять дорожное полотно и добавлять новые полосы движения, заставляет регулярно задумываться над оптимизацией
движения потоков автомобильного транспорта в условиях имеющихся в распоряжении ресурсов. Правильная настройка циклов работы светофоров на перекрестках является одним из способов решения этой проблемы. В качестве метода исследования чаще всего выбирают имитационное моделирование, поскольку наличие светофорного регулирования со своими схемами пофазного разъезда и другими параметрами существенно затрудняет построение аналитических моделей.
Однако и в имеющихся компьютерных моделях многие факторы зачастую не учитываются: например, не рассматривается особенность поворота налево по сравнению с другими направлениями движения на перекрестке [1, с. 232, 233; 2] либо
выбирается такой режим работы светофоров, при котором никакие транспортные
потоки при выполнении маневров на перекрестке не пересекаются [3]. В данной
статье предлагается учесть особенность левого поворота, связанную с необходимостью уступить дорогу транспортным средствам встречного направления, а также принять во внимание ограниченность размера пространства на перекрестке, на
котором автомобили могут дожидаться возможности завершения маневра. Задача
будет состоять в построении соответствующей имитационной модели средствами
системы GPSS World и проведении над построенной моделью ряда экспериментов
с целью определения оптимального режима работы светофоров при управлении
потоками транспортных средств с заданными интенсивностями. В качестве целевой функции, которую будем минимизировать, выберем среднее время проезда
перекрестка.
Имитационная модель перекрестка
Рассмотрим пересечение двух автомобильных дорог. Пусть каждая дорога состоит из двух проезжих частей, а каждая проезжая часть, в свою очередь, имеет 2
полосы движения: одна – для поворота налево, другая – для движения прямо и на-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Имитационная модель перекрестка с двухфазным светофорным регулированием
139
право. Предположим, что на перекрестке разрешен проезд в любом из направлений
(прямо, налево, направо), а светофоры работают в двухфазном режиме (рис. 1).
N
N
а
б
E
W
E
W
S
S
Рис. 1. Режимы работы светофоров на перекрестке: а – 1-я фаза; б – 2-я фаза
Во время работы светофоров в первой фазе (рис. 1, а) движение разрешено по
проезжим частям S и N. При этом автомобили, двигающиеся по правой полосе, могут беспрепятственно продолжать движение прямо или направо, а те, кто едет по
левой полосе, могут повернуть налево, уступив дорогу транспортным средствам
встречного направления, едущим прямо. Во время работы светофоров во второй
фазе (рис. 1, б) движение разрешено по проезжим частям W и E. Направления движения по полосам и правила проезда перекрестка аналогичны первому случаю.
Моделирование начинается в момент времени равный 0. При этом светофоры
работают в первой фазе. Пусть все входящие потоки являются простейшими, известны интенсивности потоков по каждой полосе, при этом для правых полос
движения каждой проезжей части известно также процентное соотношение между
автомобилями, двигающимися прямо и поворачивающими направо. Убедившись
в том, что горит разрешающий сигнал светофора, будем разрешать выезд автомобилей на перекресток. Если автомобиль, стоящий первым на светофоре, начинает
выезд на перекресток, то в течение времени CrossTme1 все остальные автомобили
в этой полосе должны оставаться на месте. Это соответствует этапу «трогания с
места». Далее при отсутствии помех автомобиль в течение времени CrossTime2
завершает маневр и покидает перекресток. Для осуществления временной задержки на время CrossTme1 и CrossTme2 будем использовать одноканальные устройства обслуживания (ОКУ).
Для автомобилей, поворачивающих налево, необходимо еще учесть тот факт,
что их траектории пересекаются с траекториями автомобилей встречного направления, двигающихся прямо. Поэтому будем разрешать им выезд на перекресток в
свой накопитель (многоканальное устройство ограниченной емкости, например,
3), а для завершения левого поворота будем проверять, свободно или занято соответствующее ОКУ встречного направления, обеспечивая тем самым выполнение
требования «Уступить дорогу». В течение времени CrossTime1 автомобиль сможет выехать на перекресток (занимая при этом ОКУ и МКУ), а в течение времени
CrossTime2 завершить маневр при отсутствии встречных помех.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.В. Приступа
140
При генерации транзактов будем также назначать им различные приоритеты: 1 –
для автомобилей, двигающихся прямо или направо; 0 – для автомобилей, поворачивающих налево. Использование приоритетов также обусловлено требованием «Уступить дорогу», поскольку при смене сигналов светофора перед перекрестком уже
имеется некоторая очередь, которая образовалась, пока горел запрещающий сигнал.
И приоритет в ней имеют те автомобили, которые собираются проехать прямо, по
сравнению с машинами встречного направления, поворачивающими налево.
Программная реализация на GPSS
Рассмотрим программную реализацию сегмента, отвечающего за смену сигналов светофорных объектов.
GENERATE 0,,,1
Label1 SAVEVALUE TrafficSN,0
SAVEVALUE TrafficWE,999
ADVANCE GreenTimeSN
SAVEVALUE TrafficSN,999
SAVEVALUE TrafficWE,0
ADVANCE GreenTimeWE
TRANSFER ,Label1
В момент времени равный 0 создается единственный транзакт, инициирующий
первую фазу работы светофоров. Переменная TrafficSN принимает значение 0, что
соответствует зеленому сигналу светофора на проезжих частях S и N, а переменная TrafficWE принимает значение 999, что соответствует красному цвету на проезжих частях W и E. По истечении времени, заданного константой GreenTimeSN,
осуществляется переход ко второй фазе: значения переменных меняются местами, и производится задержка на время равное GreenTimeWE. Далее следует переход на первую фазу и т.д. Задача заключается в том, чтобы подобрать такие значения длительности сигналов светофоров, которые обеспечат минимальное средневзвешенное время ожидания автомобилей на перекрестке.
Теперь перейдем к рассмотрению сегментов, которые отвечают за движение
автомобилей. Для поворота налево (на примере проезжей части S) имеем следующую программную реализацию:
GENERATE (Exponential(1,0,meanS_L)),,,,0
QUEUE LineS_L
TEST E X$TrafficSN,SF$WayS_Left
ENTER WayS_Left
SEIZE WayS_L1
ADVANCE CrossTime1
RELEASE WayS_L1
TEST E X$TrafficSN,F$WayN_F
LEAVE WayS_Left
SEIZE WayS_L2
ADVANCE CrossTime2
RELEASE WayS_L2
DEPART LineS_L
TERMINATE
Машины прибывают на перекресток по левой полосе через случайные промежутки времени, имеющие экспоненциальный закон распределения со средним
значением meanS_L. Приоритет равен 0. Далее они поступают в соответствующую
очередь LineS_L для того, чтобы по окончании моделирования можно было оценить среднее время ожидания автомобиля, собирающегося выполнить поворот
налево. Если горит разрешающий сигнал светофора и число машин в накопителе
для левого поворота не превысило заданной емкости (проверка в первом блоке
TEST), то автомобиль в течение времени CrossTime1 выезжает на перекресток и
ожидает возможности завершения маневра, т.е. отсутствия встречных машин
(проверка во втором блоке TEST). Если условие истинно, то автомобиль в течение
времени CrossTime2 завершает проезд перекрестка и освобождает все соответствующие очереди и устройства обслуживания.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Имитационная модель перекрестка с двухфазным светофорным регулированием
141
Рассмотрим теперь сегмент, который отвечает за движение машин прямо и направо (на примере проезжей части S), программная реализация которого выглядит
следующим образом:
GENERATE (Exponential(2,0,meanS_F_R)),,,,1
QUEUE LineS_F_R
TEST E X$TrafficSN,F$WayS_F_R
SEIZE WayS_F_R
ADVANCE CrossTime1
RELEASE WayS_F_R
TRANSFER S_RightPart,,S_RightLabel
S_ForwardLabel SEIZE WayS_F
;движение прямо
ADVANCE CrossTime2
RELEASE WayS_F
TRANSFER ,S_EndLabel
S_RightLabel SEIZE WayS_R
;движение прямо
ADVANCE CrossTime2
RELEASE WayS_R
S_EndLabel DEPART LineS_F_R
TERMINATE
По правой полосе машины прибывают на перекресток через случайные промежутки времени, имеющие экспоненциальный закон распределения со средним
значением meanS_F_R. Приоритет равен 1. Далее они поступают в соответствующую очередь LineS_F_R для того, чтобы по окончании моделирования можно было оценить среднее время ожидания автомобиля, собирающегося проехать прямо
или повернуть направо. Если горит разрешающий сигнал светофора и впереди
стоящая машина завершила этап «трогания с места», то автомобиль в течение
времени CrossTime1 выезжает на перекресток. После этого в блоке TRANSFER
определяется дальнейший маршрут движения (прямо или направо) и осуществляется передача управления в соответствующий блок обработки, где автомобиль в
течение времени CrossTime2 завершает проезд перекрестка. Направление, в котором поедет автомобиль после того, как заедет на перекресток, интересует нас
лишь потому, что машины, поворачивающие направо, не мешают никому, а двигающиеся в прямом направлении мешают встречным машинам поворачивать налево, и это обстоятельство необходимо учитывать.
Таким образом, нами рассмотрен 1 сегмент модели, отвечающий за смену сигналов светофоров, а также 2 сегмента, имитирующих проезд перекрестка машинами, прибывшими с направления S. Оставшиеся 6 сегментов (для проезжих частей N, W и E) аналогичны рассмотренным. Можно также отметить, что при увеличении числа полос движения или количества фаз светофорного регулирования
модель может быть адаптирована для работы в новых условиях: для этого достаточно дописать несколько подобных сегментов.
Рассмотрим полученные результаты на примере одного из наборов значений
входных параметров. Предположим, что полная длительность светофорного цикла составляет 80 с, время проезда перекрестка составляет 4 с (CrossTime1 = 2;
CrossTime2 = 2), а емкость накопителя для машин, желающих повернуть налево,
равна 3. Пусть Green.SN и Green.WE – продолжительность разрешающего сигнала
на направлениях SN и WE соответственно. При условии, что все интенсивности
прибытия автомобилей к перекрестку известны, будем искать такие значение
Green.SN и Green.WE, которые обеспечат нам минимальное средневзвешенное
время проезда перекрестка (столбец TIME).
Для заданных интенсивностей были проведены имитационные эксперименты с
различными значениями продолжительностей сигналов светофоров. В данных условиях наилучшим режимом работы оказался такой, когда длительность первой фазы (46 с из 80) составил 57,5 % полного цикла, а продолжительность второй (34 с из
80) – 42,5 %. В этих условиях средневзвешенная временная задержка оказалась минимальной и составила 27,378 с. Аналогичным образом можно смоделировать работу перекрестка при других интенсивностях входящих потоков.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
142
%Right
Проезжая
τ1
τ2
(с)
(с)
(%)
часть
S
4,5
6
20
N
6
6
25
W
8
8
15
E
7
6
50
Описание: τ1 – среднее время
между прибытиями машин по
левой полосе; τ2 – среднее время
между прибытиями машин по
правой полосе; %right – % машин,
которые из правой полосы поворачивают направо (остальные −
прямо)
А.В. Приступа
Green.SN
(с)
Green.WE
(с)
40
40
46
34
50
30
Time.L
(с)
120,451
37,712
22,133
28,348
31,939
25,127
28,047
41,953
23,988
20,442
33,960
77,652
Time.F_R TIME
(с)
(с)
20,035
20,028
43,752
17,888
20,028
15,665
15,664
27,378
22,296
26,077
13,215
13,210
31,529
25,816
33,919
Заключение
Для регулируемого перекрестка двух автомобильных дорог разработана имитационная модель движения транспортных средств, которая при заданных интенсивностях входящих потоков позволяет определить такой режим работы светофоров, который обеспечит минимальное средневзвешенное время проезда перекрестка для автомобилей, прибывающих с различных направлений. Особенность модели состоит в том, что в ней учтена специфика маневра левого поворота, заключаящаяся в необходимости уступить дорогу транспортным средствам встречного
направления, а также в ограниченности пространства на перекрестке, на котором
автомобили могут дожидаться возможности завершения маневра.
ЛИТЕРАТУРА
1. Вероятностные и имитационные подходы к оптимизации автодорожного движения /
А.П. Буслаев [и др.]; под ред. чл.-корр. РАН В.М. Приходько. М.: Мир, 2003. 368 с.
2. Anfilets S.V., Shut V.N. The creation of models of adjustable crossroads on GPSS // Proc. 9th
Int. Conf. «Reliability and Statistics in Transportation and Communication» (21–24 October
2009, Riga, Latvia). Riga: Transport and Telecommunication Institute, 2009. P. 433−438.
3. Зольников В.А. Модель движения машин на Т-образном перекрестке // Имитационное
моделирование. Теория и практика: сб. докл. Пятой Всероссийской научно-практической конференции ИММОД-2011. Т. 2. СПб.: ОАО «ЦТСС», 2011. С. 104−108.
Приступа Андрей Викторович
Томский государственный университет
E-mail: pristupa@sibmail.com
Поступила в редакцию 23 апреля 2013 г.
Pristupa Andrey V. (Tomsk State University). Crossroad simulation model with the two-phase
traffic signal control.
Keywords: simulation model, crossroads, traffic light.
One considers the problem of finding the optimal mode of traffic signal control at the
crossroad while managing the traffic flow with given intensities. Simulation is chosen as a
research method. Feature of the model is the explicit allocation of left turns from all possible
directions at the crossroad, associated with the necessity to give way to cars traveling in opposite
direction.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013
Управление, вычислительная техника и информатика
№ 3(24)
СВЕДЕНИЯ ОБ АВТОРАХ
БОНДАРЕНКО Анатолий Николаевич − доктор физико-математических наук, ведущий
сотрудник Института математики им. С.Л. Соболева СО РАН. E-mail: bondarenkoan1953@
mail.ru
ВЕРХОВИН Антон Викторович − аспирант кафедры «Информатика и вычислительная
техника» факультета информационных технологий и компьютерных систем Омского государственного технического университета. E-mail: 007vav@mail.ru
ГУЛЬТЯЕВА Татьяна Александровна – аспирантка, ассистент кафедры программных
систем и баз данных. E-mail: gult_work@mail.ru
ГУМЕНЮК Александр Степанович − доцент, кандидат технических наук, доцент кафедры «Информатика и вычислительная техника» факультета информационных технологий и компьютерных систем Омского государственного технического университета.
E-mail: gumas45@mail.ru
ГУНЬКИН Андрей Юрьевич − аспирант факультета прикладной математики и информатики Новосибирского государственного технического университета. E-mail: shamrock24@
mail.ru
ДМИТРЕНКО Анатолий Григорьевич – профессор, доктор физико-математических наук, профессор кафедры исследования операций факультета прикладной математики и кибернетики Томского государственного университета. E-mail : dmitr@fpmk.tsu.ru
ДОМБРОВСКИЙ Владимир Валентинович – профессор, доктор технических наук, зав.
кафедрой математических методов и информационных технологий в экономике экономического факультета Томского государственного университета. E-mail: dombrovs@ef.tsu.ru
ЗЕНКОВА Жанна Николаевна, кандидат физико-математических наук, МВА, доцент кафедры теоретической кибернетики факультета прикладной математики и кибернетики
Томского государственного университета, доцент кафедры высшей математики Физикотехнического института Томского политехнического университета. Е-mail: thankoff@fpmk.
tsu.ru
ЗОРИН Андрей Владимирович − кандидат физико-математических наук, доцент, доцент
кафедры прикладной теории вероятностей факультета вычислительной математики и кибернетики Нижегородского государственного университета им. Н.И. Лобачевского. E-mail:
zoav1602@gmail.com
КОКШЕНОВ Владимир Владимирович − ассистент кафедры прикладной информатики
факультета информатики Томского государственного университета. E-mail: vladimir_finf@
mail.ru
КРАКОВЕЦКАЯ Инна Валентиновна − кандидат экономических наук, доцент кафедры
системного менеджмента и предпринимательства экономического факультета Томского
государственного университета, доцент кафедры инженерного предпринимательства Института социально-гуманитарных технологий Томского политехнического университета.
Е-mail: inna_krakov@mail.ru
ЛАПКО Александр Васильевич – доктор технических наук, главный научный сотрудник
отдела прикладной информатики Института вычислительного моделирования СО РАН;
профессор кафедры космических средств и технологий Сибирского государственного аэрокосмического университета имени академика М.Ю. Решетнёва (г. Красноярск). E-mail:
lapko@icm.krasn.ru
ЛАПКО Василий Александрович – доктор технических наук, ведущий научный сотрудник отдела прикладной информатики Института вычислительного моделирования СО
РАН; профессор кафедры космических средств и технологий Сибирского государственного
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
144
Сведения об авторах
аэрокосмического университета имени академика М.Ю. Решетнёва (г. Красноярск). E-mail:
lapko@icm.krasn.ru
ЛЮБИНА Татьяна Викторовна – начальник организационно-технического отдела филиала ФГБОУ ВПО «Кемеровский государственный университет» в г. Анжеро-Судженске.
Е-mail: lyubina_tv@mail.ru
МЕДВЕДЕВ Геннадий Алексеевич – профессор, доктор физико-математических наук,
профессор факультета прикладной математики и информатики Белорусского государственного университета (г. Минск, Беларусь). E-mail: MedvedevGA@cosmostv.by
МИХЕЕВ Павел Андреевич − кандидат технических наук, программист кафедры прикладной информатики факультета информатики Томского государственного университета.
E-mail: doka-patrick@mail.ru
НАЗАРОВ Анатолий Андреевич – профессор, доктор технических наук, заведующий кафедрой теории вероятностей и математической статистики факультета прикладной математики и кибернетики Томского государственного университета. Е-mail: anazarov@
fpmk.tsu.ru
НЕДЕЛЬКО Виктор Михайлович − доцент, кандидат физико-математических наук,
старший научный сотрудник лаборатории анализа данных Института математики СО РАН.
E-mail: nedelko@math.nsc.ru
ПОПОВ Александр Александрович – доктор технических наук, профессор, заведующий
кафедрой программных систем и баз данных. E-mail: alex@fpm.ami.nstu.ru
ПРИСТУПА Андрей Викторович − кандидат технических наук, доцент кафедры теоретических основ информатики Томского государственного университета. E-mail:
pristupa@sibmail.com
ПРИСТУПА Марина Юрьевна – кандидат технических наук, ООО «Битворкс»
(г. Томск). Е-mail: kiselevamy@gmail.com
СМАГИН Валерий Иванович – профессор, доктор технических наук, профессор кафедры
прикладной математики факультета прикладной математики и кибернетики Томского государственного университета. Е – mail: vsm@mail.tsu.ru
СУЩЕНКО Сергей Петрович − профессор, доктор технических наук, заведующий кафедрой прикладной информатики факультета информатики Томского государственного
университета. E-mail: ssp@inf.tsu.ru
ТОЛСТУХА Сергей Александрович – аспирант факультета туризма и информационных
технологий Омского государственного института сервиса. E-mail: letters@sergal.ru
УРИНОВ Радик Истамович – аспирант кафедры исследования операций факультета прикладной математики и кибернетики Томского государственного университета. E-mail:
rad_d@sibmail.com
ФИЛИМОНОВ Вячеслав Аркадьевич – профессор, доктор технических наук, старший
научный сотрудник Омского филиала Института математики им. С.Л. Соболева Сибирского отделения Российской академии наук. E-mail: filimono@ofim.oscsbras.ru
ЦИЦИАШВИЛИ Гурами Шалвович – доктор физико-математических наук, профессор,
ИПМ ДВО РАН (г. Владивосток). Е-mail: guram@iam.dvo.ru
1/--страниц
Пожаловаться на содержимое документа