close

Вход

Забыли?

вход по аккаунту

?

Методы теории искусственных нейронных сетей в задачах идентификации переходных вероятностей управляемых дискретнозначных марковских моделей..pdf

код для вставкиСкачать
НАУЧНЫЙ ВЕСТНИК МГТУ ГА
сер. Радиофизика и радиотехника
2005
№ 96
УДК 629.735
Методы теории искусственных нейронных сетей в задачах
идентификации переходных вероятностей управляемых
дискретнозначных марковских моделей
Д. М. НЕНАДОВИЧ
Статья представлена доктором технических наук, профессором Шахтариным Б.И.
В статье представлен алгоритм идентификации элементов матрицы одношаговых переходных вероятностей
управляемой дискретнозначной марковской модели процесса функционирования телекоммуникационной сети на
основе методов теории искусственных нейронных сетей, приводится пример реализации алгоритма.
Моделирование сложных информационных систем, в частности, современных телекоммуникационных систем (ТКС), которые в большинстве случаев можно классифицировать как
мультисервисные и гетерогенные, приводит к необходимости унификации математического
описания процессов их функционирования.
Проблема унификации может быть решена на основе моделирования процессов функционирования ТКС “разрывными” управляемыми марковскими процессами (управляемыми цепями
Маркова (УЦМ)) изменения состояний системы (или характеризующих ее параметров). Основной сложностью реализации математического представления УЦМ в системах управления ТКС
в виде стохастических разностных уравнений является неопределенность значений элементов
матрицы одношаговых переходных вероятностей (ОПВ) [1]. Одним из подходов к решению
задачи идентификации значений вероятностей перехода ТКС из состояния в состояние является
подход, основанный на использовании методов искусственных нейронных сетей, в частности, с
использованием экстраполирующих нейронных сетей (ЭНС) [2-7].
Рассмотрим алгоритм функционирования ЭНС для идентификации значений вероятностей
перехода параметра системы (определяющего состояние ТКС) из состояния в состояние. Разработанный алгоритм идентификации предназначен для определения значений элементов матрицы ОПВ параметров состояния ТКС в условиях нестохастической неопределенности – недостоверности (недостатка, неполноты, противоречивости) информации. Алгоритм представлен в
виде блок-схемы на рис. 1.
На вход такой ЭНС поступает C(k ) =  y1i (k ), y 2i (k ), y3i (k )  - входной образ ЭНС, характеризующий множество состояний, в которое может перейти параметр ТКС из данного состояния.
Например, для первой строки ОПВ и трех возможных состояний, входной образ для идентифи
кации вероятности р11(k) имеет вид: C(k ) = [1, 0, 0] .
Предположим, пользователь определил, что в данный момент времени, на k-м шаге, управленческие воздействия подобраны таким образом, что повышают, для некоторого i-го параметра ТКС, вероятность того, что находясь в состоянии 1 данный параметр останется в этом состоянии, а характер изменения значений других вероятностей, находящихся в этой же строке
ОПВ – неопределенный (неточный, противоречивый). В целях получения обоснованных значений вероятности перехода параметра ТКС из состояния в состояние, необходимо идентифицировать недостающие значения элементов данной строки ОПВ.
Функционирование ЭНС осуществляется следующим образом [2-7]:
Д.М. Ненадович
46
6
Начало
1
Ввод исходных
данных:
7
Суммирование значений
весовых коэффициентов
3 BΣf = ∑ Bi ( f ([ bi ]))
С( k ); || W (k ) ||
2
Активизация входного
слоя ЭНС
i =1
8
a i (0) = c i , ∀i =1,3
Смещение (сдвиг)
весовых коэффициентов
корреляционной связи
f ([ bi + w Σmax
ij ]), ∀i = 1,3
3
Начальная инициализация
нейронов второго слоя ЭНС
a , i ∈ [1,...,3]
bi (0) =  i
0, i ∉ [1,...,3]
4
9
Вычисление
идентифицированных значений
вероятностей перехода
Приведение нейронов вх.
слоя к состоянию нейронов
второго слоя
pi1 ( k ); pi 2 (k ); pi 3 (k )
a i (k ′) = bi (k ′), ∀i = 1,3
10
5 Вычисление новых состоя-
ний нейронов втор-го слоя
Вычислить
вероятности для
других строк ОПВ ?
нет
∀i = ∀(i + 1) ∈1,3
3
bi (k ′ + 1) = f ( ∑ bi ( k ′) w ij ( k ))
j =1
да
нет
6
ЭНС стабилизировалась?
bi (k ′) = bi ( k ′ + 1),
∀i ∈1,3
11
Вывод результатов:
идентифицированные
значения переходных
вероятностей
да
7
Конец
Рис.1. Блок-схема нейросетевого алгоритма идентификации значений вероятностей перехода параметра ТКС из
состояния в состояние
1. Активизация входного слоя Sа ЭНС входным образом C(k ) = [ c1 (k ), c 2 (k ), c3 (k )] (блок 2
алгоритма на рис. 1), т.е. приведение нейронов входного слоя в начальные состояния
аi(0) = сi , ∀i = 1, 3 ,
причем нулевой (стартовый) такт экстраполяции ЭНС в выражении для матрицы весов [1]:
0 1 -1
||W1 (k )|| = 1 0 -1 ,
1 1 0 
(1)
(2)
а также последующие такты осуществляются в рамках k-го шага функционирования ТКС и обозначаются k ′ = 0,1, 2,…;
2. Начальная инициализация (блок 3 алгоритма) нейронов слоя Sb в соответствии с выражением:
a i , i ∈ [1,...,3];
(3)
bi (0) = 
 0 , i ∉ [1,..., 3].
3. Приведение нейронов входного слоя ЭНС на данном k ′ -м такте к состоянию нейронов
второго (Sb) слоя (блок 4 алгоритма на рис. 5):
a i (k ′) = bi (k ′) , ∀i = 1, 3 .
(4)
4. Вычисление новых состояний нейронов второго слоя (блок 5 алгоритма) для всех
Методы теории искусственных нейронных сетей в задачах …
47
i ∈ [1,..., 3] по формуле:
3
bi (k ′ + 1) = f (∑ bi (k ′) w ij (k )) ,
∀i = 1, 3 ,
(5)
j =1
где f ( x) - ступенчатая функция активации.
5. Повторение шагов 3-4 до тех пор, пока ЭНС на каком либо k ′ -м такте не достигнет стабильного состояния (блок 6 алгоритма на рис. 1). Проверка достигла либо не достигла ЭНС стабильного состояния, осуществляется в (базовом процессорном элементе (БПЭ) [1] Sс, путем
сравнения состояний нейронов второго слоя Sb на предшествующем k ′ -м и очередном (k ′ + 1) -м
такте
=
bi(k’) bi(k’+1), ∀i = 1, 3 .
(6)
≠
6. По сигналу с выхода БПЭ Sс, имеющему место в случае достижения ЭНС стабильного
состояния, в БПЭ Sd осуществляется суммирование значений весовых коэффициентов, полученных в рамках вычисления состояний нейронов второго слоя Sb и соответствующих выходным сигналам слоя Sb в момент достижения ЭНС стабильного состояния
3 (7)
BΣf = ∑ Bi ( f ([bi ])) .
i =1
7. Элементы данного суммарного вектора характеризуют полученные в ходе идентификации весовые коэффициенты корреляционной связи значений вероятностей переходов для одной
i-й строки ОПВ. Данный вектор может содержать как положительные, так и отрицательные
числа, поэтому, чтобы избавиться от отрицательных значений весов, но сохранить их пропорциональную зависимость, в базовый процессорный элемент БПЭ Sе для всех элементов вектора
(7) вводится единый положительный коэффициент смещения (сдвига), численно равный максимально возможному значению суммарного веса концепт в итоговой матрице весов
К см = w Σmax
(8)
ij = N э × N сост ,
где N э - количество экспертов, привлекаемых к решению задачи, а N сост - число возможных
состояний неточно (противоречиво) заданного параметра ТКС. При этом выражение для операции смещения (сдвига) имеет вид
max
max
BΣf см = f ([b1 + w Σmax
(9)
ij ; b 2 + w Σ ij ; b 3 + w Σ ij ]) .
8. Вычисление идентифицированных значений вероятностей перехода параметра ТКС из
первого состояния во второе, третье и вероятности остаться в первом состоянии. Данная процедура реализуется в БПЭ Sе и осуществляется на основе квадратичной метрики, применяемой к
смещенным значениям суммарных весовых коэффициентов корреляционной связи вероятностей переходов (9) в соответствии с выражениями

b1 + w Σmax
ij

p11 (k ) =
max
2
max
2
 (b1 + w Σ ij ) + (b 2 + w Σ ij ) 2 + (b3 + w max
Σ ij )

2
(b1 + w Σmax
ij )
=
2
max 2
max 2
(b1 + w max
Σ ij ) + (b 2 + w Σ ij ) + (b 3 + w Σ ij )
2

 =


(10)
Д.М. Ненадович
48

b 2 + w Σmax
ij

p12 (k ) =
max
2
max
2
 (b1 + w Σ ij ) + (b 2 + w Σ ij ) 2 + (b3 + w Σmax
ij )

2
(b 2 + w Σmax
ij )
=
2
max 2
max 2
(b1 + w Σmax
ij ) + (b 2 + w Σ ij ) + (b 3 + w Σ ij )
2

 =



b3 + w Σmax
ij
p13 (k ) = 
2
max 2
max 2
 (b1 + w Σmax
ij ) + (b 2 + w Σ ij ) + (b 3 + w Σ ij )

2
(b3 + w Σmax
ij )
=
2
max 2
max 2
(b1 + w Σmax
ij ) + (b 2 + w Σ ij ) + (b 3 + w Σ ij )
(11)
2

 =


(12)
9. Повторение шагов 1-8 до тех пор, пока не будут идентифицированы элементы во всех остальных i-х строках ОПВ (блок 10 алгоритма на рис. 1).
Рассмотрим алгоритм функционирования данной ЭНС на примере итоговой когнитивной
карты [1], характеризуемой итоговой матрицей ||W(k)|| весов. Допустим, данные когнитивная
карта и матрица весов характеризуют корреляционные зависимости значений переходных вероятностей, расположенные в первой строке ОПВ, а задачей ЭНС является идентификация этих
значений. В этом случае на вход ЭНС подается последовательно три входных образа, начиная с
C(k ) = 1, 0, 0 , характеризующего необходимость прогноза изменений корреляционных зави-
симостей между вероятностями р12(k) и р13(k) в случае роста значений вероятности р11(k).
В соответствии с алгоритмом, выходной вектор второго слоя (Sb) на каждом k ′ -м такте ра
боты ЭНС B(k ′) = [ b1 (k ′), b 2 (k ′), b3 (k ′)] последовательно принимает ряд значений состояний,
которые определяются на основе выражения (4) и элементы этого вектора, для рассматриваемого примера, на каждом k ′ -м такте работы ЭНС будут равны:
B1 (1) = f ([0, 3, − 2]) = [1, 1, − 1];
B1 (2) = f ([1, 0, − 3]) = [1, 0, − 1];
(13)
B1 (3) = f ([−2, 0, − 2]) = [1, 0, − 1];
B1 (4) = f ([−2, 0, − 2]) = [1, 0, − 1].
Нетрудно видеть, что ЭНС достигла стабильного состояния на четвертом такте. Аналогичным образом получаем выходные вектора второго слоя (Sb) ЭНС для входных образов
C(k ) = 0, 1, 0 и C(k ) = 0, 0, 1 . Данные входные образы характеризуют соответственно необходимость прогноза изменений корреляционных зависимостей между вероятностями р11(k) и
р13(k) в случае роста значений вероятности р12(k) и необходимость прогноза изменений корреляционных зависимостей между вероятностями р11(k) и р12(k) в случае роста значений вероятности р13(k). Выходные вектора второго слоя (Sb) ЭНС для этих входных образов соответственно равны:
B2 (1) = f ([3, 0, − 1]) = [1, 1, − 1];
B2 (2) = f ([1, 0, − 3]) = [1, 1, − 1];
(14)
B2 (3) = f ([1, 0, − 3]) = [1, 1, − 1];
Методы теории искусственных нейронных сетей в задачах …
49
B3 (1) = f ([2, 3, 0]) = [1, 1, 1];
B3 (2) = f ([5, 6, − 3]) = [1, 1, 1];
(15)
B3 (3) = f ([5, 6, − 3]) = [1, 1, − 1].
Полученные результаты характеризуют промежуточные и финальные зависимости веса
концепт (переходных вероятностей), т.е. характеризуют суммарную предпочтительность (с точки зрения экспертов) преобладания (доминирования) значений одной вероятности по отношению к другой, а итоговые функции весов могут быть представлены графически в виде пошаговых ленточных диаграмм, как показано на рис. 2.
f(b1)
6
4
f(b2)
f(b3)
6
0
4
-1
3-1
f3-12
2-1
f1-1
1-1
3-2 -2
f3-2
2-2
1-2
f1-2
-3
2
0
-2
1
2
3
4
k’
0
1
2
а
3
4
k’
3-3
f3-3
2-3
f1-3
1-3
1
б
2
3
4
k’
с
Рис.2. Графики зависимости функций весов концепт от такта вычисления ( k ′) новых состояний нейронов второго слоя ЭНС: а - функции весов значений вероятностей перехода из любого состояния в первое; b - функции
весов значений вероятностей перехода из любого состояния во второе состояние; c - функции весов значений
вероятностей перехода из любого состояния в третье состояние
Полученные функции весов значений вероятностей перехода из состояния в состояние
суммируются в соответствии с (7) и на выходе БПЭ Sd (или блока 7 алгоритма) имеем суммарный вектор весовых коэффициентов
B1Σ f = ([4, 6, − 8]),
(16)
характеризующий полученные в ходе идентификации весовые коэффициенты корреляционной
связи значений вероятностей переходов для одной первой строки ОПВ. С учетом того, что для
данного примера К см = w Σmax
ij = 12 , в соответствии с (13) получим вектор суммарных весовых
коэффициентов со смещением (сдвигом)
B1Σ f см = ([16, 18, 4]),
(17)
что позволяет избавиться от отрицательных значений весов, но сохранить их пропорциональную зависимость.
В итоге, на выходе БПЭ Sе (или блока 9 нейросетевого алгоритма), реализующего выражения (10-12), получим идентифицированные значения вероятностей перехода неточно (противоречиво) заданного параметра ТКС из первого состояния во второе, в третье и вероятности остаться в первом состоянии, т.е. элементы первой строки матрицы ОПВ ϕ yi :
p11 (k ) =
p12 (k ) =
p13 (k ) =
2
(b1 + w Σmax
ij )
2
max 2
max 2
(b1 + w max
Σ ij ) + (b 2 + w Σ ij ) + (b 3 + w Σ ij )
2
(b 2 + w Σmax
ij )
2
max 2
max 2
(b1 + w Σmax
ij ) + (b 2 + w Σ ij ) + (b 3 + w Σ ij )
2
(b3 + w max
Σ ij )
2
max 2
max 2
(b1 + w Σmax
ij ) + (b 2 + w Σ ij ) + (b 3 + w Σ ij )
=
162
= 0, 42953 ;
16 2 + 182 + 42
=
182
= 0,54362 ;
16 2 + 182 + 42
=
42
= 0, 02684 .
16 2 + 182 + 42
Д.М. Ненадович
50
Аналогичным образом могут быть получены остальные идентифицированные значения вероятностей перехода неточно (противоречиво) заданного параметра ТКС, т.е. элементы второй
и третьей строк матрицы ОПВ ϕ yi .
Таким образом, сформулирован подход к моделированию процесса функционирования
ТКС в условиях, когда элементы матрицы ОПВ могут быть заданы недостоверно (неточно, неполно и противоречиво). Показано, что на основе использования математически корректного
нейросетевого алгоритма могут быть получены количественные значения элементов матрицы
ОПВ – одной из ключевых составляющих стохастических разностных уравнений, представляющих собой математическую модель процесса функционирования ТКС. Использование
предложенного нейросетевого алгоритма позволяет наиболее полно учесть неопределенности
нестохастического характера (неточность, неполноту и противоречивость), присущие исходным
данным. Это позволяет реализовать в рамках так называемого параллельного подхода процедуру оптимизации управляющих воздействий на ТКС, повысить степени объективности принимаемых информационных решений при управлении структурой, параметрами и режимами работы сетей такого класса.
ЛИТЕРАТУРА
1.Ненадович Д.М. Постановка задачи идентификации переходных вероятностей управляемых дискретнозначных марковских моделей методами теории искусственных нейронных сетей //Статья в настоящем Научном
Вестнике.
2.Щербаков М.А. Искусственные нейронные сети. Пенза: ПГТУ, 1996.
3.Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика. М.: Мир, 1992.
4.Kosko B. Fuzzy cognitive maps. // International Journal of Man-Machine Studies, V. 24, 1986.
5.Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линияТелеком, 2002.
6.Паращук И.Б. Особенности и содержание этапов разработки интеллектуальных систем анализа эффективности телекоммуникационных сетей. // Петербургский журнал электроники, № 1, 1999.
D.M. Nenadovich
Methods of artificial neuron nets theory in the problems of identification of transition probabilities of controlled discrete Markov models
In paper, an identification algorithm of one-step transition probabilities matrix elements of controlled discrete Markov
model of telecommunication system operation is presented on base of artificial neuron nets theory methods. There is given
an example of algorithm realization.
Сведения об авторе
Ненадович Дмитрий Михайлович, 1961 г.р., окончил Ленинградское высшее военное инженерное училище
связи им. Ленсовета (1984), Военную академию связи (1995), кандидат технических наук, эксперт Главного технического управления Банка России, автор более 40 научных работ, область научных интересов – системы управления телекоммуникационными сетями.
1/--страниц
Пожаловаться на содержимое документа