close

Вход

Забыли?

вход по аккаунту

?

Модель роботизированной платформы как ординарный полумарковский процесс.

код для вставкиСкачать
Известия ТулГУ. Технические науки. 2016. Вып. 9
УДК 519.216
МОДЕЛЬ РОБОТИЗИРОВАННОЙ ПЛАТФОРМЫ
КАК ОРДИНАРНЫЙ ПОЛУМАРКОВСКИЙ ПРОЦЕСС
К.А. Гришин
Исследуются проблемные вопросы управления группами роботизированных
платформ. Построена полумарковская модель циклограммы управления платформой. Определены вероятности переключения состояний. Рассмотрен полумарковский
процесс с помощью математического ожидания и дисперсии.
Ключевые слова: роботизированные платформы, стохастическая матрица,
модель управления, полумарковский процесс.
Определим вероятностное пространство борелевской тройкой
(Ω, Θ, P ) , включающей множество элементарных событий Ω , носитель Θ
алгебры Θ , формируемый из подмножеств множества Ω , и вероятностную
меру Р.
Множество Ω = {ω1 , ..., ωn , ..., ω N } включает события, каждое из
которых не разлагается на другие события, и поэтому называется элементарным. Из элементов множества Ω могут быть сформированы подмножества, составляющие носитель алгебры ∑ , которые также являются
событиями. На множестве Θ определена сигнатура алгебры, включающая
двуместные операции: объединение, пересечение и одноместную операцию дополнение [1].
При моделировании роботизированных платформ множество элементарных событий может быть представлено как объединение:
{
Ω = Ωt ∪ Ω a ,
}
(1)
где Ω t = ω1t (t ) , ..., ωtj (t ) , ..., ωtJ (t ) - подмножество элементарных событий,
{
}
формирующих временные интервалы; Ω a = ω1a( a ) , ..., ωaj ( a ) , ..., ωaJ ( a ) подмножество элементарных событий, формирующих дискретную величину, называемую состоянием физического объекта.
Под состоянием роботизированной платформы понимается как выполнение оборудованием некоторого действия, причем в этом состоянии
платформа пребывает от начала выполнения действия до его окончания
[2]. При многократном появлении элементарных событий подмножества
Ωt формируется поток временных интервалов, представляющих собой
функцию τ(ωt ) .
70
Информатика, вычислительная техника, обработка и защита информации
{
}
В реальности Ω t = ω1t (t ) , ..., ωtj (t ) , ... , Ωt = ∞ и τ(ωt ) представляет
континуум, а временные интервалы являются случайными непрерывными
величинами. В этом случае для j(t)-го интервала временного потока может
быть определена вероятностная мера:
F j (t ) (t ) = P(ωt : 0 ≤ τ(ωt ) ≤ t ) ,
(2)
Для стационарного потока число временных интервалов, попадающих на любой фиксированный интервал времени, будет распределено по
закону Пуассона:
βm
Pm =
exp(−β) ,
(3)
m!
где β - некоторая положительная величина, называемая параметром закона
Пуассона.
Плотность распределения значений временных интервалов τ (ω t )
для подобного потока определяем в виде:
f (t ) = 1(t )λ exp(−λt ) ,
(4)
Очевидно, что если на временные интервалы τ(ωt ) не накладываются ограничения по ординарности и отсутствию последействия, то они
могут быть распределены по произвольному закону, отличному от (4). При
этом единственным ограничением, накладываемым на плотность распределения произвольного закона, является то, что его область определения
лежит в положительной полуплоскости:
≥ 0, если 0 ≤ t min ≤ t ≤ t max
f (t ) 
,
(5)
 = 0, если t < 0;
На верхний предел области ненулевых значений плотности распределения tmax никаких дополнительных ограничений, кроме (5), не накладывается. Для некоторых физических объектов возможна ситуация, когда
tmax = ∞ .
Функция a (ωa ) от элементарных событий подмножества состояний
{
}
объекта Ω a = ω1a( a ) , ..., ωaj ( a ) , ..., ωaJ ( a ) является дискретной одноместной
и взаимно однозначной:
a j ( a ) ∈ A = α(ωaj ( a ) ) ,
{
где A = a1( a ) , ..., a j ( a ) , ..., a J ( a )
тизированной платформы.
(6)
} - множество физических состояний робо-
{
}
Множеству Ω a = ω1a( a ) , ..., ωaj ( a ) , ..., ωaJ ( a ) ставится в соответствие
мера:
71
Известия ТулГУ. Технические науки. 2016. Вып. 9
[
]
p j ( a ) = P ω a : α (ω a ) = a j ( a ) ,
(7)
Выражение (7) характеризует вероятность пребывания платформы в
одном из состояний множества А для внешнего по отношению к внешнему
наблюдателю. Тот факт, что система может находиться в одном и только в
одном из состояний, накладывает следующее ограничение на вероятности
(7):
J (a )
∑
j ( a )=1( a )
p j (a) = 1 ,
(8)
{
}
Возведение подмножества Ω a = ω1a( a ) , ..., ωaj ( a ) , ..., ωaJ ( a ) во вторую декартову степень дает множество пар элементарных событий.
Двуместная функция σ(ωαj ( a ) , ωα
n( a ) ) = s j ( a ),n( a ) от пары элементар-
ных событий подмножества Ω a определяем через пару одноместных
функций:
[
]
a
a
σ(ωαj ( a ) , ωα
n( a ) ) = s j ( a ),n( a ) = a (ω j ( a ) ), (ωn( a ) ) = a ( a j ( a ) ), ( an( a ) ) , (9)
Назовем кортеж σ(ωαj ( a ) , ωα
n( a ) ) = s j ( a ),n( a ) переключением роботизированной платформы, или переходом платформы из состояния a j (a ) в
состояние an(a ) . Каждой паре одноместных функций [α(ωαj(a)), α(ωαn(a))] и
границе временных интервалов j(t) поставим в соответствии вероятностную меру:
(ωα , ωα )
: α(ωαj ( a ) ) = a j ( a ), j (t ) , α(ωα
) =
j
(
t
)
j
(
a
)
n
(
a
)
n
(
a
)
 , (10)
p j ( a ) n ( a ) j (t ) = P 


= an( a ), j (t )+1

a
где (ωαj ( a ) , ωα
n( a ) ) j (t ) - пара элементарных событий подмножества Ω , определенных на j(t)-й границе j(t)-го и [j(t) + 1]-го временных интервалов;
a j ( a ), j (t ) - состояние системы до переключения; an( a ), j (t ) +1 - состояние
системы после переключения.
Повторяющиеся появления элементарных событий подмножества
a
Ω , формирует последовательность смен состояний роботизированной
платформы в моменты, определяемые элементарными событиями подмножества Ωt [3]. Потребуем, чтобы при переключениях состояний процесса выполнялись следующие допущения.
Вероятности смены состояний (10) не зависят от предыстории процесса:
72
Информатика, вычислительная техника, обработка и защита информации
[
]
α
α
p j ( a ) n( a ) j (t ) = P (ωαj ( a ) , ωα
n ( a ) ) j (t ) : α(ω j ( a ) ) = a j ( a ) , α(ωn ( a ) ) = an ( a ) , (11)
Временные интервалы (2.3) не зависят от предыстории процесса, а
зависят только от функции переключения σ(ωαj ( a ) , ωα
n(a ) ) .
Если для элементарного случайного процесса справедливы эти допущения, то такой процесс будет являться полумарковским.
Полумарковский процесс полностью определяется полумарковской
матрицей h(t ) , представляющей собой прямое (поэлементное) произведение матрицы вероятностей и матрицы плотностей распределения:
h(t ) = h j ( a ),n( a ) t = p ⊗ f (t ) ,
(12)
где p = p j ( a ),n( a )t - стохастическая матрица (она же матрица вероятностей,
она же вложенная цепь Маркова); f = f j ( a ), n( a )t - матрица плотностей распределения; ⊗ - символ, означающий прямое (поэлементное) произведение
матриц.
Из (12) стохастическая матрица и матрица плотностей распределения могут быть получены в соответствии со следующими выражениями:
∞
p = ∫ p(t )dt ,
(13)
0
 h j (a ),n(a ) (t )
f (t ) = 
(14)
,
p
 j (a ),n(a ) 
Полумарковский процесс, кроме стохастической матрицы, может
быть охарактеризован следующие числовыми характеристиками, наиболее
часто используемыми в теории вероятностей:
1) математическими ожиданиями времени пребывания в состояниях
множества А:
∞
[
]
T = ∫ tf (t )dt = T j ( a ),n( a ) ,
(15)
0
2) дисперсиями времени пребывания в состояниях множества А
∞
[
]
D = ∫ t 2 F (t )dt − T ⊗ T = D j ( a ),n( a ) ,
0
{
(16)
}
Множество состояний A = a1( a ) , ..., a j ( a ) , ..., a J ( a ) и множество
S = s : s j (a ),n(a ) = a j (a ) , an(a ) , a j (a ) ∈ A, an(a ) ∈ A, 1(a ) ≤ j (a ), n(a ) ≤ J (a )
{
[
]
}
могут быть представлены в виде ориентированного графа. Граф, в свою
очередь, также задан входной и выходной функцией или матрицей смежности:
r = r j (a ),n(a ) ,
(17)
[
]
73
Известия ТулГУ. Технические науки. 2016. Вып. 9
Уравнения (17) будет иметь два состояния:
1, если p j (a ),n(a ) ≠ 0;
r j (a ),n(a ) = 
0, если p j (a ),n(a ) = 0.
(18)
Под выходной функцией O(α ) состояния α здесь и ниже будет пониматься множество состояний, в которые можно переключиться непосредственно из состояния α. Под входной функцией I (α ) состояния α
здесь и ниже будет пониматься множество состояний, из которых можно
переключиться непосредственно в состояние α [4]. Как матрица смежности, так и пара «входная/выходная функция» определяют структуру графа
состояний полумарковского процесса.
Состояния могут быть перенумерованы произвольным образом. Без
нарушения общности можно считать, что поглощающие состояния имеют
номера с J (a ) − J (e ) + 1 по J (a ) .
Безусловная плотность распределения времени пребывания полумарковского процесса в непоглощающих состояниях a j (a ) до его пере-
[
]
ключения в состояния ai ( a ) ∈ O a j ( a ) определяется зависимостью:
f j ( a ) (t ) =
J (a)
∑
n ( a ) =1( a )
h j ( a ), n( a ) (t ) ,
(19)
Последовательность смены состояний роботизированной платформы, описываемой с помощью полумарковского процесса, для внешнего
наблюдателя может быть представлена как блуждание по полумарковской
цепи (рис. 1). При блужданиях процесс пребывает в состоянии a j (a ) в течение случайного времени, а затем с вероятностью p j ( a ), n( a ) переключается в состояние an(a ) . Элемент h j ( a ), n( a ) (t ) полумарковской матрицы определяет временные и вероятностные характеристики между двумя переключениями. Время, в течение которого процесс пребывает в состоянии
a j (a ) , определено с точностью до условной плотности распределения
f j ( a ), n( a ) (t ) . Состояния, в которые последовательно попадает процесс при
блужданиях, ниже будет называться траекторией блуждания. Очевидно,
что для каждой реализации полумарковского процесса траектория блуждания детерминирована и строго определяется логикой управления
роботизированной платформой. Для внешнего же, по отношению к процессу, наблюдателя каждая конкретная траектория реализации является
случайной.
Начало процесса определим вектором вероятностей:
q = q j (a )
74
(20)
Известия ТулГУ. Технические науки. 2016. Вып. 9
где δ(t ) - δ-функция Дирака.
Таким образом, было определено понятие полумарковского процесса, который используется в качестве инструментария для моделирования
состояний роботизированных платформ, показано, что полумарковские
процессы являются математическим подобием циклограмм управления отдельными узлами и блоками платформ, а состояния полумарковских процессов связаны с выполнением роботизированной платформой определенных действий.
Список литературы
1. Ивутин А.Н., Ларкин Е.В. Обобщенная полумарковская модель
алгоритма управления цифровыми устройствами // Известия Тульского государственного университета. Технические науки. Тула: Изд-во ТулГУ,
2013. Вып. 1. С. 221 – 228.
2. Ивутин А.Н., Ларкин Е.В. Временные и вероятностные характеристики транзакций в цифровых системах управления // Известия Тульского государственного университета. Технические науки. Тула: Изд-во ТулГУ, 2013. Вып. 1. С. 252 – 258.
3. Ларкин Е.В., Ивутин А.Н. Определение временных интервалов в
алгоритмах управления // Известия Томского политехнического университета. Томск: Томский политехнический университет, 2014. Т. 124. №5.
Управление, вычислительная техника и информатика. С. 6 – 12.
4. Larkin E.V., Ivutin A.N. Estimation of Latency in Embedded RealTime Systems // 3-rd Mediterranean Conference on Embedded Computing
(MECO-2014). Budva, Montenegro, 2014. P. 236 – 239.
Гришин Константин Анатольевич, асп., GrishKons92@yandex.ru, Россия, Тула,
Тульский государственный университет
THE MODEL OF THE ROBOTIC PLATFORM AS
AN ORDINARY SEMI-MARKOV PROCESS
K.A. Grishin
The problem questions of control of groups of robotic platforms are investigated. Effectiveness of distribution of functions between control hardware units is evaluated. The
probability of switching conditions is determined .Semi-Markov process with mathematical
expectation and dispersion is considered.
Key words: robotic platform, the stochastic matrix, formalism of control, semiMarkov process.
Grishin Konstantin Anatolyevich, postgraduate, GrishKons92@yandex.ru, Russia,
Tula, Tula, Tula State University
76
Документ
Категория
Без категории
Просмотров
9
Размер файла
262 Кб
Теги
платформы, ординарных, полумарковское, процесс, роботизированной, модель
1/--страниц
Пожаловаться на содержимое документа