close

Вход

Забыли?

вход по аккаунту

?

Риски и исходы в одной многокритериальной динамической задаче.

код для вставкиСкачать
Известия Института математики и информатики. Иевск. 2004. Є2(30)
УДК 519.816.4:517.977.54
В. И. Жуковский, К. С. Сорокин
molostvisa.a.ru, kostya-homemail.ru
РИСКИ И ИСХОДЫ В ОДНОЙ
МНОГОКРИТЕРИАЛЬНОЙ
ДИНАМИЧЕСКОЙ ЗАДАЧЕ
Ключевые слова:
Abstrat.
1
риски, критерии, стратегии, оптимум по ?арето
Guaranteed deision with respet to outome and risks of
multi-riteria linear-quadrati dynami problem under unertainty
is being formalized and expliit solution is being found
Введение
ны
Современным моделям экономической динамики свойствен-
наличие нескольких критериев, оценивающих качество функционирования управляемой экономической системы (увеличение
прибыли, сниение себестоимости, расходов и т. д.);
подверенность воздействию неопределенных факторов, о
которых отсутствуют статистические характеристики (неоиданное появление конкурента на рынке сбыта, непредсказуемые
скачки цен, срыв или изменение номенклатуры поставок);
изменение управляемой системы с течением времени;
требование экономистов об оптимальном сочетании исходов
(значений критериев) и рисков.
1
Работа поддерана грантом РФФИ (02-01-00612).
53
Эти модели исследуются в рамках теории многокритериальных динамических задач при неопределенности. ?ервой работой этого направления явилась монография [1?. Для учета єдействия неопределенности в ней применялась подходящая модификация принципа максиминной полезности [2?. Однако такой
подход рассчитан на єкатастрофу - на реализацию єсамой неблагоприятной неопределенности. Избеать такого пессимистического подхода удается за счет применения подходяще модифицированного принципа минимаксного соаления [3?. Кроме того,
он позволяет осуществить требование [4. С. 21? экономистов об
оптимальном сочетании исходов и рисков.
В данной работе впервые предпринята попытка формализации гарантированного решения с учетом исходов и рисков (на
основе объединения принципа Севида [3? с векторным оптимумом из [1?). ?олучен явный вид такого решения для многокритериальной динамической линейно-квадратичной задачи при неопределенности.
1.
?остановка задачи
Многокритериальной динамической линейно-квадратичной
задачей при неопределенности назовем упорядоченный набор
объектов
h, U, Z, J (U, Z, t , x )i.
(1.1)
Здесь управляемая динамическая система описывается
линейным векторным дифференциальным уравнением
0
0
x_ = Ax + u + A1 z + a(t), x(t0 ) = x0 ,
(1.2)
где фазовый вектор x ? Rn , управляющее воздействие Л?Р (лица, принимающего решения) u ? Rn , неопределенный фактор
z ? Rk , постоянные матрицы A, A соответствующих размерностей и непрерывная n-вектор функция a(t) заданы априори;
1
54
фиксированы момент ? > 0 окончания процесса управления и
начальная позиция (t , x ) ? [0, ?) ╫ ╫Rn . Мноество U позиционных стратегий
U = {U ў u(t, x) | u(t, x) = P (t)x + p(t),
(1.3)
?P (╖) ? Cn╫n [0, ??, p(╖) ? Cn [0, ??},
то есть стратегии U у Л?Р отодествляются с функциями вида
u(t, x) = P (t)x + p(t),
где матрицы P(t) и p(t) непрерывны на [0, ?? . Мноество Zt
программных неопределенностей Zt
Zt = {Zt ў z [t? | z_ [t? = Bz [t? + b(t)?z [t ? ? Rk },
(1.4)
то есть мноество Zt образуют непрерывные на [0, ?? решения
z [t? дифференциального уравнения из (1.4), где B - постоянная
k ╫ k матрица, b(╖) ? Ck [0, ?? и неопределенностью фактически
становится начальное условие z[t ? ; такая неопределенность появляется в задачах прогнозирования в связи с моделью Эванса
установления равновесной цены [5. C. 197? и учетом непредсказуемых скачков цен на рынке сбыта до момента t . Будем дальше использовать и мноество позиционных неопределенностей
Z (аналогичное U ) :
Z = {Z ў z (t, x)|z (t, x) = Q(t)x + q (t),
(1.5)
?Q(╖) ? Cn╫n [0, ??, q (╖) ? Cn [0, ??},
а таке мноество Uz контрстратегий
0
0
0
0
0
= {Uz ў u(t, x, z[t?)|u(t, x, z[t?) = P (t)x + p(t)},
(1.6)
то есть контрстратегия Uz отодествляется с функцией
u(t, x, z ) такой, что при z = z [t? (?Zt ў z [╖?, Zt ? Zt ) функция
u(t, x, z [t?) = P (t)x + p(t)
Uz
55
при некоторых P (╖) ? Cn╫n[0, ??, p(╖) ? Cn[0, ?? . Заметим, что
пара Uz , Zt будет использована при построении функции риска, а U, Z - при построении гарантированного решения задачи
(1.1). ?роцесс принятия решения в задаче (1.1) происходит следующим образом: Л?Р выбирает и использует какую-либо стратегию U ў u(t, x) = P (t)x + p(t), U ? U . Независимо от такого
выбора в задаче (1.1) реализуется конкретная неопределенность
Z ў z(t, x) = Q(t, x)x + q(t) из мноества Z . Затем строится
решение x(t), t ? [t , ?? системы линейных неоднородных дифференциальных уравнений с непрерывными коэффициентами:
x_ = Ax + u(t, x) + A z (t, x) + a(t) =
(1.7)
= [A + P (t) + A Q(t)?x + [p(t) + A q(t) + a(t)?,
x(t ) = x .
Такая система имеет [6. С. 29? единственное непрерывное решение x(t), продолимое на интервале [t , ?? . С помощью x(t) находятся указанная стратегия u[t? = P (t)x(t) + p(t) и позиционная
неопределенность z[t? = Q(t)x(t) + q(t) . Отметим, что векторфункции u[t? и z[t? будут непрерывны на [t , ??. Наконец, на всех
возмоных тройках (x(t), u[t?, z[t?|t ? [t , ??) определен векторный критерий
J (U, Z, t , x ) = (J (U, Z, t , x ), ..., Jn (U, Z, t , x )),
(1.8)
компоненты которого заданы линейно-квадратичными функционалами (i ? N = {1, . . . , N })
0
1
1
1
0
0
0
0
0
0
0
1
0
0
0
0
Ji (U, Z, t0 , x0 ) = x? (?)Ci x(?) + 2ci x(?)+
Z ?
+ {u?[t?[Di u[t? + 2Ki z[t? + 2Mi x(t) + 2di ?+
t0
(1.9)
+z? [t?[Liz[t? + 2Ni x(t) + 2li ? + x? (t)[Gi x(t) + gi?}dt,
где использованы заданные априори постоянные n ╫ n матрицы Ci , Di , Mi, Gi ; n ╫ k матрицы Ki , Ni; k ╫ k матрицы Li;
56
n-векторы ci , di , gi ; k-векторы li , причем Ci, Di , Li, Gi симметричны и штрих сверху означает операцию транспонирования.
На єсодерательном уровне цель Л?Р состоит в выборе такой
своей стратегии U ? U , чтобы все критерии
Ji (U, Z, t , x ), i ? N , принимали возмоно большие значения и
одновременно риски по кадому критерию становились как моно меньше. ?ри этом Л?Р вынуден учитывать возмоность
реализации любой неопределенности Z ? Z .
Заметим, что процесс принятия решения в задаче (1.1), где U
заменено на Uz , а Z - на Zt , происходит аналогично, описанным
выше способом.
В настоящей работе
во-первых, будет найден явный вид функции риска по кадому из критериев,
во-вторых, формализовано гарантированное по исходам и
рискам решение задачи (1.1),
в-третьих, будет построен явный вид такого решения.
Математическим аппаратом будут подходящие варианты метода динамического программирования. Существенную роль при
этом играет объединение метода динамического программирования с методом функции Ляпунова, предлоенное Н. Н. Красовским для решения задач стабилизации. В целях сокращения объема статьи мы не будем приводить подробные доказательства
(они имеются в подготовленной к изданию монографии ).
0
2.
0
?остроение функции риска
Кадому критерию Ji (U, Z, t , x ), i ? N , поставим в соответствие однокритериальную задачу
h, Uz , Zt , Ji (Uz , Zt , t , x )i,
(2.1)
где та е, что и в (1.1), мноество контрстратегий Uz определено в (1.6), мноество неопределенностей Zt - в (1.4), критерии
Ji (Uz , Zt , t , x ) - в (1.8), где вместо U применяется Uz , а Z
заменено на Zt .
0
0
0
0
0
57
0
Для построения функции риска по i-му критерию (1.8) следует,
во-первых, решить оптимизационную задачу
Ji (Uz , Zt , t , x ) = Ji (Uzi , Zt , t , x ) = Ji [Zt , t , x ?
max
(2.2)
?U
0
U
( )
0
0
0
0
0
при любых Zt ? Zt и начальных позициях (t , x ) ? [0, ?) ╫ Rn ;
во-вторых, саму функцию риска построить по формуле
i(U, Z, t , x ) = Ji[Z, t , x ? ? Ji (U, Z, t , x ).
(2.3)
Заметим, что функционал (2.3) численно оценивает соаление (риск) Л?Р о том, что при неопределенности Zt он выбирает (исходя из наличия N различных критериев) стратегию U ,
а не Uzi , удовлетворяющую условию (2.2). Далее для матрицы
D < 0(6 0, > 0, > 0) означает, что квадратичная форма u? Du
определенно отрицательна (неполоительна, определенно полоительна, неотрицательна). С помощью следующего утвердения решаем задачу (2.2).
У т в е р д е н и е 2.1. Если в функционале (1.8)
Di < 0, Ci 6 0, Gi ? Mi? Di? Mi 6 0,
(2.4)
0
0
0
0
0
0
0
0
( )
1
то контрстратегия
Zt
(i)
Uz , удовлетворяющая
? Zt и (t0 , x0 ) ? [0, ?) ╫ Rn ), имеет вид
(2.2)
(при любых
Uzi ў u i (t, x, z) =
= ?Di? [(i (t) + Mi )x + (?i(t) + Ki)z + (?i(t) + di ), (2.5)
матрицы i (t), i (t) и вектор ?i (t) являются решениями
( )
( )
1
где
системы
0n╫n = _ i + i[A ? Di? Mi ? + [A? ? Mi?Di? ?i?
?i Di? i + Gi ? Mi? Di? Mi , i (?) = Ci ;
1
1
1
1
58
(2.6)
0n╫k = _i + i[A ? Di? (i + Mi)? + B ?i + Ni?
?Ki? Di? (i + Mi ), i (?) = 0n╫k ;
(2.7)
?
?
?
_
0n = ?i + [A ? (i + Mi )Di ??i + gi?
?(i + Mi? )Di? di + i a(t) + ?i (t)b(t), ?i (?) = ci ,
(2.8)
где 0n╫n - нулевая n ╫ n матрица, а 0n - нулевой n-вектор.
З а м е ч а н и е 2.1. ?ри выполнении (2.4) матричное
дифференциальное уравнение типа Риккати (2.6) имеет непрерывное и продолимое на [0, ?? решение i(t) . ?олоив i =
i(t) в (2.7), получим матричное дифференциальное линейное
неоднородное уравнение с непрерывными (по t) коэффициентами. ?оэтому оно тое имеет продолимое на [0, ?? решение
i(t) . Наконец, векторное уравнение (2.8) при i = i(t) и
i = i(t) по той е причине имеет непрерывное и продолимое
на [0, ?? решение ?i(t) . Указанные решения и следует использовать в (2.5).
У т в е р д е н и е 2.2. Если при всех i ? N выполняются ограничения (2.4), то компоненты i (U, Z, t , x ),
1
1
1
1
0
0
i ? N , векторной функции риска
(U, Z, t , x ) = ( (U, Z, t , x ), ..., n (U, Z, t , x ))
0
имеют вид
0
1
Z
0
?
0
0
0
(2.9)
i(U, Z, t , x ) = {z? [t?[i (t)Di? ?i(t) ? Ki?Di? Ki?z[t? +
t0
?
+x (t)[i (t)Di? i(t) ? Mi? Di? Mi?x(t) +
+2x? (t)[i(t)Di? ?i(t) ? Mi? Di? Ki?z[t? ?
(2.10)
?u? [t?[Di u[t? + 2Ki z [t? + 2Mi x(t) + 2di ? +
+2[?i? (t)Di? i(t) ? d?i Di? Mi?x(t) +
+2[?i? (t)Di? ?i(t) ? d?i Di? Ki?z[t? +
+[?i? (t)Di? ?i(t) ? d?i Di? di?}dt,
где i (t), i (t), xii (t) - решения (2.6)-(2.8).
0
0
1
1
1
1
1
1
1
1
1
1
1
1
59
3.
Формализация гарантированного решения задачи
Задаче (1.1) поставим в соответствие єрасширенную вспомогательную задачу:
h, U, Z, J (U, Z, t , x ), ?i (U, Z, t , x )i =
(3.1)
= h, U, Z, {Ij (U, Z, t , x )}j ,..., N i,
где h, U, Zi те е, что в (1.1), а определено в (2.9), (2.10);
в(3.1) обозначено Ii = Ji , IN i = ?i, i ? N . Естественно, при
этом предполагаем выполненным требование (2.4).
О п р е д е л е н и е 3.1. Тройку
(U? , J ? [t , x ?, ? [t , x ?) ? U ╫ R N
назовем гарантированным по исходам и рискам решением задачи (1.1), если существует неопределенность Z ? ? Z такая, что
для i-й компоненты N-векторов J ?[t , x ? и ?[t , x ? выполнены
равенства
Ji? [t , x ? = Ji (U? , Z? , t , x ),
(3.2)
?i [t , x ? = i(U? , Z?, t , x ), i ? N
при любом выборе начальной позиции (t , x ) ? [0, ?) ╫ Rn и,
кроме того,
1) для всех U ? U несовместна система неравенств
Ij (U, Z? , t , x ) > Ij (U? , Z? , t , x ), j = 1, ..., 2N ,
(3.3)
из которых, по крайней мере, одно строгое.
2) при кадом Z ? Z несовместна система неравенств
Ij (U? , Z, t , x ) 6 Ij (U? , Z? , t , x ), j = 1, ..., 2N ,
(3.4)
из которых, по крайней мере, одно строгое. Тогда N-вектор
J ? [t , x ? назовем гарантированным векторным исходом,
N-вектор ?[t , x ? - гарантированным векторным риском задачи (1.1) с начальной позицией (t , x ) , а пару U?, Z? - седловой
точкой по ?арето задачи (3.1)
0
0
0
0
0
0
0
=1
0
2
+
0
0
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
60
0
0
0
З а м е ч а н и е 3.1. Выполнение требования 1) из определения (3.1) означает, что стратегия U? максимальна по ?арето в задаче 3.1, где фиксирована неопределенность Z = Z? , а
условие 2) - минимальность по ?арето неопределенности Z? в
задаче (3.1), где єзамороена уе стратегия U = U? .
З а м е ч а н и е 3.2. Согласно определению (3.1) для
построения (U? , J ? [t , x ?, ? [t , x ?) ? U ╫ R N достаточно найти
седловую точку по ?арето (U? , Z? ) єрасширенной задачи (3.1),
а затем уе воспользоваться формулами (3.2).
0
4.
0
0
2
0
Находение седловой точки по ?арето
Для вектора ? = (? , ? ) = (? , ..., ? N , ? , ..., ? N ) с
полоительными постоянными компонентами введем обозначения:
X
X
D(?) =
[?i + ?i ?Di , M (?) = [?i + ?i ?Mi,
(1)
(1)
K (?) =
L(?, t) =
G(?, t)
=
N (?, t) =
l(?, t) =
g(?, t)
r (?
(2)
=
, t) =
i?N
X
i?N
X
i?N
[?i
X
i?N
[?i
X
i?N
(1)
[?i
X
i?N
(1)
[?i
X
i?N
(1)
(1)
[?i
X
(1)
(
1
(2)
(2)
(1)
2
d(?) =
[?i + ?i ?di ,
(1)
(2)
i?N
(
Gi + ?i
(Mi?Di? Mi ? i(t)Di? i(t))?,
Ni + ?i
(Ki?Di? Mi ? i(t)Di? i(t))?,
(2)
(2)
Ki? Di?1 Ki
? i (t)Di?1 ?i (t))?,
1
1
1
1
li + ?i
(Ki? Di? di ? i(t)Di? ?i(t))?,
gi + ?i
(Mi? Di? di ? i(t)Di? ?i(t))?,
(2)
(2)
)
(2)
Li + ?i
(2)
(
2
i?N
X
1
1
1
1
[?i (d?i Di? di ? ?i(t)Di? ?i(t))?,
(2)
)
(1)
[?i + ?i ?Ki ,
(1)
(1)
1
(2)
1
1
i?N
61
(4.1)
C (?(1) ) =
X
?i Ci , c(?(1) ) =
(1)
i?N
X
(1)
?i ci ,
i?N
где матрицы i(t), i(t) , и вектор ?i(t) являются решениями
системы (2.6)-(2.8). Напомним, что при выполнении (2.4) такое
решение существует, единственно, непрерывно и продолимо на
[0, ?? .
У т в е р д е н и е 4.1. ?редполоим, что
1) для функционалов (1.8) выполнены условия (2.4) при всех
i?N;
2) существует постоянный 2N-вектор
? = (?1 , ..., ?1 , ?2 , ..., ?2
(1)
(N )
(1)
(N )
)
с полоительными компонентами, при котором для всех
t ? [0, ??
L(?, t) > 0, D ?1 (?) + A1 L?1 (?, t)A?1 < 0, K (?) = 0n╫n ,
(4.2)
G(?, t) ? M ? (?)D ?1 (?)M (?) ? N ? (?, t)L?1 (?, t)N (?, t) 6 0.
Тогда седловая точка по ?арето
ет и имеет вид:
U? , Z?
задачи
(3.1)
существу-
U? ў u? (t, x) = ?D? (?){[(t) + M (?)?x + [?(t) + d(?)?}, (4.3)
1
Z? ў z?(t, x) = ?L? (?, t){[A? (t) + N (?, t)?x + [A ?(t) + l(?, t)?},
1
1
1
D(?), C (?), M (?), L(?, t), N (?, t), G(?, t) и вектора
d(?) , c(?), l(?, t) определены в (4.1), а симметричная n ╫ n матрица и n-вектор ? (t), t ? [0, ??, являются решением систегде матрицы
мы:
0n╫n = _ + [A ? A L? (?, t)N (?, t) ? D? (?)M (?)? +
+[A? ? N ?(?, t)L? (?, t)A? ? M ? (?)D? (?)? ?
?[A L? (?, t)A? + D ? (?)? +
+[G(?, t) ? M ? (?)D? (?)M (?) ? N ? (?, t)L? (?, t)N (?, t)?,
1
1
1
1
1
1
1
1
1
1
1
1
62
(?) = C (? );
(4.4)
(1)
0n = ?_ + {A? ? [ + M ?(?)?D? (?) ?
?[A + N ? (?, t)?L? (?, t)A? ?? + a(t) ?
?[ + M ? (?)?D ? (?)d(?) + g(?, t) ?
(4.5)
?[A + N ? (?, t)?L? (?, t)l(?, t)
? (?) = c(? ).
З а м е ч а н и е 4.1. ?ри выполнении ограничений
(4.2) матричное дифференциальное уравнение (4.4) имеет единственное непрерывное решение (t) , продолимое на [0, ?? . ?олоив в (4.5) матрицу = (t) , получаем, что и (4.5) единственное непрерывное продолимое на [0, ?? решение ?(t) .
З а м е ч а н и е 4.2. ?риведенные в работе утвердения позволяют предлоить следующую схему построения гарантированного по исходам и рискам решения задачи (1.1):
a) проверить выполнение ограничений (2.4) и затем найти решение i(t), i (t), xii (t, i ? N) системы (2.6)-(2.8);
b) по формуле (2.10) построить функции риска;
) найти полоительные постоянные ?ir (r = 1, 2; i ? N , при
которых с учетом (4.5) выполняются условия (4.2);
d) построить решение (t), ?(t) системы (4.5);
e) по формулам (4.3) аналитически сконструировать U? , Z? ;
f) используя пункт b и (1.8), по (3.2) найти N-вектора
?
J [t , x ? , ? [t , x ? ; здесь таке моно применить прием, предлоенный в [7. С. 81-85?.
?олученная в результате тройка (U? , J ? [t , x ?, ? [t , x ?) и
образует гарантированное по исходам и рискам решение задачи
(1.1). Заметим, что предлоенная здесь схема реализована в [8?
для скалярного варианта задачи (1.1).
1
1
1
1
1
1
1
(1)
0
0
0
0
0
63
0
0
0
Список литературы
1. Zhukovskiy V. I., Salukvadze M.E. The Vetor-Valued Maximin. N. Y.
et.: Aademi Press 1994.
2. Wald A. Contribution to the theory of statistial estimation and testing
hypothesis //Annual Math. Statist. 1939. Є 10. P. 299 - 326.
3. Savege L. Y. The theory of statistial deision //J. Amerian Statisti
Assoiation 1951. Є 46. P. 55 - 67.
4. Уткин Э. А. Риск-менедмент. М.: ЭКМОС, 1998.
5. Колемаев В. А. Математическая экономика. М.: ЮНИТИ, 2002.
6. ?онтрягин Л. С. Обыкновенные дифференциальные уравнения М.:
ГИФМЛ, 1961.
7. Жуковский В. И. Введение в дифференциальные игры при неопределенности. М.: МНИИ?У, 1997.
8. Сорокин К. С. Решение одной многокритериальной динамической
задачи при неопределенности с учетом риска. (В настоящем сборнике.)
64
Документ
Категория
Без категории
Просмотров
4
Размер файла
208 Кб
Теги
риски, исход, одной, задачи, динамическое, многокритериальной
1/--страниц
Пожаловаться на содержимое документа