close

Вход

Забыли?

вход по аккаунту

?

Решение одной модельной игровой задачи о дальнем воздушном бое.

код для вставкиСкачать
УЧЕНЫЕ
Том XXXV
ЗАПИСКИ
ЦАГИ
№ 1—2
2004
УДК 629.735.33.015.076.4
519.8
РЕШЕНИЕ ОДНОЙ МОДЕЛЬНОЙ ИГРОВОЙ ЗАДАЧИ
О ДАЛЬНЕМ ВОЗДУШНОМ БОЕ
В. А. ЯРОШЕВСКИЙ
Рассмотрена игровая задача о дальнем воздушном бое двух самолетов в
предположении, что экипажи самолетов знают о количестве выстрелов, выполненных
противником («шумная» дуэль), и что этой информацией они не обладают («бесшумная»
дуэль). Для простейшего случая рассмотрен также промежуточный вариант «смешанной»
дуэли. Предполагается, что отношение условных вероятностей поражения самолетов при
выполнении выстрелов (запусков ракет) остается постоянным и что траектории самолетов в
процессе дальнего воздушного боя (на этапе сближения) заданы. Цена игры определяется
разностью безусловных вероятностей поражения самолетов.
Процесс воздушного боя принято разделять на фазы дальнего и ближнего боя. Во второй
фазе основная задача сводится к поиску оптимальной тактики маневрирования, и эффективность
действий самолета в очень большой степени зависит от его маневренных возможностей —
максимальной и минимальной скорости, допустимой перегрузки, допустимого угла атаки и т. д.
Применение оружия естественно определяется при этом выходом самолета в условия, когда
вероятность поражения противника достигает максимума.
В отличие от второй фазы маневренные возможности самолета в дальнем бою, где
самолеты движутся навстречу друг другу, играют меньшую роль. Здесь большое значение
приобретает выбор правильной тактики обстрела противника — выбор моментов запуска ракет.
В самой примитивной постановке можно считать, что движение самолетов задано, и свести
задачу к задаче о «шумной» или «бесшумной» дуэли, [1], [2]. Эти термины означают, что в
первом случае экипаж самолета имеет информацию о количестве выстрелов, выполненных
противником, а во втором случае он такой информации не имеет.
1. Решение задачи о «шумной» дуэли. Задача о шумной дуэли, в которой оба игрока знают
о количестве выполненных выстрелов, решается в следующей постановке.
Ценой игры является разность безусловных (unconditional) вероятностей поражения
самолетов в конечный момент времени t f :
( )
( )
=
ν Puncond t f − Quncond t f .
(1)
Первый самолет стремится максимизировать выражение (1), а второй — минимизировать.
Предполагается, что первый самолет располагает n, а второй — m единицами боезапаса
(ракетами) и что выстрелы выполняются мгновенно. Условные вероятности поражения второго и
первого самолетов P ( t ) и Q ( t ) монотонно возрастают на единичном интервале времени
( 0)
( t f = 1) , причем P=
Q=
( 0 ) 0.
Рассмотрим сначала случай, когда каждый самолет располагает только одной ракетой.
Пусть первым стреляет первый самолет в момент времени t, тогда второй самолет, если он
68
не сбит, отвечает выстрелом в момент достижения максимума условной вероятности, в конце
интервала, и цена игры (1) определяется формулой
(1)
ν11
= P ( t ) − (1 − P ( t ) ) Q (1) .
(2)
В том случае, когда первым стреляет второй самолет, из аналогичных соображений
получим:
(2)
ν11
=
−Q ( t ) + (1 − Q ( t ) ) P (1) .
(3)
Здесь нижний индекс обозначает наличие у обоих самолетов по одной ракете, а верхний
обозначает номер самолета, начинающего обстрел.
Нетрудно убедиться, что функция (2) начинается с отрицательных значений и в процессе
времени возрастает до положительных значений, а функция (3) ведет себя противоположным
образом. Тогда выясняется, что ни одному из самолетов невыгодно начинать обстрел слишком
рано, до пересечения функций (2) и (3), а при достижении момента пересечения t11 одному из
самолетов предписывается выполнить выстрел, на который другой самолет отвечает выстрелом
при достижении максимума условной вероятности. В итоге момент пересечения определяется
приравниванием выражений (2) и (3), после чего определяется цена игры:
ν11 =
P ( t11 ) − (1 − P ( t11 ) ) Q (1) =
−Q ( t11 ) + (1 − Q ( t11 ) ) P (1) .
(4)
Пусть, далее, первый самолет располагает двумя ракетами, а второй самолет — одной. Если
первым стреляет первый самолет в момент времени, не превосходящий t11 , то цена игры
определяется формулой
ν (1)
21= P ( t ) + (1 − P ( t ) ) ν11 ,
(5)
а если первым стреляет второй самолет, то первый отвечает сдвоенным выстрелом при
достижении максимума условной вероятности:
(
)
ν (2)
−Q ( t ) + (1 − Q ( t ) ) 1 − (1 − P (1) ) .
21 =
2
(6)
Рассуждая аналогично предыдущему, убеждаемся, что первый выстрел один из самолетов
должен выполнить в момент времени t21 , определяемый приравниванием выражений (5) и (6),
при условии, что t21 < t11. Это условие при сделанных предположениях о монотонном
возрастании условных вероятностей всегда выполняется. Подставляя значение t21 в выражение
(5)
или (6), вычисляем цену игры ν 21. Аналогично определяется цена игры ν12 в случае, когда
первый самолет обладает одной ракетой, а второй — двумя.
При наличии у обоих самолетов по две ракеты вычисляются две функции времени:
ν (1)
22= P ( t ) + (1 − P ( t ) ) ν12 ,
(7)
ν (2)
−Q ( t ) + (1 − Q ( t ) ) ν 21.
22 =
(8)
Приравнивая эти выражения, определяем момент времени t22 , который оказывается
меньше значений t12 и t21 , после чего вычисляем цену игры ν 22 , и так далее. Решения такой
задачи при бесконечно малых значениях условных вероятностей содержатся в [3].
2. Основные соотношения для определения оптимальных смешанных стратегий
обстрела самолета противника в дальнем воздушном бою. В [1] содержатся теоретические
результаты решения ряда модельных игровых задач. В том числе, изложены результаты решения
69
игровых задач воздушного боя в предположении о том, что каждый из двух самолетов,
участвующих в бою, не имеет информации о том, был ли он обстрелян (так называемая
«бесшумная» дуэль). Ценой игры является по-прежнему разность безусловных вероятностей
поражения самолетов в конечный момент времени (1).
В отличие от [1] предположение о том, что P=
(1) Q=
(1) 1, не вводится, поэтому
соответствующие формулы из [1] были скорректированы (наряду с устранением некоторых
опечаток).
Рассмотрим сначала случай, когда каждый самолет обладает только одной ракетой.
Постановка задачи заключается в следующем. Пусть времена запуска ракет первым и вторым
самолетом обозначаются через ξ, η соответственно. Тогда цена игры определяется формулами:
K = K (1) = P ( ξ ) − (1 − P ( ξ ) ) Q ( η) при ξ < η ,
(9)
K =K (2) =−Q ( η) + (1 − Q ( η) ) P ( ξ ) при ξ > η.
(10)
Распределения моментов выстрела первого и второго самолета обозначаются через
dx
= f (ξ) ,
dξ
dy
= g ( η) соответственно. Цена игры определяется формулой
dη
11
=
ν
∫∫ K ( ξ, η) f ( ξ ) g ( η) d ξd η.
(11)
00
Заметим, что распределения моментов выстрела первым или вторым самолетом могут
включать дельта-функции (в конце процесса), что соответствует конечной вероятности
выполнения выстрела в указанный момент. Первый самолет выбирает тактику, заключающуюся
в том, чтобы максимизировать выражение (11), а второй — чтобы минимизировать это
выражение.
В [1] показано, что в этом случае оптимальные распределения не равны нулю на одном и том же
интервале a ÷ 1, где a > 0, и цена игры определяется одновременно соотношениями:
1
=
ν
∫ K ( ξ, η) f ( ξ ) d ξ + α K (1, η) ,
(12)
a
1
=
ν
∫ K ( ξ, η) g ( η) d η + β K ( ξ,1).
(13)
a
В таком случае выражение (12) не зависит от η , а выражение (13) не зависит от ξ .
Учитывая формулы (9), (10), можно выражение (12) продифференцировать по η , разделить на
Q ( η) и вторично продифференцировать по η. Аналогичную процедуру можно проделать с
выражением (13). В итоге получим:
=
f (t )
70
c f Q′ ( t )
cg P′ ( t )
,
,
=
g
t
(
)
P (t ) Q2 (t )
Q (t ) P2 (t )
(14)
где константы c f и cg определяются из условий нормировки распределений с учетом того, что
в конце процесса первое распределение дополняется импульсом величины α или второе
распределение дополняется импульсом величины β. Тогда
1
∫ f ( t ) dt =
1
1 − α,
a
∫ g ( t ) dt =
1 − β.
(15)
a
С другой стороны, для того, чтобы функция (12) не зависела от η, а функция (13) не
зависела от ξ, должны выполняться соотношения:
1
1




=
2c f Q (1) 1 + αP (1) − P ( t ) f ( t ) dt  , =
2cg P (1) 1 + βQ (1) − Q ( t ) g ( t ) dt )  .




a
a




∫
∫
(16)
Процедура отыскания решения, которое сводится к вычислению констант c f , cg , a, α или
β, заключается в том, чтобы найти такое положительное значение α или β , меньшее единицы,
чтобы одновременно выполнялись соотношения (15) и (16). Далее вычисляется цена игры с
помощью соотношений (12) или (13).
Результаты решения задачи о выборе смешанных стратегий (распределений моментов
выполнения выстрелов) в более общем случае, когда первый самолет располагает n ракетами, а
второй — m ракетами, сводятся к следующему. Моменты выстрелов первого самолета
распределяются в интервалах a1 ÷ a2 , a2 ÷ a3, ..., an ÷ 1, а моменты выстрелов второго самолета
распределяются в интервалах b1 ÷ b2 , b2 ÷ b3 , ..., bm ÷1, причем должно выполняться условие
a1 = b1.
Распределения моментов
соответственно функциями
f (=
t)
выстрелов
hi Q′ ( t )
(17)
первого
∏ (1 − Q ( b j ) ),
Q 2 ( t ) P ( t ) 1> b > t
g (=
t)
j
и
второго
k j P′ ( t )
самолетов
определяются
∏ (1 − P ( ai ) ).
P 2 ( t ) Q ( t ) 1 > ai > t
Индексы i, j соответственно относятся к интервалам
ai ÷ ai +1 ,
b j ÷ b j +1 ,
(18)
причем
a=
n + 1 b=
m + 1 1.
Кроме того, в общем случае первый самолет совершает выстрел при t = 1 с вероятностью α
или, в противном случае, второй самолет при t = 1 совершает выстрел с вероятностью β. Таким
образом, одно (и только одно) из распределений выстрелов первого или второго самолета на
последнем интервале содержит в конце интервала дельта-функцию, причем
αβ = 0.
(19)
Далее вводятся величины Di , E j , определяемые соотношениями:
ai +1 − ε
=
Di
=
P ( t ) dxi ( t ) , E j
∫
ai
b j +1 − ε
∫
Q ( t ) dy j ( t ),
(20)
bj
где dxi ( t ) f=
=
( t ) dt , dy j ( t ) g ( t ) dt в соответствии с формулами (18), ε → 0 (таким образом,
последние импульсы в распределениях моментов обстрела не учитываются).
71
Значения hi , k j определяются последовательно, начиная со старших номеров, из соотношений:
=
2hn Q (1) ( P (1) α + 1 − Dn ) ,
=
2km P (1) ( Q (1) β + 1 − Em ) ,
hi =
(1 − Di ) hi +1 , i < n,
(
(21)
)
1 − E j k j +1 , j < m.
kj =
Значения параметров α > 0 или β > 0 подбираются таким образом, чтобы выполнилось
условие (17).
В общем случае, при немалых m, n, процедура нахождения решений оказывается
достаточно трудоемкой. В приложении к задаче воздушного боя ситуация несколько упрощается,
если учесть, что каждый из самолетов практически не успевает запустить более двух ракет.
После отыскания всех параметров, определяющих решение задачи, цену игры (разность
безусловных вероятностей в конце игры, при t = 1 + ε) можно вычислить различными способами,
используя это обстоятельство для контроля за правильностью решения.
Дело в том, что при использовании, например, первым самолетом оптимальной тактики
обстрела, а вторым самолетом — произвольной последовательности обстрела (при условии, что
моменты выстрела второго самолета располагаются в найденных интервалах b j ÷ b j +1 !) цена
игры сохраняется. Здесь уместна аналогия с конечномерным случаем, когда тактика обоих
самолетов определяется конечным числом параметров ([1], [2]). В этом случае игра
характеризуется конечной матрицей исходов, и при отсутствии седловой точки в этой матрице из
нее путем решения задачи линейного программирования исключаются ряд строк и столбцов и в
конечном итоге остается квадратная матрица, содержащая только «существенные» стратегии
(или параметры). Тогда оптимальные смешанные стратегии обоих самолетов сводятся к
использованию элементарных стратегий с соответствующими положительными вероятностями,
сумма которых для каждого самолета равна единице. При этом, в том случае, если один из
самолетов использует одну из существенных чистых стратегий, уцелевших после редукции
исходной матрицы, то цена игры сохраняется. Это впервые доказано фон Нейманом.
Возвращаясь к рассматриваемой задаче, например, для случая, когда каждый самолет
располагает двумя ракетами и когда решение определяется значениями α, a1 , b2 , a2 > b2 , можно
приписать второму самолету оптимальную тактику, а первому самолету четыре варианта
последовательности выполнения выстрелов: 1. t1 = a1 , t2 = a2 ; 2. t1 = a1 , t2 = 1; 3. t1= t2= a2 ; 4.
t1 = a2 , t2 = 1. В случае, когда первый самолет использует оптимальную тактику обстрела, можно
предусмотреть три варианта последовательности выполнения выстрелов вторым самолетом: 1.
t1 = a1 , t2 = b2 , 2. t1= t2= b2 ; 3. t1 = b2 , t2 = a2 (вариант с выполнения выстрела вторым
самолетом при t2 = 1 представляется сомнительным, поскольку первый самолет имеет конечную
вероятность выполнения выстрела в этот же момент при α ≠ 0, что порождает
неопределенность). Во всех упомянутых семи вариантах цена игры должна совпадать, если
найденное решение правильно. При этом в указанных вариантах цена игры легко вычисляется,
как это будет проиллюстрировано позже. Если же задать момент выполнения выстрела за
пределами найденного диапазона, цена игры ухудшается для самолета, игнорирующего это
предписание: это становится совершенно очевидным в случае, когда один из самолетов
выполняет выстрел при t = 0 (с нулевой условной вероятностью поражения самолета
противника).
В случае, когда самолеты располагают по одной ракете, при β =0 или при α =0, цену игры
проще всего вычислить по формулам:
2 P (1) P ( a1 ) + P ( a1 ) − P (1)
ν11 =
P (1) + P ( a1 )
72
(22а)
или
Q (1) − Q ( a1 ) − 2Q (1) Q ( a1 )
ν11 =
Q (1) + Q ( a1 )
(22б)
соответственно.
3.Модельная задача. Рассмотрим модельную задачу, когда условные вероятности
поражения самолетов задаются функциями
=
P ( t ) A=
Q ( t ) A2t ,
1t ,
(23)
где Ai ≤ 1.
1.=
n 1,=
m 1. Шумная дуэль. Рассмотрим прежде всего самый простой случай, когда
каждый самолет вооружен только одной ракетой.
В этом случае первый выстрел при
t11 =
A1 + A2
A1 + A2 + 2 A1 A2
(24)
выполняет один из самолетов, а другой отвечает выстрелом в конечный момент времени, при
достижении максимальной условной вероятности. Цена игры составляет
( A − A2 )( A1 + A2 + A1 A2 ) .
ν11 = 1
A1 + A2 + 2 A1 A2
(25)
Результаты расчетов приведены в табл. 1.
Таблица 1
A1
A2
t11
t11
ν11
1
1
1
1
1
0,8
0,8
0,8
0,8
0,6
0,6
0,6
0,4
0,4
0,2
1
0,8
0,6
0,4
0,2
0,8
0,6
0,4
0,2
0,6
0,4
0,2
0,4
0,2
0,2
0,5
0,529
0,571
0,636
0,75
0,556
0,593
0,652
0,758
0,625
0,676
0,769
0,714
0,789
0,833
0,75
0,765
0,786
0,818
0,875
0,778
0,797
0,826
0,879
0,813
0,838
0,885
0,857
0,895
0,917
0
0,153
0,314
0,491
0,7
0
0,159
0,330
0,527
0
0,168
0,354
0
0,179
0
Здесь приведены результаты только для случая A1 > A2 , поскольку в противоположном
случае цена игры просто меняет знак, а время выполнения первого выстрела сохраняется. Можно
считать, что в случае шумной дуэли «в среднем» выстрелы выполняются обоими самолетами при
=
t11
1 + t11 A1 + A2 + A1 A2
=
,
2
A1 + A2 + 2 A1 A2
(26)
n 1,=
m 1. Бесшумная дуэль. Примем для определенности, что A1 > A2 .
2.=
Используя выписанные соотношения, легко убедиться, что в данном случае
73
β =0,
1
,
1 + 2 A2
a1= b1=
α=
A1 − A2
.
A1 (1 + A2 )
(27)
Цену игры можно определить из условия, что первый самолет выполняет выстрел при
t = a1 , а второй самолет придерживается оптимальной тактики обстрела (вторая из формул (14)):
ν=
A1 − A2
.
1 + A2
(28)
Результаты расчета приведены в табл. 2.
Таблица 2
A1
A2
a1
α
t2
ν11
1
1
1
1
1
0,8
0,8
0,8
0,8
0,6
0,6
0,6
0,4
0,4
0,2
1
0,8
0,6
0,4
0,2
0,8
0,6
0,4
0,2
0,6
0,4
0,2
0,4
0,2
0,2
0,333
0,385
0,455
0,556
0,714
0,385
0,455
0,556
0,714
0,455
0,556
0,714
0,556
0,714
0,714
0
0,111
0,25
0,429
0,667
0
0,156
0,357
0,625
0
0,238
0,556
0
0,417
0
0,447
0,508
0,585
0,687
0,822
0,508
0,585
0,687
0,822
0,585
0,687
0,822
0,687
0,822
0,822
0
0,111
0,250
0,429
0,667
0
0,125
0,286
0,5
0
0,143
0,333
0
0,167
0
Сопоставим эти результаты с аналогичным решением для шумной дуэли (формулы
(24),(25)). Легко убедиться, что выигрыш сильнейшего самолета всегда меньше выигрыша для
шумной дуэли. Интересно сопоставить и времена выполнения выстрелов: в случае бесшумной
дуэли, при дефиците информации, обстрел начинается раньше ( a1 < t11 ) . Можно также
сопоставить средние времена, характеризующие процесс обстрела, вычисляя в случае бесшумной
дуэли медиану распределения моментов выстрелов слабейшего самолета
t2 =
2
(1 + 2 A2 )2 + 1
(29)
.
Как видно, и «в среднем» процесс обстрела в случае бесшумной дуэли происходит раньше,
чем в случае шумной дуэли.
3.=
n 2,=
m 1. Шумная дуэль. В этом случае первый самолет обладает двумя ракетами, а
второй — одной.
Результаты численного расчета содержатся в табл. 3, в которой приведены значения
t21 , ν 21 , соответствующие различным сочетаниям A1 , A2 .
Таблица 3
74
A1
A2
t21
ν 21
1
1
1
1
1
0,8
0,6
0,4
0,333
0,346
0,364
0,389
0,333
0,446
0,565
0,690
1
0,8
0,8
0,8
0,8
0,8
0,6
0,6
0,6
0,6
0,6
0,2
1
0,8
0,6
0,4
0,2
1
0,8
0,6
0,4
0,2
0,428
0,387
0,405
0,432
0,477
0,562
0,438
0,461
0,493
0,545
0,643
0,828
0,210
0,325
0,450
0,586
0,740
0,032
0,161
0,296
0,439
0,604
Продолжение табл. 3
A1
A2
t21
ν 21
0,4
0,4
0,4
0,4
0,4
0,2
0,2
0,2
0,2
0,2
1
0,8
0,6
0,4
0,2
1
0,8
0,6
0,4
0,2
0,505
0,526
0,556
0,607
0,703
0,625
0,636
0,657
0,690
0,764
−0,188
−0,050
0,092
0,244
0,410
−0,485
−0,333
−0,176
−0,016
0,153
4.=
n 2,=
m 1. Бесшумная дуэль. Первый самолет является почти всегда сильнейшим и распределение его моментов выстрела содержит импульс в конечный момент времени ( α ≠ 0, β =0 ) ,
за исключением тех случаев, когда условная вероятность поражения противника с помощью его
ракет оказывается значительно меньшей, чем у его оппонента, тогда выполняются условия
α= 0, β ≠ 0.
a1 b1a2 , α, β определяются
Из соотношений (21) следует, что в данном случае параметры =
при решении системы уравнений:
A ( y + 1)
y 2 −1
= 1
,
2 (1 − α ) 1 + A1α
(
)
 (1 − A y ) x 2 − y 2

1
y 2 −1

+

2
2 


y 2 −1
x2 − y 2
+ A1 ( x − y ) =
,
2 (1 − α )
2
(1 − β ) =
A2 ( (1 − A1 y )( x − y ) + (1 + y ) )
1 + A2β
(30)
,
αβ = 0.
Здесь
=
x 1=
a1 , y 1 a2 .
Для определения цены игры целесообразно выводить на печать несколько значений,
вычисленных различными способами, как отмечено выше, и непосредственно убеждаться в их
совпадении. Так, можно допустить, что второй самолет придерживается оптимальной тактики, а
первый делает два выстрела в различные моменты времени ( t1 = a1 , t2 = a2 ; t1 = a1 , t2 = 1;
t1= t2= a2 ; t1 = a2 , t2 = 1) , или предположить, что первый самолет придерживается оптимальной
тактики, а второй делает выстрел при t = a1 или t = a2 .
Например, во втором из указанных случаев цена игры вычисляется по следующей схеме.
Сначала выполняет выстрел первый самолет, и вероятность поражения второго самолета
составляет A1a1. На интервале a1 ÷ 1 − ε обстрел выполняет второй самолет, если он не сбит. С
75
учетом формул (18) распределение моментов выстрела второго самолета описывается законом
g=
( t ) C (1 − A1a2 ) t 3 при t < a2 , g ( t ) = C t 3 при t > a2 . Константу С можно найти из условия
1
нормировки
∫ g ( t ) dt = 1,
а вероятность поражения первого самолета определяется интегралом
a1
1
∫ A2 g ( t ) tdt.
После этого совершает второй выстрел первый самолет с условной вероятностью
a1
поражения второго самолета, равной A1 , и разность безусловных вероятностей поражения
самолетов (1) составляет
1
 1

ν 2 =1 A1a1 − (1 − A1a1 ) A2 g ( t ) td t+ (1 − A1a1 ) 1 − A2 g ( t ) td t A1.


a1
 a1

∫
∫
Результаты расчетов содержатся в табл. 4.
Таблица 4
76
A1
A2
α, β∗ , γ∗∗
a1
a2
ν
1
1
1
1
1
0,9
0,8
0,8
0,8
0,8
0,8
0,8
0,7
0,6
0,6
0,6
0,6
0,6
0,6
0,6
0,6
0,6
0,6
0,5
0,5
0,4
0,4
0,4
0,4
0,4
0,4
0,4
0,4
0,4
0,3
1
0,8
0,6
0,4
0,2
0,099
1
0,8
0,6
0,4
0,2
0,162
0,200
1
0,960
0,8
0,6
0,4
0,217
0,2
0,15
0,1
0,05
0,813
0,219
1
0,8
0,664
0,6
0,3
0,208
0,15
0,1
0,05
0,511
0,268
0,401
0,552
0,714
0,869
1
0,160
0,318
0,507
0,727
0,958
1
1
*
0,020
0
0,155
0,390
0,683
1
**
0,056
**
0,229
**
0,430
**
0,676
0
1
*
0,202
*
0,103
0
0,105
0,743
1
**
0,219
**
0,438
**
0,693
0
0,285
0,313
0,344
0,373
0,397
0,439
0,299
0,334
0,375
0,418
0,459
0,466
0,496
0,320
0,320
0,353
0,404
0,467
0,530
0,548
0,631
0,692
0,810
0,358
0,569
0,408
0,408
0,408
0,429
0,562
0,615
0,684
0,760
0,861
0,476
0,464
0,539
0,634
0,750
0,877
1
0,456
0,535
0,641
0,784
0,963
1
1
0,455
0,455
0,519
0,628
0,788
1
1
1
1
1
0,500
1
0,556
0,556
0,556
0,593
0,863
1
1
1
1
0,625
0,307
0,418
0,544
0,684
0,838
0,870
0,177
0,286
0,412
0,559
0,725
0,758
0,657
0,031
0,050
0,134
0,257
0,404
0,563
0,579
0,609
0,689
0,758
0,044
0,472
−0,160
−0,044
0,036
0,074
0,295
0,380
0,440
0,498
0,564
0,026
Рис. 1. Разделение плоскости
( A1,
A2 ) на три области: верхняя
кривая соответствует условию α =0, нижняя — условию α =1
0,3
0,2
0,2
0,2
0,2
0,2
0,2
0,1
0,1
0,182
1
0,8
0,6
0,4
0,352
0,141
0,185
0,083
1
0,479
*
0,414
*
0,305
*
0,088
0
1
0
1
*
0,672
0,572
0,572
0,572
0,572
0,572
0,745
0,722
0,845
1
0,714
0,714
0,714
0,714
0,714
1
0,833
1
0,289
−0,455
−0,310
−0,164
−0,019
0,016
0,196
0,006
0,100
Результаты, приведенные в таблице, требуют комментариев. Плоскость
( A1 ,
A2 )
разделяется на три области (рис. 1). В правой области, которая имеет наибольшие размеры,
выполняются условия α ≠ 0, β =0. В верхней области выполняются условия α= 0, β ≠ 0 (в
таблице эти варианты отмечены звездочками). В нижней части области решение уравнений (22)
приводит к значениям α > 1, которые неприемлемы, поскольку не укладываются в схему,
описанную в [1]. Здесь
первый самолет, имея подавляющее преимущество, распределяет свой первый выстрел в
интервале a1 ÷ 1 − ε и дополняет его конечной вероятностью, равной γ, при t = 1 + ε, а второй
выстрел выполняет также при t = 1 + ε. Поэтому в таблице выделены сочетания максимальных
условных вероятностей, которые соответствуют значениям α =0 и α =1.
77
Рис. 2. Пример распределений моментов выполнения выстрелов первым и
вторым самолетом: n = 2, m = 1; A1 = 0,6; A2 = 0,8. Распределение
выстрелов второго самолета построено в нижней полуплоскости. Конечной
вероятности выполнения второго выстрела первым самолетом при t = 1
отвечает дельта-функция в конце процесса, площадь которой равна 0,155
Для того чтобы найти эти сочетания, следует обратиться к уравнениям (22) и разрешить их
при указанных условиях. В итоге условию α =0 соответствует соотношение
A2 =
x 2 − y 2 + 4 A1 (1 + 2 A1 )
2 ( x − y + 2 (1 + 2 A1 ) )
(31)
,
где y = 1 a2 = 1 + 2 A1 , x =1 a1 =A1 + (1 + A1 )(1 + 5 A1 ) .
Условию α =1 соответствует соотношение
(1 − A1 )(1 − A2 ) + 4 A2 ,
A3 − A12 + 3 A1 + 1
=
x=
A1 + 1
A2 +
1 + A1
1 − A1
2
(32)
при этом y = 1.
Для вариантов
=
A1 0,6,
=
A1 0, 4 и малых значений A2 приведены результаты расчетов,
соответствующих условию γ > 0 (отмечены двумя звездочками), при A2 → 0, очевидно, получим
γ → 1, a1 → 1, ν → 2 A1 − A12 .
Для примера графически процесс боя иллюстрируется на рис. 2 для случая n = 2, m = 1,
A1 = 0,6, A2 = 0,8. Для удобства восприятия распределение выстрелов второго самолета
изображено в нижней полуплоскости (со знаком минус).
5.
=
n 2,=
m 2. Шумная дуэль. Результаты расчетов приведены в табл. 5.
Таблица 5
78
A1
A2
ν12
ν 21
t 22
ν 22
1
1
1
1
1
0,8
0,8
0,8
0,8
0,6
0,6
0,6
0,4
0,4
0,2
1
0,8
0,6
0,4
0,2
0,8
0,6
0,4
0,2
0,6
0,4
0,2
0,4
0,2
0,2
−0,333
−0,210
−0,032
0,188
0,485
−0,325
−0,161
0,050
0,333
−0,296
−0,092
0,176
−0,244
0,016
−0,153
0,333
0,446
0,565
0,690
0,828
0,325
0,450
0,586
0,740
0,296
0,439
0,604
0,244
0,410
0,153
0,25
0,277
0,303
0,337
0,390
0,307
0,340
0,385
0,462
0,380
0,431
0,526
0,490
0,584
0,664
0
0,125
0,280
0,462
0,686
0
0,155
0,344
0,579
0
0,191
0,436
0
0,246
0
6.=
n 2,=
m 2. Бесшумная дуэль. Рассматриваются варианты, где A1 ≥ A2 , при этом
выполняются условия a2 ≥ b2 , β =0. Задается некоторое значение α. Далее вычисляется значение
y = 1 a2 при решении квадратного уравнения:
2 A1 (1 − α )=
(1 + A1α ) ( y 2 − 1)
2 − A1 (1 − α )( y − 1) .
(33а)
После этого определяется значение z = 1 b2 при решении квадратного уравнения:
((
2 A2 =(1 − A1 y ) z 2 − y 2
)
) (
)
2 − A2 ( z − y ) + y 2 − 1 2 − A2 ( y − 1) .
(33б)
Наконец, решаются два квадратных уравнения для определения значений x1 , x2 :
( y −1)
(z
2 (1 − α )=
2
2
(1 − A2 z ) ( ( x12 − z 2 )
)
(
) (
2 − A1 ( x1 − z ) + z 2 − y 2
)
((
)
2 − A1 ( z − y ) ,
)
)
− y 2 (1 − A1 y ) 2 + y 2 − 1 2 =(1 − A1 y ) x22 − z 2 − A2 ( x2 − z ) .
(33в)
Итерационным путем подбирается значение α, при котором выполняется условие
x=
1 x=
2 1 a1 , после чего одним из описанных способов вычисляется цена игры. Результаты
расчетов приведены в табл. 6.
Таблица 6
A1
A2
a1
b2
a2
α
ν
1
1
1
1
1
0,8
0,8
0,8
0,8
0,6
1
0,8
0,6
0,4
0,2
0,8
0,6
0,4
0,2
0,6
0,2
0,228
0,265
0,311
0,365
0,238
0,280
0,338
0,414
0,294
0,333
0,381
0,440
0,512
0,587
0,385
0,447
0,525
0,598
0,455
0,333
0,391
0,473
0,594
0,772
0,385
0,468
0,597
0,815
0,455
0
0,125
0,284
0,490
0,743
0
0,184
0,433
0,414
0
0
0,118
0,267
0,456
0,698
0
0,141
0,326
0,575
0
79
0,6
0,6
0,4
0,4
0,2
0,4
0,2
0,4
0,2
0,2
0,363
0,467
0,385
0,518
0,556
0,541
0,639
0,556
0,684
0,714
0,586
0,830
0,556
0,797
0,714
0,303
0,752
0
0,605
0
0,175
0,422
0
0,232
0
Для полноты картины приведем в заключение два результата вычислений для случая
A=
A
=
1
2 1.
=
n 3,=
m 1:=
a1 0, 234, =
a2 0,325, =
a3 0,574,=
α 0, 459, ν=
31 0, 485;
=
n 3,=
m 2:=
a1 0,177, =
a2 0, 247, =
b2 0,303, =
a3 0, 408,=
α 0,159, ν=
32 0,187.
4. Смешанная дуэль. Несколько более сложной является задача о смешанной дуэли, когда
один из самолетов (первый) располагает информацией о количестве выстрелов, выполненных
противником, а второй этой информацией не располагает. В [1] изложено решение такой задачи
только для случая A1= A2= 1, n= m= 1. При Ai ≠ 1, =
n 1,=
m 1 выкладки получаются более
трудоемкими и требуют применения итерационной процедуры.
В той ситуации, когда первым выполняет выстрел второй самолет ( η < ξ ) , первый самолет
отвечает выстрелом в конечный момент времени, и цена игры, в отличие от (10), определяется
формулой
K (2) = −Q ( η) + (1 − Q ( η) ) P (1) = − A2 η + (1 − A2 η) A1
(34)
(для исследуемой модельной задачи). В результате, второй, менее информированный, самолет
должен использовать смешанную стратегию выполнения выстрелов, и его распределение
моментов выстрела всегда включает импульс величины β в конечный момент времени. Первый
самолет использует «полусмешанную» стратегию: при ξ < η она является смешанной, т. е.
задается распределение f ( ξ ) , а при η < ξ выполняет выстрел в конечный момент времени. Эти
распределения при t > a описываются в данном случае формулами:
f=
( t ) c f ( t − λ1 )
g=
(t )


− 3 2 +(1− A2 )  2 1+ 6 A2 + A22  





− 3 2 +(1− A2 )  2 1+ 6 A2 + A22  
cg t − λ1 


(
)

( t − λ 2 )− 3 2−(1− A2
(
 2 1+ 6 A + A2  

2
2 

 ,


− 3 2 −(1− A2  2 1+ 6 A2 + A22  
t − λ 2 

 ,
(35)
)
− (1 + A2 ) ± 1 + 6 A2 + A22
где λ1, 2 =
.
2 A2
Для констант c f , cg справедливы условия нормировки
1
1
a
a
∫ f ( t ) dt = 1, ∫ g ( t ) dt =
1 − β.
(36)
Константу a можно определить численным путем из условия, чтобы интеграл,
определяющий цену игры, не зависел от момента выполнения выстрела вторым самолетом t ≥ a:
ν (=
t)
t
1
∫
f ( ξ ) ( A1ξ − (1 − A1ξ ) A2t ) d ξ + f ( ξ ) ( − A2t + (1 − A2t ) A1 ) d ξ .
a
t
∫
Это условие проще всего записать, приравнивая значения ν ( a ) и ν (1) :
80
(37)
1
1
a
a
d ξ ∫ f ( ξ ) ( A1ξ − (1 − A1ξ ) A2 ) d ξ ,
∫ f ( ξ ) ( − A2 a + (1 − A2 a ) A1 ) =
(38)
и найти значение a. При этом значение (38) определяет цену игры ν.
Для определения значения β можно использовать другое выражение для цены игры,
соответствующее выполнению выстрела первым самолетом в момент времени t = a:
1
∫ g ( η) ( A1a − (1 − A1a ) A2η) d η + β ( A1 (1 + A2 ) a − A2 ) = ν.
(39)
a
Результаты расчета приведены в табл. 7.
Таблица 7
A1
A2
a
β
1
1
1
1
1
0,8
0,8
0,8
0,8
0,8
0,6
0,6
1
0,8
0,6
0,4
0,2
1
0,8
0,6
0,4
0,2
1
0,8
0,45
0,486
0,537
0,615
0,743
0,473
0,505
0,551
0,623
0,745
0,514
0,539
0,184
0,145
0,100
0,052
0,012
0,247
0,205
0,151
0,088
0,026
0,337
0,292
0,6
0,6
0,6
0,4
0,6
0,4
0,2
1
0,576
0,638
0,750
0,586
0,230
0,146
0,052
0,450
A1
A2
a
β
0,4
0,4
0,8
0,6
0,602
0,627
0,425
0,359
0,4
0,4
0,2
0,2
0,4
0,2
1
0,8
0,672
0,763
0,721
0,728
0,261
0,114
0,673
0,641
0,2
0,2
0,6
0,4
0,738
0,757
0,589
0,493
0,2
0,2
0,804
0,299
ν
0,101
0,223
0,355
0,508
0,704
−0,052
0,073
0,205
0,352
0,532
−0,222
−0,090
0,047
0,192
0,360
−0,420
Продолжение табл. 7
ν
−0,274
−0,127
0,024
0,187
−0,666
−0,499
−0,331
−0,163
0,007
Использованная выше модель, в которой условные вероятности поражения противника
линейно возрастают по времени, не очень реалистична, но это обстоятельство не играет
существенной роли. Действительно, временные зависимости P (t ), Q(t ) в данном случае
несущественны, существенной является зависимость
Q( P) =
A2
P,
A1
(40)
81
с помощью которой можно аппроксимировать реальные процессы изменения условных
вероятностей в дальнем воздушном бою. Поэтому, например, моменты начала обстрела следует
охарактеризовать не временем, а достижением соответствующих значений условной
вероятности.
5. Анализ результатов расчета. Попытаемся вкратце сравнить результаты расчета для
шумной и бесшумной дуэли.
Выше было отмечено, что при отсутствии информации о выстрелах, выполненных противником, обстрел нужно начинать раньше, чем в случае шумной дуэли. Момент начала обстрела
удобно охарактеризовать значением условной вероятности поражения противника. Например,
для варианта=
n 2,=
m 2 в случае шумной дуэли, при близких значениях максимальной
условной вероятности, обстрел начинается при достижении условной вероятности 0,23—0,25, а
для бесшумной дуэли — при достижении условной вероятности 0,18—0,20.
n 2,=
m 2 при умеренном превосходстве сильнейшего самолета (в смысле
Для варианта=
разности A1 − A2 ) выигрыш сильнейшего самолета в случае шумной дуэли оказывается на
5—10% больше выигрыша для бесшумной дуэли. При очень большом преимуществе
сильнейшего самолета выигрыши оказываются близкими.
n 2,=
m 1 позволяет сделать заключение о том, какое преимущество
Анализ варианта=
в максимальной условной вероятности может уравновесить дефицит в количестве ракет (одна
вместо двух). Результаты расчета показали, что как для шумной, так и для бесшумной дуэли
отношение A1 A2 должно находиться в пределах 1,8—1,9.
Сделанное сравнение указывает на то, что для оперативной оценки преимущества одного
самолета над другим в дальнем воздушном бою можно использовать более простую модель
шумной дуэли с той оговоркой, что для бесшумной дуэли обстрел следует начинать раньше.
n 1,=
m 1
Наконец, анализ результатов расчета для смешанной дуэли в варианте =
показывает , что для компенсации дефицита информации о выстрелах, сделанных противником,
достаточно иметь преимущество в максимальной условной вероятности, достигающее 15% при
больших значениях Ai , а при малых Ai дефицит информации становится малосущественным.
Работа выполнена при поддержке Российского фонда фундаментальных исследований,
грант № 01-01-00431.
ЛИТЕРАТУРА
1. К а р л и н С. Математические методы в теории игр, программировании и экономике. — М.: Мир. — 1964.
2. Б л э к у э л л Д., Г и р ш и к М. А. Теория игр и статистических решений. — М.:
Изд. иностр. лит. — 1958.
3. К р у г л о в Б. П., К у з ь м и н В. П., Я р о ш е в с к и й В. А. О математическом
моделировании воздушного боя. — Труды ЦАГИ. 1973.
_________________
Рукопись поступила 31/X 2002 г.
82
Документ
Категория
Без категории
Просмотров
5
Размер файла
342 Кб
Теги
решение, игровой, одной, бое, дальней, задачи, модельное, воздушного
1/--страниц
Пожаловаться на содержимое документа