close

Вход

Забыли?

вход по аккаунту

?

Адаптивная аппроксимация функций.

код для вставкиСкачать
1999
ИЗВЕСТИЯ ВЫСШИХ УЧЕБНЫХ ЗАВЕДЕНИЙ
МАТЕМАТИКА
Є 1 (440)
УДК 629.78
Ю.В. КОЖЕВНИКОВ
АДАПТИВНАЯ АППРОКСИМАЦИЯ ФУНКЦИЙ
Поставлена задача адаптивной аппроксимации функции из L2 . Предложен метод последовательных приближений решения задачи. Доказаны теоремы о достаточных условиях сходимости
последовательных приближений к искомому решению.
1. Постановка задачи
Полиномиальная аппроксимация функций имеет целью создание дополнительных возможностей их приближенного аналитического исследования и практической реализации. Это достигается за счет применения в качестве координатных функций аппроксимаций хорошо исследованных выражений, а также числовых параметров | коэффициентов полиномов ([1], гл. 3,
x 7, с. 42). При этом предполагается, что вычислимость параметров гарантирует их физическую
реализуемость.
Между тем, последнее не всегда имеет место. В частности, в целом ряде случаев искомые
оптимальные значения параметров аппроксимаций практически могут быть получены лишь
последовательными уточнениями (коррекциями) их некоторых начальных состояний с использованием последовательно накапливаемой измерительной информации об аппроксимирующих
функциях. Такого рода ситуации относятся к числу достаточно распространенных и не требуют
специального исследования ([2], с. 135).
В связи с этим рассмотрим задачу об оптимальной аппроксимации вещественной функции
x (t) 2 L2 на интервале T значений вещественного аргумента t в классе аппроксимирующих
функций вида
x(t) = U T u + V T v + W T w + T # (t 2 T ):
(1.1)
Здесь U T = kU 1 (t); : : : ; U n (t)k, V T = kV 1 (t); : : : ; V m (t)k, W t = kW 1 (t); : : : ; W r (t)k, T =
k1(t); : : : ; q (t)k | матрицы-строки координатных функций из L2; u = ku1 ; : : : ; un kT , v =
kv1 ; : : : ; vmkT , w = kw1 ; : : : ; wr kT , # = k#1; : : : ; #q kT | матрицы-столбцы параметров аппроксимации; T | знак транспонирования матрицы.
Аппроксимацию
xf (t) = U T uf + V T vf + W T wf + T #;
(1.2)
параметры которой uf = ku1f ; : : : ; unf kT , vf = kvf1 ; : : : ; vfm kT доставляют минимум функции
Z
Y = [x(t) ; x (t)]2 dt
T
(1.3)
по переменным u, v при условии w = wf = kwf1 ; : : : ; wfr kT , где wf | заданная матрица, будем
называть оптимальной.
Очевидно, что uf и vf должны определяться из уравнений ([1], гл. 3, x 7, с. 43)
(U; U T )uf + (U; V T )vf = (x ; U ) ; (U; W T )wf ; (U; T )#;
(1.4)
(V; U T )uf + (V; V T )vf = (x ; V ) ; (V; W T )wf ; (V; T )#:
18
Здесь круглые скобки | выражения вида
(U; V T ) =
Z
T
UV T dt;
и предполагается выполненным условие
(U; U T )
(U; V T ) 6= 0:
(1.5)
(V; U T )
(V; V T )
Известно, что обычная задача оптимальной аппроксимации функций в классе (1.1) сводится
к решению уравнений вида (1.4) относительно uf , vf . Однако учет условий физической реализуемости аппроксимаций и их параметров существенно меняют дело.
Будем считать, что построение оптимальной аппроксимации (1.2) с ее параметрами должно
проводиться с соблюдением следующих условий физической реализуемости x(t) и ее параметров.
1. Оптимальная аппроксимация xf (t) может быть получена только переходом от некоторого
начального состояния
x0 (t) = U T u0 + V T v0 + W T w0 + T # (t 2 T )
(1.6)
аппроксимации x(t) за счет последовательных изменений (коррекций) параметров u0 , v0 , w0
на некоторые известные величины uk , vk , wk (k = 0; 1; : : : ). Здесь u0 = ku10 ; : : : ; un0 kT ,
v0 = kv01 ; : : : ; v0m kT , w0 = kw01 ; : : : ; w0r kT | начальные состояния параметров u, v, w; uk =
ku1k ; : : : ; unk kT , vk = kvk1 ; : : : ; vkm kT , wk = kwk1 ; : : : ; wkr kT | k + 1-я (k = 0; 1; : : : ) коррекция параметров u0 , v0 , w0 ; # | неизвестный неизменяемый параметр.
2. Аппроксимация x(t) после k + 1-й коррекции может быть представлена в виде
xk+1 (t) = U T uk+1 + V T vk+1 + W T wk+1 + T # (t 2 T ; k = 0; 1; : : : );
(1.7)
где
uk+1 = u0 + uk ; vk+1 = v0 + vk ; wk+1 = w0 + wk (k = 0; 1; : : : ):
(1.8)
3. Любая аппроксимация xk (t) (k = 0; 1; : : : ) может быть реализована в виде случайного
процесса
Xk (t) = xk (t) + Yk (t) (k = 0; 1; : : : );
(1.9)
где Yk (t) | случайная ошибка реализации, xk (t) | гильбертовский случайный процесс с характеристиками
M (Yk (t)) = 0; M [Yk (t) Yk (t0)] = Ky (t; t0 ):
(1.10)
Здесь M | операция математического ожидания; Ky (t; t0 ) | интегрируемая на T T автокорреляционная функция процесса Yk (t), удовлетворяющая условиям
8 (t) 2 L2 :
ZZ
(t) (t0 )Ky (t; t0 )dt dt0 > 0;
TT
Ky (t; t0 ) = Ky (t0; t):
(1.11)
4. Любая реализация измерения случайного процесса Xk (t) может быть получена в виде
реализации случайного процесса
Zk (t) = Xk (t) + k (t) (k = 0; 1; : : : ):
(1.12)
Здесь k (t) | случайная ошибка измерений процесса, Xk (t) | гильбертовский случайный процесс с характеристиками
M [k (t)] = 0; M [k (t) k (t0 )] = K (t; t0 );
(1.13)
19
где K (t; t0 ) | интегрируемая на T T автокорреляционная функция процесса k (t), удовлетворяющая условиям
M [k (t)Zj (t0)] = 0 (t; t0 2 T ; k; j = 0; 1; : : : );
ZZ
8 (t) 2 L2 : (t) (t0 )K (t; t0)dt dt0 > 0;
TT
K (t; t0 ) = K (t0 ; t):
(1.14)
5. Коррекция параметров, реализации и измерение аппроксимаций могут осуществляться
как при известных, так и неизвестных состояниях параметров u0 , v0 , w0 , #. Здесь дополнительно
будем предполагать, что u0 и wf | известные матрицы, а матрицы v0 , w0 , # неизвестны.
В связи с этим подчеркнем специфику параметров u, v, w, #, связанную со спецификой
прикладных задач:
u | параметр, который подлежит преобразованию от известного начального u0 к неизвестному оптимальному состоянию uf (программный параметр);
v | параметр, который подлежит преобразованию от неизвестного начального v0 , к неизвестному оптимальному состоянию vf ;
w | параметр, который должен быть преобразован от неизвестного начального w0 к заданному конечному состоянию wf ;
# | неизвестный неизменяемый параметр (мешающий параметр).
Теперь видно, что в отличие от обычной задачи оптимальной аппроксимации условие (1.4)
в нашем случае необходимо, но не достаточно для фактического построения параметров uf ,
vf , wf и функции xf (t). Действительно, во-первых, в рассматриваемом случае правые части
уравнений (1.4) содержат неизвестный параметр #; во-вторых, даже если в частных случаях
из этих уравнений найдется параметр vf , его нельзя будет реализовать практически методом
коррекций исходного состояния v0 , т. к. искомое физически реализуемое уточнение vf = vf ; v0 ,
где по условию v0 неизвестен, останется неизвестной величиной.
Аналогично обстоит дело с преобразованием неизвестного параметра w0 в заданное состояние
wf .
В связи с этим, учитывая сформулированные условия физической реализуемости, будем
решать задачу методом последовательных приближений, цикл которого состоит в следующем.
1. Реализация аппроксимации xk (t) k-го приближения на T в виде Xk (t) с результатами
измерения процесса Xk (t) в виде Zk (t) (k = 0; 1; : : : ).
2. Определение с использованием Z0 (t); : : : ; Zk (t) подходящих коррекций uk , vk , wk параметров u0 , v0 , w0 (k = 0; 1; : : : ).
3. Реализация параметров uk+1 , vk+1 , wk+1 следующего приближения в соответствии с формулами (1.8).
Ясно, что предлагаемый метод последовательных приближений будет приемлемым, если
коррекции uk , vk , wk (k = 0; 1; : : : ) будут формироваться таким образом, чтобы была обеспечена сходимость в каком-то практически приемлемом смысле последовательностей fuk g, fvk g,
fwk g, fxk (t)g соответственно к uf , vf , wf , xf (t).
Таким образом, имеем задачу: при заданных n, m, { , q, u0 , wf , x (t), U , V , W , , Ky (t; t0 ),
K (t; t0 ), Zk (t) (k = 0; 1; : : : ) и неизвестной матрице # требуется построить последовательности
fuk g, fvk g, fwk g, fxk (t)g, которые сходятся в каком-то смысле соответственно к uf , vf , wf , xf (t)
при условиях (1.1), (1.2), (1.4){(1.14) и обеспечивают в пределе минимизацию выражения (1.3)
по переменным u, v. Эту задачу будем называть адаптивной аппроксимацией функций из L2 .
Отметим, что поскольку коррекции параметров u0 , v0 , w0 формируются в зависимости от
результатов измерений случайных функций Xk (t) со случайными ошибками k (t), то рассматриваемые последовательности являются случайными. Поэтому их сходимость может формулироваться в терминах сходимости случайных последовательностей.
20
2. Решение задачи
В качестве достаточного алгоритма метода решения задачи адаптивной аппроксимации может быть принят следующий порядок действий и вычислений.
1. Осуществить на T процесс Xk (t) и получить результат его измерения Zk (t) на k-м шаге
приближений (k = 0; 1; : : : ).
2. Определить на T функции
Zk (t) = Zk (t) ; U T uk
(k = 0);
Zk (t) = Zk (t) ; U T uk ; V T vk;1 ; W T wk;1 (k = 1; 2; : : : );
(2.1)
k
X
Z k (t) = k +1 1 Zi(t)
(k = 0; 1; : : : ):
i=0
3. Используя Zk (t), Z k (t), построить оценки vek , wek , #ek k-го приближения параметров v0 , w0 ,
#0 , например, по формулам вида
vek = v0 +
Z
T
Z
v (t)Z k (t)dt;
wek = w0 + w (t)Z k (t)dt;
#ek = #0 +
Z
T
T
k = 0; 1; : : :
(2.2)
#(t)Z k (t)dt;
Здесь и далее 0 и (t) с соответствующими индексами | матрицы-столбцы параметров и функций из L2 соответствующих размерностей, определяемые методами статистического точечного
оценивания.
4. Построить k-е приближение оценок uefk , vefk параметров uf , vf из уравнений
(UU T )uefk + (UV T )vefk = (x ; U ) ; (U; W T )wf ; (U; T )#ek ;
k = 0; 1; : : :
(2.3)
(V U T )uefk + (V V T )vefk = (x ; V ) ; (V; W T )wf ; (V; T )#ek ;
5. Построить оценку k-го приближения xefk (t) функции xef (t) в виде
xefk (t) = U (t)T uefk + V (t)T efk + W (t)T wf + (t)T #ek ; k = 0; 1; : : :
(2.4)
6. Вычислить меры точности оценок параметров, например, в виде их среднеквадратических
отклонений
J#j = M [(#eik ; #i0 )2 ]; JVj = M [(wekj ; w0j )2 ]; J# = M [(#erk ; #s )2 ] (i = 1; m; j = 1; { ; s = 1; q ):
(2.5)
7. Определить коррекции параметров k-го приближения по формулам
uk = uefk ; u0 ; vk = vefk ; vek ; wk = wf ; wek ; k = 0; 1; : : :
(2.6)
8. Реализовать полученные коррекции и получить параметры следующего приближения в
соответствии с формулами (1.8).
9. Используя uk+1 , vk+1 , wk+1 в качестве исходных данных для построения xk+1 (t), повторить
пп. 1{8 алгоритма с увеличением индекса действий на единицу; процесс продолжать до тех пор,
пока не будет достигнута удовлетворительная точность оценок параметров uf , vf , wf и функции
xf (t).
Достаточные условия применимости этого алгоритма устанавливает следующая
fv g fw g f# g
Если случайные последовательности ek , ek , ek оценок параметров
0 , сходятся по вероятности к этим параметрам, то случайные последовательности
сходятся по вероятности соответственно к f , f , f , f
.
k , k , k
Теорема 1.
w #
fv g fw g fx (t)g
u v w x (t) (8t 2 T )
21
v0,
fuk g,
Из уравнений (2.3) и условия (1.5) следует, что uefk и vefk являются линейными функциями аргумента #ek . Отсюда и из системы (1.4), учитывая известную теорему вероятностей о сходимости последовательности значений непрерывных функций, соответствующей
последовательности значений случайных аргументов, сходящихся по вероятности к некоторому
пределу, находим, что если выполнено условие о сходимости по вероятности последовательности
f#ek g к #, то имеет место аналогичная сходимость последовательностей fuefk g и fvefk g соответственно к uf и vf .
Учитывая это обстоятельство, соотношения (2.6), а также условие теоремы о сходимости по
вероятности последовательностей fvek g и fwek g к v0 , и w0 , в силу той же теоремы находим, что
случайные последовательности fuk g, fvk g, fwk g сходятся по вероятности соответственно к
uf ; u0 , vf ; v0 , wf ; w0 .
Теперь, принимая во внимание (1.8), нетрудно убедиться, что случайные последовательности
fuk+1 g, fvk+1 g, fwk+1 g действительно сходятся по вероятности соответственно к u0 + uf ; u0 = uf ,
v0 + vf ; v0 = vf , w0 + wf ; w0 = wf .
Аналогично с учетом формул (1.2) и (2.4) устанавливается сходимость по вероятности случайной последовательности fxk (t)g к xf (t) для всякого t 2 T , что и требовалось.
Доказательство.
Из этой теоремы следует, что построение состоятельных оценок параметров v0 , w0 , #0 по
результатам Zk (t) измерений функций Xk (t) (k = 0; 1; : : : ) достаточно для сходимости в статистическом смысле предлагаемого метода последовательных приближений.
Конструктивное условие сходимости алгоритма устанавливает следующая
e вида (2:2) являются несмещенными, то последовательek , w
ek , #
Теорема 2. Если оценки v
k
ности fuk g, fvk g, fwk g, fxk (t)g (t 2 T ) сходятся по вероятности соответственно к uf , vf , wf ,
xf (t) (t 2 T ).
Доказательство.
лучим
Из соотношений (1.7){(1.14), (2.1) после несложных преобразований по
Zk(t) = (t) + k (t); Z k (t) =(t) + Z k (t); M [Z k (t)] = 0;
Здесь
M [Zk(t)] = M [Z k (t)] = (t); M [Z (t)Z (t0 )] = k +1 1 K (t; t0 ):
k
X
k = Jk (t) + k (t); Z k (t) = k +1 1 i (t);
(t) = V T v
+ WTw
i=0
0;
+ T #
0
0
0
0
K (t; t ) = Ky (t; t ) + K (t; t0 ):
Теперь из (2.2) следует
vekj = v0j +
Z
T
vj (t)(t)dt +
Z
vj (t)Z k (t)dt (j = 1; n):
T
Отсюда, учитывая соотношение (2.7), находим
M (vkj ) = vk0j +
e
vekj ; M (vekj ) =
Z
T
Z
T
vj (t)(t)dt;
vj (t)Z k (t)dt (j = 1; n):
22
(2.7)
(2.8)
Следовательно, если оценка vekj является несмещенной, т. е. M (vekj ) = v0j , то
M [(vekj ; v0j )2 ] =
ZZ
TT
vkj (t)vkj (t0 )M [Z k (t)Z k (t0 )]dt dt0 (j = 1; n):
Отсюда и из (2.7) следует, что при условии теоремы 2
ZZ
M [(vekj ; v0j )2 ] = k +1 1 vj (t)vj (t0 )K (t; t0 )dt dt0 :
TT
Следовательно,
lim M [(vekj ; v0j )2 ] = 0:
k!1
Последнее означает сходимость оценки vekj к v0j в среднем квадратическом и, следовательно,
сходимость по вероятности.
Аналогично доказывается состоятельность оценок других элементов матриц vek , wek , #ek .
Поскольку в соответствии с теоремой 1 из состоятельности оценок vek , wek , #ek следует сходимость метода последовательных приближений, то теорему 2 следует считать доказанной.
Теорема 3.
Если оценки
vek , wek , #ek определяются из системы уравнений
(V; V T )vek + (V; W T )wek + (V; T )#ek = (V; Z k );
(W; V T )vek + (W; W T )wek + (W; T )#ek = (W; Z k );
(; V T )vek + (; W T )wek + (; T )#ek = (; Z k );
(2.9)
fuk g, fvk g, fwk g, fxk (t)g
u v w x (t) t 2 T ).
определитель которой отличен от нуля, то последовательности
сходятся по вероятности соответственно к f , f , f , f
(
(t 2 T )
Доказательство. Учитывая введенное ранее определение выражений{круглых скобок в
уравнении (2.9) и независимость их от индекса k, очевидным образом устанавливаем, что оценки
параметров, определяемые из этих уравнений, относятся к классу (2.2). Далее, учитывая соотношения (2.7) и (2.8), относящиеся к функции Z k (t), и применяя операцию математического
ожидания к обеим частям уравнений (2.8), получим
(V; V T )M (vek ) + (V; W T )M (wek ) + (V; T )M (#ek ) = (V; V T )v0 + (V; W T )w0 + (V; T )#;
(W; V T )M (vek ) + (W; W T )M (wek ) + (W; T )M (#ek ) = (W; V T )v0 + (W; W T )w0 + (W; T )#;
(; V T )M (vek ) + (; W T )M (wek ) + (; T )M (#ek ) = (; V T )v0 + (; W T )w0 + (; T )#:
По условию определитель этой системы отличен от нуля, поэтому имеем
M (vek ) = v0 ; M (wek ) = w0 ; M (#ek ) = #:
Таким образом, оценки vek , wek , #ek , определяемые из уравнений (2.9), являются несмещенными, а поскольку они относятся к классу оценок (2.2), то они удовлетворяют условиям теоремы
2. Отсюда следует их требуемая сходимость и, следовательно, достаточность для рассматриваемого метода последовательных приближений.
Можно показать, что достаточными для алгоритма метода являются также минимаксные
оценки параметров, полученные в ([3], с. 14).
23
Литература
1. Демидович Б.П., Марон И.А., Шувалова Э.З.
Численные методы анализа. Приближение
функций, дифференциальные и интегральные уравнения
Адаптивная коррекция параметрических систем
. { М.: Наука, 1967. { 368 с.
2. Кожевников Ю.В.
// Автоматика и телемеханика. { 1991. { Є 10. { С. 135{143.
3. Кожевников Ю.В. Минимаксная оценка параметров регрессий при непрерывных измерениях.
{ Вестн. КГТУ. { 1997. { Є 2. { С. 19{25.
Казанский государственный
технический университет
Поступила
05.10.1998
24
Документ
Категория
Без категории
Просмотров
4
Размер файла
132 Кб
Теги
адаптивных, функции, аппроксимация
1/--страниц
Пожаловаться на содержимое документа