close

Вход

Забыли?

вход по аккаунту

?

Линейные оптимальные алгоритмы в задачах оценивания с нелинейными измерениями. Связь с алгоритмами калмановского типа

код для вставкиСкачать
Известия ТулГУ. Технические науки. 2012. Вып. 7
3. Микромеханические гироскопы: конструкции, характеристики,
технологии, пути развития / Северов Л.А. [и др.] // Известия вузов, Приборостроение, т.41, №1-2, 1998. С.57-73.
4. Информационные характеристики вибрационного микромеханического гироскопа / Северов Л.А. [и др.] // Гироскопия и Навигация.
№1.2003. С.76-82.
5. Распопов В.Я. Микромеханические приборы: учебное пособие.
Тула: Изд-во ТулГу, 2002. 392с.
S.D. Evstafyev, O.I. Rakityansky, L.A. Severov, A.A. Semenov
CALIBRATION OF INFORMATION CHARACTERISTICS MMG LL-TYPE
Methods of control and calibration of information characteristics of a micromechanical gyroscope designed by Gyrooptika (St. Petersburg, Russia) are considered.
Key words: micromechanical gyroscope, large-scale factor, pass-band, drift.
Получено 08.09.2012
УДК 621.391.172
О.А. Степанов, д-р техн. наук, нач. отдела,
(812) 499-82-53, ostepanov@eprib.ru
(Россия, Санкт-Петербург, ОАО «Концерн «ЦНИИ «Электроприбор»),
А.Б. Торопов, науч. сотрудник, (812) 499-78-90, toropov a@mail.ru
(Россия, Санкт-Петербург, ОАО «Концерн «ЦНИИ «Электроприбор»)
ЛИНЕЙНЫЕ ОПТИМАЛЬНЫЕ АЛГОРИТМЫ В ЗАДАЧАХ
ОЦЕНИВАНИЯ С НЕЛИНЕЙНЫМИ ИЗМЕРЕНИЯМИ.
СВЯЗЬ С АЛГОРИТМАМИ КАЛМАНОВСКОГО ТИПА
Применительно к простейшей задаче оценивания с нелинейными измерениями
обсуждаются особенности линейного оптимального алгоритма и на этой основе анализируется его связь с алгоритмами калмановского типа, включая получивший в последнее время широкое применение так называемый UKF алгоритм.
Ключевые слова: линейный оптимальный алгоритм, алгоритм калмановского
типа, сопоставление, навигационные приложения.
Работа проводилась при поддержке гранта РФФИ 11-08-00372-a.
Введение
При обработке навигационной информации нередко возникает потребность решения задач оценивания с использованием нелинейных измерений. При их решении применяется аппарат теории оптимальной фильтрации [1], [2], в соответствии с которой оптимальная в
среднеквадратическом смысле оценка представляет собой условное математическое ожидание, соответствующее апостериорной плотности для
172
Гироскопы и навигация
вектора оцениваемых параметров. Алгоритм вычисления оптимальной
оценки, как правило, носит нелинейный характер, поэтому такой алгоритм
получил название нелинейного оптимального алгоритма (НОА). Для получения оценки в нелинейных задачах разрабатываются упрощенные субоптимальные алгоритмы. В качестве одного из них может выступать так называемый линейный оптимальный алгоритм (ЛОА), особенность которого
заключается в том, что минимизация среднеквадратического критерия
осуществляется в классе линейных относительно измерений оценок [3],
[4]. Взаимосвязь и отличия такого алгоритма и НОА исследованы в работе
[5]. Анализ литературы показывает, что в последнее время широкое распространение получил ряд новых субоптимальных алгоритмов калмановского типа (КТ), в частности, так называемый UKF (Unscented Kalman Filter) алгоритм, регрессионные фильтры Калмана и т.д. [6-9]. Обычно при
анализе их эффективности сопоставление проводят с другими субоптимальными алгоритмами, имеющими такую же структуру. В частности, нередко обсуждаются преимущества UKF алгоритмов по сравнению с различными модификациями фильтров КТ, основанных на линеаризации.
Однако в тени остается вопрос о связи таких алгоритмов с ЛОА. С учетом
сказанного в предлагаемой работе исследуются особенности ЛОА и на
этой основе, с одной стороны, устанавливается взаимосвязь с алгоритмами
КТ, что позволяет более объективно оценить их достоинства и недостатки,
с другой  обсуждаются возможные модификации ЛОА, направленные на
получение точностей, близких к потенциальной и обеспечиваемой при использовании НОА.
Постановка задачи
Рассмотрим следующую задачу: оценить n -мерный случайный векT
тор x  [ x1 ... xn ]T по m -мерным измерениям y  [ y1 ... y m ] ,
y  s ( x)  v ,
(1)
в которых s(x)  [ s1 (x) ... s m (x)]T – известная m -мерная нелинейная
вектор функция векторного аргумента, v  [v1 ... vm ]T – случайный вектор ошибок измерения. Выбор такой задачи обоснован, с одной стороны,
тем, что с ее решением нередко приходится сталкиваться при обработке
навигационной информации [1], [2], [10], а с другой – тем фактом, что при
оценивании вектора постоянных параметров проще выявить особенности
обсуждаемых алгоритмов, не вдаваясь в тонкости, связанные с изменчивостью этих параметров. Считая известной совместную функцию плотности
распределения вероятности f (x, v) для векторов x и v , можно сформулировать задачу нахождения оптимальной в среднеквадратическом смысле
оценки (оценки с минимальной дисперсией) xˆ opt (y ) , минимизирующей
критерий
173
Известия ТулГУ. Технические науки. 2012. Вып. 7
J  M x, y [(x  xˆ opt (y ))T (x  xˆ opt (y ))] ,
(2)
где M – знак математического ожидания, а индексы снизу указывают на
случайные векторы, которым оно соответствует.
Известно, что оценка xˆ opt (y ) представляет собой математическое
ожидание апостериорной плотности для искомого вектора x , нахождение
которого, как отмечалось во введении, определяет НОА и для нелинейного
случая является нетривиальной задачей [1]. Один из вариантов упрощения
задачи основан на использовании линейных алгоритмов, имеющих структуру
(3)
xˆ  (y )  x  K  (y  y  ) ,
где индекс  фиксирует правила вычисления входящих в это выражение
неизвестных x , y  , K  для конкретного алгоритма. Для ЛОА (   lin )
соответствующие ему x lin , y lin K lin выбираются такими, чтобы обеспечить минимальное значение критерия (2) в классе алгоритмов вида (3).
Идея построения ЛОА достаточно проста и она основана на использовании
известного соотношения, определяющего линейную регрессию одного
вектора x по фиксированному значению другого вектора y , которая вычисляется
с
помощью
соотношения
(3)
при
x lin  x ,
y lin  y ,
K lin  Pxy Py1 [10]. Таким образом, для получения ЛОА достаточно
знать математические ожидания x и y составного вектора, включающего
x и y , и матрицу ковариаций этого вектора, задаваемую матрицами ковариаций Px , Py и матрицей взаимной ковариации Pxy . Заметим, что в гауссовской линейной задаче (при sx   Нx ) ЛОА совпадает с НОА, т.е.
xˆ opt (y )  xˆ lin (y ) , которая может быть вычислена с помощью фильтра Калмана (ФК). Для решения прикладных задач предложен ряд субоптимальных алгоритмов, имеющих вид (3), при этом структура (3) совпадет со
структурой ФК, поэтому будем, как это и принято в литературе, называть
их алгоритмами КТ. Обычно при анализе эффективности предлагаемых
алгоритмов КТ проводят их сопоставление с другими субоптимальными
алгоритмами, имеющими такую же структуру.
Цель же предлагаемой работы заключается в выявлении особенностей ЛОА (в том числе и с учетом его отличий от НОА) и проведении на
этой основе сопоставления с алгоритмами КТ и обсуждении их достоинств
и недостатков.
Для сопоставления в ходе анализа предполагается вычисление безусловных дисперсий, соответствующих рассматриваемым алгоритмам и
определяемым как
174
Гироскопы и навигация


(4)
Di  M xi , y ( xi  xˆi (y )) 2 , i  1.n ,
где индекс  обозначает используемый алгоритм:   opt  НОА,   lin 
ЛОА,   sub - субоптимальный алгоритм, x̂i y  - оценка i-го элемента
оцениваемого вектора.
Помимо самой оценки в исследуемых алгоритмах вырабатывается
соответствующая расчетная характеристика точности в виде текущей рас-
четной матрицы ковариаций P  (y ) . С целью проверки адекватности
P  (y ) помимо (4) осуществляют вычисление
~
Di  M y Pii (y ) , i  1.n ,


(5)
где Pii (y) - диагональные элементы матрицы P  (y ) .
Расчетная характеристика будет считаться адекватной при
~
(6)
Di  Di .
Для нахождения (4), (5) традиционно используется метод статистических испытаний [1], а для вычисления необходимых при этом оптимальной оценки и матрицы ковариаций - методы, описанные в [1], [2].
Обсудим более подробно ЛОА и проанализируем его особенности.
Линейный оптимальный алгоритм и его особенности
Будем далее полагать, что известны математические ожидания и
матрицы ковариаций для вектора оцениваемых параметров x , Px и ошибок измерения v , Pv , для простоты считая v =0. Известно, что при сделанных предположениях входящие в (2) параметры x lin , y lin , K lin , соответствующие ЛОА, в рассматриваемой задаче определяются с помощью
следующих соотношений [3-5], [10]:
y lin  y  M x s(x),
x lin  x ,
K lin  Pxy Py1 ,
в которых
(7)
(8)


 M (x  x)(s(x)  y ) .
Py  M x (s(x)  y )(s(x)  y ) т  Pv ,
(9)
т
(10)
Pxy
x
Располагая (7), (9), (10), нетрудно найти действительную матрицу
ковариаций ошибок оценивания для ЛОА:
(11)
P lin  M x (x  xˆ lin )(x  xˆ lin ) т  Px  Pxy Py1Pyx ,


которая и используется как расчетная характеристика точности.
Отметим следующие особенности ЛОА:
1. Расчетная и действительная матрица ковариаций в ЛОА между
175
Известия ТулГУ. Технические науки. 2012. Вып. 7
собой совпадают, что следует из (11), т.е. ЛОА обеспечивает выработку
адекватной характеристики точности.
2. Для исходных нелинейных измерений (1) ЛОА совпадает с НОА
для следующих «эквивалентных» линейных измерений:
(12)
y  y  Hlin (x  x)  v ad  v ,
где H lin  Pyx Px1 , а v ad - независимый от x и v центрированный гауссовский случайный вектор, с матрицей ковариаций Pad , определяемой как


(13)
Pad  M x (s(x)  y )(s(x)  y ) т  Pxy Px1Pyx .
Таким образом, можно отметить, что при построении ЛОА исход-
ная нелинейная функция заменяется линейной sx   y  H lin (x  x) , а для
учета такой замены вводится дополнительная методическая ошибка v ad с
указанными свойствами.
3. Параметры, определяющие «эквивалентные» линейные измерения, обеспечивают минимизацию критерия
Т
~
~
~
J~
x, ~
y , H  M x  sx   H(x  ~
x)  ~
y sx   H(x  ~
x)  ~
y  . (14)


4. Для реализации ЛОА необходимо уметь вычислять вектор
y  M x s(x)   s(x) f (x)dx
(15)
и матрицы
(16)
I1   s(x)s т (x) f (x)dx , I 2   xs т (x) f (x)dx ,
где f (x) - функция плотности распределения вероятности для вектора x , а
пределы интегрирования предполагаются бесконечными.





Рассмотрим поясняющий пример. Пусть требуется оценить частоту
x гармонического сигнала по измерениям
yi  sin( xti )  vi ,
i  1.m .
где ti  дискретные моменты времени. Предположим, что x - равномерно
распределенная случайная величина ( f ( x)  xmax  xmin 1  C ) с матема-
тическим ожиданием x и дисперсией  02 , а ошибки измерения  i  центрированные случайные величины, распределенные по гауссовскому закону с одинаковыми дисперсиями r 2 .
В этой задаче s( x)  sin( xt1), sin( xt2 ),....,sin( xtm )T и для реализации
ЛОА необходимо вычислять интегралы вида
xmax
xmax
xmax
xmin
xmin
xmin
yi  C  sin( ti x)dx ; I1 (i, j )  C  sin( ti x) sin( t j x)dx ; I 2 (i )  C  x sin(ti x)dx ,
где I1 (i, j )  элементы матрицы I1 ; I 2 (i)  элементы вектора – строки I 2 ,
176
Гироскопы и навигация
i, j  1.m . Заметим, что в рассматриваемом примере эти интегралы могут
быть вычислены аналитически. В частности, для yi и I 2 (i ) они будут
иметь вид
1 C
C
sin 2ti xmax   sin 2ti xmin  .
yi   costi xmax   costi xmin  , I 2 (i )  
2 4ti
ti
В общем же случае нахождение интегралов (15), (16) осуществляется численно. Для этого, в частности, может быть использован метод Монте-Карло, применение которого, например, для вектора y сведется к вычислению
1 N
y   s ( x (l ) ) ,
N l 1
где x (l ) ,  полученные путем моделирования реализации вектора x с
плотностью распределения f (x) [1]. Перейдем далее к сопоставлению
ЛОА и алгоритмов КТ.
Взаимосвязь ЛОА и алгоритмов калмановского типа
Следуя работе [7], выделим три группы алгоритмов КТ, с которыми
и сопоставим ЛОА.
Первая группа алгоритмов основана на приближенном представлении нелинейной функции s(x) . Среди алгоритмов такого типа наибольшее
распространение получили линеаризованный и итерационный фильтры
Калмана (ИФК). Все они опираются на представлении нелинейной функции s(x) с помощью ее разложения в ряд Тэйлора в виде
s(x)  s(x л )  H л (x  x л ) , где H л 
ds(x)
,
x л  точка линеаризации.
dxТ x  x л
Полагая справедливым такое представление, оценку вычисляют с исполь-
зованием алгоритма ФК в виде (3), в котором полагают   ФК , x ФК  x ,
y ФК  s(x л ) . Матрицы P ФК и K ФК , рассчитываются согласно стандартным формулам ФК, совпадающим с (8)-(11) при учете линеаризованного
представления.
В линеаризованном алгоритме точка линеаризации фиксирована, а в
итерационном  измерения обрабатываются несколько раз [10]. При этом
каждый раз точка линеаризации изменяется с учетом оценок, полученных
на очередной итерации. Существенно при этом, что в последнем случае
алгоритм становится уже нелинейным. В рассмотренном примере (рис.1)
для
линеаризованного
алгоритма,
как
нетрудно
убедиться,

T
H ФК  t1 cos( x л t1 ), t 2 cos( x л t 2 ),...., t m cos( x л t m ) ,
177

Pxy   02 H ФК
Т ,
Известия ТулГУ. Технические науки. 2012. Вып. 7

Py  HФК02 HФК
m m, y
ФК

Т  r 2Emm ,
Emm - единичная матрица размерности
Т
 sin( x л t1 ), sin( x л t 2 ),...., sin( x л t m ) , а расчетная дисперсия
определяется соотношением P
ФК
1
m
2 2  2
2
2
2 л  .
  0 r  r   0  t i cos x t i 
i 1


( 0)
л

Для итерационного алгоритма x  xˆ
Hл 
,
  0, 1, 2,..., xˆ
x и
ds( x)
на каждой итерации.
dx Т x  xˆ iter
Очевидно, что модель измерений для этих алгоритмов может быть
записана
в
виде,
аналогичном
(12),
т.е.
y  y л  s(x л )  H ФК (x  x л )  v л  v , где v л - ошибка, вызванная заменой
нелинейной функции на линейную.
а
б
Рис. 1. Линейное описание (2) нелинейной функция (1) в ЛОА (а)
и линейные описания (3,4) той же функции (1)
в алгоритмах КТ для разных x л (б)
При реализации таких алгоритмов составляющей ошибкой vѐ, как
правило, пренебрегают, что и порождает причины, по которым вырабатываемая в алгоритме расчетная матрица ковариаций может отличаться от ее
действительного значения.
Таким образом, можно выделить следующие особенности алгоритмов такого типа по сравнению с ЛОА:
- параметры линейного описания находятся путем вычисления
производных, с помощью которых удается передать лишь локальное поведение нелинейной функции, в отличие от ЛОА, в котором линейное описание выбирается исходя из условия минимизации критерия (14) рис.1.
178
Гироскопы и навигация
- как правило, в алгоритмах, основанных на линеаризации, факт
наличия дополнительной ошибки не учитывается, что приводит к неадекватности вырабатываемых в них характеристик точности в виде расчетных
дисперсий, т.е. к невыполнению (6).
Среди фильтров, основанных на приближенном описании функции
s(x) , можно отметить также и фильтры второго порядка, в которых учитывается второе слагаемое в разложении Тэйлора [1]. Однако в этом случае
алгоритм вычисления оценки существенно усложняется и такие алгоритмы
не получили сколько-нибудь широкого практического применения [1].
Для рассмотренного выше примера в табл.1 представлены результа~
~  D
ты расчета действительной (    D  ) и расчетной ( 
) среднеквадратических ошибок (СКО) при времени наблюдения T *  2 с с шагом
0.2 с ( m  10 ), r  1 рад/с для двух значений априорной СКО для искомого
параметра:  0  1 рад/с и  0  0.3 рад/с, x  2 . Расчеты приведены для
НОА (   opt ), ЛОА (   lin ), линеаризованного (   ФК ) и итерационного (   iter ) алгоритмов. Число итераций  при моделировании не превышало 10.
~  ,   вычислялись с использоРасчетные и действительные СКО 
ванием метода статистических испытаний по формулам
L
2 1 L
2
~  2  1  P y ( j ) ,

   x ( j )  xˆ  y ( j ) ,
L j 1
L j 1
 
 
 

 
где x ( j )  реализация оцениваемой величины, моделируемая в соответствии с заданным законом распределения f (x) ; y ( j )  реализация вектора
   
измерений, j  1.L , L  1000 ; xˆ  y ( j ) , P y ( j ) - оценка и расчетная дисперсия ошибки оценивания, вырабатываемая в  алгоритме.
Таблица 1
~  в задаче оценивания частоты
Значения   / 
0
1 рад/с
0,3 рад/с
  ФК
0,7/0,3
0,2/0,2
  iter
0,6/0,3
0,2/0,2
  lin
0,6/0,6
0,2/0,2
  opt
0,5/0,5
0,2/0.2
Анализ результатов позволяет сделать следующие выводы.
Как и ожидалось, для ЛОА расчетные и действительные значения
СКО между собой совпадают при любом значении  0 . При этом
lin  opt . Проигрыш обусловлен, с одной стороны, заменой нелинейной
179
Известия ТулГУ. Технические науки. 2012. Вып. 7
функции линейной, а другой – наличием дополнительных ошибок, обусловленных такой заменой.
~ ФК и 
~ iter , вырабатываемые в линеариРасчетные характеристики 
зованном и итерационном алгоритмах, в общем случае не согласованы со
значениями  ФК ,  iter , характеризующими действительную точность.
Согласованность наблюдается лишь при малом значении  0 , когда нелинейный характер задачи практически не проявляется. В этих условиях точность обоих алгоритмов обычно совпадает с точностью НОА.
Вторая группа алгоритмов КТ основана на методе статистической
линеаризации, предложенном для решения задач оценивания еще в 70-е
годы прошлого века [11]. В соответствии с этим методом линейное представление отыскивается исходя из минимизации критерия (14), что и объединяет его с ЛОА. Применительно к рассмотренному примеру (см. рис.
1,а) этот критерий сведется к виду


m
~
J ~
x, ~
y, H  С 
~ ~
 sin t i x   hi x  x   yi  dx ,
xmax
~
2
i 1 xmin
~
~
где ~
y и H.
yi , hi - элементы векторов ~
Однако в алгоритмах, предложенных в указанных работах, не учитывался факт наличия дополнительной ошибки, обусловленной заменой
нелинейной функцией ее линейным аналогом. Ясно, что пренебрежение
указанной ошибкой существенно снижает эффективность алгоритма
фильтрации. Учет дополнительной ошибки осуществляется в более поздних алгоритмах, рассмотренных в [9]. Их особенность заключается в том,
что параметры линейной аппроксимации и матрицы ковариаций дополнительной ошибки вычисляются с использованием специальной вычислительной процедуры, основанной на формировании набора выборочных
реализаций y j и x j . Такие алгоритмы названы линейными регрессионными фильтрами Калмана. Можно заметить, что, по сути, эти алгоритмы
совпадают с ЛОА, если при вычислении (7)-(10) ориентироваться на применение метода Монте-Карло. Следует, однако, отметить, что при построении ЛОА его параметры получались путем непосредственной минимизации критерия (2) в классе линейных оценок (3), а линейное
представление использовано только в методических целях, позволяющих,
в том числе, установить его связь с другими алгоритмами КТ.
Еще один класс алгоритмов КТ основан на методах приближенного
вычисления двух первых моментов функции плотности распределения, для
вектора, подверженного нелинейному преобразованию. Поскольку именно
эти моменты используются и при реализации ЛОА, алгоритмы такого типа
фактически представляют собой приближенные реализации ЛОА. Наибольшее распространение среди них получили алгоритмы, основанные на
180
Гироскопы и навигация
так называемом Unscented (U) – преобразовании [12]. Учитывая, что в русскоязычной литературе особенности алгоритмов, основанных на U – преобразовании, практически не рассматриваются, обсудим их более подробно в следующем разделе.
U-преобразование и его особенности при использовании в ЛОА
Предположим, что имеется вектор x с математическим ожиданием
x и матрицей ковариаций Px . При использовании U-преобразования первый и второй моменты другого m -мерного вектора g , связанного с x зависимостью g  (x) (где  (x) - нелинейная m -мерная функция), вычисляются следующим образом:
2n
g  gU  Wk  ( k ) ,
k 0
2n
(17)


Pg  PgU  Wk ( k )  gU (k )  gU
k 0
T .
(18)
где Wk ,  k  веса и специальным образом выбранные векторы, определяющие так называемые сигма-точки пространства состояния, удовлетворяющие условиям
2n
2n
2n
k 0
k 0
k 0
x  Wk k , Px  Wk k  x  k  x T ,
Wk  1.
(19)
Количество сигма-точек  k выбирается равным 2n +1, где n – размерность вектора x , а их расположение формируется симметрично относительно x , например, с использованием соотношений [14]
0  x, k  x  n  K Px k , k  1.2n .
Здесь

n  K Px  k


- k -й столбец матрицы
n  K Px ,
которая
может быть найдена, например, путем использования формул факторизации Холецкого. Соответствующие сигма-точкам веса определяются в виде:
K
1
W0 
, Wk 
, k  1. 2 n .
nK
2n  2 K
В этих соотношениях K – коэффициент, выбираемый, вообще говоря, из эвристических соображений, в частности, для гауссовского распределения K принимается равным 3  n [14].
Предположим, что в качестве  (x) выступает функция s(x) из
примера,
рассмотренного
в
предыдущем
разделе,
т.е.
g  sin( xt1), sin( xt2 ),....,sin( xtm )T . Поскольку n=1, в этом случае имеем всего три сигма-точки в одномерном пространстве, а соответствующие им веса будут задаваться в виде
181
Известия ТулГУ. Технические науки. 2012. Вып. 7
0  x ,
1,2  x  1  K 0 ,
K
1
, W1  W2 
.
1 K
2  2K
Используя (17), (18) можем найти два момента для вектора g .
W0 
В частности, для компонент вектора gU получим
K
1
giU 
sin( ti x ) 
sin ti x  1  K 0  sin ti x  1  K 0 ,
1 K
2  2K
где i  1.m .
Обсудим некоторые особенности U–преобразования. Предположим,
что x - случайная величина с математическим ожиданием x  M x x и
 





дисперсией 02  M x x  x 2 и в результате ее преобразования с использованием нелинейной функции формируется новая случайная величина
g  (x) . Разложим в ряд Тэйлора функцию (x) и запишем следующее
выражение для математического ожидания g в окрестности точки x :
1
g  M x g     x   '  x M x ~
x   ''  x M x ~
x 2  ...
2
1
  (l )  x M x ~
x l  ...,
l!
 
 
(20)
где ~
x  x  x . Аналогичным образом поступим с g U , т.е.
2
2
2
1
2
g  g U   Wk ( x )  '  x  Wk ~k  ''  x  Wk ~k  ...
2
k 0
k 0
k 0
2
1 (l )
l


  x  Wk ~k  ...,
l!
k 0
(21)
k  k  x . В силу свойств весов и сигма-точек (19), получаем
где ~
2
2
k 0
k 0
 
2
Wk  1, M x ~x   0  Wk ~k , M x ~x 2  Wk ~k 2  02 .
k 0
(22)
Отсюда с очевидностью следует, что первые три члена рядов (20) и
(21) совпадают. Именно поэтому принято считать, что U-преобразование
позволяет определить математическое ожидание вектора, сформированного с использованием нелинейной функции, с точностью до учета членов
третьего порядка малости при разложении этой функции в ряд Тейлора.
Можно показать, что аналогичные утверждения справедливы и для
второго момента, а также и в векторном случае [13].


Если g  zT  xT , yT - составной вектор, включающий оцениваемый вектор и вектор измерений, то формулы (17), (18) позволяют найти
первые два момента этого вектора, т.е. моменты, необходимые для реализации ЛОА (7)-(10). Алгоритм, использующий U–преобразование
182
Гироскопы и навигация
для нахождения моментов y , Pxy , Py с последующим применением выражений типа (7) для вычисления линейных оценок, был назван ―
Unscented
Kalman Filter‖ (UKF) [14]. Иногда его также называют Sigma Point Kalman
Filter [15].
При рассмотрении особенностей алгоритма UKF нередко основное
внимание уделяется преимуществам по сравнению с обобщенным ФК и
его модификациями [12], [14]. В частности, отмечается, что такой алгоритм обеспечивает более высокую точность и проще в вычислительном
отношении, поскольку при его реализации не требуется нахождения производных функции s(x) . Для целей настоящей работы важно еще раз подчеркнуть, что, алгоритм UKF направлен на вычисление двух моментов


вектора g  zT  xT , yT и таким образом он является приближенной реализацией ЛОА. Однако в упомянутых выше работах, а также в трудах, посвященных использованию аналогичных приближенных процедур (например, используемых в так называемых DDF, CDF, QKF CKF алгоритмах
[16-18]), не уделяется должного внимания вопросу о возможных потерях в
точности по сравнению с ЛОА. Не затаривается и проблема адекватности
вырабатываемой характеристики точности. Проиллюстрируем важность
этих вопросов на следующем методическом примере.
Предположим, что функция s(x) в выражении (1) может быть представлена в виде s( x)  g ( x)I m1 , где x  скалярная центрированная гауссовская величина, а функция g (x)  такая, что g ( x )  g (0)  0 и
g ( x)   g ( x) . Здесь и далее I m m  матрица, составленная из единиц,
размерности m  m . Найдем первые два момента составного вектора

T
z  x yT
и соответствующую матрицу ковариаций для методической
ошибки:
y   g ( x) f ( x)dxI m 1 , Py   ( g ( x)  y ) 2 f ( x)dxI mm  Pv ,
1
T
.
Pxy   xg ( x) f ( x)dxI1m , Pad   ( g ( x)  y ) 2 f ( x)dxI m m 
Pxy Pxy
 02
Поскольку сигма-точки и соответствующие им веса в данном случае определятся в виде
 0  0, 1,2   3 0 , W0  2 / 3, W1  W2  1 / 6 ,


то, полагая K  3  n и применяя U – преобразование, нетрудно получить
1
U

0 g 30 I1m ,
yU  0 , Pxy
3
2
1
PyU  g 3 0 I mm  Pv ,
3



183

Известия ТулГУ. Технические науки. 2012. Вып. 7
U
Pad


1
g 3 0
3
 I
2
mm





T
 1

1  1
 2
 0 g 3 0 I 1m   0 g 3 0 I 1m   0.
0  3
 3

К примеру, при g ( x)  ax  bx 3 , где a, b - известные константы, будем иметь




y  0 , Pxy   02 a  3b 02 I1 m , Py  a 2 02  15b 2  60  6ab 04 I mm  Pv ,
H lin  (a  3b 02 )I1 m , Pad  6b 2  60 I m m .
Применяя U–преобразование, можем записать
U
yU  y, Pxy
 Pxy ,


PyU  a 2  02  9b 2  60  6ab 04 I mm  Pv .
U
Нетрудно заметить, что Pad
 0 , иными словами в этом примере
расчетное значение матрицы ковариаций для методической ошибки равно
нулю, что на самом деле не соответствует действительности и приведет к
появлению дополнительной ошибки при решении задачи оценивания и неадекватности вырабатываемой характеристики точности.
Таким образом, можно выделить следующие особенности алгоритма UKF:
- простота реализации по сравнению с ЛОА и алгоритмами КТ;
- не требуется вычисления производных и обеспечивается более
адекватное описание нелинейного функции с помощью линейного аналога,
по сравнению с алгоритмами КТ, основанными на разложение в ряд Тейлора;
- несмотря на то, что предусматривается учет наличия дополнительных ошибок, возникающих при использовании линейного описания, в
общем случае не обеспечивается адекватность вырабатываемых расчетных
характеристик точности.
Анализ исследуемых алгоритмов на примере нелинейной навигационной задачи
Проанализируем эффективность применения исследуемых алгоритмов на примере задачи определения координат места по информации о
дальностях до точечных ориентиров (ТО) с известными координатами. В
целях упрощения ограничимся ее рассмотрением для плоскости в предположении, что используется лишь два ТО. Идея определения местоположения по дальностям до ТО основана на отыскании точки пересечении изолиний положения (рис. 2) [10]. В этом случае задача может быть
сформулирована следующим образом.
184
Известия ТулГУ. Технические науки. 2012. Вып. 7
При проведении моделирования будем полагать заданными: гаус-
совский закон распределения x и v ; координаты ТО x1  , 0T ,
x 2  0, T ,   3000 м; значения  0 = 300 м и 1400 м и r  0.01 ; m =5;
количество итераций при реализации ИФК   10 ; число реализаций при
вычислении безусловных дисперсий L=1000; число реализаций при вычислении моментов в ЛОА N =10000.
Полученные результаты представлены в табл. 2 для одной компоненты вектора состояния, для второй компоненты они имеют аналогичный
вид.
Таблица 2
 ~
Значения  /  в задаче определения координат
по измерениям (23)
 0  1400 м
 0  300 м
  ФК
610/13
29/13
  iter
300/40
13/13
  lin
495/495
25/25
 U
533/383
25/25
  opt
280/280
13/13
Выводы, которые следуют из представленных результатов, полностью согласуются с теми, которые были получены в предыдущем простейшем примере:
- ЛОА вырабатывает адекватную характеристику, однако потери в
точности по сравнению с НОА могут быть значительными, особенно в задачах с существенными нелинейностями.
~ ФК , 
~ iter , вырабатываемые в линеа- Расчетные характеристики 
ризованном и итерационном алгоритмах, в общем случае не согласованы с
действительной СКО, но при малом значении  0 такое согласование у
итерационного алгоритма имеет место, и его точность выше точности ЛОА
и совпадает с точностью НОА. Таким образом, при малом уровне априорной неопределенности ЛОА проигрывает по точности не только НОА, но и
по итерационному алгоритму КТ. Этот проигрыш объясняется нелинейным характером итерационного алгоритма. Основным недостатком алгоритмов, основанных на приближенном описании нелинейной функции
s(x) , является тот факт, что в них не учитывается наличие дополнительной
ошибки, возникающей при замене нелинейной функции ее линейным описанием. Достоинство ИФК заключается в обеспечении, в ряде случаев,
точности, близкой к точности НОА для задач с несущественными нелинейностями, что является следствием его нелинейного характера.
- Применение алгоритма UKF (   U ) позволяет существенно снизить объем вычислений и не требует нахождения производных, однако
достигаемая при этом точность в общем случае ниже точности ЛОА,
186
Гироскопы и навигация
и в ряде случаев вырабатываемая в них расчетная характеристика точности
не адекватно отражает действительный уровень ошибок оценивания. Это
объясняется приближенным характером процедуры нахождения моментов
плотности распределения при использовании U-преобразования.
На основе проведенного сопоставления ЛОА с алгоритмами КТ могут быть предложены модификации ЛОА, позволяющие в ряде случаев получать точности, близкие к потенциальной и обеспечиваемой при использовании НОА. В частности, можно показать, что модификация ЛОА,
основанная на комбинированном использовании ЛОА и итерационного алгоритма, позволяет в ряде случаев приблизиться к точности НОА [19]. В
такой модификации предполагается двухэтапная процедура, при этом на
первом этапе используется ЛОА, а затем ИФК. Также заслуживают внимания итерационный ЛОА [20] или итерационный UKF [21], [22]. Их суть заключается в итерационной процедуре использования ЛОА или UKF и учете информации об оценке и расчетной матрице ковариаций с предыдущей
итерации. Этот прием позволяет приблизиться к точности НОА [20]. Основой для повышения эффективности в таких алгоритмах служит тот факт,
что в ЛОА обеспечивается выработка адекватной характеристики точности. Однако нередко в задачах с существенными нелинейностями указанные модификации не приводят к должному эффекту, и точность ЛОА ниже
точности НОА.
Таким образом, можно констатировать, что в общем случае в задачах с существенными нелинейностями использование алгоритмов КТ,
включая UKF и ЛОА, не обеспечивает достижения точности, близкой к потенциальной и достигаемой с помощью НОА.
Заключение
На примере простейшей нелинейной задачи оценивания исследованы особенности линейного оптимального алгоритма, и на этой основе, с
одной стороны, проанализирована взаимосвязь с алгоритмами КТ, включая
алгоритм UKF, а с другой – их достоинства и недостатки. Показаны ограниченные возможности ЛОА в задачах с существенными нелинейностями,
обсуждены возможные пути повышения эффективности его работы.
Заметим, что детального рассмотрения заслуживает вопрос сопоставления вычислительной сложности алгоритмов, в т.ч. сложности реализации самого ЛОА. Этот вопрос здесь не затрагивался, во-первых, в связи с
тем, что цель работы заключалась в выявлении принципиальных отличий,
обсуждаемых алгоритмов, не связанные с проблемой их реализации, а, вовторых, по причине ограниченного объема статьи. По этой же причине не
рассматривался очень важный вопрос о рекуррентных процедурах и возможности обобщения полученных выводов на случай оценивания изменяющихся во времени последовательностей. Перечисленные вопросы являются предметом отдельного обсуждения.
187
Известия ТулГУ. Технические науки. 2012. Вып. 7
Список литературы
1. Степанов О.А. Применение теории нелинейной фильтрации в задачах обработки навигационной информации. СПб: ГНЦ РФ ЦНИИ "Электроприбор", 1998 г, 369с.
2. Bergman, N. Recursive Bayesian estimation. Navigation and Tracking
Applications. Linkoping Studies in Science and Technology. Dissertations, 579.
Dept. Elect. Eng., Linkoping Univ., SE-581-83 Linkoping, Sweden, 1999.
3. Степанов О.А. Линейный оптимальный алгоритм в нелинейных
задачах обработки навигационной информации // Гироскопия и навигация,
2006, №4, СПб: ГНЦ РФ ЦНИИ "Электроприбор". С. 11–21.
4. Li X. R., Zhu Y., Wang J., and Han C. Optimal Linear Estimation Fusion—Part I: Unified Fusion Rules. IEEE Transactions on Information Theory,
Vol. 49, No. 9, 2003, pp. 2192-2208.
5. Степанов О.А., Торопов А.Б. Сравнительное исследование линейного и нелинейного оптимальных алгоритмов оценивания в задачах обработки навигационной информации // Гироскопия и навигация. № 3 (70).
2010. С. 24-36.
6. Daum F. Nonlinear Filters: Beyond the Kalman Filter. //IEEE Aerospace and Electronic Systems. Tutorials, Vol. 20(8), 2005, pp. 57-71.
7. Li X. R. and V.P. Jilkov. A survey of Maneuvering Target Tracking:
Approximation Techniques for Nonlinear Filtering. Proc. 2004 SPIE Conference
on Signal and Data Processing of Small Targets, San Diego, 2004, pp 537-535
8. Chen Z. Bayesian Filtering: From Kalman Filters to Particle Filters,
and Beyond. p.69. Cвободный доступ: citeseerx.ist.psu.edu. Последнее обращение: 30.06.2010.
9. Lefebvre, T., H. Bruyninckx and J. De Schutter. Nonlinear Kalman
Filtering for Force-Controlled Robot Tasks. Springer, Berlin, 2005.
10. Степанов О.А. Основы теории оценивания с приложениями к
задачам обработки навигационной информации. СПб: ГНЦ РФ ЦНИИ
"Электроприбор", 2010. с. 496.
11. Gelb A. Applied Optimal Estimation. England, the M.I.T. Press,
1974.
12. Juiler S. J. and J. K. Uhlmann. Unscented Filtering and Nonlinear
Estimation.// Proc. IEEE, Vol. 92(3), 2004, pp 401-422.
13. Van der Merwe, R. and E. A. Wan. The Unscented Kalman Filter. In:
Kalman Filtering and Neural Networks (Haykin S.), 2001, pp 221-268, John Wiley & Sons. Inc.
14. Juiler S. J. and J. K. Uhlmann. Simon J., H.F. Durrant-Whyte. A new
Approach for Filtering Nonlinear Systems. // In Proceedings of American Control Conference, Seattle, Washington, 1995, 1628-1632.
188
Гироскопы и навигация
15. Wendel J., Metzger J., Moenikes R., Maier A., Trommer G.F. A Perfomance Comparison of Tightly Coupled GPS/INS Navigation Systems based
on Extended and Sigma Point Kalman Filters. Navigation: Journal of the Institute of Navigation USA, Spring 2006, vol. 53, № 1, p. 21-31.
16. Nørgaard M., Poulsen N. K and Ravn O. Advances in Derivative_Free State Estimation for Nonlinear Systems. Technical report IMM-REP1998-15, Technical University of Denmark, 2800 Lyngby, Denmark, 2000.
17. Arasaratnam I. and S. Haykin. Cubature Kalman filters, IEEE Trans.
Automatic Control, pp. 1254-1269, June 2009.
18. Arasaratnam I., Haykin S., Elliott R. J. Discrete-Time Nonlinear Filtering Algorithms Using Gauss–Hermite Quadrature.//Proceedings of the IEEE,
Vol. 95, No. 5, May 2007, p. 953-977.
19. Торопов А.Б. Решение задачи корреляционно-экстремальной
навигации на основе комбинированного использования линейного оптимального и итерационного алгоритмов. Материалы IX КМУ "Навигация и
управление движением", СПб: ГНЦ РФ ЦНИИ "Электроприбор", 2007. С.
235-242.
20. Степанов О.А., Торопов А.Б., Королева Ю.В. Сопоставление субоптимальных алгоритмов калмановского типа в нелинейных навигационных задачах. //Труды VI Российской научно-технической конференции
"Современное состояние и проблемы навигации и океанографии", СПб:
ГУНИО, 2007. С. 55-63.
21. Грачев А.Н., Шурыгин С.В. Методика синтеза итерационных
алгоритмов совместного оценивания параметров и состояния линейных
дискретных систем // Труды VII Международной конференции «Идентификация систем и задачи управления», Москва, ИПУ им. Трапезникова
РАН, 2008.
22. Zhan R. and Wan J. Iterated Unscented Kalman Filter for Passive
Target Tracking\\ IEEE Transactions on Aerospace and Electronic Systems.
Vol.43, N 3, July 2007, pp. 1155 – 1163.
О.A.Stepanov, A.B. Toropov
LINEAR OPTIMAL ALGORITHMS FOR ESTIMATION PROBLEMS WITH
NONLINEAR MEASUREMENTS. RELATION WITH KALMAN-TYPE ALGORITHMS.
Features of linear optimal algorithms (LOA)  for estimation problems with nonlinear measurements are investigated. The relation of the LOA with Kalman-type algorithm,
such as Iterated Kalman Filter, Unscented Kalman Filter and Linear Regression Kalman Filter are discussed.
Key words: Kalman filters, navigation, liner optimal algorithm, Kalman-type algorithm.
Получено 08.09.2012
189
Документ
Категория
Без категории
Просмотров
14
Размер файла
1 898 Кб
Теги
нелинейные, оценивания, оптимальное, типа, измерения, алгоритм, линейный, калмановской, связи, задача, алгоритма
1/--страниц
Пожаловаться на содержимое документа