close

Вход

Забыли?

вход по аккаунту

?

Синтез стабилизирующих управлений и анализ устойчивости в задаче путевой стабилизации колесных роботов.

код для вставкиСкачать
На правах рукописи
Пестерев Александр Витальевич
СИНТЕЗ СТАБИЛИЗИРУЮЩИХ УПРАВЛЕНИЙ И АНАЛИЗ
УСТОЙЧИВОСТИ В ЗАДАЧЕ ПУТЕВОЙ СТАБИЛИЗАЦИИ
КОЛЕСНЫХ РОБОТОВ
Специальность 05.13.01 Системный анализ, управление и обработка
информации (в отраслях информатики, вычислительной техники и
автоматизации)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени
доктора физико-математических наук
Москва 2013
Работа выполнена в Федеральном государственном бюджетном учреждении
науки Институте проблем управления им. В.А. Трапезникова РАН
Научный
консультант:
доктор физико-математических наук,
Рапопорт
Лев Борисович
Официальные оппоненты:
Иванов Александр Павлович, доктор физико-математических наук, профессор, заведующий кафедрой теоретической механики федерального
государственного бюджетного образовательного учреждения высшего профессионального образования Московский физико-технический институт
Ткачев Сергей Борисович, доктор физико-математических наук, доцент, профессор кафедры математического моделирования федерального государственного бюджетного образовательного учреждения высшего профессионального
образования Московский государственный технический университет имени
Н.Э. Баумана
Фомичев Василий Владимирович, доктор физико-математических наук, профессор кафедры нелинейных динамических систем и процессов управления
федерального государственного бюджетного образовательного учреждения
высшего профессионального образования Московский государственный
университет имени М.В. Ломоносова
Ведущая организация: Федеральное государственное бюджетное учреждение науки Институт проблем механики им. А.Ю. Ишлинского РАН,
лаборатория робототехники и мехатроники и лаборатория механики управляемых систем
Защита состоится 6 марта 2014 г. в 14 часов на заседании диссертационного совета Д 002.226.02 при ФГБУН Институте проблем управления
им. В.А. Трапезникова РАН по адресу: 117997, Москва, Профсоюзная, 65
С диссертацией можно ознакомиться в библиотеке ФГБУН Института
проблем управления им. В.А. Трапезникова РАН.
Автореферат разослан
2013 г.
Ученый секретарь диссертационного совета
кандидат физико-математических наук
Галяев А.А.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Колесными роботами
ботами)
(далее, КР, или просто
ро-
будем называть автоматические транспортные средства с установ-
ленными на них навигационным и инерциальным оборудованием. Колесные
роботы могут использоваться для выполнения ряда нетривиальных операций,
таких как обход препятствий, проникновение в труднодоступные зоны, прецизионное движение по сложным криволинейным траекториям. Мобильность и
автономность таких роботов делает привлекательным их использование в самых разнообразных сферах человеческой деятельности, включая военное дело, сельское хозяйство, строительство, домашнее хозяйство и т.п. Многообразие сфер применения КР и решаемых ими задач определяет многообразие
задач управления движением КР. Сложность возникающих в этой области задач обусловлена, в частности, тем, что КР представляет из себя неголономную
механическую систему. Достаточно полное и систематическое изложение механики неголономных систем общего вида дано в монографии Неймарка Ю.И. и
Фуфаева В.А. С точки зрения теории управления, принципиальным отличием
неголономных систем от голономных является то, что полная управляемость
неголономных систем достигается с помощью меньшего числа управлений, т.е.,
число приводов в робототехнической системе может быть меньше числа степеней свободы этой системы. С другой стороны, задачи планирования движения
для неголономных систем значительно труднее аналогичных задач для голономных систем.
Последние тридцать лет активно развивается теория управления движением неголономных колесных систем. Интерес к этой области вызван как важностью задач управления движением с точки зрения практики, так и новизной
возникающих здесь математических задач, требующих привлечения новых методов исследования, не применявшихся ранее в классической теории управления. Последние включают, в том числе, методы дифференциальной геометрии
и геометрической теории управления. Задачам управления движением колесных роботов посвящено огромное число публикаций, простое перечисление которых заняло бы слишком много места.
Одной из важных задач управления движением, возникающей во многих
приложениях, является задача путевой стабилизации, под которой понимается
выведение транспортного средства на заданный путь, проложенный по ровной поверхности или пересеченному рельефу, и стабилизация его движения
3
вдоль этого пути. Хотя математическая постановка задачи путевой стабилизации известна достаточно давно, в последние два десятилетия наблюдается
значительный рост интереса к ней, связанный с появлением и внедрением в повседневную практику спутниковой навигации, которая позволяет определять
позицию и ориентацию транспортного средства с высокой (сантиметровой, а
иногда и миллиметровой) точностью. Необходимость в решении задач управления движением с такой высокой точностью возникает во многих приложениях. Например, в сельском хозяйстве возник даже специальный термин
земледелие (precise agriculture),
точное
обозначающий совокупность приложений, тре-
бующих высокой точности выполнения операций движущимися транспортными средствами, например, задачи, связанные с посадкой растений, внесением
удобрений на засеянные участки и т.п. (Berducat M., Cariou C., Cordesses L.,
Lenain R., Martinet P., Thuilot B.). Из вышесказанного следует, что существует
реальный запрос на разработку высокоточных методов управления движением колесных роботов, позволяющих решать задачи прецизионного движения
вдоль заданной кривой.
Один из часто и успешно применяемых подходов к решению различных
задач стабилизации движения, включая задачу путевой стабилизации, основан на точной линеаризации уравнений движения с помощью подходящим образом выбранной обратной связи (d'Andrea-Novel D., Di Benedetto M.D., Itoh
T., Khalil H.K, De Luca A., Nakamichi M., Oriolo G., Samson C., Sampei M.,
Sastry S., Tamura T.). В рамках этого подхода ищется такая нелинейная обратная связь, замыкание которой делает систему линейной. Применение этого
подхода к конкретной системе предполагает приведение уравнений движения
к некоторому специальному виду, из которого легко находится линеаризующая
обратная связь, так что задача сводится, по существу, к нахождению подходящей замены переменных. В ряде работ искомое представление для кинематической и автомобилеподобной моделей КР, а также для модели робота с
прицепами, было выведено из цепной формы уравнений движения (Berducat
M., Cariou C., Cordesses L., Lenain R., De Luca A., Martinet P., Oriolo G., Samson
C., Thuilot B.). Цепное представление (Murray R.M., Sastry S.S.), являющееся
одним из наиболее важных канонических представлений, используемых в области управления колесными роботами, особенно полезно в случае КР с двумя
управлениями. Применение цепного преобразования к системе с одним входом
(в том числе, к задаче путевой стабилизации) дает неавтономную систему, которая легко приводится к линейному виду (De Luca A., Oriolo G., Samson C.).
4
Однако, представление задачи путевой стабилизации, полученное с помощью цепного преобразования, является далеко не единственным представлением, допускающим точную линеаризацию с помощью обратной связи, к тому
же приведение уравнений движения к цепному виду является в общем случае
нетривиальной задачей. Хорошо известно, что уравнения движения подавляющего большинства моделей КР (включая модели, рассматриваемые в настоящей работе) могут быть представлены в виде аффинной системы (системы,
нелинейной по переменным состояния и линейной по управлению) с одним или
двумя входами. В задаче путевой стабилизации управление скалярно (система
управляется поворотом рулевых колес), так что соответствующая аффинная
система имеет один вход. Специальными формами аффинных систем, допускающими линеаризацию с помощью обратной связи, являются каноническое
и квазиканоническое представления (Жевнин Ф.Ф., Клинковский М.Г., Крищенко А.П., Ткачев С.Б., Brockett R.W., Hunt L.R., Jacubczyk B., Meyer G.,
Respondek W., Su R.). Аналогом квазиканонического представления для стационарных аффинных систем с заданным выходом является нормальная форма
(Byrnes C., Isidori A.). Так как выход в задачах путевой стабилизации фиксирован (им обычно служит отклонение КР от целевого пути), нормальная форма аффинной системы представляется наиболее естественным кандидатом на
роль искомого представления. Однако известные из литературы методы приведения к квазиканоническому виду или нормальной форме требуют (кратного)
дифференцирования дрейфового поля системы по времени и, таким образом,
неприменимы в случае, когда скорость робота является априори неизвестной
функцией времени и ее производные не могут быть измерены. Поэтому актуальна проблема разработки методов приведения таких аффинных систем к
нормальному (каноническому) виду.
Так как ресурс управления реальных колесных систем всегда ограничен,
система, замкнутая управлением, синтезированным с помощью методов точной
линеаризации, не может быть линейной во всей области определения и, следовательно, стабилизируемость системы при произвольных начальных условиях не гарантируется. Поэтому актуальна задача построения оценки области
притяжения целевого пути. Для решения последней задачи для двух моделей
колесных роботов и целевых кривых специального вида Рапопорт Л.Б. использовал методы теории абсолютной устойчивости (Гелиг А.Х., Леонов Г.А.,
Пятницкий Е.С., Формальский А.М., Якубович В.А.). В диссертационной работе указанный подход обобщен на случай произвольных моделей колесных
5
роботов, уравнения движения которых приводятся к каноническому виду, и
произвольных допустимых целевых кривых. Подход основан на введении системы сравнения для рассматриваемой нелинейной системы. В широком смысле, системой (или моделью) сравнения называется более простая по сравнению
с исходной система, процессы в которой мажорируют в некотором смысле процессы в исходной сложной системе и из устойчивости которой вытекает устойчивость исходной системы (Анапольский Л.Ю., Васильев С.Н., Козлов Р.И.,
Матросов В.М., Матросова Н.И., Теренгулов А.Э.). В рассматриваемом в работе частном случае системой сравнения служит линейная нестационарная система, правая часть которой имеет ту же структуру, что и правая часть исходной
нелинейной системы, и удовлетворяет секторному ограничению, а искомая область ищется в виде инвариантного эллипсоида (Поляк Б.Т., Черноусько Ф.Л.,
Щербаков П.С.) системы сравнения.
Целью
диссертационной работы является разработка теоретических ос-
нов и методов стабилизации движения неголономных колесных систем вдоль
заданного целевого пути и построения областей притяжения для систем с ограниченным ресурсом управления и фазовыми ограничениями. Поставленная
цель достигается решением следующих
основных задач:
разработка метода приведения уравнений движения колесных роботов
к каноническому виду;
применение разработанного метода приведения уравнений движения
колесных роботов к каноническому виду для синтеза стабилизирующих управлений для кинематической и автомобилеподобной моделей колесных роботов;
разработка методов решения задачи путевой стабилизации при движении по неровной поверхности;
исследование глобальной стабилизируемости кинематической модели
колесного робота с ограниченным ресурсом управления вдоль прямого целевого пути;
разработка метода построения оценок областей устойчивости нулевого
решения канонической системы при ограниченном ресурсе управления;
применение разработанного метода построения оценок областей устойчивости нулевого решения канонической системы для нахождения аппроксимаций областей притяжения целевого пути для автомобилеподобного робота с
ограниченным ресурсом управления и фазовыми ограничениями;
разработка метода аналитического решения системы двух линейных
матричных неравенств второго порядка;
6
применение метода аналитического решения системы линейных матричных неравенств для нахождения наилучшей эллипсоидальной аппроксимации области притяжения целевого пути для кинематической модели колесного робота с ограниченным ресурсом управления;
разработка метода построения допустимого целевого пути для автомобилеподобного робота с помощью кубических В-сплайнов.
Методы исследования.
В диссертации применяются методы диффе-
ренциальной геометрии, теории дифференциальных уравнений, математической и геометрической теорий управления, теории устойчивости движения,
теории оптимизации, линейной алгебры, линейных матричных неравенств и
теории неголономных механических систем.
Научная новизна.
1. Введено не используемое ранее в теории управления движением колесных систем понятие канонического представления задачи путевой стабилизации, как представления, легко приводимого к линейному виду с помощью подходящим образом выбранной обратной связи, позволившее разработать единый
подход к решению задач путевой стабилизации для широкого класса робототехнических колесных систем, моделями которых являются нестационарные
аффинные системы со скалярными входом и выходом.
2. Специфической особенностью рассматриваемых аффинных систем является то, что дрейфовое поле системы не может быть продифференцировано
по времени (связано это в данном случае с тем, что зависимость скорости движения робота априори не известна, а ее производные не могут быть измерены). Для таких систем не применимы стандартные методы теории нормальных
форм. Показано, что каноническое представление является нормальной формой некоторой промежуточной аффинной системы, полученной из исходной
с помощью замены независимой переменной. Установлен общий вид замены
независимой переменной, позволяющий избавиться от указанной нестационарности в дрейфовом поле.
3. Найдены две замены независимой переменной, приводящие к двум различным каноническим представлениям, и с их помощью синтезированы два новых стабилизирующих закона управления для кинематической модели и два
новых закона управления для автомобилеподобного робота. Показано, что новые законы управления имеют несомненные преимущества по сравнению с
другими, известными из литературы, законами управления, полученными с
помощью методов точной линеаризации.
7
4. Синтезированы стабилизирующие законы управления для кинематической и автомобилеподобной моделей колесных роботов, движущихся по неровной поверхности.
5. Разработан основанный на применении результатов теории абсолютной устойчивости подход к построению оценок областей устойчивости нулевого решения канонической системы при ограниченном ресурсе управления,
позволяющий находить эллипсоидальные аппроксимации областей притяжения целевых путей для колесных роботов общего вида. Нахождение указанных
аппроксимаций сведено к решению систем линейных матричных неравенств и
проверке скалярного условия.
6. Для линейных матричных неравенств второго порядка найдено аналитическое решение, что позволило поставить задачу построения эллипсоидальной аппроксимации области притяжения наибольшей площади для кинематической модели колесного робота. Решение указанной оптимизационной задачи
сведено к стандартной задаче условной оптимизации функции двух переменных.
7. Разработан новый метод сглаживания кривизны В-сплайновой аппроксимации целевого пути для автомобилеподобного робота, построенной по зашумленным измерениям.
Достоверность результатов
подтверждена строгими доказательства-
ми, результатами численного моделирования и натурными экспериментами.
Практическая ценность
полученных результатов состоит в том, что
предложенные подходы к решению задач синтеза стабилизирующих управлений для колесных роботов и нахождению оценок областей притяжения доведены до конструктивных методов. Стабилизирующие законы управления для
кинематических и автомобилеподобных моделей колесных роботов, синтезированные в диссертации, могут быть использованы для управления движением реальных колесных роботов. Один из приведенных в диссертации законов
управления, синтезированных для автомобилеподобного робота, был апробирован на колесном роботе, созданном в компании Джавад Джи Эн Эс Эс на
базе легкового автомобиля НиваШевроле. Результаты полевых испытаний
продемонстрировали высокую эффективность стабилизации в условиях переменной скорости движения в диапазоне скоростей до 5м/с.
Апробация результатов работы.
Результаты диссертационной рабо-
ты докладывались на заседаниях семинаров Теория автоматического управления под рук. д.т.н. Поляка Б.Т. (Москва, ИПУ РАН, 2008 и 2011 гг.), Нели8
нейные динамические системы и процессы управления под рук. чл.-корр. РАН
Крищенко А.П. (Москва, МГТУ им. Н.Э. Баумана, июнь и сентябрь 2013),
Проблемы нелинейной динамики и управления под рук. акад. Емельянова
С.В. (Москва, МГУ им. М.В. Ломоносова, 2013), Теория управления и динамика систем под рук. акад. Ф.Л. Черноусько (Москва, ИПМех РАН, 2013
г.), на международной конференции американского общества инженеров механиков ASME IDETC/CIE (Лас-Вегас, США, 2007, Сан-Диего, США, 2009),
на международном семинаре им. Е.С. Пятницкого Устойчивость и колебания
нелинейных систем управления (Москва, 2008, 2010, 2012 гг.), на 6-й международной конференции EUROMECH ENOC2008 (Санкт-Петербург, 2008), на
IX Крымской международной математической школе Метод функций Ляпунова MFL-2008 (Алушта, Украина, 2008), на XXVI конференции памяти Н.Н.
Острякова (Санкт-Петербург, 2008), на 4-й международной конференции по
проблемам управления (Москва, 2009), на 18-м всемирном конгрессе IFAC (Милан, Италия, 2011), на 10-м международном симпозиуме IFAC по управлению
роботами (Дубровник, Хорватия, 2012), на IV международной конференции по
оптимизации и приложениям OPTIMA2013 (Петровац, Черногория, 2013).
Работа выполнена при поддержке комплексной Программы 22 Президиума РАН, государственной программы поддержки ведущих научных школ РФ
(НШ-1676.2008.1), программы ОЭММПУ ќ 15, межсекционной программы ќ
1 ОЭММПУ РАН Научные основы робототехники и мехатроники.
Публикации.
Основные результаты диссертации опубликованы в 23 на-
учных статьях [123], в том числе в 12 статьях [112], опубликованных в журналах из Перечня ведущих научных журналов и изданий ВАК, и 8 тезисах
докладов [2431].
Личный вклад соискателя.
Все исследования, результаты которых
представлены в диссертационной работе, проведены лично соискателем в процессе научной деятельности. Из совместных публикаций в диссертацию включен лишь тот материал, который непосредственно принадлежит соискателю.
Структура и объјм работы.
Диссертация состоит из введения, четы-
рех глав, выводов и списка литературы, а также содержит 40 рисунков. Общий
объјм диссертации составляет 212 страниц. Библиография включает 128 наименований.
9
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы, сформулированы цели и задачи исследования, научная новизна, теоретическая и прикладная значимость
полученных результатов, основные положения, выносимые на защиту, а также
приведены данные о структуре и объеме диссертации.
В
первой главе
рассматриваются примеры моделей колесных роботов
и обсуждается постановка задачи путевой стабилизации.
В разделе 1.1 обсуждается классификация задач управления движением
колесных роботов и дается общее представление о задаче путевой стабилизации, под которой понимается задача выведения колесного робота на заданный
целевой путь и стабилизации его движения вдоль этого пути.
В разделе 1.2 вводится понятие допустимого целевого пути и формулируются требования, предъявляемые к целевым путям.
В разделе 1.3 рассматриваются некоторые модели колесных роботов, выводятся уравнения движения кинематической и автомобилеподобной моделей,
обсуждаются вопросы, связанные с учетом динамики механизма привода рулевых колес и ограниченностью ресурса управления. Основное внимание уделено двум классическим кинематической и автомобилеподобной моделям
колесных роботов, так как именно эти модели используются в последующих
главах в качестве примеров применения разработанных в диссертации методов
и алгоритмов. Вводится понятие путевых координат (переменных), в терминах
которых уравнения движения колесных роботов принимают наиболее удобный
вид с точки зрения задачи путевой стабилизации. Для кинематической модели путевые координаты это переменные d, ? и s, где d отклонение робота
от целевого пути, ? угловое отклонение (угол между вектором скорости и
касательной к целевому пути в ближайшей к роботу точке) и s значение параметра целевой кривой в ближайшей к роботу точке. Уравнения движения
кинематической модели в путевых координатах имеют вид
d? = v sin ?,
cos ?
,
?? = vu ? vk1?kd
cos ?
s? = v1?kd
,
где v ? v(t) скорость движения
целевой точки
(1)
(точки, расположенной посе-
редине оси, соединяющей задние колеса), k ? k(s) кривизна целевой кривой,
управлением служит мгновенное значение кривизны u траектории, описывае10
мой целевой точкой, связанное с углом ? поворота передних колес соотношением u = tg ?/L, и L расстояние между осями передних и задних колес.
Уравнения движения автомобилеподобного робота в путевых переменных
получаются добавлением к системе (1) уравнения, описывающего динамику
механизма привода колес:
d?
??
??
s?
= v sin ?,
?
vk cos ?
= v tg
L ? 1?kd ,
= u,
cos ?
= v1?kd
.
(2)
Управление u в данной модели угловая скорость поворота передних колес.
f3 = (?1/k?, 1/k?) Ч S 1 Ч R1
Системы (1) и (2) определены на многообразиях M
f4 = (?1/k?, 1/k?) Ч S 1 Ч (???, ??) Ч R1 соответственно, где S 1 одномерное
иM
многообразие, гомеоморфное окружности (т.е. отрезок [0, 2?] с отождествленными концами), k? максимальное значение кривизны целевой кривой и ?? максимально возможный угол поворота передних колес.
Для колесного робота с n степенями свободы будем говорить, что его
уравнения движения записаны в путевых переменных, если первая, вторая и
последняя компоненты вектора состояния совпадают с определенными выше
переменными d, ? и s соответственно. Всюду далее для вектора путевых переменных и вектора, составленного из его первых n ? 1 компонент, используются
обозначения x? и x соответственно: x?T = [xT , s].
В разделе 1.4 обсуждаются особенности постановки задачи путевой стабилизации в случае движения по неровной поверхности. Предполагается, что
рельеф поверхности описывается гладкой функцией и в окрестности любой
точки на расстояниях порядка размера платформы робота хорошо аппроксимируется касательной плоскостью. Такое предположение позволяет использовать рассмотренные в разделе 1.3 плоские модели колесных роботов, которые в
этом случае описывают движение робота в касательной плоскости. Положение
касательной плоскости в любой точке поверхности рельефа описывается двумя углами: углом ?1 наклона вектора скорости v к горизонтальной плоскости
(угол тангажа) и углом ?2 между вектором, лежащим в касательной плоскости
перпендикулярно вектору v , и горизонтальной плоскостью (угол крена). Значения этих углов могут быть вычислены, если задано математическое описание
поверхности, или измерены в процессе движения (например, при наличии двух
спутниковых антенн). В первом случае углы ?1 и ?2 зависят от переменных
11
состояния d, ?, s, а во втором случае являются априори неизвестными функциями времени. В качестве целевого пути предлагается использовать проекцию
желаемого пути на плоскость локального горизонта. Выведены уравнения движения кинематической и автомобилеподобной моделей в касательной плоскости.
В разделе 1.5 приводится математическая постановка задачи путевой стабилизации. Анализ существующих моделей колесных роботов (включая модели, рассмотренные в разделе 1.3) показывает, что уравнения их движения
описываются нелинейными аффинными системами, определенными на гладких многообразиях. Для модели колесного робота, пространство конфигураций которого n-мерно, задача путевой стабилизации может быть записана в
виде нелинейной аффинной системы управления со скалярным входом:
x?? = g0 (x?, t)?(t) + g1 (x?, t)u,
(3)
где ?(t) ? ?0 > 0 непрерывная (вообще говоря, неизвестная) функция време-
fn вектор путевых переменных, M
fn = M n?1 ЧR1 гладкое n-мерное
ни, x? ? M
многообразие (пространство конфигураций робота), x?T = [xT , s], x ? M n?1 ,
fn и ?t ? R+ ,
s ? R1 , g0 (x?, t) и g1 (x?, t) векторные поля, g1 (x?, t) ?= 0 ?x? ? M
n-ая компонента g1n поля g1 равна нулю,
fn ?t ? R+ ,
g1n (x?, t) = 0 ?x? ? M
(4)
и u скалярное управление. Что касается вида дрейфового поля в правой части (3), в реальных задачах путевой стабилизации типична ситуация (например, при так называемом полуавтономном выводе транспортного средства на
целевой путь, когда поворотом рулевого колеса управляет автоматика, а скоростью водитель), когда зависимость скорости от времени априори неизвестна, ее значения находятся из измерений, и при этом производные скорости по
времени не могут быть измерены. С другой стороны, как будет видно из дальнейшего, приведение системы (3) к удобному для синтеза стабилизирующего
управления виду требует дифференцирования дрейфового поля по времени.
В связи с этим, а также благодаря тому, что скорость входит мультикапликативно во все компоненты дрейфового поля, представляется целесообразным
представлять дрейфовое поле в виде произведения гладкого поля g0 (x?, t) и
функции ?(t).
u(x?, t)
Dx ? M n?1 ,
Определение 1. Функцию
будем называть
стабилизирующей обрат-
?s0 ? R1 , ?t0 ? R+ и ?x0 ? Dx решение (x(t), s(t)) системы (3), замкнутой обратной связью u(x?, t), с начальным
ной связью
в области
если
12
условием
t??
и
x(t0 ) = x0 , s(t0 ) = s0 устойчиво по переменной x1 , x1 (t) ? 0
s(t) монотонно возрастающая функция времени.
при
В соответствии с данным определением задача путевой стабилизации заключается в нахождении стабилизирующей обратной связи.
Вторая глава
посвящена синтезу стабилизирующих законов управления
движением колесных роботов, основанных на методе точной линеаризации с
помощью нелинейной обратной связи. Метод заключается в нахождении такого зависящего от переменных состояния управления, подстановка которого
в исходную нелинейную систему превращает ее в линейную замкнутую экспоненциально устойчивую систему. Нахождение линеаризующей обратной связи
предполагает приведение уравнений движения к некоторому специальному виду, допускающему такую линеаризацию, так что задача сводится, по существу,
к нахождению подходящей замены переменных.
В разделе 2.1 отмечается характерная особенность рассматриваемых моделей колесных роботов, заключающаяся в том, что стабилизация в нуле отклонения целевой точки от целевой кривой влечет за собой стабилизацию еще
n ? 2 величин, где n порядок системы (3). Наличие такого свойства позволяет сделать предположение о существовании единого для всех рассматриваемых
моделей канонического представления задачи путевой стабилизации.
Определение 2. Будем говорить, что задача путевой стабилизации для
аффинной системы (3), определенной на многообразии
fn = M n?1 ЧR1 , предM
ставима в каноническом виде, если найдутся
1) открытая область
Dx ? M n?1 ,
? = ?(x, s, t), удовлетворяю? s, t) ? ?? (x) > 0 ?x ? Dx , ?s ? R1 , ?t ? R+ , и
щая условию ?(x,
3) сохраняющее x1 отображение z = ?(x, s, ?), являющееся при любых фик1
сированных s ? R и ? ? R+ диффеоморфизмом Dx и открытого множества
Dz (s, ?) ? Rn?1 , содержащего начало координат z = 0,
2) обратимая замена независимой переменной
такие, что система (3) принимает вид
z1?
= z2 ,
..
.
?
zn?2
= zn?1 ,
?
zn?1
= f0 (z, s, ?) + f1 (z, s, ?)u,
s?
= ?(z, s, ?),
где
?s ? R1 , ?? ? R+
и
?z ? Dz (s, ?) ?(z, s, ?), f0 (z, s, ?)
13
(5)
и
f1 (z, s, ?)
кусочно-
s
непрерывные по
и гладкие по
z
и
?
функции,
f1 (z, s, ?) ?= 0
и
?(z, s, ?) ?
?0 (z) > 0.
канонической системой
Система (5) называется
КР, переменные
z
и
уравнений движения
s каноническими переменными состояния, а множество
? ?
Dz =
Dz (s, ?)
??R+ s?R1
областью определения
канонической системы.
В определении 2 z = [z1 , . . . , zn?1 ]T вектор стабилизируемых переменных, а штрих обозначает дифференцирование по новой независимой переменной ? . Задача путевой стабилизации в каноническом представлении формулируется как задача синтеза закона управления u(z, s, ?), стабилизирующего
нулевое решение z = 0 системы (5).
Синтез стабилизирующего управления для канонической системы обсуждается в разделе 2.2. Удобство канонического представления (5) заключается
в том, что из него немедленно находится закон управления, линеаризующий
систему по части стабилизируемых переменных. Действительно, замыкая (5)
обратной связью
u(z, s, ?) = ?
1
(?(z) + f0 (z, s, ?)),
f1 (z, s, ?)
(6)
где ?(z) линейная функция, ?(z) = cT z, cT = [c1 , . . . , cn?1 ], ci > 0, получаем
систему, состоящую из линейной подсистемы порядка n ? 1 для определения
z и скалярного нелинейного уравнения:
z ? = Az,
(7)
s? = ?(z, s, ?).
(8)
Коэффициенты ci линейной формы всегда можно выбрать так, чтобы матрица
A была гурвицевой и, следовательно, нулевое решение системы (7) было глобально асимптотически устойчиво. Последнее, однако, не означает, что нулевое
решение канонической системы, замкнутой обратной связью (6), будет также
асимптотически устойчиво при любых начальных условиях, так как линейная
система (7) определена во всем пространстве Rn?1 , в то время как каноническая система определена только в области Dz ? Rn?1 .
Утверждение 1. Обратная связь (6) стабилизирует решение
z =0
кано-
нической системы (5) при любых начальных условиях, принадлежащих инвариантному множеству
области
DzI
линейной системы (7), целиком лежащему в
Dz , DzI ? Dz .
14
Доказана теорема о том, что обратная связь (6) является стабилизирующим
управлением и для исходной системы (3) при надлежащем выборе начальных
значений.
Теорема 1. Пусть задача путевой стабилизации для системы (3) предста-
вима в каноническом виде и пусть
DzI ? Dz
- инвариантное множество
линейной системы (7), целиком лежащее в области
Dz .
Тогда, каковы бы ни
s0 ? R1 и ?0 ? R+ , обратная связь u(z, s, ?), определенная при s ? s0
и ? ? ?0 формулой (6), является стабилизирующей обратной связью для ис0
I
I
?1
I
ходной системы (3) при любых x ? Dx (s0 , ?0 ), где Dx (s, ?) = ? (Dz , s, ?) I
образ множества Dz при обратном преобразовании.
были
В разделе 2.3 обсуждается центральная проблема главы 2 приведение
исходной аффинной системы (3) к каноническому виду (5). Так как каноническая система (5) представляет собой частный случай нормальной формы
некоторой нелинейной аффинной системы с относительной степенью выхода
y = z1 равной n ? 1, возникает вопрос нельзя ли воспользоваться результатами
теории нормальной формы для стационарных (A. Isidori) или нестационарных
(С. Ткачев) аффинных систем. Оказывается, что непосредственное применение методов теории нормальных форм возможно только в случае постоянной
скорости движения робота. В случае же переменной скорости требуется предварительное приведение системы к промежуточному виду, в котором дрейфовое поле не содержит функции ?(t).
Рассмотрим сначала нелинейную стационарную аффинную систему общего вида
x?? = f (x?) + g(x?)u
(9)
со скалярными входом u и выходом y = h(x?), где h(x?) гладкая скалярная
функция, а g(x?) ? [g 1 (x?), . . . , g n (x?)]T непрерывное векторное поле. Относительно дрейфового поля f (x?) ? [f 1 (x?), . . . , f n (x?)]T , мы для начала предположим, что оно дифференцируемо столько раз, сколько потребуется, а затем
сформулируем минимальные условия на его гладкость применительно к задаче
путевой стабилизации.
Определение 3.
ную степень r
(A. Isidori)
в точке
Lg Lkf h(x?) = 0 для
k < r ? 1;
r?1
0
(б) Lg Lf h(x? ) ?= 0,
(а)
x?0 ,
Говорят, что система (9) имеет
относитель-
если
любых
x?,
принадлежащих окрестности
15
x?0 ,
и всех
Lf ? производная Ли скалярной функции ?(x?) по векторной функции
f (x?), Lf ? = [??/?x1 , · · · , ??/?xn ] · f (x?), а Lkf ? = Lf (Lk?1
f ?) производная
Ли k -го порядка.
где
Если свойства (а) и (б) определения 3 выполняются для любых x?0 , принадлежащих открытому множеству D?x , говорят, что система имеет
относительную степень
равномерную
r в области D?x .
Введем обозначения
(10)
?1 (x?) = h(x), ?2 (x?) = Lf h(x), . . . , ?r (x?) = Lr?1
f h(x?).
Справедливо следующее утверждение (A. Isidori). Если система имеет относительную степень r в точке x?0 ? D?x , то r ? n и найдутся n ? r функций
?r+1 (x?), . . . , ?n (x?), удовлетворяющих условию Lg ?r+1 (x?) = · · · = Lg ?n (x?) = 0,
таких, что якобиан преобразования z? = ?(x?), где ?(x?) = [?1 (x), . . . , ?n (x)]T ,
не вырожден и в новых координатах zi = ?i (x) система (9) принимает вид
z?1 = z2 , . . . , z?r?1 = zr , z?r = f0 (z?) + f1 (z?)u, z?r+1 = ?r+1 (z?), . . . , z?n = ?n (z?), (11)
где z? = [z1 , . . . , zn ]T , f0 (z?) = Lrf y(z?) и f1 (z?) = Lg Lr?1
f y(z?) ?= 0. Система (11)
называется нормальной
пенью
формой
аффинной системы (9) с относительной
сте-
выхода r.
Пусть теперь относительная степень выхода системы (9) в точке x?0 ? D?x
равна n ? 1. Тогда еј нормальная форма (11) в окрестности x?0 имеет вид
z?1
z?n?2
z?n?1
z?n
=
..
.
=
=
=
z2 ,
zn?1 ,
f0 (z?) + f1 (z?)u,
?(z?),
(12)
где zi = ?i (x?), функции ?i (x?), i = 1, . . . , n ? 1, определены формулами (10), а
функция ?n (x?) может быть выбрана так, что она удовлетворяет уравнению
Lg ?n (x?) = 0
и якобиан отображения z? = ?(x?) не вырожден. При этом функции f0 (z?) и
f1 (z?) в правой части нормальной формы находятся по формулам
f0 (z?) = f?0 (??1 (z?)), f?0 (x?) = Ln?1
f h(x?),
(13)
f1 (z?) = f?1 (??1 (z?)), f?1 (x?) = Lg Ln?2
f h(x?) ?= 0.
(14)
16
Доказывается, что при определенных условиях исходная система приводится к нормальной форме с помощью преобразования, сохраняющего первую
и последнюю переменные состояния.
f i (x?) дрейфового поля f (x?) аффинной систеfn и удовлетворяющей условию (4),
многообразии M
Теорема 2. Пусть компоненты
мы (9), определенной на
имеют вид
f i = f i (x1 , . . . , xi+1 , xn ), i = 1, . . . , n ? 2, f n = f n (x1 , x2 , xn )
и в некоторой открытой области
fn
D?x ? M
(15)
удовлетворяют условиям
?f i (x?)
?= 0, i = 1, . . . , n ? 2.
?xi+1
(16)
Пусть относительная степень системы (9) с выходом
ке
x?0 ? D?x
равна
n ? 1.
y = x1
Тогда в некоторой окрестности точки
в точ-
x?0
си-
стема (9) приводится к нормальному виду (12) с помощью преобразования
(z, zn ) = (?(x, xn ), xn ),
где
z = [z1 , . . . , zn?1 ]T , ?(x, xn ) = {?i (x, xn )}n?1
i=1
опре-
делено формулами
(17)
?1 (x?) = x1 , ?2 (x?) = Lf x1 , . . . , ?n?1 (x?) = Ln?2
f x1 ,
функции
f0 (z?)
и
f1 (z?)
имеют вид (13) и (14) соответственно и
?(z?) = f n (??1 (z?)).
fn Пусть теперь аффинная система (9) описывает движение КР и x? ? M
вектор путевых переменных. Доказывается, что при некоторых дополнительных предположениях нормальная форма (12) является каноническим представлением задачи путевой стабилизации.
D?x вида
y = x1 имеет
Теорема 3. Пусть условия теоремы 2 выполняются в области
D?x = Dx ЧR1 , Dx ? M n?1 , и пусть система (9) с выходом
в области D?x равномерную относительную степень n ? 1 и удовлетворяет
условию
f n (x, s) ? f0n (x) > 0.
Пусть при
?s ? R1
(17) диффеоморфизм области
ства координатного пространства
Rn?1 ,
(18)
Dx
и открытого множе-
содержащего точку
z=0
вместе
с некоторой ее окрестностью. Тогда задача путевой стабилизации для системы (9) представима в
Dx
в каноническом виде.
17
Условия (15), (16) и (18), а также предположение о существовании области вида Dx ЧR1 , в которой система (9) имеет равномерную относительную
степень n ? 1, достаточные для существования канонического представления
задачи путевой стабилизации, с одной стороны, не являются очень обременительными и, с другой стороны, легко проверяются. В частности, им удовлетворяют все рассматриваемые в диссертации модели КР.
Доказательство теоремы 2 опирается на предположение существования
всех производных дрейфового поля f (x?), необходимых для вычисления якобиана преобразования (17). В теории нормальных форм на поле f (x?), как правило,
накладывается условие гладкости. Однако применительно к рассматриваемой
в работе задаче путевой стабилизации такое требование ограничивает область
применимости предлагаемых в настоящей работе методов, так как, в свою очередь, требует, чтобы целевые кривые были бесконечно-дифференцируемыми
по путевому параметру s, что редко выполняется на практике. С целью избавиться от данного ограничения, определим минимальные требования на дифференцируемость поля f (x?) по s, так как именно они определяют ограничения
на допустимые целевые пути, полагая при этом, что по остальным переменным состояния x1 , . . . , xn?1 , поле f (x?) дифференцируемо столько раз, сколько
требуется.
Теорема 4. Пусть система (9) с выходом
ям теоремы 2 и пусть
векторного поля
f (x?).
l ? 1
были
n?l?1
удовлетворяют услови-
номер первой зависящей от
s
компоненты
Тогда для существования нормальной формы системы
в окрестности любой точки
f (x?)
y = x1
x?0 ? D?x
достаточно, чтобы компоненты поля
раз дифференцируемыми функциями
s.
С помощью теоремы 4 легко находятся условия, которым должен удовлетворять целевой путь, чтобы быть допустимым для данной модели КР.
Нестационарная аффинная система
x?? = f (x?, t) + g(x?, t)u
(19)
со скалярными входом u и выходом h(x?, t) и гладким дрейфовым полем f (x?, t)
приводится к нормальной форме в окрестности точки (x?0 , t0 ) расширенного
пространства состояний аналогично стационарной системе (С. Ткачев), при
этом более полезным является понятие равномерной по t относительной степени.
Определение 4.
h(x?, t)
(С. Ткачев)
Если относительная степень выхода
y =
системы (19) определена и постоянна во всех точках множества
18
{(x?, t) : x? = x?0 , t ? R+ }, будем говорить, что в точке x?0 определена равномерная по t относительная степень. Если относительная степень r , равn
номерная по t, определена и постоянна во всех точках множества D?x ? M? ,
то будем говорить, что выход системы (19) имеет равномерную по t относительную степень r в D?x .
Аналогично теоремам 2 и 3 в стационарном случае доказываются теоремы о приведении системы (19) к нормальной форме в окрестности точки
(x?0 , t0 ) расширенного пространства состояний с помощью преобразования, сохраняющего n-ю переменную состояния, и к каноническому виду. При этом
дополнительно требуется, чтобы система имела равномерную по t относительную степень n ? 1 в некоторой области Dx ЧR1 и чтобы преобразование к нормальной форме было при ?s ? R1 и ?t ? R+ диффеоморфизмом области Dx и
открытого множества координатного пространства Rn?1 .
Проверка достаточных для существования канонического представления
задачи путевой стабилизации условий, как правило, не представляет трудностей. Таким образом, задача заключается в приведении исходной системы к
виду (9) или (19), т.е. в том, чтобы избавиться от функции ?(t) в дрейфовом
поле. Показано, что это можно сделать с помощью замены независимой переменной t 7? ? . Воспользуемся условием положительности функции ?(t) и
рассмотрим расширенную систему вида
x?? = g0 (x?, t)?(t) + g1 (x?, t)u,
?? = µ(x?)?(t),
(20)
fn от? M
крытое множество и µ(x?) > 0 ?x? ? D?x . Тогда ?(t) монотонно-возрастающая
функция времени при любых x? ? D?x и еј можно взять в качестве независимой переменной вместо времени. Переходя от дифференцирования по t в (20)
к дифференцированию по ? и заменяя t на ? в аргументах функций, получаем
промежуточную аффинную систему искомого вида
где ? ? R+ и µ(x?) гладкая скалярная функция. Пусть D?x
x?? = f (x?, ?) + g(x?, ?)u,
где f (x?, ?) = g?0 (x?, ?)/µ(x?) и g(x?, ?) = g?1 (x?, ?)/(µ(x?)??(?)) (здесь g?0 (x?, ?), g?1 (x?, ?)
и ??(?) обозначают функции, получающиеся из функций g0 (x?, t), g1 (x?, t) и ?(t)
подстановкой ? вместо t), для которой уже установлены условия существования канонического представления.
В разделе 2.4 изложенный выше метод приведения к каноническому виду
19
применяется к двум кинематической и автомобилеподобной моделям колесных роботов. С помощью двух различных замен независимой переменной
для каждой из моделей получены два различных канонических представления
задачи путевой стабилизации и на их основе синтезированы два различных
линеаризующих закона управления.
Рассмотрим сначала кинематическую модель (1) и открытые множества
f3 .
Dx = (?1/k?, 1/k?)Ч(??/2, ?/2) ? M 2 , D?x = Dx ЧR1 ? M
Положим µ(x) ? 1 во втором уравнении расширенной системы (20). При таком выборе µ независимой переменной очевидно служит путь, пройденный
роботом: ?(t) =
?t
v(? )d? . Применяя описанный выше формализм теории нормальных форм, получаем искомое каноническое представление (будем далее
называть его первым каноническим представлением) системы (1):
t0
z1? = z2 ,
?
2
2)
z2? = ? k(1?z
+
1 ? z22 u,
1
? 1?kz
1?z 2
s? = 1?kz12 ,
(21)
где
z1 = d, z2 = sin ?.
Последнее преобразование есть диффеоморфизм открытых областей Dx и Dz ,
где Dz область определения канонической системы,
Dz = (?1/k?, 1/k?)Ч(?1, 1) ? R2 .
(22)
Применяя формулу (6) к системе (21), получаем линеаризующую обратную
связь
?
k 1 ? z22
?(z)
?(d, sin ?) k cos ?
u = ??
+
?
?
(23)
+
.
1 ? kz1
cos ?
1 ? kd
1 ? z22
Аналогично, положив µ(x) = cos ? (при таком выборе µ независимую
переменную ? можно интерпретировать как проекцию пути, пройденного роботом, на касательное к целевой кривой направление) во втором уравнении
расширенной системы (20), находим второе каноническое представление
z1? = z2 ,
2
2 3/2
2 )k
z2? = ? (1+z
u,
1?kz1 + (1 + z2 )
1
s? = 1?kz1 ,
где
z1 = d, z2 = tg ?.
20
(24)
Область определения канонической системы (24) есть
Dz = (?1/k?, 1/k?)ЧR1 ? R2 .
(25)
Применяя формулу (6) к системе (24), находим линеаризующую обратную
связь
u=?
k
?(z)
k cos ?
3
?
+
?
??(d,
tg
?)
cos
?
+
.
1 ? kd
(1 + z22 )3/2
1 + z22 (1 ? kz1 )
(26)
Таким образом, с помощью двух различных замен независимой переменной, получены два различных канонических представления (21) и (24) и
два синтезированных на их основе закона управления для задачи путевой стабилизации: (23) и (26). Применяя любой из этих законов управления к системе
(1), получаем одну и ту же линейную систему (7) (при условии, что коэффициенты линейной функции ?(z) выбираются одинаковыми во обоих случаях). Раз
так, то возникает вопрос, в чем отличие одного закона управления от другого
и можно ли считать какой-либо из них более предпочтительным.
Главное различие двух канонических представлений заключается в том,
что область определения первой канонической системы уже области определения второй: область (22) является собственным подмножеством области (25). В
частности, для прямого целевого пути (k? = 0) область (25) совпадает со всем
координатным пространством R2 , в то время как область (22) представляет
из себя полосу |z2 | < 1 в R2 . Так как R2 , очевидно, является инвариантным
множеством линейной системы (7), система (24), замкнутая управлением (26),
глобально асимптотически устойчива в силу утверждения 1. Учитывая, что
образ R2 при обратном преобразовании есть Dx = R1 Ч(??/2, ?/2), в силу
теоремы 1, получаем следующее
Утверждение 2. Обратная связь (26) стабилизирует движение кинема-
тической модели колесного робота вдоль прямого целевого пути при произвольных начальных условиях
d(0)
и
??/2 < ?(0) < ?/2.
Область определения первой канонической системы (22) не является инвариантной областью линейной системы (7). Следовательно, нулевое решение
системы, замкнутой обратной связью (23), не обладает свойством глобальной
асимптотической устойчивости. В силу теоремы 1 управление (23) гарантирует асимптотическую устойчивость решения d = 0, ? = 0 системы (1), только
если начальные отклонения z1 (0), z2 (0) канонической системы принадлежат
инвариантному множеству DzI линейной системы z ? = Az , вписанному в полосу |z2 | ? 1. Оценка инвариантной области DzI может быть найдена, например,
21
с помощью квадратичной функции Ляпунова линейной системы. При малых
отклонениях (а именно отклонениях, принадлежащих инвариантному множеству линейной системы (7), вписанному в область (22)) траектории систем,
замкнутых обоими полученными законами управления, ведут себя одинаково
(при соответствующем выборе коэффициентов обратной связи в функции ? ).
Сравним законы управления (23) и (26) с известным из литературы линеаризующим законом управления (Samson C.)
[ks? d tg ? + k(1 ? kd) tg2 ? ? ?(z)] cos3 ? k cos ?
u=
,
+
(1 ? kd)2
1 ? kd
(27)
синтезированным из так называемой цепной формы уравнений движения
(Murray R.M., Sastry S.S.). В (27) k ? ? ks? (s) значение производной кривизны
по параметру кривой s в ближайшей к C точке целевой кривой, z = [z1 , z2 ]T и
z1 = d, z2 = (1 ? k(s)d) tg ?.
(28)
Легко показать, что управление (27) может быть получено в рамках предлагаемого в диссертации подхода, если ввести новую независимую переменную с
помощью функции µ(d, ?, s) = cos ?/(1 ? k(s)d) (при этом ? = s + C , где C
произвольная постоянная). Очевидно, что область значений преобразования
(28) совпадает с областью определения (25) канонического представления (24).
Следовательно, закон управления (27) гарантирует стабилизируемость системы в той же области начальных значений, что и закон (26). Основное отличие
закона управления (27) от законов (23) и (26) заключается в том, что применение закона (27) предполагает знание производной кривизны целевого пути
k ? (s), в то время как два последних используют только кривизну пути. Данное
обстоятельство означает, что закон управления (27) накладывает излишние
требования на гладкость целевого пути, так как хорошо известно, что путь
с кусочно непрерывной кривизной является допустимым для кинематической
модели (De Luca A.). Таким образом, обратная связь (27) определена не для
всех допустимых путей, что является еј серьезным недостатком.
Применяя любую из двух приведенных выше замен независимой переменной к системе (2) и преобразуя получившуюся промежуточную аффинную систему к нормальному виду, находим каноническое представление задачи
путевой стабилизации для автомобилеподобного робота. Введјм обозначение
x = [d, ?, ?, s]T . В случае первой замены независимой переменной (µ(x?) ? 1),
22
система (2) приводится к каноническому виду с помощью преобразования
cos ? tg ? k(s) cos2 ?
z1 = d, z2 = sin ?, z3 =
?
,
L
1 ? k(s)d
определенного в области
Dx = (?1/k?, 1/k?)Ч(??/2, ?/2)Ч(???, ??) ? M 3 .
Если ?? = ?/2, областью определения канонической системы будет открытое
множество
Dz = (?1/k?, 1/k?)Ч(?1, 1)ЧR1 ? R3 .
(29)
Линеаризующее управление определено формулой
[
vL cos2 ?
sin ? tg2 ?
u=?
?(z) ?
+
cos ?
L2
]
3k cos ? sin ? tg ? 3k 2 cos2 ? sin ?
ks? cos3 ?
+
?
?
.
L(1 ? kd)
(1 ? kd)2
(1 ? kd)3
(30)
Чтобы избежать громоздкости, правая часть формула дана в смешанных (x
и z ) обозначениях.
При использовании второй замены (µ(x) = cos ? ), система (2) приводится
к каноническому виду в той же области Dx с помощью преобразования
z1 = d, z2 = tg ?, z3 =
tg ?
k(s)
?
.
L cos3 ? (1 ? k(s)d) cos2 ?
(31)
Областью определения канонической системы при ?? = ?/2 будет множество
Dz = (?1/k?, 1/k?)ЧR2 .
(32)
Линеаризующее управление вычисляется по формуле
[
3 sin ? tg2 ?
u = ?vL cos2 ? cos4 ? ?(z) + 2
?
L cos5 ?
]
5k sin ? tg ?
k 2 sin ?
ks?
?
+
?
.
(33)
L(1 ? kd) cos4 ? (1 ? kd)2 cos3 ? (1 ? kd)3 cos2 ?
Как и в случае кинематической модели, различие двух полученных законов управления заключается в областях их определения: область (29) является
собственным подмножеством области (32), т.е. управление (33) определено в
большей области, чем управление (30). В частности, в случае прямого целевого пути, обратная связь (33) глобально стабилизирует систему при любых
z(0) ? R3 ; а именно, справедливо аналогичное утверждению 2
23
Утверждение 3. Обратная связь (33) стабилизирует движение автомо-
билеподобного робота (2) вдоль прямого целевого пути при произвольных начальных условиях
d(0), ??/2 < ?(0) < ?/2, ??/2 < ?(0) < ?/2.
В то же время управление (30) гарантирует асимптотическую устойчивость
решения d = 0, ? = 0, ? = 0 системы (2), если только начальные отклонения
z1 (0), z2 (0), z3 (0) канонической системы принадлежат инвариантному множеству DzI линейной системы z ? = Az , вписанному в слой |z2 | ? 1.
Проведено сравнение полученных законов управления для автомобилеподобного робота с известным из литературы линеаризующим законом управления (De Luca A., Oriolo G., Samson C.), синтезированным из цепной формы
уравнений движения (Murray R.M., Sastry S.S.). Показано, что данный закон
управления может быть получен с помощью обсуждаемого в диссертации подхода, если выбрать в качестве новой независимой переменной путевой параметр: ? = s. В этом случае приведение к каноническому виду получается с
помощью преобразования, определенного формулами (28) и
tg2 ? + 1 (1 ? kd)2 tg ?
z3 = ?k(1 ? kd)
+
? ks? d tg ?.
2
3
cos ?
L cos ?
Так как в определение переменной z3 входит производная кривизны целевого
пути ks? , а вычисление правой части канонической системы требует дифференцирования правой части выражения, определяющего z3 , по всем переменным, то управление зависит от второй производной кривизны (это также видно
непосредственно из выражения для управления, данного в книге A. De Luca,
которое здесь не приведено в виду его громоздкости). Данное обстоятельство
означает, что рассматриваемый закон управления накладывает излишние требования на гладкость целевого пути, так как хорошо известно, что допустимыми для автомобилеподобного робота являются кривые с кусочно-непрерывной
производной кривизны. Таким образом, обсуждаемая обратная связь определена не для всех допустимых путей, что является еј серьезным недостатком.
С другой стороны, синтезированные в настоящей работе законы управления
(30) и (33) зависят только от первой производной кривизны, что делает их
использование в практических приложениях более предпочтительным.
В качестве иллюстрации применения предлагаемого подхода к моделям
большей размерности, получено каноническое представление задачи путевой
стабилизации для модели автомобилеподобного робота с прицепом (Samson
24
C.), уравнения движения которого в путевых координатах имеют вид
d?
??
??
??
s?
= v sin ?,
cos ?
= v tgl ? ? vk1?kd
,
tg ?
v tg ?
= Lvcos
? ? l ,
= u,
cos ?
= v1?kd
,
(34)
где ? угол между продольными осями робота и прицепа, v = v0 (t) cos ? скорость целевой точки (точки, расположенной в середине колесной оси прицепа), v0 (t) продольная скорость движения КР (скорость движения точки,
расположенной в середине задней оси КР), и l расстояние от задней оси КР
до колесной оси прицепа, при ограничениях на переменные состояния вида
|?| ? ?? и |?| ? ?? .
Показано, что система (34) приводится к каноническому виду с помощью второй замены независимой переменной (соответствующей µ(x) = cos ? )
и преобразования, определенного формулами (31) и
tg ?
3 tg2 ? sin ?
tg ?
z4 =
+
?
?
lL cos4 ? cos3 ?
l2 cos5 ?
l2 cos4 ? cos2 ?
?
5k tg ? sin ?
k 2 sin ?
k?
+
?
.
l cos4 ?(1 ? kd) cos3 ?(1 ? kd)2 cos2 ?(1 ? kd)3
При ?? = ?? = ?/2 областью определения канонической системы будет Dz =
(?1/k?, 1/k?)ЧR3 , и указанное преобразование является диффеоморфизмом областей Dx = (?1/k?, 1/k?)Ч(??/2, ?/2)3 и Dz .
В разделе 2.5 рассматривается задача синтеза линеаризующих управлений для роботов, движущихся по неровной поверхности. Показано, что
управление в случае кинематической модели колесного робота получается из
управления (26) введением поправочного коэффициента 1/F (?), где функция F (?) = cos ?2 / cos2 ?1 несет информацию о локальном характере рельефа
в окрестности текущей позиции робота. Случай автомобилеподобного робота
представляет гораздо большие трудности, так как дрейфовое поле в получающейся после замены независимой переменной аффинной системе нестационарно (содержит функцию F (?)). Из-за этого, при взятии производной Ли по
направлению дрейфового поля возникает необходимость в дифференцировании функции F (?), что, в свою очередь, требует знания производных от углов
тангажа ?1 и крена ?2 по переменной ? . Производные ??1 и ??2 могут быть получены из уравнения поверхности, по которой движется робот, или найдены из
25
измерений, если в составе навигационного оборудования робота имеются два
одноосных (или один трехосный) гироскопа. Рассматривается частный случай
движения по наклонной плоскости. В этом случае производные углов ?1 и ?2 ,
а значит и производная функции F (?), могут быть найдены аналитически.
Наконец, в разделе 2.6 рассматривается задача стабилизации движения
кинематической модели КР с ограниченным ресурсом управления |u| ? u?
вдоль прямого пути. Доопределим управление (26), применив функцию насыщения satu? (u) к правой части (26), т.е. определим управление формулой
(
u = satu? ?
?(z)
k
?
+
(1 + z22 )3/2
1 + z22 (1 ? kz1 )
)
,
(35)
и положим ?(z) = ?2 z1 + 2?z2 , где ? > 0 (при таком выборе линейной функции
матрица A линейной системы имеет кратное собственное значение ??).
k ? 0) решение d = 0, ? = 0 системы (1) с ограниченным ресурсом управления |u| ? u?, замкнутой управлением
(35), асимптотически устойчиво при любых ? > 0, u? > 0 и любых начальных
условиях d(0), ?(0) ? ?, где
Теорема 5. Для прямого целевого пути (
? = {d, ? : d ? R1 , ??/2 < ? < ?/2},
и при этом
?
является инвариантной областью системы.
Теорема 5 гарантирует стабилизируемость КР с обратной связью (35)
при любом ресурсе управления и любых ? > 0, но она ничего не говорит о
том, как конкретный выбор параметра обратной связи влияет на поведение
системы. Из общих соображений ясно, что, как при слишком малых, так и
слишком больших значениях ?, эффективность стабилизации не велика. В
первом случае система большую часть времени линейна, но скорость сходимости (экспоненциальная с показателем ??) мала. Во втором случае, хотя
отклонения линейной системы быстро убывают, управление также быстро достигает насыщения и траектория будет состоять из многих участков насыщения, перемежающихся короткими участками линейности, что также означает
медленную сходимость траектории в начало координат, а также периодически
повторяющиеся значительные отклонения от целевого пути (перерегулирование). В первом случае фазовый портрет системы мало отличается от фазового
портрета линейной системы, имеющей в начале координат особую точку типа устойчивый вырожденный узел. При больших ?, фазовый портрет системы
больше напоминает фазовый портрет особой точки типа фокус. Поставим следующую задачу. Определить диапазон значений параметра обратной связи ?,
26
при которых любая траектория нелинейной системы имеет не более одного
участка насыщения. Выбор параметра обратной связи из этого диапазона гарантирует, что любая траектория пересекает асимптоту z2 = ??z1 не более
одного раза, так что фазовый портрет нелинейной замкнутой системы сохраняет свойства фазового портрета линейной системы. Максимальное значение
?, при котором исследуемая система обладает указанными свойствами, будем
называть оптимальным значением параметра обратной связи. Справедлива
следующая
Теорема 6. Для прямого целевого пути оптимальное значение параметра
обратной связи определено формулой
?
?opt = 3 3u?/2.
Для любого
? ? ?opt ,
любая траектория замкнутой системы содержит не более одного участка
насыщения.
Третья глава
посвящена анализу устойчивости систем, приводимых к
каноническому виду, и построению оценок областей притяжения этих систем
с учетом ограниченного ресурса управления |u| ? u?. Всюду далее управление
берется в виде
(
)
?(z) + f0 (z, s, ?)
u(z, s, ?) = satu? ?
(36)
,
f1 (z, s, ?)
получающемся применением функции насыщения к линеаризующему каноническую систему управлению (6).
В разделе 3.1 предлагается единый подход к построению оценок областей
притяжения для колесных роботов с ограниченным управлением, уравнения
движения которых представимы в каноническом виде. Подход основан на применении методов теории абсолютной устойчивости (Гелиг А.Х., Леонов Г.А.,
Пятницкий Е.С., Рапопорт Л.Б., Формальский А.М., Якубович В.А.). Представление уравнений движения робота в каноническом виде позволяет свести
нахождение областей притяжения целевого пути к исследованию устойчивости
нулевого решения z = 0 нелинейной системы
z1?
?
zn?2
?
zn?1
s?
=
..
.
=
=
=
z2 ,
(37)
zn?1 ,
??(?, z, s, ?),
?(z, s, ?),
где
(
?(?, z, s, ?) = ?f0 (z, s, ?) ? satu?
27
?(z) + f0 (z, s, ?)
?
f1 (z, s, ?)
)
· f1 (z, s, ?).
Правая часть системы (37) определена в области Dz ЧR1 ЧR+ , где Dz ? Rn?1 область определения канонической системы. Включение ? в число аргументов
функции ? подчеркивает, что правая часть системы зависит не только от текущих значений переменных состояния и независимой переменной, но также и от
значения линейной функции ?(z). Показано, что, если целевой путь допустим,
то функция ? линейна по ? по крайней мере в некоторой окрестности нуля.
Область ? ? Dz будем называть
z областью нелинейной системы (37), если при ?z0 ? ? и ?s0 ? R1 , ??0 ? R+ компонента
z(?) решения (z(?), s(?)) системы (37), удовлетворяющего начальным условиям z(?0 ) = z0 , s(?0 ) = s0 , лежит в области ? при любых ? ? ?0 .
инвариантной по
Наряду с (37) рассмотрим линейную нестационарную систему
z1?
= z2 ,
..
.
= zn?1 ,
= ??(?, ?),
(38)
0 < ?0 ? ?(?) ? 1.
(39)
?
zn?2
?
zn?1
где ?(?, ?) = ?(?)? и
Система (38) называется
системой сравнения
для нелинейной системы (37).
Правая часть системы (38), как функция ? , принадлежит сектору [?0 , 1], ограниченному прямыми ? = ? и ? = ?0 ? . Говорят, что система (38) абсолютно
устойчива в секторе [?0 , 1], если нулевое решение системы (38) асимптотически
устойчиво при любых функциях ?(?), удовлетворяющих условию (39).
ниченной инвариантной областью
Огра-
системы сравнения будем называть такую
область в Rn?1 , которая вместе с любой принадлежащей ей точкой z0 содержит
всю полутраекторию системы (38), начинающуюся в этой точке, какова бы ни
была функция ?(?), удовлетворяющая неравенству (39).
Теорема 7. Пусть система (38) абсолютно устойчива в секторе
пусть
?
[?0 , 1]
и
ограниченная инвариантная область системы, принадлежащая
области определения
Dz
системы (37). Пусть для любого
z ? ? выполняются
неравенства
и условие
?0 ? ?(?, z, s, ?)/? ? 1 ?s ? R1 , ?? ? R+ ,
(40)
f0 (z, s, ?) 1
f1 (z, s, ?) < u? ?s ? R , ?? ? R+ .
(41)
28
Тогда
? инвариантная по z
область системы (37) и решение
асимптотически устойчиво в
z = 0 системы
?.
Из теоремы 7 следует, что построение оценки области устойчивости нулевого решения нелинейной системы вида (37) опирается на решение следующих
трех задач.
Задача 1.
Построение ограниченной инвариантной области системы сравне-
ния (38), (39), принадлежащей области определения канонической системы Dz ,
при заданном ?0 .
Задача 2.
Нахождение диапазона значений, из которого можно выбирать ?0 ,
т.е. определение наибольшего сектора, в котором абсолютно устойчива система
сравнения (38).
Задача 3.
Проверка выполнения секторных условий (40) и (41) в искомой
ограниченной инвариантной области.
Оценку ограниченной инвариантной области системы (38), (39) можно
легко построить, если известна ее функция Ляпунова. Конструктивное нахождение оценки области устойчивости нелинейной системы (37) возможно,
по-видимому, только если ограничиться квадратичными функциями Ляпунова, т.е. искать оценку ограниченной инвариантной области сравнения в виде
эллипсоида
?(P ) = {z : z T P z < 1}.
(42)
Известно (Boyd S.), что для абсолютной устойчивости системы (38), (39) достаточно, чтобы существовала общая квадратичная функция Ляпунова у линейных систем z ? = A1 z и z ? = A?0 z , где A1 и A?0 матрицы линейной системы
(38) при ?(?) ? 1 и ?(?) ? ?0 соответственно. В свою очередь, для того чтобы у
этих систем существовала общая квадратичная функция Ляпунова L = z T P z ,
где P > 0 симметрическая матрица размера n ? 1, необходимо и достаточно
чтобы имела решение система линейных матричных неравенств
P A 1 + AT
1 P ? 0,
P A + AT P ? 0.
?0
(43)
(44)
?0
Для любого решения системы (43), (44) эллипсоид (42) является ограниченной
инвариантной областью системы сравнения.
Теорема 8. Пусть
P
решение системы линейных матричных неравенств
?0 , такое, что на эллипсоиде (42)
?(P ) ? Dz . Тогда ?(P ) инвариантный
(43), (44) при некотором
выполняются
условия (40) и (41) и
эллипсоид си-
стемы (37) и нулевое решение системы асимптотически устойчиво в
29
?(P ).
В случае фазовых ограничений общего вида область Dz может быть
устроена довольно сложно, так что вписывание эллипсоида в нее может оказаться весьма нетривиальной задачей. В таком случае Dz аппроксимируется
более простой областью, граница которой может быть представлена в виде совокупности гиперплоскостей и/или поверхностей второго порядков, при этом
условие принадлежности эллипсоида (42) аппроксимирующему множеству записывается в виде системы линейных матричных неравенств вида
li (P ) ? 0, i = 1, . . . , ng ,
(45)
где li (P ) линейная форма от матрицы P а число ng определяется выбранной
аппроксимацией границы области Dz . Таким образом, решение задачи 1 сводится к совместному решению системы линейных матричных неравенств (43),
(44), (45).
Задача 2 состоит в нахождении наименьшего значения ?0 , при котором
система линейных матричных неравенств (43), (44) имеет решения. Обозначим
его через ?0? . Сектор [?0? , 1] является максимальным сектором, в котором система (38), во-первых, абсолютно устойчива и, во-вторых, имеет квадратичную
функцию Ляпунова, производная которой в силу системы отрицательна при
любых ?(?), принадлежащих сектору. Из определения матриц A1 и A?0 следует, что величина ?0? может зависеть только от порядка системы (т.е. от числа
степеней свободы выбранной модели КР) и, быть может, от коэффициентов
обратной связи c1 , c2 , . . . , cn?1 , т.е. от выбора линейной функции ?(z).
Доказано, что, по крайней мере для функций ?(z) специального вида,
значение ?0? не зависит от выбора коэффициентов обратной связи и определяется единственно порядком системы. Это означает, что задача 2 решается один
раз для заданной модели КР. Функция ?(z), о которой идет речь, определена
формулой
?(z) =
n?1
?
(46)
n?i n?i
Cn?1
? zi ,
i=1
i
где Cn?1
биномиальные коэффициенты и ? > 0 произвольное число. Непо-
средственной проверкой нетрудно убедиться, что, при таком выборе линейной
функции все n?1 собственных чисел матрицы A1 равны ?? (линейная система
z ? = A1 z имеет кратный полюс ??).
Теорема 9. Для функций
?(z)
вида (46) нижняя граница
чивости системы сравнения не зависит от
ком системы сравнения.
30
?
?0?
сектора устой-
и определяется только поряд-
Для двумерных систем (38) (n = 3) значение ?0? = 1/9 найдено аналитически (раздел 3.2). Для больших размерностей теорема 9 позволяет найти
сколь угодно точную оценку для границы сектора численно (один раз для
заданного порядка системы). Действительно, для этого достаточно решить систему (43), (44) для нескольких значений ?0 и выбрать в качестве оценки наименьшего значения ??0? минимальное из этих значений, при котором система
имела решения. Для систем (38) третьего порядка (n = 4) величина сектора
устойчивости была найдена численно: ?0? = 0, 20000. Для систем большего порядка, оценки областей устойчивости пока не строились и величина сектора
устойчивости не оценивалась.
В отличие от задачи 2, задачи 1 и 3 приходится решать неоднократно,
так как оценки области устойчивости в общем случае строятся итерационно
(исключение составляет случай n = 3, когда соответствующая, двумерная, система линейных матричных неравенств решается аналитически). Количество
итераций возрастает многократно, если требуется построить не произвольную,
а оптимальную в том или ином смысле, оценку. Любое решение системы неравенств (43), (44) определяет инвариантный эллипсоид системы (38), (39) с
точностью до масштабного множителя, который следует выбирать так, чтобы
результирующий эллипсоид принадлежал области определения канонической
системы Dz .
Проверка выполнения условий (40) и (41) (задача 3) сведена к проверке
более простого неравенства
?0 ?0 ? U?0 ,
(47)
выполнение которого гарантирует выполнение условий (40) и (41). В (47), ?0 максимум линейной функции ?(z) на эллипсоиде (42), определенный формулой
?
?0 = ? cT P ?1 c (Рапопорт Л.Б), и
U?0 =
min
z??, s?R1 , ??R+
U? (z, s, ?), U? (z, s, ?) = f1 (z, s, ?)u? ? |f0 (z, s, ?)|,
(48)
где ? - некоторая простая область (например, параллелепипед), содержащая
эллипсоид, в которой ищется минимум функции U? (z, s, ?).
Раздел 3.2 посвящен аналитическому решению системы линейных матричных неравенств (43), (44) в двумерном случае (дифференциальный порядок
модели n = 3). Установлено, что любое решение системы линейных матричных
31
неравенств (43), (44) представимо в виде
(
P =
?p?1 p?2 /2
p?2 /2 p?3 /?
)
(49)
,
где p?1 , p?2 , и p?3 координаты произвольной точки трехмерного пространства,
принадлежащей пересечению (не зависящих от ?) конусов
(p?3 ? p?2 ? p?1 )2 + (p?2 ? 2p?1 )2 ? 4p?21 ,
(50)
?0 (p?3 ? p?2 ? p?1 /?0 )2 + (p?2 ? 2p?1 )2 ? 4p?21
(51)
или, в эквивалентном виде,
(p?1 ? p?2 ? p?3 )2 + (p?2 ? 2p?3 )2 ? 4p?23 ,
1
(p?1 /?0 ? p?2 ? p?3 )2 + (p?2 /?0 ? 2p?3 )2 ? 4p?23 .
?0
Так как решение системы линейных матричных неравенств определено с точностью до скалярного множителя, число неизвестных можно уменьшить до
двух, положив p?1 (или p?3 в двух последних неравенствах) равным константе.
Пусть, для определенности, p?1 = const. Деля обе части неравенств (50) и (51)
на p?1 и переходя к новым переменным
q1 = p?2 /p?1 , q2 = p?3 /p?1 ,
(52)
(q2 ? q1 ? 1)2 + (q1 ? 2)2 ? 4,
(53)
?0 (q2 ? q1 ? 1/?0 )2 + (q1 ? 2)2 ? 4.
(54)
получим неравенства
Теорема 10. Система линейных матричных неравенств (43), (44) имеет
решения тогда и только тогда, когда совместны скалярные неравенства (53)
и (54). Пусть
q1 , q 2
решение системы (53), (54). Тогда, соответствующее
решение системы (43), (44) определено формулой (49), где
из формул (52) и
p?1
p?2
и
p?3
находятся
произвольная константа.
Очевидно, что при ?0 = 1 неравенства (53) и (54) совместны. Чем меньше
значение ?0 , тем больше система (37) отличается от линейной (при ?0 = 1
система линейна), поэтому наибольший интерес для нас представляет нижняя
граница сектора.
32
Теорема 11. Минимальное значение
матричных неравенств
?0? = 1/9.
(43), (44)
?0 ,
при котором система линейных
имеет решения не зависит от
При этом значении система имеет единственное
до скалярного множителя) решение
(49),
(с
?
и равно
точностью
где
p?2 = 2p?1 , p?3 = 5p?1 .
В последующих построениях важную роль играет следующая лемма, устанавливающая минимальное значение ?0 , при котором данная точка (q1 , q2 ) принадлежит обоим эллипсам (53) и (54).
Лемма 1. Пусть
чение
q1
и
q2
(53). Наименьшее зна-
удовлетворяют неравенству
?0 , при котором также выполняется неравенство (54), определено фор?
?
мулой
?0min (q1 , q2 ) =
?
?
2q1 +2q2 ?q12 ? q1 (q1 ?4)(q12 ?4q2 )
,
2(q2 ?q1 )2
1
, q 1 = q2 .
2q1 +2q2 ?q12
q1 ?= q2 ,
(55)
В разделе 3.3 описанный в разделе 3.1 метод применяется для нахождения оценок областей притяжения для кинематической модели колесного робота (1). Существование аналитического решения системы линейных матричных
неравенств (43), (44) в этом случае дает возможность ставить и эффективно
решать оптимизационные задачи и находить наилучшие в том или ином смысле оценки. Показано, в частности, что нахождение эллипсоидальной оценки
наибольшей площади сводится к стандартной задаче условной оптимизации
функции двух переменных.
Рассмотрим луч в пространстве трех переменных p?1 , p?2 , p?3 , принадлежащий конусу решений линейного матричного неравенства (43). Такой луч
однозначно определяется координатами q1 и q2 точки пересечения луча плоскостью p?1 = 1, принадлежащей эллипсу (53). Эллипсы ?, соответствующие
различным точкам луча имеют одинаковую форму и отличаются друг от друга только размером, а соответствующие матрицы P отличаются друг от друга
скалярным множителем и могут быть представлены в виде
P?
, P? = ?22
P =
det P?
(
?
1
q1 /2?
q1 /2? q2 /?2
)
,
(56)
?p?1 ? maxz?? |z2 |. При фиксированных q1 и q2 , det P (det P? ) монотонно возрастает (убывает) с ростом ?2 . Поэтому наибольшая площадь эллипса достигается при максимальном значении ?2 , при котором еще выполняется
левое неравенство в секторном условии (40). Так как проверка условия (40)
где ?2 =
33
затруднительна, будем контролировать выполнение неравенства (47). Учитывая, что наибольшее значение ?2 достигается при наименьшем возможном при
данных q1 и q2 значении ?0 , получаем уравнение для определения ?2 :
U?0 = ?2 ??0min (q1 , q2 )??0 (q1 , q2 ),
(57)
где U?0 и ?0min (q1 , q2 ) определены формулами (48) и (55) соответственно, а
?
??0 (q1 , q2 ) = q2 ? 2q1 + 4. Минимум функции U? (x, s, ?) в (48) берется по описывающему искомый эллипс прямоугольнику размера 2?1 Ч 2?2 , где ?1 =
?
maxz?? |z1 | и ?2 = maxz?? |z2 |. В силу соотношения ?1 = ?2 q2 /?, искомое
?2 и детерминант соответствующей матрицы P? однозначно определяются выбранным лучом и являются функциями переменных q1 и q2 : ?2 = ?2 (q1 , q2 )
и det P? = D(q1 , q2 ). Зависимость U?0 от ?1 и ?2 определяется выбором обратной связи, используемой для стабилизации. В случае обратной связи (23),
U?0 = min{U?01 , U?02 }, где
?
k?(1 ? ?22 )
k?
, U?02 = u? ?
.
U?01 = u? 1 ? ?22 ?
1 ? k??1
1 ? k??1
Если используется обратная связь (26), то U?0 ? U?02 .
В силу приведенного выше соотношения, связывающего размеры ?1 и
?2 описывающего прямоугольника, уравнение (57) можно решать как относительно ?2 , так и ?1 . Заметим, что численное решение уравнения (57) не
представляет трудностей, так как обе части уравнения являются монотонными функциями ?2 (?1 ): U?0 монотонно убывает с ростом ?2 (?1 ) (чем больше
эллипс, тем больше описанный прямоугольник и тем меньше минимум функции U? (z, s, ?) на нем), а правая часть монотонно возрастающая (линейная)
функция.
Теперь для того чтобы построить наилучшую эллипсоидальную аппроксимацию области притяжения, требуется найти максимум функции двух переменных D(q1 , q2 ), область изменения которых ограничена эллипсом (53). Таким
образом, справедлива следующая
Теорема 12. Пусть
q1? , q2?
решение задачи максимизации функции двух пе-
ременных
)
(
?24 (q1 , q2 )
q12
D(q1 , q2 ) =
q2 ?
?2
4
2
2
при условии (q2 ? q1 ? 1) + (q1 ? 2) ? 4, где ?2 (q1 , q2 ) решение скалярного
уравнения (57). Тогда матрица P наилучшей в смысле площади эллипсоидаль? ?
ной аппроксимации области притяжения получается подстановкой q1 , q2 в
формулу (56).
34
Теорема 12 сводит задачу нахождения наилучшей эллипсоидальной аппроксимации области притяжения к стандартной задаче условной оптимизации
функции двух переменных, определенной на выпуклом множестве (эллипсе).
Эта задача в общем случае может быть решена только численно, так как оптимизируемая функция включает в себя функцию ?2 (q1 , q2 ), значения которой
определяются путем численного решения скалярного уравнения (57). Однако
простота указанного скалярного уравнения и малая размерность задачи оптимизации делают численное решение весьма эффективным. Точка q1? , q2? , в которой достигается максимум детерминанта находится либо с помощью методов
графической визуализации, либо численно (например, с помощью программы
fmincon, имеющейся в пакете Matlab).
В разделе 3.4 строятся оценки области притяжения для автомобилеподобного робота (2) с ограничением на максимальный угол поворота передних
колес |?| ? ?? < ?/2 и ограниченным ресурсом управления |u| ? u?. Рассматривается один из двух линеаризующих законов управления, полученных в главе
2, а именно, управление, определенное формулой (30). Применяя к правой части (30) функцию насыщения (см. формулу (36)), подставляя результирующее
управление в каноническую систему и опуская последнее уравнение получаем
нелинейную систему
z1? = z2 ,
z2? = z3 ,
z3? = ??(?, z, s).
(58)
Как уже упоминалось выше, для функций ? вида ?(z) = ?3 z1 + 3?2 z2 +
3?z3 (получается подстановкой n = 4 в формулу (46)) нижняя граница сектора
?0? была найдена численно и равна ?0? = 0.20000 (задача 2). Фазовое ограничение |?| ? ?? в канонических переменных имеет вид
?
?
2
2
tg ?? 1 ? z22 k(s)(1 ? z22 )
tg ?? 1 ? z2 k(s)(1 ? z2 )
?
? z3 ?
?
.
?
(59)
L
1 ? k(s)z1
L
1 ? k(s)z1
Область определения канонической системы Dz , которой должны принадлежать искомые инвариантные эллипсоиды, устроена довольно сложно (даже
для целевого пути постоянной кривизны) и, в общем случае, не выпукла. В
случае, когда кривизна целевой кривой меняется в диапазоне ?k? ? k(s) ? k? ,
предлагается аппроксимировать Dz ограниченным эллиптическим цилиндром
с осью симметрии, направленной вдоль оси z1 . Вид аппроксимирующего цилиндра устанавливается следующей леммой.
35
Лемма 2. Пусть
?k? ? k(s) ? k?
кривизна целевой кривой удовлетворяет ограничениям
и пусть
?1 < ??1 ?
Тогда любая точка
z = (z1 , z2 , z3 ),
1
L
?
.
k? tg ??
(60)
удовлетворяющая ограничениям
?
??1 ? z1 ? ?1 , ?1 ? z2 ? 1, |z3 | ? h? 1 ? z22 ,
где
h? =
(61)
tg ??
k?
?
,
L
1 ? k??1
удовлетворяет также неравенствам (59) при всех значениях
s.
При этом
цилиндр (61) является наибольшим эллиптическим цилиндром, аппроксимирующем одновременно все семейство фазовых пространств в полосе
|z1 | ? ?1 .
Таким образом, задача построения эллипсоида, удовлетворяющего фазовым
ограничениям (задача 1), заменена более простой задачей вписывания эллипсоида в ограниченный эллиптический цилиндр, которая эквивалентна выполнению линейных матричных неравенств:
P ? I1 , P ? ?0 , где I1 = diag[1/?12 , 0, 0], ?0 = diag[0, 1, 1/h?2 ].
(62)
Проверка секторных условий (задача 3) заменена проверкой неравенства
(47), при этом минимум U?0 функции в правой части формулы (48) ищется на
криволинейном параллелепипеде ?, определенном формулами
?
? = {z : |z1 | ? ?1 , |z2 | ? ?2 , |z3 | ? u? 1 ? z22 ,
где ?1 = maxz?? |z1 | и ?2 = maxz?? |z2 |, и равен (k? ? = maxs |k ? (s)|)
(
)
?
?
u?
k?
k?
tg
??
?
2
U?0 = 1 ? z22
?
?
? ?2 u?2 .
3
v?L (1 ? k??1 )
L(1 ? k??1 )
Теорема 13. Пусть
P >0
решение системы линейных матричных нера-
?0 ? (0.2, 1] и некотором ?1 , удовлетвоT
пусть в области ? = {z : z P z ? 1} выполнено
Тогда ? является инвариантным эллипсоидом
венств (43), (44), (62) при некотором
ряющем неравенству (60), и
скалярное неравенство (47).
системы (58).
Показано, что, если целевой путь допустим, то всегда можно добиться
выполнения неравенства (47). Для этого может понадобиться сжать построенный эллипсоид в направлении z2 и ? , что, в свою очередь, достигается
добавлением одного или двух матричных неравенств к системе (62).
36
Поясним, что означает выполнение требуемых теоремой условий. Неравенство (60) ограничивает диапазон возможных значений ?1 , и его выполнение
гарантирует существование аппроксимирующего цилиндра ненулевой высоты
при данном ?1 . Матричные неравенства (62) удовлетворены, если эллипсоид
принадлежит аппроксимирующему цилиндру, что гарантирует выполнение фазовых ограничений. Условия (43), (44) означают, что область ? является областью притяжения системы (58) в случае, когда правая часть третьего уравнения принадлежит сектору [?0 , 1]. А условие (47) означает, что при z ? ?
правая часть этого уравнения действительно ему принадлежит. Таким образом, нахождение инвариантного эллипсоида сводится к совместному решению
системы из четырех линейных матричных неравенств и проверке условия (47).
В двух следующих параграфах раздела 3.4 представлены постановка задачи построения квазиоптимального инвариантного эллипсоида для автомобилеподобного робота и алгоритм его нахождения, а в последнем параграфе
дан численный пример построения квазиоптимального эллипсоида.
В
четвертой главе
обсуждаются некоторые вопросы, связанные с по-
строением целевых путей по заданному дискретному множеству точек.
В разделе 4.1 обсуждается общая постановка задачи, а также требования,
которым должна соответствовать целевая кривая, помимо условий гладкости,
обсуждавшихся в первой главе.
В разделе 4.2 рассматривается аппроксимация целевых путей для автом??билеподобного робота с помощью однородных кубических В-сплайнов. Искомый целевой путь, заданный дискретным набором точек на плоскости, аппроксимируется В-сплайновой кривой, состоящей из элементарных кубических
B-сплайнов. Каждый из элементарных В-сплайнов строится по четырем точкам ri?1 , ri , ri+1 , ri+2 по формуле
r(i) (t) = b0 (t)ri?1 + b1 (t)ri + b2 (t)ri+1 + b3 (t)ri+2 ,
где
(1 ? t)3
4 ? 6t2 + 3t3
1 + 3t + 3t2 ? 3t3
t3
b0 (t) =
, b1 (t) =
, b2 (t) =
, b3 (t) =
6
6
6
6
и 0 ? t ? 1 - параметр сплайна. Выбор В-сплайнов для аппроксимации целевого пути объясняется простотой их использования и тем, что В-сплайновая
кривая удовлетворяет минимальным требованиям на гладкость целевой кривой (трижды дифференцируема всюду, за исключением конечного числа точек), а также следующими замечательными свойствами В-сплайновой кривой
37
(Позняк Э.Г., Шикин Е.В.): 1) кривая лежит в объединении n ? 1 выпуклых
оболочек, порожденных четверками вершин ri?1 , ri , ri+1 , ri+2 ; 2) кривая повторяет контрольную ломанную, проведенную через точки, по которым строится
сплайновая аппроксимация; 3) если контрольные точки лежат на одной прямой, то составная сплайновая кривая также расположена на этой прямой; 4)
модификация одной контрольной точки влияет только на часть аппроксимационной кривой (меняются не более четырех элементарных сплайнов). Отмечается, что использование однородных сплайнов наиболее эффективно в случае
эквидистантных точек. Даны формулы для оценки ошибки аппроксимации.
В разделе 4.3 предлагается метод фэринга (от английского слова fairing облагораживание),
который позволяет значительно улучшить форму аппрок-
симационной кривой, построенной по результатам зашумленных измерений.
Цель фэринга сгладить график кривизны (которая и определяет, в первую
очередь, форму кривой) целевой кривой. Необходимость в процедуре фэринга
объясняется тем, что даже малые ошибки измерений при малом расстоянии
между контрольными точками приводят к значительным вариациям графика кривизны построенной кривой. В свою очередь, осциллирующий характер
графика кривизны приводит к частым поворотам рулевого колеса то в одну, то в другую сторону, что в лучшем случае не эффективно и приводит к
быстрому износу рулевого механизма, а в худшем невозможно из-за конструкционных ограничений. Предлагаемый метод основан на варьировании
позиций контрольных точек в направлении, перпендикулярном построенной
кривой, и минимизации нормы скачков третьей производной в точках соединения элементарных сплайнов. Выбор такого критерия объясняется тем, что
характер графика кривизны определяется третьей производной. Так как последняя является постоянной для любого элементарного сплайна, то кривизна
определяется скачками третьей производной в точках соединения сплайнов.
Представляет также интерес интерпретация используемого критерия качества
с точки зрения механики, в рамках которой сплайновая кривая рассматривается как функция, описывающая форму упругого континуума под действием
поперечных сил, приложенных в точках соединения элементарных сплайнов.
В этом случае минимизация указанного критерия соответствует минимизации
энергии деформации континуума.
В предположении малости ошибок измерений и, соответственно, малости
вариаций контрольных точек критерий качества записывается в виде квадра38
тичного функционала
1
?(?) = ?T H? + f T ?,
2
где ? = [?1 , . . . , ?n ]T , ?i вариация i-ой контрольной точки в направлении нормали Ni к В-сплайновой кривой в точке соединения i-го и (i+1)-го элементарных
сплайнов, H = C T C, f = C T F (0), C пятидиагональная симметричная матрица
?
?
6
?4c12 c13
0
0
0
···
?
?
? ?4c21
6
?4c23 c24
0
0
··· ?
?
?
?
? c31 ?4c32
6
?4c
c
0
·
·
·
34
35
?
?
?
?
C=? 0
c42 ?4c43
6
?4c45 c46 · · · ? ,
?
?
? 0
?
0
c
?4c
6
?4c
·
·
·
53
54
56
?
?
? 0
0
0
c64 ?4c65
6
··· ?
?
?
..
..
..
..
..
..
...
.
.
.
.
.
.
cij = (Ni , Nj ), и Fi (0) = (ri?2 , Ni )?4(ri?1 , Ni )+6(ri , Ni )?4(ri+1 , Ni )+(ri+2 , Ni ).
Так как цель фэринга устранение ошибок измерений, диапазон варьирования
?i , i = 1, . . . , n, контрольных точек следует ограничить малым интервалом:
|?i | ? ? . В качестве ? можно взять ? = 3? , где ? оценка среднеквадратичного
отклонения ошибок измерения контрольных точек. Таким образом, приходим
к следующей задаче квадратичного программирования с простыми ограничениями
min ?(?), ? ? Rn ,
?
?? ? ?i ? ?.
Глобальный минимум квадратичного функционала легко находится любым
стандартным методом, например, так называемым методом активного набора
(Гил Ф., Мюррей М., Райт М.). Эффективность процедуры фэринга иллюстрируется примерами его применения к траекториям, построенным по данным реальных навигационных измерений, полученных с помощью спутникового приемника, установленного на движущемся автомобиле.
Наконец, в разделе 4.4 обсуждается проблема вычисления отклонения
от В-сплайновой кривой. Точное вычисление расстояния до кривой является довольно трудоемкой задачей, решение которой в общем случае не всегда
однозначно. Предлагается вместо точного расстояния использовать аппроксимирующую ее функцию, так называемое квазирасстояние. Для элементарного
В-сплайна квазирасстояние определяется как расстояние от данной точки до
39
сплайна вдоль прямой, соединяющей эту точку с центром кривизны сплайна
(определяется как точка пересечения прямых, перпендикулярных к сплайну
в его начале и конце) со знаком плюс, если точка находится справа от кривой при движении в положительном направлении, и знаком минус, если слева.
Квазирасстояние совпадает с обычным расстоянием в случаях, когда прямая,
вдоль которой оно измеряется, проходит через концы элементарных сплайнов,
и и с хорошей точностью аппроксимирует расстояние во всех остальных случаях. В отличие от точного расстояния, квазирасстояние легко вычисляется, а
точность аппроксимации, зависящая от расстояния между контрольными точками и кривизны целевой кривой, легко оценивается. Алгоритм вычисления
квазирасстояния подробно описан.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ РАБОТЫ
В диссертации получены следующие результаты:
1. Введено понятие канонического представления задачи путевой стабилизации для колесной системы общего вида, как представления, легко приводимого к линейному виду с помощью подходящим образом выбранной обратной
связи, и разработан метод приведения уравнений движения робота к каноническому виду. Установлено, что каноническая система представляет собой нормальную форму некоторой промежуточной аффинной системы, полученной из
исходной с помощью замены независимой переменной.
2. Синтезированы стабилизирующие законы управления для кинематической и автомобилеподобной моделей колесных роботов. Продемонстрированы преимущества полученных законов управления по сравнению с другими,
известными из литературы, законами управления, полученными с помощью
методов точной линеаризации.
3. Доказана глобальная стабилизируемость кинематической модели колесного робота с ограниченным ресурсом управления, замкнутой синтезированным законом управления, вдоль прямого целевого пути.
4. Синтезированы стабилизирующие законы управления для кинематической и автомобилеподобной моделей колесных роботов, движущихся по неровной поверхности.
5. Разработан метод построения оценок областей притяжения целевых
путей для колесных роботов с ограниченным ресурсом управления, уравнения движения которых приводятся к каноническому виду. Метод основан на
40
применении результатов теории абсолютной устойчивости и сводит нахождение эллипсоидальной аппроксимации области притяжения к решению системы
линейных матричных неравенств и проверке скалярного неравенства.
6. Получено аналитическое решение системы линейных матричных неравенств второго порядка относительно общей квадратичной функции Ляпунова
двух линейных систем. С его помощью построение эллипсоидальной аппроксимации области притяжения наибольшего объема для задачи путевой стабилизации кинематической модели колесного робота сведено к стандартной задаче
условной оптимизации.
7. Разработан метод сглаживания кривизны (фэринг) В-сплайновой аппроксимации целевого пути для автомобилеподобного робота, построенной по
зашумленным измерениям.
Проведенные исследования позволяют сделать следующие выводы:
1. Введенное в диссертации понятие канонического представления оказалось весьма плодотворным и эффективным, позволив разработать единый
подход к решению задач путевой стабилизации для широкого класса робототехнических колесных систем, моделями которых являются нестационарные
аффинные системы со скалярными входом и выходом. Установление связи канонического представления с нормальной формой аффинной системы позволяет воспользоваться результатами и методами теории нормальных форм для
построения канонических представлений и, тем самым, эффективно решать
задачу синтеза стабилизирующих законов управления.
2. Разработанный метод приведения уравнений движения к каноническому виду позволяет эффективно решать задачу стабилизации для аффинных
систем с дрейфовым полем, представимым в виде произведения гладкого векторного поля на априори неизвестную скалярную функцию, для которых не
применимы стандартные методы теории нормальных форм аффинных систем.
3. Разработанный в диссертации подход к построению оценок областей
притяжения целевых путей для колесных роботов с ограниченным ресурсом
управления применим не только к задачам путевой стабилизации и является универсальным методом исследования устойчивости по части переменных
нормальной формы аффинных систем со скалярными входом и выходом, относительная степень которых на единицу меньше порядка системы.
4. Применение разработанного метода построения эллипсоидальных оценок областей притяжения на практике при стабилизации реальных колесных
систем с ограниченным ресурсом управления является эффективным инстру41
ментом решения задачи путевой стабилизации и позволяет осуществлять постоянный контроль выполнения задачи стабилизации в процессе движения.
5. Использование разработанного в диссертации метода сглаживания
кривизны целевого пути, построенного по зашумленным измерениям, значительно повышает эффективность управления, так как позволяет избежать частых хаотичных поворотов рулевых колес, уменьшая тем самым ошибку стабилизации и износ рулевого механизма.
42
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1.
Пестерев А.В., Гилимьянов Р.Ф. Планирование пути для колесного робота// Проблемы вычислений в распределенной среде: распределенные приложения, коммуникационные системы, математические модели и оптимизация. Тр. ИСА РАН. М.: URSS. 2006. Т. 25. C. 204211.
2.
Рапопорт Л.Б., Ткаченко, М.Я., Могильницкий В.Г., Хвальков А.А., Пестерев А.В. Интегрированная система спутниковой и инерциальной навигации: экспериментальные результаты и применение к управлению мобильными роботами// Гироскопия и навигация. 2007. Т. 56, ќ 1. С. 1628.
3.
Гилимьянов Р.Ф., Пестерев А.В., Рапопорт Л.Б. Сглаживание кривизны
траекторий, построенных по зашумленным измерениям, в задачах планирования пути для колесных роботов// Известия РАН. Теория и системы
управления. 2008. Т. 47. ќ 5. С. 148156.
4.
Гилимьянов Р.Ф., Пестерев А.В., Рапопорт Л.Б. Управление движением
колесного робота в задаче следования вдоль криволинейного пути// Известия РАН. Теория и системы управления. 2008. Т. 47. ќ 6. С. 158165.
5.
Пестерев А.В., Рапопорт Л.Б. Построение инвариантных эллипсоидов в задаче стабилизации движения колесного робота вдоль криволинейного пути// Автоматика и телемеханика. 2009. ќ 2. С. 5267.
6.
Пестерев А.В. Алгоритм построения инвариантных эллипсоидов в задаче
стабилизации движения колесного робота// Автоматика и телемеханика.
2009. ќ 9. С. 100112.
7.
Пестерев А.В., Рапопорт Л.Б. Стабилизация движения колесного робота вдоль криволинейной траектории, проложенной по неровной поверхности// Известия РАН. Теория и системы управления. 2010. Т. 49. ќ 4. С.
135144.
8.
Пестерев А.В. Построение наилучшей эллипсоидальной аппроксимации области притяжения в задаче стабилизации движения колесного робота//
Автоматика и телемеханика. 2011. ќ 3. С. 5168.
43
9.
Пестерев А.В. Синтез стабилизирующего управления в задаче следования
колесного робота вдоль заданной кривой// Автоматика и телемеханика.
2012. ќ 7. С. 2539.
10. Пестерев А.В. Эллипсоидальные аппроксимации области притяжения в задаче путевой стабилизации колесного робота с ограниченным управлением// Известия РАН. Теория и системы управления. 2012. Т. 51. ќ 4. С.
131144.
11. Пестерев А.В., Рапопорт Л.Б. Каноническое представление задачи путевой
стабилизации для колесных роботов// Автоматика и телемеханика. 2013.
ќ 5. С. 80101.
12. Пестерев А.В. Синтез линеаризующего управления в задаче стабилизации
движения автомобилеподобного робота вдоль криволинейного пути// Известия РАН. Теория и системы управления, 2013. Т. 52. ќ 5. С. 153165.
13. Рапопорт Л.Б., Ткаченко, М.Я., Могильницкий В.Г., Хвальков А.А., Пестерев А.В. Интегрированная система спутниковой и инерциальной навигации: экспериментальные результаты и применение к управлению мобильными роботами// Труды XIII межд. конф. по интегрированным навигационным системам, Санкт-Петербург, 2006. С. 8392.
14. Rapoport L., Gribkov M., Khvalkov A., Matrosov I., Pesterev A., Tkachenko
M. Control of wheeled robots using GNSS and inertial navigation: control law
synthesis and experimental results// Proc. of the 19th Int. Technical Meeting
of the Satellite Division of The Institute of Navigation. Fort Worth, USA, Sept.
2006, P. 22142221.
15. Гилимьянов Р.Ф., Пестерев А.В. Численный метод улучшения траекторий,
построенных по данным GNSS измерений, в задаче управления колесным
роботом// II школа-семинар молодых ученых "Управление большими системами". Сб. трудов конф., Воронеж, Научная книга, 2007. Т. 1. С. 1420.
16. Pesterev A.V., Rapoport L.B., Gilimyanov R.F. Global energy fairing of
B-spline curves in path planning problems// Proc. of the ASME Int.
Design Engineering Technical Conferences and Computers and Information in
Engineering Conferences (IDETC/CIE), Las Vegas, paper DETC2007-35306,
2007. V. 8. P. 11331139.
44
17. Гилимьянов Р.Ф., Пестерев А.В., 2008, Применение декомпозиции для сглаживания кривизны траекторий, построенных по зашумленным измерениям, в задачах большой размерности// Проблемы управления и информационные технологии (ПУИТ'08): Труды конф., Казань, 2008. С. 188191.
18. Pesterev A., Rapoport L., Gilimyanov R. Control of a wheeled robot following
a curvilinear path// Proc. of the 6th EUROMECH Conf. ENOC2008, St.
Petersburg, 2008. CD ROM.
19. Пестерев А.В., Рапопорт Л.Б. Построение инвариантного эллипсоида максимального размера в задаче стабилизации движения колесного робота//
Труды 4-ой Межд. конф. по проблемам управления, М.: ИПУ РАН. 2009.
С. 471478.
20. Pesterev A., Rapoport L. Ellipsoidal approximations of invariant sets in
stabilization problem for a wheeled robot following a curvilinear path// Proc.
of the ASME Int. Design Engineering Technical Conferences and Computers
and Information in Engineering Conferences (IDETC/CIE), San Diego, paper
DETC2009-86199, 2009. V. 4. P. 19091918.
21. Pesterev A.V. Maximum-volume ellipsoidal approximation of attraction
domain in stabilization problem for wheeled robot// Proc. of the 18th IFAC
World Congress, Milan, 2011. P. 1186911874.
22. Pesterev A. Stabilizing control for a wheeled robot following a curvilinear
path// Proc. of the 10th Int. IFAC Symp. on Robot Control, Dubrovnik,
Croatia, 2012. P. 643648.
23. Pesterev A. Normal-form representation of the path following problem for
wheeled robots// Proc. of the ASME Int. Design Engineering Technical
Conferences and Computers and Information in Engineering Conferences
(IDETC/CIE), Portland, USA, 2013. CD ROM, paper DETC2013-12134.
24. Гилимьянов Р.Ф., Пестерев А.В. Планирование траектории и управление
движением колесного робота по данным, полученным с помощью GPS измерений// Труды XLIX науч. конф. МФТИ. Аэрофизика и космические
исследования, М.: МФТИ, 2006. С. 221222.
25. Пестерев А.В., Рапопорт Л.Б. Построение инвариантных эллипсоидов в задаче стабилизации движения колесного робота вдоль криволинейного пу45
ти// Устойчивость и колебания нелинейных систем управления: Тез. докл.
Х Межд. сем. им. Е.С. Пятницкого. М.: ИПУ РАН, 2008. С. 236238.
26. Пестерев А.В., Рапопорт Л.Б. Построение инвариантных эллипсоидов в задаче стабилизации движения колесного робота вдоль криволинейного пути// Метод функций Ляпунова и его приложения (MFL - 2008): Труды IX
Крымской межд. мат. школы, Алушта, 2008. С. 132133.
27. Пестерев А.В., Рапопорт Л.Б. Оценка инвариантного множества в задаче
стабилизации движения колесного робота вдоль криволинейного пути//
Тез. докл. XXVI Конференция памяти Н.Н. Острякова, Санкт-Петербург,
2008. С. 4849.
28. Гилимьянов Р.Ф., Пестерев А.В., Рапопорт Л.Б., Управление движением
колесного робота в задаче следования вдоль криволинейного пути, построенного по данным GNSS измерений// Тез. докл. 52-ой науч. конф. МФТИ,
Долгопрудный, 2009.
29. Пестерев А.В., Рапопорт Л.Б. Стабилизация движения колесного робота
вдоль криволинейного пути в условиях неровного рельефа // Устойчивость
и колебания нелинейных систем управления: Тез. докл. ХI Межд. сем. им.
Е.С. Пятницкого. М.: ИПУ РАН, 2010. С. 318319.
30. Пестерев А.В. Синтез стабилизирующего управления для колесного робота
с ограниченным ресурсом управления// Устойчивость и колебания нелинейных систем управления: Тез. докл. ХI Межд. сем. им. Е.С. Пятницкого.
М.: ИПУ РАН, 2012. С. 265267.
31. Pesterev A. The best ellipsoidal approximation of the attraction domain in the
path following problem for a wheeled robot with constrained control resource//
Abstracts of the IV International Conference on Optimization Methods and
Applications (OPTIMA-2013), Petrovac, Montenegro, 2013. P. 132133.
46
будем
называть оптимальным значением параметра обратной связи. Справедлива
следующая
Теорема 6. Для прямого целевого пути оптимальное значение параметра
обратной связи определено формулой
?
?opt = 3 3u?/2.
Для любого
? ? ?opt ,
любая траектория замкнутой системы содержит не более одного участка
насыщения.
Третья глава
посвящена анализу устойчивости систем, приводимых к
каноническому виду, и построению оценок областей притяжения этих систем
с учетом ограниченного ресурса управления |u| ? u?. Всюду далее управление
берется в виде
(
)
?(z) + f0 (z, s, ?)
u(z, s, ?) = satu? ?
(36)
,
f1 (z, s, ?)
получающемся применением функции насыщения к линеаризующему каноническую систему управлению (6).
В разделе 3.1 предлагается единый подход к построению оценок областей
притяжения для колесных роботов с ограниченным управлением, уравнения
движения которых представимы в каноническом виде. Подход основан на применении методов теории абсолютной устойчивости (Гелиг А.Х., Леонов Г.А.,
Пятницкий Е.С., Рапопорт Л.Б., Формальский А.М., Якубович В.А.). Представление уравнений движения робота в каноническом виде позволяет свести
нахождение областей притяжения целевого пути к исследованию устойчивости
нулевого решения z = 0 нелинейной системы
z1?
?
zn?2
?
zn?1
s?
=
..
.
=
=
=
z2 ,
(37)
zn?1 ,
??(?, z, s, ?),
?(z, s, ?),
где
(
?(?, z, s, ?) = ?f0 (z, s, ?) ? satu?
27
?(z) + f0 (z, s, ?)
?
f1 (z, s, ?)
)
· f1 (z, s, ?).
Правая часть системы (37) определена в области Dz ЧR1 ЧR+ , где Dz ? Rn?1 область определения канонической системы. Включение ? в число аргументов
функции ? подчеркивает, что правая часть системы зависит не только от текущих значений переменных состояния и независимой переменной, но также и от
значения линейной функции ?(z). Показано, что, если целевой путь допустим,
то функция ? линейна по ? по крайней мере в некоторой окрестности нуля.
Область ? ? Dz будем называть
z областью нелинейной системы (37), если при ?z0 ? ? и ?s0 ? R1 , ??0 ? R+ компонента
z(?) решения (z(?), s(?)) системы (37), удовлетворяющего начальным условиям z(?0 ) = z0 , s(?0 ) = s0 , лежит в области ? при любых ? ? ?0 .
инвариантной по
Наряду с (37) рассмотрим линейную нестационарную систему
z1?
= z2 ,
..
.
= zn?1 ,
= ??(?, ?),
(38)
0 < ?0 ? ?(?) ? 1.
(39)
?
zn?2
?
zn?1
где ?(?, ?) = ?(?)? и
Система (38) называется
системой сравнения
для нелинейной системы (37).
Правая часть системы (38), как функция ? , принадлежит сектору [?0 , 1], ограниченному прямыми ? = ? и ? = ?0 ? . Говорят, что система (38) абсолютно
устойчива в секторе [?0 , 1], если нулевое решение системы (38) асимптотически
устойчиво при любых функциях ?(?), удовлетворяющих условию (39).
ниченной инвариантной областью
Огра-
системы сравнения будем называть такую
область в Rn?1 , которая вместе с любой принадлежащей ей точкой z0 содержит
всю полутраекторию системы (38), начинающуюся в этой точке, какова бы ни
была функция ?(?), удовлетворяющая неравенству (39).
Теорема 7. Пусть система (38) абсолютно устойчива в секторе
пусть
?
[?0 , 1]
и
ограниченная инвариантная область системы, принадлежащая
области определения
Dz
системы (37). Пусть для любого
z ? ? выполняются
неравенства
и условие
?0 ? ?(?, z, s, ?)/? ? 1 ?s ? R1 , ?? ? R+ ,
(40)
f0 (z, s, ?) 1
f1 (z, s, ?) < u? ?s ? R , ?? ? R+ .
(41)
28
Тогда
? инвариантная по z
область системы (37) и решение
асимптотически устойчиво в
z = 0 системы
?.
Из теоремы 7 следует, что построение оценки области устойчивости нулевого решения нелинейной системы вида (37) опирается на решение следующих
трех задач.
Задача 1.
Построение ограниченной инвариантной области системы сравне-
ния (38), (39), принадлежащей области определения канонической системы Dz ,
при заданном ?0 .
Задача 2.
Нахождение диапазона значений, из которого можно выбирать ?0 ,
т.е. определение наибольшего сектора, в котором абсолютно устойчива система
сравнения (38).
Задача 3.
Проверка выполнения секторных условий (40) и (41) в искомой
ограниченной инвариантной области.
Оценку ограниченной инвариантной области системы (38), (39) можно
легко построить, если известна ее функция Ляпунова. Конструктивное нахождение оценки области устойчивости нелинейной системы (37) возможно,
по-видимому, только если ограничиться квадратичными функциями Ляпунова, т.е. искать оценку ограниченной инвариантной области сравнения в виде
эллипсоида
?(P ) = {z : z T P z < 1}.
(42)
Известно (Boyd S.), что для абсолютной устойчивости системы (38), (39) достаточно, чтобы существовала общая квадратичная функция Ляпунова у линейных систем z ? = A1 z и z ? = A?0 z , где A1 и A?0 матрицы линейной системы
(38) при ?(?) ? 1 и ?(?) ? ?0 соответственно. В свою очередь, для того чтобы у
этих систем существовала общая квадратичная функция Ляпунова L = z T P z ,
где P > 0 симметрическая матрица размера n ? 1, необходимо и достаточно
чтобы имела решение система линейных матричных неравенств
P A 1 + AT
1 P ? 0,
P A + AT P ? 0.
?0
(43)
(44)
?0
Для любого решения системы (43), (44) эллипсоид (42) является ограниченной
инвариантной областью системы сравнения.
Теорема 8. Пусть
P
решение системы линейных матричных неравенств
?0 , такое, что на эллипсоиде (42)
?(P ) ? Dz . Тогда ?(P ) инвариантный
(43), (44) при некотором
выполняются
условия (40) и (41) и
эллипсоид си-
стемы (37) и нулевое решение системы асимптотически устойчиво в
29
?(P ).
В случае фазовых ограничений общего вида область Dz может быть
устроена довольно сложно, так что вписывание эллипсоида в нее может оказаться весьма нетривиальной задачей. В таком случае Dz аппроксимируется
более простой областью, граница которой может быть представлена в виде совокупности гиперплоскостей и/или поверхностей второго порядков, при этом
условие принадлежности эллипсоида (42) аппроксимирующему множеству записывается в виде системы линейных матричных неравенств вида
li (P ) ? 0, i = 1, . . . , ng ,
(45)
где li (P ) линейная форма от матрицы P а число ng определяется выбранной
аппроксимацией границы области Dz . Таким образом, решение задачи 1 сводится к совместному решению системы линейных матричных неравенств (43),
(44), (45).
Задача 2 состоит в нахождении наименьшего значения ?0 , при котором
система линейных матричных неравенств (43), (44) имеет решения. Обозначим
его через ?0? . Сектор [?0? , 1] является максимальным сектором, в котором система (38), во-первых, абсолютно устойчива и, во-вторых, имеет квадратичную
функцию Ляпунова, производная которой в силу системы отрицательна при
любых ?(?), принадлежащих сектору. Из определения матриц A1 и A?0 следует, что величина ?0? может зависеть только от порядка системы (т.е. от числа
степеней свободы выбранной модели КР) и, быть может, от коэффициентов
обратной связи c1 , c2 , . . . , cn?1 , т.е. от выбора линейной функции ?(z).
Доказано, что, по крайней мере для функций ?(z) специального вида,
значение ?0? не зависит от выбора коэффициентов обратной связи и определяется единственно порядком системы. Это означает, что задача 2 решается один
раз для заданной модели КР. Функция ?(z), о которой идет речь, определена
формулой
?(z) =
n?1
?
(46)
n?i n?i
Cn?1
? zi ,
i=1
i
где Cn?1
биномиальные коэффициенты и ? > 0 произвольное число. Непо-
средственной проверкой нетрудно убедиться, что, при таком выборе линейной
функции все n?1 собственных чисел матрицы A1 равны ?? (линейная система
z ? = A1 z имеет кратный полюс ??).
Теорема 9. Для функций
?(z)
вида (46) нижняя граница
чивости системы сравнения не зависит от
ком системы сравнения.
30
?
?0?
сектора устой-
и определяется только поряд-
Для двумерных систем (38) (n = 3) значение ?0? = 1/9 найдено аналитически (раздел 3.2). Для больших размерностей теорема 9 позволяет найти
сколь угодно точную оценку для границы сектора численно (один раз для
заданного порядка системы). Действительно, для этого достаточно решить систему (43), (44) для нескольких значений ?0 и выбрать в качестве оценки наименьшего значения ??0? минимальное из этих значений, при котором система
имела решения. Для систем (38) третьего порядка (n = 4) величина сектора
устойчивости была найдена численно: ?0? = 0, 20000. Для систем большего порядка, оценки областей устойчивости пока не строились и величина сектора
устойчивости не оценивалась.
В отличие от задачи 2, задачи 1 и 3 приходится решать неоднократно,
так как оценки области устойчивости в общем случае строятся итерационно
(исключение составляет случай n = 3, когда соответствующая, двумерная, система линейных матричных неравенств решается аналитически). Количество
итераций возрастает многократно, если требуется построить не произвольную,
а оптимальную в том или ином смысле, оценку. Любое решение системы неравенств (43), (44) определяет инвариантный эллипсоид системы (38), (39) с
точностью до масштабного множителя, который следует выбирать так, чтобы
результирующий эллипсоид принадлежал области определения канонической
системы Dz .
Проверка выполнения условий (40) и (41) (задача 3) сведена к проверке
более простого неравенства
?0 ?0 ? U?0 ,
(47)
выполнение которого гарантирует выполнение условий (40) и (41). В (47), ?0 максимум линейной функции ?(z) на эллипсоиде (42), определенный формулой
?
?0 = ? cT P ?1 c (Рапопорт Л.Б), и
U?0 =
min
z??, s?R1 , ??R+
U? (z, s, ?), U? (z, s, ?) = f1 (z, s, ?)u? ? |f0 (z, s, ?)|,
(48)
где ? - некоторая простая область (например, параллелепипед), содержащая
эллипсоид, в которой ищется минимум функции U? (z, s, ?).
Раздел 3.2 посвящен аналитическому решению системы линейных матричных неравенств (43), (44) в двумерном случае (дифференциальный порядок
модели n = 3). Установлено, что любое решение системы линейных матричных
31
неравенств (43), (44) представимо в виде
(
P =
?p?1 p?2 /2
p?2 /2 p?3 /?
)
(49)
,
где p?1 , p?2 , и p?3 координаты произвольной точки трехмерного пространства,
принадлежащей пересечению (не зависящих от ?) конусов
(p?3 ? p?2 ? p?1 )2 + (p?2 ? 2p?1 )2 ? 4p?21 ,
(50)
?0 (p?3 ? p?2 ? p?1 /?0 )2 + (p?2 ? 2p?1 )2 ? 4p?21
(51)
или, в эквивалентном виде,
(p?1 ? p?2 ? p?3 )2 + (p?2 ? 2p?3 )2 ? 4p?23 ,
1
(p?1 /?0 ? p?2 ? p?3 )2 + (p?2 /?0 ? 2p?3 )2 ? 4p?23 .
?0
Так как решение системы линейных матричных неравенств определено с точностью до скалярного множителя, число неизвестных можно уменьшить до
двух, положив p?1 (или p?3 в двух последних неравенствах) равным константе.
Пусть, для определенности, p?1 = const. Деля обе части неравенств (50) и (51)
на p?1 и переходя к новым переменным
q1 = p?2 /p?1 , q2 = p?3 /p?1 ,
(52)
(q2 ? q1 ? 1)2 + (q1 ? 2)2 ? 4,
(53)
?0 (q2 ? q1 ? 1/?0 )2 + (q1 ? 2)2 ? 4.
(54)
получим неравенства
Теорема 10. Система линейных матричных неравенств (43), (44) имеет
решения тогда и только тогда, когда совместны скалярные неравенства (53)
и (54). Пусть
q1 , q 2
решение системы (53), (54). Тогда, соответствующее
решение системы (43), (44) определено формулой (49), где
из формул (52) и
p?1
p?2
и
p?3
находятся
произвольная константа.
Очевидно, что при ?0 = 1 неравенства (53) и (54) совместны. Чем меньше
значение ?0 , тем больше система (37) отличается от линейной (при ?0 = 1
система линейна), поэтому наибольший интерес для нас представляет нижняя
граница сектора.
32
Теорема 11. Минимальное значение
матричных неравенств
?0? = 1/9.
(43), (44)
?0 ,
при котором система линейных
имеет решения не зависит от
При этом значении система имеет единственное
до скалярного множителя) решение
(49),
(с
?
и равно
точностью
где
p?2 = 2p?1 , p?3 = 5p?1 .
В последующих построениях важную роль играет следующая лемма, устанавливающая минимальное значение ?0 , при котором данная точка (q1 , q2 ) принадлежит обоим эллипсам (53) и (54).
Лемма 1. Пусть
чение
q1
и
q2
(53). Наименьшее зна-
удовлетворяют неравенству
?0 , при котором также выполняется неравенство (54), определено фор?
?
мулой
?0min (q1 , q2 ) =
?
?
2q1 +2q2 ?q12 ? q1 (q1 ?4)(q12 ?4q2 )
,
2(q2 ?q1 )2
1
, q 1 = q2 .
2q1 +2q2 ?q12
q1 ?= q2 ,
(55)
В разделе 3.3 описанный в разделе 3.1 метод применяется для нахождения оценок областей притяжения для кинематической модели колесного робота (1). Существование аналитического решения системы линейных матричных
неравенств (43), (44) в этом случае дает возможность ставить и эффективно
решать оптимизационные задачи и находить наилучшие в том или ином смысле оценки. Показано, в частности, что нахождение эллипсоидальной оценки
наибольшей площади сводится к стандартной задаче условной оптимизации
функции двух переменных.
Рассмотрим луч в пространстве трех переменных p?1 , p?2 , p?3 , принадлежащий конусу решений линейного матричного неравенства (43). Такой луч
однозначно определяется координатами q1 и q2 точки пересечения луча плоскостью p?1 = 1, принадлежащей эллипсу (53). Эллипсы ?, соответствующие
различным точкам луча имеют одинаковую форму и отличаются друг от друга только размером, а соответствующие матрицы P отличаются друг от друга
скалярным множителем и могут быть представлены в виде
P?
, P? = ?22
P =
det P?
(
?
1
q1 /2?
q1 /2? q2 /?2
)
,
(56)
?p?1 ? maxz?? |z2 |. При фиксированных q1 и q2 , det P (det P? ) монотонно возрастает (убывает) с ростом ?2 . Поэтому наибольшая площадь эллипса достигается при максимальном значении ?2 , при котором еще выполняется
левое неравенство в секторном условии (40). Так как проверка условия (40)
где ?2 =
33
затруднительна, будем контролировать выполнение неравенства (47). Учитывая, что наибольшее значение ?2 достигается при наименьшем возможном при
данных q1 и q2 значении ?0 , получаем уравнение для определения ?2 :
U?0 = ?2 ??0min (q1 , q2 )??0 (q1 , q2 ),
(57)
где U?0 и ?0min (q1 , q2 ) определены формулами (48) и (55) соответственно, а
?
??0 (q1 , q2 ) = q2 ? 2q1 + 4. Минимум функции U? (x, s, ?) в (48) берется по описывающему искомый эллипс прямоугольнику размера 2?1 Ч 2?2 , где ?1 =
?
maxz?? |z1 | и ?2 = maxz?? |z2 |. В силу соотношения ?1 = ?2 q2 /?, искомое
?2 и детерминант соответствующей матрицы P? однозначно определяются выбранным лучом и являются функциями переменных q1 и q2 : ?2 = ?2 (q1 , q2 )
и det P? = D(q1 , q2 ). Зависимость U?0 от ?1 и ?2 определяется выбором обратной связи, используемой для стабилизации. В случае обратной связи (23),
U?0 = min{U?01 , U?02 }, где
?
k?(1 ? ?22 )
k?
, U?02 = u? ?
.
U?01 = u? 1 ? ?22 ?
1 ? k??1
1 ? k??1
Если используется обратная связь (26), то U?0 ? U?02 .
В силу приведенного выше соотношения, связывающего размеры ?1 и
?2 описывающего прямоугольника, уравнение (57) можно решать как относительно ?2 , так и ?1 . Заметим, что численное решение уравнения (57) не
представляет трудностей, так как обе части уравнения являются монотонными функциями ?2 (?1 ): U?0 монотонно убывает с ростом ?2 (?1 ) (чем больше
эллипс, тем больше описанный прямоугольник и тем меньше минимум функции U? (z, s, ?) на нем), а правая часть монотонно возрастающая (линейная)
функция.
Теперь для того чтобы построить наилучшую эллипсоидальную аппроксимацию области притяжения, требуется найти максимум функции двух переменных D(q1 , q2 ), область изменения которых ограничена эллипсом (53). Таким
образом, справедлива следующая
Теорема 12. Пусть
q1? , q2?
решение задачи максимизации функции двух пе-
ременных
)
(
?24 (q1 , q2 )
q12
D(q1 , q2 ) =
q2 ?
?2
4
2
2
при условии (q2 ? q1 ? 1) + (q1 ? 2) ? 4, где ?2 (q1 , q2 ) решение скалярного
уравнения (57). Тогда матрица P наилучшей в смысле площади эллипсоидаль? ?
ной аппроксимации области притяжения получается подстановкой q1 , q2 в
формулу (56).
34
Теорема 12 сводит задачу нахождения наилучшей эллипсоидальной аппроксимации области притяжения к стандартной задаче условной оптимизации
функции двух переменных, определенной на выпуклом множестве (эллипсе).
Эта задача в общем случае может быть решена только численно, так как оптимизируемая функция включает в себя функцию ?2 (q1 , q2 ), значения которой
определяются путем численного решения скалярного уравнения (57). Однако
простота указанного скалярного уравнения и малая размерность задачи оптимизации делают численное решение весьма эффективным. Точка q1? , q2? , в которой достигается максимум детерминанта находится либо с помощью методов
графической визуализации, либо численно (например, с помощью программы
fmincon, имеющейся в пакете Matlab).
В разделе 3.4 строятся оценки области притяжения для автомобилеподобного робота (2) с ограничением на максимальный угол поворота передних
колес |?| ? ?? < ?/2 и ограниченным ресурсом управления |u| ? u?. Рассматривается один из двух линеаризующих законов управления, полученных в главе
2, а именно, управление, определенное формулой (30). Применяя к правой части (30) функцию насыщения (см. формулу (36)), подставляя результирующее
управление в каноническую систему и опуская последнее уравнение получаем
нелинейную систему
z1? = z2 ,
z2? = z3 ,
z3? = ??(?, z, s).
(58)
Как уже упоминалось выше, для функций ? вида ?(z) = ?3 z1 + 3?2 z2 +
3?z3 (получается подстановкой n = 4 в формулу (46)) нижняя граница сектора
?0? была найдена численно и равна ?0? = 0.20000 (задача 2). Фазовое ограничение |?| ? ?? в канонических переменных имеет вид
?
?
2
2
tg ?? 1 ? z22 k(s)(1 ? z22 )
tg ?? 1 ? z2 k(s)(1 ? z2 )
?
? z3 ?
?
.
?
(59)
L
1 ? k(s)z1
L
1 ? k(s)z1
Область определения канонической системы Dz , которой должны принадлежать искомые инвариантные эллипсоиды, устроена довольно сложно (даже
для целевого пути постоянной кривизны) и, в общем случае, не выпукла. В
случае, когда кривизна целевой кривой меняется в диапазоне ?k? ? k(s) ? k? ,
предлагается аппроксимировать Dz ограниченным эллиптическим цилиндром
с осью симметрии, направленной вдоль оси z1 . Вид аппроксимирующего цилиндра устанавливается следующей леммой.
35
Лемма 2. Пусть
?k? ? k(s) ? k?
кривизна целевой кривой удовлетворяет ограничениям
и пусть
?1 < ??1 ?
Тогда любая точка
z = (z1 , z2 , z3 ),
1
L
?
.
k? tg ??
(60)
удовлетворяющая ограничениям
?
??1 ? z1 ? ?1 , ?1 ? z2 ? 1, |z3 | ? h? 1 ? z22 ,
где
h? =
(61)
tg ??
k?
?
,
L
1 ? k??1
удовлетворяет также неравенствам (59) при всех значениях
s.
При этом
цилиндр (61) является наибольшим эллиптическим цилиндром, аппроксимирующем одновременно все семейство фазовых пространств в полосе
|z1 | ? ?1 .
Таким образом, задача построения эллипсоида, удовлетворяющего фазовым
ограничениям (задача 1), заменена более простой задачей вписывания эллипсоида в ограниченный эллиптический цилиндр, которая эквивалентна выполнению линейных матричных неравенств:
P ? I1 , P ? ?0 , где I1 = diag[1/?12 , 0, 0], ?0 = diag[0, 1, 1/h?2 ].
(62)
Проверка секторных условий (задача 3) заменена проверкой неравенства
(47), при этом минимум U?0 функции в правой части формулы (48) ищется на
криволинейном параллелепипеде ?, определенном формулами
?
? = {z : |z1 | ? ?1 , |z2 | ? ?2 , |z3 | ? u? 1 ? z22 ,
где ?1 = maxz?? |z1 | и ?2 = maxz?? |z2 |, и равен (k? ? = maxs |k ? (s)|)
(
)
?
?
u?
k?
k?
tg
??
?
2
U?0 = 1 ? z22
?
?
? ?2 u?2 .
3
v?L (1 ? k??1 )
L(1 ? k??1 )
Теорема 13. Пусть
P >0
решение системы линейных матричных нера-
?0 ? (0.2, 1] и некотором ?1 , удовлетвоT
пусть в области ? = {z : z P z ? 1} выполнено
Тогда ? является инвариантным эллипсоидом
венств (43), (44), (62) при некотором
ряющем неравенству (60), и
скалярное неравенство (47).
системы (58).
Показано, что, если целевой путь допустим, то всегда можно добиться
выполнения неравенства (47). Для этого может понадобиться сжать построенный эллипсоид в направлении z2 и ? , что, в свою очередь, достигается
добавлением одного или двух матричных неравенств к системе (62).
36
Поясним, что означает выполнение требуемых теоремой условий. Неравенство (60) ограничивает диапазон возможных значений ?1 , и его выполнение
гарантирует существование аппроксимирующего цилиндра ненулевой высоты
при данном ?1 . Матричные неравенства (62) удовлетворены, если эллипсоид
принадлежит аппроксимирующему цилиндру, что гарантирует выполнение фазовых ограничений. Условия (43), (44) означают, что область ? является областью притяжения системы (58) в случае, когда правая часть третьего уравнения принадлежит сектору [?0 , 1]. А условие (47) означает, что при z ? ?
правая часть этого уравнения действительно ему принадлежит. Таким образом, нахождение инвариантного эллипсоида сводится к совместному решению
системы из четырех линейных матричных неравенств и проверке условия (47).
В двух следующих параграфах раздела 3.4 представлены постановка задачи построения квазиоптимального инвариантного эллипсоида для автомобилеподобного робота и алгоритм его нахождения, а в последнем параграфе
дан численный пример построения квазиоптимального эллипсоида.
В
четвертой главе
обсуждаются некоторые вопросы, связанные с по-
строением целевых путей по заданному дискретному множеству точек.
В разделе 4.1 обсуждается общая постановка задачи, а также требования,
которым должна соответствовать целевая кривая, помимо условий гладкости,
обсуждавшихся в первой главе.
В разделе 4.2 рассматривается аппроксимация целевых путей для автом?
Документ
Категория
Без категории
Просмотров
15
Размер файла
286 Кб
Теги
анализа, синтез, роботов, стабилизирующих, стабилизацией, колесных, путевой, управления, устойчивость, задачи
1/--страниц
Пожаловаться на содержимое документа