close

Вход

Забыли?

вход по аккаунту

?

Разработка и исследование методики синтеза и алгоритма распознавания образа искусственного маркера в системах управления робототехническим объектом.

код для вставкиСкачать
3
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. В настоящее время все серьезнее встает проблема ограниченности времени функционирования различного рода робототехнических объектов
(роботов) в автоматическом режиме, будь то бесплотный летательный аппарат
(БПЛА), автономный необитаемый подводный аппарат (АНПА) или любой другой
автономный робот. Их функционирование связано с необходимостью выполнения
длительных задач. Время автономной работы таких объектов редко достигает суток,
что связано с ограниченной емкостью аккумуляторов на борту робота, в результате
чего возникает необходимость их периодической перезарядки.
Наиболее рациональным решением данной проблемы на современном этапе развития техники и технологий принято считать использование док-станции, пристыковавшись к которой, робот будет способен выполнить перезарядку аккумуляторов и,
кроме того, осуществить информационный обмен: получить новое задание или перенести, собранную за время выполнения задачи, информацию на физический носитель.
В публикациях отечественных и зарубежных исследователей данной проблемы
представлены различные способы определения параметров положения робота в пространстве, позволяющие выполнять стыковку с док-станцией в автоматическом режиме. Основными из них являются способы на основе акустических, инфракрасных,
лазерных датчиков, с применением свойств электромагнетизма и другие. Однако
наиболее универсальным на этапе стыковки принято считать способ, основанный на
методах цифровой обработки визуальной информации, когда определение параметров
положения выполняется за счет соотношений между известными параметрами реальных объектов и их изображением. Это связано с тем фактом, что большинство существующих на текущий момент роботов изначально содержат в своем составе видеокамеру (камеру), а точности работы других способов недостаточно.
В последние годы проводятся обширные исследования в области применения
цифровой обработки визуальной информации при решении различных задач машинного зрения и, в частности, при решении задачи локального ориентирования, о чем
свидетельствует большое число научных публикаций. При этом, задача ориентирования решается за счет распознавания изображений (образов) искусственных объектов
(маркеров), что связано с их статичной структурой. Наиболее широкое применение
такого подхода представлено в статьях, посвященных решению данной задачи для
АНПА. Это обусловлено тем, что в силу особенностей гидрооптических свойств воды, применение методов визуального ориентирования, разработанных для наземных
систем, в большинстве случаев невозможно из-за затухания света (в среднем лишь
20% солнечного света проникает на глубину 10 метров в чистой воде). Это сокращает
дальность действия оптических систем и связано с необходимостью использования
дополнительных источников освещения, что является причиной неравномерной подсветки донных объектов. Кроме того, в отличие от подобных сухопутных систем, где
для локального ориентирования используются образы маркеров с четкими границами,
на подводных изображениях объекты заилены, поэтому происходит искажение геометрии маркера. Следует отметить, что среди сухопутных систем также не существует универсального решения задачи локального ориентирования.
В силу указанных обстоятельств актуальным является решение проблемы локального ориентирования роботов с применением цифровой обработки визуальной информации, что позволит выполнять стыковку с док-станцией для заряда аккумуляторов и информационного обмена в автоматическом режиме.
4
Целью работы является разработка методического и алгоритмического обеспечения, позволяющего повысить точность и расширить диапазон возможных пространственных положений объекта при его локальном ориентировании относительно образа маркера в системах управления робототехническими объектами.
Задачи исследования:
– разработать и исследовать методику синтеза образов искусственных маркеров
для осуществления локального ориентирования роботов на основе применения цифровой обработки визуальной информации с учетом выявленных недостатков существующих образов;
– синтезировать маркер с учетом требований разработанной методики;
– разработать алгоритм распознавания синтезированного образа маркера;
– провести компьютерные эксперименты и испытания предложенного методического и алгоритмического обеспечения.
Решение поставленных задач достигается за счет использования инвариантных
свойств перспективной группы геометрических трансформаций (ГГТ), что позволяет
учитывать и компенсировать искажения, которые появляются в результате проецирования на плоскость изображения. При этом появляется возможность распознавания
маркера и выполнения локального ориентирования в более широком диапазоне возможных положений камеры, по сравнению с рассмотренными аналогами.
Характер объекта исследования, а также специфика цели и задач обусловили выбор методов и приемов исследования, среди которых основными являются: системный анализ, теория множеств, математическая статистика, структурное и объектноориентированное программирование, цифровая обработка изображений и распознавание образов.
Основные положения, выносимые на защиту:
1. Методика синтеза образов маркеров, позволяющая расширить диапазон положения объекта относительно маркера.
2. Синтезированный образ маркера, отличающийся от аналогов более широким
диапазоном пространственных координат объекта для его распознавания.
3. Алгоритм распознавания синтезированного маркера на основе модификации
метода Хафа, позволяющий снизить вычислительные затраты.
Научная новизна результатов исследования заключается в том, что:
1. Разработана и исследована методика синтеза образов маркеров, которая учитывает перспективные законы проецирования и инварианты перспективной ГГТ на
изображении, что способствует расширению диапазона возможных положений камеры относительно маркера, при которых маркер распознается и позволяет определять
параметры относительного положения.
2. Синтезирован образ маркера, с учетом требований разработанной методики,
состоящий из элементов, позволяющих выполнять распознавание образа маркера в
более широком диапазоне возможных положений камеры, по сравнению с рассмотренными аналогами.
3. Разработан алгоритм, в основе которого лежит модифицированный метод Хафа, оптимизированный для распознавания образа синтезированного маркера.
Практическая значимость работы заключается в том, что разработанная методика синтеза образов маркеров и алгоритмов их распознавания с целью выполнения
локального наведения, позволяет стабилизировать положение робота при выполнении
стыковки с док-станцией в автоматическом режиме за счет более точного определения параметров относительного положения робота в режиме реального времени.
5
Работа выполнялась в рамках:
1. Поисковой НИР по направлению темы диссертационной работы в рамках
Федеральной целевой программы «Научные и научно-педагогические кадры
инновационной России» на 2009-2013 гг. «Исследование принципов построения
систем наведения и позиционирования подводного робота с применением
современных микроэлектронных средств на примере матричной логики и цифровых
сигнальных процессоров» ГК № П497 от 13 мая 2010 г.;
2. НИОКР по направлению темы диссертационной работы в рамках программы
«У.М.Н.И.К.», проводимых Фондом содействия развитию малых форм предприятий в
научно-технической сфере «Исследование и разработка уточненных технологий и
программно-аппаратных средств в металлообработке, приборостроении и экологии»
ГК № 7103р/9661 от 07.07.2009 г.;
3. НИОКР по направлению темы диссертационной работы в рамках программы
«У.М.Н.И.К.», проводимых Фондом содействия развитию малых форм предприятий в
научно-технической сфере «Разработка уточненных технологий и технологических
комплексов в робототехнике, машиностроении, экологии» ГК № 8728р/13159 от
14.01.2011 г.;
4. НИОКР по направлению темы диссертационной работы в рамках программы
«СТАРТ», проводимых Фондом содействия развитию малых форм предприятий в
научно-технической сфере «Система технического зрения роботов для выполнения
задач ориентирования и поиска» ГК № 11320р/20563 от 14.01.2013 г.
Полученные в ходе выполнения диссертационной работы методика синтеза образов маркеров для выполнения локальной навигации и алгоритм их распознавания могут быть использованы при проектировании автоматических систем управления различного рода роботов. Практическая ценность синтезированного образа маркера заключается, во-первых, в его несложной структуре, что в значительной степени упростит техническую реализацию систем на его основе и, во-вторых, в универсальности
разработанных алгоритмов распознавания применимо к различным условиям функционирования робота. Значимость полученных решений подтверждается научными
публикациями.
Основные результаты работы использованы при выполнении НИР «Методы и алгоритмы цифровой обработки изображений в системе технического зрения интеллектуального подводного аппарата» (ГК №П476 в рамках ФЦП «Научные и научнопедагогические кадры инновационной России» на 2009-2013 гг.), а также в учебном
процессе Тихоокеанского государственного университета в рамках дисциплины «Системы цифровой обработки изображений», что подтверждается соответствующими
актами внедрения (представлены в П.1).
Достоверность исследований обеспечивается обоснованием выбора используемых теоретических методов и подтверждается результатами компьютерных экспериментов и испытаний.
Апробация результатов работы. Основные идеи и результаты исследования отражены в семнадцати публикациях, четыре из которых напечатаны в журналах, рекомендованных ВАК Министерства образования и науки РФ для публикации статей соискателей ученой степени кандидата технических наук. Результаты исследования
также нашли отражение в докладах на следующих конференциях:
6
1. Международная научно-техническая конференция «Робототехника и искусственный интеллект 2012» (Железногорск, 2012г.);
2. Проектирование инженерных и научных приложений в среде MATLAB:
материалы V международной научной конференции (Харьков, 2011г.);
3. 12-ой Международной конференции и выставке «Цифровая обработка сигналов
и ее применение (Digital signal processing and its applications) DSPA-2010» в секции
«Проектирование и техническая реализация систем ЦОС (Москва, 2010г.);
4. The First Russian and Pacific Conference on Computer Technology and Applications
(Владивосток, 2010г.);
5. III Всероссийская научно-техническая конференция «Технические проблемы
освоения мирового океана» (Владивосток, 2009г.);
6. X Всероссийская научно-техническая конференция «Теоретические и
прикладные вопросы современных информационных технологий» (Улан-Удэ, 2009г.).
Работа в целом обсуждалась на научных семинарах кафедры «Вычислительная
техника» ТОГУ.
Публикация результатов работы. По теме диссертации опубликовано 16 печатных работ, из которых – 3 статьи опубликованы в журналах из списка, рекомендованного ВАК РФ, 1 статья в журнале РИНЦ, 6 работ в материалах и трудах конференций
и 6 свидетельств о государственной регистрации программ для ЭВМ.
Личный вклад автора: основные научные положения, теоретические выводы, а
также результаты компьютерных экспериментов и испытаний, содержащиеся в диссертационной работе, получены автором самостоятельно. Положения, составляющие
новизну и выносимые на защиту, получены автором лично.
Структура и объем работы: диссертация состоит из введения, четырех глав, заключения, списка литературы, приложений. Работа содержит 108 страниц основного
текста (с рисунками), 74 рисунка, 3 таблицы, библиографический список из 104
наименований, 10 страниц приложений.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность исследования, формулируются цель и
задачи, указывается материал и методы его исследования, устанавливаются научная
новизна, теоретическая и практическая значимость работы, а также формулируются
положения, выносимые на защиту.
В главе I «Локальное ориентирование робототехнических объектов» выполняется обзор современных разработок в области алгоритмов относительного ориентирования роботов, их анализ и сравнение. Исследуется принципиальная возможность реализации необходимой функциональности, определяются теоретические предпосылки
и методологические основы предпринимаемого исследования.
Отмечается, что одним из решений, рассмотренных в работе проблем, является
использование док-станции стационарного или буксируемого типов. Применение такого рода док-станции требует определение параметров относительного положения
(ПОП) робота для осуществления стыковки в автоматическом режиме.
Указывается, что для осуществления стыковки в автоматическом режиме
необходимо определять координаты робота с погрешностью не более десятков
миллиметров. Такую погрешность, на текущий момент, дают методы, основанные на
оптическом способе в совокупности с использованием алгоритмов цифровой
обработки изображений и распознавания образов, но имеющие ряд недостатков.
7
Рассматриваются существующие методы оптического определения ПОП, среди
которых выделяют два основных направления: ориентирование относительного маркеров естественного и маркеров искусственного происхождения. Дано обоснование
выбора искусственных маркеров, а так же приводятся ГГТ на изображении и соответствующие им инварианты, которые сведены в таблицу 1.
Таблица 1 – Геометрические инвариантные свойства.
Группа трансформаций
Матрица
Инвариантные свойства
 параллельность линий
 R t   длинна отрезка между двумя точками
Изометрические
0T 1  угол между двумя прямыми


 площадь
 sR t   параллельность линий
Трансформации подобия
 0T 1  соотношение длин отрезков

  соотношение площадей
 A t   параллельность линий
Аффинные
0T 1  соотношение длин отрезков

  соотношение площадей
Перспективные
A t
 vT  


 коэффициент двойного отношения (КДО)
длин отрезков на прямой линии
Рассматривается ряд образов маркера с точки зрения инвариантности их геометрии и алгоритмы их распознавания. В результате анализа алгоритмов отмечается, что
большинство из них не способны распознать образ маркера на изображении при отклонении от параллельного положения камеры относительно плоскости, в которой
расположен маркер, что накладывает ограничения на диапазон возможных положений камеры и, как следствие, приводит к росту числа случаев, когда распознать образ
маркера на изображении не удается.
На рисунке 1 графически представлен диапазон возможных положений камеры
относительно маркера, когда маркер полностью попадает в кадр, и диапазон, в которой большинство рассмотренных алгоритмов позволяют распознавать образ маркера.
Координаты положения камеры в таком случае описываются сферическими координатами: r – дальность, φ – зенит, θ – азимут.
φ
Рассмотренные
алгоритмы
Маркер
r
θ
Рисунок 1. Диапазон возможных положений камеры относительно маркера.
8
Анализ образов маркеров показал, что такое ограничение связано с тем, что в образ маркера изначально не закладываются инварианты перспективной ГГТ, которое
претерпевает изображения при проецировании.
Исходя из этого, актуальна цель работы по разработке методического и алгоритмического обеспечения, позволяющего повысить точность и расширить диапазон
возможных пространственных положений объекта при его локальном ориентировании относительно образа маркера в системах управления робототехническими объектами.
В главе II «Разработка методики формирования образа искусственного маркера» описывается процесс разработки методики синтеза образов маркеров, основанной на использовании инвариантов перспективной ГГТ. А также представлены результаты компьютерного моделирования, позволяющие синтезировать простейший
образ маркера, который удовлетворяет предложенной методике.
Базовый закон получения координат точек пространства P на плоскости изображения I описывается соотношением 1:
q  HQ  sKWQ ,
(1)
где Q(X, Y, Z) – точка внутри пространства P; q(x, y, 1) – однородные координаты проекции точки Q на плоскость изображения I; H – матрица гомологии, определяющая
закон проецирования; K – матрица внутренней калибровки камеры; W – матрица
внешней калибровки камеры; s – масштабирующий коэффициент.
Как показывает ряд исследований, для определения положения системы отсчета, связанной с камерой относительно системы отсчета в пространстве P, представляющей собой маркер известной формы, необходимо чтобы он состоял минимум из
четырех характерных неколлинеарных точек с известными координатами как в пространстве P, так и на плоскости I, а камера должна быть калибрована.
В процессе калибровки камеры определяются параметры матриц внутренней и
внешней калибровки. Матрица внутренней калибровки камеры K содержит в своей
основе физические параметры камеры. Матрица внешней калибровки камеры W содержит параметры перехода из одной системы координат в другую, учитывающие
относительное положение камеры и сцены. Таким образом, существует возможность
определять параметры перехода из одной системы координат в другую, что и позволит оценить ПОП робота. Следует отметить, что несмотря на факт использования в
соотношении 1 декартовой системы координат, в работе применяются полярные координаты. Это обусловлено удобством использования при проведении компьютерных
экспериментов и испытаний.
Фундаментальным инвариантом, при использовании перспективной ГГТ, является
коэффициент двойного отношения (КДО) η, который описывается соотношением 2, а
геометрический смысл представлен на рисунке 2.
C A D1 A1 C2 A2
  CA DA  1 1

CB DB
C1B1
D1B1
C2 B2
D2 A2
,
D2 B2
(2)
где О1 и О2 – центры проецирования; [A1, B1, C1, D1] и [A2, B2, C2, D2] – проекции
множества точек [A, B, C, D] на плоскости I1 и I2 соответственно; I1 и I2 – плоскости
проецирования;
9
O1
O2
I1
I2
A1
B1
C1
D1 A 2
B2
C2
D2
P
A
B
C
D
Рисунок 2. Геометрический смысл КДО.
Отношение расстояний между четырьмя коллинеарными точками является инвариантом, т.е. не зависит от относительного положения камеры. Учитывая данное
обстоятельство, целесообразно формировать структуру маркера из дискретных объектов, физическим аналогом которого могут быть как разного рода источники света
(светодиоды, лампы и т.д.), так и контрастные объекты (белые полусферы на черной
поверхности и т.д.). Назовем линейкой дискретных объектов (ЛДО) последовательность из четырех коллинеарных дискретных объектов. Чтобы существовала возможность определения ПОП робота, необходима структура маркера, состоящая не только
из коллинеарных точек, а, следовательно, необходимо задаться некоторым множеством ЛДО (МЛДО), взаимное расположение которых и определит геометрию маркера.
Для формирования МЛДО допустим, что объекты внутри ЛДО расположены на отрезке единичной длины, а крайние объекты S1 и S4 попадают соответственно на начало
и конец отрезка. Таким образом, конфигурация будет зависеть только от положения
объектов S2 и S3. Для получения всех возможных положений S2 и S3 зададимся шагом ξ,
который должен быть больше параметра ρ, учитывающего линейные размеры физического аналога, как это показано на рисунке 3.

0
0,5
1

s1
s2
s3
s4
Рисунок 3. Линейка дискретных объектов.
Отсюда следует, что число возможных конфигураций ЛДО N будет определяться
как число всех возможных перестановок S2 и S3, на основе по соотношения 3.

1 1   1
N    1    2  ,
(3)
2
 

Ввиду того, что после отметки 0,5 конфигурации ЛДО начинают повторяться по
причине симметричности расположения, то число уникальных конфигураций n будет
определяться соотношением 4:
 5
n
 4
 1
 1
 2

 1  1 ,

(4)
Основным критерием при выборе оптимальной конфигурации ЛДО из n – возможных является значение коэффициента промахов M(r, φ, θ), которое описывается соотношением 5, и характеризует устойчивость ЛДО к перспективным искажениям:
10
m  
(5)
100% ,
C
где C – общее число возможных положений камеры, полученных при конечном дискретном значении ПОП, таких, что центр кадра совпадает с центром ЛДО; m(τ) – число
положений камеры, для которых определение КДО ЛДО невозможно; τ – параметр, который учитывает минимальное расстояние между соседними проекциями pi и pi+1 в
плоскости I, при котором возможно определение КДО ЛДО (рисунок 5).
Число m(τ) увеличивает свое значение в двух возможных случаях: когда не все элементы ЛДО попали в поле зрения камеры, т.е. на изображении I отсутствуют их проекции (такой исход наступает на близком расстоянии от маркера); когда расстояние между соседними проекциями оказывается меньше параметра τ (на большом удалении от
маркера, либо при φ→900). В процессе определения M(r, φ, θ) для каждого положения
камеры, исходя из координат проекции pi, необходимо определить значение m(τ). Очевидно, что оптимальная конфигурация ЛДО, с точки зрения распознавания на изображении, соответствует минимальному значению m(τ), определяемому коэффициентом
mmin и соотношением 6:
M  r ,  ,  
n 1
mmin  min(m j ( )) ,
j 0
(6)
Другим важным параметром является величина ε модуля отклонения ηР, вычисленного для конфигурации ЛДО лежащей в плоскости сцены Р от ηI, полученного в результате проецирования ЛДО на плоскость изображения I, представленное соотношением 7:
  r , ,   Р I ,
(7)
Для каждой конфигурации ЛДО наибольший интерес представляет величина максимального отклонения, определяемая коэффициентом εmax и соотношением 8:
C 1
 max  max( j ) ,
j 0
(8)
где εmax – коэффициент, показывающий в каких пределах может изменяться ошибка
определения КДО ЛДО среди всех возможных положений камеры С в идеальных условиях. При равных значениях коэффициентов M(r, φ, θ) и mmin нескольких ЛДО, оптимальной конфигурацией будет обладать ЛДО с меньшим коэффициентом εmax.
В результате определяется конфигурация ЛДО, которая будет распознаваться с
большего числа возможных положений камеры и обладать КДО равным η0. Чтобы
определить МЛДО необходимо среди оставшихся n-1–ЛДО выбрать такие, значения
которых удовлетворяют соотношению 9:

(0   0,max )  ( j   j ,max ), если 0   j
 0 j  0  
(9)
(



)

(



),
если




j
j
,max
0
0,max
0
j

,
где Δ0-j – величина, характеризующая ширину «защитного» интервала между двумя
ЛДО c η0 и ηj; ηj – значения КДО из числа оставшихся n-1–ЛДО. Назначение Δ графически представлено на рисунке 4.
11
2 j ,max
2 0,max
j
0
Δ0-j
Рисунок 4. Ширина «защитного» интервала между двумя ЛДО c η0 и ηj.
Введение коэффициента Δ0-j позволяет избежать неоднозначности между значениями КДО для разных ЛДО, близких по расположению объектов S2 и S3, т.к. в результате
проецирования значению ηР могут соответствовать значения ηI ± εmax. Таким образом,
определение МЛДО позволит синтезировать образ маркера, который будет различим с
максимального числа возможных положений камеры.
Схематично процесс проецирования ЛДО представлен на рисунке 5.
I
I
p1
p2
p4
p3
H
P
s1
s2 s3
s4
w
Рисунок 5. Проецирования ЛДО на плоскость изображения I.
Согласно предложенной методике, необходимо определить базовое ЛДО с КДО
η0. Для этого необходимо построить зависимости M(r, φ, θ). Если для параметров
φ=0..900 и θ=0..3590 предельные значения определены, то для параметра r верхняя
граница определяется в результате проведения эксперимента и зависит от параметров
модели, поэтому график зависимости M(r, φ, θ) будет строится, при фиксации параметра r.
Следует отметить, что в общем случае зависимость параметров камеры от размеров маркера и необходимой дальности функционирования робота определяется соотношением 10:
f h
 l 
r
r
 w ,   2arctg 

H
W
2f 
(10)
где h и w – горизонтальный и вертикальный размеры матрицы камеры; l – диагональный размер габаритного контейнера маркера, который должен попасть в кадр полностью; H и W – горизонтальные и вертикальное разрешение матрицы камеры.
Для проведения компьютерного эксперимента зададимся следующими параметрами модели: α=900; l=1м; τ=10пикс.; ρ=0,05м; H×W=1920×1080. На рисунке 6 представлены результаты компьютерного эксперимента.
12
М(r, φ, θ ), %
100
80
Группа №3
60
40
20
Группа №2
Группа №1
2
4
6
8
10
12
14
16
18
20
r, м
Рисунок 6. График зависимости M(r, φ, θ).
По результатам моделирования можно отметить разделение всего множества ЛДО
на три группы. В группу №1 попали те ЛДО, положение объектов S2 и S3 на которой
симметрично относительно отметки 0,5. Такие ЛДО показывают лучшие показатели
M(r, φ, θ), что объясняется увеличением m(τ) только для положений камеры при r<2м и
при φ>700. На графике можно отметить, что для указанных параметров модели предельное значение параметра r=18м. В группу №2 и №3 вошли ЛДО c ассиметричным
положением объектов. Разница заключается в том, что в группе №3 объекты S2 и S3
располагаются ближе к отметкам 0 и 1, что приводит к увеличению m(τ) уже при φ>500.
Таким образом, для дальнейших исследований будут использованы только ЛДО
из группы №1, результаты компьютерного эксперимента для которых показаны на рисунке 7. Исходя из графика можно заключить, что наиболее оптимальным по критерию mmin является ЛДО с КДО заданным значением η0=1,333, при этом величина отклонения составляет ε0, max=0,15. η0 и будет выбран в качестве базового для формирования МЛДО.
М(r, φ, θ ), %
10
8
6
Группа №1
4
η0=1,333
2
2
4
6
8
10
12
14
16
18
20
r, м
Рисунок 7. График зависимости M(r) для ЛДО группы №1.
Для формирования МЛДО обратимся к гистограмме на рисунке 8, где представлены значения Δ0-j для других ЛДО из группы №1.
13
Δ0-j
η1=1,067
η5=1,022
η2=1,8
0.03
η3=1,522
η4=1,4
0
-0.03
-0.06
Рисунок 8. Ширина «защитного» интервала для ЛДО относительно η0.
Как можно заключить из гистограммы, результирующее МЛДО будет состоять из
шести ЛДО с КДО: η0=1,333, η1=1,067, η2=1,8, η3=1,522, η4=1,4, η5=1,022. Однако, если
рассмотреть взаимный коэффициент Δ будет очевидно, что КДО η3, η4 и η5 имеют отрицательные значения защитного интервала, что не позволяет однозначно отличать их
друг от друга. В результате, исходя из данных моделирования, МЛДО включает три
ЛДО с КДО: η0=1,333, η1=1,067 и η2=1,8.
Таким образом, образ маркера примет вид, который представлен на рисунке 9. Такая структура маркера является самой простой из возможных, которая позволяет компенсировать области положений камеры, при которых ЛДО не были распознаны по отдельности.
D2
A3
1
,8
2

7
B2
C3
0  1,333
D3
A1
, 06
1
C2
1
B3
B1
A2
C1
D1
Рисунок 9. Элементарная структура образа маркера.
Кроме того, была определена область возможных положений камеры относительно маркера, для которых маркер будет распознан на изображении в идеальных условиях. Такая область задана системой 12:
  0..3590

 r  2..18 м
  0..850

(12)
14
В главе III «Разработка алгоритма распознавания синтезированного образа
маркера» представляется модифицированный алгоритм Хафа для поиска образа синтезированного маркера, который позволяет выполнить распознавание маркера с последующим определением ПОП. Кроме того, по результатам компьютерного эксперимента приводятся значения абсолютной погрешности определения ПОП.
Отмечается, что для поиска кривых разных порядков на изображении применяется алгоритм преобразования Хафа, в основе которого принципы контурного анализа. В частности, для определения прямой над каждой точкой изображения выполняется преобразование координат в фазовую плоскость, где каждый элемент представляет
собой аккумулятор с координатами (d, ψ), для чего используется соотношение 13:
ψ
d(ψ)=xcosψ+ysinψ,
(13)
где d – длина перпендикуляра; ψ=0..π – угол между положительным направлением
оси ОХ и перпендикуляром к прямой, который проходит через координаты (x, y) и
опускается из начала координат.
Однако в результате того, что алгоритм предназначен для работы со сплошным
контуром, при использовании маркера, состоящего из сегментов, нахождение максимума аккумулятора не дает нужного результата по той причине, что точки не лежат
строго на прямой линии, а находятся в некотором диапазоне δ, как это представлено
на рисунке 10.а). По этой причине необходимо выбирать точки, инкрементируя аккумулятор, для диапазона возможных положений, которые заданы выражением d±δ, где
δ – ширина коридора, внутри которого находятся точки искомого отрезка, как это показано на рисунке 10.б).
Значение δ во многом определяет число положений камеры, при которых образ
маркера будет успешно найден на изображении и, кроме того, влияет на число
найденных отрезков прямых линий, что представлено на рисунке 10.в).
В результате проведенных компьютерных экспериментов для значений δ=0..10
было отмечается, что использование ширины коридора δ=5 с одной стороны позволяет увеличить вероятность распознавания маркера на изображении в идеальных условиях, а с другой стороны снижает число появлений отрезков прямых линий с заданными КДО на изображении с посторонними сегментами. Таким образом, при выполнении дальнейших экспериментов будет использоваться ширина коридора δ=5.
X
X
X
d
2
Y
Y
Y
Рисунок 10. a) классический алгоритм Хафа; б) предложенная модификация алгоритма Хафа; в) влияние δ на количество найденных отрезков прямых линий.
15
Из данных результатов эксперимента получены изображения маркера, для которых был применен алгоритм определения ПОП, описанный соотношением 1. Для
оценки погрешностей для каждого положения камеры было сделано по 300 снимков,
что позволяет оценить погрешность определения параметров относительно положения с доверительной вероятностью 0,9 и доверительным интервалом 0,05. Абсолютная погрешность при определении дальности не превышает 1%, погрешность определения зенита и азимута не превышают двух и четырех градусов соответственно, в
диапазоне возможных положений камеры, определённых системой 12. При моделировании используются параметры камеры, которая будет входить в состав экспериментальной установки и иметь следующие коэффициенты матрицы внутренней калибровки: fx=700,95; fy=726,094; cx= 1926,5; cy= 1091,5.
В главе IV «Проведение испытаний» приводятся результаты экспериментов,
которые отражают статистические данные, демонстрирующие возможности разработанных алгоритмов по распознаванию образа маркера, синтезированного на основе
предложенной методики. Данные были получены применительно к модели системы в
масштабе 10:1.
Описывается последовательность предварительной обработки исходного изображения, результатом которой является множество сегментов, выделенных на изображении, являющиеся входными данными для алгоритма распознавания образа маркера на изображении.
Отмечается, что в общем случае, такая последовательность определена, достаточно глубоко изучена и обоснована многими отечественными и зарубежными исследователями. Отличием в данном случае является тот факт, что в ряде существующих
работ применяется этап, целью которого является фильтрация исходного изображения для устранения влияния различных видов шумов. Однако, исходя из специфики
предлагаемого образа маркера, выполнение дополнительной фильтрации, в общем
случае, может привести к потере элементов структуры маркера. В результате предлагается из общей последовательности исключить этап фильтрации, как это представлено на рисунке 11.
Алгоритм поиска
Сегментация
Бинаризация
Фильтрация
Видеокамера
Эквализация
Рисунок 11. Модифицированная последовательность предобработки изображения.
Из представленной последовательности предобработки наибольший интерес
представляют алгоритмы бинаризации, т.к. во многом от качественного выполнения
разбиения изображения на составляющие объект/фон зависит число найденных сегментов и результат распознавания маркера.
16
Среди рассмотренных в работе алгоритмов были проведены компьютерные эксперименты, которые показали, что целесообразно скомбинировать алгоритмы определения средневзвешенного порога для задания начального приближения и метод Отсу для оценки итеративного приближения к искомому глобальному порогу бинаризации. На вход алгоритму подавались сгенерированные изображения образа маркера,
выполненные в графическом 3D-редакторе в области положения камеры, заданной
соотношением 10.
Кроме того, представляются результаты выполнения серии экспериментов по
распознаванию маркера. Для проведения экспериментов использовалась установка, в
состав которой входят следующие элементы:
1. Маркер. Изображение образа синтезированного маркера выполнено в масштабе 10:1 с размеченными делениями и реперными точками для упрощения процесса фиксации камеры;
2. Камера. В процессе выполнения экспериментов применялась видеокамера c
разрешением Full HD (1920×1080, камера Panasonic HDC-SD800). Положение камеры
выбиралось таким образом, чтобы изображение маркера всегда находилось в кадре;
3. Штатив. Использовался для фиксации положения камеры;
4. Леска с делениями. Расстояние от объектива камеры до геометрического
центра маркера определялось при помощи натянутой лески с делениями с шагом 10
см. Таким образом, удалось фиксировать камеру на заданном расстоянии r от маркера;
5. Лазерная указка. Использовалась для задания положения камеры относительно маркера путем совмещения указателя с делениями на изображении маркера.
Для проведения эксперимента зададимся следующими параметрами модели:
α=900; l=0,1м; τ=10пикс.; ρ=0,01м; H×W=1920×1080. Коэффициенты матрицы внутренней калибровки были рассмотрены при выполнении компьютерного моделирования. В ходе эксперимента изображения маркера были получены в диапазоне возможных положениях камеры, заданной системой 14:
  0,10,..,3500

r  0,1;0, 2;..;1, 0 м
  0,10,..,800

,
(14)
Всего в ходе эксперимента было получено более 60000 изображений маркера.
Для статистической обработки и отображения результатов разработано программное
обеспечение.
Результаты выполнения серии экспериментов, которые позволили уточнить диапазон возможных положений камеры относительно маркера, в которой маркер
успешно распознается. Диапазон возможных положений представлена системой 15.
  0..3590

r  0, 2..1, 0 м
  0..700

(15)
Кроме того определены погрешности нахождения значений ПОП относительно
маркера с доверительной вероятностью 0,85 и доверительным интервалом 0,05 для
чего выполнено 30 измерений параметров для каждого положения камеры.
17
Погрешность при определении дальности не превышает 1% от дальности, погрешность определения зенита и азимута не превышают двух и четырех градусов соответственно, в диапазоне возможных положений камеры, определённых системой
15. Графики погрешности определения ПОП относительно маркера, заданные среднеквадратическим отклонением (СКО), представлены на рисунке 12.
1)
σr, м
0,025
0,020
0,015
0,010
0,005
0,1
10
0,2
0,3
0,4
0,5
0,6
0,7
0,8
50
60
70
80
200
240
280
320
0,9
1,0
r, м
2)
σφ , град
8
6
4
2
10
10
20
30
40
φ, град.
3)
σθ , град
8
6
4
2
40
80
120
160
360
Рисунок 12. Максимальные значения СКО для:
1) дальности r, 2) зенита φ, 3) азимута θ.
θ, град.
18
Сравнивая результаты компьютерных экспериментов и испытаний, предложенного образа маркера и алгоритма его распознавания, можно отметить, что значения
погрешностей при определении значений ПОП совпадают, что говорит о адекватности реализованной модели получения проекции сцены на плоскость изображения, а
так же о работоспособности предложенной методики, которая позволила синтезировать образ маркер, позволяющий выполнять его распознавание в более широком диапазоне возможных положений камеры и, кроме того, определять значения ПОП с достаточной точностью. Такие результаты позволяют сделать вывод о целесообразности
применения разработанного методологического и алгоритмического обеспечения в
системах управления робототехническими объектами
В заключении подводятся итоги работы и намечаются области теоретического и
практического применения результатов исследования.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
По итогам выполнения диссертационных исследований получены следующие
основные результаты:
1. Исходя из анализа рассмотренных вариантов использования образов искусственных маркеров в качестве ориентиров, предложено использование инвариантов
перспективной ГГТ при построении образа маркера, что позволяет снизить влияние
перспективных искажений и повысить вероятность распознавания маркера.
2. Разработана и исследована методика синтеза образов искусственных маркеров, которая учитывает перспективные законы проецирования и инварианты перспективной ГГТ на изображении, что способствует расширению диапазона возможных положения камеры относительно маркера, при которых образ маркера распознается с заданной вероятностью.
3. По результатам компьютерного моделирования, используя предложенную
методику, найдены оптимальные элементы, с помощью которых синтезирован образ
искусственного маркера, позволяющий использовать алгоритмы определения параметров относительного положения робота.
4. Модифицирован алгоритм Хафа для работы с образом синтезированного
маркера, что позволяет выполнять его поиск и распознавание с меньшим количеством
вычислительных операций.
5. Разработано алгоритмическое и программное обеспечение и проведены
эксперименты, в результате которых установлены погрешности определения параметров положения робота относительно образа маркера.
В целом, в процессе диссертационных исследований на основе разработанных
алгоритмов синтеза и распознавания образа маркера получено решение одной из проблем локального ориентирования роботов. Полученные в ходе выполнения диссертационной работы методика синтеза образов маркеров для выполнения локальной навигации и алгоритмы их распознавания могут быть использованы при проектировании
автоматических систем наведения различного рода роботов.
19
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
Статьи, опубликованные в журналах из перечня, рекомендованного ВАК РФ
1. Чемерис, Д.С. Методика синтеза образа искусственного маркера для решения
задачи определения параметров относительного положения робототехнического
объекта [Текст] / С.В. Сай, Д.С. Чемерис // Научные ведомости Белгородского
государственного национального исследовательского университета. Серия история,
экономика, политология, информатика. – 2012. – № 19 (138). – Выпуск 24/1. – С.109115.
2. Чемерис, Д.С. Алгоритм поиска и распознавания искусственных объектов
подводных изображений [Текст] / С.В. Сай, Д.С. Чемерис, Н.Ю. Сорокин, В.В.
Бородулин // Вестник Тихоокеанского государственного университета. – 2012. – №3
(26). – С.67-74.
3. Чемерис, Д.С. Определение относительного положения на основе обработки
видеоизображений [Текст] / И.Н. Бурдинский, Д.С. Чемерис // Цифровая обработка
сигналов. – 2010. – №2. – С.57-59
Публикации в других изданиях
4. Чемерис, Д.С. Формирование образа маркера для автономного относительного
ориентирования в ближней зоне [Текст] / С.В. Сай, Д.С. Чемерис // Исследования
Наукограда. – 2013. – №1 (3). – С. 56-58
5. Чемерис, Д.С. Формирование образа маркера для автономного относительного
ориентирования в ближней зоне [Текст] / С.В. Сай, Д.С. Чемерис // Робототехника и
искусственный интеллект: Материалы IV Международный научно-технической
конференции (г. Железногорск, 7 декабря 2012) / Под ред. В.А. Углева. –
Железногорск: Железногорский филиал СФУ. – 2012. – С. 59-63.
6. Чемерис, Д.С. Моделирование поведения и реализация цифровой системы
наведения подводного робота [Текст]. Материалы III конкурса-конференции научных
работ молодых учёных Тихоокеанского государственного университета (Хабаровск,
1-4 дек. 2009). – Хабаровск: Изд-во Тихоокеан. гос. ун-та. – 2010. – С. 51-56.
Свидетельства о государственной регистрации программ для ЭВМ
7. Свидетельство о государственной регистрации программы для ЭВМ
№2012661252. Модель процесса распознавания точечного маркера на изображении с
помехами [Текст] / С.В. Сай, Д.С. Чемерис – Зарегистрировано в Реестре программ
для ЭВМ 11.12.2012 (РФ).
8. Свидетельство о государственной регистрации программы для ЭВМ
№2012661298. Определение оптимальной структуры точечного маркера для
распознавания в ближней зоне [Текст] / С.В. Сай, Д.С. Чемерис – Зарегистрировано в
Реестре программ для ЭВМ 11.12.2012 (РФ).
9. Свидетельство о государственной регистрации программы для ЭВМ
№2012661251. Программный комплекс автоматической калибровки видеокамеры по
образу точечного маркера [Текст] / С.В. Сай, Д.С. Чемерис – Зарегистрировано в
Реестре программ для ЭВМ 11.12.2012 (РФ).
Чемерис Денис Сергеевич
РАЗРАБОТКА И ИССЛЕДОВАНИЕ МЕТОДИКИ СИНТЕЗА
И АЛГОРИТМА РАСПОЗНАВАНИЯ ОБРАЗА ИСКУССТВЕННОГО
МАРКЕРА В СИСТЕМАХ УПРАВЛЕНИЯ РОБОТОТЕХНИЧЕСКИМ
ОБЪЕКТОМ
АВТОРЕФЕРАТ
диссертации на соискание ученой степени
кандидата технических наук
Подписано в печать 15.11.2013. Формат 60х84 1/16.
Бумага писчая. Гарнитура «Таймс». Печать цифровая.
Усл. печ. л. 1,2. Тираж 100 экз. Заказ №278
Отдел оперативной полиграфии издательства
Тихоокеанского государственного университета.
680035, Хабаровск, ул. Тихоокеанская, 136.
1/--страниц
Пожаловаться на содержимое документа