close

Вход

Забыли?

вход по аккаунту

?

Методы алгоритмы и средства автоматического управления процессом формирования изображений в системах распознавания текстовых меток реального времени.

код для вставкиСкачать
На правах рукописи
Черкас Павел Сергеевич
Методы, алгоритмы и средства автоматического управления
процессом формирования изображений в системах распознавания
текстовых меток реального времени
05.13.01 – Системный анализ, управление и обработка информации
(технические системы и связь)
Автореферат диссертации на соискание ученой степени
кандидата технических наук
Череповец – 2013
2
Работа выполнена в Институте менеджмента и информационных технологий
(филиале) федерального государственного бюджетного образовательного
учреждения высшего профессионального образования «Санкт-Петербургский
государственный
политехнический
университет»
(ИМИТ
«СПбГПУ»)
в г. Череповце.
Научный руководитель:
Царев Владимир Александрович, кандидат технических наук, доцент.
Официальные оппоненты:
Кузнецов Павел Константинович, доктор технически наук, профессор,
заведующий кафедрой «Электропривод и промышленная автоматика»
ФГБОУ ВПО «Самарский государственный технический университет»;
Фурсов Владимир Алексеевич, доктор технических наук, профессор, заведующий
кафедрой общей информатики ФГБОУ ВПО «Самарский государственный
аэрокосмический университет имени академика С.П. Королёва (национальный
исследовательский университет)».
Ведущая организация:
федеральное государственное бюджетное учреждение науки Институт систем
обработки изображений Российской академии наук (г. Самара).
Защита состоится 18 декабря 2013 г. в 10:00 часов на заседании диссертационного
совета Д 212.215.07, созданном на базе ФГБОУ ВПО «Самарский
государственный аэрокосмический университет имени академика С.П. Королёва
(национальный исследовательский университет)», по адресу: 443086 Россия,
г. Самара, Московское шоссе, 34.
С диссертацией можно ознакомиться в библиотеке ФГБОУ ВПО «Самарский
государственный аэрокосмический университет имени академика С.П. Королёва
(национальный исследовательский университет)».
Автореферат разослан 15 ноября 2013 г.
Ученый секретарь
диссертационного совета
доктор технических наук, профессор
Белоконов И.В.
3
Общая характеристика работы
Актуальность темы и степень ее разработанности
Системы распознавания текстовых меток реального времени представляют
собой аппаратно-программные комплексы (АПК) и предназначены для
идентификации объектов в режиме реального времени с помощью распознавания
образов их текстовых меток на изображениях. Классическим примером систем
распознавания текстовых меток являются системы распознавания автономеров.
В аппаратное обеспечение систем распознавания входят компьютер и
видеооборудование: видеокамеры, объективы, средства освещения, средства
захвата видео и т. д. Основные функции программного обеспечения заключаются
в получении видеоизображений от видеооборудования и в выявлении и
распознавании графических образов текстовых меток на них.
Эффективность систем распознавания текстовых меток зависит от многих
факторов, в том числе и от работы алгоритмов распознавания, которые
предъявляют определенные требования к изображениям с образами текстовых
меток. Из-за этого максимальная эффективность алгоритмов распознавания
достигается только при обработке качественных изображений с образами
текстовых меток, удовлетворяющих требованиям.
Качество изображений с образами текстовых меток зависит от следующих
основных факторов: условия использования системы, характеристики текстовой
метки, качество видеооборудования и корректность его установки и настройки.
Многие системы распознавания текстовых меток применяются в сложных
нестационарных условиях эксплуатации. Например, когда освещенность зоны
контроля переменчива и непредсказуема, когда могут проявляться погодные
явления, а текстовые метки обладают различными характеристиками и могут
быть загрязнены. При этом используется видеооборудование общего назначения,
которое в подобных условиях не способны формировать качественные
изображения текстовых меток. Это связано с тем, что механизмы адаптации к
условиям использования в таком оборудовании (например, автоматическая
регулировка усиления и диафрагмы, автоматический электронный затвор и др.)
рассчитаны на достижение высокого качества всего изображения, а не его
областей, содержащих образы текстовых меток, и не учитывают особенности
функционирования конкретной системы и применяемых в ней алгоритмов
распознавания. Из-за этого типовое видеооборудование в сложных
нестационарных условиях эксплуатации зачастую формируют низкокачественные
изображения, при анализе которых алгоритмы не способны правильно распознать
текстовую метку, что приводит к значительному снижению эффективности всей
системы. Указанные проблемы отмечены в публикациях М.В. Руцкова,
Ю. Бухтиярова, А. Гонта и др.
Для повышения эффективности систем распознавания текстовых меток в
подобных условиях необходимо, чтобы на вход алгоритмов распознавания
поступали изображения с качественными образами текстовых меток. В
определенных случаях можно применять программные алгоритмы для улучшения
качества изображений. Но в рассматриваемых системах изображения текстовых
4
меток могут быть настолько низкого качества, что подобные алгоритмы будут не
способны улучшить его. Для обеспечения необходимого качества изображений
текстовых меток целесообразно управлять процессом формирования изображений
в соответствии с особенностями функционирования конкретной системы и
используемых в ней алгоритмов распознавания текстовых меток.
Одним из таких способов является ручная подстройка параметров
видеооборудования (выдержки, усиления и др.). Но во многих случаях она не
выполняется. Это отмечено во многих научных статьях и профессиональных
журналах, посвященным системам видеонаблюдения и технического зрения.
В этой связи для повышения эффективности систем распознавания
текстовых меток в нестационарных условиях целесообразно производить
автоматическое управление параметрами видеооборудования. При этом системы
распознавания текстовых меток рассматриваются как системы автоматического
управления, в которых качество изображения текстовой метки является сигналом
обратной связи и учитывается в процессе управления параметрами
видеооборудования. Цель управления заключается в максимизации качества
изображений, содержащих образы текстовых меток. Однако при разработке
описанных
выше
систем
автоматического
управления
параметрами
видеооборудования возникают определенные научные и технические проблемы.
Большинство систем распознавания текстовых меток описываются только
на уровне алгоритмов анализа изображений. Это прослеживается в работах
Воскресенского Е.М., Фаворской М.Н. и др. Но для автоматического управления
параметрами оборудования системы управления должны включать в себя
критерии и алгоритмы оценки качества изображений с образами текстовых меток
и алгоритмы автоматического управления параметрами видеооборудования.
Критериям и алгоритмам оценки качества изображений в общем виде
посвящены работы К.С. Икрамова, И. Кривошеева и др. Но данные методы не
учитывают особенности оценки качества изображений с точки зрения процессов
распознавания текстовых меток и управления параметрами видеооборудования.
Проблемы возникают и при разработке алгоритма автоматического
управления, т. к. на данный момент мало изучены вопросы автоматического
управления параметрами видеооборудования в системах распознавания текстовых
меток именно с точки зрения процесса распознавания. А само видеооборудование
должно позволять управлять своими параметрами с учетом особенностей
функционирования системы и используемых в ней алгоритмов распознавания.
Цель диссертационной работы
Целью диссертационной работы является повышение эффективности
систем распознавания текстовых меток реального времени при применении в
нестационарных внешних условиях эксплуатации за счет автоматического
управления процессом формирования изображений.
Основные задачи
Для достижения указанной цели необходимо решить следующие задачи:
1) Разработать критерии и алгоритмы оценки качества изображений,
содержащих образы текстовых меток.
5
2) Разработать структуру системы автоматического управления параметрами
видеооборудования в системах распознавания текстовых меток реального
времени.
3) Разработать
алгоритмы
автоматического
управления
параметрами
видеооборудования.
4) Апробировать предложенные решения в системе автоматического
распознавания автомобильных номеров.
Научной новизной обладают:
1) Критерии и алгоритмы оценки качества изображений, содержащих образы
текстовых меток. Данные критерии и алгоритмы позволяют оценивать
качество именно образов текстовых меток на изображениях.
2) Структура
системы
автоматического
управления
параметрами
видеооборудования в системах распознавания текстовых меток реального
времени. Данная структура позволяет выполнять автоматическое управление
параметрами видеооборудования для формирования изображений текстовых
меток необходимого качества.
3) Алгоритмы автоматического адаптивного
управления параметрами
видеооборудования. Применение данных алгоритмов при использовании
системы распознавания текстовых меток реального времени в нестационарных
внешних условиях эксплуатации позволяет формировать высококачественные
изображения текстовых меток и за счет этого повысить эффективность
алгоритмов распознавания текстовых меток и всей системы.
Практическая ценность
1) Описана методика разработки систем автоматического управления
параметрами видеооборудования. Данная методика может быть использована
при разработке новых систем и при модификации существующих.
2) Разработаны алгоритмы оценки качества изображений с образами нескольких
текстовых меток.
3) Описаны ограничения процесса управления параметрами видеооборудования.
4) Представлены критерии оценки эффективности систем управления
параметрами видеооборудования.
5) Разработана система автоматического управления выдержкой и усилением
камеры в системе распознавания автономеров АПК «УМКА-АвтоМаршал»
Предмет исследования – методы, алгоритмы и средства автоматического
управления процессом формирования изображений в системах распознавания
текстовых меток реального времени при их применении в нестационарных
внешних условиях эксплуатации.
Методология и методы исследования
В данной работе рассматриваются системы автоматического управления
параметрами видеооборудования в системах распознавания текстовых меток, в
которых видеооборудование является объектом управления, качество
изображений является сигналом обратной связи, а цель управления заключается в
максимизации качества формируемых изображений с образами текстовых меток.
Для решения поставленных задач в диссертационной работе использованы
методы обработки и анализа изображений, теории автоматического управления,
6
математической статистики, теории оптимизации, математический аппарат
теории распознавания изображений и законы оптики.
На защиту выносятся:
1) Критерии и алгоритмы оценки качества изображений, содержащих образы
текстовых меток.
2) Структура
систем
автоматического
управления
параметрами
видеооборудования в системах распознавания текстовых меток реального
времени.
3) Алгоритмы адаптивного
автоматического
управления параметрами
видеооборудования.
Достоверность результатов
Данные, полученные при исследованиях и испытаниях, подтверждают
корректность предложенных в данной работе решений. Алгоритмы оценки
качества
изображений
и
автоматического
управления
параметрами
видеооборудования основываются на известных положениях фундаментальных
наук. Результаты исследований использовались при разработке АПК «УМКААвтоМаршал», который показал высокую эффективность в задачах распознавания
автономеров при применении в нестационарных условиях эксплуатации.
Апробация
Основные положения диссертации были представлены на десятой
международной научной конференции «Распознавание образов и анализ
изображений: новые информационные технологии» (Санкт-Петербург, 2010),
Межвузовском конкурсе-конференции «Технологии Microsoft в теории и
практике программирования» (Санкт-Петербург, 2012), четвертом ежегодном
смотре-сессии аспирантов и молодых ученых Вологодской области по отраслям
наук (Вологда, 2010 г.), а также на научных семинарах кафедры «Программного
обеспечения вычислительной техники и автоматизированных систем» Института
менеджмента и информационных технологий ФГБОУ ВПО «СанктПетербургский государственный политехнический университет». В 2010 году в
г. Вологда автором получена премия в рамках конкурса «Инновационные проекты
молодых изобретателей и рационализаторов» за разработку АПК «УМКААвтоМаршал».
Публикации
По результатам диссертации было опубликовано 7 работ, в том числе 4 в
изданиях, рекомендованных ВАК.
Структура диссертации
Диссертация состоит из введения, 4 глав, заключения, списка сокращений и
условных обозначений, списка литературы, списка иллюстративного материала и
приложений. Объем основной части составляет 167 страницы. Работа содержит 46
рисунков, 7 таблиц, список литературы из 76 наименований, 5 приложений на 21
страницах.
Содержание работы
Во введении обоснована актуальность работы, сформулирована цель и
поставлены задачи проводимых исследований, описана научная новизна и
7
практическая значимость результатов, приведены сведения о публикациях и
апробации полученных результатов.
В первой главе представлена общая характеристика систем распознавания
текстовых меток реального времени и проблемы, возникающие при их
использовании в нестационарных условиях. Дано общее описание управления
параметрами видеооборудования.
Системы распознавания текстовых меток являются АПК и предназначены
для идентификации объектов с помощью распознавания образов их текстовых
меток. Эффективность данных систем зависит от работы алгоритмов
распознавания, которые предъявляют определенные требования к качеству
изображений. Видеооборудование общего назначения в нестационарных условиях
формируют изображения низкого качества, из-за чего эффективность алгоритмов
снижается. Для повышения эффективности алгоритмов распознавания и всей
системы при использовании в нестационарных условиях необходимо производить
автоматическое управление процессом формирования изображений.
Анализ источников литературы показал, что многие вопросы разработки и
применения алгоритмов распознавания текстовых меток и алгоритмы оценки
качества изображений в общем виде проработаны на высоком уровне. Но
отсутствуют структуры систем управления параметрами видеооборудования в
системах распознавания текстовых меток, содержащие критерии и алгоритмы
оценки качества изображений с образами текстовых меток и алгоритмы
автоматического управления параметрами видеооборудования.
Во второй главе представлены критерии и алгоритмы оценки качества
изображений с образами текстовых меток и описана структура систем
автоматического управления параметрами видеооборудования.
Все изображения разделяются на два класса: информативные и
неинформативные. Информативными являются те изображения, при анализе
которых можно извлечь информацию о текстовой метке или об условиях
использования, необходимую для управления параметрами видеооборудования.
Качество определяется только для информативных изображений. Для этого
вычисляются характеристики областей изображения с образами текстовых меток:
ri (I) ∈ Ai , где ri – функция, рассчитывающая i-ую характеристику, Ai – область
значений функции ri. Набор значений всех характеристик изображения
описывается вектором R(I) = (r1(I) , … , rn(I)).
При определении качества информативных изображений важно учитывать,
что эффективность большинства алгоритмов распознавания текстовых меток
зависит от того, насколько символы образа текстовой метки отличаются от ее
фона. Поэтому в областях изображения с образами текстовых меток
рассчитывается средняя яркость светлых BRwhite(I) и темных BRblack(I) пикселей
образа текстовой метки: R(I)=(BRwhite(I), BRblack(I)). Данные характеристики
позволяют оценивать яркость пикселей символов и фона образа текстовой метки
и могут быть использованы для оценки качества изображений в широком круге
задач распознавания текстовых меток.
С учетом того, что области изображения кроме образов текстовых меток
могут содержать посторонние объекты, а сами образы текстовых меток могут
8
быть наклонены, то при вычислении R(I) используются алгоритмы, которые
вычисляют характеристики именно образа текстовой метки, а не всей области l.
Для этого область l пересекается горизонтальными линиями с некоторым шагом.
Вдоль данных линий определяются контрастные пиксели, у которых разница
яркости с предыдущим пикселем больше определенного порога. В окрестностях
данных пикселей вычисляется локальный порог бинаризации Th как среднее
между минимальной и максимальной яркостью. С помощью Th рассчитываются
средняя яркость темных (при яркости пикселей < Th) и светлых (при яркости
пикселей ≥ Th) пикселей в окрестностях точки. Данные значения для всех
контрастных точек в области l упорядочиваются, и медианные значения
используются как BRwhite(I) и BRblack(I). Подразумевается, что наибольшее
количество контрастных пикселей будет принадлежать образу текстовой метки,
поэтому данный алгоритм рассчитывает характеристики образа текстовой метки.
Для вычисления BRwhite(I) и BRblack(I) используются результаты работы
алгоритмов распознавания. Если в локализованной области l распознана большая
часть символов текстовой метки, то R(I) вычисляется в сегментах s с образами
распознанных символов. Если в локализованной области l распознано мало
символов текстовой метки, то R(I) вычисляется во всей области l.
Кроме этого BRwhite(I) и
BRblack(I) рассчитываются для областей
изображения, которые в определенных случаях могут содержать образ текстовой
низкого качества. Например, с помощью бинаризации с высоким порогом,
выделения связных компонент и их фильтрации по размерам можно
обнаруживать белые прямоугольные области изображения, которые могут
соответствовать образу пересвеченной текстовой метки. При этом BRwhite(I) и
BRblack(I) вычисляются как средняя яркость данных прямоугольников. BRwhite(I) и
BRblack(I) определяются и в тех случаях, когда все изображение является
низкокачественным. Например, когда больше 80 % изображения пересвечено, то
и образ текстовой метки будет пересвечен и BRwhite(I)=BRblack(I) =255. В остальных
случаях изображения являются неинформативными и R(I) не рассчитывается.
Далее определяются оптимальные значения R0 характеристик R(I), при
которых алгоритмы распознавания текстовых меток проявляют максимальную
эффективность: R0={(r 01,1 , … , r 01,n ), … , (r 0m,1 , … , r 0m,n )}, где r 0i , j ⊂ Aj –
оптимальное значение j-ой характеристики в векторе R0i. При формировании R0
могут учитываться и субъективные требования, предъявляемые оператором.
Для определения R0 все пространство характеристик R(I) делится на
области определенного размера. Для каждой i-ой области формируется выборка
изображений с образами текстовых меток, чьи характеристики R(I) лежат в
данной области. Для каждой i-ой области вычисляется вероятность правильного
распознавания Pi как доля изображений, на которых текстовая метка правильно
распознана, из всех изображений в области. Если Pi ≥ ε , то центр области Сi ∈ R0.
Значения R0 определяются при разработке системы по полученной в результате
проведенных исследований зависимости эффективности алгоритмов от R(I).
Качество Q изображения I определяется как степень соответствия его
характеристик оптимальным значениям и вычисляется с помощью кратчайшего
нормированного евклидова расстояния от вектора R(I) до R0:
9
1,
R(I ) ∈ R0

 D ( R ( I ), R 0)
,
(1)
Q ( R ( I ), R 0) = 
1 − min
, R(I ) ∉ R0

D max
где D(R1, R2) – евклидово расстояние, Q(I) ∈ [0, 1],
Dmax – максимальное расстояние (для BRwhite и BRblack: Dmax = D((0,0), (255,255))),
Dmin(R(I),R0) = min(D(R(I), R01), … , D(R(I), R0n)).
Если на изображении присутствуют образы нескольких текстовых меток, то
для каждой области l с образом текстовой метки вычисляется вектор R(Il); далее
выполняется кластеризация данных векторов; центр наибольшего кластера (по
количеству векторов) используется как вектор обобщенных значений
характеристик R(I) в алгоритме оценки качества (1).
Далее разрабатывается структура рассматриваемых систем автоматического
управления параметрами видеооборудования. При этом выбираются управляемые
параметры видеооборудования (выдержка, усиление и др.). В момент времени t
набор значений управляемых параметров описывается следующим образом:
HPRt = (hprt,1 , … , hprt,k), где hprt,i ∈Ahi – значение i-ого параметра в момент
времени t, Ahi – область всех возможных значений i-ого параметра. Также
описываются результаты выполнения основных этапов распознавания образов
текстовых меток на изображениях в виде набора координат областей с образами
текстовых меток, распознанных в них текстовых меток и координат образов
каждого распознанного символа текстовой метки.
Из-за того, что условия эксплуатации рассматриваемых систем управления
являются нестационарными, то зависимость характеристик R(I) от значений
управляемых параметров видеооборудования HPR (данная зависимость является
законом управления) является априорно неизвестной и нестационарной (чаще
всего она и нелинейная). Поэтому используется модуль управления (МУ),
который является адаптивным автоматическим регулятором и состоит из
подсистемы управления и подсистемы адаптации. Структура системы
автоматического управления (САУ) параметрами видеооборудования с
адаптивным модулем управления представлена на рисунке 1. Жирным отмечены
те элементы, которые были добавлены в типовую систему распознавания
текстовых меток реального времени, чтобы в ней происходило автоматическое
управления процессом формирования изображений.
Рисунок 1 – САУ с адаптивным модулем управления
10
В адаптивном МУ подсистема управления вырабатывает новые значения
HPR't регулируемых параметров в соответствии с их текущими значениями HPRt
и качеством текущего изображения Q(It) с помощью закона управления U:
HPR 't = U ( Q ( I t ), HPR t ) .
(2)
Закон управления подстраивается под изменение условий использования в
подсистеме адаптации. При этом оборудование является объектом управления,
качество изображений используется как сигнал обратной связи. Цель управления
заключается в максимизации качества изображений, содержащих образы ТМ.
В третьей главе описаны алгоритмы автоматического управления
параметрами видеооборудования и методика разработки рассматриваемых систем
автоматического управления параметрами видеооборудования.
При разработке систем управления учитывается, что алгоритмы
распознавания должны предоставлять информацию для модуля управления.
Далее выбирается основное (видеокамеры и объективы) и дополнительное
(средства освещения, фильтры) видеооборудования с учетом условий
использования, характеристик текстовых меток и требований к сюжету
изображения. Данное оборудование должны обладать необходимым качеством и
допускать управление своими параметрами программно. Из всех программно
управляемых параметров должны быть выбраны регулируемые параметры HPR,
которые оказывают наибольшее влияние на R(I) и на Q(I).
Далее экспериментально определяется базовая модель зависимости R(I) от
HPR: Mbase = {(R1 , HPR1) , … , (Rn , HPRn)}. При этом все пространство HPR
разбивается на области. Для каждой области вычисляется ее центр HPRi. Далее в
реальных условиях проводится эксперимент, в котором используется
видеооборудование и текстовая метка. При этом перебираются все центры HPRi ,
и с данными значениями формируются изображения текстовых меток. На
полученных изображениях вычисляется вектор Ri усредненных значений
характеристик R(I) для каждой области с центром в HPRi . В Mbase записываются
пары таких значений (Ri , HPRi). Модель зависимости Mbase используется как
начальная при инициализации системы и обновляется при ее функционировании.
Далее разрабатываются адаптивные алгоритмы автоматического управления
параметрами видеооборудования. Т.к. R(I) и Q(I) вычисляются только для
информативных изображений, то разрабатываются отдельные алгоритмы
управления
параметрами
видеооборудования
для
информативных
и
неинформативных изображений (для управления в ожидании появления
текстовой метки). Но данные алгоритмы должны функционировать согласованно.
При обработке информативных изображений используется беспоисковый
алгоритм прямого адаптивного управления. В нем используются вектора R0 и
модель зависимости R(I) от HPR, которая основана на Mbase, обновляется в
подсистеме адаптации и описывается следующим образом: M = {m1, … , mn}. Где
mi = (Ri , HPRi , Ti ) – элемент для области пространства HPR c центром в HPRi . Ti –
время последнего обновления элемента mi, оно позволяет использовать в
управлении наиболее актуальные данные. Также исходными для алгоритма
являются следующие данные: HPRt , R(It), Q(It) и текущее время t.
11
При управлении, если качество изображений высокое, то текущие значения
параметров видеооборудования не изменяются. В остальных случаях вычисляется
ближайший по простому евклидову расстоянию к R(It) вектор оптимальных
значений Ropt из R0. Он используется при вычислении необходимого изменения
значений характеристик: ∆R = Ropt – R(It). Далее по модели зависимости M
характеристик R от HPR определяется наиболее актуальный и ближайший к
вектору
текущего
состояния
системы
mt =(R(It), HPRt , t)
элемент
m_base=(Rm_base, HPRm_base , Tm_base). Близость вычисляется по взвешенному
нормализованному евклидову расстоянию DN:
 (r − r ) 2
(r − r ) 2  (hpr1,1 − hpr1, 2 ) 2
(hprm,1 − hprm, 2 ) 2 (T1 − T2 ) 2
DN (m1 , m2 ) = ∆ *  1,1 1, 22 + ... + n,1 n, 22  +
...
.
+
+
+
2
2
2
 r max

r
max
hpr
max
hpr
max
T
max
1
n
1
m


Наибольший вес должны оказывать именно характеристики изображения R(I).
Далее за основу берется элемент m_base, и рассматриваются все возможные
изменения значений параметров оборудования от HPRm_base до центров всех
областей HPRi в M. Также вычисляются предполагаемые изменения
характеристик изображений: ∆Ri = Ri – Rm_base. После чего выбирается элемент
m_opt из M, для которого ∆Rm_base ближе остальных соответствует ∆R по
евклидову расстоянию (рисунок 2). Данный элемент используется для вычисления
вектора ∆HPR изменения текущих параметров: ∆HPR = HPRm_opt – HPRm_base . При
управлении для вычисления новых значений параметров оборудования их
текущие значения изменяются вдоль вектора ∆HPR с учетом скорости управления
SHPR: HPR't = HPRt + SHPR * ∆HPR.
{
Рисунок 2 – Определения ∆HPR при обработке информативных изображений
В итоге алгоритм управления для информативных изображений имеет вид:
HPR t ,
Q(It ) = 1

HPR 't = 
(3)
HPR
+
S
*
∆
HPR
,
Q
(
I
)
<
1
t
HPR
t

Далее в подсистеме адаптации обновляется элемент mi из M, где
HPRt ∈ HPRi следующим образом: Ri = (1 – α) * Ri + α * R(It) , Ti = t. Также для mi
обновляется количество информативных изображений Cnti = Cnti +1 за время Tcnt.
При этом, кроме самого элемента mi изменяются и его ближайшие соседи
аналогичным образом, но с меньшим коэффициентом α . Это позволяет более
плавно и корректно обновлять модель зависимости R от HPR.
При обработке неинформативных изображений применяется поисковый
расходящийся алгоритм адаптивного управления. Он использует R0 и модель
зависимости М, обновляемую в подсистеме адаптации при обработке
12
информативных изображений. Также данный алгоритм принимает на вход
следующие исходные данные: T0 – время обработки последнего информативного
изображения, M q > 0.9 – количество качественных кадров за последнее время, Mlen
– порог для количества качественных кадров, t – текущее время.
На первой стадии в момент, когда на обработку поступило
неинформативное изображение, и с момента T0 не прошло много времени
(T0 < t ≤ T1), а при построении модели зависимости M участвовало достаточное
количество качественных кадров (M q > 0.9 ≥ Mlen), то по модели M вычисляется
один вектор оптимальных значений параметров оборудования:
HPR 't = max ({ HPR i | Qi = Q max }),
(4)
по Cnt i
где Qmax = max (Q1 , … , Qn).
Данное значение используется в течение времени T1, пока модель M еще
актуальна. Спустя T1 (при M q > 0.9 ≥ Mlen и T1 < t ≤ T2) без поступления новых
данных от информативных изображений модель M начинает устаревать, поэтому
по ней вычисляется множество оптимальных векторов {HPRi | Qi ≥ ε (t)}, из
которого перебираются значения HPR't . Где ε (t) – это уменьшающийся со
временем порог для качества изображений: ε (t) = Qmax * (1 – (t – T1) / (T2 – T1)).
Данная стадия управления продолжается до момента T2, когда зависимость
M полностью устареет. После этого или когда M q > 0.9 слишком мало (при t > T2
или M q > 0.9 < Mlen (например, при начальной инициализации системы)) HPR't
перебирается из всей области допустимых значений с определенным шагом.
После разработки САУ оценивается эффективности видеооборудования и
алгоритмов управлениях его параметрами. Для этого рассчитывается процент
высококачественных изображений THQ ≥ 0,95:
|I+ |
(5)
TH Q≥0,95 =
* 100% ,
| I '|
где I' = {I1, … , In} – изображения зоны контроля, когда в ней находился объект с
ТМ; I+ = {I ∈ I' | Q(I) ≥ 0,95} – высококачественные изображения.
В системах автоматического управления параметрами видеооборудования
также проверяются ограничения процесса управления. Они заключаются в том,
что за время T ', которое объект с текстовой меткой находится в зоне контроля,
модуль управления должен иметь возможность несколько раз оценить качество
изображений, выработать и применить новые значения HPR't управляемых
параметров, то есть должно выполняться неравенство:
k << T ' ,
(6)
где k – время, необходимое для анализа одного изображения, выработки и
применения новых значений управляемых параметров оборудования,
T ' – минимальное время нахождения в поле зрения камеры объекта контроля с
текстовой меткой, движущегося с максимальной скоростью.
При невыполнении ограничений (6) автоматическое управление
параметрами оборудования от кадра к кадру невозможно, т.к. за время k объект с
текстовой меткой уже покинет зону контроля. При этом выполняется более
«медленное» управление: выработка новых значений параметров оборудования
13
выполняется для некоторого интервала времени при значительном изменении R(I)
с учетом усреднения накопленных ранее данных.
Из-за того, что в рассматриваемых САУ используются эвристические
алгоритмы управления, сами системы применяются с нестационарных условиях и
закон управления также является нестационарным и нелинейным, то измерение
других (типовых) характеристик САУ не представляется возможным.
Итоговое тестирование систем автоматического управления параметрами
видеооборудования проводится в реальных условиях или с применением
моделирующих программ. Это связано с тем, что для проверки алгоритмов
управления необходимо видеооборудования.
Таким образом, системы автоматического управления, соответствующие
представленной выше структуре, необходимо разрабатывать с использованием
предложенных в данной работе решений по следующей методике:
1) Вычислить зависимость вероятности правильного распознавания текстовых
меток от R(I), определить оптимальные значения R0.
2) Выбрать видеооборудование и его управляемые параметры, вычислить
базовую зависимость R(I) от HPR.
3) Реализовать модуль управления параметрами видеооборудования.
4) Определить эффективность разработанной САУ.
В четвертой главе описан процесс разработки системы автоматического
управления параметрами видеооборудования в системе распознавания
автомобильных номеров.
Автономера описаны в ГОСТ Р 50577-93 и являются текстовыми метками.
Большинство систем распознавания автономеров используются в нестационарных
условиях с оборудованием общего назначения. От видеооборудования в
алгоритмы
распознавания
поступают
низкокачественные
изображения
автономеров из-за чего эффективность алгоритмов и всей системы значительно
снижается. При этом целесообразно выполнять автоматическое управление
параметрами оборудования с помощью предложенных в данной работе решений.
По представленной в 3 главе методике с использованием предложенных в
работе решений разработан АПК «УМКА-АвтоМаршал». Он представляет собой
сетевую «умную камеру» и предназначен для применения в системах
распознавания автономеров. Для распознавания автономеров в нем используются
алгоритмы из ядра программы «АвтоМаршал». Определение качества
информативных изображений происходит так, как это было описано во 2 главе.
Была определена зависимость вероятности P правильного распознавания
автономеров в программе «АвтоМаршал» от значений BRwhite и BRblack (рис. 3 а).
Использовалась выборка из 738 изображений с образами автономеров. По данной
зависимости были определены оптимальные значения R0 (при P ≥ 0,95) (рис. 3 б).
В аппаратное обеспечение АПК «УМКА-АвтоМаршал» входит
вычислительный модуль с процессором Intel Atom, USB видеокамера SDU 415,
совмещенная с ИК подсветкой и узкополосным ИК фильтром. Для управления
были выбраны выдержка E и усиление G камеры. Их области допустимых
значений были ограничены следующим образом:
− для E: AE ' = [Emin, Emax], где Emin = 4 мкс, Emax = 1000 мкс;
14
− для G: AG ' = [Gmin, Gmax], где Gmin = 320, Gmax = 1000.
Так как изменение E и G сходным образом влияют на характеристики BRwhite
и BRblack образа номера на изображении, то они были сгруппированы: K = E * G.
250
P
250
0.9
200
0.8
200
0.7
BRwhite
150
0.6
150
0.5
0.4
100
BRwhite
100
0.3
0.2
50
50
0.1
0
0
0
50
100
150
200
250
0
50
100
150
200
250
BRblack
BRblack
а)
б)
а – зависимость вероятности правильного распознавания автономеров P от BRwhite
и BRblack ; б – оптимальные значения R0
Рисунок 3 – Оптимальные значения R0 в АПК «УМКА-АвтоМаршал»
Для вычисления значения E и G по K используются следующие формулы:
 Emin , при K < K min

 K
E(K ) = 
, при K min ≤ K ≤ Ks ,
G
 min
 Emax , при K > K s
K min = E min * G min ,
K s = E max * G min ,
G min , при K ≤ K s

 K
G(K ) = 
, при K s < K ≤ K max ,
E
 max
Gmax , при K > K max
(7)
K max = E max * G max .
Для управления параметром K в АПК «УМКА-АвтоМаршал» используются
алгоритмы, описанные в 3 главе данной работы.
В АПК «УМКА-АвтоМаршал» оценивалась эффективность процесса
управления: на обработку одного изображения, выработку и применение нового
значения K требуется время k = 75 мс. Этого достаточно для адаптации параметра
K при движении автомобиля со скоростью 120 км/ч (параметр T '=210 мс для
типичной зоны контроля глубиной 7 метров). То есть выражение (6) выполняется.
Тестирование АПК «УМКА-АвтоМаршал» проводилось в два этапа. На
обоих этапах видео записывалось с разных видеокамер и подавалось в программу
«АвтоМаршал» для распознавания. На первом этапе оценивалась эффективность
управления параметром K. Для этого было проведено тестирование в реальных
условиях работы с включенным и с отключенным алгоритмом управления. Во
втором случае E = 750 мкс, G = 500. АПК «УМКА-АвтоМаршал» с включенным
алгоритмом управления работал намного эффективнее. Было обработано 520
автомобилей. Результаты первого этапа представлены в таблице 1. На втором
этапе в реальных условиях АПК «УМКА-АвтоМаршал» с включенным
управлением сравнивался с видеокамерами общего назначения. Обработано 1240
автомобилей. Результаты второго этапа представлены в таблице 2.
АПК «УМКА-АвтоМаршал», разработанный с применением предложенных
в работе решений, показал высокую эффективность при распознавании
автомобильных номеров и с 2010 по 2013 год применяется в ООО «Малленом» в
15
рамках проекта «Дорожный пристав» в Вологодской, Смоленской и Томской
областях, в республике Бурятия и других регионах Российской Федерации, что
подтверждено соответствующим актом. Данный АПК с 01.08.2011 также
применяется в составе АСУЛТЦ г. Сочи по заказу АНО «Транспортная дирекция
Олимпийских игр», что подтверждено соответствующим отзывом.
Таблица 1 – Оценка эффективности управления в АПК «УМКА-АвтоМаршал».
THQ ≥ 0,95
Видеокамера
Вероятность правильного
распознавания в ПО
«АвтоМаршал»
День,
День,
Ночь
облачно
ярк. солнце
День,
облачно
День,
ярк. солнце
Ночь
УМКА-АвтоМаршал
с управлением
97
95
94
93
93
89
УМКА-АвтоМаршал
без управления
65
40
79
60
44
78
Таблица 2 – Сравнение АПК «УМКА-АвтоМаршал» с другими видеокамерами.
Видеокамера
УМКА-АвтоМаршал (с управлением)
MINTRON MTV-64G5DHP
BOSCH LTC0510/50
1)
2)
3)
4)
5)
1)
2)
3)
4)
Вероятность правильного
распознавания в ПО «АвтоМаршал»
день ночь
день
ночь
96,8 88,7
92,2
88,4
86,2 8,2
89,3
13,3
71,5 73,4
84,7
82,7
THQ ≥ 0,95
В заключении сформулированы основные выводы диссертации.
В приложениях представлены:
Оценка зависимости вероятности правильного распознавания автомобильных
номеров от средней яркости светлых и темных пикселей их образов.
Технические характеристики аппаратно-программного комплекса «УМКААвтоМаршал».
Результаты эксперимента по определению эффективности аппаратнопрограммного комплекса «УМКА-АвтоМаршал».
Акты и отзывы об использовании результатов диссертационного
исследования.
Награды и дипломы, полученные по результатам диссертационного
исследования.
Заключение
Основные результаты диссертационных исследований:
Сформулированы основные проблемы применения систем распознавания
текстовых меток в нестационарных условиях эксплуатации. Проведен анализ
систем автоматического управления параметрами видеооборудования.
Разработаны критерии и алгоритмы оценки качества изображений,
содержащих образы текстовых меток.
Разработана структура систем автоматического управления параметрами
видеооборудования в системах распознавания текстовых меток.
Разработаны
алгоритмы
автоматического
адаптивного
управления
параметрами видеооборудования.
16
5) Представлена методика разработки систем автоматического управления
параметрами видеооборудования в системах распознавания текстовых меток.
6) С применением предложенных в работе решений разработан АПК «УМКААвтоМаршал», который представляет собой сетевую «умную камеру».
Список публикаций по теме
В изданиях, рекомендованных ВАК:
1) Черкас П.С. Метод автоматического адаптивного управления процессом
формирования изображений в системах распознавания текстовых меток
реального времени [Текст] / П.С. Черкас, В. А. Царев // Компьютерная оптика. –
2013. – Т. 37, № 3. – С. 376–384.
2) Черкас П.С. Автоматическое управление параметрами средств формирования
изображений в системах распознавания текстовых меток реального времени
[Текст] / Л.Л. Малыгин, В.А. Царев, П.С. Черкас // Научно-технические
ведомости СПбГПУ 4' 2012. Информатика. Телекоммуникации. Управление. –
СПб. : Изд-во Политехн. ун-та, 2012. – С. 106–109.
3) Cherkas P. S. Smart Camera Adaptive Optoelectronic System [Text] / E. N. Vesnin,
A. E. Mikhailov, V. A. Tsarev, and P. S. Cherkas // Pattern Recognition and Image
Analysis. – Pleiades Publishing, Ltd., 2012. – 2012, Vol. 22, No. 3. – P. 406–411.
4) Черкас П.С. Метод машинного обучения на основе алгоритма многомерной
интерполяции и аппроксимации случайных функций [Текст] / Ю.Н. Бахвалов,
Л.Л. Малыгин, П.С. Черкас // Вестник Череповецкого государственного
университета 2012. – 2012, № 2, Т. 2. – С. 7–9.
В иных изданиях:
5) Черкас П.С. Автоматическое управление параметрами средств формирования
изображений в системах распознавания автомобильных номеров реального
времени [Текст] / Е.Н. Веснин, П.С. Черкас // Технологии Microsoft в теории и
практике программирования : материалы межвузовского конкурсаконференции студентов, аспирантов и молодых ученых Северо-Запада. – СПб. :
Изд-во Политехн. ун-та, 2012. – С. 47– 48.
6) Cherkas P.S. Adaptive optoelectronic system “Smart camera” [Text] / P.S. Cherkas
// 10th International Conference on Pattern Recognition and Image Analysis: New
Information Technologies (PRIA-10-2010). St. Petersburg, December 5-12, 2010.
Conference Proceedings (Vol. I-II), Volume II. – SPb. : Politechnika, 2010. – P. 83–85.
7) Черкас П.С. Оптоэлектронные системы распознавания автомобильных
номеров с управляемой подсветкой [Текст] / П.С. Черкас, В.А. Царев //
Материалы IV ежегодных смотров-сессий аспирантов и молодых ученых по
отраслям наук: Технические науки. Экономические науки. – Вологда: ВоГТУ,
2010. – С. 75–79.
Подписано в печать 8 ноября 2013 г.
Формат 60 х 84/16. Бумага офсетная. Печать оперативная.
Объем – 1,0 усл. печ. л. Тираж 100 экз. Заказ №. 45
Отпечатано в типографии «Инсома-пресс»
443080, г. Самара, ул. Санфировой, 110А, оф. 22А,
тел. 222-92-40, E-mail: insoma@bk.ru
1/--страниц
Пожаловаться на содержимое документа