close

Вход

Забыли?

вход по аккаунту

?

Модели представления объектов в пространстве цветовых компонент при анализе изображений..pdf

код для вставкиСкачать
Управление, вычислительная техника и информационные технологии
Kushnir Olesya Alexandrovna, master, kushnir-olesya@rambler.ru, Russia, Tula,
Tula State University,
Seredin Oleg Sergeevich, candidate of physico-mathematical sciences, docent,
oseredin@yandex.ru, Russia, Tula, Tula State University.
УДК 004.93
МОДЕЛИ ПРЕДСТАВЛЕНИЯ ОБЪЕКТОВ В ПРОСТРАНСТВЕ
ЦВЕТОВЫХ КОМПОНЕНТ ПРИ АНАЛИЗЕ ИЗОБРАЖЕНИЙ
А.О. Ларин, О.С. Середин
В ходе решения задач обработки изображений возникает необходимость
использования пиксельных классификаторов в пространстве цветовых компонент.
Анализируются и сравниваются три одноклассовых классификаторов применительно
к задаче параметризации точек в трехмерном пространстве. Исследованы
классификаторы, построенные на модели Тэкса, модели смеси нормальных
распределений и аппроксимации исходных данных эллиптическими цилиндрами,
упорядоченными относительно главных компонент выборки. Сравнение алгоритмов
проводилось по трем основным критериям: качество классификации, время
параметризации исходного набора данных и время классификации новых объектов.
Ключевые слова: одноклассовая классификация, пиксельные классификаторы,
метод описания данных опорными векторами, детектирование огня, поиск пламени.
В системах технического зрения при решении задач сегментации и
детектирования объектов одним из этапов работы алгоритмов является
описание набора точек, представляющих объекты интереса на изображении в параметрической форме. Так, например, при цветовом анализе изображений любой пиксель можно представить в виде трехмерного вектора,
каждая координата которого совпадает со значением соответствующей
компоненты RGB этого пикселя. Задачей параметризации, или Color data
modeling [4], принято называть построение на основании выделенного экспертом набора точек в цветовом пространстве такого математического
правила (модели), которое позволяет с заданной точностью параметрически описывать области интереса в пространстве признаков. Примером подобной задачи является параметризация пикселей огня, необходимая для
выделения областей изображения, потенциально содержащих пламя.
207
Известия ТулГУ. Технические науки. 2013. Вып. 2
Специфика проблемы заключается в том, что обучающая выборка
содержит только объекты одного класса. Поэтому для ее решения предлагается использовать специфическую постановку задачи обучения распознаванию образов: построение одноклассового классификатора.
В этой работе было проведено экспериментальное исследование и
сравнение трех одноклассовых классификаторов применительно к задаче
параметризации точек в трехмерном пространстве. В частности, рассмотрены классификаторы, построенные на модели Тэкса [6], модели смеси
нормальных распределений [2] и аппроксимации исходных данных эллиптическими цилиндрами, упорядоченными вдоль оси главных компонент
выборки [10]. Сравнение алгоритмов проводилось по трем основным критериям: качество классификации, время обучения модели и время классификации новых объектов.
Модели представления объектов в цветовом пространстве RGB
Широко используемым подходом к решению задачи параметризации является метод аппроксимации исходных данных смесью нормальных
распределений (англ. General mixture model, GMM) [5]. В [7] показано
применение этого метода для решения упомянутой ранее прикладной задачи поиска пламени на изображениях. В литературе описаны различные
методики подбора параметров для смеси нормальных распределений,
наилучшим образом описывающей исходный набор данных, но наиболее
часто
используется
метод,
основанный
на
EM-алгоритме
(англ. Expectation-maximization, EM) [2]. Регулируемыми параметрами алгоритма являются число нормальных распределений в смеси и пороговое
значение дисперсии для принятия решения.
Альтернативой ему служит один из методов одноклассовой классификации, метод описания данных опорными векторами (Support Vector
Data Description, SVDD), предложенный Д. Тэксом в 2001 году [6]. Модель
описания данных в такой постановке – гиперсфера с минимальным радиусом, представляющая ближайшую внешнюю оболочку вокруг данных.
Особенность метода заключается в том, что для описания данных более
«гибкой формой», чем сфера, можно использовать идею перехода в спрямляющее пространство. Экспериментальное исследование показало эффективность использования для этого радиальной базисной функции Гаусса [11]. Настраиваемым параметром для этого алгоритма является коэффициент РБФ Гаусса.
208
Управление, вычислительная техника и информационные технологии
Авторами был также разработан алгоритм, основанный на аппроксимации обучающей совокупности в пространстве цветовых компонент
набором эллиптических цилиндров [10]. Суть метода заключается в
нахождении главных компонент (англ. Principal component analysis, PCA)
обучающей выборки с целью уменьшения корреляции цветовых компонент [1, 8]. Цвет при компьютерной обработке обычно представлен конечным множеством значений, поэтому становится возможным разделить
пространство на двумерные слои, ортогональные направлению главной
компоненты. В каждом таком слое строится эллипс рассеяния на основе
PCA. Таким образом, упорядоченная вдоль главной компоненты совокупность таких эллипсов описывает обучающую выборку. Параметрами этого
алгоритма являются количество двумерных слоев и пороговое значение
дисперсии двумерного эллипса. В экспериментах будет варьироваться
только второй параметр, первый же будет иметь максимальное допустимое
значение.
Методика проведения экспериментальных исследований
Для проведения экспериментальных исследований была использована модель генеральной совокупности объектов, сформированная точками, располагающимися внутри сфер, радиусы которых меняются по синусоидальному закону, а центры расположены вдоль спиральной кривой в
трехмерном пространстве (рис. 1). Несмотря на то, что полученное «облако» точек не описывает какую-то область реального изображения, в прикладных задачах похожую конфигурацию образует в пространстве RGB
множество точек, принадлежащих пламени.
Параметры генератора данных были подобраны таким образом, что
в генеральную совокупность вошло порядка 100 тыс. объектов (весь куб
RGB содержит 2563 ≈ 16.8 млн объектов). При этом часть генеральной совокупности, выбранная случайным образом, выступала в экспериментах в
качестве обучающего множества (рис. 2), а оставшаяся часть куба RGB –
как объекты контроля качества распознавания.
209
Известия ТулГУ. Технические науки. 2013. Вып. 2
Рис. 1. Визуализация совокупности точек, формирующих генеральную
совокупность для проведения экспериментов, в пространстве RGB
а
б
Рис. 2. Визуализация совокупности точек, которые формируют
обучающую выборку для проведения экспериментов, в пространстве
RGB: а - 1 % генеральной совокупности (1000 объектов),
б - 0,1 % генеральной совокупности (100 объектов)
Для того, чтобы избежать неточностей при измерении характеристик методов, в качестве реализаций всех трех алгоритмов использовался
только исходный код на языке C++, собранный в один тестовый проект.
Для исследования модели GMM был взят исходный код с сайта [9]. Эксперименты с методом SVDD проводились с использованием библиотеки,
специально оптимизированной для работы с пространством объектов
RGB [11]. Метод аппроксимации данных эллиптическими цилиндрами (PCA) был самостоятельно реализован специально для данного исследования.
210
Управление, вычислительная техника и информационные технологии
Сравнение алгоритмов проводилось по трем основным критериям:
качество классификации, время обучения модели и время классификации
новых объектов.
Для оценки качества работы алгоритмов при различных параметрах
использовались измерения доли ошибок первого и второго рода, представленные в виде ROC-кривых [3]. При этом для объектов контроля использовались все объекты генеральной совокупности, а также все оставшееся
множество объектов пространства RGB.
Суть измерения скорости параметризации классификатором заключалась в его многократном обучении на одном и том же наборе данных,
чтобы уменьшить погрешность измерений, после чего вычислялось среднее время параметризации. Параметры обучения при этом варьировались,
так как время обучения классификатора может зависеть от его параметров.
Время классификация нового объекта RGB рассчитывалось как
среднее время классификации всех объектов куба RGB: принадлежащих и
не принадлежащих целевому классу.
Результаты экспериментов
На рис. 3, 4, 5 представлены результаты аппроксимации рассматриваемыми методами исходного набора данных, представленного на рис. 2, а.
а
б
Рис. 3. Результаты построения разделяющей границы
с использованием модели GMM для количества распределений
3 (а) и 5 (б)
211
Известия ТулГУ. Технические науки. 2013. Вып. 2
а
б
Рис. 4. Результаты построения разделяющей границы
с использованием классификатора SVDD для параметров
потенциальной функции Гаусса 50 (а) и 100 (б)
а
б
Рис. 5. Результаты построения разделяющей границы
с использованием классификатора, основанной на PCA, для значений
пороговых дисперсий 0,5 (а), 1,5 (б)
На рис. 6, 7 приводятся численные оценки скорости работы алгоритмов, представленные в виде графиков, которые показывают зависимость времени выполнения соответствующей операции от размера обучающей совокупности. Параметры методов в этих оценках были подобраны
таким образом, чтобы ошибка классификации была минимальной (рис. 8).
212
Управление, вычислительная техника и информационные технологии
Рис. 6. График, показывающий зависимость времени обучения модели
(мс) от размера обучающего множества (доли генеральной
совокупности)
Рис. 7. График, показывающий зависимость времени классификации
нового объекта (мс) от размера обучающего множества
(доли генеральной совокупности)
Оценка качества работы алгоритмов для обучающей выборки, содержащей 1 % генеральной совокупности (см. рис. 2, а), представлена в
виде эмпирических ROC-кривых (рис. 8).
Для обучающего набора данных, содержащего 0.1 % (см. рис. 2, б)
генеральной совокупности, ROC-кривая представлена на рис. 9.
213
Известия ТулГУ. Технические науки. 2013. Вып. 2
Рис. 8. ROC-кривая, характеризующая качество классификации
алгоритмов в случае обучающей выборки, составляющей 1 %
генеральной совокупности
Рис. 9. ROC-кривая, характеризующая качество классификации
алгоритмов в случае обучающей выборки, составляющей
0.1 % генеральной совокупности
Можно заметить, что ошибка классификации на малом количестве
кластеров модели GMM незначительно превосходит ошибку метода
SVDD. Качество классификации для модели GMM можно было бы повысить посредством увеличения количества используемых в смеси нормальных распределений. Однако при малом размере обучающей выборки, как
во втором случае (около 100 объектов), модель будет подвержена переобучению. Подобный этому эффект можно наблюдать и для метода PCA,
ошибка классификации которого резко возросла при уменьшении обучающей выборки в 10 раз. Поэтому можно сделать вывод о том, что метод
SVDD является наиболее устойчивым к проблеме недостаточного объема
обучающего материала.
214
Управление, вычислительная техника и информационные технологии
Выводы
Методы GMM и PCA являются очень чувствительными к размеру
обучающей выборки в отличие от метода SVDD, использующего РБФ
Гаусса. Вследствие этого данный метод оказался наиболее сбалансированным с точки зрения скорости и качества для решения задачи пиксельной
классификации. Также среди преимуществ метода SVDD можно отметить
наличие всего одного настроечного параметра. Это, несомненно, существенно упрощает предварительную настройку классификатора с наилучшими показателями качества. Дальнейшее направление исследований связано с применением описанных классификаторов для практических задач
сегментации изображений.
Работа выполнена при поддержке грантов РФФИ 10-07-00489-а, 1207-92000-ННС_а.
Список литературы
1. Abdel-Mottaleb M., Jain A. Face detection in color images // IEEE
Transactions on Pattern Analysis and Machine Intelligence, 2002. Vol. 24,
No. 5. P. 696 – 706.
2. Bilmes J. A Gentle Tutorial of the EM Algorithm and its Application
to Parameter Estimation for Gaussian Mixture and Hidden Markov Models //
Technical Report TR-97-021. International Computer Science Institute and
Computer Science Division, University of California at Berkeley, April, 1998.
3. Fawcett T. ROC Graphs: Notes and Practical Considerations for Researchers // Proc. of the 19th international joint conference on Artificial intelligence. 2005. P. 702 – 707.
4. Rother C., Kolmogorov V., Blake A. GrabCut – Interactive foreground extraction using iterated graph cuts // ACM Transactions on Graphics
(TOG). ACM. 2004. Vol. 23, No. 3. P. 309 – 314.
5. Ruzon M., Tomasi C. Alpha estimation in natural images // In proc.
CVPR. 2000. Vol. 1, No. June. P. 18 – 25.
6. Tax D. One-class classification; Concept-learning in the absence of
counterexamples // Ph.D thesis. Delft University of Technology, ASCI Dissertation Series. 2001. 146 p.
7. Tőreyin B. Fire detection algorithms using multimodal signal and image analysis // Ph.D thesis. 2009. 138 p.
215
Известия ТулГУ. Технические науки. 2013. Вып. 2
8. Tsaig Y. Automatic Segmentation of Moving Objects in Video Sequences // Trans. on Circuits and Systems for Video Technology. 2002.
Vol. 12. P. 597 – 612.
9. http://sourceforge.net/projects/gmm-gmr/ – Gaussian Mixture Model
and Regression, 2008.
10. Ерохин М. А., Копылов А. В., Ларин А. О. Параметрическое
представление объектов в цветовом пространстве на основе метода главных компонент // Интеллектуализация обработки информации ИОИ-2012.
М., 2012. С. 460 – 463.
11. Ларин А. О., Середин О. С. Параметризации цветового представления изображения пламени с использованием одноклассового классификатора // Математические методы распознавания образов ММРО15. М., 2011. С. 362 – 366.
Ларин Александр Олегович, аспирант, ekzebox@gmail.com, Россия, Москва,
Московский физико-технический институт,
Середин Олег Сергеевич, канд.физ.-мат. наук, доц., oseredin@yandex.ru,
Россия, Тула, Тульский государственный университет
RESEARCH OF COLOR DATA MODELS FOR OBJECTS REPRESENTATION
IN RGB-SPACE IMAGE ANALYSIS
A.O. Larin, O.S Seredin
The solution of many image processing tasks requires the use of pixels classifiers in
a color space. This work covers analysis and comparison of three one-class classifiers in a
problem of points parameterization in 3D space. The classifiers are based on Tax's model,
Guassian mixture model and model of elliptic cylinders approximation (the cylinders are ordered by primary components of learning samples). Algorithms have been compared by three
criteria, namely: quality of classification, time of parameterization of the given data set and
time of classification of new objects.
Key words: one-class classification, pixel classifiers, fire detection, flame detection,
Support Vector Data Description.
Larin Alexander Olegovich, postgraduate, ekzebox@gmail.com, Russia, Moscow,
Moscow Institute of Physics and Technology,
Seredin Oleg Sergeevich, candidate of physical and mathematical sciences, docent,
oseredin@yandex.ru, Russia, Tula, Tula State University
216
Документ
Категория
Без категории
Просмотров
7
Размер файла
415 Кб
Теги
анализа, компонентов, пространство, объектов, цветовых, pdf, изображение, представление, модель
1/--страниц
Пожаловаться на содержимое документа