close

Вход

Забыли?

вход по аккаунту

?

pdf111

код для вставкиСкачать
Министерство образования и науки Российской Федерации
Государственное образовательное учреждение
высшего профессионального образования
Санкт-Петербургский государственный университет
аэрокосмического приборостроения
Н. Н. Красильников, О. И. Красильникова
Компьютерная обработка изображений.
Морфологические операции
и их применение
Допущено Учебно-методическим объединением вузов
по университетскому политехническому образованию
в качестве учебного пособия для студентов высших учебных заведений,
обучающихся по направлению подготовки
230200 – «Информационные системы»
Санкт-Петербург
2010
УДК 004.9
ББК 32.811.3
К78
Рецензенты:
доктор технических наук, профессор Е. А. Крук;
доктор технических наук, профессор А. П. Шепета
Утверждено
редакционно-издательским советом университета
в качестве учебного пособия
Красильников Н. Н., Красильникова О. И.
К78 Компьютерная обработка изображений. Морфологические
операции и их применение: учеб. пособие / Н. Н. Красильников, О. И. Красильникова. – СПб.: ГУАП, 2010. – 44 с.
ISBN 978-5-8088-0538-5
Изложены вопросы, связанные с повышением качества бинарных и полутоновых изображений посредством нелинейной цифровой обработки изображений, базирующейся на использовании морфологических операций.
Предназначено для студентов старших курсов, изучающих
компьютерную обработку изображений в рамках технических специальностей.
УДК 004.9
ББК 32.811.3
ISBN 978-5-8088-0538-5
© Санкт-Петербургский государственный
университет аэрокосмического
приборостроения (ГУАП), 2010
© Н. Н. Красильников,
О. И. Красильникова, 2010
ПРЕДИСЛОВИЕ
Одной из важных задач компьютерной обработки изображений
является повышение их качества. Это актуально как для случаев,
когда изображения предназначены для восприятия зрительной
системой человека, так и для случаев, когда они предназначены
для анализа в системах машинного зрения. Одним из достаточно
эффективных методов, используемых с этой целью, является применение морфологической обработки изображений, базирующейся
на использовании тех или иных морфологических операций.
Морфологические операции представляют собой удобный инструмент, предназначенный как для извлечения отдельных компонент изображения, так и для выполнения фильтрации изображений. Их применяют для изменения (улучшения) формы изображений объектов, например, для устранения разрывов в контурных
линиях, устранения отдельных точек и штрихов при получении
контурных препаратов, для изготовления масок и т. д. Они широко
используются в алгоритмах анализа изображений и распознавания
образов, во многих приложениях, связанных с машинным зрением.
Известно, что растровые изображения, полученные с помощью различных сканеров и видеодатчиков, характеризуются присутствием
дефектов линий и шумов. Такие артефакты недопустимы, в частности, в системах, связанных с распознаванием образов, широко используемых в задачах автоматизированной механической обработки и сборки изделий, где необходимо иметь точную информацию о
топологии объекта. В этом случае для сглаживания бинарных растровых изображений могут быть использованы морфологические
операции. Другими примерами эффективного использования этих
операций может служить применение морфологической фильтрации в дактилоскопии, в биомедицинских исследованиях и т. д.
Морфологические операции являются нелинейными, в их основе лежит учет связности пикселей в обрабатываемых изображениях. Для описания алгоритма, в соответствии с которым выполняется та или иная морфологическая операция, используют различные
подходы, а именно – теорию множеств, метод шаблонов, а также
другие методы [1, 3, 6, 7]. Для наибольшей наглядности изложения
мы будем использовать тот или иной метод.
Данное пособие позволит читателю ознакомиться с основными
морфологическими операциями, оценить их эффективность для
решения различного рода конкретных задач, возникающих в про3
цессе обработки как бинарных, так и полутоновых изображений.
Первоначально морфологические операции были развиты применительно к обработке бинарных изображений, но в дальнейшем
морфологические алгоритмы были расширены на полутоновые
изображения. Следуя сложившейся традиции, рассмотрение морфологических операций в пособии начинается применительно к
обработке бинарных изображений. Этот материал предваряет первая глава, в которой описаны основные характеристики бинарных
изображений, логические операции над ними и введено понятие
связности пикселей. Вторая глава пособия посвящена подробному
рассмотрению операций морфологической обработки бинарных
изображений, а также примеров их использования. И, наконец, в
третьей главе изложены вопросы, связанные с применением морфологических операций применительно к полутоновым изображениям.
4
Глава 1. БИНАРНЫЕ ИЗОБРАЖЕНИЯ.
ОСНОВНЫЕ ХАРАКТЕРИСТИКИ И ПОНЯТИЯ
1.1. Бинарные изображения и их характеристики
В отличие от полутонового изображения, в бинарном (двухградационном) изображении яркость пикселей может принимать только
два значения – черное или белое. Бинарное изображение получается из цветного изображения посредством его преобразования сначала в полутоновое, а затем в бинарное путем сравнения яркости
каждого из пикселей с заранее выбранным порогом. В том случае,
если яркость пикселя превышает значение установленного порога, ему присваивается значение «единица», он считается белым, в
противном случае, ему присваивается нулевое значение, и он считается черным. Принято при представлении объектов на бинарном
изображении пикселям, представляющим объекты, присваивать
значения «единица» (белое), а пикселям, представляющим фон, –
значения «нуль» (черное). Эта операция называется бинаризацией
изображения. На рис. 1.1, а и б показаны соответственно исходное,
в данном примере полутоновое, изображение и это же изображение
после его бинаризации.
Разумеется, бинарное изображение содержит существенно
меньшее количество информации о представленных на нем объектах, поскольку содержит лишь их силуэты, однако в ряде случаев
исключение из изображений излишней, не используемой при решении данной конкретной задачи, информации может быть полезным. Примером таких задач, где работать с бинарными изображе-
а
б
Рис. 1.1. Исходное (а) и бинаризированное (б) изображения
5
ниями предпочтительнее, являются задачи определения площади
объектов, задачи, в которых измеряется положение объекта на изображении, и ряд других.
Пользуясь терминологией математической морфологии, можно сказать, что объекты на бинарном изображении представляются множествами всех пикселей соответствующего цвета (в данном
случае белого). Задание такого множества является вариантом полного морфологического описания изображения.
Рассмотрим методы нахождения основных геометрических характеристик бинарных изображений объектов.
Площадь бинарного изображения объекта S по определению
равна количеству пикселей, составляющих силуэт объекта, т. е.
K
N
S = å å L(k,n),
k=1n=1
где L(k, n) – яркость пикселя, занимающего k-ю строку и n-й столбец в бинарном изображении, состоящем из K строк и N столбцов.
Напомним, что по условию яркость белого пикселя бинарного изображения принята равной единице, а черного пикселя – равной
нулю.
Положение силуэта объекта kоб, nоб на бинарном изображении
часто определяют как координаты «центра тяжести» («центра
масс»), которые вычисляются по формулам
K
N
å å kL(k,n)
kîá =
k=1n=1
S
K
,
N
å å nL(k,n)
nîá = k=1n=1
S
.
Однако если нам известна форма и размеры трехмерного объекта, а также характеристики отображающей системы, то, используя бинарное изображение, можно определить не только положение центра тяжести объекта на плоскости этого изображения, но и
его положение в пространстве. Поясним сказанное примером. На
рис. 1.2 показано силуэтное изображение самолета, идущего на посадку. Измеряя расстояние между концами крыльев на изображении в пикселях, а также зная размах крыльев реального объекта и
6
Рис. 1.2. Силуэтное изображение самолета
характеристики телевизионной камеры (фокусное расстояние объектива и размеры фоточувствительной поверхности датчика сигнала изображения), посредством которой было получено исходное
изображение, не составляет труда путем геометрических построений определить расстояние до объекта. Далее, исходя из формы
реального объекта и его видимого силуэта, контуры которого совпадают с контурами его проекции, элементарно находятся углы,
определяющие его положение в пространстве.
К бинарным изображениям принадлежат также контурные изображения. Они используются для представления рукописного или
печатного текста, рабочих и сборочных чертежей конструкторской
документации, в художественных графических работах.
1.2. Логические операции
над бинарными изображениями
Основными логическими операциями являются логическое
умножение (AND), логическое сложение (OR) и отрицание (NOT).
Эти три операции представляют функционально полный класс,
все другие логические операции могут быть получены путем комбинирования только этих трех операций. В таблице приведены результаты выполнения четырех наиболее часто используемых при
обработке изображений логических операций – AND, OR, NOT и
XOR (исключающее ИЛИ). Через L1 и L2 обозначены операнды,
участвующие в логических операциях, при этом операция NOT выполняется над операндом L1.
Логические операции
L1
L2
AND
OR
NOT
XOR
0
0
1
1
0
1
0
1
0
0
0
1
0
1
1
1
1
1
0
0
0
1
1
0
7
Рис. 1.3. Иллюстрация применения логических операций
к бинарным изображениям
При обработке изображений логические операции выполняются попиксельно, т. е. над соответствующими пикселями двух изображений (исключение составляет только операция NOT, которая
выполняется над пикселями одного изображения, инвертируя значения их яркостей). На рис. 1.3 показаны результаты применения
приведенных логических операций над бинарными изображениями «звезда» и «круг».
1.3. Понятие связности
При работе с бинарными изображениями широко применяется
понятие связности пикселей, относительно которых предполагается, что они принадлежат одному классу (объекту). Рассмотрим
рис. 1.4. На нем слева хорошо видны три области: черный контур
прямоугольника, белые пиксели внутри этого контура и белые пик-
Рис. 1.4. Иллюстрация к понятию связности пикселей
8
сели снаружи. Пиксели, относящиеся к каждой из областей, связаны друг с другом. На рис. 1.4 справа ситуация не столь однозначна. Пиксели черного цвета можно отнести как к четырем разным
прямолинейным отрезкам, так и к единому контуру прямоугольника. Для разрешения данной ситуации следует определить понятие связности.
Для используемого в компьютерных дисплеях ортогонального
растра определяют два вида связности пикселей – четырехсвязность и восьмисвязность. Пиксель А8, показанный на рис. 1.5, интенсивность которого равна единице, называют четырехсвязным,
если среди окружающих его пикселей имеется хотя бы один с интенсивностью, равной единице, который бы своей «стороной» касался пикселя А8.
А0 А1 А2
А7 А8 А3
А6 А5 А4
Рис. 1.5. Иллюстрация четырехсвязности
и восьмисвязности пикселей
Другими словами, для того чтобы пиксель А8 был бы четырехсвязным, необходимо, чтобы хотя бы один из пикселей А1, А3, А5,
А7 имел интенсивность, равную единице. Этот же пиксель называют восьмисвязным, если среди окружающих его пикселей А0, А1,
А2, А3 А4, А5, А6, А7 хотя бы один имеет интенсивность, равную единице. Сказанное касается определения связности объектов. Аналогичные определения можно сделать относительно фона. При этом
четырехсвязность пикселей фона автоматически означает восьмисвязность пикселей объектов, и наоборот. Алгоритмы целого ряда
морфологических обработок бинарных изображений критичны к
критерию связности. Проиллюстрируем это следующим примером.
Рис. 1.6. Иллюстрация к критерию связности объектов
9
На рис. 1.6 показано бинарное изображение, на котором имеются
пиксели, принадлежащие и фону, и объектам. Если исходить из
того, что все пиксели, принадлежащие каждому из объектов, должны быть четырехсвязными, то на изображении можно выделить
три разных объекта, удовлетворяющих этому требованию. Если же
рассматривать объекты, состоящие из восьмисвязных пикселей, то
таких объектов будет два.
Если в поле зрения находится более одного объекта, то можно
пометить отдельные объекты и вычислить геометрические характеристики для каждого из них в отдельности. Наконец, перед дальнейшей обработкой изображение можно упростить, постепенно модифицируя его итеративным образом.
10
Глава 2. ОПЕРАЦИИ МОРФОЛОГИЧЕСКОЙ ОБРАБОТКИ
БИНАРНЫХ ИЗОБРАЖЕНИЙ
2.1. Морфологическая обработка изображений
методом логической апертуры
Поясним морфологическую обработку изображений методом использования логической апертуры следующим образом. При морфологической обработке бинарного изображения логической апертурой оно сканируется окном, размеры которого составляют N×M
пикселей. В качестве примера на рис. 2.1 показано такое окно размером 3×3 пикселя. Здесь через L0, L1, L2, L3 L4, L5, L6, L7, L8 обозначены интенсивности пикселей обрабатываемого изображения,
которые оказались в пределах сканирующего окна.
M
L0 L1 L2
N L7 L8 L3
L6 L5 L4
Рис. 2.1. Окно размером 3×3 пикселя
В процессе сканирования изображения при каждом положении
сканирующего окна из обрабатываемого изображения считываются значения пикселей, оказавшихся в его пределах, и на основании
анализа значений их интенсивностей, в соответствии с правилами,
принятыми для реализуемой морфологической операции, центральному пикселю присваивается то или иное значение.
Рассмотрим пример использования логической апертуры для
описания алгоритма простейшей морфологической операции, заключающейся в удалении одиночных точек (clean), которая уничтожает на двухградационных изображениях объекты размером в
один пиксель, т. е. одиночные белые точки на черном фоне. В этом
случае правило, реализуемое логической апертурой при выполнении рассматриваемой морфологической операции, может быть записано следующим образом:
ì
ï0, åñëè L0 = L1 = L2 = L3 = L4 = L5 = L6 = L7 = 0
L8 = ï
.
í
ï
ï
îL8 â ïðîòèâíîì ñëó÷àå
11
Другими словами, если все 8 соседей центрального пикселя принадлежат фону, то и интенсивность центрального пикселя нужно
сделать равной нулю, т. е. преобразовать его в фоновый пиксель,
в противном случае, значение центрального пикселя следует оставить неизменным. На рис. 2.2, а показано исходное бинарное изображение, которое, в частности, содержит две белые точки размером в один пиксель; на рис. 2.2, б показано это же изображение, но
после его обработки морфологической операцией clean. Видно, что
имеющиеся на рис. 2.2, а две белые одиночные точки на рис. 2.2, б
исчезли, в то время как изломанная линия толщиной в один пиксель при этом сохранилась. На этом рисунке сохранились также
изображения крестов толщиной в один пиксель и буквы, толщина
линий которой составляет три пикселя.
Рассмотренная морфологическая операция может быть использована для удаления одиночных импульсных помех на бинарном
изображении, а также для удаления одиночных точек, возникающих при изготовлении контурных препаратов из полутоновых изображений.
В качестве второго примера рассмотрим использование логической апертуры для описания алгоритма морфологической операции, заключающейся в удалении внутренних пикселей объектов
(remove). Эта операция на бинарных изображениях, в отличие от
морфологической операции clean, устанавливает в нуль пиксели
объектов, у которых интенсивности четырех соседних по горизонтали и по вертикали пикселей равны единице. В этом случае правило, реализуемое логической апертурой при выполнении рассматриваемой морфологической операции, может быть записано следующим образом:
ì
ï0, åñëè L1 = L3 = L5 = L7 = 1
L8 = ï
.
í
ï
ï
îL8 â ïðîòèâíîì ñëó÷àå
а
б
в
Рис. 2.2. Исходное бинарное изображение (а), изображения
после выполнения морфологических операций clean (б), remove (в)
12
На рис. 2.2, в показан результат применения к изображению, представленному на рис. 2.2, а, морфологической операции
remove.
Обратим внимание на то, что морфологические операции действуют на пиксели обрабатываемого изображения избирательно,
при этом результат их воздействия определяется как видом морфологической операции, так и значениями интенсивности пикселей
в области, примыкающей к обрабатываемому пикселю. Другими
словами, морфологические операции относятся к группе так называемых пространственных (матричных) преобразований.
Понятие логической апертуры позволяет легко распространить
морфологические операции на полутоновые, а также на трехмерные (объемные) изображения.
2.2. Морфологические операции эрозии
и наращивания бинарных изображений
Эрозия и наращивание (дилатация) являются базовыми морфологическими операциями, которые часто применяются при обработке изображений. Их используют и для построения других
морфологических операций. Рассмотрим случай, когда при выполнении этих операций бинарное изображение объекта сканируется
окном размером 3×3 пикселя.
Алгоритм эрозии (erode) заключается в том, что интенсивность
пикселя исходного изображения устанавливается в нуль, если интенсивность хотя бы одного из пикселей изображения, оказавшихся внутри окна, равна нулю, в противном случае, его интенсивность
сохраняет значение «единица». Этот алгоритм может быть записан
следующим образом:
ìï0, åñëè (L0 = 0) || (L1 = 0) || (L2 = 0) || (L3 = 0) ||
ïï
L8 = ïí(L4 = 0) || (L5 = 0) || (L6 = 0)|| (L7 = 0)
,
ïï
ïïîL8 â ïðîòèâíîì ñëó÷àå
(2.1)
где || – логическая операция ИЛИ.
В результате выполнения эрозии с объекта, представленного на
бинарном изображении, снимается внешний слой пикселей, принадлежащих объекту, т. е. пикселей, имеющих значение «единица», а также сглаживаются выступы границ объекта размером в
13
один пиксель. Кроме того, при эрозии уничтожаются все малые
объекты (линии толщиной в один или два пикселя, точки, размеры
которых меньше размера окна, и т. д.). Рис. 2.3 поясняет сказанное: на рис. 2.3, а показаны исходные объекты, а на 2.3, б – результат их преобразования операцией «эрозия».
а
б
Рис. 2.3. Исходное изображение (а) и изображение
после выполнения операции эрозии (б)
Операция наращивания (дилатации) является операцией, обратной по отношению к операции эрозии. Алгоритм операции наращивания (dilate) заключается в том, что при сканировании обрабатываемого изображения окном размером 3×3 пикселя центральный
пиксель исходного изображения устанавливается в состояние «единица», если хотя бы один из пикселей его восьмисвязной окрестности равен единице, в противном случае, он сохраняет свое прежнее
значение. Этот алгоритм может быть записан следующим образом:
ìï1, åñëè (L0 = 1) || (L1 = 1) || (L2 = 1)||
ïï
L8 = ïí(L3 = 1) || (L4 = 1) || (L5 = 1) || (L6 = 1)|| (L7 = 1). (2.2)
ïï
ïïîL8 â ïðîòèâíîì ñëó÷àå
В результате выполнения операции на объект, представленный
на бинарном изображении, наращивается слой пикселей, имеющих значение «единица». Рис. 2.4 поясняет сказанное.
а
б
Рис. 2.4. К пояснению операции наращивания: а – исходное изображение;
б – изображение после выполнения наращивания
14
Морфологические операции эрозии и наращивания, как, впрочем, и ряд других, могут быть n-кратными. Под n-кратной операцией понимается последовательное применение n раз данной операции к обрабатываемому изображению. На рис. 2.5, а показано
исходное изображение; на рис 2.5, б – результат применения к нему
однократной операции эрозии; на рис. 2.5, в – двукратное применение этой операции. Рис. 2.5, г и рис. 2.5, д демонстрируют применение к исходному изображению, соответственно, однократной и
двукратной операции дилатации.
а
б
г
в
д
Рис. 2.5. К пояснению n-кратности выполнения операций эрозии
и дилатации: исходное изображение (а), результаты однократного
выполнения этих операций ((б) и (г) соответственно), результаты
двукратного выполнения этих операций ((в) и (д) соответственно)
Описанный метод называется методом с применением примитива (structuring element) [1]. В данном случае примитивом является окно, форма и размеры которого могут быть выбраны в зависимости от решаемой задачи. Понятно, что в выражение (2.2) при
этом должны быть внесены очевидные изменения.
2.3. Использование шаблонов
при выполнении морфологических операций
В ряде случаев при описании алгоритма выполнения морфологической операции удобно использовать так называемые шаблоны, размеры которых равняются размерам сканирующего окна.
Поясним их применение на простейшем, уже рассматривавшемся
выше, примере удаления одиночных точек (операция clean) на бинарных изображениях, а затем используем их при описании других алгоритмов. В рассматриваемом случае обрабатываемое изоб15
ражение сканируется окном размером 3×3 пикселя, показанным на
рис. 2.1. При этом область изображения, перекрываемая сканирующим окном, попиксельно сравнивается с шаблоном, показанным
на рис. 2.6.
Рис. 2.6. Пример шаблона размером 3×3 пикселя
В том случае, если интенсивности пикселей изображения, оказавшихся в пределах сканирующего окна, совпадают с интенсивностями соответствующих пикселей шаблона, интенсивность пикселя изображения, оказавшегося в центре окна, приравнивается
нулю, т. е. он преобразуется в фоновый пиксель, в противном случае, интенсивность его не изменяется. Это можно записать следующим образом:
8
ìï
2
ïï0, åñëè
å (Lk - Løk ) = 0, L8 = ïí
k=0
ïï
ïïL8 â ïðîòèâíîì ñëó÷àå
î
(2.3)
где L0, L1, L2, L3, L4, L5, L6, L7, L8 – значения интенсивности пикселей изображения, оказавшихся в пределах окна; Lш0, Lш1, Lш2,
Lш3, Lш4, Lш5, Lш6, Lш7, Lш8 – соответственно значения интенсивностей пикселей шаблона, пронумерованных в том же порядке, что
и пиксели окна.
Морфологическая операция удаления одиночных точек является слишком простой, чтобы на ее примере можно было бы продемонстрировать достоинства использования шаблонов, что позволяет просто описывать и реализовывать алгоритмы сложных
морфологических операций. С целью демонстрации широких возможностей рассматриваемого приема рассмотрим еще несколько
морфологических операций.
Морфологическая операция эрозии (erode). Алгоритм этой
морфологической операции, рассмотренной в п. 2.2, при использовании метода шаблонов может быть описан следующим образом:
16
8
ìï
ïï0, åñëè
å Lk - Løk < 9. L8 = ïí
=0
k
ïï
ïïL8 â ïðîòèâíîì ñëó÷àå
î
(2.4)
На рис. 2.7 показано изображение шаблона для рассматриваемого случая, который представляет массив, состоящий из нулей. На рисунке черным обозначены элементы шаблона, равные
нулю. Правило (2.4), согласно которому реализуется алгоритм
эрозии, несколько проще, чем правило, представленное формулой (2.1).
Рис. 2.7. Пример шаблона, состоящего из нулей
Морфологическая операция дилатации (dilate), которая, как
уже отмечалось, является операцией, обратной по отношению к
операции эрозии. Алгоритм этой морфологической операции при
использовании метода шаблонов может быть описан следующим
образом:
8
ìï
ïï1, åñëè
å Lk - Løk > 0, L8 = ïí
=0
k
ïï
ïïL8 â ïðîòèâíîì ñëó÷àå
î
(2.5)
где по-прежнему L0, L1, L2, L3, L4, L5, L6, L7, L8 – значения интенсивности пикселей изображения, оказавшихся в пределах сканирующего окна размером 3×3 пикселя; Lш0, Lш1, Lш2, Lш3, Lш4,
Lш5, Lш6, Lш7, Lш8 – соответственно значения интенсивностей
пикселей шаблона, пронумерованных в том же порядке, что и пиксели окна. В этом случае также применяется шаблон, показанный
на рис. 2.7.
Выше был рассмотрен случай, когда окно и, соответственно,
шаблон имели одинаковые размеры в обоих направлениях, равные
3×3 пикселя. В общем случае эти размеры могут быть большими и
неодинаковыми, если этого требует вид реализуемой морфологической операции.
17
При рассмотрении морфологических операций эрозии и дилатации оказалось достаточным использование только одного довольно
простого шаблона, в других случаях, как это будет видно из дальнейшего, количество используемых шаблонов может быть существенно больше.
Теперь рассмотрим некоторые другие наиболее часто употребляемые морфологические операции.
2.4. Морфологические операции
бинарного открытия и бинарного закрытия
Последовательное применение операций эрозии и наращивания
называется операцией бинарного открытия (open). Эта операция
на первом шаге своего выполнения (на шаге выполнения операции эрозии) устраняет мелкие детали, точки и линии, объединяя
области фона, разъединенные ранее узкими линиями. На втором
шаге выполнения (на шаге выполнения операции наращивания)
операция бинарного открытия восстанавливает размеры объектов,
сохранившихся после выполнения первого шага. В результате применения операции бинарного открытия к бинарному изображению
на этом изображении сглаживаются контуры объектов, ликвидируются выступы небольшой ширины, обрываются узкие перешейки.
В качестве иллюстрации на рис. 2.8, а показано исходное бинарное изображение; на рис. 2.8, б – это же изображение после выполнения первого шага алгоритма (т. е. эрозии); на рис. 2.8, в – результат выполнения всей операции открытия, т. е. второго, заключительного шага этой операции (наращивания).
а
б
в
Рис. 2.8. Иллюстрация выполнения операции бинарного открытия:
а – исходное изображение; б – изображение, получившееся
после выполнения первого шага алгоритма; в – изображение,
получившегося после выполнения второго шага алгоритма
18
Последовательное применение операций наращивания и эрозии
называется операцией бинарного закрытия (close). Эта операция
на первом шаге своего алгоритма (на шаге выполнения операции
наращивания) «заливает» узкие разрывы и щели малой ширины
в объектах, кроме того, эта операция удаляет малые дыры в объектах.
На втором шаге алгоритма (на шаге выполнения операции эрозии) операция бинарного закрытия восстанавливает размеры объектов, изменившиеся после выполнения первого шага алгоритма.
В результате применения операции бинарного закрытия к бинарному изображению на этом изображении также сглаживаются
контуры объектов, но это достигается за счет «заливки» узких
разрывов.
В качестве иллюстрации на рис. 2.9, а показано исходное бинарное изображение; на рис. 2.9, б – это же изображение после выполнения первого шага алгоритма (т. е. наращивания); на рис. 2.9,
в – результат выполнения всей операции закрытия, т. е. второго,
заключительного шага этой операции (эрозии).
а
б
в
Рис. 2.9. Иллюстрация выполнения операции бинарного закрытия:
а – исходное изображение; б – изображение, получившееся
после выполнения первого шага алгоритма; в – изображение,
получившееся после выполнения второго шага алгоритма
Операции бинарного открытия и закрытия могут быть
n-кратными. Под n-кратными операциями бинарного открытия и
закрытия понимаются такие операции, когда вначале применяется
n раз операция эрозии (во втором случае – наращивания), а затем n
раз – операция наращивания (во втором случае – эрозии). При использовании n-кратных операций бинарного открытия и закрытия
из изображения в первом случае устраняются детали, а во втором
случае – дыры, размеры которых определяются кратностью применяемых операций.
19
2.5. Морфологические операции утончения и утолщения
бинарных изображений
Утончение (thin) – это морфологическая операция, в результате
выполнения которой происходит утончение изображения объекта до ширины одного пикселя. Алгоритм выполнения этой операции заключается в том, что изображение циклически сканируется
окном размером 3×3 пикселя. При выполнении каждого цикла для
каждого положения сканирующего окна анализируются значения
яркостей пикселей, попавших в это окно. В том случае, если одновременно выполняются следующие условия:
– значение яркости центрального пикселя равно единице;
– хотя бы один из пикселей внутри этого окна равен нулю;
– обращение центрального пикселя окна в нуль не разрывает
восьмисвязную цепочку пикселей, составляющих изображение
объекта;
яркость центрального пикселя устанавливается в нуль, в противном случае, значение его яркости сохраняется равным единице. Циклическое сканирование изображения продолжается до тех
пор, пока толщина объекта, т. е. толщина цепочки пикселей, не
станет равной одному пикселю. На рис. 2.10, а показано исходное
изображение; на рис. 2.10, б – промежуточная фаза его обработки;
на рис. 2.10, в – изображение объекта, полученное в результате выполнения описанной операции.
а
б
в
Рис. 2.10. Иллюстрация выполнения морфологической операции
утончения бинарного изображения: а – исходное изображение;
б – промежуточная фаза обработки изображения;
в – изображение, полученное в результате выполнения операции
Операцию утончения используют для предобработки изображений текста, в частности, рукописного, перед его распознаванием, поскольку эта операция позволяет устранить из изображений букв все несущественное и мешающее, например, утол20
а
б
Рис. 2.11. Изображения рукописного текста до обработки
посредством морфологической операцией утончения (а) и после нее (б)
щения, и вместе с тем сохранить непрерывность линий. На
рис. 2.11, а приведены изображения рукописного текста до его
обработки посредством морфологической операцией утончения
и после нее. Из рисунка видно, что после обработки толщина
каждой линии, составляющей букву, стала равна одному пикселю. При распознавании текста на таком изображении элементы
букв, такие как разветвления, пересечения и т. д., распознаются гораздо проще, чем в случае, когда толщина линий букв непостоянная.
Утолщение (thicken) – это морфологическая операция, обратная по отношению к морфологической операции «утончение»
со всеми вытекающими последствиями. Отметим, что алгоритм
морфологической операции «утолщение» на практике реализуется редко. Обычно это делается следующим образом. Вначале
изображение инвертируется, при этом области, занятые объектами, становятся черными, а области фона – белыми. Затем выполняется операция утончения, которая, естественно, утончает
белые области, поскольку алгоритм утончения реагирует на них
как на объекты, при этом черные области утолщаются. Затем
полученный результат снова инвертируется. В зависимости от
вида изображений объектов описанная процедура иногда приводит к возникновению отдельных изолированных белых пикселей в обработанном изображении, поэтому заключительным
этапом обработки является удаление изолированных точек, например, методом открытия.
21
2.6. Морфологические операции: усечение, мост
и удаление центрального пикселя в конфигурациях
с H-связностью бинарных изображений
Морфологическая операция усечения (spur) является важным
дополнением к другим морфологическим операциям, в частности,
к операции утончения. Рассмотрим эту операцию на примере задачи отсечения ложных ветвей. Как известно, в основе автоматического распознавания рукописных текстов лежит анализ скелета
каждого символа. При получении скелета часто в результате различных причин на изображении символа возникают паразитные
отростки. Пример такого изображения показан на рис. 2.12, а.
В случае морфологической операции усечения (spur) под паразитными отростками понимаются пиксели объекта, у которых только
один из восьми соседних пикселей имеет интенсивность, равную
единице, а остальные равны нулю.
а
б
Рис. 2.12. Исходное изображение (а) и изображение, полученное
в результате выполнения морфологической операции усечения (б)
Отличие алгоритма морфологической операции усечения (spur)
от алгоритма морфологической операции удаления одиночных точек (clean) состоит в том, что содержимое сканирующего окна сравнивается не с одним шаблоном, как в предыдущем случае, а последовательно с группой шаблонов, приведенных на рис. 2.13.
Рис. 2.13. Шаблоны, используемые для выполнения
морфологической операции усечения (spur)
22
Если заполнение сканирующего окна совпадает с одним из шаблонов, показанных на рис. 2.13, то центральный пиксель окна обнуляется, т. е. преобразуется в фоновый пиксель, в противном случае, его интенсивность не изменяется, т. е.
8
ìï
2
ïï0, åñëè äëÿ îäíîãî èç øàáëîíîâ
å (Lk - Løk ) = 0, (2.6)
L8 = ïí
k=0
ïï
ïïL8 â ïðîòèâíîì ñëó÷àå
î
где L0, L1, L2, L3, L4, L5, L6, L7, L8 – значения интенсивности пикселей изображения, оказавшихся в пределах сканирующего окна
размером 3×3 пикселя; Lш0, Lш1, Lш2, Lш3, Lш4, Lш5, Lш6, Lш7,
Lш8 – соответственно значения интенсивностей пикселей шаблона,
пронумерованных в том же порядке, что и пиксели окна.
На рис. 2.12, б показан результат обработки изображения
рис. 2.12, а морфологической операцией spur. В целях демонстрации выполнения морфологической операции усечения (spur) на
рис. 2.14, а приведена также группа исходных тестовых изображений, а на рис. 2.14, б показан результат их обработки рассматриваемой морфологической операцией.
а
б
Рис. 2.14. Иллюстрация к морфологической операции усечения (spur):
а – исходные тестовые изображения; б – изображения, полученные
в результате выполнения данной операции
Морфологическая операция «мост» (bridge) соединяет ранее
разъединенные пиксели фрагментом фона толщиной в один пиксель. Рис. 2.15 демонстрирует результат выполнения этой операции. На рис. 2.15, а показан ряд исходных бинарных изображений
23
а
б
Рис. 2.15. Иллюстрация к морфологической операции мост (bridge):
а – исходные изображения; б – изображения, полученные
в результате выполнения данной операции
объектов, а на рис. 2.15, б приведены изображения этих же объектов, но после их преобразования операцией мост (bridge).
На рис. 2.16 показана группа шаблонов, которые были использованы при выполнении этой операции. Если заполнение сканирующего окна совпадает с одним из шаблонов, показанных на рис. 2.16,
то центральный пиксель окна приобретает яркость, равную единице, в противном случае, его интенсивность не изменяется, т. е.
8
ìï
ïï1, åñëè äëÿ îäíîãî èç øàáëîíîâ
(Lk - Løk )2 = 0
å
ï
L8 = í
. (2.7)
k=0
ïï
ïïL8 â ïðîòèâíîì ñëó÷àå
î
Рис. 2.16. Шаблоны, используемые для выполнения
морфологической операции мост (bridge)
24
Морфологическая операция hbreak удаляет центральные пиксели в конфигурациях с H-связностью. Алгоритм этой морфологической операции при использовании метода шаблонов может быть
описан следующим образом. Обрабатываемое изображение сканируется окном. Если заполнение сканирующего окна совпадает с одним из шаблонов, то центральный пиксель окна обнуляется, т. е.
преобразуется в фоновый пиксель, в противном случае, его интенсивность не изменяется, т. е.
8
ìï
ïï0, åñëè äëÿ îäíîãî èç øàáëîíîâ
(Lk - Løk )2 = 0
å
ï
L8 = í
. (2.8)
k=0
ïï
ïïL8 â ïðîòèâíîì ñëó÷àå
î
На рис. 2.17, а показан ряд исходных бинарных изображений
объектов, а на рис. 2.17, б – изображения этих же объектов, но после их преобразованием операцией hbreak.
в
а
б
Рис. 2.17. Иллюстрация к морфологической операции мост (hbreak):
а – исходные изображения; б – изображения, полученные
в результате выполнения данной операции; в – группа шаблонов,
которые были использованы при выполнении этой операции
В заключение этого подраздела отметим, что применение шаблонов, хотя и связано, как правило, с необходимостью использовать
их большие наборы, но вместе с тем этот метод предоставляет очень
широкие возможности конструирования различных морфологиче25
ских операций. Так, выбирая тот или иной набор шаблонов и используя их для обработки изображения, можно исключать из него
или, наоборот, выделять на нем самые разнообразные конфигурации пикселей, образующих прямые линии, углы, разветвления
и т. д. При этом в ряде случаев могут потребоваться окна, размер
которых может заметно превышать 3×3 пикселя, например, при
исключении (обнаружении) кривых линий и более сложных фрагментов. Понятно, что время обработки в этом случае существенно
возрастает.
2.7. Заполнение областей (заливка)
бинарных изображений
Алгоритм заполнения области внутри замкнутого восьмисвязного контура (fill) включает в себя следующие шаги. Сначала внутри замкнутого контура задается точка, яркость которой по умолчанию равна яркости окружающего ее контура. На рис. 2.18, а в
виде сетки показаны отдельные пиксели изображения, белым цветом изображен контур, а также точка, помещенная внутри контура. Затем в режиме итерации, начиная с этой точки, выполняется
четырехсвязная дилатация. При этом в процессе обработки каждого пикселя исходного изображения значение его яркости устанавливается в единицу только при выполнении следующих двух условий, а именно:
– если хотя бы один из пикселей в его четырехсвязной окрестности равен единице;
а
б
в
г
Рис. 2.18. Иллюстрация к алгоритму заполнения областей бинарных
изображений: а – изображение с точкой, помещенной внутри контура;
б – результат дилатации после первой итерации; в – результат
дилатации после четвертого шага; г – результат обработки
(полное заполнение контура)
26
– если его яркость до этого равнялась нулю, т. е. если до преобразования он принадлежал фону, а не контуру.
В противном случае, пиксель сохраняет значение «нуль».
На рис. 2.18, б показан результат дилатации после первой итерации. На рис. 2.18, в приведен результат дилатации после четвертого шага итерации. Из рисунка видно, что при данном алгоритме
дилатация не распространяется за пределы контура. Дилатация
продолжается до полного заполнения области (рис. 2.18, г). Описанный алгоритм с соответствующими изменениями может быть применен и для заполнения областей в полутоновых и цветных изображениях.
2.8. Построение скелета объекта
на бинарном изображении
Одним из способов описания объекта является выделение из
него так называемого скелета (морфологическая операция skel).
Существует ряд методов получения скелета объекта, из которых
наиболее наглядным, на наш взгляд, является метод, называемый
методом степного пожара. Этот метод выделяет также дополнительную информацию, которая вместе со скелетом дает возможность восстановить описываемый объект. Сначала в целях наглядности объяснения рассмотрим случай, когда изображение объекта
задано в аналоговом виде. Представим изображение объекта в виде
области, покрытой травой, а изображение фона – в виде области,
где трава отсутствует. На рис. 2.19 объект показан в виде прямоœÉ¹ÆÁϹǺӾÃ˹
­ÉÇÆË
ɹÊÈÉÇÊËɹƾÆÁØǼÆØ
Рис. 2.19. Иллюстрация к морфологической операции skel
27
угольника. Будем считать, что огонь возник по всему периметру
объекта одновременно. В этом случае огонь будет распространяться
с постоянной скоростью в направлении центра объекта.
На рис. 2.19 штриховой линией показаны фронты огня, распространяющиеся от каждой из четырех границ объекта. При этом
фронт огня, распространяющийся от одной границы объекта, будет
встречаться с фронтом огня, распространяющимся от другой границы, и эти два фронта огня будут гасить друг друга. Линии гашения огня образуют скелет объекта, который на рис. 2.19 показан
жирными линиями.
При построении скелета объекта вводят в рассмотрение функцию гашения. Функция гашения представляет собой зависимость
минимального расстояния d от точки скелета с координатами x и y
до границы объекта. Располагая скелетом объекта и функцией гашения, можно восстановить изображение объекта следующим образом. Описывая окружности радиусом d из каждой точки скелета
и проводя к ним касательную, мы получаем точное изображение
объекта. Этот же результат можно получить, используя морфологическую функцию Matlab skel с параметром inf.
Выше был рассмотрен способ построения скелета объекта применительно к аналоговому изображению. Построение скелета цифровых изображений принципиально не отличается от рассмотренного выше метода, однако имеет специфические особенности, связанные с применением эвклидовой метрики. Подробные сведения
по этому вопросу приведены в литературе [1, 4, 5].
2.9. Производные морфологические операции
над бинарными изображениями
Ряд морфологических операций могут быть реализованы в результате нахождения разности двух изображений, одно из которых
является исходным, а второе было получено в результате применения к исходному изображению одной из морфологических операций. Приведем примеры.
Морфологическая операция выделения периметра (remove) реализуется следующим образом. Сначала двоичное изображение объекта L1(k, n) подвергается эрозии, в результате которой получается
изображение L2(k, n). После этого из изображения L1(k, n) вычитается изображение L2(k, n). Получившееся в результате вычитания
28
распределение яркости будет представлять собой изображение границы (периметра) Lгр(k, n) толщиной в один пиксель:
Lãð (k, n) = L1 (k, n)- L2 (k, n).
Исходное изображение и результат его обработки посредством
морфологической операция выделения периметра показаны на
рис. 2.20, а и б соответственно. Этот же результат может быть получен непосредственно путем применения к исходному изображению
L1 (k,n) операции remove Matlab, удаляющей внутренние пиксели
а
б
Рис. 2.20. Иллюстрация к морфологической операции
выделения периметра: а – исходное изображение;
б – изображение периметра
Рис. 2.21. Шаблоны, используемые для выполнения
морфологической операции remove
29
объекта, у которых соседние пиксели по горизонтали и вертикали
равны единице. Этот подход был описан в п. 2.1 как пример использования логической апертуры.
Можно получить этот результат также, применив метод шаблонов. На рис. 2.21 показана группа шаблонов, которые используются при непосредственном выполнении операции remove и формулы
(2.6).
Морфологическая операция низ шляпы (bothat) реализуется
путем вычитания исходного изображения из его бинарного закрытия.
Морфологическая операция верх шляпы (tophat) реализуется
путем вычитания из исходного изображения его бинарного открытия.
2.10. Использование «интегральных» шаблонов
при выполнении морфологических операций
над бинарными изображениями
Особенностью рассмотренного выше метода выполнения морфологических операций с использованием шаблонов является то, что,
как правило, он требует для своей реализации применения большого количества шаблонов. Так, например, для реализации морфологической операции spur требуется 8 шаблонов, для операции bridge
необходимо использовать 30 шаблонов, для операции remove –
16 шаблонов, и т. д. Исключение составляют только самые простые операции, например, операция удаления одиночных восьмисвязных точек (clean). В ряде случаев этого можно избежать, если
модифицировать рассмотренный метод. Модифицированный вариант этого метода, который мы назовем методом «интегральных»
шаблонов, заключается в следующем. В этом методе используется
один шаблон, паттерн которого представляет собой изображение
удаляемого объекта, например, отрезок прямой заданной длины и
ориентации, окружность заданного диаметра и т. д. На рис. 2.22
в качестве примера приведены два таких шаблона. Шаблон, показанный на рис. 2.22, а, предназначен для удаления из изображения
отрезков линий длиной в 5 пикселей, ориентированных к направлению строк под углом 45о, а на рис 2.22, б показан шаблон, предназначенный для удаления из изображения окружностей заданного диаметра.
30
а
б
Рис. 2.22. Шаблоны для удаления из изображения
определенных объектов: а – отрезков линий длиной в 5 пикселей,
ориентированных к направлению строк под углом 45о;
б – окружностей заданного диаметра
При реализации модифицированного варианта метода обрабатываемое изображение сканируется окном, размеры которого совпадают с размерами шаблона. Как и ранее, область изображения,
перекрываемая сканирующим окном, попиксельно сравнивается с
шаблоном.
Отличие модифицированного варианта метода состоит в том, что
если интенсивности пикселей изображения, оказавшихся в пределах сканирующего окна, совпадают с интенсивностями соответствующих пикселей шаблона, все пиксели изображения, оказавшиеся
в пределах сканирующего окна, а не только центральный, как это
было ранее, обнуляются, т. е. преобразуются в фоновые пиксели.
В противном случае, значения интенсивностей пикселей изображения, оказавшихся в пределах окна, сохраняются. Достоинством
этого метода является простота и наглядность. Его удобно применять в тех случаях, когда из изображения требуется удалить объекты, форма, размеры и ориентация которых заранее известны.
31
Глава 3. Морфологические операции
обработки полутоновых изображений
3.1. Морфологические операции эрозии
и наращивания полутоновых изображений
В полутоновых цифровых изображениях каждый пиксель как
элемент множества, представляющего изображение, описывается
тремя координатами: две из них описывают координаты пикселя в
пространстве, а третья представляет дискретное значение ярости.
Распространим рассмотренные ранее базовые морфологические
операции эрозии и дилатации на полутоновые изображения.
Морфологическая операция эрозии полутонового изображения
выполняется следующим образом. Обрабатываемое изображение
сканируется окном, размеры которого должны быть равны размерам шаблона. При каждом положении окна на обрабатываемом
изображении вычисляются разности интенсивностей пикселей,
оказавшихся в пределах окна, и интенсивностей элементов шаблона, накрывающих эти пиксели, а затем среди полученных разностей находится наименьшая. Значение этой наименьшей разности
присваивается пикселю обработанного изображения, расположенному в центре сканирующего окна. В результате эрозии при условии, что все значения элементов шаблона положительные, яркость
светлых деталей полутонового изображения, если хотя бы один из
их размеров меньше соответствующего размера шаблона, ослабляется. Степень этого ослабления зависит как от значений яркости
пикселей изображения, окружающих эти детали, так и от формы самого шаблона и значений интенсивностей его элементов. На
рис. 3.1, а в качестве примера показано исходное изображение; на
рис. 3.1, в – результат его эрозии; на рис. 3.1, б приведен шаблон,
который при этом был использован.
Морфологическая операция дилатации полутонового изображения выполняется похожим образом. Обрабатываемое изображение также сканируется окном, размеры которого равны размерам
шаблона. При каждом положении окна на обрабатываемом изображении вычисляются суммы интенсивностей пикселей, оказавшихся в пределах окна, с интенсивностями элементов шаблона,
накрывающих эти пиксели, а затем среди полученных сумм находится наибольшая. Значение этой наибольшей суммы присваивает32
а
в
б
г
Рис. 3.1. Иллюстрация к морфологическим операциям эрозии
и дилатации полутонового изображения: а – исходное изображение;
б – шаблон; в – результат эрозии исходного изображения;
г – результат дилатации исходного изображения
ся пикселю обработанного изображения, расположенному в центре
сканирующего окна. В результате дилатации при условии, что все
значения элементов шаблона положительные, темные детали полутонового изображения, если хотя бы один из их размеров меньше соответствующего размера шаблона, становятся светлее или
вообще пропадают. Степень этого осветления зависит от значений
яркости пикселей изображения, окружающих эти детали, а также
от формы и значений интенсивностей элементов самого шаблона.
На рис. 3.1, г в качестве примера показан результат дилатации исходного изображения, а на рис. 3.1, б – шаблон, который при этом
был использован.
3.2. Морфологические операции открытия
и закрытия полутоновых изображений
Морфологическая операция открытия полутонового изображения, как и в случае бинарного изображения, выполняется сле33
дующим образом. Вначале полутоновое изображение подвергается
операции эрозии, а затем полученный результат подвергается операции дилатации с использованием одного и того же шаблона.
Морфологическая операция закрытия полутонового изображения выполняется следующим образом. Сначала полутоновое изображение подвергается операции дилатации, а затем полученный
результат подвергается операции эрозии с использованием одного
и того же шаблона. На рис. 3.2 в качестве примера приведены результат открытия (рис. 3.2, а) и результат закрытия (рис. 3.2, б)
изображения, показанного на рис 3.1, а.
а
б
Рис. 3.2. Результаты выполнения морфологических операций открытия
(а) и закрытия (б)
На практике операция открытия применяется для удаления
из полутонового изображения небольших по сравнению с размерами шаблона светлых деталей. Достигается это благодаря тому,
что на первом этапе этой операции, когда выполняется эрозия, небольшие светлые детали удаляются из изображения, при этом несколько уменьшается яркость всего изображения. На втором этапе
операции, когда выполняется дилатация, яркость сохранившихся
на изображении деталей восстанавливается, но при этом детали,
удаленные на первом этапе, не восстанавливаются.
Операция закрытия на практике применяется для удаления из
полутонового изображения небольших по сравнению с размерами
шаблона темных деталей. Это происходит благодаря тому, что на
первом этапе этой операции, при выполнении дилатации, небольшие темные детали удаляются из изображения, при этом несколько увеличивается яркость всего изображения. На втором этапе
операции, когда выполняется эрозия, яркость сохранившихся на
изображении деталей восстанавливается, но при этом детали, удаленные на первом этапе, не восстанавливаются.
34
3.3. Морфологические операции tophat, bothat
и «морфологический градиент» при фильтрации
полутоновых изображений
Рассмотрим морфологические функции tophat и bothat, которые
применяют при фильтрациях полутоновых изображений.
Морфологическая функция tophat (верх шляпы) представляет
собой вычитание из обрабатываемого изображения L(k, n) результата его открытия Lоткр(k, n), при этом результат обработки может
быть записан следующим образом:
Lâûõ (k, n) = L(k, n)- Lîòêð (k, n).
Поскольку при открытии из исходного изображения удаляются
небольшие светлые детали, то результатом операции tophat является выделение из исходного изображения этих небольших светлых
деталей, которые при дальнейших этапах обработки изображений
могут быть использованы путем их включения в обрабатываемое
изображение с тем или иным весовым коэффициентом. На рис. 3.3
показано исходное изображение (рис. 3.3, а) и результат его обработки рассматриваемой операцией (рис. 3.3, б).
а
б
Рис. 3.3. Иллюстрация выполнения морфологической операции tophat:
а – исходное изображение; б – результат обработки
Морфологическая функция bothat (низ шляпы) представляет
собой вычитание исходного изображения L(k, n) из результата его
закрытия Lзакр(k, n), при этом результат обработки может быть записан следующим образом:
Lâûõ (k, n) = Lçàêð (k, n)- L(k, n).
35
Поскольку при закрытии из исходного изображения удаляются
небольшие темные детали, то результатом операции bothat является выделение из исходного изображения этих небольших темных
деталей, которые при дальнейших этапах обработки изображений
могут быть использованы путем их включения в обрабатываемое
изображение с тем или иным весовым коэффициентом. На рис. 3.4
показаны исходное изображение (рис. 3.4, а) и результат его обработки рассматриваемой операцией (рис. 3.4, б).
а
б
Рис. 3.4. Иллюстрация выполнения морфологической операции bothat:
а – исходное изображение; б – результат обработки
На практике совместное использование морфологических операций tophat и bothat в процессе обработки исходного изображения
L(k, n) в соответствии с выражением
Lâûõ (k, n) = L(k, n)+ éêë L(k, n)- Lîòêð (k, n)ùúû - éêë Lçàêð (k, n)- L(k, n)ùúû
позволяет увеличить контраст его мелких деталей. На рис. 3.5 показано исходное изображение (рис. 3.5, а) и результат его обработки описанным способом (рис. 3.5, б) при использовании шаблона,
приведенного на рис. 3.1, б.
Достоинством этого метода фильтрации, по сравнению с известным методом нерезкого маскирования [2], является то, что в
рассматриваемом случае на изображении отсутствуют окантовки.
Возможности этого метода можно расширить, если суммирование
и вычитание результатов операций tophat и bothat производить с
весовыми коэффициентами.
Рассмотрим еще один метод морфологической фильтрации, а
именно – морфологический градиент. Эта морфологическая опера36
а
б
Рис. 3.5. Исходное изображение (а), изображение
с увеличенным контрастом мелких деталей (б)
а
б
Рис. 3.6. Исходное изображение (а), результат его фильтрации
методом «морфологический градиент» (б)
ция реализуется путем вычитания из результата дилатации исходного изображения результата его эрозии, выполненных с использованием одного и того же шаблона. На рис. 3.6 показаны исходное
изображение (рис. 3.6, а) и результат его фильтрации методом морфологический градиент (рис. 3.6, б) при использовании шаблона
размером 3×3 пикселя, заполненного единицами.
Одной из возможных областей применения данного типа фильтрации является художественная графика, где этот прием может
оказаться достаточно выразительным инструментом.
37
Заключение
Авторы надеются, что данное пособие окажется полезным для
студентов и аспирантов, изучающих компьютерную обработку изображений. В настоящее время эта область науки и техники очень
востребована. Тем не менее наблюдается явный недостаток научной литературы, подробно излагающей методы и алгоритмы, которые могут быть эффективно применены при решении целого ряда
практических задач. К таким, на наш взгляд, недостаточно освещенным в литературе методам обработки бинарных и полутоновых
изображений относится морфологическая обработка.
Знание основ морфологической обработки предоставляет специалистам широкие возможности для реставрации и улучшения
изображений, поскольку она имеет дело непосредственно с формой
тех или иных деталей изображения. Работая с соответствующими
шаблонами, можно избирательно влиять на обработку избранных
фрагментов обрабатываемых изображений и получать при этом
хорошие результаты применительно к целому ряду практических
задач.
38
Рекомендуемая литература
1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.:
Техносфера, 2006.
2. Красильников Н. Н. Цифровая обработка изображений. М.:
Вузовская книга, 2001.
3. Яне Б. Цифровая обработка изображений. М.: Техносфера,
2007.
4. Montanari U. A method for obtaining skeletons using a quasiEuclidean distance // J. ACM. 1968. № 15. P. 600–624.
5. Montanari U. Continuous skeletons from digitized images //
J. ACM. 1969. № 16. P. 534–549.
6. Serra J. Image analyses and mathematical morphology. London:
Academic Press, 1982.
7. Soiled P. Morphological Image Analysis. Principles and Applications. 2nd ed., Berlin: Springer, 2002.
39
Вопросы для самоконтроля
1. Дайте определение связности пикселей в бинарном изображении. Приведите примеры.
2. Какие логические операции над бинарными изображениями
вам известны? Опишите их.
3. В чем заключается морфологическая операция эрозии бинарных изображений? Опишите морфологическую операцию эрозии
бинарных изображений.
4. В чем заключается морфологическая операция дилатации бинарных изображений? Опишите морфологическую операцию дилатации бинарных изображений.
5. В чем заключается морфологическая операция бинарного открытия? Опишите морфологическую операцию бинарного открытия.
6. В чем заключается морфологическая операция бинарного закрытия? Опишите морфологическую операцию бинарного закрытия.
7. Какая морфологическая операция состоит из последовательно
выполняемых операций эрозии и дилатации? Что изменится, если
изменить очередность выполнения операций эрозии и дилатации?
8. Каким образом с использованием морфологических операций
может быть выделен периметр объекта на бинарном изображении?
9. В чем заключается морфологическая операция эрозии полутоновых изображений? Опишите морфологическую операцию эрозии полутоновых изображений.
10. В чем заключается морфологическая операция дилатации
полутоновых изображений? Опишите морфологическую операцию
дилатации полутоновых изображений.
11. Каким образом и с какой целью выполняются морфологические операции открытия и закрытия полутоновых изображений?
40
Содержание
Предисловие.............................................................................. Глава 1. Бинарные изображения. Основные характеристики
и понятия.................................................................................. 1.1. Бинарные изображения и их характеристики....................... 1.2. Логические операции над бинарными изображениями .......... 1.3. Понятие связности........................................................... Глава 2. Операции морфологической обработки бинарных
изображений.............................................................................. 2.1. Морфологическая обработка изображений
методом логической апертуры ................................................. 2.2. Морфологические операции эрозии и наращивания
бинарных изображений........................................................... 2.3. Использование шаблонов при выполнении
морфологических операций . ................................................... 2.4. Морфологические операции бинарного открытия
и бинарного закрытия ............................................................ 2.5. Морфологические операции утончения и утолщения
бинарных изображений........................................................... 2.6. Морфологические операции: усечение, мост и удаление
центрального пикселя в конфигурациях с H-связностью
бинарных изображений........................................................... 2.7. Заполнение областей (заливка) бинарных изображений......... 2.8. Построение скелета объекта на бинарном изображении......... 2.9. Производные морфологические операции
над бинарными изображениями............................................... 2.10. Использование «интегральных» шаблонов
при выполнении морфологических операций
над бинарными изображениями............................................... Глава 3. Морфологические операции обработки полутоновых
изображений.............................................................................. 3.1. Морфологические операции эрозии и наращивания
полутоновых изображений...................................................... 3.2. Морфологические операции открытия и закрытия
полутоновых изображений...................................................... 3.3. Морфологические операции tophat, bothat
и «морфологический градиент» при фильтрации
полутоновых изображений ...................................................... Заключение............................................................................... Рекомендуемая литература.......................................................... Вопросы для самоконтроля........................................................... 3
5
5
7
8
11
11
13
15
18
20
22
26
27
28
30
32
32
33
35
38
39
40
41
Для заметок
42
Для заметок
43
Учебное издание
Красильников Николай Николаевич
Красильникова Ольга Ивановна
Компьютерная обработка изображений.
Морфологические операции
и их применение
Учебное пособие
Редактор В. А. Черникова
Верстальщик С. Б. Мацапура
Сдано в набор 12.05.10. Подписано к печати 17.06.10.
Формат 60×84 1/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 2,56.
Уч.-изд. л. 2,5. Тираж 100 экз. Заказ № 281.
Редакционно-издательский центр ГУАП
190000, Санкт-Петербург, Б. Морская ул., 67
Документ
Категория
Без категории
Просмотров
0
Размер файла
960 Кб
Теги
pdf111
1/--страниц
Пожаловаться на содержимое документа