close

Вход

Забыли?

вход по аккаунту

?

Krasilnikov Multimediatekhn

код для вставкиСкачать
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
Государственное образовательное учреждение
высшего профессионального образования
САНКТ+ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
АЭРОКОСМИЧЕСКОГО ПРИБОРОСТРОЕНИЯ
Н. Н. Красильников, О. И. Красильникова
МУЛЬТИМЕДИАТЕХНОЛОГИИ
В ИНФОРМАЦИОННЫХ СИСТЕМАХ
ПРЕДСТАВЛЕНИЕ И ОБРАБОТКА ИЗОБРАЖЕНИЙ
В КОМПЬЮТЕРЕ
Учебное пособие
Рекомендовано Учебнометодическим объединением
по университетскому политехническому образованию
в качестве учебного пособия для студентов высших учебных заведений,
обучающихся по специальности
230201 – Информационные системы и технологии направления подготовки
230200 – Информационные системы
Санкт+Петербург
2007
УДК 004.4
ББК 32.973
М78
Рецензенты:
кафедра видеотехники Санкт+Петербургского государственного университета
кино и телевидения; доктор технических наук, профессор Р. Е. Быков
Утверждено редакционно+издательским советом университета
в качестве учебного пособия
К78
Красильников Н. Н., Красильникова О. И.
Мультимедиатехнологии в информационных системах.
Представление и обработка изображений в компьютере: учеб.
пособие/Н. Н. Красильников, О. И. Красильникова. ГУАП. –
СПб., 2007. – 132 с.: ил.
ISBN 978+5+8088+0257+5
В учебном пособии изложены вопросы, связанные с представле+
нием трехмерной и двумерной графики. Приведены статистиче+
ские характеристики двумерных изображений. Рассмотрены воп+
росы оцифровки изображений и возникающие при этом искаже+
ния. Описаны методы линейной и нелинейной обработки изображе+
ний с целью повышения их качества.
Учебное пособие предназначено для студентов старших курсов,
изучающих мультимедиатехнологии в рамках технических специ+
альностей.
УДК 004.4
ББК 32.973
ISBN 978+5+8088+0257+5
2
©
©
ГУАП, 2007
Н. Н. Красильников,
О. И. Красильникова,
2007
СОДЕРЖАНИЕ
Предисловие .....................................................................
1. Реальные сцены. Трехмерная и двумерная графика .............
1.1. Объекты реального мира и их свойства .......................
1.2. Воксельная модель представления трехмерных изобра+
жений ..................................................................
1.3. Векторная полигональная модель представления трех+
мерных изображений ..............................................
1.4. Модель освещения ..................................................
1.5. Определение нормали к поверхности и вектора отраже+
ния .....................................................................
1.6. Методы закраски граней ..........................................
1.7. Трассировка лучей ..................................................
1.8. Двумерная растровая модель изображения сцен и состав+
ляющих их объектов ..............................................
1.9. Векторная модель представления двумерных изображе+
ний .....................................................................
1.10.Динамические изображения .....................................
2. Двумерные изображения и их статистические характери+
стики ..........................................................................
2.1. Классификация изображений ...................................
2.2. Пример модели изображений ....................................
2.3. Гистограмма распределения яркостей в изображении ....
2.4. Спектральное представление сигналов ........................
2.5. Пространственные спектры изображений ....................
2.6. Спектральные интенсивности изображений .................
2.7. Автокорреляционные функции изображений ...............
2.8. Коэффициент автокорреляции изображений ................
2.9. Понятие о характеристиках цвета .............................
3. Цифровая обработка изображений ...................................
3.1. Оцифровка изображений ..........................................
3.2. Теорема Котельникова ............................................
3.3. Спектры аналогового и оцифрованного изображений,
помеха пространственной дискретизации ....................
3.4. Метод уменьшения помехи пространственной дискрети+
зации ...................................................................
3.5. Растры, применяемые при дискретизации изображений .
3.6. Метод уменьшения погрешностей интерполяции ..........
3.7. Квантование изображений по яркости ........................
3.8. Ложные контуры ....................................................
3.9. Контраст, детальность, разрешение принтера и частота
пространственной дискретизации ..............................
3.10.Устройства ввода графической информации .................
4. Применение линейной фильтрации для улучшения каче+
ства изображений ..........................................................
4.1. Цели применения линейной фильтрация изображений ..
5
7
7
9
11
14
16
19
22
24
27
29
31
31
33
34
37
39
40
42
43
46
48
48
48
52
58
60
64
67
72
73
75
79
79
3
4.2. Апертурные искажения изображений .........................
4.3. Фильтрация цифровых изображений методом свертки
с импульсной характеристикой .................................
4.4. Фильтрация цифровых изображений в спектральной
области ................................................................
4.5. Подчеркивание световых границ на изображениях ........
4.6. Подчеркивание световых границ методом нерезкого мас+
кирования ............................................................
4.7. Другие методы подчеркивания световых границ на изо+
бражениях ............................................................
4.8. Ослабление дефектов изображения путем размытия ......
4.9. Линейная фильтрация изображений в графических
редакторах ............................................................
5. Нелинейная обработка изображений для улучшения их ка+
чества .........................................................................
5.1. Искажения воспроизведения градаций яркости ............
5.2. Коррекция искажений воспроизведения градаций яр+
кости ...................................................................
5.3. Методы увеличения контраста изображений ................
5.4. Разрежение шкалы квантования при коррекции свето+
вых характеристик .................................................
5.5. Тоновая коррекция .................................................
5.6. Гомоморфная фильтрация изображений .....................
5.7. Медианная и ранговая фильтрации изображений .........
5.8. Методы выделения контуров на изображениях .............
5.9. Методы нелинейной обработки в графических редак+
торах ...................................................................
Библиографический список .................................................
4
80
86
90
92
94
96
99
100
104
104
108
109
112
116
117
119
123
127
131
ПРЕДИСЛОВИЕ
Предлагаемое учебное пособие поможет читателю осознать, ка+
ким образом мы воспринимаем образ окружающего нас трехмерного
мира, состоящего из множества, как правило, трехмерных объек+
тов. Трехмерные изображения лежат в основе развивающихся в на+
стоящее время новых технологий – технологий виртуальной реаль+
ности. Эта область является весьма перспективной, и изучение раз+
личных аспектов представления трехмерных объектов, в том числе
их моделей, стало действительно актуальной задачей. К сожалению,
среди огромного количества изданий, посвященных изучению ком+
пьютерных технологий создания трехмерных сцен, чрезвычайно мало
книг, в которых приводились бы теоретические предпосылки реали+
зуемых в приложениях методов. Явный крен в сторону изучения при+
емов работы в ущерб пониманию происходящих процессов не способ+
ствует формированию грамотных специалистов в области мультиме+
диатехнологий. Этот пробел и предназначено восполнить в какой+то
мере данное учебное пособие.
Вопросом трехмерного представления реальных сцен, моделям
описания трехмерных и двумерных изображений посвящен первый
раздел пособия.
Во втором разделе подробно излагаются основные статистические
характеристики изображений. Знание этих характеристик, их учет
является той необходимой базой, на которой строится преобразова+
ние изображений из аналоговой формы в цифровую с минимальной
степенью внесения искажений, обусловленных таким преобразова+
нием. Эти вопросы рассмотрены в третьем разделе пособия.
В четвертом и пятом разделах пособия дано достаточно полное
описание методов цифровой обработки двумерных графических изоб+
ражений, направленных на повышение их качества. Среди них раз+
нообразные методы линейной и нелинейной фильтраций. Многие из
этих методов реализованы в таких мощных графических редакто+
рах, как, например, Photoshop. Несомненно, детальное знакомство
с теоретической базой часто используемых на практике приемов ра+
боты с изображениями будет по+настоящему и полезным, и интерес+
5
ным для всех, кто всерьез занимается созданием мультимедийных
проектов, а также исследованиями в области обработки графиче+
ских изображений.
Включенные в учебное пособие вопросы соответствуют представ+
ленному в ГОС содержанию целого ряда дисциплин образовательных
программ направления 230200 «Информационные системы»:
– дисциплины «Мультимедиатехнологии» специальности 230201
«Информационные системы и технологии»,
– дисциплины «Компьютерная обработка изображений» специ+
альности 230203 «Информационные технологии в дизайне»,
– дисциплины «Техника аудиовизуальных средств» специально+
сти 230204 «Информационные технологии в медиаиндустрии».
Все изложенное выше позволяет считать, что представленное на
рецензию пособие может быть эффективно использовано студентами
и аспирантами различных технических специальностей.
Важным преимуществом пособия является то, что авторам уда+
лось совместить необходимый уровень теоретического описания и
математизации изложения с простотой объяснения сложных поня+
тий и процессов. Благодаря этому обстоятельству пособие будет, бе+
зусловно, интересно и полезно как студентам технических специаль+
ностей и инженерно+техническим работникам, так и представителям
творческих профессий.
6
1. РЕАЛЬНЫЕ СЦЕНЫ.
ТРЕХМЕРНАЯ И ДВУМЕРНАЯ ГРАФИКА
1.1. Объекты реального мира и их свойства
Посредством зрения мы воспринимаем образ окружающего нас
мира. Этот мир трехмерный и состоит из множества, как правило,
трехмерных объектов. Каждый объект имеет оболочку (поверхность),
которая отделяет его от окружающего пространства. Оболочка каж+
дого объекта имеет присущие ей отражательные характеристики и
характеристики излучения, которые по ее поверхности могут быть
неоднородными. Для того чтобы мы могли наблюдать окружающие
нас объекты, они должны быть освещены, если только не являются
самосветящимися.
В процессе наблюдения свет от рассматриваемых объектов попа+
дает на сетчатки глаз и формирует на них изображения, которые пред+
ставляют собой центральные проекции рассматриваемых объектов.
Распределение интенсивностей для всего спектра видимого излуче+
ния по поверхностям сетчаток определяется отражательными харак+
теристиками и характеристиками излучения поверхностей объектов,
их положением относительно точки наблюдения, спектральными
характеристиками источников освещения, а также положением ис+
точников освещения относительно наблюдаемых объектов.
Поскольку положение наблюдателя, положение источников ос+
вещения и спектральные характеристики источников освещения
могут изменяться в широких пределах, то одному и тому же объекту
может соответствовать бесчисленное количество проекций на сетчат+
ках глаз.
Наиболее устойчивыми признаками объектов на изображениях,
формирующихся на сетчатках глаз, являются их контуры, посколь+
ку они представляют собой проекции их оболочек, которые не зави+
сят от условий освещения. Вот почему контурный, или силуэтный,
рисунок позволяет легко узнавать изображаемый объект.
Так как реальные объекты, составляющие сцену, четко отделены
от окружающего их пространства оболочками, то их проекции на
плоскость, т. е. изображения объектов, также должны иметь четкие
световые и цветовые границы, отделяющие их от фона, на котором
они наблюдаются. Размытие границ на реальных изображениях воз+
никает вследствие искажений, обусловленных несовершенством ис+
пользуемой аппаратуры. Поэтому любая обработка изображений,
заключающаяся в замене размытых границ резкими границами, бу+
дет восприниматься зрительной системой как улучшение качества
их воспроизведения.
7
Световые и цветовые границы изображений объектов за исключе+
нием отдельных изломов являются гладкими, поскольку в основном
гладкими являются оболочки реальных объектов.
Области изображений объектов, на которых отсутствуют их дета+
ли, как правило, имеют в среднем плавно изменяющиеся интенсив+
ности красного, зеленого и синего. Обычно это изменение обусловле+
но плавным изменением освещенности в пространстве.
На изображения объектов, как правило, наложена текстура, обус+
ловленная фактурой их поверхности. Исследования показали, что
зритель не замечает замены одной реализации текстуры другой, если
функция автокорреляции и гистограмма распределения интенсивно+
сти новой текстуры совпадают с функцией автокорреляции и гисто+
граммой распределения интенсивности прежней.
При наблюдении изображений зрительная система человека «вы+
деляет» на них семантически значимые области, представляющие
собой те или иные объекты или их части. При этом зрительная систе+
ма «из опыта знает», какими могут и должны быть фрагменты изоб+
ражения, представляющие ту или иную часть объекта. Если эти фраг+
менты отличаются от тех, какими они должны быть, это восприни+
мается как дефект изображения. Примерами таких дефектов
являются: размытие световых и цветовых границ, наличие шума в
областях с плавно изменяющейся интенсивностью красного, зелено+
го и синего, наличие посторонних узоров в виде муарового рисунка,
обусловленного шумом пространственной дискретизации, наличие
ложных контуров, обусловленных недостаточным количеством уров+
ней квантования и т. д. Как дефект воспринимается также отсут+
ствие текстуры на объектах, где она ожидается, например, на лице
человека. Такие лица выглядят кукольными.
Не все фрагменты изображения для зрительной системы человека
являются равноценными. На семантически значимых участках изоб+
ражения малейшие искажения легко замечаются, в то время как зна+
чительные искажения других семантически малозначимых участков
остаются незамеченными. Этот факт хорошо известен и использует+
ся на практике. Например, в JPEG+2000 предусмотрена поддержка
кодирования отдельных областей изображения (глаза и т. д.) с луч+
шим качеством.
Зрительная система при наблюдении трехмерной сцены формиру+
ет ее трехмерное представление в коре головного мозга. Это необхо+
димо уже хотя бы для того, чтобы мы имели возможность манипули+
ровать различными объектами, составляющими сцену, и не сталки+
ваться с ними при своем перемещении в пространстве, а также
распознавать их при наблюдении под различными ракурсами.
8
С самого начала отметим, что для формирования в зрительной
системе объемного представления объектов, составляющих сцену,
наличие бинокулярного зрения не является обязательным. Объем+
ное представление трехмерных объектов способны формировать и
люди, не имеющие возможности бинокулярно рассматривать наблю+
даемую сцену, а также многие животные и птицы, вообще лишенные
бинокулярного зрения. Поскольку при формировании объемного
представления незнакомого трехмерного объекта в зрительной сис+
теме единственным источником информации о нем являются его дву+
мерные проекции на сетчатки глаз, то для этого необходимо распола+
гать рядом таких проекций, полученных при различных ракурсах
наблюдения.
Из сказанного следует, что при наблюдении сцен, изображенных,
например, на фотографиях, на сетчатках глаз создаются проекции,
подобные тем, что создаются при непосредственном наблюдении са+
мих изображаемых сцен, благодаря чему создаваемое впечатление
близко к тому, которое имеет место при наблюдении изображаемой
натуры. На этом, собственно, и базируются такие виды искусства,
как живопись и кино.
Впечатление реальности еще больше усиливается, если зрителю
предлагают для наблюдения трехмерное изображение сцены, по+
скольку при этом у него появляется возможность рассматривать его
при различных ракурсах наблюдения, как в жизни. Трехмерные изоб+
ражения лежат в основе развивающихся в настоящее время новых
технологий – технологий виртуальной реальности.
1.2. Воксельная модель представления
трехмерных изображений
Рассмотрение методов представления трехмерных изображений
объектов начнем с так называемой воксельной модели [3]. Воксель+
ная модель разбивает весь объем трехмерного изображения на ячей+
ки – воксели, создавая трехмерный (3D) растр. Воксель – это элемент
объема (voxel – volume element). Таким образом, воксельная модель
представляет собой растровую модель для трехмерного изображения.
На рис. 1.1 приведен трехмерный растр, составленный из вокселей.
Каждый воксель в случае цветного изображения с использованием
моды RGB, характеризуется цветом, для представления которого
расходуется 24 единицы двоичного кода. Кроме того, каждый вок+
сель характеризуется прозрачностью, которая может изменяться в
пределах от нуля до единицы. Для представления прозрачности так+
же расходуется 24 единицы двоичного кода. Чем больше вокселей
содержит трехмерный растр и, следовательно, чем меньше размеры
9
l
d
h
Рис. 1.1. Трехмерный растр
самих вокселей, тем с большим разрешением представляются объек+
ты в трехмерном пространстве. Однако здесь мы встречаемся с очень
серьезной проблемой. Поскольку уменьшение размера вокселей вле+
чет за собой возрастание количества вокселей, заполняющих ото+
бражаемый объем обратно пропорционально третьей степени их ли+
нейного размера ∆, это приводит к сильному увеличению объема па+
мяти, требуемой для сохранения трехмерного изображения. В данном
случае требуемый объем памяти составит M = 48 N бит, где N – коли+
чество вокселей в изображении. Проиллюстрируем это примером.
Пусть мы имеем дело с цветным трехмерным изображением, размеры
которого равны N = 1000×1000×1000. Проводя вычисления, находим,
что требуемый объем памяти в данном случае составит M = 48 · 109
бит, т. е. 6 Гбайт! Вторым недостатком, обусловленным большим ко+
личеством данных, используемых для представления изображений
в воксельной модели, является малая скорость обработки таких изоб+
ражений.
Несмотря на отмеченные недостатки, воксельная модель в насто+
ящее время считается перспективной, поскольку имеет следующие
достоинства:
Она удобна для использования в медицине, например при скани+
ровании томографом (computer tomography), так как получающиеся
при этом изображения срезов сканируемого объекта объединяются
в трехмерное изображение для дальнейшего анализа. Воксельная мо+
дель применяется также в геологии, сейсмологии и других областях,
10
правда, пока при построении трехмерных изображений с небольшим
разрешением.
Эта модель допускает простое выполнение топологических опера+
ций над отдельными объектами, а также всей сценой. Например, для
показа разреза достаточно те воксели, которые заслоняют разрез,
сделать прозрачными.
Кроме того, ее достоинством является простота описания слож+
ных объектов и сцен.
Воксельная модель за исключением некоторых случаев является
избыточной. Так, например, если среда, окружающая сцену, прозрач+
на, то нет необходимости передавать (сохранять) все воксели сцены,
а достаточно ограничиться только теми, которые формируют поверх+
ности объектов, составляющих сцену. Такой способ представления
сцены обеспечивает большую экономию в требуемом объеме памяти.
Проиллюстрируем это примером. Предположим, трехмерный объект
представляет собой шар радиусом R. В этом случае при прочих равных
условиях количество вокселей, размещающихся в его объеме, будет
пропорционально 4πR3/3, в то время как количество вокселей, распо+
лагающихся в поверхностном слое сферы, будет пропорционально
4πR2, т. е. в R/3 раз меньше. Если учесть, что при таком методе пред+
ставления трехмерных изображений (назовем его модифицированным
воксельным) на представление пустого пространства вообще не затра+
чивается память, то выигрыш получается впечатляющим.
Дальнейшим развитием этого метода является векторная полиго+
нальная модель. Главной особенностью векторной полигональной
модели является то, что она описывает только поверхности объек+
тов, составляющих сцену.
1.3. Векторная полигональная модель представления
трехмерных изображений
Векторная полигональная модель в настоящее время находит наи+
более широкое применения для представления трехмерных изобра+
жений объектов [3]. Ее используют в системах автоматизированного
проектирования, компьютерных играх, тренажерах, системах вир+
туальной реальности и в других областях. При использовании этой
модели оболочка объекта формируется набором плоских граней –
полигонов (рис. 1.2, а). Грани оболочки могут иметь как треуголь+
ную, так и многоугольную форму. Таким образом, в памяти компью+
тера создается трехмерное изображение оболочки объекта, которое
можно представить себе как его скульптурное изображение.
Положение в пространстве и форма каждой грани однозначно опи+
сываются положением ее границ, которые задаются набором векто+
11
б)
а)
Рис. 1.2. Векторная полигональная модель представления трехмерных
изображений: а – оболочка объекта; б – полигональная сетка
ров, образующих полигональную сетку (wireframe), показанную на
рис. 1.2, б. В свою очередь положение векторов определяется поло+
жением вершин (vertex) – точек, определяющих начало и конец каж+
дого вектора. Из изложенного следует, что оболочка объекта в ко+
нечном счете описывается набором координат вершин, которые рас+
положены в точках начала и конца векторов (см. рис. 1.2, б).
Часто для описания оболочек объектов используют два массива.
В первый трехмерный массив записывают декартовы координаты всех
вершин, принадлежащих объекту. Во втором же массиве, размерность
которого равна числу вершин, формирующих грань, сохраняют ин+
дексы вершин, определяющих грани. Рис. 1.3 поясняет изложенное
для случая, когда грани имеют треугольную форму. Возможны и дру+
гие варианты.
97
5 356
64
356 1 2 3 4
1223456787 1 1223456787 2 1223456787 3 237 376
64
356
237 376
237 376
5
6
8 9
3 5
6 7
4
21
4
27
8
7
8
9
97
5 376
1
1
3
2
2
2
4
1
3
3
2
4
1
6
3
5
2
5
2
5
4
6
4
8
1
7
1
8
6
22
9
5
23
8
9
6
24
6
9
25
5
9
7
Рис. 1.3. Способ хранения данных для описания оболочек объектов
12
2
7
9
8
Размер граней оболочки определяет разрешение трехмерного изоб+
ражения, подобно тому, как размер пикселя в случае двумерного изоб+
ражения, или размер вокселя в трехмерном изображении. Чем мень+
шего размера грани (соответственно большее количество вершин)
используются для аппроксимации оболочки объекта, тем больше
будет разрешение трехмерного изображения и тем более точно будет
представлена форма объекта. Однако увеличение количества вершин
влечет за собой увеличение объема памяти, необходимого для сохра+
нения оболочки объекта.
Векторная полигональная модель позволяет по сравнению с вок+
сельной моделью более экономно описывать трехмерные изображе+
ния объектов.
Главным достоинством этой модели является то, что она описы+
вает не весь объем, занимаемый объектом, а лишь его оболочку, что
обеспечивает громадную экономию в затрате единиц двоичного кода
по сравнению с воксельной моделью, в которой описывается весь
объем. Это особенно сильно проявляется при увеличении разреше+
ния трехмерного изображения. Если в воксельной модели требуемый
при этом объем памяти растет обратно пропорционально третьей сте+
пени линейного размера элемента (вокселя), то в рассматриваем слу+
чае это возрастание будет обратно пропорционально только второй
степени линейного размера разрешаемого элемента.
Кроме того, для сокращения требуемого объема памяти вершины
по поверхности оболочки располагают неравномерно. Там где кри+
визна поверхности оболочки мала, их располагают на большем рас+
стоянии друг от друга, а там где кривизна велика, вершины помеща+
ют более тесно, как показано на рис. 1.2, б. При таком расположе+
нии вершин размеры граней на участках с большой кривизной будут
малыми, что и обеспечивает приемлемую точность представления
оболочки объекта при умеренной затрате двоичных единиц кода.
Требуемый объем памяти в рассматриваемом случае может быть
рассчитан следующим образом:
M = NV · CV + NF · CF · P,
где NV – количество вершин; CV – количество единиц двоичного кода,
используемых для записи трех координат каждой вершины; NF– ко+
личество граней; CF – количество единиц двоичного кода, использу+
емых для записи индекса одной вершины; P – количество вершин,
образующих грань. Для представления одной координаты вполне до+
статочно 4 байт (float), а для представления номера грани 2 байт
(unsigned short). Количество вершин, образующих грань, может быть
равно 3, 4, 5 или даже 6.
13
Сравнивая векторную полигональную модель с воксельной моделью
по величине затрат единиц двоичного кода на описание объекта, приве+
дем такие данные: для описания оболочки трехмерного изображения
головы человека, занимающего объем 250×250×290 вокселей, в случае
воксельной модели потребовалось 18,125 Мбайт, в то время как в слу+
чае векторной полигональной модели потребовалось всего лишь
199 Кбайт, т. е. в 91 раз меньше. Для сравнения отметим, что представ+
ление двумерного изображения этого объекта потребовало 215 Кбайт.
Помимо рассмотренной векторной полигональной модели извест+
ны также родственная ей аналитическая модель, в которой описание
поверхности задается математическими формулами, и ряд других,
которые мы здесь рассматривать не будем.
Завершая этот раздел, обратим внимание, что до сих пор речь шла
о представлении только оболочек объектов, которые, как уже отме+
чалось, можно уподобить изображению скульптур изображаемых
объектов. Реальные же объекты помимо формы (оболочки) характе+
ризуются такими свойствами, как способность отражать свет, что,
собственно, и делает их видимыми. Поэтому в дальнейшем оболочки
мы будем рассматривать как набор плоских граней, которые отража+
ют, рассеивают, поглощают и пропускают, преломляя свет.
1.4. Модель освещения
Отражение света от плоской поверхности – в рассматриваемом
случае от грани оболочки – происходит в соответствии с хорошо из+
вестным законом отражения, который гласит, что:
– падающий и отраженный лучи света, а также нормаль к отража+
ющей поверхности лежат в одной плоскости;
– угол между падающим лучом и нормалью равен углу θ между
нормалью и отраженным лучом (рис. 1.4);
Рис. 1.4. Зеркальное отражение света
14
– кроме того, интенсивность падающего I и отраженного Is лучей
одинаковы, т. е. при идеальном отражении не происходит потерь энер+
гии. Этот закон выполняется для идеально зеркальной поверхности.
Такая поверхность не имеет собственного цвета. Если же отражаю+
щая поверхность не идеальна, то интенсивность отраженного луча
может быть рассчитана по эмпирической формуле Фонга:
Is = IK s cospα,
где Ks – коэффициент пропорциональности (0 < Ks < 1); p – показа+
тель степени, который лежит в пределах от 1 до 200.
Если поверхность шероховатая (матовая), имеет место диффуз+
ное отражение. При диффузном отражении луч рассеивается равно+
мерно во все стороны. Диффузное отражение описывается законом
Ламберта
Id = IKdcosθ,
где I – по+прежнему интенсивность падающего луча; Id – интенсив+
ность отраженного луча; Kd – коэффициент, учитывающий свойства
материала отражающей поверхности (0< Kd <1), θ – угол между нор+
малью и падающим лучом (рис. 1.5).
В случае диффузного отражения отражающая поверхность имеет
свой собственный цвет, т. е. коэффициент Kd зависит от длины вол+
ны. При этом наблюдаемый цвет диффузно отражающей поверхнос+
ти определяется как цветом источника освещения, так и цветом са+
мой поверхности.
Поскольку поверхности реальных непрозрачных объектов не яв+
ляются ни идеально зеркальными, ни идеально матовыми, то интен+
a1
I
II
a2
Рис. 1.5. Диффузное отражение
света
Рис. 1.6. Преломление свето
вого луча
15
сивность лучей, отраженных от таких поверхностей, можно рассчи+
тать по формуле
Iотр = I(Kdcosq + Kscospa).
(1.1)
Учитывая, что в реальных случаях всегда имеет место подсветка
объекта светом, отраженным от других объектов, то для расчетов
интенсивности отраженных лучей Iотр применяют формулу, учиты+
вающую это обстоятельство, а именно:
Iотр = Iа Kа +
(
I Kd cos θ + Ks cos p α
)
(1.2)
,
R +k
где Ia – интенсивность рассеянного света; Ka – константа; R – рассто+
яние от центра проекции до поверхности; k – константа.
В случае, когда объект является прозрачным, необходимо учиты+
вать закон преломления. Согласно закону преломления:
– падающий и преломленный лучи света, а также нормаль к отра+
жающей поверхности лежат в одной плоскости;
– для углов падения и преломления выполняется следующее соот+
ношение:
n1sinα1 = n2sinα2,
где n1 и n2 – абсолютные показатели преломления первой и второй сред
соответственно, а α1 и α2 – углы падения и преломления (рис. 1.6).
1.5. Определение нормали к поверхности и вектора отражения
Как было показано в подразд. 1.4, для того чтобы определить ин+
тенсивность света, отражаемого освещаемой поверхностью, необхо+
димо знать косинус угла. заключенного между нормалью N к этой
поверхности и источником освещения, а также косинус угла между
направлением зеркального отражения света, падающего на поверх+
ность от источника, и линией наблюдения. В случае полигональной
модели изображения отражающими поверхностями будут ее грани.
Найдем интенсивность света, исходящего от одной из граней (рис. 1.7),
и рассмотрим случай, когда грань освещается параллельным пучком
света, т. е. от удаленного источника.
Сначала определим вектор нормали к грани. В целях упрощения
решения задачи выполним это следующим образом. Введем новую
систему координат x′ , y′ , z′ , которая отличается от прежней x, y, z
лишь тем, что ее начало совмещено с одной из вершин рассматривае+
мой грани, обозначенной на рис. 1.7 цифрой 1, при этом направление
координатных осей в обеих системах одинаково. В новой системе ко+
ординат вектор нормали будет исходить из ее начала. Как известно,
координаты вектора нормали могут быть найдены путем вычисле+
16
z
N = AB
S
z
1
aaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaa
A
aaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaa2
aaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaa
B
aaaaaaaaaaaaaaaaaaaa
yaaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaa
x
3
x
y
Рис. 1.7. Определение интенсивности света, отражаемого гранью
ния векторного произведения любых двух векторов, лежащих в плос+
кости рассматриваемой грани. В качестве таких векторов можно ис+
пользовать любые два ребра грани, например ребра 1–2 и 1–3. Назо+
вем ребро 1–2 вектором A, а ребро 1–3 вектором B, как показано на
рис. 1.7. Выражая координаты вектора нормали N через координаты
вершин грани в старой системе координат, имеем:
x′N = (y2 – y1) (z3 – z1) – (z2 – z1) (y3 – y1),
y′N = (z2 – z1) (x3 – x1) – (x2 – x1) (z3 – z1),
′ = (x2 – x1) (y3 – y1) – (y2 – y1) (x3 – x1).
zN
В том случае, если грань не треугольная, а, например, четыреху+
гольная, расчет нормали можно выполнять по любым трем верши+
нам грани.
Найдем косинус угла, заключенного между нормалью N к грани и
вектором, направленным на источник света S. Как известно, ска+
лярное произведение двух векторов S и N равно
SN = |S||N|cosθ,
(1.3)
где |S| и |N| – длины векторов S и N соответственно. Кроме того, изве+
стно, что
SN = xSxN + ySyN + zSzN,
(1.4)
17
где xS, yS, zS и xN, yN, zN – компоненты векторов S и N соответствен+
но. Решая совместно выражения (1.3) и (1.4), находим
cos θ =
xSxN + yS yN + zSzN
.
SN
Для упрощения вычислений вектор S целесообразно взять еди+
ничной длины.
Найдем косинус угла, заключенного между вектором отражен
ного луча и вектором, направленным на наблюдателя. Рассмотрим
единичные векторы R1, S1 и N1. Так как вектор нормали к грани, а
также векторы впадающего и отраженного лучей лежат в одной плос+
кости, то
R1 + S1 = N′,
где N′ – вектор, представляющий собой диагональ ромба, показанно+
го на рис. 1.8, который по направлению совпадает с нормалью. При
этом, как нетрудно видеть из рисунка:
N′ = N12 cosθ,
èëè
R1 + S1 = N12 cosθ.
Из выражения следует, что
N
S
2cos θ − .
N
S
R1 = N12cos θ − S1 =
Значение cosθ, как и ранее, найдем из скалярного произведения
cos θ =
NS
.
NS
Делая подстановку найденного значения cosθ в выражение для
R1, получим
R1 = 2N
NS
2
N S
−
S
.
S
Считая, что при отражении луча не происходит его ослабления, а
следовательно, R = R1 S , запишем
R = 2N
18
NS
N
2
− S,
Рис. 1.8. Определение косинуса угла между вектором отраженного луча
и вектором, направленным на наблюдателя
при этом для компонентов вектора R будем иметь
xR = 2xN
xN xS + yN yS + zN zS
− xS ,
2
2
2
xN
+ yN
+ zN
yR = 2yN
xN xS + yN yS + zN zS
− yS,
2
2
2
+ yN
+ zN
xN
zR = 2xN
xN xS + yN yS + zN zS
− zS.
2
2
2
xN
+ yN
+ zN
Косинус угла, заключенного между вектором отраженного луча и
вектором, направленным на наблюдателя, найдем, используя ска+
лярное произведение вектора отраженного луча R и вектора, направ+
ленного на наблюдателя K:
cos α =
xK xR + yK yR + zK zR
KR
.
=
2
2
2
K R
xK + yK
+ zK
xR2 + yR2 + zR2
Для упрощения вычислений векторы S, N и K целесообразно брать
единичной длины.
1.6. Методы закраски граней
После того как найдены косинусы углов, определяющих взаим+
ные положения нормали к плоскости грани, источника освещения и
19
наблюдателя, можно вычислить интенсивность лучей, отраженных
от каждой из граней по формуле (1.4). Однако непосредственное при+
менение описанной методики расчета приводит к тому, что на изоб+
ражении оказываются легко различимыми грани отображаемых
объектов. Этот эффект демонстрируется рис. 1.9, а и г, на которых
изображены сфера и цилиндр. Для получения иллюзии гладкой по+
верхности, количество граней векторной полигональной модели дол+
жно быть сильно увеличено, однако это влечет за собой увеличение
требуемого объема памяти и замедление скорости рисования объек+
та. Эта проблема решается посредством использования метода Гуро.
Метод Гуро состоит в том, что каждая плоская грань объекта
закрашивается плавно изменяющимся цветом, который определя+
ется путем интерполяции цветов примыкающих граней (рис. 1.10).
В соответствии с этим методом закрашивание грани выполняется в
четыре этапа. Вначале вычисляются нормали к каждой грани. Затем
находятся нормали в каждой вершине N путем усреднения норма+
лей, примыкающих к вершине граней. В случае треугольных граней
это нормали N1, N2 и N3:
N = (N1 + N2 + N3)/3.
Используя найденные таким образом нормали в вершинах и фор+
мулу (1.2), находят значения интенсивностей в вершинах.
а)
б)
в)
г)
д)
е)
Рис. 1.9. Иллюстрация к методам закраски граней на примерах сферы и
цилиндра: а – сфера с «примитивной» закраской; б – сфера с
закрашиванием граней по методу Гуро; в – сфера с закрашива
нием граней по методу Фонга; г – цилиндр с «примитивной»
закраской; д – цилиндр с закрашиванием граней по методу Гуро;
е – цилиндр с закрашиванием граней по методу Фонга
20
Заключительным этапом метода является закраска граней путем
линейной интерполяции значений интенсивностей в вершинах.
Недостатки метода Гуро проявляются при имитации криволиней+
ных зеркальных поверхностей, перпендикулярных линии наблюде+
ния, что хорошо заметно на рис. 1.9, б и д, на которых, особенно на
рис. 1.9, б, отсутствует световой блик, обусловленный отражением.
Для объяснения причин, обусловивших этот недостаток, обратимся
к рис. 1.11, на котором изображена полигональная модель цилинд+
ра, освещаемого из точки, расположенной позади наблюдателя. На
этом рисунке закраской выделена грань, которая ориентирована пер+
пендикулярно к линии наблюдения. Поскольку источник света рас+
положен на линии наблюдения и согласно законам оптики угол па+
дения равен углу отражения, на изображении этой грани должен при+
сутствовать блик, но он отсутствует. Обусловлено это самим
принципом, положенным в основу метода Гуро. Действительно, по+
скольку косинусы углов между нормалями Nа, Nб, Nв, Nг и векто+
ром, направленным на источник света, равны в силу очевидной сим+
метрии, значения интенсивностей отраженных лучей в вершинах
также будут равны между собой. Из этого следует, что в результате
интерполяции найденные значения интенсивностей отраженных лу+
чей будут равны между собой и на ребрах, а, следовательно, грань
будет закрашена одним тоном. От этого недостатка свободен метод
Фонга.
Метод Фонга отличается от метода Гуро тем, что для определе+
ния интенсивности отраженных лучей света в каждой точке грани
интерполируются не интенсивности отраженного света, а векторы
нормалей. Согласно алгоритму вначале, как и в случае метода Гуро,
N1
N
N2
N0
N1
N2
N3
N3
Рис. 1.10. Закрашивание по ме
тоду Гуро
Рис. 1.11. К пояснению недостатка
закрашивания, свойствен
ного методу Гуро
21
определяют нормали к каждой грани полигональной модели объек+
та. Затем находят нормали в каждой вершине N модели путем усред+
нения нормалей, примыкающих к вершине граней. Далее, в каждой
точке закрашиваемой грани также путем линейной интерполяции
находят интерполированный вектор нормали. И, наконец, по направ+
лению векторов полученных таким образом нормалей определяется
интенсивность отраженных лучей света по формуле (1.2). Этот метод
более сложен и для своей реализации требует больше вычислитель+
ных операций, чем метод Гуро, однако он дает лучшие результаты,
что следует из рассмотрения рис. 1.9, в и е.
1.7. Трассировка лучей
В предыдущих подразделах рассматривались случаи, когда имел+
ся один объект, который освещался одним источником света, созда+
ющим поток параллельных лучей. Однако в реальности все обстоит
намного сложнее. Как правило, отображаемая сцена включает в себя
множество объектов, обладающих различными оптическими свой+
ствами, и она освещается несколькими источниками света, имею+
щими различные спектральные характеристики. Кроме того, объек+
ты освещаются не только источниками света (их называют первич+
ными), но также и светом, отраженным от других объектов,
интенсивность и спектральный состав которого будет также зави+
сеть от отражающих свойств этих объектов. В этом случае использу+
ют два метода: метод прямой трассировки лучей и метод обратной
трассировки лучей.
Метод прямой трассировки лучей заключается в прослеживании
(трассировке) лучей, исходящих от первичных источников света.
Часть из них, не встречая на своем пути объекты, покидают сцену и
по этой причине из дальнейшего рассмотрения исключаются. Другая
часть лучей встречает на своем пути объекты, от которых зеркально
или диффузно отражается или преломляется, образуя вторичные
лучи. Некоторые из вторичных лучей попадают в глаз наблюдателя,
другие, не встретив на своем пути объекты, покидают сцену и долж+
ны быть исключены из дальнейшего рассмотрения, а некоторые,
встретив на своем пути объекты, зеркально или диффузно отражают+
ся от них или преломляются, порождая новое поколение лучей. Ал+
горитм построения изображения рассматриваемым методом сводит+
ся к перебору всех лучей с целью отбора только лучей, попадающих в
глаз наблюдателя. Недостатком этого метода является большое ко+
личество вычислительных операций, связанных с расчетом лучей,
которые в дальнейшем не используются. В связи с этим был разрабо+
тан альтернативный метод – метод обратной трассировки лучей.
22
Метод обратной трассировки лучей заключается в прослежива+
нии (трассировке) лучей, исходящих не от источников света, а в об+
ратном направлении – от точки наблюдения. При таком подходе
к решению проблемы в расчет принимаются только те лучи, которые
влияют на формирование изображения, поэтому этот метод позволя+
ет существенно сократить перебор лучей и, как следствие, количе+
ство вычислительных операций, связанных с их расчетом. При этом
методе прослеживают только те лучи, которые, исходя из точки на+
блюдения, попадают на объекты (в этом случае их называют первич+
ными лучами). Все другие лучи с самого начала исключаются из рас+
смотрения. Поскольку на объектах лучи поглощаются, зеркально
или диффузно отражаются или же преломляются, то находят так
называемые вторичные лучи, которые могли породить первичные
лучи, исходящие из точки наблюдения. Другими словами, задача
состоит в том, чтобы найти лучи, которые, попав на поверхность
объекта, породили лучи, попадающие в точку наблюдения. Затем
процесс повторяют путем прослеживания (трассировки) только тех
вторичных лучей, которые в свою очередь при распространении по+
падут на объекты. Процесс завершают, когда трассируемые лучи до+
стигнут источников света.
Поскольку законы геометрической оптики носят «симметричный»
характер, то при реализации метода обратной трассировки лучей ка+
ких+либо проблем с этой стороны не возникает. Проблемы техничес+
кого характера возникают, когда трассируемый луч попадает на диф+
фузно отражающую поверхность, которая одинаково отражает во
всех направлениях. В этом случае источником первичного луча мо+
жет быть любой луч, пришедший от любого объекта, видимого из
данной точки, что приводит к необходимости выполнять большое
количество вычислительных операций.
При практической реализации метода обратной трассировки лу+
чей вводят ряд ограничений, которые позволяют уменьшить количе+
ство вычислительных операций, например:
– ограничивают количество итераций, после которых трассиров+
ка завершается;
– отражающие поверхности описывают суммой двух компонент –
диффузной и отражающей;
– при диффузном отражении учитывают только лучи от источни+
ков света.
Кроме того, учитывают, что источники света могут только излу+
чать свет, но не могут его отражать или преломлять, а также некото+
рые другие ограничения.
23
1.8. Двумерная растровая модель изображения сцен
и составляющих их объектов
Двумерное изображение представляет собой обычно центральную
проекцию трехмерной сцены на какую+либо поверхность – обычно на
плоскость. Особенность центральной проекции, как известно, состо+
ит в том, что:
– прямые линии отображаются прямыми линиями;
– параллельные линии изображаются сходящимися в одной точке;
– не сохраняется отношение длин и площадей.
В компьютерной графике используют растровую и векторную мо+
дели двумерного изображения. В основе растровой модели лежит
растр – матрица пикселей, которые представляют интенсивность со+
ответствующих участков изображения. В качестве поясняющего при+
мера на рис. 1.12 приведен фрагмент растрового изображения с орто+
гональным расположением пикселей, линейные размеры которых
в обоих направлениях одинаковы. Помимо растра с ортогональным
расположением пикселей возможны и другие растры, например растр
с шахматным расположением пикселей, растр с гексагональным рас+
положением пикселей, однако они применяются редко.
Растровое изображение характеризуется разрешением, которое
определяется количеством пикселей на единицу длины. Чем больше
пикселей приходится на единицу длины, тем выше разрешение и тем
более мелкие детали могут быть воспроизведены на изображении.
Для того чтобы изображение можно было обрабатывать посредством
компьютера, его представляют в цифровой форме. В случае полуто+
нового черно+белого, т. е. не цветного изображения, это означает,
что интенсивность (яркость) каждого пикселя представляется чис+
лом, которое обычно лежит в пределах от 0 до 255. Другими слова+
ми, полутоновое черно+белое изображение представляется в виде дву+
мерной матрицы, состоящей из 8+разрядных двоичных чисел. Для
представления цветного изображения в цифровой форме используют
уже три матрицы, каждая из которых состоит из 8+разрядных двоич+
ных чисел. При этом элементы каждой из этих матриц представляют
Рис. 1.12. Пример растрового изображения
24
интенсивности красного, зеленого и синего компонентов пикселя,
поскольку цвет каждого из пикселей растра синтезируется путем сме+
шения красного, зеленого и синего цветов, как в палитре художника.
При выборе разрешения изображения исходят из того, что зрителю
изображение должно казаться непрерывным, т. е. зритель не видит на
изображении растровую структуру. С этой целью количество пиксе+
лей на единицу длины в изображении выбирают исходя из остроты
(разрешающей способности) зрения. Известно, что при наблюдении
двух объектов, угловое расстояние между которыми меньше одной уг+
ловой минуты, они сливаются в один объект. Из этого следует, что для
отсутствия заметности растровой структуры угловое расстояние меж+
ду формирующими ее пикселями β должно быть меньше, или, в край+
нем случае, равняться одной угловой минуте. Рис. 1.13, на котором
приведено растровое изображение, поясняет изложенное. Поскольку
угол β зависит от расстояния наблюдения, линейное расстояние меж+
ду центрами пикселей ∆ (шаг пространственной дискретизации изоб+
ражений) также зависит от этого угла. Записывая очевидное геомет+
рическое соотношение ∆/L = tgβ, имеем ∆ = Ltgβ, при этом общее число
пикселей N, составляющих растр, будет равно N = hl/ ∆2, что после
подстановки значения ∆ дает N = hl/(Ltgβ)2. Поскольку tg от одной
минуты равен 2,909·10–4, получим окончательно
N=
11818799hl
,
L2
(1.5)
l
D
b
0
h
L
Рис. 1.13. Выбор разрешения изображения
25
а число строк z в изображении, как нетрудно видеть, будет равно
3437,8l
.
L
Из выражения (1.5) следует, что минимально необходимое коли+
чество пикселей, составляющих растр изображения, определяется
не только его размером, но также в сильной степени условиями на+
блюдения изображения, т. е. расстоянием, с которого ведется наблю+
дение. В телевидении расстояние наблюдения принимается равным
L ≅ 5l. Учитывая, что согласно телевизионному стандарту отноше+
ние ширины изображения к его высоте l/h принято близким 4/3, чис+
ло строк в телевизионном изображении в соответствии с приведен+
ными расчетами должно быть z ≅ 600, что практически совпадает
с принятым по стандарту значением 625.
Количество растровых элементов в изображении наряду с разряд+
ностью двоичного кода, посредством которого представляется яр+
кость (в случае цветного изображения интенсивности красного, зе+
леного и синего цветов), определяет необходимый объем памяти для
хранения изображения. В случае черно+белого полутонового изобра+
жения (grayscale) необходимый объем памяти равен M = 8N бит,
в случае цветного изображения с использованием моды RGB (True+
Color) необходимый объем памяти составит уже M = 24N бит. Так,
например, для того чтобы сохранить цветное RGB+изображение раз+
мером 1000×1000 пикселей, потребуется 3 Мбайта памяти [1].
На рис. 1.14, а и б для сравнения приведены соответственно дву+
мерная растровая и воксельная модели, причем линейные размеры
z=
l
а)
l
h
d
б)
h
Рис. 1.14. Сравнение 2D и 3Dмоделей: а – двумерная растровая модель;
б – трехмерная воксельная модель
26
пикселей в двумерной модели и вокселей в трехмерной модели для
всех направлений взяты одинаковыми. Каждый воксель, так же как
и каждый пиксель в двумерной растровой модели, в случае цветного
изображения с использованием моды RGB характеризуется цветом,
для представления которого расходуется 24 единицы двоичного кода,
и, кроме того, прозрачностью, на которую также расходуется 24 еди+
ницы двоичного кода.
1.9. Векторная модель представления
двумерных изображений
В отличие от растровых изображений, основой которых являются
пиксели, основой векторных изображений являются контуры, пред+
ставляемые кривыми, называемыми векторами [2]. Каждый контур
векторного изображения представляет собой отдельный объект, ко+
торый можно независимо от других редактировать. В соответствии
с этим векторную графику также иногда называют объектноориен
тированной графикой. Файлы векторных изображений содержат
набор инструкций, основой которых являются формулы, по кото+
рым строятся контуры. Благодаря тому что форма контуров задается
этими инструкциями, точность воспроизведения векторного изобра+
жения, его четкость, определяется только разрешающей способнос+
тью воспроизводящего устройства (принтера, экрана дисплея и т. д.).
По этой причине оно может быть неограниченно увеличено без поте+
ри качества, в то время как в случае увеличения растровых изобра+
жений мы встречаемся с серьезными проблемами. Другим достоин+
ством векторных изображений является компактность их хранения.
Действительно, для того чтобы сохранить изображение отрезка пря+
мой линии в векторном формате, необходимо сохранить координа+
ты, определяющие его начало и конец, а также данные о цвете и тол+
щине. Для этого потребуется всего несколько байтов. В то же время
для хранения изображения того же отрезка в растровом режиме по+
требуется значительно больший объем информации, поскольку при
этом необходимо хранить цвет каждого из множества пикселей, со+
ставляющих отрезок. Отсюда следует, что векторный формат, как
правило, более компактен, чем растровый, хотя байтовый размер век+
торного изображения в случае сложных рисунков может превышать
байтовый размер этих же рисунков в растровом формате. Векторное
изображение легко экспортируется в растровый формат, но не наобо+
рот. Вместе с тем векторная графика не пригодна для хранения полу+
тоновых изображений, например фотографий.
Векторное изображение состоит из объектов. Каждый объект со+
стоит из одного или нескольких контуров. Контуры могут быть зам+
27
кнутыми или открытыми, т. е. незамкнутыми. Примером замкнуто+
го контура является окружность, примером открытого – отрезок ли+
нии. Закрытые контуры имеют свойство быть заполненными залив+
кой. В свою очередь каждый контур, в зависимости от сложности,
состоит из одного или нескольких сегментов, представляющих со+
бой отрезки прямых или кривых линий, заканчивающихся узлами
(опорными точками). Узлы определяют положение сегмента в кон+
туре. На рис. 1.15 показаны перечисленные выше элементы вектор+
ного изображения.
Рассмотрим кратко математические основы векторной графики.
В векторной графике точке соответствует узел.
Для описания отрезка прямой линии в векторной графике исполь+
зуют уравнение
y = ax + b,
где x и y декартовы координаты, а a и b – постоянные коэффициенты.
Кроме того, начало и конец отрезка задаются координатами x1 и x2.
Для описания кривых второго порядка: окружностей, эллипсов,
парабол и гипербол используют кривые второго порядка
x2 + a1y2 + a2xy + a3x + a4y + a5 = 0,
где a1, a2, a3, a4 и a5 – постоянные коэффициенты. Поскольку сег+
мент представляет отрезок линии, в данном случае кривой, то необ+
ходимо задать координаты, определяющие его начало и конец, на+
пример x1 и x2. Эти кривые в векторной графике используют для по+
строения базовых примитивов, в частности эллипсов и окружно+
Рис. 1.15. Векторное изображение
28
стей. Особенностью этих кривых является то, что они не имеют то+
чек перегиба.
В отличие от кривых второго порядка, кривые третьего порядка
могут иметь точки перегиба, что дает возможность их использовать
для представления в векторной форме различных природных объек+
тов. Уравнение, применяемое для описания кривых третьего поряд+
ка, имеет вид
x3 + a1y3 + a2x2y + a3x y2 + a4 x2 + a5y2 + a6xy + a7x + a8y + a9 = 0,
где a1, a2, a3, a4, a5, a6, a7, a8 и a9 – постоянные коэффициенты. По+
скольку сегмент представляет отрезок линии, то необходимо, так же
как и ранее, задать координаты, определяющие его начало и конец –
x1 и x2.
Широкое применение в векторной графике получили кривые Бе
зье третьего порядка. Особенностью этих кривых является то, что
они позволяют удобно регулировать не только положение узлов на
плоскости изображения, но также величины первой производной
линии (угла наклона) и ее второй производной (кривизну) в этих точ+
ках. Это, в частности, дает возможность соединять отдельные сег+
менты без изломов в точках соединения и тем самым аппроксимиро+
вать отрезками кривых Безье контуры любой сложности [2].
1.10. Динамические изображения
Для создания ощущения движения объекта необязательно, что+
бы его проекция на сетчатку непрерывно смещалась. Это ощущение
не нарушается и в том случае, если на сетчатку глаза проецировать
ряд быстро сменяющих друг друга изображений объекта, на которых
представлены последовательные фазы его движения. Именно это
свойство зрения используется для создания иллюзии движения
в кино, телевидении и компьютерном видео. Для того чтобы движе+
ние воспринималось плавным, частота смены изображений с различ+
ными фазами движения должна быть достаточно большой, иначе дви+
жения будут казаться прерывистыми. Чем больше яркость экрана,
тем выше эта частота (частота кадров). При используемых яркостях
экрана компьютерного дисплея она не превышает 60–70 Гц, при яр+
костях экрана, применяемых в кино, – существенно ниже. Это на+
кладывает определенные ограничения на допустимое значение вели+
чины угловых перемещений изображений объектов, т. е. перемеще+
ний в направлении линии наблюдения. При нарушении этих ограни+
чений движения воспринимаются как прерывистые. Эффект преры+
вистости движения хорошо заметен, например, при панорамной
съемке опушки хвойного леса, когда на изображении имеется много
29
вертикальных стволов, а панорамирование происходит достаточно
быстро.
Недостаточно высокая частота кадров приводит также к другому
неприятному явлению – мельканию наблюдаемого изображения.
Критическая частота мельканий fкр, как показали исследования,
зависит от угловых размеров мелькающего поля наблюдаемого и его
средней яркости L. Для угловых размеров мелькающего поля, в дан+
ном случае угловых размеров экрана, на котором демонстрируется
движущееся изображение, эта зависимость описывается следующей
эмпирической формулой:
fкр = 10lgL + 30.
При проектировании устройств воспроизведения изображений,
например дисплеев, знание этой величины очень важно, так как на ее
основании определяется частота смены кадров. Так, при используе+
мых яркостях экранов компьютерных дисплеев fкр ≈ 60 Гц, поэтому
частота кадров в них выбирается выше этого значения.
При частотах мелькания, превышающих критическую частоту,
мелькания незаметны, и яркость мелькающего поля L(t) кажется
неизменной и пропорциональной своему среднему значению:
T
Lср =
1
L ( t ) dt,
T0
∫
где T = 1/f – период мелькания. Эта формула представляет собой за+
кон Тальбота.
30
2. ДВУМЕРНЫЕ ИЗОБРАЖЕНИЯ И ИХ СТАТИСТИЧЕСКИЕ
ХАРАКТЕРИСТИКИ
2.1. Классификация изображений
Неподвижное ахроматическое изображение представляет собой
функцию, описывающую распределение яркости Lc на плоскости, т. е.
Lc(x,y), где x и y – декартовы координаты. Для представления ахро+
матического движущегося изображения в написанное выражение до+
бавляется еще одна независимая переменная – время t, а запись при+
нимает вид Lc(x,y,t). Цветные изображения натурных сцен в качестве
независимых переменных будут содержать еще и длину волны свето+
вого излучения λ. В этом случае для цветного неподвижного изобра+
жения будем иметь Lc(x,y,λ), а для движущегося – Lc(x,y,t,λ), где Lc
следует рассматривать как интенсивность излучения на длине волны
λ, в точке с координатами x и y, в момент времени t.
Современная техника передачи, консервации и демонстрации изоб+
ражений основана на их представлении в виде ряда компонентов.
Так, например, цветное изображение, предназначенное для вывода
на экран телевизора или на экран монитора компьютера, представ+
ляется в виде трех цветоделенных изображений: красного, зеленого
и синего. В полиграфии по ряду причин число цветоделенных изобра+
жений берется большим. Аналогичным образом обстоит дело с дви+
жущимися изображениями, которые, как уже было отмечено, пред+
ставляются последовательностью неподвижных, быстро сменяющих
друг друга изображений, на каждом из которых зафиксирована соот+
ветствующая фаза движения.
Последовательность неподвижных цветоделенных изображений,
которой представляются реальные цветные движущиеся изображе+
ния, в общем случае, обладает одной замечательной особенностью –
все они описываются очень похожими характеристиками. Эта осо+
бенность позволяет в дальнейшем сосредоточиться на рассмотрении
свойств и методов обработки неподвижных ахроматических изобра+
жений и лишь в необходимых случаях выходить за эти рамки.
Изображения принято разделять на два класса: семантические,
т. е. смысловые, и текстурные, примеры которых приведены на рис. 2.1
и 2.2. В процессе эволюции зрительная система человека приспособи+
лась обнаруживать, опознавать и классифицировать не любые произ+
вольные распределения яркости, спроецированные зрачком на сетчат+
ку глаза, а лишь те, которые создаются объектами внешнего мира.
В этом легко убедиться, если попытаться обнаружить шумовой узор
(«шумовой объект»), показанный на рис. 2.2, б на фоне шумового поля,
31
Рис 2.1. Семантическое изображение
а)
б)
Рис. 2.2. Текстурное изображение: а – шумовое поле; б – шумовой объект
32
которое приведено на рис. 2.2, а. Зрительно эта задача решается с
трудом, путем поэлементного сравнения обоих изображений, тогда
как на рис. 2.1 любой объект можно найти легко и быстро. Отмечен+
ная особенность зрения используется в природе для целей камуфля+
жа. Так, например, неправильной формы полосы на шкуре тигра де+
лают его плохо различимым в зарослях.
Важной особенностью изображений реальных объектов является
то, что они состоят из областей, разделенных более или менее резки+
ми световыми границами, внутри которых яркость и цвет изменя+
ются сравнительно медленно.
Эти световые границы (контуры) передают форму объекта и явля+
ются основой для его опознавания. Из опыта известно, что информа+
ции, содержащейся в контурах, как правило, вполне достаточно для
безошибочного узнавания объекта. Так, например, мы легко узнаем
лицо знакомого человека по контурному рисунку.
Вместе с тем при решении ряда задач прикладного характера при+
ходится иметь дело с различением текстурных полей на изображе+
нии. В последнее время много внимания уделяется анализу изобра+
жений, полученных при дистанционном зондировании Земли, где
вопрос различения текстур занимает ведущее место. Решается эта
задача посредством применения компьютерных технологий.
2.2. Пример модели изображений
При обработке изображений в зависимости от решаемой задачи
используют различные модели изображений. Под моделью изобра+
жения понимается комплекс характеристик, описывающих распре+
деление яркости на плоскости, которыми аппроксимируется рассмат+
риваемый класс изображений. Модель должна удовлетворять проти+
воречивым требованиям достаточной близости к реальным изобра+
жениям и простоты теоретического анализа. При выборе модели су+
щественное значение имеет также степень общности результатов,
которые могут быть получены при ее использовании. В зависимости
от конкретной задачи используют ту или иную модель изображения.
В качестве примера приведем одну из моделей, применяемую при син+
тезе алгоритмов нелинейной обработки изображений:
Lс ( x, y ) = kE ( x, y ) rс ( x, y ),
где rc(x,y) – коэффициент отражения различных участков сцены, со+
ответствующих ее проекции на светочувствительную поверхность
датчика сигнала изображения с координатами x,y; E(x,y) – освещен+
ность различных участков сцены, соответствующих ее проекции на
33
светочувствительную поверхность датчика сигнала изображения
с координатами x,y; k – коэффициент, согласующий размерности.
Важными свойствами функции rc(x,y) и E(x,y) являются следую+
щие.
Коэффициент отражения rc(x,y) – это функция, характеризующа+
яся наличием резких скачков, возникающих на контурах, в то время
как E(x,y) представляет собой в основном очень медленно изменяю+
щуюся функцию координат x,y. Благодаря этому спектр rc(x,y) яв+
ляется широкополосным, а спектр функции E(x,y) узкополосным,
что используется, например, в целях «улучшения» качества изобра+
жения при его гомоморфной фильтрации.
Другим важным свойством функций rc(x,y) и E(x,y) является их
положительность, что обеспечивает положительность Lc(x,y). Свой+
ство положительности Lc(x,y) накладывает сильные ограничения на
выбор возможных алгоритмов обработки, поскольку результат об+
работки – обработанное изображение – также должен быть положи+
тельной функцией, так как отрицательные значения яркости физи+
чески не реализуемы. В дальнейшем мы познакомимся с другими мо+
делями изображений.
Хорошая модель изображения является надежной основой синте+
за эффективных алгоритмов обработки изображений, и, наоборот,
неудачные модели часто оказывались причиной неудач при разработ+
ке алгоритмов обработки изображений.
2.3. Гистограмма распределения яркостей в изображении
Гистограммы распределения яркостей в цифровых изображениях
широко применяются при их фотографировании цифровыми фото+
аппаратами и последующей обработке. Понятие гистограммы проще
всего пояснить на примере полутонового черно+белого изображения.
В этом случае под гистограммой понимается график, представляю+
щий зависимость вероятности p события, заключающегося в том,
что яркость пикселя, выбранного случайным образом на изображе+
нии, попадет в интервал значений от L до L + ∆L, где ∆L – заданное
приращение яркости (рис. 2.3).
Сумма вероятностей p, взятых по всем значениям L, равна едини+
це, поскольку она представляет вероятность всех возможных собы+
тий. В случае цветных изображений применяют также гистограммы
распределения интенсивностей в каждой из трех компонент изобра+
жения R, G, B (красной, зеленой и синей). Экспериментально было
найдено, что гистограммы яркостей аналоговых изображений, не
подвергнутых нелинейной обработке, имеют максимум в области чер+
ного, подобно тому, как это показано на рис. 2.3 [1]. Аналогичные
34
p
0
L
Рис. 2.3. Гистограмма изображения, в котором преобладают малые зна
чения яркости
результаты, но значительно позднее, были получены и опубликова+
ны Стокхемом. Другими словами, распределение яркости по уров+
ням в изображении существенно не равномерно. Наиболее вероятны
малые уровни яркости в изображении и менее вероятны – большие.
Однако благодаря тому, что характеристика восприятия яркости
человеком имеет вид насыщающейся зависимости, плотность ве
роятности визуально воспринимаемой яркости оказывается близ
кой к равномерной.
Однако этого нельзя сказать об изображениях, представляемых
в цифровой форме. Объясняется это тем, что обычно динамический
диапазон интенсивностей цифровых изображений ограничен 256
уровнями квантования, и для того чтобы в этом динамическом диа+
пазоне разместить изображение, имеющее изначально существенно
больший динамический диапазон, его приходится подвергать нели+
нейной обработке. В результате этой обработки динамический диа+
пазон изображения уменьшают и буквально «втискивают» в интер+
вал, ограниченный 256 уровнями квантования, но при этом гисто+
грамма распределения яркостей сильно изменяется. По этой причи+
не гистограммы распределения яркостей в изображениях, введенных
в компьютер, далеки от вида, приведенного на рис. 2.3. К счастью,
наша зрительная система этого практически не замечает.
Вид гистограммы много говорит о тоновых характеристиках изоб+
ражения.
Если основная площадь гистограммы сосредоточена в области
малых значений яркости (интенсивности), то изображение темное,
что может быть по двум причинам. Первая причина состоит в том,
что преобладание темных тонов обусловлено самим сюжетом, напри+
мер на изображении представлен вид вечернего города с отдельными
фонарями и огнями рекламы, второй причиной может быть недоста+
точная экспозиция при фотографировании.
35
Аналогично, в случае если основная площадь гистограммы сосре+
доточена в области высоких значений яркости (рис. 2.4), это может
быть обусловлено либо самим сюжетом, например изображение снеж+
ного склона, освещенного ярким солнцем, с мелкой фигуркой лыж+
ника, либо чрезмерно большой экспозицией при фотографировании.
Гистограмма может указывать и на другие дефекты изображения.
Например, если малые, большие или те и другие значения яркости
в изображении отсутствуют (см. гистограмму на рис. 2.5), так как
в этих областях значения вероятности p равны нулю, это указывает
на неполное использование динамического диапазона, что обычно
проявляется в малом контрасте изображения.
Иногда гистограмма принимает вид серии сравнительно далеко
отстоящих друг от друга вертикальных линий, что указывает на так
p
0
L
Рис. 2.4. Гистограмма изображения, в котором преобладают большие
значения яркости
p
0
L
Рис. 2.5. Гистограмма изображения, в котором отсутствуют малые и
большие значения яркости
36
называемое разрежение шкалы квантовых уровней. В этом случае на
изображении возможно появление ложных контуров.
2.4. Спектральное представление сигналов
В технике обработки и передачи сигналов и изображений широко
применяются спектральные представления сигналов и изображений.
Как известно, периодический сигнал, удовлетворяющий условиям
Дирихле, например электрический сигнал от звучащей струны музы+
кального инструмента, может быть представлен в виде суммы триго+
нометрических функций, с соответствующим образом подобранны+
ми значениями амплитуд и начальных фаз:
e(t) = C0 +
∞
∑ Ck sin ⎛⎜⎝ 2Tπk t − ϕk ⎞⎟⎠,
1
где t – время T – период, с которым изменяется сигнал; k – номер
слагаемого, называемого номером гармоники; Ck – амплитуда k+й
гармоники; ϕk – начальная фаза k+й гармоники. Часто это выраже+
ние записывают в следующем виде:
e(t) = C0 +
∞
∑ Ck sin (2πkf1t − ϕk ),
1
где f1 – основная частота (первая гармоника) сигнала, которая равна
f1 = 1/T, Гц. Величина частоты в герцах равна количеству периодов
сигнала, приходящихся на одну секунду.
Значения Ck и ϕk определяются следующим образом:
Ck = Ak2 + Bk2 , tgϕk = Ak Bk ,
где
T2
Ak =
T2
2
2
e ( t ) cos2πkf1tdt, Bk =
e ( t ) sin2πkf1tdt.
T −T 2
T −T 2
∫
∫
Таким образом, сложный периодический сигнал e(t) полностью
определяется совокупностью величин Ck и ϕk. Совокупность величин
Ck называется спектром амплитуд, или амплитудным спектром, а
совокупность величин ϕk называется спектром фаз, или фазовым спек
тром.
Спектр амплитуд периодического сигнала можно изобразить гра+
фически (рис. 2.6). На этом рисунке по оси абсцисс отложено значе+
37
Рис. 2.6. Спектр амплитуд периодического сигнала
ние частоты f, а по оси ординат – значения амплитуд Ck. Спектр пе+
риодического сигнала является дискретным, т. е. состоящим из от+
дельных спектральных линий. Кроме того, рассматриваемый спектр
является гармоническим, это выражается в том, что отдельные спек+
тральные линии отстоят друг от друга на одинаковом расстоянии.
Обратимся теперь к спектрам непериодических сигналов. Пере+
ход от периодического сигнала к непериодическому сигналу, как из+
вестно, может быть осуществлен путем предельного перехода, при
котором период устремляют к бесконечности. В результате такого
предельного перехода интервалы между отдельными спектральны+
ми линиями неограниченно сокращаются, линии спектра сливают+
ся, и спектр непериодического сигнала M(ω) становится сплошным.
При этом непериодический сигнал и его спектр связаны друг с другом
парой преобразований Фурье
M ( ω) =
∞
∫ e ( t ) exp ( −iωt ) dt,
−∞
∞
1
e (t) =
∫ M ( ω) exp ( iωt ) dt,
2π −∞
В этих формулах использованы следующие обозначения: i = −1;
ω – круговая частота, которая связана с частотой f простым соотно+
шением ω = 2πf.
Обратим внимание на то, что спектр M(ω) является комплексной
функцией круговой частоты ω и в отличие от спектра периодического
сигнала определен на интервале значений ω, простирающихся от −∞
до +∞ .
На рис. 2.7 показан график модуля спектра непериодического сиг+
нала |M(ω)|, т. е. амплитудный спектр непериодического сигнала для
38
M(w)
w
0
Рис. 2.7. Амплитудный спектр
положительных значений круговой частоты, что достаточно, по+
скольку для реальных сигналов он симметричен.
2.5. Пространственные спектры изображений
Рассмотрим черно+белое полутоновое изображение L(x,y), кото+
рое представлено распределением яркости на плоскости, где L – зна+
чение яркости в точке с координатами x и y.
Изображение можно рассматривать как сигнал, но в отличие от
электрического сигнала e(t), значение которого зависит только от
одной переменной – времени t, значение яркости в изображении за+
висит от двух переменных – пространственных координат x и y. Та+
ким образом, в отличие от электрического сигнала, который являет+
ся одномерным сигналом, изображение является двумерным сигна+
лом. Это отличие проявляется в том, что спектр изображения также
является двумерным, представляя совокупность компонент из вер+
тикальных и горизонтальных полос, яркость которых изменяется
по гармоническому закону с периодами 1/fx и 1/fy, где fx и fy – про+
странственные частоты.
Согласно определению спектр изображения M(ωx,ωy) представля+
ет собой комплексную функцию, связанную с распределением ярко+
сти в изображении L(x,y) парой преобразований Фурье:
M ( ωx , ωy ) =
L ( x, y ) =
∞ ∞
∫ ∫ L ( x, y ) exp ⎡⎣ −i ( ωxx + ωyy )⎤⎦ dxdy,
−∞ −∞
∞ ∞
1
M ( ωx , ωy ) exp ⎡⎣i ( ωxx + ωy y ) ⎤⎦ dωxdωy,
4π2 −∞ −∞
∫∫
где ωx и ωy – круговые пространственные частоты спектра в направле+
нии осей x и y, равные ωx = 2πfx. ωy = 2πfy. Определенные таким обра+
39
зом спектры содержат полную информацию как об амплитудах, так
и о фазах частотных составляющих.
2.6. Спектральные интенсивности изображений
При решении ряда задач информация о фазовых соотношениях
частотных составляющих оказывается излишней, и тогда использу+
ют спектральную интенсивность, или, что то же самое, энергетиче+
ский спектр изображения. В отличие от спектра спектральная ин+
тенсивность содержит информацию только о распределении энергии
(или величины, пропорциональной ей) по пространственным часто+
там. Спектральную интенсивность изображения определяют следу+
ющим образом:
S ( ωx , ωy ) =
2
1
M ( ωx , ωy ) ,
sи
где sи = x0y0 – площадь прямоугольника, в который вписано изобра+
жение (рис. 2.8), а |M(ωx,ωy)| – модуль спектра, или, что то же самое,
амплитудный спектр изображения.
Спектральные интенсивности изображений позволяют вычислить
соответствующие им значения энергий
∞ ∞
E=
sи
S ( ωx , ωy ) dωxdωy,
4π2 −∞ −∞
∫∫
Чем больше значение E, тем выше вероятность правильного обна+
ружения изображения объекта в присутствии шума.
Экспериментальные исследования показали, что основная доля
энергии изображений сосредоточена в области низких пространствен+
ных частот, при этом примерно половина ее приходится на постоян+
ную составляющую.
Несмотря на то, что энергия, приходящаяся на область высоких
пространственных частот в изображении, мала, эти составляющие
спектра играют большую роль, обеспе+
чивая четкость изображения.
В качестве примера на рис. 2.9 при+
y
ведена экспериментальная зависимость
нормированной к максимальному зна+
чению спектральной интенсивности
Sс(ωx) от круговой пространственной ча+
x
стоты ωx.
Экспериментальные исследования по+
Рис. 2.8. Определение пло
щади изображения казали также, что спектральные интен+
H
0
40
0
Рис. 2.9. Пример экспериментальной зависимости спектральной ин
тенсивности изображений от круговой пространственной ча
стоты ωx. (прямоугольниками показаны экспериментальные
точки)
wy
as
6
4
2
6
4 2
0
2
4
6
wx
as
2
4
6
Рис. 2.10. Семейство линий постоянной спектральной интенсивности
Sc (ωx, ωy) = const изображений; as – параметр, определяемый
характером и размером изображений
сивности изображений анизотропны, что находит свое выражение в
более медленном их убывании вдоль осей ωx, ωy, чем в направлениях,
расположенных к этим осям под углами 45°.
41
Анизотропия спектральных интенсивностей реальных изображе+
ний обусловлена самой их структурой, которая в конечном счете оп+
ределяется структурой самой Вселенной, например формой земной
поверхности, направлением сил тяготения и т. п. Вследствие ука+
занных причин в «естественных» изображениях вертикальные и го+
ризонтальные контуры встречаются чаще, чем контуры, ориентиро+
ванные в других направлениях. Рис. 2.10, на котором приведено се+
мейство линий постоянной спектральной интенсивности (изолиний)
S(ωx,ωy) = const, иллюстрирует сказанное.
2.7. Автокорреляционные функции изображений
Для описания статистических связей между элементами изобра+
жений используют функцию автокорреляции, которую определяют
следующим образом:
1
R ( ξ, η) =
sи
x0 y0
∫ ∫ L ( x,y ) L ( x + ξ,y + η) dxdy,
0 0
где ξ и η – смещения реализации изображения L(x+ξ, y+η) относи+
тельно реализации этого же изображения L(x,y) по осям x и y соот+
ветственно; x0, y0 – размеры изображения по горизонтали и вертика+
ли (рис. 2.11).
Распространение пределов интегрирования до бесконечности
в написанном интеграле не изменяет значения интеграла, поскольку
за пределами прямоугольника, в котором заключено изображение,
яркость принята равной нулю.
Приведенное определение функции автокорреляции тем ближе
к строгому определению, используемому в математической стати+
стике, чем меньше площадь автокорреляции изображения ξкηк, ко+
торая определяется соотношением
ξкηк =
{
4 R ( 0,0 ) − ⎡⎣ L ⎤⎦
{
}
∞ ∞
1
2
∫ ∫ R ( ξ,η) − ( L )
−∞ −∞
2
}
dξdη,
по сравнению с площадью изображения sи = x0y0. Здесь через L обо+
значено среднее значение яркости изображения.
Приведем ряд важных свойств функции автокорреляции.
1. Функция автокорреляции обладает свойством четности
R ( ξ, η) = R ( −ξ,η) = R ( ξ, −η) = R ( −ξ, −η ),
2. Функция автокорреляции принимает максимальное значение,
когда ξ и η равны нулю.
42
x0
y0
Рис. 2.11. Определение функции автокорреляции изображения
3. С ростом ξ и η функция автокорреляции убывает вследствие
ослабления статистических связей с увеличением расстояния между
элементами в изображении. При этом в пределе для неограниченно
больших изображений функция автокорреляции R(ξ,η ) стремится
к квадрату среднего значения яркости изображения ( L )2 .
4. Функция автокорреляции изображения R(ξ,η) и его спектраль+
ная интенсивность S(ωx,ωy) связаны парой преобразований Фурье
R ( ξ, η) =
∞ ∞
1
S ( ωx, ωy ) exp ⎡⎣i ( ωxξ + ωyη) ⎤⎦ dωxdωy,
4π2 −∞ −∞
∫∫
S ( ωx, ωy ) =
∞ ∞
∫ ∫ R ( ξ,η) exp ⎡⎣ −i ( ωxξ + ωyη)⎤⎦ dξdη.
−∞ −∞
2.8. Коэффициент автокорреляции изображений
Часто в рассмотрение вводят коэффициент автокорреляции изоб+
ражения, который связан с его функцией автокорреляции простым
соотношением:
43
( ξ,η) − ( L )
2
ρ ( ξ, η) =
( )
R ( 0,0 ) − L
2
.
Из данного выражения следует, что коэффициент автокорреля+
ции находится путем вычитания из функции автокорреляции квад+
рата средней яркости изображения и деления получившегося резуль+
тата на разность между функцией автокорреляции при нулевых сме+
щениях реализаций и средним квадратом среднего значения яркости
изображения. Для практического применения коэффициент автокор+
реляции оказывается более удобным, чем функция автокорреляции,
поскольку он является функцией, нормированной относительно сво+
его максимального значения, и, следовательно, его максимальное
значение равно единице.
Одним из первых ученых, исследовавших экспериментально зави+
симость коэффициента автокорреляции изображений от смещения их
реализаций, был Кречмер. При проведении экспериментов Кречмер
использовал прибор, в котором два диапозитива одного и того же изоб+
ражения, наложенные друг на друга со сдвигом ξ и η (см. рис. 2.11),
просвечивались параллельным пучком световых лучей. Суммарный
световой поток, прошедший через диапозитивы и пропорциональный
R(ξ,η), регистрировался фотоэлектронным умножителем. Перемещая
один диапозитив относительно другого и измеряя ток фотоэлектрон+
ного фотоумножителя, им были получены зависимости коэффициен+
тов автокорреляции от смещений ξ и η для ряда изображений.
На рис. 2.12 сплошными линиями показаны зависимости коэф+
фициента автокорреляции от смещения в направлении оси y, пред+
ставленного числом растровых элементов (точнее строк), найденные
экспериментальным путем для двух изображений. Из рисунка следу+
ет, что чем меньше взаимное смещение реализаций η, тем больше
значение коэффициента автокорреляции ρc(ξ,η), а следовательно,
сильнее статистические связи между элементами изображения. Из
рисунка также следует, что в первом случае (лицо крупным планом),
когда изображение содержит небольшое число мелких деталей и, сле+
довательно, статистические связи между элементами изображения
более сильны, коэффициент автокорреляции убывает медленнее, чем
во втором случае (изображение общего плана). Аналогичный вид
имеют кривые, представляющие зависимость ρc(ξ,η) от смещения ξ
в направлении оси x.
В результате многочисленных экспериментальных исследований
было найдено, что зависимость коэффициента автокорреляции от
44
Рис. 2.12. Зависимость коэффициента автокорреляции ρ от смещения
вдоль строки y, выраженного в числе растровых элементов η/∆д;
1 – изображение лица крупным планом; 2 – изображение общего
плана (трибуны стадиона, заполненные зрителями); ∆д – ли
нейный размер растрового элемента
величины смещения для реальных изображений хорошо аппрокси+
мируется экспоненциальной функцией
ρ ( ξ, η) = exp ⎡⎣ −as ( ξ + η ) ⎤⎦ .
В формуле параметр as представляет собой величину, обратную
интервалу автокорреляции, и целиком определяется свойствами изоб+
ражения.
На рис. 2.12 штриховыми линиями обозначены зависимости ρ от
η/∆д, рассчитанные по этой формуле.
То обстоятельство, что коэффициенты автокорреляции изоб
ражений аппроксимируются экспоненциальными функциями, позво
ляет в качестве стохастической модели изображений использовать
случайный двумерный марковский процесс первого порядка.
Подводя итог, отметим, что:
1) коэффициент автокорреляции, как и функция автокорреляции,
обладает свойством четности;
2) коэффициент автокорреляции принимает максимальное значе+
ние, равное единице, когда ξ и η равны нулю;
3) с ростом ξ и η коэффициент автокорреляции убывает вследствие
ослабления статистических связей с увеличением расстояния между
элементами в изображении, при этом в пределе для неограниченно
больших изображений R(ξ,η) стремится к нулю.
45
2.9. Понятие о характеристиках цвета
До сих пор речь, в основном, шла о полутоновых черно+белых изоб+
ражениях, для описания которых было достаточно задать функцию
Lc(x,y), представляющую распределение яркости Lc на плоскости
с координатами x,y. Черно+белые изображения являются частным
случаем более широкого класса цветных изображений.
В отличие от спектральной плотности излучения цвет представ+
ляет собой понятие субъективное, при этом он характеризуется тре+
мя величинами: светлотой, цветовым тоном и насыщенностью. По+
этому цвет является векторной величиной.
Светлота в восприятии изображений играет ведущую роль. Одни
и те же цвета, но обладающие разной светлотой, вызывают различ+
ные зрительные ощущения. Так, например, белый цвет в зависимос+
ти от светлоты может восприниматься как белый, светло+серый, се+
рый, темно+серый и т. д. Цвет воспринимаемый при большой светло+
те как желтый, при малой светлоте воспринимается как коричневый
и т. п. Более того, в зависимости от яркости соседних участков изоб+
ражения нейтральный цвет, характеризуемый одной и той же ярко+
стью, может восприниматься нами и как белый, и как черный. В под+
тверждение этого парадокса приведем пример, заключающийся в том,
что яркость черных букв газетного текста на солнце (соответственно
количество отраженного от них света) выше, чем яркость белой бу+
маги, на которой они напечатаны, в тени. Из изложенного следует,
что светлота, представляющая собой зрительное ощущение, являет+
ся нелинейной и достаточно сложной функцией яркости, которая
определяется свойствами зрения. Яркость же представляет собой
физическую величину и от свойств зрения не зависит.
Цветовой тон излучения характеризует свойство цвета, которое
отличает его от белого и серого. Названия цветов – красный, жел+
тый, синий и т. д. следует рассматривать как приблизительные обо+
значения цветового тона. Количественно цветовой тон излучения
характеризуется доминирующей длиной волны, т. е. длиной волны
такого спектрально+чистого цвета, который необходимо смешать с
белым цветом в определенной пропорции для того, чтобы получить
описываемый цвет. Между цветовым тоном и доминирующей длиной
волны существует нелинейная зависимость. Так, например, желтый
цвет занимает на шкале длин волн интервал приблизительно 30 нм,
в то время как красный – около 75 нм.
Насыщенность цвета характеризует степень разбавленности спек+
трально+чистого цвета белым цветом. Добавление к спектрально+
чистому цвету белого цвета уменьшает его насыщенность. Доля спек+
трального цвета в его смеси с белым называется чистотой цвета p:
46
p=
Lλ
L
= λ,
Lλ + LE L
где Lλ – яркость спектрально+чистого цвета; LE – яркость равноэнер+
гетического белого цвета, т. е. излучения, спектральная интенсив+
ность которого на всех длинах волн видимого излучения постоянна;
L – яркость смеси. Из данного выражения следует, что для спект+
рально+чистых излучений чистота цвета максимальна (p = 1), а для
равноэнергетического белого минимальна (p = 0). Нужно отметить,
что в силу особенностей нашей зрительной системы связь между на+
сыщенностью цвета (т. е. зрительным ощущением насыщенности) и
чистотой цвета нелинейная. Более того, при одной и той же чистоте
цвета красный и синий спектрально+чистые цвета воспринимаются
как высоконасыщенные, а желтый и голубой, тоже спектрально+чи+
стые, как цвета, имеющие меньшую насыщенность. Таким образом,
между характеристиками восприятия цвета: светлотой, цветовым
тоном и насыщенностью, с одной стороны, и характеристиками цве+
та: яркостью, доминирующей длиной волны и чистотой цвета – с дру+
гой, имеют место сложные зависимости.
47
3. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ
3.1. Оцифровка изображений
Цифровая обработка изображений начинается с того, что вначале
их вводят в память компьютера, используя для этой цели сканеры,
цифровые камеры, видеокамеры, а также платы ввода видеоданных.
При вводе изображений в память компьютера их преобразуют из
аналоговой формы в цифровую, т. е. оцифровывают. Так, например,
в случае неподвижного ахроматического изображения непрерывное
распределение яркости на его плоскости Lc0(x,y) будет преобразова+
но в матрицу чисел ||Lc(k,n)|| с конечной разрядностью, подлежащую
запоминанию на жестком диске (винчестере). Индексы k и n пред+
ставляют номера строк и столбцов соответственно. При оцифровке
в изображения неизбежно вносятся искажения, величина которых
определяется плотностью и структурой расположения отсчетов на
исходных изображениях, числом уровней квантования, определяе+
мым разрядностью представления значений яркости, а также выб+
ранной шкалой квантования, которая может быть как равномерной,
так и неравномерной. Результатом неправильного выбора этих пара+
метров может быть как недопустимо большой уровень искажений,
который сведет на нет все последующие работы, поскольку искаже+
ния, возникшие на этом этапе, в дальнейшем уже не смогут быть
исправлены, так и чрезмерно большой объем файла, в котором запи+
сано изображение, вследствие неоправданного запаса при выборе ис+
ходных параметров оцифровки.
При выборе параметров оцифровки следует исходить из того, где и
для каких целей в дальнейшем эти изображения будут использова+
ны, поскольку это в значительной степени определит сам выбор. Так,
изображение, которое предназначено для альбома репродукций ше+
девров живописи, потребует высокого разрешения и точной передачи
цвета, в то время как изображение, которое будет использовано
в Интернете, скорее всего, будет представлено с меньшим разрешени+
ем и с палитрой 256 цветов.
Рассмотрим далее причины, приводящие к возникновению иска+
жений на этапе оцифровки изображений, так называемых помех про
странственной дискретизации изображений и шумов квантования,
а также методы, позволяющие уменьшить эти искажения до допус+
тимого значения.
3.2. Теорема Котельникова
При оцифровке непрерывное изображение вначале подвергается
пространственной дискретизации, т. е. представляется в виде набора
48
отсчетов (пикселей), поэтому обратимся к проблеме выбора плотно+
сти расположения отсчетов на исходном изображении. Рассмотрим
для простоты случай пространственной дискретизации неподвижно+
го ахроматического изображения. Будем считать, что пространствен+
ный спектр дискретизируемого изображения Lc0(x,y) ограничен кру+
говыми пространственными частотами ωxгр, ωyгр, т. е.
⎧∞ ∞
Lс0 ( x, y ) exp ⎡⎣ −i ( ωxx + ωy y ) ⎤⎦ dxdy
⎪
⎪ −∞ −∞
⎪⎪
Mс0 ( ωx, ωy ) = ⎨при ωx < ωxгр , ωy < ωyгр ,
⎪
⎪0 – при невыполнении этого условия,
⎪
⎪⎩
∫ ∫
где i = −1. В этом случае распределение яркости в дискретизируе+
мом изображении определится следующим образом:
Lс0 ( x, y ) =
ωxгр ωyгр
1
4π2 −ω∫
∫
xгр −ωyгр
Mc0 ( ωx , ωy ) exp ⎡⎣ i ( ωxx + ωyy ) ⎤⎦ dωxdωy . (3.1)
Раскладывая спектр изображения Mc0(ωx,ωy) в двойной ряд Фурье
по переменным ωx,ωy на интервалах –ωxгр<ωx<ωxгр; –ωyгр<ωy<ωyгр,
получаем
Mс0 ( ωx, ωy ) =
∞
∞
⎡ ⎛ 2πnω
2πkω ⎞ ⎤
∑∑ Dnk exp ⎢⎢i ⎜⎜ 2ωxгрx + 2ωyгрy ⎟⎟ ⎥⎥ ,
−∞ −∞
⎣ ⎝
⎠⎦
(3.2)
где 2ωxгр и 2ωyгр – периоды разложения спектра изображения
Mc0(ωx,ωy); Dnk – коэффициенты разложения. На рис. 3.1 показаны
разлагаемые в ряд Фурье спектр исходного изображения (он заштри+
Рис. 3.1. Разложение спектра изображения в ряд Фурье
49
хован), а без штриховки – побочные спектры (так называемые реп+
лики), обусловленные природой периодического ряда.
Коэффициенты разложения определяются следующим образом:
ωxгр ωyгр
Dnk =
1
2ωxгр 2ωyгр −ω
∫
∫
xгр −ωyгр
Mc0 ( ωx,ωy ) ×
⎡ ⎛ 2πnω
2πkωy ⎞ ⎤
x
× exp ⎢ −i ⎜
+
⎟⎟ ⎥ dωxdωy.
⎜
⎣⎢ ⎝ 2ωxгр 2ωyгр ⎠ ⎦⎥
(3.3)
Сопоставляя формулы (3.1) и (3.3), видим, что
Dnk =
⎛ πn
π2
πk ⎞
Lс0 ⎜ −
,−
.
⎜ ωxгр ωyгр ⎟⎟
2ωxгр 2ωyгр
⎝
⎠
После введения обозначений π/ωxгр = ∆x, π/ωyгр = ∆y, получим
Dnk =
π2
Lс0 ( −n∆ x , −k∆ y ),
2ωxгр 2ωyгр
(3.4)
где ∆x, ∆y – интервалы взятия отсчетов на изображении (интервалы
пространственной дискретизации изображения) в направлении осей
x и y. Обычно при дискретизации эти значения делают одинаковыми.
Заменим в формуле (3.1) Mc0(ωx,ωy) его представлением в виде ряда
Фурье
Lс0 ( x, y ) =
ωxгр ωyгр
×
∫
∫
−ωxгр −ωyгр
1
4ωxгрωyгр
∞
∞
∑∑ Lс0 (n∆ x,k∆ y )×
−∞ −∞
(
)
exp ⎡i ωx ( x − n∆ x ) + ωy ( y − k∆ y ) ⎤ dωxdωy.
⎣
⎦
Учитывая, что
ωxгр
∫
−ωxгр
и
50
exp ⎡⎣iωx ( x − n∆ x ) ⎤⎦ dωx =
2sin ωx ( x − n∆ x )
( x − n∆x )
ωyгр
∫
−ωyгр
exp ⎡⎣iωy ( y − k∆ y ) ⎤⎦ dωy =
2sin ωy ( y − k∆ y )
( y − k∆ y )
,
запишем окончательно
Lс0 ( x, y ) =
∞
∞
∑∑ Lс0 ( n∆x,k∆ y )
−∞ −∞
2sin ωx ( x − n∆ x ) 2sin ωy ( y − k∆ y )
( x − n∆x )
( y − k∆ y )
.
(3.5)
Из этой формулы следует, что непрерывное изображение Lc0(x,y)
с ограниченным спектром круговых пространственных частот ωx, ωy,
полностью определяется значениями яркости, взятыми в точках дис+
кретных отсчетов, расположенных в узлах прямоугольной решетки
(рис. 3.2). Такая структура расположения отсчетов называется ор
тогональной.
Интервалы пространственной дискретизации ∆x, ∆y и граничные
круговые пространственные частоты ωxгр, ωyгр, как отмечено ранее,
связаны соотношениями ∆x = π/ωxгр, ∆y = π/ωyгр. Чем выше значения
граничных круговых пространственных частот, тем меньшими дол+
жны быть значения интервалов пространственной дискретизации ∆x,
∆y для того, чтобы обеспечить правильное представление мелких де+
талей, которые содержит дискретизируемое изображение. Если изве+
стна площадь изображения sи, то при оговоренных выше условиях
y
Dy
Dx
0
x
Рис. 3.2. Ортогональная структура расположения точек дискретных
отсчетов на изображении
51
оно должно быть представлено N = sи/(∆x∆y) отсчетами, чтобы по
ним можно было бы его точно восстановить.
Выражение
2sin ωx ( x − n∆ x ) 2sin ωy ( y − k∆ y )
( x − n∆x )
( y − k∆ y )
,
называемое функцией отсчетов, обладает следующими свойствами.
1. Во всех точках дискретных отсчетов, за исключением одной,
координаты которой x = n∆x, y = k∆y, значения функции равны нулю.
В точке же дискретного отсчета с координатами x = n∆x, y = k∆y значе+
ние функции отсчетов равно единице.
2. Спектральная интенсивность функции отсчетов постоянна
в интервале круговых пространственных частот |ωx|<ωxгр, |ωy|<ωyгр и
равна нулю за его пределами.
В более общем случае можно показать, что дискретные отсчеты не
обязательно должны располагаться на равных расстояниях друг от
друга. Более того, можно их передавать через один, но в каждой точ+
ке, где они передаются, кроме значения яркости передавать также
значение ее первой производной или же вести передачу отсчетов через
две точки, передавая при этом значения яркости, а также первую и
вторую ее производные и т. д. Важно, чтобы число независимых дан+
ных на единицу площади было бы не меньше, чем N1 = ωxгр ωxгр /π2.
Аналогично доказывается теорема для случая, когда распределе+
ние яркости в изображении является функцией большего числа пе+
ременных, как это, например, имеет место в случае движущихся изоб+
ражений.
Значение теоремы отсчетов состоит в том, что она устанавли
вает связь между дискретными и аналоговыми изображениями.
В заключение заметим, что если при дискретизации изображений
условие теоремы отсчетов |ωx| < ωxгр, |ωy| < ωyгр не выполняется, а это,
к сожалению, как правило, всегда имеет место, возникают своеоб+
разные искажения, называемые помехой пространственной дискре
тизации.
3.3. Спектры аналогового и оцифрованного изображений,
помеха пространственной дискретизации
Переходя к изучению помехи пространственной дискретизации изоб+
ражений, рассмотрим вначале случай, когда дискретизируемое изобра+
жение имеет ограниченный спектр пространственных частот и удовлет+
воряет условию теоремы Котельникова, т. е. ∆x = π/ωxгр; ∆y = π/ωyгр.
Выделим на изображении k+ю строку, например строку, соответству+
52
ющую k = 0, и рассмотрим значения отсчетов яркости вдоль этой стро+
ки Lc = (n∆x, k∆y), для чего обратимся к рис. 3.3, а. Зависимость
последовательности Lc0 = (n∆x, k∆y) от номера отсчета n можно рас+
сматривать как результат амплитудной модуляции (перемножения)
периодической последовательности бесконечно тонких импульсов,
показанных на рис. 3.3, б, функцией Lc0(x,y) (рис. 3.3, в).
Принимая во внимание, что периодическая последовательность
бесконечно тонких импульсов имеет периодический дискретный
спектр, условно показанный на рис. 3.4, а в виде отрезков одинако+
вой высоты, и, что амплитудная модуляция последовательности бес+
конечно тонких импульсов функцией Lc0(x,y) приводит к модуляции
каждой из спектральных составляющих, приходим к заключению,
что спектр изображения после его пространственной дискретизации
имеет вид, показанный на рис. 3.4, б. Из этого рисунка следует, что
в результате амплитудной модуляции около каждого из спектраль+
ных компонентов периодической последовательности импульсов (от+
а)
б)
в)
Рис. 3.3. Иллюстрация к процессу дискретизации: а – периодическая
импульсная последовательность, модулированная функцией
Lc0(x,0); б – немодулированная периодическая импульсная пос
ледовательность; в – функция Lc0(x,0)
53
а)
б)
Рис. 3.4. Амплитудные спектры немодулированной и модулированной
периодической последовательности: а – амплитудный спектр
немодулированной периодической импульсной последователь
ности; б – амплитудный спектр периодической импульсной
последовательности, модулированной функцией Lc0(x,0), при
условии, что частота дискретизации удовлетворяет услови
ям теоремы Котельникова
счетов) возникли боковые полосы частот, представляющие собой ос+
новной спектр исходного изображения (на рис. 3.4, б заштрихован),
и побочные спектры.
Аналогичная картина будет иметь место и в том случае, если мы
будем рассматривать не одномерный, а двумерный спектр дискрети+
зированного изображения Mc.д(ωx,ωy), который показан на рис. 3.5.
В этом случае спектр дискретизированного изображения Mc.д(ωx,ωy)
также включает в себя как компоненту спектра исходного не дискре+
тизированного изображения (на рисунке область, занимаемая этим
компонентом спектра, заштрихована), так и компоненты побочных
спектров (области, которые они занимают, показаны без штрихов+
ки). Из рисунка видно, что побочные спектры получаются путем сме+
щения основного спектра по осям круговых пространственных час+
тот ωx, ωy на величины lωxд, rωyд, где ωxд = 2π/∆x, ωyд = 2π/∆y – часто+
ты пространственной дискретизации по осям ωx и ωy, которые обычно
берутся одинаковыми, l и r – целые числа. Положение частот дискре+
тизации и их гармоник на рис. 3.5 показано кружками.
54
wy
aaaaaaaaa
aaaaaaaaa
aaaaaaaaa
aaaaaaaaa
aaaaaaaaa
wx
Рис. 3.5. Двумерный спектр дискретизированного изображения при ус
ловии, что частота пространственной дискретизации удов
летворяет условиям теоремы Котельникова
При этом
Mс.д ( ωx , ωy ) =
∞
∞
∑∑ Mс ( ωx − lωxд,ωy − rωyд ).
−∞ −∞
Из рис. 3.5 видно, что для того, чтобы из дискретизированного
изображения восстановить исходное изображение, т. е. аналоговое,
достаточно из спектра дискретизированного изображения выделить
посредством фильтрации компонент исходного спектра. Эта опера+
ция может быть осуществлена путем свертки дискретизированного
изображения с функцией отсчетов в соответствии с формулой (3.5).
Перейдем теперь к рассмотрению случая, когда дискретизируемое
изображение не удовлетворяет условию теоремы отсчетов, т. е. когда
∆x > π/ωxгр, ∆y > π/ωyгр. Повторяя приведенные выше рассуждения,
построим рисунок, на котором показаны области, занимаемые ос+
новным и побочными спектрами (рис. 3.6). Из рисунка видно, что
теперь за счет того, что ωxгр и ωyгр возросли по сравнению с предыду+
щим случаем, возникло взаимное перекрытие основного и побочных
спектров, что привело к возникновению так называемой помехи про+
странственной дискретизации. Поскольку спектр большинства ре+
альных изображений не ограничен по частотам ωx и ωy, взаимное на+
ложение спектров неизбежно и, после того как оно произошло, поме+
ха пространственной дискретизации не может быть отфильтрована.
Проявление помехи пространственной дискретизации на изобра+
жениях определяется структурой самих изображений. Так, в случае
изображений, содержащих много мелких деталей, но не содержащих
55
wy
aaaaaaaaaaaaaaa
aaaaaaaaaaaaaaa
aaaaaaaaaaaaaaa
aaaaaaaaaaaaaaa
aaaaaaaaaaaaaaa
aaaaaaaaaaaaaaa
aaaaaaaaaaaaaaa
aaaaaaaaaaaaaaa
wx
Рис. 3.6. Двумерный спектр дискретизированного изображения для слу
чая, когда частота пространственной дискретизации не удов
летворяет условиям теоремы Котельникова
периодических структур, помеха пространственной дискретизации
проявляется в виде хаотически распределенных светлых и темных
точек, распределение которых по яркости описывается нормальным
законом. Если же изображение содержит периодические структуры,
как, например, изображение, показанное на рис. 3.7, а, то помеха
пространственной дискретизации проявляется в виде муарового ри+
сунка (рис. 3.7, б).
Поскольку помеха пространственной дискретизации является
мультипликативной помехой, то изменение контраста изображения
повлечет за собой увеличение также и ее контраста, отношение же
сигнал/помеха при этом не изменится. Для того чтобы избежать воз+
никновения этой помехи, спектр дискретизируемого изображения
должен быть предварительно ограничен со стороны верхних про+
странственных частот. Этого можно достичь, в частности, путем оп+
тической фильтрации изображений. Такую фильтрацию осуществ+
ляют, например, следующими двумя способами. Первый способ зак+
лючается в применении аподизированной оптики. Второй способ
связан с использованием когерентных оптических систем. При этом
диапозитив фильтруемого изображения помещается в коллимиро+
ванный поток когерентного света, который затем пропускается через
линзу. В задней фокальной плоскости линзы, где распределение све+
тового потока пропорционально двумерному спектру Фурье простран+
56
а)
б)
Рис. 3.7. Изображение с периодической структурой: а – изображение до
дискретизации; б – изображение после дискретизации в случае
нарушения условий теоремы Котельникова
ственного распределения прозрачности диапозитива, помещается
диафрагма, которая отсекает световой поток в области верхних про+
странственных частот. Далее изображение фокусируется на свето+
чувствительной поверхности датчика сигнала изображения. Про+
фильтрованное таким образом изображение может быть продискре+
тизировано без опасности возникновения помехи пространственной
дискретизации. Однако описанные способы не удобны на практике –
первый по причине существенного уменьшения светового потока апо+
дизированной оптикой и, как следствие, снижения чувствительнос+
ти преобразователя свет+сигнал, второй – по причине громоздкости.
Простым, но не лучшим методом ослабления помехи простран+
ственной дискретизации на изображении, которым и пользуются на
практике, является увеличение числа отсчетов на изображении при
его оцифровке. Однако увеличение числа отсчетов влечет за собой
пропорциональное увеличение размера файла, в котором изображе+
ние будет храниться.
Все сказанное, с учетом специфики, можно также распространить
на временную дискретизацию движущихся изображений, при кото+
рой возникает помеха временной дискретизации. В частности, эта
помеха проявляется на изображении в виде хорошо всем знакомого
эффекта обратного вращения спиц колеса при определенных скорос+
тях его вращения.
В следующем подразделе рассматривается разработанный автора+
ми метод, позволяющий сильно ослабить помеху пространственной
дискретизации и при этом избежать увеличения числа отсчетов в изоб+
ражении, а следовательно, и увеличения размера файла изображе+
ния [1].
57
3.4. Метод уменьшения помехи пространственной дискретизации
Приступая к рассмотрению метода уменьшения помехи простран+
ственной дискретизации, будем полагать, что интервал простран+
ственной дискретизации изображения одинаков в обоих направле+
ниях, т. е. ∆ = ∆x = ∆y, а следовательно, одинакова и частота про+
странственной дискретизации в обоих направлениях: ωд = ωxд = ωyд.
Как отмечалось, причиной возникновения помехи пространствен+
ной дискретизации на изображении является наложение на основ+
ной спектр побочных спектров. Так как спектры реальных изобра+
жений не ограничены по пространственным частотам, то избежать
этого полностью невозможно, хотя можно в значительной степени
ослабить последствия этих наложений путем увеличения частоты
пространственной дискретизации ωд. На рис. 3.8, а и б приведены
зависимости спектральной интенсивности дискретизированного изоб+
ражения Sс.д(ωx,ωy) от круговой пространственной частоты ωx, пояс+
няющие сказанное.
Это обстоятельство используется в описываемом методе уменьше+
ния помехи пространственной дискретизации, включающем в себя
три этапа. Вначале при оцифровке изображения выполняется его
первичная (предварительная) дискретизация с круговой частотой
пространственной дискретизации ωд.п, в n раз превышающей основ+
ную частоту пространственной дискретизации ωд, т. е. ωд.п = nωд. Это
достигается за счет того, что интервал пространственной дискрети+
а)
б)
Рис. 3.8. Графики спектральных интенсивностей, представляющие ос
новной и побочные спектры изображения при двух различных
частотах пространственной дискретизации: а – случай с ма
лой частотой пространственной дискретизации; б – случай
с повышенной частотой пространственной дискретизации
58
зации на первом этапе берется в n раз меньше того, с которым изобра+
жение в дальнейшем будет записано в память. Благодаря такому
выбору частоты пространственной дискретизации основной и побоч+
ные спектры дискретизированного изображения оказываются силь+
но смещенными друг относительно друга так, как это показано на
рис. 3.9, а, и поэтому их взаимное перекрытие оказывается пренеб+
режимо малым. На втором этапе предварительно дискретизирован+
ное изображение подвергается пространственной фильтрации путем
его свертки с импульсной функцией типа sin x/x, благодаря чему без
изменения остаются только те компоненты пространственного спек+
тра изображения, которые удовлетворяют условию
ωx − lnωд < ωxгр ∧ ωy − rnωд < ωyгр ,
где l и r – целые числа, изменяющиеся от – ∞ до + ∞, все же прочие
компоненты спектра отфильтровываются. На рис. 3.9, б показана
зависимость спектральной интенсивности изображения Sс.д(ωx,ωy)
от круговой пространственной частоты ωx после фильтрации. И, на+
конец, третьим, заключительным, этапом реализации описываемо+
а)
б)
в)
Рис. 3.9. Спектральные интенсивности дискретизированного изображе
ния: а – после первичной дискретизации; б – после фильтрации
с использованием импульсной функции вида sinx/x; в – то же
после прореживания отсчетов
59
Рис. 3.10. Изображение при оцифровке методом ослабления помехи про
странственной дискретизации (см. подразд. 3.4)
го метода является передескритизация профильтрованного изобра+
жения, в результате которой частота пространственной дискретиза+
ции становится равной ωд. Достигается это путем прореживания (де+
цимации) отсчетов в n раз, как по горизонтали, так и по вертикали.
В результате этой операции количество отсчетов на изображении
уменьшается до величины, еще обеспечивающей выполнение теоре+
мы отсчетов, а спектральная интенсивность дискретизированного
изображения становится такой, как показано на рис. 3.9, в. Следует
иметь в виду, что при этом линейные размеры воспроизводимого изоб+
ражения также уменьшаются в n раз. Проведенные нами исследова+
ния показали высокую эффективность этого метода. Для его реали+
зации достаточно предварительную частоту пространственной диск+
ретизации увеличить всего лишь в два или три раза (n = 2…3) по
отношению к основной. На рис. 3.10 показано изображение, которое
было оцифровано с использованием описанного метода при n = 2.
Число отсчетов на этом изображении то же самое, что и на изображе+
нии, показанном на рис. 3.7, б, однако помеха пространственной дис+
кретизации на нем практически отсутствует.
Этот метод легко может быть распространен также на ослабление
помехи временной дискретизации движущихся изображений. Прин+
цип его реализации очевиден и пояснений не требует.
3.5. Растры, применяемые при дискретизации изображений
До сих пор при рассмотрении дискретизации изображений счита+
лось, что спектр дискретизируемого изображения ограничен прямоу+
гольником (в частном случае квадратом) со сторонами 2ωxгр, 2ωyгр.
В этом случае при выполнении теоремы отсчетов можно получить
60
наиболее плотную упаковку основного и побочных спектров на час+
тотной плоскости, как, например, показано на рис. 3.5. Однако, как
было отмечено в подразд. 1.4, линии постоянной спектральной ин+
тенсивности большинства изображений скорее напоминают ромбы
или квадраты, повернутые относительно своего центра на угол 45°.
Поэтому, желая ограничить спектр реального изображения по про+
странственным частотам с внесением ми+
нимальных искажений, его следует огра+
ничивать по линиям постоянной спект+
ральной интенсивности, в результате чего
область, занимаемая таким спектром,
приобретает форму квадрата, повернуто+
го относительно своего центра на угол 45°,
как это показано на рис. 3.11 штрихов+
кой. Полагая ωгр = ωxгр = ωyгр, что вполне Рис. 3.11. Область, зани
допустимо, приходим к заключению, что
маемая спект
ром типичного
для того чтобы при ортогональной диск+
изображения
ретизации изображения с таким спектром
избежать наложения побочных спектров
на основную компоненту, необходимо частоту пространственной дис+
кретизации выбирать из условия ωд ≥ 2ωгр. При этом спектр дискрети+
зированного изображения будет иметь вид, приведенный на рис. 3.12.
Рис. 3.12. Спектр дискретизированного типичного изображения при ор
тогональной структуре дискретизации
61
На этом рисунке двойной штриховкой показана область, занимае+
мая основной компонентой спектра, одинарной штриховкой – обла+
сти, занимаемые компонентами побочных спектров, а кружками –
положения частоты пространственной дискретизации и ее гармоник.
Как следует из рисунка, упаковка основного и побочного спектров на
частотной плоскости при этом далека от совершенства – половина
частотной плоскости (не заштрихована) оказывается не занятой спек+
тральными компонентами. Достичь более плотной упаковки основ+
ного и побочных спектров в рассматриваемом случае можно, если при+
менить другую структуру расположения отсчетов на плоскости изоб+
ражения. Поясним это следующим образом. Повернем изображение,
спектр которого занимает область, показанную на рис. 3.11 штри+
ховкой, на 45°. Нетрудно видеть, что область, занимаемая спектром
повернутого изображения, будет иметь форму квадрата со стороной
2 ωгр, при этом ортогональная структура расположения отсчетов
с интервалом ∆ = 2π/ωд, где ωд ≥ 2 ωгр – частота пространственной
дискретизации обеспечит наиболее плотную упаковку основного и
побочных спектров на частотной плоскости (см. рис. 3.5). Обратим
внимание на то, что интервал пространственной дискретизации
в рассматриваемом случае увеличился в 2 раз. Это вызвано тем,
что ширина и высота области, занимаемой спектром изображения,
уменьшились в 2 благодаря его повороту. Если теперь после вы+
полнения пространственной дискретизации сделать обратный пово+
рот координатных осей, то повернется на 45° не только дискретизи+
рованное изображение, приняв свое нормальное положение, но и его
спектр, который будет иметь вид, показанный на рис. 3.13, при этом
структура расположения отсчетов на изображении окажется такой,
как показано на рис. 3.14. Эту структуру расположения отсчетов при+
нято называть шахматной. Применение шахматной структуры рас+
положения отсчетов позволяет в 2 раза сократить число отсчетов на
изображениях с рассмотренным спектром, а значит, и длину файлов,
в которые они записываются, без сколько+нибудь заметного сниже+
ния их качества. Обусловлено это тем, что и в направлении строк, и в
направлении столбцов шаг пространственной дискретизации при
шахматной структуре расположения отсчетов увеличивается в 2
раз.
Отсюда следует, что структура расположения отсчетов на дискре+
тизируемом изображении, при которой достигается наиболее плот+
ная упаковка основного и побочных спектров, а следовательно, и
минимальный размер файла, в который оно записывается, полно+
62
wy
wx
Рис. 3.13. Спектр дискретизированного типичного изображения при
шахматной структуре дискретизации
y
D
D
0
x
Рис. 3.14. Шахматная структура дискретизации
стью определяется видом его пространственного спектра. В настоя+
щее время кроме ортогональной и шахматной структур расположе+
ния отсчетов известны также треугольная, которая является опти+
мальной при анизотропном спектре изображения, и диагональная.
63
3.6. Метод уменьшения погрешностей интерполяции
При выводе изображений на экран дисплея или на печать иногда
возникает необходимость в увеличении их размеров. Достигается это
путем введения в изображения дополнительных строк и пикселей
(отсчетов) в строках. Так, например, при увеличении линейных раз+
меров изображения в 2 раза, необходимо в него ввести дополнитель+
ные строки, разместив их между уже имеющимися строками, а так+
же ввести дополнительные пиксели, поместив их между уже суще+
ствующими на изображении пикселями. При этом необходимо
определить величины яркости вставляемых в изображение пикселей.
В простейшем случае необходимые значения находят, применяя ин+
терполяцию нулевого порядка (Nearest Neighbor), когда значения яр+
кости вновь вставляемых пикселей делают равными значениям ярко+
сти пикселей, к которым они примыкают. Однако такой способ опре+
деления яркости вставляемых в изображения пикселей не является
наилучшим, так как приводит к повышению заметности растровой
структуры изображений, которая при больших увеличениях суще+
ственно снижает их качество.
Обращаясь к рассмотрению механизма этого явления, будем счи+
тать, что исходное изображение перед его пространственной дискре+
тизацией удовлетворяло теореме отсчетов и, следовательно, после
дискретизации оно свободно от шума, обусловленного наложением
спектров. Будем также считать, что интервал пространственной дис+
кретизации изображения ∆ одинаков в обоих направлениях. Кроме
того, для простоты рассмотрения примем, что распределение прозрач+
ности в апертуре воспроизводящего устройства постоянно, а сама
апертура имеет форму квадрата со стороной ∆. Рассмотрение удобно
провести в спектральной области. На рис. 3.15 приведена зависи+
мость спектральной интенсивности дискретизированного изображе+
ния Sс.д(ωx,ωy) от круговой пространственной частоты ωx, а также
амплитудно+частотная характеристика (АЧХ) апертуры воспроиз+
водящего устройства с равномерным распределением прозрачности,
описывающая эффект фильтрации изображения этой апертурой
K ( ωx, ωy ) =
sin(πωx ωд )
,
(πωx ωд )
где ωд = 2π/∆ – частота пространственной дискретизации.
Из рассмотрения спектра дискретизированного изображения и
АЧХ апертуры воспроизводящего устройства следует, что при его
воспроизведении, когда изображение преобразуется из дискретного
64
Рис. 3.15. К пояснению возникновения искажений в процессе преобразо
вания дискретизированного изображения в непрерывное
вида в непрерывный вид, возникают два вида искажений. Во+пер+
вых, побочные спектры дискретизированного изображения полнос+
тью не отфильтровываются, создавая на экране характерную растро+
вую структуру в виде квадратов с постоянной яркостью. Во+вторых,
K(ωx,ωy) заметно ослабляет верхние пространственные частоты ос+
новного спектра, который на рисунке показан штриховкой. Если
размер изображения невелик, то растровая структура мало заметна
в силу ограничений со стороны зрительной системы. Увеличение же
линейных размеров изображения в n раз с использованием интерпо+
ляции нулевого порядка приводит к увеличению в n раз размеров
вновь формируемых пикселей, которые образуются путем объедине+
ния смежных вставляемых пикселей, имеющих ту же яркость, что и
исходный. Увеличение размера пикселей делает их более заметными
для зрителя, ухудшая общий вид изображения. Обращаясь к спект+
ральному представлению изображения, обратим внимание на то, что
в рассматриваемом случае увеличение изображения влечет за собой
сужение его пространственного спектра в n раз, а также сжатие по
оси ωx в это же число раз K(ωx,ωy) вследствие уменьшения в n раз
частоты пространственной дискретизации, обусловленной увеличе+
нием размеров вновь формируемых пикселей. Другими словами, гра+
фик, показанный на рис. 3.15, в рассматриваемом случае сжимается
в n раз по горизонтальной оси, не претерпевая каких+либо других
изменений. Из изложенного следует, что увеличение изображения
при использовании интерполяции нулевого порядка не приводит
к каким+либо дополнительным его искажениям, видимое же сниже+
ние качества всецело обусловлено изменившимися условиями наблю+
дения, при которых ограничения со стороны остроты зрения оказа+
лись ослабленными. Этот же результат будет иметь место, если уве+
личение изображения осуществить оптическим способом.
65
Заметность растровой структуры на изображении можно суще+
ственно ослабить, если значения яркости вставляемых пикселей оп+
ределять, используя более совершенные методы интерполяции. Дей+
ствительно, поскольку исходное дискретизируемое изображение со+
гласно принятому допущению удовлетворяло условиям теоремы
отсчетов, то, используя формулу (3.5), можно определять значения
яркости изображения в любых точках, в том числе и в точках вновь
вставляемых пикселей при его увеличении. В этом случае мы будем
иметь дело только с увеличением размера изображения без сопутству+
ющего ему увеличения размеров пикселей, так как яркость каждого
вновь вставляемого пикселя будет определяться не яркостью исходно+
го, который при интерполяции нулевого порядка как бы увеличи+
вался в размерах, а действительной яркостью исходного не дискре+
тизированного изображения в этой точке. На рис 3.16 показаны
спектр дискретизированного изображения для этого случая и АЧХ
апертуры воспроизводящего устройства. Из рисунка следует, что уве+
личение изображения при использовании интерполяции, определяе+
мой формулой (3.5), приводит только к сужению его пространствен+
ного спектра (в данном примере в 3 раза) без какого+либо изменения
АЧХ. Кроме того, благодаря сужению пространственного спектра
изображения, обусловленного увеличением изображения, амплитуд+
но+частотные искажения, вносимые в изображение апертурой вос+
производящего устройства, существенно уменьшаются, как и иска+
жения, связанные с неполным подавлением побочных спектров, по+
скольку они оказываются в той области частотного пространства,
где значения K(ωx,ωy) невелики. На практике интерполяцию, близ+
кую к рассматриваемой, нетрудно получить, если в суммах формулы
Рис. 3.16. К пояснению метода уменьшения ошибок интерполяции при
увеличении цифровых изображений
66
(3.5) использовать не более 10 членов. Так, например, при изготов+
лении изображения, приведенного на рис. 3.10, было применено уве+
личение в 2 раза с использованием описанного метода интерполя+
ции.
Применяемые в настоящее время графические редакторы, напри+
мер PhotoShop, предлагают использование трех видов интерполяции
при увеличении изображений: интерполяцию нулевого порядка
(Nearest Neighbor), интерполяцию первого порядка (Bilinear) и би+
кубическую интерполяцию (Bicubic). Из трех предлагаемых методов
последний метод, являясь наилучшим, тем не менее, несколько ус+
тупает рассмотренному нами методу интерполяции с использовани+
ем функции отсчетов.
В заключение отметим, что аналогичные по своему существу ме+
тоды можно использовать и используют в целях уменьшения замет+
ности мельканий движущихся изображений, например в кино, «раз+
множая» проектируемые на экран кадры путем перекрывания их про+
екции обтюратором.
3.7. Квантование изображений по яркости
Любая величина, подлежащая цифровой обработке, в том числе
яркость пикселя, должна быть представлена в виде двоичного кода.
Обрабатываемые изображения представляются в виде матрицы це+
лых чисел Lскв, описывающих значения яркости в точках взятия
отсчетов
Lс.кв =
(
)
Lс max
an0 2n0 −1 + an0 −12n0 −2 + ... + a120 ,
m −1
где Lс max – максимальное значение яркости в изображении; ak = 1 или
n
0; k = 1, 2, …, n0; m – число уровней квантования, m= 2 0 , n0 – число
разрядов двоичного кода на один отсчет (пиксель) изображения.
Преобразование аналоговой величины Lс, представляющей зна+
чение яркости в точке отсчета, которая может принимать любые зна+
чение в интервале 0 ÷ Lс max, в квантованную величину Lс.кв, прини+
мающую только дискретные значения, называется квантованием.
Квантование является нелинейным преобразованием сигнала. От+
метим, что результат любого измерения, представленный числом
с ограниченным количеством разрядов, можно рассматривать как
квантованный. Таким образом, все величины, с которыми мы имеем
дело в жизни и в инженерной практике, являются квантованными
значениями. Главной характеристикой, описывающей работу кванту+
ющего устройства, является его амплитудная характеристика. Ампли+
67
тудная характеристика квантующего устройства представляет собой
зависимость значения выходного сигнала от его входного значения.
На рис. 3.17, а в качестве примера приведена амплитудная характе+
ристика квантующего устройства с равномерной шкалой квантова+
ния. На практике применяют также неравномерные шкалы кванто+
вания. В отличие от равномерной шкалы квантования, при неравно+
мерной шкале квантования пороговые уровни и уровни квантования
располагаются друг относительно друга на неодинаковом расстоя+
нии. В качестве примера на рис. 3.17, б приведена амплитудная ха+
рактеристика квантующего устройства с неравномерной шкалой кван+
тования. Квантующие устройства с неравномерной шкалой кванто+
вания сложнее в своей реализации, но в ряде случаев они обеспечива+
ют заметно лучшие результаты, чем квантующие устройства, у кото+
рых шкала квантования равномерная.
При квантовании в исходный сигнал, например сигнал, опреде+
ляющий яркость изображения в точке отсчета Lс, вносится ошибка,
называемая шумом квантования. Величина этой ошибки равна
Lш.кв = Lс.кв − Lс.
Одной из важнейших характеристик шума квантования являет+
ся его средний квадрат (дисперсия)
σ2ш.кв = L2ш.кв.
а)
б)
Рис. 3.17. Амплитудные характеристики квантующих устройств: а –
случай равномерной шкалы квантования; б – случай неравно
мерной шкалы квантования
68
Средний квадрат шума квантования σ2ш.кв зависит:
– от среднего квадрата квантуемого сигнала L2с;
n
– от числа уровней, на которое квантуется сигнал, т. е. от m= 2 0 ,
где n0 – число двоичных разрядов, которым представляется кванто+
ванное значение сигнала Lс;
– от взаимного расположения пороговых уровней и уровней кван+
тования;
– от плотности вероятности квантуемого сигнала W.
В том случае, если шкала квантования задана, средний квадрат
шума квантования можно определить следующим образом
σ2ш.кв = L2сσ20 ( n0, W ),
(3.6)
где n0 = log2m, σ20 (n0,W) – средний квадрат шума квантования сигна+
ла на m уровней при условии, что средний квадрат самого квантуемо+
го сигнала равен единице, а распределение его по яркости описывает+
ся плотностью вероятности W. Другими словами, средний квадрат
шума квантования прямо пропорционален среднему квадрату кван
туемого сигнала. Это положение носит принципиально важный ха+
рактер, и к нему мы будем в дальнейшем обращаться.
Если квантуемый сигнал распределен равномерно в интервале значе+
ний 0 ÷ Lс max, оптимальной, т. е. обеспечивающей минимальный уро+
вень шума квантования, будет равномерная шкала. При этом шаг кван+
тования δкв, представляющий разность двух смежных уровней кванто+
вания Lквk и Lквk–1 с номерами k и k – 1, будет постоянным δкв = const и
равным δкв = Lсmax/(m – 1).
При оцифровке изображений используется равномерная шкала
квантования, несмотря на то, что в данном случае она не является
оптимальной, поскольку закон распределения яркости в изображе+
нии не является равномерным. Обусловлено это тем, что при равно+
мерной шкале после кодирования мы получаем код, который пред+
ставляет номер уровня квантования в виде двоичного числа, удобно+
го для дальнейшего использования. В этом случае, если число уровней
квантования m ≥ 8, то, как и при равномерном распределении кван+
туемого сигнала, можно считать, что средний квадрат шума кван+
тования равен σ2кв = δ2кв 12. Подставляя в эту формулу значение δкв,
имеем
σ2кв =
L2сmax
( m − 1)2 12
,
69
откуда выражение для отношения сигнал/шум Ψ = Lсmax/sкв может
быть записано в виде Ψ = (m – 1)/√12. Плотность вероятности шума
квантования в рассматриваемом случае описывается выражением
δ
δ
⎧ 1
при − кв ≤ Lш ≤ кв ,
⎪
2
2
W ( Lш ) = ⎨ δкв
⎪0 − при невыполнении этого условия.
⎩
Ширина спектра шума квантования, как показывают расчеты и
экспериментальные исследования, определяется числом уровней
квантования и спектром квантуемого сигнала и во много раз превы+
шает последний.
Для уменьшения уровня шума квантования используют неравно+
мерные шкалы, распределение пороговых уровней θnk и уровней кван+
тования νкв.k в которых согласовано с плотностью вероятности W(ν)
квантуемого сигнала ν. Примером использования неравномерных
шкал может служить квантование сигнала ошибки предсказания в
дифференциальной кодово+импульсной модуляции. Такие квантую+
щие устройства называются оптимальными квантователями, или
квантователями Ллойда – Макса. Шкала квантования оптималь+
ных квантователей определяется следующим образом:
ν + ν квk+1
θпk = квk
, ν квk =
2
θпk +1
∫
νW ( ν ) dν /
θпk
θпk +1
∫
W ( ν ) dν.
θпk
В табл. 3.1 приведены значения пороговых уровней и уровней кван+
тования, полученные в результате решения этих уравнений для слу+
чая, когда средний квадрат квантуемого сигнала ν равен единице.
Таблица 3.1. Значения пороговых уровней и уровней квантования для оп
тимального квантователя
Значение уровня для следующего вида распределения квантуемого сигнала
n0
равномерное
qnk
1
2
70
–1,7320
0,0000
1,7320
–1,7320
–0,8660
0,0000
0,8660
1,7320
nnk
–0,8660
0,8660
–1,2990
–0,4330
0,4330
1,2990
нормальное
qnk
– ¥
0,0000
¥
– ¥
–0,9816
0,0000
0,9816
¥
nnk
–0,7979
0,7979
–1,5104
–0,4528
0,4528
1,5104
Лапласа
qnk
– ¥
0,0000

¥
–¥

–1,1269
0,0000
1,1269
¥
nnk
–0,7071
0,7071
–1,8340
–0,4198
0,4198
1,8340
Продолжение табл. 3.1
Значение уровня для следующего вида распределения квантуемого сигнала
n0
равномерное
nnk
qnk
3
4
–1,7320
–1,2990
–0,8660
–0,4330
0,0000
0,4330
0,8660
1,2990
1,7320
–1,7320
–1,5155
–1,2990
–1,0825
–0,8660
–0,6495
–0,4330
–0,2165
0,0000
0,2165
0,4330
0,6495
0,8660
1,0825
1,2990
1,5155
1,7320
–1,5155
–1,0825
–0,6495
–0,2165
0,2165
0,6495
1,0825
1,5155
–1,6237
–1,4072
–1,1907
–0,9742
–0,7577
–0,5412
–0,3247
–0,1082
0,1082
0,3247
0,5412
0,7577
0,9742
1,1907
1,4072
1,6237
нормальное
qnk
Лапласа
nnk
– ¥
–1,7479
–1,0500
–0,5005
0,0000
0,5005
1,0500
1,7479

¥
– ¥
–2,4008
–1,8435
–1,4371
–1,0993
–0,7995
–0,5224
–0,2582
0,0000
0,2582
0,5224
0,7995
1,0993
1,4371
1,8435
2,4008

¥
qnk
–2,1519
–1,3439
–0,7560
–0,2451
0,2451
0,7560
1,3439
2,1519
–2,7326
–2,0690
–1,6181
–1,2562
–0,9423
–0,6568
–0,3880
–0,1284
0,1284
0,3880
0,6568
0,9423
1,2562
1,6180
2,0690
2,7326
–¥

–2,3796
–1,2527
–0,5332
0,0000
0,5332
1,2527
2,3796

¥
–¥

–3,7240
–2,5971
–1,8776
–1,3444
–0,9198
–0,5667
–0,2664
0,0000
0,2664
0,5667
0,9198
1,3444
1,8776
2,5971
3,7240
¥
nnk
–3,0867
–1,6725
–0,8330
–0,2334
0,2334
0,8330
1,6725
3,0867
–4,4311
–3,0169
–2,1773
–1,5778
–1,1110
–0,7287
–0,4048
–0,1240
0,1240
0,4048
0,7287
1,1110
1,5778
2,1773
3,0169
4,4311
Таблица 3.2. Значения σ20 ( n0, W ) для оптимального квантователя
Распределение
Равномерное
Нормальное
Лапласа
σ20 ( n0 , W ) при различных распределениях квантуемого сигнала и
различных n0
1
2
3
4
0,25
3,63·10–1
0,5
6,25·10–2
1,16·10–1
1,76·10–1
1,56·10–2
3,54·10–2
5,45·10–2
3,90·10–3
9,89·10–3
1,56·10–2
Средний квадрат шума квантования в оптимальном среднеквад+
ратичном квантователе при квантовании сигнала, дисперсия кото+
71
рого составляет единицу, равен
σ20
m −1
θпk +1
( n0,W ) = 1 − ∑ ( ν квk ) ∫
k=0
2
W ( ν ) dν.
θпk
В табл. 3.2 приведены значения σ20 ( n0, W ), рассчитанные по этой
формуле для трех плотностей распределения вероятностей.
3.8. Ложные контуры
При квантовании изображений по яркости, как уже было отмече+
но, в них вносятся искажения, которые при недостаточном количе+
стве уровней квантования проявляются на изображениях в виде так
называемых ложных контуров. Ложные контуры особенно заметны
на участках изображений с плавным изменением яркости. На рис. 3.18
в качестве примера показана исходное изображение и это же изобра+
жение, проквантованное на 2, 4 и 8 уровней, соответственно. Для того
чтобы ложные контуры были незаметными, в случае полутонового
нецветного изображения, оно должно быть проквантовано не менее
чем на 128 уровней. Используемый в настоящее время стандарт пре+
дусматривает квантование таких изображений на 256 уровней, т. е.
для представления яркости каждого пикселя отводится 8 двоичных
единиц (один байт).
По этим же причинам при квантовании цветных изображений,
включающих в себя три компоненты R, G, B (красное, зеленое и си+
а)
б)
в)
г)
Рис. 3.18. К пояснению заметности на изображениях ложных конту
ров: а – изображение проквантовано на 256 уровней; б – изобра
жение проквантовано на 8 уровней; в – изображение прокван
товано на 4 уровня; г – изображение проквантовано на 2 уров
ня
72
нее), каждая из компонент квантуется на 256 уровней, при этом на
представление одного пикселя затрачивается 3 байта. Эта цветовая
палитра называется True Color.
Заметность ложных контуров на изображении можно ослабить,
если перед квантованием к отсчетам изображения добавить псевдо+
случайную последовательность с малой дисперсией (псевдошум).
В этом случае на участках изображения с плавным изменением ярко+
сти пересечение квантуемым сигналом пороговых уровней за счет до+
бавленной псевдослучайной последовательности будет происходить
в случайных местах, благодаря чему размываются и становятся ме+
нее заметными границы ложных контуров. Аналогичный результат
получается и при добавлении к квантуемому изображению специаль+
ной периодической последовательности (Pattern). Описанный метод
используется в графических редакторах, например в редакторе
PhotoShop, при переходе от True Color к палитре с индексированны+
ми цветами. Недостатком этого метода является небольшое увеличе+
ние уровня шума на изображении.
3.9. Контраст, детальность, разрешение принтера и частота
пространственной дискретизации
Рассмотрим теперь такие понятия, как разрешение и контраст,
которые в значительной мере определяют качество воспроизведения
изображения. Контраст изображения представляет отношение мак+
симальной яркости в изображении (яркости в белом) к минимальной
яркости в изображении (яркости в черном). Контраст воспроизводи+
мого изображения определяется как контрастом исходного изобра+
жения, так и ограничениями со стороны воспроизводящего устрой+
ства, например кинескопа телевизора, или со стороны принтера.
Что касается разрешения, то здесь все не так просто. Впервые эта
проблема возникла в оптике, где для оценки качества оптических уст+
ройств был введен критерий разрешения Рэлея. В соответствии с этим
критерием при определении разрешающей способности исходили из
того, что две точки считались разрешаемыми, если первый минимум
дифракционной картины от первой точки совпадал с первым максиму+
мом от дифракционной картины от второй точки. Однако с развитием
фотографии стало ясно, что разрешение зависит, и в очень сильной
степени, также от уровня шума (в случае фотографии – зерна) на изоб+
ражении. При оцифровке же даже при очень низком уровне шума, вно+
симого в изображение устройством, используемым для его ввода,
в изображения вносятся дополнительные помехи, обусловленные глав+
ным образом его пространственной дискретизацией. Из этого следует,
что при определении разрешения помимо АЧХ устройства ввода не+
73
обходимо учитывать указанные выше помехи. Однако если эти поме+
хи свести к пренебрежимо малому уровню путем использования ме+
тода, описанного в подразд. 3.4, то в случае небольших амплитудно+
частотных искажений устройства ввода его разрешение будет одно+
значно определяться числом отсчетов (пикселей) на единицу длины.
Качество воспроизведения изображения в сильной степени зави+
сит как от числа уровней квантования, так и от разрешения, обеспе+
чиваемого всем процессом обработки, который включает в себя ввод
и оцифровку, собственно обработку и вывод. В случае вывода оциф+
рованных изображений на экран кинескопа число воспроизводимых
уровней квантования и обеспечиваемое им разрешение можно счи+
тать в первом приближении величинами независимыми, если только
сам кинескоп не вносит больших апертурных искажений. Совсем
иначе обстоит дело при выводе изображений на печать. Как извест+
но, при печати тот или иной уровень серого обеспечивается путем
заполнения пикселя (полутоновой ячейки) пятнами, формирующи+
ми точки того или иного размера (рис. 3.19). Чем больше пятен фор+
мируют точку, тем в большей степени она заполняет площадь пиксе+
ля черным, тем более темным он будет казаться зрителю на изобра+
жении, поскольку глаз, вследствие ограниченной остроты зрения,
отдельных точек не видит, а воспринимает только среднюю яркость
(зачерненность) пикселя. Количество уровней квантования m, кото+
рое можно воспроизвести таким способом, определяется отношени+
ем площади пикселя sпик к площади одного пятна sп плюс единица,
т. е. m = sпик/sп+1. На рис. 3.19 приведен пример для случая, когда
число уровней квантования, воспроизводимых печатающим устрой+
ством, составляет 256. При выводе изображений на печать необхо+
димо учитывать два важных параметра: число пикселей на единицу
длины nпик и число пятен на единицу длины nп. Первый характеризу+
Рис. 3.19. К пояснению принципа растровой печати полутоновых ахро
матических изображений
74
ет плотность отсчетов на изображении, второй – число пятен, кото+
рое печатающее устройство может воспроизвести на единицу длины.
Количество воспроизводимых уровней квантования при печати можно
определить также следующим образом:
m = ( nп nпик ) + 1.
2
Это соотношение всегда следует иметь в виду при работе с изобра+
жениями. До сих пор речь шла о выводе на печать черно+белых полу+
тоновых изображений. В случае вывода на печать цветных изобра+
жений ситуация усугубляется. Как известно, при трехцветной печа+
ти цветных изображений используются четыре краски: голубая,
желтая, пурпурная и черная. В соответствии с этим каждая точка в
пикселе составляется из четырех субточек: голубой, желтой, пур+
пурной и черной. При этом площадь такой составной точки увеличи+
вается в четыре раза, а линейный размер – в два раза. Этим объясня+
ется тот факт, что струйные принтеры в режиме цветной печати обес+
печивают в 2 раза меньшую (линейную) плотность печати.
В заключение следует упомянуть об одной новой технологии печа+
ти – стохастическом или частотно+модулированном растрировании.
В отличие от описанного способа печати, при котором используются
регулярные структуры – точки переменных размеров, расположен+
ные периодически, в технологиях частотно+модулированного растри+
рования точки фиксированного размера помещаются нерегулярным
образом. Однако частотно+модулированное растрирование – сравни+
тельно молодая технология и поэтому о ее достоинствах и недостат+
ках пока имеется мало достоверных сведений. Отмечается, что в этой
технологии наблюдается тенденция к увеличению размера точки при
печати.
3.10. Устройства ввода графической информации
Для ввода неподвижных изображений в память компьютера ис+
пользуют сканеры, реже – цифровые фотоаппараты. Наилучшими
характеристиками, определяющими качество введенного изображе+
ния, обладают сканеры с вращающимся барабаном.
Барабанные сканеры применяют в тех случаях, когда требуется
обеспечить очень высокое качество изображений, например, при из+
дании книг и альбомов по искусству. Однако до самого последнего
времени такие сканеры имели большие размеры, требовали высокой
квалификации обслуживающего персонала, а стоимость их состав+
ляла сотни тысяч долларов. Иметь такие сканеры могли позволить
себе только фирмы, специализирующиеся на сканировании изобра+
75
жений. Однако в последние годы ситуация существенно изменилась,
были разработаны небольшие по размерам сканеры с вращающимся
барабаном, которые могут быть размещены на рабочем столе. Эти
устройства соединяются с компьютерами Macintosh или PC, работа+
ющими в среде Windows. Сканеры этого типа имеют практически те
же характеристики, что и их старшие собратья, но стоят много де+
шевле.
Принцип действия барабанного сканера заключается в следую+
щем. Изображение фиксируется на прозрачном барабане, который
вращается с высокой скоростью (300–1350 об/мин), а на расстоянии
в несколько миллиметров от него находится модуль сканирующего
датчика. Внутри этого модуля находится мощный источник (гало+
генный или ксеноновый), свет которого фокусируется в виде малого
пятна на поверхности вращающегося изображения. Свет, отражен+
ный от поверхности изображения, попадает в модуль, проходит че+
рез малую диафрагму, определяющую размер пикселя, а затем через
цветоделительные зеркала, в которых он разделяется на три свето+
вых потока: красный, зеленый и синий. Эти световые потоки про+
ецируются на фотоэлектронные умножители (ФЭУ), сигналы, сни+
маемые с выходов ФЭУ, усиливаются и подаются на аналогово+циф+
ровые преобразователи (АЦП), где они преобразуются в цифровой
код. В случае сканирования прозрачного оригинала модуль датчика
освещает его изнутри барабана, так что свет от него проходит сквозь
оригинал и собирается снаружи него.
Барабанные сканеры, как правило, производят выборку от 10 до
16 бит на каждый цвет, благодаря чему обеспечивается большой ди+
намический диапазон, что позволяет сохранять детали изображения
даже в затененных зонах. Применение ярких источников света в мо+
дуле датчика, а также ФЭУ обеспечивает высокое отношение сигна+
ла к шуму, что необходимо для обеспечения большого динамическо+
го диапазона.
Разрешение барабанных сканеров определяется отношением диа+
метра барабана к диаметру диафрагмы и для современных моделей
лежит в пределах от 2500 до 8000 пикселей на дюйм.
В качестве примера приведем параметры двух типичных настоль+
ных барабанных сканеров. Настольный барабанный сканер DT+S1015
фирмы «Screen USA» имеет разрешение 2500 пикселей на дюйм при
10+битовой разрядности считывания на каждый цвет. Область ото+
бражения для этого сканера составляет 5,8×5,9 дюймов. Другим при+
мером является настольный барабанный сканер ColorGetter III Pro
фирмы «Optronics», разрешение которого составляет 8000 пикселей
76
на дюйм с динамическим диапазоном 4,0 и областью отображения
11×15 дюймов. Этот сканер по своим параметрам приближается к
барабанным сканерам высокого класса.
Планшетные сканеры являются наиболее распространенным ти+
пом устройств, применяемых для ввода изображений, что обуслов+
лено их невысокой стоимостью и малыми размерами. В планшетных
сканерах в качестве датчика сигнала изображения применяется при+
бор с зарядовой связью (ПЗС). В отличие от барабанных сканеров,
в планшетных сканерах сканируемое изображение помещается на
плоское стекло, отделяющее его от сканирующей головки, которая
перемещается относительно неподвижного изображения. В качестве
источника света в планшетных сканерах используют или флуорес+
центные источники света с холодным катодом, или вольфрамовые
галогенные лампы, что уменьшает выделение тепла, а следователь+
но, позволяет сканирующую головку поместить ближе к изображе+
нию. Разрешающая способность этих сканеров определяется коли+
чеством элементов в линейке ПЗС. При сканировании сигнал с выхо+
да ПЗС усиливается и подается на вход АЦП, где он преобразуется
в цифровой код. Динамический диапазон таких сканеров определя+
ется двумя факторами: разрядностью преобразования, т. е. числом
бит, которыми представляется отсчет в каждом цвете, и отношением
сигнала к шуму. Эти параметры должны быть согласованы между
собой. Одно только увеличение разрядности представления сигнала
при низком отношении сигнала к шуму не приводит автоматически к
увеличению динамического диапазона. Типичное значение разряд+
ности для планшетных сканеров, выпускаемых промышленностью
в настоящее время, составляет 10–12 бит на каждый цвет, а типич+
ное разрешение 600–1800 пикселей на дюйм.
В качестве примера приведем параметры двух типичных планшет+
ных сканеров. Планшетный сканер Epson 1200C имеет разрешение
600×1200 пикселей на дюйм при 10+битовой разрядности считыва+
ния на каждый цвет. Сканер предназначен для работы с компьютера+
ми PC и Macintosh. Применение дополнительного адаптера диапози+
тивов дает возможность с помощью этого сканера сканировать про+
зрачные оригиналы. В качестве другого примера назовем планшетный
сканер PowerLook фирмы Umax. Сканер обеспечивает разрешение
600×1200 пикселей на дюйм при 10+битовой глубине каждого цвета и
может оцифровывать как отражающие, так и прозрачные оригиналы.
В сканерах, как в барабанных, так и в планшетных, выполняется
предварительная обычно несложная цифровая обработка изображе+
ний.
77
В последние годы были разработаны и появились на рынке цифро+
вые фотоаппараты, которые могут быть использованы для ввода изоб+
ражений в компьютер. В этих фотоаппаратах в качестве светочув+
ствительного элемента применяются матрицы ПЗС. Получаемые изоб+
ражения записываются в сменные носители данных большой емкости
или на карточки флэш+памяти. Примером такого фотоаппарата яв+
ляется камера Digital IXUSII фирмы Canon, которая может записы+
вать изображения с разрешением до 2048×1536 пикселей.
78
4. ПРИМЕНЕНИЕ ЛИНЕЙНОЙ ФИЛЬТРАЦИИ ДЛЯ
УЛУЧШЕНИЯ КАЧЕСТВА ИЗОБРАЖЕНИЙ
4.1. Цели применения линейной фильтрация изображений
Линейная фильтрация изображений – это одна из наиболее часто
применяемых процедур обработки изображений в современных гра+
фических редакторах. Так, например, графический редактор
Photoshop представляет пользователю в меню 10 вариантов линей+
ной фильтрации, включая как различные варианты сглаживания
резких световых границ изображения, так и различные методы их
подчеркивания. Широкое применение линейной фильтрации при об+
работке изображений обусловлено тем, что она позволяет в значи+
тельной мере скорректировать целый ряд искажений, возникающих
как при получении, так и при передаче изображений. К этим искаже+
ниям, в первую очередь, относятся апертурные искажения, обуслов+
ленные несовершенством устройств (передающих телевизионных
камер, сканеров, цифровых фотоаппаратов), посредством которых
получаются изображения, а также ошибки, допущенные при съемке
(неточность фокусировки объектива, смаз изображения вследствие
недостаточно короткой экспозиции при съемке движущихся объек+
тов и т. д.). Линейная фильтрация применяется для ослабления за+
метности растровой структуры на изображениях, получаемых в ре+
зультате сканирования типографских репродукций. Как уже отме+
чалось в разд. 3, линейная фильтрация применяется также для
уменьшения помех, обусловленных наложением побочных спектров,
возникающих при пространственной дискретизации изображений.
Это касается и рассмотренного в разд. 3 метода ослабления помех
пространственной дискретизации, и просто фильтрации, приводя+
щей к ограничению пространственного спектра изображения при его
вводе в компьютер. Как уже было отмечено в подразд. 3.6, примене+
ние линейной фильтрации позволяет уменьшить ошибки интерпо+
ляции, т. е. заметность растровой структуры при воспроизведении
изображений, например, при их печати.
Посредством линейной фильтрации в известных пределах удается
несколько уменьшить заметность флюктуационного шума, а также
других дефектов на воспроизводимых изображениях.
Следует также отметить такие области применения линейной
фильтрации, как редактирование изображений, при котором дости+
гается их большая выразительность. Сюда относится подчеркива+
ние границ и сглаживание отдельных областей путем применения
фильтров с различными характеристиками.
79
4.2. Апертурные искажения изображений
Апертурные искажения являются линейными искажениями. Наи+
более общим способом описания этих искажений является задание
импульсной характеристики (импульсной функции, функции рассе+
яния точки, распределения прозрачности в апертуре) системы, вно+
сящей эти искажения. Обычно функция рассеяния точки не посто+
янна на всей плоскости изображения, а изменяется с изменением
координат x и y. В центре изображения кружок рассеяния, как пра+
вило, меньше, по краям изображения больше. Поскольку эти изме+
нения происходят плавно, то оказывается возможным все изображе+
ние разбить на так называемые изопланарные области, где функцию
рассеяния точки можно считать неизменной. Для каждой изопла+
нарной области можно ввести в рассмотрение частотную передаточ+
ную функцию, связанную с функцией рассеяния точки парой двумер+
ных преобразований Фурье. Так как вид этих частотных передаточ+
ных функций определяется природой возникновения рассматривае+
мых апертурных искажений, то рассмотрим их для каждого случая
отдельно.
1. Апертурные искажения, обусловленные неточной фокусиров
кой оптической системы.
Рассмотрим случай, когда сфокусированное изображение переме+
щается из фокальной плоскости. Для простоты пренебрежем влия+
нием дифракции и абберациями оптической системы. Функция рас+
сеяния точки при этом будет иметь вид кружка рассеяния с постоян+
ным распределением яркости радиусом R, т. е.
⎧⎪1 πR 2 при r ≤ R,
(4.1)
h ( r, θ ) = ⎨
при r > R.
⎪⎩0
где r – расстояние от центра; θ – полярный угол. В данном случае
частотная передаточная функция, как известно, может быть найде+
на следующим образом:
K ( ωr ,ϕ ) =
2π ∞
∫ ∫ h (r,θ) J0 ( ωr ,r ) r ⋅ dr ⋅ dθ,
0
(4.2)
0
где J0 ( ) – функция Бесселя 1+го рода нулевого порядка; ϕ – поляр+
ный угол в частотном пространстве; ωr – круговая пространственная
частота в полярной системе координат, связанная с круговыми про+
странственными частотами в декартовой системе координат соотно+
шениями
ωx = ωr cos ϕ, ωy = ωr sin ϕ.
80
(4.3)
Делая подстановку (4.1) в (4.2) и используя хорошо известное
для функций Бесселя соотношение
d ⎡ n
z Jn ( z ) ⎤ = zn Jn −1 ( z ),
⎦
dz ⎣
получим после интегрирования и подстановки пределов
K ( ωr , ϕ ) =
2J1 ( ωr , R )
ωr R
(4.4)
,
где J1 ( ) – функция Бесселя 1+го рода нулевого порядка. Применяя
соотношения (4.3) к (4.4), получим
K ( ωx , ωy ) =
2J1 ⎡⎣ R ( ωx cos ϕ + ωy sin ϕ ) ⎤⎦
R ( ωx cos ϕ + ωy sin ϕ )
.
(4.5)
На рис. 4.1 показана частотная передаточная функция, рассчитан+
ная по формуле (4.5). Особенностью этой функции является то, что на
определенных пространственных частотах она изменяет свой знак,
проходя через нуль, что обусловлено скачкообразным изменением фа+
зочастотной характеристики (ФЧХ) на угол, равный π. Первый раз
переход функции через нуль, так называемый первый предел разреше+
ния, соответствует круговой пространственной частоте ωr = 3,83/R.
Если с помощью рассматриваемой дефокусированной оптической сис+
темы спроецировать на экран миру, состоящую из группы сходящих+
K(ωx,ωy)
0
ωy
ωx
Рис. 4.1. Частотная передаточная функция дефокусированной оптиче
ской системы
81
ся полос, то на пространственной частоте штрихов, равной 3,83/R,
мы будем иметь нулевой контраст. На больших частотах, где частот+
ная передаточная функция принимает отрицательные значения, мы
вновь будем наблюдать штрихи миры, однако с «отрицательным кон+
трастом», т. е. в спроецированном изображении черным штрихам
миры будут соответствовать белые и наоборот. Этот эффект, называ+
емый в оптике ложным разрешением, будет повторяться при каж+
дом переходе частотной передаточной функции в область отрицатель+
ных значений. Наличие нулей у частотной передаточной функции
означает невозможность полной коррекции рассматриваемых иска+
жений, так как на частотах, где характеристика принимает нулевые
значения, информация об этих частотных составляющих полностью
теряется.
2. Апертурные искажения изображения, обусловленные смазом
вследствие недостаточно короткой экспозиции при съемке движу
щегося объекта.
В качестве примера рассмотрим фотографирование движущегося
объекта, при этом будем считать, что его изображение идеально сфо+
кусировано в плоскости фотопленки, скорость перемещения со+
ставляет v, м/с, в направлении координатной оси x, а экспозиция рав+
на Tэ, с. Если фотографируемым объектом является точка, например
звезда при фотографировании звездного неба без компенсации его пе+
ремещения, обусловленного вращением Земли, то поскольку в раз+
ные моменты времени она занимает на проекции изображения раз+
личные положения, на фотографии останется ее след в виде отрезка
линии протяженностью ∆x. Этот след может рассматриваться как
функция рассеяния точки. В данном случае искажения, обусловлен+
ные движением, носят одномерный характер и могут быть описаны
одномерной функцией рассеяния точки. Полагая, что движение про+
исходит в направлении оси x, запишем
⎧1 ∆x при x ≤ ∆x ,
⎪⎪
2
h(x ) = ⎨
∆
x
⎪0
при x >
,
⎪⎩
2
(4.6)
∆x = vTэ
(4.7)
где
Искажения, возникающие при фотографировании более сложных
объектов, могут быть найдены путем свертки их неискаженных изоб+
ражений с функцией рассеяния точки, описывающей результат сма+
за, обусловленный движением.
82
Найдем частотную передаточную функцию, описывающую иска+
жения, обусловленные недостаточно короткой экспозицией при фо+
тографировании движущегося объекта. Для этого подвергнем интег+
ральному преобразованию Фурье найденную функцию рассеяния точ+
ки (4.6)
∆x 2
1
exp ( −iωxx ) dx =
K ( ωx ) =
∆x −∆x 2
∫
⎛ ω ∆x ⎞
sin ⎜ x ⎟
⎝ 2 ⎠
ω
⎛ x ∆x ⎞
⎜
⎟
⎝ 2 ⎠
и с учетом (4.7) будем иметь
⎛ ω vT ⎞
sin ⎜ x э ⎟
⎝ 2 ⎠.
K ( ωx ) =
⎛ ωxvTэ ⎞
⎜
⎟
⎝ 2 ⎠
(4.8)
На рис. 4.2 приведена частотная передаточная функция, рассчи+
танная по формуле (4.8). Как и в предыдущем случае, частотная пе+
редаточная функция с увеличением пространственной частоты изме+
няет свой знак, проходя через нуль на частотах ωx = 2πn/vTэ, где n –
целое число. Как уже было отмечено, изменение знака частотной пе+
редаточной функции означает скачкообразное изменение ФЧХ на
угол, равный π. Наличие нулей означает невозможность полной кор+
рекции рассматриваемых искажений.
K(wx)
1
0,5
p
3p
0
2p
p
wxnTM
2
2p
3p
0,5
Рис. 4.2. Частотная передаточная функция, описывающая искажения,
возникающие вследствие смаза
83
Изложенное справедливо не только для фотографических уст+
ройств, но и для всех устройств, посредством которых производится
съемка изображений.
3. Апертурные искажения изображения, обусловленные несовер
шенством преобразователей изображения в сигнал.
Обратимся теперь к случаю, когда источником апертурных иска+
жений является датчик сигнала изображения. Из опыта работы с та+
кими датчиками (передающая телевизионная трубка, датчик сигнала
изображения на основе прибора с зарядовой связью и т. д.) известно,
что их функции рассеяния точки (в телевидении в этом случае чаще
используют термин «распределение прозрачности в апертуре») хоро+
шо аппроксимируются гауссовой функцией
h ( x, y ) =
⎛ x2 + y2 ⎞
1
exp
⎜⎜ −
⎟,
πre2
re2 ⎠⎟
⎝
(4.9)
где re – условный радиус кружка рассеяния, т. е. расстояние от его
центра, где h(x,y) уменьшается в e раз (e ≈ 2,72). На рис. 4.3 показа+
на функция рассеяния точки, построенная в соответствии с форму+
лой (4.9).
Найдем частотную передаточную функцию, соответствующую
функции рассеяния точки, которая задана формулой (4.9):
K ( ωx , ωy ) =
∞ ∞
⎡ x 2 + y2
⎤
1
exp ⎢ −
− i ( ωxx + ωy y ) ⎥ dxdy.
2
2
re
πre −∞ −∞
⎣
⎦
∫∫
Учитывая, что переменные в показателе степени разделяются,
запишем
h(x,y)
re
x
y
Рис 4.3. Типичная функция рассеяния точки преобразователя изобра
жения в сигнал
84
∞
∞
⎡ ⎛ x2
⎡ ⎛ y2
⎞⎤
⎞⎤
1
1
exp ⎢ − ⎜⎜ 2 + iωx x ⎟⎟ ⎥ dx
exp ⎢ − ⎜⎜ 2 + iωy y ⎟⎟ ⎥ dy.
πre −∞
πre −∞
⎢⎣ ⎝ re
⎢⎣ ⎝ re
⎠ ⎥⎦
⎠ ⎥⎦
K ( ωx , ωy ) =
∫
∫
Преобразуя выражение, стоящее в показателе степени подынтег+
ральной функции первого интеграла, к виду
2
⎛ x ireωx ⎞ re2ω2x
x2
i
+
ω
x
=
⎜ +
⎟ +
x
2 ⎠
4
re2
⎝ re
и выполнив аналогичные преобразования для второго интеграла,
получим
K ( ωx , ωy ) =
×
2⎤
⎡ ⎛
⎡ ⎛ r 2ω2 ⎞ ⎤ ∞
x ir ω ⎞
1
exp ⎢ − ⎜⎜ e x ⎟⎟ ⎥ exp ⎢ − ⎜ + e x ⎟ ⎥ dx ×
2 ⎠ ⎥
⎢ ⎝ re
πre
⎣⎢ ⎝ 4 ⎠ ⎦⎥ −∞
⎣
⎦
∫
⎡ ⎛ y ir ω ⎞2 ⎤
⎡ ⎛ re2ω2y ⎞ ⎤ ∞
1
e y
⎟ ⎥ exp ⎢ − ⎜ +
exp ⎢ − ⎜
⎟ ⎥ dy,
⎜
⎟
r
4
2
⎢
πre
⎢⎣ ⎝
⎥
e
⎝
⎠ ⎥⎦
⎠ ⎦ −∞
⎣
∫
что после несложных преобразований и интегрирования дает
(
)
⎡ re2 ω2x + ω2y ⎤
⎥.
(4.10)
K ( ωx , ωy ) = exp ⎢ −
⎢
⎥
4
⎣
⎦
На рис. 4.4 приведена частотная передаточная функция, постро+
енная в соответствии с формулой (4.10). Особенностью, отличающей
K(wx,wy)
wx
wy
Рис. 4.4. Типичная частотная передаточная функция преобразователя
изображения в сигнал
85
ее от ранее найденных частотных передаточных функций, является
то, что при всех значениях пространственных частот она остается
положительной, плавно стремясь к нулю при неограниченном их воз+
растании. Это указывает на отсутствие фазовых искажений при пре+
образовании изображения в сигнал рассматриваемыми датчиками
сигнала изображения.
При нахождении результирующей частотной передаточной функ+
ции необходимо учитывать все источники апертурных искажений.
Это можно сделать двумя путями:
– либо путем свертки исходного изображения с результирующей
функцией рассеяния точки, которая получается в результате свер+
ток функций рассеяния точки, учитывающих соответствующие ис+
точники апертурных искажений;
– либо путем перемножения спектра исходного изображения на
результирующую частотную передаточную функцию, которая нахо+
дится путем перемножений частотных передаточных функций, учи+
тывающих соответствующие источники апертурных искажений.
4.3. Фильтрация цифровых изображений методом свертки с
импульсной характеристикой
Фильтрация изображения Lc(x,y) методом свертки с импульсной
характеристикой h(x,y) является одним из распространенных мето+
дов фильтрации. В случае непрерывного ахроматического изображе+
ния эта операция может быть записана следующим образом:
∞ ∞
Lc Ω ( x, y ) =
∫ ∫ Lc ( ξ,η) h ( x − ξ,y − η,) dξdη,
(4.11)
−∞ −∞
где LcΩ(x,y) – распределение яркости в изображении после фильтра+
ции; ξ,η – переменные интегрирования. При реализации этого мето+
да фильтрации цифровым способом исходное изображение, изобра+
жение после фильтрации, а также импульсная характеристика пред+
ставляются в виде массивов чисел, элементы которых обозначим со+
ответственно Lc(k,n), LcΩ(k,n) и h(k,n), а номера строк и столбцов – k
и n. При этом яркость пикселей профильтрованного изображения
вычисляется следующим образом:
Lc Ω ( k,n ) =
K −1
2
N −1
2
∑K −1 ∑N −1 Lс ( k′,n′)h (k − k′,n − n′),
k′=−
2
n′ =−
(4.12)
2
где K и N – протяженность импульсной характеристики. Величины
K и N выбираются нечетными для того, чтобы избежать смещения
профильтрованного изображения относительно исходного.
86
При разработке цифрового фильтра импульсная характеристика
h(k,n) находится следующим образом.
Вначале, исходя из поставленных требований, находится частот+
ная передаточная функция аналогового фильтра K(ωx,ωy). Затем
путем применения к ней двумерного интегрального преобразования
Фурье находят соответствующую ей импульсную характеристику
h(x,y):
∞ ∞
1
K ( ωx , ωy ) exp ⎡⎣ i ( ωx x + ωy y ) ⎤⎦ dωxdωy.
(4.13)
4π2 −∞ −∞
Найденную таким образом импульсную характеристику необхо+
димо преобразовать в дискретную форму посредством ее простран+
ственной дискретизации, при этом шаг пространственной дискрети+
зации должен быть тем же самым, что и шаг пространственной диск+
ретизации фильтруемого изображения.
Следующей операцией, которую следует выполнить над дискре+
тизированной импульсной характеристикой, является ее усечение,
т. е. ограничение ее размеров по строкам и столбцам до разумных
пределов. Дело в том, что частотным передаточным функциям, огра+
ниченным в пространстве частот граничными частотами ωxгр,ωyгр,
соответствуют импульсные характеристики, не ограниченные в про+
странстве координат x,y. Сказанное поясняет рис. 4.5, на котором
изображены частотная передаточная функция фильтра нижних час+
тот и соответствующая ей импульсная характеристика.
h ( x, y ) =
а)
∫∫
б)
K(wx,0)
0
wx
h(x,0)
0
x
Рис. 4.5. Характеристики фильтра нижних частот: а – частотная пе
редаточная функция; б – соответствующая ей импульсная ха
рактеристика
87
Последней, заключительной, операцией является нормировка усе+
ченной импульсной характеристики, в результате которой сумма ее
отсчетов должна стать равной единице, т. е.
K −1
2
N −1
2
∑K −1 ∑N −1 h (k,n ) = 1.
k =−
2
n =−
(4.14)
2
Благодаря нормировке усеченной импульсной характеристики
обеспечивается правильное воспроизведение средней яркости в про+
фильтрованном изображении, которое иначе было бы нарушено вслед+
ствие операции усечения.
Обращаясь к проблеме усечения импульсной характеристики, от+
метим, что чем больше ее протяженность, тем больший объем вычис+
лений необходимо выполнить при реализации цифровой фильтра+
ции рассматриваемым методом. Кроме того, на большей части изоб+
ражения будет проявляться краевой эффект. Простое усечение
импульсной характеристики путем ее умножения на функцию окна
W(k,n), удовлетворяющую условию:
⎧1 при k , n ≤ N − 1 ,
⎪
W ( k,n ) = ⎨
2
⎪⎩0 − при невыполнении этого условия,
приводит к появлению нежелательной «волнистости» частотной пе+
редаточной функции, а также к ее расширению в частотной области.
Для достижения компромисса между протяженностью импульсной
характеристики в пространстве изображения и частотной передаточ+
ной функции в пространстве частот был разработан ряд окон специ+
альной формы, среди которых наиболее известными являются: треу+
гольное окно Бартлетта, окно Блэкмана, окно Ханна, окно Кайзера,
а также окно Хэмминга, удовлетворяющее условию:
⎧0,54 + 0,46cos 2πn при n ≤ N − 1 ,
⎪
W (n) = ⎨
N −1
2
⎪⎩0 − при невыполнении этого условия.
Важной особенностью этих окон является то, что при подходе
к границе усечения величина W(k,n) плавно убывает, благодаря чему
ослабляются эффекты «волнистости» и расширения частотной пере+
даточной функции.
После нахождения импульсной характеристики h(k,n) необходи+
мо ее исследовать на разделимость в отношении переменных k и n.
Если окажется, что она разделима, т. е. если выполняется равенство
88
h ( k,n ) = h ( k ) h ( n ),
где h(k), h(n) – одномерные импульсные характеристики, то выраже+
ние (4.12) можно преобразовать к виду
Lc Ω ( k,n ) =
K −1
2
N −1
2
∑K −1 h ( k − k′) ∑N −1 Lс ( k′,n′) h (n − n′).
k′ =−
2
n′=−
(4.15)
2
Вычисление значений LcΩ(k,n) по формуле (4.15) позволяет суще+
ственно сократить количество необходимых математических опера+
ций по сравнению с количеством математических операций, требуе+
мых при использовании формулы (4.12). Так, например, если при
вычислении LcΩ(k,n) по формуле (4.12) для определения значения
одного отсчета профильтрованного изображения требуется выпол+
нить (K–1)N операций умножения и (K–1)(N–1) операций сложе+
ния, то в случае вычисления LcΩ(k,n) по формуле (4.15) количество
необходимых операций умножения сокращается до величины K + N,
а количество операций сложения сокращается до величины K + N–2.
Если даже принять K = 7, N = 7, что совсем немного для типичных
задач фильтрации, то и в этом случае выигрыш в количестве необхо+
димых вычислительных затрат, обеспечиваемый за счет использова+
ния свойства разделимости импульсной характеристики, составит
3,5 раза в отношении операций умножения и 3 раза в отношении
операций сложения. На самом деле выигрыши, обеспечиваемые ис+
пользованием свойства разделимости импульсной характеристики,
значительно больше. Следует отметить, что ряд импульсных харак+
теристик, с которыми часто приходится иметь дело на практике, яв+
ляются разделимыми. К ним относятся: импульсная характеристи+
ка описываемая гауссовым законом, импульсная характеристика,
имеющая постоянное значение внутри прямоугольного окна, и неко+
торые другие.
Далее следует обратить внимание еще на два важных обстоятель+
ства, о которых следует помнить при разработке фильтра.
Во+первых, необходимо устанавливать ограничители на величи+
ну яркости профильтрованного изображения перед его представле+
нием восьмиразрядным кодом, предотвращающие ее выход за преде+
лы принятого динамического диапазона. Появление таких значений
яркости возможно, если на переходной характеристике фильтра име+
ются выбросы, обусловленные, например, резким спадом частотной
передаточной функции. В этом случае отсутствие ограничителей бу+
дет приводить к переполнению разрядной сетки, что повлечет за со+
89
бой появление на светлых участках профильтрованного изображе+
ния черных точек и пятен, а на темных – соответственно белых точек
и пятен. Применение ограничителей динамического диапазона сиг+
нала со стороны белого и со стороны черного устраняет эти артефак+
ты, хотя и вносит в профильтрованное изображение так называемый
шум ограничения.
Во+вторых, ограничение разрядной сетки приводит к возникнове+
нию своеобразных искажений – шума. Дело в том, что алгоритм филь+
трации методом свертки включает в себя операцию умножения, в ре+
зультате которого число разрядов кода, которым представляются от+
счеты профильтрованного изображения, оказывается равным сумме
чисел разрядов кода, используемых для представления исходного изоб+
ражения и импульсной функции. Поскольку и исходное изображение,
и импульсная характеристика обычно представляются восьмиразряд+
ными числами, то в результате фильтрации получается изображение,
представляемое шестнадцатиразрядным кодом. Для того чтобы перей+
ти к стандартному виду записи профильтрованного изображения, не+
обходимо привести его в восьмиразрядному представлению, т. е. про+
извести округление, из+за чего возникнет шум округления.
Изложенное полностью справедливо и применительно к фильтра+
ции цветного изображения с той разницей, что фильтрации должны
быть подвергнуты все три его компонента.
4.4. Фильтрация цифровых изображений
в спектральной области
Альтернативой методу свертки изображения с импульсной харак+
теристикой является фильтрация изображения в спектральной об+
ласти. Сущность метода заключается в том, что вначале массив от+
счетов, которым представлено исходное изображение Lc(x,y), в рас+
сматриваемом случае – ахроматическое изображение, преобразуется
по какому+либо базису в массив спектральных коэффициентов
Mc(u,v), а затем каждый из спектральных коэффициентов скалярно
умножается на соответствующий отсчет дискретной частотной пере+
даточной функции K(u,v):
MсΩ ( u,v ) = Mс ( u,v ) K ( u,v ),
где McΩ(u,v) – спектральные коэффициенты профильтрованного
изображения; u,v – индексы, определяющие положение спектраль+
ных коэффициентов, а также отсчетов частотной передаточной фун+
кции в столбце и строке соответствующего массива. Заключитель+
ным этапом этого метода фильтрации является преобразование
90
найденного массива спектральных коэффициентов в массив отсчетов
профильтрованного изображения LcΩ(k,n).
Описанный метод полностью аналогичен фильтрации аналогово+
го изображения Lc(x,y) в частотной области. Напомним, что в этом
случае для исходного изображения путем двумерного интегрального
преобразования Фурье находится его спектр Mc(ωx,ωy), который за+
тем умножается на частотную передаточную функцию K(ωx,ωy), а
полученный таким образом спектр профильтрованного изображения
McΩ(ωx,ωy) путем обратного двумерного интегрального преобразова+
ния Фурье преобразуется в профильтрованное изображение LcΩ(x,y).
Такой метод фильтрации, в частности, может быть реализован опти+
ческим способом. При фильтрации изображения в частотной облас+
ти следует внимательно подходить к определению дискретной час+
тотной передаточной функции фильтра K(u,v). Обычно частотная
передаточная функция цифрового фильтра определяется на основе
предварительно найденной частотной передаточной функции анало+
гового фильтра K(ωx,ωy). Однако следует сразу же предостеречь от
соблазна получить K(u,v) путем простой дискретизации функции
K(ωx,ωy). Дело в том, что вид K(u,v), как и вид Mc(u,v), определяет+
ся базисом, используемым при вычислении спектральных коэффи+
циентов цифрового изображения. На рис. 4.6 показаны дискретные
спектры Mc(u,v) одного и того же изображения, но полученные пу+
тем его преобразования по двум различным базисам. В одном случае
при определении спектральных коэффициентов Mc(u,v) было ис+
Рис. 4.6. Зависимость амплитуды спектральных коэффициентов от
индекса u для ДКП и ДПФ
91
пользовано дискретное косинусное преобразование (ДКП), а в дру+
гом – дискретное преобразование Фурье (ДПФ). Из рисунка видно,
что для двух различных базисов дискретные спектры сильно разли+
чаются между собой. Поэтому определение K(u,v) необходимо осу+
ществлять следующим образом. Вначале на основе известной анало+
говой частотной передаточной функции K(ωx,ωy) посредством дву+
мерного интегрального преобразования Фурье (4.13) находится
соответствующая ей импульсная характеристика h(x,y), которая
подвергается пространственной дискретизации с тем же интервалом,
что и фильтруемое изображение. Затем выполняется нормировка
дискретной импульсной характеристики с тем, чтобы сумма всех ее
отсчетов равнялась бы единице. И только после этого вычисляется
дискретная частотная передаточная функция K(u,v) путем примене+
ния к h(k,n) двумерного ортогонального преобразования с использо+
ванием тех же базисных функций, что и при вычислении спектраль+
ных коэффициентов.
При фильтрации цветного изображения все перечисленные выше
операции выполняются над тремя его компонентами.
В заключение сравним два метода линейной фильтрации изобра+
жений и дадим рекомендации относительно их применения.
В случае, если импульсная характеристика фильтра имеет боль+
шую протяженность и соответственно частотная передаточная фун+
кция – малую протяженность, метод фильтрации изображения в ча+
стотной области с учетом вычислительных затрат на прямое и обрат+
ное ортогональные преобразования может оказаться предпочтитель+
нее вследствие меньших вычислительных затрат при его выполне+
нии. Однако, как правило, в большинстве практических случаев
метод свертки фильтруемого изображения с импульсной характерис+
тикой требует меньших вычислительных затрат и поэтому оказыва+
ется лучшим.
4.5. Подчеркивание световых границ на изображениях
Опыт показывает, что фотографические и телевизионные изобра+
жения с подчеркнутыми границами субъективно воспринимаются как
изображения более высокого качества, чем фотометрически точные
репродукции. Более того, мелкие объекты на таких изображениях
обнаруживаются и опознаются быстрее и легче. Объяснить этот эф+
фект можно, видимо, тем, что при наблюдении изображений в усло+
виях хорошей освещенности в первичных отделах зрительной систе+
мы человека также происходит подчеркивание границ в результате
воздействия тормозных зон рецептивных полей сетчатки. Поэтому,
92
подчеркивая границы на изображении, мы как бы помогаем зритель+
ной системе, поскольку основой опознавания семантических изобра+
жений являются их границы и контуры.
В ахроматическом изображении под границей понимается линия,
разделяющая две области на изображении Lc(x,y), на которой проис+
ходит скачок яркости. В случае цветного изображения граница мо+
жет быть образована как скачком яркости, так и изменением цвето+
вого тона (в меньшей степени насыщенности). Как и ранее, рассмот+
рение проведем на примере ахроматических изображений. Формально
граница может быть определена как геометрическое место точек, где
абсолютное значение градиента функции достигает своего максималь+
ного значения, а оператор Лапласа
∆ ( x, y ) =
∂2Lс ( x, y )
∂x2
+
∂2Lс ( x, y )
∂y2
=0
при условии, что он расположен между двумя своими экстремумами,
что соответствует точке перегиба функции Lc(x,y). Рис. 4.7, на кото+
ром показаны зависимости Lc(x,y), gradLc(x,y) и ∆(x,y) для случая
вертикальной границы на изображении, поясняет изложенное.
В настоящее время для подчеркивания границ разработан ряд ли+
нейных и нелинейных методов. Ограничиваясь в этой главе линей+
ными методами, рассмотрим вначале подчеркивание границ методом
нерезкого маскирования, после чего рассмотрим другие методы под+
черкивания границ, применяемые в настоящее время.
Рис. 4.7. Зависимости Lc(x,y), gradLc(x,y) и ∆(x,y) от x применительно
к случаю вертикальной границы на изображении
93
4.6. Подчеркивание световых границ методом
нерезкого маскирования
При использовании метода нерезкого маскирования подчеркива+
ние границ на изображении достигается за счет того, что из исходно+
го изображения Lc(x,y) вычитается его оператор Лапласа ∆(x,y), ум+
ноженный на весовой коэффициент b. При этом распределение ярко+
сти в изображении с подчеркнутыми границами вычисляется по
формуле
Lс.гр ( x, y ) = Lс ( x, y ) − b∆ ( x, y ).
(4.16)
Изменяя величину весового коэффициента b, можно изменять сте+
пень подчеркивания границ. На рис. 4.8 показаны зависимость яр+
кости в исходном изображении вертикальной световой границы от
координаты x, зависимость значения оператора Лапласа от x и зави+
симость яркости от x в изображении с подчеркнутыми границами. Из
рисунка видно, что на графике зависимости Lc.гр(x,y) вследствие под+
черкивания границ появились два выброса, а сама зависимость в точке
перегиба стала круче, благодаря чему создается впечатление повы+
шенной резкости границы.
При использовании метода нерезкого маскирования величина ве+
сового коэффициента подбирается экспериментально, при этом сле+
дует помнить, что выбор слишком большого значения b приводит
к появлению на изображениях неприятных окантовок, а также к
возрастанию уровня шума.
Рис. 4.8. Зависимость Lc(x,y), ∆(x,y) и Lc.гр(x,y) от координаты x при
менительно к случаю вертикальной границы на изображении
94
Впервые метод нерезкого маскирования был применен в фотогра+
фии, а затем довольно успешно использовался при создании специ+
альных кинофильмов, предназначенных для передачи по системам
телевизионного вещания. В последнем случае за счет подчеркивания
границ создавалась иллюзия большей четкости изображений на эк+
ранах телевизоров. В случае изображения с подчеркнутыми граница+
ми фотографическим способом при его печати на негатив накладыва+
ется так называемая маска, которая представляет собой нерезкую
позитивную версию изготавливаемого изображения.
В настоящее время используются два других способа.
В одном из этих способов изображение с подчеркнутыми граница+
ми получается следующим образом:
Lс.гр ( x, y ) = cLс ( x, y ) − ( c − 1) LсΩ ( x, y ),
где LcΩ(x,y) – нерезкая версия исходного изображения, а c – весовой
коэффициент. Обратим внимание на то, что в этом выражении при
всех значениях весового коэффициента обеспечивается правильное
воспроизведение средней яркости изображения.
Нерезкая версия исходного изображения в этом способе получает+
ся путем свертки исходного изображения с гауссовой импульсной
характеристикой,
В другом способе подчеркивание границ методом нерезкого маски+
рования достигается непосредственно путем свертки исходного изоб+
ражения Lc(k,n) с импульсной характеристикой вида
−b
0
0
h ( k,n ) = −b 1 + 4b −b .
−b
0
0
При этом изображение с подчеркнутыми границами вычисляется
по формуле
Lc.гр ( k,n ) =
1
1
∑ ∑
'
'
Lс ( k′,n′ )h ( k − k′,n − n′ ).
k = −1 n = −1
При подчеркивании границ в цветном изображении операция под+
черкивания применяется ко всем трем его компонентам.
Рассмотренный метод используется в современных графических
редакторах, например в редакторе Photoshop. Однако, работая в этом
графическом редакторе, следует иметь в виду, что в нем применена
модифицированная версия фильтрации методом нерезкого маскиро+
вания. Подробнее эта модификация описана в подразд. 4.9.
95
4.7. Другие методы подчеркивания световых границ
на изображениях
Другим методом, который близок методу нерезкого маскирования,
является метод свертки исходного изображения с корреляционной
маской, элементы которой определяются коэффициентами корреля+
ции отсчетов на изображении. Поскольку реальные изображения
могут быть промоделированы двумерным процессом Маркова перво+
го порядка, то для них корреляционная маска (импульсная функ+
ция) может быть представлена следующим образом:
ρnρk
(
h ( k,n ) = −ρk 1 + ρ2n
ρnρk
(
−ρn 1 + ρ2k
)
) (1 + ρ )(1 + ρ )
−ρ (1 + ρ )
2
n
n
2
k
2
k
ρnρk
(
)
−ρk 1 + ρ2n ,
ρnρk
где ρk, ρn – коэффициенты корреляции между соседними по строке и
столбцу отсчетами на изображении.
В частном случае, когда ρk = ρn = 0, т. е. в случае отсутствия корре+
ляции между соседними отсчетами изображения, в результате сверт+
ки исходного изображения с маской подчеркивания границ не проис+
ходит.
В другом частном случае, при ρk = ρn = 1, подчеркивание границ
достигает максимума, а корреляционная маска переходит в маску
Лапласа:
1 −2 1
h ( k,n ) = −2 4 −2 .
1 −2 1
Замечательным свойством метода нерезкого маскирования явля+
ется то, что степень подчеркивания границ при его использовании не
зависит от их ориентации. Объясняется это тем, что подчеркивание
границ достигается путем вычитания из исходного изображения опе+
ратора Лапласа, который представляет собой скалярную величину.
Однако в ряде практических задач, связанных с обнаружением и
выделением границ, возникает необходимость подчеркивания гра+
ниц с заранее заданной ориентацией. Достигается это путем сумми+
рования исходного изображения Lc(x,y) с его первой производной,
взятой по заданному направлению z:
96
∂Lс ( x, y )
Lс.гр ( x, y ) = Lс ( x, y ) + b
где
∂z
,
∂Lс ( x, y )
– производная от Lc(x,y) по направлению z, составляю+
∂z
щему угол α с горизонтальной осью x, по определению равная:
∂Lс ( x, y )
∂z
=
∂Lс ( x, y )
∂x
cos α +
∂Lс ( x, y )
∂y
sin α,
b – весовой коэффициент, определяющий степень подчеркивания гра+
ниц. Поскольку величина и знак производной зависят от направле+
ния, по которому производится дифференцирование, то и степень
подчеркивания границ будет зависеть от этого направления.
В случае цифровой реализации этого метода вычисление первой
производной по заданному направлению заменяется вычислением
дискретной разности. При вычислении дискретной разности в направ+
лении горизонтальной оси x имеем
∆Lс ( k,n ) = ⎡⎣ Lс ( k,n ) − Lс ( k,n − 1) ⎤⎦ − ⎡⎣ Lс ( k,n + 1) − Lс ( k,n ) ⎤⎦ ,
и соответственно при вычислении дискретной разности в направле+
нии вертикальной оси y
∆Lс ( k,n ) = ⎡⎣ Lс ( k,n ) − Lс ( k − 1,n ) ⎤⎦ − ⎡⎣ Lс ( k + 1,n ) − Lс ( k,n ) ⎤⎦ .
Аналогичным образом осуществляется вычисление дискретных
разностей по другим направлениям.
Двумерное дискретное дифференцирование удобно выполнять пу+
тем свертки исходного изображения с курсовыми градиентными мас+
ками (импульсными характеристиками), которые приведены ниже:
1
1
1
1 −2
1,
−1 −1 −1
– север:
h ( k,n ) =
– северо+восток:
1
1
h ( k,n ) = −1 −2
−1 −1
1
1,
1
– восток:
−1
1
h ( k,n ) = −1 −2
−1
1
1
1,
1
97
– юго+восток:
−1 −1
h ( k,n ) = −1 −2
1
1
– юг:
h ( k,n ) =
−1 −1 − 1
1 −2
1,
1
1
1
– юго+запад:
h ( k,n ) =
1 −1 −1
1 −2 − 1 ,
1
1
1
– запад:
h ( k,n ) =
1
1 −1
1 −2 −1 ,
1
1 −1
1
1,
1
1
1
1
1
−
2
−
1
.
– северо+запад:
1 −1 −1
Использованные названия «курсов» масок указывают на направ+
ление склона перепада яркости, при котором маска дает максималь+
ный отклик. Так, например, северная градиентная маска дает мак+
симальный положительный отклик при положительном изменении
яркости в вертикальном направлении снизу вверх. Обратим внима+
ние на то, что сумма элементов маски равна нулю, поэтому на участ+
ках изображения, где яркость не изменяется, значение дискретной
разности равно нулю. На рис. 4.9 для сравнения показаны исходное
изображение и две его версии, полученные в результате подчеркива+
а)
б)
в)
h ( k,n ) =
Рис. 4.9. Подчеркивание границ разными методами: а – исходное изобра
жение; б – изображение с подчеркнутыми границами методом
нерезкого маскирования; в – изображение с подчеркнутыми гра
ницами методом суммирования с первой производной, получен
ной при использовании градиентной маски «восток»
98
ния границ методом нерезкого маскирования и методом суммирова+
ния исходного изображения с его первой пространственной произ+
водной (дискретной разностью). Из рассмотрения приведенных изоб+
ражений видно, что в первом случае усиление контраста на границах
не зависит от их ориентации, во втором случае вертикальные грани+
цы максимально усилены, а горизонтальные границы остались та+
кими же, как и на исходном изображении.
Рассмотренные выше линейные методы подчеркивания границ
применяются как самостоятельно, так и в качестве составной части
более сложных нелинейных методов, рассматриваемых в разд. 5, по+
средством которых полутоновые изображения преобразуются в кон+
турные.
В заключение отметим, что эффективное применение методов под+
черкивания границ возможно лишь в том случае, если шум на изоб+
ражении мал. При заметном уровне шума подчеркивание границ при+
водит к его значительному усилению, что сильно ухудшает изобра+
жение.
4.8. Ослабление дефектов изображения
путем размытия
Реальные изображения, например негативы старых фотографий,
часто содержат такие дефекты, как пылинки, царапины, а также
другие мелкие неоднородности, которые при подготовке изображе+
ний к печати должны быть устранены. Поскольку энергия таких нео+
днородностей распределена в широком интервале пространственных
частот, а энергия изображения – в сравнительно более узком интер+
вале, эффективным средством их сглаживания может быть низкоча+
стотная пространственная фильтрация, приводящая к их размытию.
В соответствии с методами, рассмотренными в подразд. 4.3, эта филь+
трация может быть выполнена путем свертки исходного (реставри+
руемого) изображения со сглаживающей импульсной характеристи+
кой h(k,n). Ниже приведены три сглаживающие импульсные харак+
теристики:
h ( k,n ) =
h ( k,n ) =
1 1 1
1
1 1 1,
91 1 1
1 1 1
1
1 2 1,
10 1 1 1
99
h ( k,n ) =
1 2 1
1
2 4 2,
16 1 2 1
Приведенные импульсные характеристики имеют две особенно+
сти. Во+первых, все элементы их массивов положительны. Во+вто+
рых, они нормированы таким образом, что сумма всех их элементов
равна единице, что обеспечивает правильное воспроизведение сред+
ней яркости изображения.
При сглаживании дефектов на изображениях мы встречаемся с
двумя противоречивыми требованиями. С одной стороны, необходи+
мо устранить дефекты на изображении в виде пылинок, царапин и
т. п., а с другой – необходимо сохранить резкость границ. Одним из
способов разрешения этого противоречия является предварительное
выделение областей, в пределах которых необходимо провести уст+
ранение дефектов, а затем сглаживание их в пределах этих областей.
Такая возможность предусмотрена во многих графических редакто+
рах и, в частности, в редакторе Photoshop.
Реализуется эта возможность следующим образом. Вначале со+
здается маска, представляющая собой двухградационное изображе+
ние, на котором одним цветом, например белым, обозначены облас+
ти, в пределах которых разрешается фильтрация реставрируемого
изображения, а другим цветом, например черным, обозначены обла+
сти, в пределах которых фильтрация реставрируемого изображения
запрещена. В процессе свертки реставрируемого изображения с им+
пульсной характеристикой производится проверка на попадание ко+
эффициентов импульсной характеристики в область запрета. Если
такое имеет место, то этот коэффициент (коэффициенты) импульс+
ной характеристики приравнивается нулю и перед сверткой произво+
дится нормировка скорректированной импульсной характеристики
таким образом, чтобы сумма ее коэффициентов равнялась нулю. За+
тем производится вычисление яркости пикселя реставрируемого изоб+
ражения по формуле (4.12) при заданном положении импульсной
характеристики относительно реставрируемого изображения. После
этого для нового положения импульсной характеристики относитель+
но фильтруемого изображения все повторяется.
4.9. Линейная фильтрация изображений
в графических редакторах
Большинство графических редакторов, таких как Photoshop CS,
Corel Photo+Paint и им подобных, предназначено для использования
100
в настольных издательских системах. Поэтому методы фильтрации,
применяемые в этих редакторах, предназначены в основном для под+
готовки изображений к печати. Вместе с тем эти редакторы применя+
ются при обработке изображений, предназначенных для использо+
вания в мультимедиаприложениях, Интернете, а также в ряде дру+
гих областей. В этих редакторах предусмотрено две группы вариантов
фильтрации изображений: размытие, при котором резкие световые
границы делаются более размытыми (смягчаются), и увеличение рез+
кости, достигаемое за счет подчеркивания границ. Каждый из этих
типов включает в себя ряд вариантов. Так, например, в графическом
редакторе Photoshop CS в диалоговой панели «Размытие» («Blur»)
предлагаются следующие варианты выполнения этой операции:
– «Усреднение» («Average»). Вычисляет среднюю яркость изобра+
жения и заполняет его ровным фоном этой яркости.
– «Размытие» («Blur»). Фильтрация осуществляется путем свер+
тки обрабатываемого изображения с импульсной характеристикой,
протяженность которой составляет 3×3 отсчета (пикселя). Этот ва+
риант фильтрации применяется для ослабления заметности шума на
изображении, а также для смягчения цветовых переходов на резких
границах.
– «Размытие+» («Blur More»). Выполняет ту же операцию, что и
предыдущий вариант, но в 3–4 раза сильнее.
– «Гауссово размытие» («Gaussian Blur»). Этот вид фильтрации
осуществляется путем свертки обрабатываемого изображения с им+
пульсной характеристикой, которая описывается гауссовой функ+
цией. Степень размытия изображения может регулироваться путем
установки соответствующего значения условного радиуса кружка
рассеяния re. Чем больше радиус, тем больше размытие. Этот вид
фильтрации часто применяют для создания эффекта дымки при ре+
дактировании изображений в соответствии с творческими задачами
автора.
«Размытие оптикой» («Lens Blur»). Имитирует размытие изобра+
жения, обусловленного плохой фокусировкой оптики.
– «Размытие в движении» («Motion Blur»). Данный вид фильтра+
ции осуществляется путем свертки обрабатываемого изображения с
импульсной характеристикой, имеющей протяженность только в
одном, заданном в диалоге, направлении. Благодаря такому виду
импульсной характеристики размытие изображения происходит толь+
ко в одном заданном направлении, что создает эффект смаза, получа+
ющийся при съемке движущегося изображения. Степень смаза регу+
лируется в диалоге.
101
– «Радиальное размытие» («Radial Blur»). Этот вид фильтрации
в зависимости от установок в диалоговой панели позволяет имити+
ровать размытие изображения, которое получается при его враще+
нии или при увеличении лупой. В первом случае эффект достигается
за счет того, что импульсная характеристика, с которой осуществля+
ется свертка изображения, имеет вид отрезка дуги окружности, при+
чем угловой размер этой дуги остается постоянным, а, следователь+
но, чем дальше от центра происходит фильтрация, тем больше полу+
чается размытие. Во втором случае импульсная характеристика имеет
вид отрезка радиуса, для каждого направления соответственно ори+
ентированного. Протяженность импульсной характеристики в этом
случае возрастает с увеличением расстояния от центра. Таким обра+
зом, для каждой точки исходного изображения, подвергаемого опе+
рации свертки, протяженность импульсной характеристики зависит
от положения этой точки относительно центра преобразования. Сте+
пень размытия и положение центра, относительно которого произ+
водятся преобразования, задаются в диалоговом режиме. На рис. 4.10
приведены изображения, полученные в результате описанных вари+
антов фильтрации. Рассмотренные варианты фильтрации применя+
ются для создания эффектов при подготовке изображений к печати
или для мультимедиаприложений.
– «Интеллектуальное размытие» («Smart Blur»). Один из видов
размытия.
Другая группа вариантов фильтрации, имеющаяся в графическом
редакторе Photoshop, включает в себя следующие варианты:
– «Резкость» («Sharpen»). В данном случае фильтрация осуще+
ствляется путем свертки обрабатываемого изображения с импульс+
а)
б)
в)
Рис. 4.10. Примеры эффектов, получаемых при фильтрации изображе
ния с использованием различных видов импульсных функций:
а – исходное изображение; б – результат фильтрации с при
менением импульсной функции в виде отрезка дуги; в – ре
зультат фильтрации с применением импульсной функции
в виде отрезка радиуса
102
ной характеристикой, имеющей отрицательные боковые лепестки,
протяженность которой составляет 3×3 отсчета (пикселя). Этот вид
фильтрации применяется для усиления резкости границ в изображе+
нии.
– «Резкость+» («Sharpen More»). Выполняет ту же операцию, что
и предыдущий вариант, но в большей степени подчеркивает грани+
цы.
– «Обострение границ» («Sharpen Edges»). С двух сторон границы
создается выброс, составляющий 25 % от перепада яркости на гра+
нице.
– «Нерезкое маскирование» («Unsharp Mask»). Этот вид фильтра+
ции реализуется методом нерезкого маскирования. В отличие от клас+
сического метода нерезкого маскирования в варианте, который ис+
пользован в редакторе Photoshop, добавлены еще две регулировки.
Помимо установки степени подчеркивания границ имеется еще воз+
можность устанавливать радиус импульсной характеристики, опре+
деляющий величину размытия нерезкой версии изображения, вычи+
таемого из исходного изображения для получения изображения с
подчеркнутыми границами, а также порог, которым ограничивается
снизу нерезкая версия перед вычитанием. Необходимо отметить, что
пороговая операция, введенная в алгоритм фильтрации, делает эту
обработку нелинейной.
Аналогичные инструменты с несколько отличающимися назва+
ниями также имеются в графическом редакторе Corel Photo+Paint.
103
5. НЕЛИНЕЙНАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ ДЛЯ
УЛУЧШЕНИЯ ИХ КАЧЕСТВА
5.1. Искажения воспроизведения градаций яркости
Динамический диапазон изменения яркости в изображаемых сце+
нах, как правило, существенно больше динамического диапазона,
который может быть воспроизведен в изображениях. Поэтому при
съемке изображений в них неизбежно вносятся искажения, которые
выражаются в ограничении динамического диапазона как в области
темных полутонов, так и в области светлых полутонов. Поскольку
динамический диапазон зрительной системы человека, адаптирован+
ной к яркости наблюдаемой сцены, также ограничен, то при правиль+
ном выборе воспроизводимого интервала яркости на изображении эти
искажения оказываются незаметными, а следовательно, не снижа+
ют качества изображения.
Кроме отмеченных искажений изображающие системы и их от+
дельные звенья, такие как: фотографические системы, воспроизво+
дящие устройства и некоторые другие, вследствие нелинейности све+
товых характеристик вносят искажения, которые приводят к пере+
распределению градаций яркости внутри воспроизводимого на
изображении динамического диапазона яркости. Искажения этого
рода по+разному проявляются на черно+белых и на цветных изобра+
жениях.
На черно+белых изображениях перераспределение градаций ярко+
сти внутри воспроизводимого интервала яркостей приводит к сдвигу
тональности изображения либо в область светлого, при этом изобра+
жение в целом становится более светлым, либо в область темного,
в результате чего в целом изображение становится более темным. Ре+
зультатом этого сдвига является потеря на изображении малоконт+
растных деталей, в первом случае – в области белого, во втором слу+
чае – в области темного участка динамического диапазона. Кроме
того, в зависимости от характера изменения тональности изображе+
ние воспринимается как более контрастное или как более вялое. Эта
особенность восприятия эффективно используется в системах черно+
белого телевидения, в черно+белом кино и черно+белой фотографии,
для чего в световые характеристики, влияющие на распределение
яркости в изображении, преднамеренно вводится небольшая нели+
нейность.
Иначе проявляется перераспределение градаций интенсивности в
цветных изображениях. Даже небольшая нелинейность световых
характеристик в этом случае приводит к неправильной передаче как
104
насыщенности, так и цветового тона изображаемых объектов. При
этом желтые цвета могут воспроизводиться как коричневые, теле+
сные цвета превратиться в бордово+красные и т. п. В связи с этим
световые характеристики изображающих систем, предназначенных
для передачи и воспроизведения цветных изображений, стремятся
сделать линейными путем коррекции составляющих их звеньев.
Рассмотрим особенности световых характеристик типичных зве+
ньев изображающих систем.
Фотоматериалы. В фотографии аналогом световой характерис+
тики, устанавливающей связь между яркостью элемента фотографи+
руемой сцены и яркостью этого элемента на изображении, является
сенситометрическая характеристика, которая устанавливает связь
между экспозицией Et данного элемента и его оптической плотно+
стью D:
D = f ( Et ),
(5.1)
где E – освещенность элемента на поверхности фотоматериала; t –
время экспозиции. При этом оптическая плотность и коэффициент
пропускания проявленного фотоматериала τ связаны соотношением
D = − lg τ.
В случае фотоматериалов изменение экспозиции от 0 до ∞ приво+
дит к изменению оптической плотности в ограниченных пределах от
Dmin до Dmax.
Это следует из того, что даже при нулевой экспозиции коэффици+
ент пропускания проявленного фотоматериала из+за наличия вуали
оказывается меньше единицы.
Фотографический процесс, как правило, включает в себя два эта+
па. На первом этапе получается негатив, с которого на втором этапе
изготавливается позитивное изображение. Поскольку в конечном
итоге нас интересует позитивное изображение, то имеет смысл рас+
сматривать зависимость оптической плотности элемента позитивно+
го изображения Dпоз, а еще лучше – зависимость коэффициента про+
пускания позитивного изображения τпоз от его экспозиции. В общем
случае эта зависимость нелинейная, более того, на ограниченном
интервале экспозиций она может быть представлена степенной фун+
кцией
γ
τпоз = β ( Et ) ,
где β и γ – коэффициенты, зависящие от типа фотоматериала и режи+
ма фотопроцесса.
105
Для сохранения правильной цветопередачи при получении цвет+
ных изображений значение γ должно быть равно единице.
В черно+белой фотографии и черно+белых кинофильмах для со+
здания иллюзии повышенной контрастности («сочности») изобра+
жений значения γ выбирают равными 1,3 ÷ 1,4.
Преобразователи изображения в видеосигнал. В современных пре+
образователях изображения в видеосигнал обычно используют дат+
чики на основе приборов с зарядовой связью (видеокамеры, план+
шетные сканеры), плумбиконы (видеокамеры), фотоэлектронные
умножители (барабанные сканеры). Все эти приборы в пределах ра+
бочего диапазона имеют линейную световую характеристику. Поэто+
му единственным видом нелинейных искажений, которые вносят эти
приборы, являются искажения, обусловленные ограниченностью их
динамического диапазона. Из этого следует, что для того чтобы избе+
жать на изображениях, получаемых посредством этих приборов, не+
линейных искажений, которые впоследствии не смогут быть скор+
ректированы, необходимо в самом начале согласовать динамический
диапазон яркостей изображения с динамическим диапазоном изоб+
ражаемой сцены или сканируемого изображения. Независимо от на+
звания конкретных регулировок, используемых в том или ином при+
боре, фактически достигается это путем правильного выбора экспо+
зиции.
Воспроизводящие устройства. Наиболее распространенными вос+
производящими устройствами, преобразующим видеосигнал в изоб+
ражение, в настоящее время являются кинескопы и жидкокристал+
лические панели. Световая характеристика (характеристики в слу+
чае масочных кинескопов, предназначенных для воспроизведения
цветных изображений), представляющая собой зависимость ярко+
сти свечения экрана Lc от напряжения eм, приложенного к модуля+
тору трубки, носит явно выраженный нелинейный характер и может
быть аппроксимирована степенной функцией
γ
Lс = βк ( eм + e0 ) к,
где βк – коэффициент, согласующий размерности; e0 – напряжение
запирания; γк – показатель степени, который в зависимости от типа
трубки лежит в пределах 2,5 ÷ 3,5. Световые характеристики жид+
кокристаллических панелей носят более сложный S+образный ха+
рактер.
В современных телевизионных системах и мониторах единствен+
ным источником нелинейных искажений, вызывающих перераспре+
деление градаций яркости в рабочем диапазоне являются воспроиз+
106
Рис. 5.1. Световые характеристики кинескопа, гаммакорректора и
результирующая
водящие устройства. Для компенсации этих искажений применяют
так называемые гамма+корректоры – устройства, амплитудная ха+
рактеристика которых в случае применения кинескопов имеет вид
eс = β e
γ с.вх
1 γк
,
где βγ – коэффициент, согласующий размерности; eс.вх – значение сиг+
нала на входе гамма+корректора; eс – значение сигнала на выходе
гамма+корректора. Гамма+корректор, будучи включенным в усили+
тельный тракт, вносит в сигнал изображения предыскажения, кото+
рые затем корректируются нелинейной световой (амплитудной) ха+
рактеристикой кинескопа. Световая характеристика черно+белого
кинескопа, амплитудная характеристика гамма+корректора, а так+
же результирующая характеристика последовательно включенных
гамма+корректора и кинескопа
(
γr
L = βк β γ e1/
с.вх
)
γк
= βкβ γγк eс.вх
показаны на рис. 5.1.
Для воспроизведения цветного изображения на экране масочного
кинескопа необходимо применять три гамма+корректора, по одному
для каждого канала цветности. Аналогичным образом решается про+
блема коррекции нелинейных искажений, обусловленных нелиней+
ностью световых характеристик жидкокристаллических панелей.
107
5.2. Коррекция искажений воспроизведения градаций яркости
В предыдущем подразделе были рассмотрены искажения, вызван+
ные нелинейностью амплитудных характеристик звеньев системы,
предназначенной для съемки, передачи и воспроизведения изобра+
жений. В ряде случаев, как, например, в случае кинескопа, ампли+
тудные (световые) характеристики могут быть аппроксимированы
степенными функциями, в других случаях, например в случае жид+
кокристаллической панели, они могут носить более сложный харак+
тер.
Для коррекции световых характеристик системы (ее калибров+
ки), необходимо вначале произвести измерения характеристик для
каждого из звеньев, составляющих систему, а затем найти ампли+
тудную характеристику гамма+корректора. Поясним это на примере
корректировки сквозной световой характеристики системы, предназ+
наченной для передачи черно+белых изображений, функциональная
схема которой показана на рис. 5.2. В целях общности рассмотрения
будем считать, что световые характеристики и датчика сигнала изоб+
ражения, и воспроизводящего устройства могут быть нелинейными.
Для измерения световых характеристик рассматриваемой системы
необходимо использовать тестовое изображение, которое бы вклю+
чало в себя градационный клин, измеритель величины сигнала изоб+
ражения (например, калиброванный осциллограф) и микрофотометр
для измерения яркости выбранной ступеньки градационного клина
на экране воспроизводящего устройства.
Измерения начинают со световой характеристики датчика сигна+
ла изображения. При ее измерении для каждой ступеньки градаци+
онного клина, яркость которой обозначим Lнn, где n – номер ступень+
ки, находят соответствующую ей величину сигнала en и данные за+
писывают в таблицу соответствия (табл. 5.1). Затем при измерении
световой характеристики воспроизводящего устройства устанавли+
вают такие значения сигнала на его входе eкn, при которых яркость
свечения его экрана Lрn будет равна или прямо пропорциональна зна+
чениям яркости соответствующих ступенек градационного клина Lнn.
После того как таблица соответствия будет полностью заполнена,
Рис. 5.2. Функциональная схема системы
108
Таблица 5.1. Таблица соответствия
1
Lнn
2
en
3
eкn
4
Lрn
требуемая амплитудная характеристика гамма+корректора опреде+
лится путем прочтения ее 2+й и 3+й строк
eкn = f ( en ).
В случаях, когда не требуется высокая степень точности коррек+
тировки сквозной световой характеристики, можно использовать
упрощенный метод. В основе этого метода лежит замечательное свой+
ство зрения, заключающееся в том, что разностный порог определя+
ется яркостью адаптации. Благодаря этому свойству зрения при на+
блюдении градационного клина на фоне большого поля, имеющего
яркость, равную яркости самой яркой его ступеньки, пороговая раз+
ность будет одинакова и для светлых, и для темных участков, если
геометрические размеры клина невелики. В этом случае критерием,
по которому можно судить о линейности световой характеристики,
является одинаковая различимость и светлых, и темных ступенек.
Рассмотренный способ удобно использовать для корректировки
световых характеристик кинескопа дисплея. С этой целью необхо+
димо изготовить и записать в память компьютера тестовое изобра+
жение в виде белого поля размером во весь экран и яркостью, соот+
ветствующей 255+му уровню квантования, с аппликированным в него
узким градационным клином из 32 ступенек, отличающихся друг от
друга по яркости на один и тот же интервал.
Упрощенные способы корректировки световой характеристики
кинескопа (корректировка гаммы), основанные на использовании
свойств зрения, в настоящее время используются в компьютерных
приложениях. Примером тому может служить утилита Gamma, по+
ставляемая вместе с графическим редактором Photoshop.
5.3. Методы увеличения контраста изображений
Типичным недостатком ряда технических изображений является
их малый контраст. Примером таких изображений являются: рент+
109
геновские изображения, изображения отпечатков пальцев, в неко+
торых случаях, изображения, получаемые с космических аппаратов
и т. п. Причинами низкого контраста таких изображений являются:
природа снимаемых объектов, неудовлетворительные условия осве+
щения, ошибки, допущенные при определении экспозиции, высокий
уровень шума, а также ряд других. Во многих случаях контраст та+
ких изображений может быть повышен фотографическими метода+
ми. Примером использования фотографических методов для этой цели
может служить повышение контраста первых изображений обрат+
ной стороны Луны, полученных в Советском Союзе в 1959 г., по+
скольку принятые с борта автоматической межпланетной станции
«Луна+3» изображения имели чрезвычайно малый контраст.
Однако фотографические методы изменения контраста имеют ряд
весьма существенных недостатков, главными из которых являются:
большие временные затраты на фотопроцесс и невозможность реали+
зовать произвольно заданные характеристики передачи уровней.
Развитие вычислительной техники позволило создать методы обра+
ботки изображений, свободные от этих недостатков. В целях повы+
шения контраста используют коррекцию изображений путем приме+
нения цифрового гамма+корректора, реализованного программным
способом. Исходными данными, которые необходимы для выбора его
амплитудной характеристики, являются минимальное Lс min и мак+
симальное Lс max значения яркости в изображении, контраст которо+
го необходимо повысить. При этом возможны два подхода к реше+
нию поставленной задачи.
В первом случае динамический диапазон обрабатываемого изобра+
жения увеличивается («растягивается») до динамического диапазо+
на, который способна воспроизвести система, но без внесения ограни+
чений по яркости в само изображение. Если обрабатываемое изобра+
жение является черно+белым и предполагается, что после обработки
оно будет выводиться на экран монитора компьютера, то его динами+
ческий диапазон после увеличения должен быть заключен в пределах
от нулевого до 255+го уровня квантования, который соответствует
максимальной яркости на экране дисплея Lд max. На рис. 5.3 приведе+
на характеристика, обеспечивающая необходимое преобразование.
Во втором случае амплитудная характеристика гамма+корректора
выбирается таким образом, что создается ограничение динамического
диапазона и со стороны малых значений яркости, и со стороны боль+
ших значений яркости обрабатываемого изображения, благодаря чему
обработанное изображение выглядит более контрастным (рис. 5.4).
В некоторых случаях этот способ обеспечивает более высокое субъек+
тивное качество изображения, особенно если изображение содержит
110
Рис. 5.3. Амплитудная характе
ристика гаммакорректо
ра для случая, когда в об
рабатываемое изображе
ние не вносятся ограниче
ния по яркости (L с.вх и
Lс.вых – значения яркости
в исходном и обработан
ном изображениях)
Рис. 5.4. Амплитудная характе
ристика гаммакорректо
ра для случая, когда в об
рабатываемое изображе
ние вносятся ограничения
по яркости (Lс.вх и Lс.вых –
значения яркости в исход
ном и обработанном изоб
ражениях)
небольшое число элементов, яркость которых выходит за уровни ог+
раничения.
Применение цифровых методов обработки предоставляет и другие
возможности, которые используют при детальном изучении изобра+
жений, выведенных на экран монитора компьютера.
Одной из таких возможностей является режим просмотра изобра+
жения, с использованием так называемой «контрастирующей лупы».
Сущность этого режима заключается в том, что программным спосо+
бом создается гамма+корректор, амплитудная характеристика кото+
рого выделяет из исходного изображения небольшую часть его дина+
мического диапазона и растягивает его на весь динамический диапа+
зон воспроизводящего устройства, увеличивая, таким образом,
контраст деталей, занимающих выделенную часть диапазона. Ши+
рина выделяемой части динамического диапазона и его положение
на шкале яркостей регулируются в диалоговом режиме. На рис. 5.5
в качестве примера обозначены значения яркости в исходном и кон+
трастированном изображениях приведена амплитудная характерис+
тика «контрастирующей лупы». Подобно тому, как обычная лупа
позволяет по очереди просматривать мелкие детали на изображении,
увеличивая их до необходимого размера, «контрастирующая лупа»
111
Рис. 5.5. Амплитудная характери
стика «контрастирующей
лупы» (Lс.вх и Lс.вых – значе
ния яркости в исходном и
контрастированном изоб
ражении)
Рис. 5.6. Амплитудная характе
ристика гаммакоррек
тора, осуществляюще
го обращение контра
ста для просмотра аэро
фотографий, а также
других изображений, по
лучаемых фотографи
ческим способом
позволяет по очереди просматривать малоконтрастные детали, рас+
положенные в различных участках динамического диапазона, кото+
рые вследствие малого контраста оставались бы для наблюдателя
невидимыми.
Другой возможностью, которую предоставляет цифровой метод
обработки, является обращение контраста, преобразующее негатив+
ное изображение в позитивное. Амплитудная характеристика гам+
ма+корректора, реализующего такое обращение контраста, показа+
на на рис. 5.6. Удобство этого вида обработки состоит в том, что при
его применении отпадает необходимость изготовления позитивных
изображений с негативов фотографическим способом. Применение
рассмотренных методов для обработки цветных изображений очевид+
но и пояснений не требует. Описанные в этом подразделе методы об+
работки изображений реализованы во всех основных графических
редакторах.
5.4. Разрежение шкалы квантования при коррекции
световых характеристик
Как было отмечено, особенностью цифровых изображений явля+
ется то, что они проквантованы по яркости. При этом яркость пиксе+
112
лей, на которые они разлагаются, может принимать не любые, а лишь
строго определенные значения, называемые уровнями квантования.
Обычно число уровней яркости, на которое квантуются изображе+
ния, т. е. число разрешенных градаций яркости, в случае черно+бе+
лых изображений равно 256, а в случае цветных – по 256 на каждый
из трех составляющих цветов, при этом расстояния между соседни+
ми уровнями квантования на выходе АЦП одинаково. Если прокван+
тованные по яркости изображения преобразуются аналоговым уст+
ройством с нелинейной световой характеристикой, например кинес+
копом или жидкокристаллической панелью, расстояния между
соседними уровнями квантования в изображении изменяются, т. е.
происходит перераспределение градаций яркости внутри динами+
ческого диапазона изображения, число же уровней при этом сохра+
няется.
Совсем иначе обстоит дело, если такое преобразование осуществ+
ляется цифровым устройством, например цифровым гамма+коррек+
тором, разрядность представления яркости у которого одинакова на
входе и на выходе. В этом случае наряду с изменением расстояния
между градациями яркости на его выходе, представляемыми сосед+
ними уровнями квантования на его входе, часть градаций яркости в
выходном сигнале пропадает. Это объясняется тем, что вследствие
сближения градаций яркости в части динамического диапазона в один
и тот же квантовый интервал выходного сигнала попадает несколь+
ко градаций яркости, соответствующих различным уровням кванто+
вания входного сигнала. Рис. 5.7, на котором приведена амплитуд+
ная характеристика цифрового гамма+корректора, поясняет изло+
женное. Уменьшение количества используемых уровней квантования
в выходном сигнале приводит к разрежению шкалы воспроизводи+
мых градаций яркости на изображении и может быть причиной по+
явления на нем ложных контуров.
Реализация цифрового гамма+корректора при компьютерной об+
работке изображения крайне проста: создается специальный одно+
мерный массив чисел, в который записывается амплитудная харак+
теристика гамма+корректора. При этом номера уровней квантования
входного сигнала рассматриваются как номера элементов массива, а
числа, записанные в массив, – как скорректированные значения сиг+
нала.
Исходя из этого оценим максимальное расстояние между воспро+
изводимыми на экране кинескопа смежными уровнями квантования
считая, что для коррекции его световой характеристики применен
цифровой гамма+корректор, на выходе которого включен цифроана+
113
Рис. 5.7. Амплитудная характеристика цифрового гаммакорректора
(kвх и kвых – номера квантовых уровней на входе и выходе гамма
корректора соответственно)
логовый преобразователь (ЦАП). Аппроксимируя световую харак+
теристику кинескопа степенной функцией, представим ее в виде за+
висимости яркости свечения экрана кинескопа Lс от величины сиг+
нала eс, вызывающего это свечение, т. е.
γ
Lс = βкeс ,
а не, как обычно принято, от величины напряжения на модуляторе
кинескопа eм = eс – e0:
γ
Lс = βк ( eм + e0 ) ,
где e0 – напряжение запирания; βк – коэффициент, согласующий раз+
мерности; γ – показатель степени, который для современных кине+
скопов лежит в пределах 2,5 ≤ γ ≤ 3,5.
Для обеспечения полной коррекции световой характеристики ки+
нескопа амплитудная характеристика гамма+корректора должна
иметь вид
eс = β e
γ с.вх
1 γк
,
где ec.вх – сигнал на входе гамма+корректора; βγ – коэффициент, со+
гласующий размерности.
114
Поскольку по условию задачи для коррекции градационных иска+
жений используется цифровой гамма+корректор, у которого для пред+
ставления сигнала на его входе и выходе используется одно и то же
количество разрядов двоичного кода, соотношение между уровнем
квантования сигнала k на входе и соответствующим ему номером
уровня квантования i на выходе имеет следующий вид:
1γ
⎡
k ⎞ к⎤
⎥,
i = round ⎢( m − 1) ⎜⎛
⎟
⎝ m −1 ⎠
⎢⎣
⎥⎦
где m – число уровней квантования сигнала, поступающего на вход
гамма+корректора.
Как уже отмечалось, вследствие сближения градаций яркости на
выходе гамма+корректора в части динамического диапазона (в дан+
ном случае в области белого) некоторые из них пропадают, что после
преобразования сигнала световой характеристикой кинескопа при+
водит к разрежению шкалы квантования в области белого. Для того
чтобы оценить это разрежение, определим номер уровня квантова+
ния k на входе гамма+корректора, которому будет соответствовать
уровень квантования на его выходе i = m – 2, т. е. уровень, ближай+
ший к максимальному. Принимая для простоты вычислений γ = 3,
получим
1/3
⎡
k ⎞ ⎤
m − 2 = round ⎢( m − 1) ⎛⎜
⎟ ⎥,
⎝ m − 1 ⎠ ⎥⎦
⎢⎣
откуда
k≈
( m − 2 )3 .
( m − 1)2
Разлагая правую часть найденного выражения в степенной ряд и
ограничиваясь первыми двумя членами разложения, получим k ≈ (m –
– 1) – 3. Из этого следует, что расстояние между максимальным уров+
нем яркости и ближайшим к нему воспроизводимым уровнем увели+
чивается в 3 раза и составляет 1/85 при 256 уровнях квантования.
Вызовет ли это появление ложных контуров на изображении?
Если учесть, что минимальное количество уровней квантования,
при котором на изображении ложные контуры еще не видны, равно
64, а расстояние между ними составляет 1/64, то можно ожидать,
что в рассмотренном выше случае этого не произойдет. Опыт работы
с реальными изображениями подтверждает этот вывод, однако име+
ющийся запас невелик.
115
5.5. Тоновая коррекция
Целью тоновой коррекции изображений является придание им боль+
шей выразительности при воспроизведении, а также их улучшение,
особенно если при съемке они были неправильно экспонированы.
В полиграфии принято весь тоновый (динамический) диапазон
изображений разделять на семь поддиапазонов.
1. Область белого, составляющая 2 % от всего динамического
диапазона. Область белого – это область, которая при воспроизведе+
нии не содержит видимых деталей.
2. Область наибольшей яркости, которая занимает часть дина+
мического диапазона в интервале от 2 до 18 %. В отличие от области
белого детали, попавшие в область наибольшей яркости на изобра+
жениях, воспроизводятся.
3. Область четвертных тонов занимает интервал от 18 до 35 %
динамического диапазона.
4. Область средних тонов занимает интервал от 35 до 65 % дина+
мического диапазона.
5. Область трехчертветных тонов занимает интервал от 65 до 80 %
динамического диапазона.
6. Область тени занимает часть динамического диапазона в пре+
делах от 80 до 98 %.
7. Область черного занимает интервал от 98 до 100 % динамиче+
ского диапазона. Эта область воспроизводится сплошным черным
цветом.
Реальные изображения, как правило, не используют весь дина+
мический диапазон яркости, при этом изображения можно условно
разделить на три группы.
1. Яркие изображения. В этих изображениях основные детали
содержатся в областях наибольшей яркости и четвертных тонов.
Примером такого изображения является фотография белого медведя
на фоне снега.
2. Сбалансированные изображения, в которых наиболее интерес+
ные детали занимают либо область средних яркостей, либо распреде+
лены между яркими и темными тонами. Этот вид изображений наи+
более распространен.
3. Темные изображения. В темных изображениях наиболее инте+
ресные детали содержатся в темных областях. Примером такого изоб+
ражения является фотография города в сумерках.
В ряде случаев характер изображения определяется не его содер+
жанием, а неправильным выбором экспозиции при съемке. Так, при
недостаточной экспозиции изображение будет темным, а при чрез+
мерно большой экспозиции – светлым.
116
При воспроизведении изображения, независимо от того, выводим
ли мы его на печать или на экран монитора компьютера, необходимо
согласовать динамический диапазон яркостей в изображении с дина+
мическим диапазоном воспроизводящего устройства. Процедура со+
гласования динамических диапазонов заключается в определении на
изображении областей наибольшей яркости и наиболее темных об+
ластей, которые еще должны содержать детали, и согласования их
с соответствующими областями воспроизводящего устройства. От+
метим, что не всегда легко определить точку наибольшей яркости и
точку черного, особенно на изображениях, перегруженных деталя+
ми. Поэтому при компьютерной обработке изображений для этого
следует использовать инструмент «пипетка».
После согласования динамических диапазонов изображения и вос+
производящего устройства следует перейти к настройке амплитудной
характеристики, определяющей вид нелинейного преобразования.
В графических редакторах этот инструмент называется «кривая». Из+
меняя вид этой характеристики по своему усмотрению, можно растя+
гивать одни участки динамического диапазона изображений за счет
сокращения других участков, добиваясь при этом увеличения контра+
ста наиболее важных в смысловом отношении деталей на обрабатыва+
емом изображении. Обратим внимание на то, что, нелинейные преоб+
разования, приводящие к перераспределению градаций яркости в изоб+
ражении, не воспринимаются зрительной системой как искажения,
что позволяет добиваться путем применения тоновой коррекции боль+
шей выразительности изображений, расставляя желательные акцен+
ты и усиливая тем самым их смысловое содержание.
5.6. Гомоморфная фильтрация изображений
Мультипликативные помехи, воздействуя на изображения, иска+
жают их, и одновременно увеличивают динамический диапазон яр+
костей, необходимый для их представления. Это, в свою очередь, со+
здает проблемы при воспроизведении таких изображений, посколь+
ку динамический диапазон воспроизводящих устройств, таких как
мониторы, принтеры и др., не превышает 100–255. Возникают про+
блемы и при их передаче по каналам связи.
Эффективным методом реставрации изображений, искаженных
мультипликативными помехами, в ряде случаев может быть гомо+
морфная фильтрация.
Рассмотрим алгоритм гомоморфной фильтрации на примере рес+
таврации ахроматического изображения для случая, когда мульти+
пликативная помеха обусловлена неравномерностью освещения по
полю.
117
Согласно модели, введенной в подразд. 2.2, распределение ярко+
сти в изображении можно рассматривать как результат перемноже+
ния функции rc(x,y), представляющей распределение коэффициен+
тов отражения в передаваемой сцене, на функцию E(x,y), которая
представляет распределение освещенности
L ( x, y ) = kE ( x, y ) rс ( x, y ),
где k – коэффициент, согласующий размерности. Если освещенность
по полю постоянна, т. е. если E(x,y) = E = const, то распределение
яркости в изображении Lc(x,y) с точностью до постоянного множите+
ля k E повторяет распределение коэффициентов отражения
Lс ( x, y ) = kErс ( x, y ).
Будем считать такое изображение неискаженным.
Динамический диапазон изменения яркости в неискаженных изоб+
ражениях определяется динамическим диапазоном изменения коэф+
фициентов отражения и обычно не превышает 100. В большинстве
же реальных случаев формирования изображений освещенность раз+
личных участков снимаемой сцены изменяется, причем в больших
пределах, что приводит к увеличению динамического диапазона яр+
костей формируемых изображений. Благодаря этому яркость черных
букв при ярком солнечном освещении оказывается больше яркости
белой бумаги, на которой они напечатаны, но в тени.
Цель гомоморфной фильтрации состоит в ослаблении мультипли+
кативной
помехи путем отыскания так называемой оценки изобра
∧
жения Lс ( x, y ). Достигается это следующим образом. Вначале иска+
женное изображение, представленное распределением яркости L(x,y),
логарифмируется, в результате чего мультипликативная помеха пре+
образуется в аддитивную помеху
ln ⎡⎣ L ( x, y ) ⎤⎦ = ln ( k ) + ln ⎡⎣ E ( x, y ) ⎤⎦ + ln ⎡⎣rс ( x, y )⎤⎦ .
Так как изменение освещенности с изменением координат x, y,
как правило, происходит медленно, основная энергия пространствен+
ного спектра функции E(x,y) сосредоточена в области низких про+
странственных частот. Напротив, для функции rc(x,y), представля+
ющей распределение коэффициентов отражения в передаваемой сце+
не, характерно наличие резких изменений на границах и контурах,
что делает ее пространственный спектр широкополосным. Отмечен+
ное отличие в пространственных спектрах находит свое отражение и
в логарифмах этих функций: ln[E(x,y)] и ln[rc(x,y)]. Это отличие ис+
118
Рис. 5.8. Алгоритм гомоморфной фильтрации
а)
б)
Рис. 5.9. Гомоморфная фильтрация изображения: а – исходное (искажен
ное) изображение; б – это же изображение после гомоморфной
фильтрации
пользуется для ослабления помехи путем линейной фильтрации фун+
кции ln[L(x,y)].
Заключительным шагом алгоритма гомоморфной фильтрации
является антилогарифмирование, в результате
которого находится
∧
оценка неискаженного изображения Lс ( x, y ). Рассмотренный алго+
ритм гомоморфной фильтрации приведен на рис. 5.8. Эффективность
этого алгоритма иллюстрируется рис. 5.9.
Все изложенное применимо к гомоморфной фильтрации цветных
изображений.
5.7. Медианная и ранговая фильтрации изображений
Медианная фильтрация была разработана Тьюки. Реализуется
медианная фильтрация путем сканирования изображения окном,
перекрывающим нечетное число его пикселей N, с последующим ран+
жированием значений яркости пикселей, оказавшихся в данный мо+
мент в окне, и записи в массив профильтрованного изображения зна+
чения, равного медиане этих элементов. Медианой дискретной пос+
ледовательности L1, L2, …, LN является тот ее элемент, для которого
(N – 1)/2 элементов последовательности меньше или равны ему по
величине, и (N – 1)/2 элементов больше или равны ему по величине.
Поясним это на численном примере. Пусть в окно медианного филь+
тра попала последовательность элементов изображения, яркость
119
которых определяется числами: 95, 122, 121, 90, 99, 200, 100, 110,
120. В этом случае медианой этой дискретной последовательности
будет число 110, поскольку после ее ранжирования оно займет в ней
центральное положение: 90, 95, 99, 100, 110, 120, 200, 122,121.
Медианная фильтрация не гарантирует того, что в результате ее
применения на изображении будут подавлены именно помехи, а по+
лезные изменения яркости сохранены. Так, в рассмотренном приме+
ре значение 200 подавляется независимо от того, обусловлено ли оно
выбросом помехи или является значением яркости элемента исход+
ного изображения.
На рис. 5.10 приведены примеры фильтрации трех последователь+
ностей дискретных отсчетов яркости изображения одномерным ме+
дианным и одномерным линейным фильтрами. В обоих случаях ис+
пользовались пятиэлементные окна, причем все отсчеты импульс+
ной характеристики линейного фильтра были выбраны одинаковыми
и равными 1/5. Рассмотрение приведенных на рис. 5.10 диаграмм
показывает, что медианный фильтр в отличие от линейного не иска+
жает передачу ступенчатой последовательности отсчетов и в то же
время эффективно подавляет импульсные последовательности, если
число импульсов в последовательности не превышает половину ши+
Рис. 5.10. Сравнение результатов фильтрации медианным и линейным
фильтрами
120
рины окна, т. е. N/2. Благодаря этому свойству медианного фильтра
можно ожидать, что при медианной фильтрации изображений с им+
пульсными помехами будет мало искажаться передача имеющихся
в них контуров и резких световых границ при эффективном подавле+
нии импульсной помехи.
До сих пор мы рассматривали примеры, в которых фильтрация
импульсных последовательностей осуществлялась одномерным ме+
дианным фильтром, т. е. фильтром, окно которого охватывало пос+
ледовательность отсчетов, расположенных вдоль одной строки изоб+
ражения. Однако при фильтрации изображений лучшие результаты
можно получить, если. использовать двумерные фильтры, т. е. филь+
тры с окнами, имеющими протяженность в двух направлениях. На
рис. 5.11 приведены примеры двумерной медианной фильтрации изоб+
ражения квадрата фильтрами с прямоугольным и крестообразным
окнами. Размеры окон были выбраны соответственно 3×3 и 5×5 от+
счетов. Из рис. 5.11 следует, что медианный фильтр с прямоуголь+
ным окном сглаживает углы квадрата на профильтрованном изобра+
жении, а медианный фильтр с крестообразным окном оставляет их
без изменения.
Известно, что при определении медианы последовательности от+
счетов f(i), где i – номер отсчета, выполняются следующие соотноше+
ния:
Рис. 5.11. Примеры двумерной медианной фильтрации с применением
крестообразного и квадратного окон
121
med ⎡⎣kf ( i ) ⎤⎦ = kmed ⎡⎣f ( i ) ⎤⎦ .
med ⎣⎡k + f ( i ) ⎦⎤ = k + med ⎣⎡ f ( i )⎦⎤ .
Однако медиана суммы двух произвольных последовательностей
f(i) и g(i) не равна сумме их медиан, т. е.
med ⎡⎣ f ( i ) + g ( i ) ⎤⎦ ≠ med ⎡⎣f ( i ) ⎤⎦ + med ⎡⎣ g ( i ) ⎤⎦ .
Так как медианная фильтрация является эвристическим методом
обработки изображений, то не представляется возможным разрабо+
тать методику синтеза «оптимального медианного фильтра», т. е.
определения размеров и формы окна, обеспечивающих наилучшие
результаты в рамках какого+либо критерия качества при заданных
характеристиках изображений и помех. Поэтому параметры окна ме+
дианного фильтра должны определяться опытным путем.
Известны различные стратегии решения этой задачи.
Одна из них состоит в том, что сначала берут окно крестообразной
формы наименьших размеров, т. е. 3×3, и осуществляют пробную
фильтрацию изображения. Если при этом искажения изображения,
обусловленные фильтрацией, незначительны, а уровень остаточной
помехи велик, размер окна увеличивают до 5×5 и снова выполняют
пробную фильтрацию. Поступая таким образом, определяют прием+
лемые размеры окна медианного фильтра.
Другая стратегия заключается в реализации каскадной медиан+
ной фильтрации изображения с применением окон с фиксированны+
ми или изменяемыми размерами. При этом те области изображения,
которые остаются без изменения после однократной обработки меди+
анным фильтром, не изменятся и после его повторной обработки.
Области же, в которых протяженность импульсной последователь+
ности менее половины размеров окна, будут подвергаться изменени+
ям после каждого цикла обработки
На рис. 5.12, а и б в качестве примера показаны исходное изобра+
жение, искаженное импульсной помехой, и это же изображение пос+
ле его медианной фильтрации фильтром с крестообразным окном раз+
мерами 5×5. Из рис. 5.12, б видно, что применение медианной филь+
трации позволило почти полностью устранить на изображении
импульсную помеху, при этом практически не исказив изображение.
Распространение процедуры медианной фильтрации на случай
обработки цветных изображений очевидно и пояснений не требует.
Следует отметить, что медианный фильтр может быть не только
одномерным или двумерным, но также и трехмерным, используя
122
а)
б)
Рис. 5.12. Медианная фильтрация изображения: а – изображение
с импульсной помехой; б – изображение после медианной филь
трации
в качестве третьего измерения время. На рис. 5.13 показано кресто+
образное окно трехмерного ме+
дианного фильтра. Примене+
ние трехмерной медианной
фильтрации увеличивает ее
эффективность, так как позво+
ляет подавлять импульсные
помехи, воздействующие на
телевизионное изображение.
Алгоритм ранговой фильт+
рации во многом подобен ал+
горитму медианной фильтра+
ции и отличается от нее лишь
тем, что в массив профильтро+
ванного изображения записы+
Рис. 5.13. Крестообразное окно трех
вается значение яркости от+
мерного медианного филь
счета, положение которого в
тра
ранжированной последова+
тельности r предварительно задается. Таким образом, медианная
фильтрация является частным случаем ранговой фильтрации для слу+
чая когда r = N/2 + 1. Наличие дополнительной степени свободы при
выборе параметров рангового фильтра иногда позволяет достичь не+
сколько лучших результатов.
5.8. Методы выделения контуров на изображениях
Как известно, семантические изображения легко и быстро разли+
чаются зрительной системой человека. Объясняется это тем, что раз+
личение семантических изображений происходит по контурам, ко+
123
торые являются наиболее устойчивыми признаками изображения.
Это, в частности, явилось причиной широкого распространения кон+
турных изображений как в изобразительном искусстве, так и в тех+
нических приложениях. Когда художник изображает реальные пред+
меты в виде контурного рисунка, определение контуров рисуемых
объектов не вызывает у него каких+либо затруднений, зрительная
система легко справляется с этой задачей. Проблемы возникают тог+
да, когда мы пытаемся автоматизировать этот процесс, поручив ра+
боту компьютеру. Несмотря на то, что было предложено много алго+
ритмов, направленных на решение данной проблемы, она так и оста+
ется до конца не решенной. Рассмотрим эти алгоритмы.
Процедура выделения контура включает в себя два этапа. Внача+
ле контрастируется яркостный перепад, образующий контур на изоб+
ражении, а затем результат контрастирования сравнивается с поро+
гом [1]. Если результат контрастирования превышает порог, то счи+
тается, что этот элемент изображения принадлежит контуру и ему
присваивается значение яркости контура Lк, в противном случае ему
присваивается значение яркости фона Lф в формируемом контурном
изображении. В результате такой обработки изображения получает+
ся контурный препарат, на котором имеются как выделенные конту+
ры, обычно разорванные во многих местах, так и отдельные точки и
штрихи, которые воспринимаются зрительной системой как поме+
ховый фон, маскирующий контурное изображение. На рис. 5.14 по+
казаны исходное изображение (а) и его контурный препарат (б), на
котором хорошо заметны отмеченные особенности.
Выбирая величину порога, можно несколько уменьшить эти не+
приятные артефакты, однако совсем от них избавиться не удается.
а)
б)
Рис. 5.14. Выделение контуров: а – исходное изображение; б – его кон
турный препарат
124
Чем выше порог, тем меньше на контурном изображении будет от+
дельных точек и штрихов, не являющихся элементами выделяемых
контуров, но при этом в полезных выделенных контурах увеличива+
ется количество и протяженность разрывов. Уменьшение порога при+
водит к обратной картине. В некоторой степени количество возника+
ющих на контурном изображении элементов, не принадлежащих
контурам, может быть уменьшено путем применения медианного или
логического фильтров, но добиться их полного устранения не удает+
ся. Многочисленные попытки решить задачу выделения контуров
привели к разработке целого ряда методов контрастирования ярко+
стных перепадов. Простейшими из них, но не лучшими, являются
линейные методы, которые отличаются от рассмотренных в разд. 4
лишь тем, что сумма элементов импульсных функций (масок), ис+
пользуемых в этих методах, равна нулю. Примером таких контра+
стирующих масок являются:
0 −1 0 −1 −1 −1
1 −2
1
−1 4 −1 , −1 8 −1 , −2 4 −2 .
0 −1 0 −1 −1 −1
1 −2 1
Лучшие результаты получаются, если контрастирование выпол+
нять одним из известных нелинейных методов. При их использова+
нии для обнаружения перепадов яркости применяются нелинейные
комбинации значений яркости элементов изображения. В большин+
стве случаев при выделении перепадов яркости ограничиваются об+
работкой изображения окном 2×2 или 3×3. Рассмотрим наиболее по+
пулярные из этих методов.
Метод Робертса. В этом методе для контрастирования и выделе+
ния перепадов яркости применяется нелинейная операция двумер+
ного дифференцирования
D ( i,k ) = ⎡⎣ L ( i,k ) − L ( i + 1,k + 1) ⎤⎦ + ⎡⎣ L ( i,k + 1) − L ( i + 1,k )⎤⎦ .
2
2
Вычисляя и сравнивая с порогом P найденные значения D(i,k),
определяют точки, для которых удовлетворяется условие D(i,k) > P
и которые считаются принадлежащими контурам. Этим точкам при+
сваивается значение яркости Lк. Остальные же точки, для которых
это условие не удовлетворяется, считаются принадлежащими фону и
им присваивается значение яркости Lф.
Для сокращения объема вычислительных операций рекомендует+
ся другая операция пространственного дифференцирования, которая
определяется выражением
125
D1 ( i,k ) = ⎡⎣ L ( i,k ) − L ( i + 1,k + 1) ⎤⎦ + ⎡⎣ L ( i,k + 1) − L ( i + 1,k )⎤⎦ .
Можно показать, что D ( i,k ) ≤ D1 ( i,k ) ≤ 2D ( i,k ).
Приблизительную ориентацию выделяемого контура можно оп+
ределить по положению в окне того из четырех пикселей, который
имеет наибольшее значение яркости.
Метод Собела. В методе Собела для контрастирования и выделе+
ния перепадов яркости, принадлежащих контурам, используется
нелинейный оператор с окном размером 3×3 пикселей, показанном
на рис. 5.15. Для контрастирования перепадов яркости, принадле+
жащих контурам, вначале вычисляются величины
F1 = ( A2 + 2 A3 + A4 ) − ( A0 + 2 A7 + A6 ),
F2 = ( A0 + 2 A1 + A2 ) − ( A6 + 2 A5 + A4 ),
а затем значение функции
D ( i,k ) = F12 + F22 ,
которое и сравнивается с порогом. Как и в предыдущем случае, по
результатам сравнения с порогом при+
нимается решение о принадлежности
данной точки к контуру. Если D(i,k)
A
A
A
превышает значение порога, то счи+
тается, что точка принадлежит кон+
туру, если нет – фону.
L(i,k)
A
A
Метод Кирша. Этот метод отлича+
ется от метода Собела видом нелиней+
ного оператора, посредством которо+
го контрастируются перепады ярко+
A
A
A
сти на контурах. В этом случае
применяется оператор с таким же ок+
ном, размером 3×3 пикселя, показан+
Рис. 5.15. Окно оператора Со ном на рис. 5.15, который определя+
бела
ется следующим образом:
0
1
3
7
6
2
5
4
{
}
D ( i,k ) = max 1,maxi =0−7 ⎡⎣ 5Si − 3Ti ⎤⎦ ,
где
Si = Ai + 0 + Ai +1 + Ai +2,
Ti = Ai +3 + Ai + 4 + Ai +5 + Ai +6 + Ai +7.
126
Индексы у слагаемых Ai в этих выражениях подсчитываются по
модулю 8. Здесь также решение о принадлежности данной точки к
контуру принимается по результатам сравнения D(i,k) с порогом.
Точка считается принадлежащей контуру в том случае, если D(i,k)
превышает значение порога. Обратим внимание, что оператор Кир+
ша дает максимальное значение курсового градиента в некоторой
точке изображения без учета значения L(i,k).
Метод Уоллиса. Нелинейный метод обнаружения перепадов яр+
кости Уоллиса использует гомоморфную обработку изображения.
В соответствии с этим методом считается, что точка находится на
перепаде яркости, если значение логарифма от яркости в этой точке
превышает среднее значение логарифмов яркостей четырех ближай+
ших соседних пикселей на некоторое фиксированное значение (по+
рог). Элемент контрастированного изображения определяется сле+
дующим образом:
1
1
1
1
D ( i,k ) = log ⎣⎡ L ( i,k ) ⎤⎦ − log ( A1 ) − log ( A3 ) − log ( A5 ) − log ( A7 ),
4
4
4
4
или, что – то же самое,
⎧ ⎡ L ( i,k ) ⎤ 4 ⎫
⎪
1
⎦ ⎪.
D ( i,k ) = log ⎨ ⎣
⎬
4
⎪⎩ A1 A3 A5 A7 ⎪⎭
При реализации этого метода нет необходимости в вычислении
каждый раз логарифма, так как сравнение D(i,k) с верхним и ниж+
ним порогами эквивалентно сравнению дроби, стоящей в фигурных
скобках с видоизмененными порогами. Основное достоинство лога+
рифмического детектора перепадов помимо простоты вычислений
заключается в том, что он не чувствителен к мультипликативным
изменениям уровня яркости.
Логарифмический метод контрастирования можно рассматривать
как линейное контрастирование изображения, но предварительно
подвергнутое операции логарифмирования посредством оператора
Лапласа.
Кроме рассмотренных был разработан еще ряд методов выделения
контуров, среди них метод Розенфельда, метод Хюккеля и некото+
рые другие.
5.9. Методы нелинейной обработки
в графических редакторах
Современные графические редакторы, такие как Photoshop CS,
Corel Photo+Paint и им подобные, ориентированы в основном на
127
применение в настольных издательских системах. В соответствии
с их функцией используемые ими методы обработки предназначены
для подготовки изображений к печати. Кроме того, эти редакторы
применяются при создании изображений, предназначенных для ис+
пользования в мультимедиаприложениях, Интернете, а также в ряде
других областей.
Основным видом нелинейной обработки, который представлен
инструментарием этих редакторов, является тоновая коррекция изоб+
ражений. Посредством тоновой коррекции изображений могут быть
решены два вида задач. Первый вид задач связан с коррекцией нели+
нейных искажений изображений, обусловленных технологически+
ми процессами их изготовления. С этим случаем мы имеем дело, ког+
да требуется воспроизводить изображения, максимально приближен+
ные к оригиналу. Примером тому могут служить фотометрически
точные копии документов, изображения, иллюстрирующие резуль+
таты некоторых научных исследований, и т. п. Другой вид задач свя+
зан с согласованием динамического диапазона яркостей в изображе+
нии, подготавливаемом для печати с динамическим диапазоном, ко+
торый может быть обеспечен самим технологическим процессом
печати. При решении задач второго вида, как правило, динамиче+
ский диапазон исходного изображения оказывается больше того, ко+
торый может быть воспроизведен. Кроме того, при подготовке изоб+
ражений для печати, мультимедиаприложения, презентации и т. д.,
стремятся «улучшить» редактируемое изображение в соответствии
с творческими задачами автора.
Ограничиваясь рассмотрением нелинейной обработки черно+белых
полутоновых изображений, обратимся к технологии этого процесса.
В случае, если целью обработки является коррекция нелинейных
искажений, обусловленных тех+
нологическими процессами изго+
товления изображений, необхо+
димо предусмотреть, чтобы вмес+
те с корректируемым изображени+
ем при его сканировании был бы
отсканирован градационный клин
с равномерным шагом изменения
яркости, который используется
для измерения возникающих ис+
кажений. На рис. 5.16 показано
Рис. 5.16. Изображение с аппли
такое изображение с впечатанным
кированным градацион
в него градационным клином.
ным клином
128
Измеряя посредством инструмента «пипетка» («Eyedrop+per») зна+
чения яркостей на ступеньках градационного клина во введенном
изображении, нетрудно определить амплитудную характеристику
сканера с тем, чтобы ее учесть и скорректировать. Далее после кор+
рекции нелинейных искажений, вносимых сканером, следует изоб+
ражение вывести на печать. Отпечатанное изображение снова скани+
руется и посредством инструмента «пипетка» измеряются значения
яркостей на ступеньках клина, а затем по данным проведенных из+
мерений определяется амплитудная (световая) характеристика уст+
ройства вывода изображения на печать. На основании найденных
амплитудных характеристик устройств ввода и вывода изображений
рассчитывается результирующая корректирующая характеристика.
Коррекция изображения осуществляется посредством инструмента
«Кривые» («Curves») путем соответствующей настройки кривой в
его окне.
Если целью обработки является согласование динамического ди+
апазона яркостей в изображении подготавливаемом для печати с ди+
намическим диапазоном, который может быть обеспечен самим тех+
нологическим процессом печати, применяется другой метод нелиней+
ной обработки. Вначале производится анализ изображения на
предмет распределения значений яркостей по динамическому диапа+
зону. Этот анализ выполняется с использованием инструментов гра+
фического редактора «Гистограмма» («Histogram») и «Пипетка». Ис+
пользуя инструмент «Гистограмма», легко определить диапазон яр+
костей изображения, общую тональность изображения, а также
имеется ли достаточный запас для коррекции изображения, т. е. не
приведет ли коррекция к такому перераспределению используемых
уровней квантования, при котором на изображении появятся лож+
ные контуры. Далее, с помощью инструмента «Пипетка» определя+
ют области высокой яркости и наиболее темные области изображе+
ния, которые должны воспроизводиться с сохранением подробнос+
тей, а также области средних тонов, детали которых не должны быть
утеряны. Используя полученную информацию, с помощью инстру+
ментов «Уровни» («Levels») и «Кривые» («Curves») устанавливают
уровни светлого и темного, а также подбирается форма кривой (кор+
ректирующей амплитудной характеристики) инструмента «Кривые».
Принцип выбора корректирующей кривой состоит в том, что на ин+
тервалах динамического диапазона, содержащего детали, которые
не должны быть потеряны, крутизна корректирующей кривой долж+
на быть увеличена за счет ее уменьшения в участках динамического
диапазона, не содержащего важных деталей. Помимо названных
129
инструментов коррекции, графический редактор Photoshop CS
включает в себя такие инструменты, как: «Яркость/Контраст»
(«Brigh+tness/Contrast»), позволяющий раздельно регулировать яр+
кость и контраст обрабатываемых изображений, а также инструмент
«Авто Уровни» («Auto Levels»), который автоматически выполняет
описанную выше операцию установки уровней светлого и темного.
Аналогичные инструменты с несколько отличающимися названия+
ми имеются также и в графическом редакторе Corel Photo+Paint. Кро+
ме того, в нем имеется инструмент, посредством которого можно вы+
делять на изображении контуры, создавая контурный препарат.
130
Библиографический список
1. Красильников Н. Н. Цифровая обработка изображений. М.:
Вузовская книга, 2001. 319 с.
2. Петров М. Н., Молочков В. П. Компьютерная графика. М.:
Питер, 2006. 810 с.
3. Пореев В. Н. Компьютерная графика. СПб.: БХВ+Петербург,
2005. 428 с.
4. Гонсалес Р., Вудс Р. Цифровая обработка изображений // Сер.
«Мир программирования». М.: Техносфера, 2004.
5. Роджерс Д., Адамс Дж. Математические основы машинной гра+
фики. М.: Мир, 2001. 604 с.
6. Шикин Е. В., Боресков А. В. Компьютерная графика. Полиго+
нальные модели. М.: ДИАЛОГ+МИФИ, 2000. 464 с.
7. Эйнджел Э. Интерактивная компьютерная графика. Вводный
курс на базе OpenGL. М.: Изд. дом «Вильямс», 2001. 592 с.
8. Мердок, Келли Л. 3ds max 7. Библия пользователя: пер. с англ.
М.: Изд. дом «Вильямс», 2006. 1296 с.
9. Дьяконов В. П. Matlab/6/0/6/1/6/5/6/5+SPI. Simulink 4/5.
Обработка сигналов и изображений. М.: СОЛОН+Пресс, 2005. 591 с.
10. Тозик В. Т., Меженин А. В. 3ds max: трехмерное моделирова+
ние и анимация. СПб.: БХВ+Петербург, 2005. 992 с.
131
Учебное издание
Красильников Николай Николаевич
Красильникова Ольга Ивановна
МУЛЬТИМЕДИАТЕХНОЛОГИИ
В ИНФОРМАЦИОННЫХ СИСТЕМАХ
ПРЕДСТАВЛЕНИЕ И ОБРАБОТКА ИЗОБРАЖЕНИЙ
В КОМПЬЮТЕРЕ
Учебное пособие
Редактор Г. Д. Бакастова
Верстальщик С. Б. Мацапура
Сдано в набор 21.02.07. Подписано к печати 14.06.07.
Формат 60×84 1/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 7,5.
Уч.+изд. л. 8,19. Тираж 250 экз. Заказ № 331.
Редакционно+издательский центр ГУАП
190000, Санкт+Петербург, Б. Морская ул., 67
132
Документ
Категория
Без категории
Просмотров
6
Размер файла
1 192 Кб
Теги
multimediatekhn, krasilnikov
1/--страниц
Пожаловаться на содержимое документа