close

Вход

Забыли?

вход по аккаунту

?

Новый метод вычисления поля ориентаций изображения.

код для вставкиСкачать
Раздел VI. Математические методы искусственного интеллекта
Раздел VI. Математические методы искусственного
интеллекта
УДК 004.932.2
А.А. Сухинов, И.Н. Тетеревлев, В.В. Царевский
НОВЫЙ МЕТОД ВЫЧИСЛЕНИЯ ПОЛЯ ОРИЕНТАЦИЙ ИЗОБРАЖЕНИЯ
Рассматривается новый метод вычисления поля ориентаций изображения, основанный на максимизации суммы векторов градиента в локальной окрестности. Дана общая
информация об ориентациях изображения в непрерывном и дискретном случаях, построен
алгоритм вычисления, и проведено сравнение метода с другими методами вычисления ориентаций. Показано, что в сравнении с существующими методами предлагаемый метод
имеет существенно меньшую систематическую погрешность для углов ориентации, близких к вертикалям или горизонталям. Метод может применяться в задачах анализа отпечатков пальцев, интерполяции, фильтрации шума, детекции объектов.
Анализ изображений; ориентация; градиент; отпечатки пальцев; интерполяция
A.A. Sukhinov, I.N. Teterevlev, V.V. Tsarevskyj
A NEW METHOD OF ORIENTATIONS FIELD CALCULATION
It is considered a new method of orientations field calculation for image processing, based
on the idea of maximization the sum of gradients inside local neighborhood. The introduction to
image orientations in continuous and discrete cases is given. The algorithm of the new method is
developed; the method is compared to existing methods of orientations calculation. It is shown that
new method has much lower systematic inaccuracy for orientations close to verticals or horizontals. The method can be applied in tasks of fingertips analysis, image interpolation, noise filtering
and object detection.
Image analysis; orientation; gradient; fingertips; interpolation
Введение. Обработка и анализ изображений все более широко входит в нашу
жизнь. С появлением дешевых и быстродействующих микропроцессоров существенно возросло количество электронных устройств, осуществляющих цифровую
обработку изображений – фотоаппараты, телевизоры, видеокамеры и подобные
устройства. Типичными задачами обработки изображения являются:
 изменение разрешения изображения;
 фильтрация шума;
 детекция лица, глаз, улыбки, и прочих элементов на изображении;
 применение к изображению художественных эффектов.
Изображения обычно представлены в виде матрицы квадратных элементов, называемых пикселями (растровое представление изображения). Для простоты изложения будем рассматривать черно-белые изображения, в которых каждый пиксель
имеет значение, связанное монотонной функцией с яркостью этого пикселя.
Основная проблема, возникающая при обработке изображений, заключается
в том, что значения пикселей являются слишком низкоуровневыми свойствами
изображения, из которых достаточно сложно получить нужную для обработки информацию.
187
Известия ЮФУ. Технические науки
Тематический выппуск
Рассмотрим распрострранённую задачу интерполяции изображения. Интеррполяция используется как дляя изменения разрешения изображения (например, с целью его отображения), так и для начального построения цветного изображенния в
цифровых фотоаппаратахх и видеокамерах, оснащенных фотосенсоором
с байеровским расположениием детекторов [1].
Классические линейны
ые алгоритмы интерполяции, основанные на сопостаавлении пикселям некоторых баазисных функций с последующим их сложением (биилинейная интерполяция, бикуубическая интерполяция, sinc и подобные методы), при
использовании в обработкее изображений показывают себя плохо, так как созддают
эффект ступенчатости, непрриятный для глаза (рис. 1). Можно показать, что лиинейные алгоритмы не могут иззбежать этого эффекта для линий, ориентированных под
различными углами.
Одним из способов реешения этой проблемы является введение анизотроппии в
используемый алгоритм иннтерполяции, причем анизотропия должна зависеть от
локальных особенностей иззображения. В качестве такой особенности чаще всего
выступает ориентация – направление, вдоль которого изображение меняяется
меньше всего. Анизотропияя, связанная с ориентацией, может вводиться в алгорритм
как неявно (например, путеем использования в качестве составной части алгориитма
медианной фильтрации, облладающей анизотропией), так и путем явного вычиисления ориентации и использоввания её в алгоритме.
а
б
в
Рис. 1. Исходное изображеение (a). Изображение, увеличенное в 5 раз при помо
ощи
бикубической интерполяцции (б). Изображение, увеличенное в 5 раз при помощ
щи
аннизотропной интерполяции (в)
Ориентации являютсяя более высокоуровневыми признаками изображеения,
чем цвета пикселей, поэтом
му могут быть плодотворно применены для многихх задач обработки и анализа иззображений. Например, ориентации давно применяю
ются
для анализа отпечатков палльцев [2] и изображений кристаллических структурр [3],
где они позволяют компакттно описать системы линий на изображении.
1. Ориентация в непр
рерывном случае. Как было сказано выше, ориентаация
– это направление, вдоль ккоторого изображение меняется меньше всего. В непрерывном случае для функциии двух переменных ориентация определяется напраавлением изолинии в точке, котторое, в свою очередь, перпендикулярно вектору градиента.
Уже при таком простоом определении выявляется интересное свойство ориентации – она определена с тточностью до угла 180 градусов, то есть ориентациии с
углом  и   180 являю
ются эквивалентными. Если рассматривать ориентаццию,
как вектор (о длине этого вектора мы поговорим далее), то получается, что этот
вектор известен нам с точнностью до знака. Такие «ненаправленные» векторы
ы будем называть векторами орииентаций.
188
Раздел VI. Математические методы искусственного интеллекта
Проблема заключается в том, что отсутствует необходимый математический
аппарат для работы с векторами ориентаций; например, не ясно, как складывать
два таких вектора. Для решения этой проблемы зачастую применяется прием, заключающийся в удвоении угла поворота вектора (относительно некоторого нулевого направления), после чего вектор ориентации превращается в обычный вектор.
Удвоение угла обладает следующими свойствами:
 После удвоения угла векторы x и  x становятся равными.
 Максимально различающиеся ориентации – перпендикулярные – превращаются в максимально различающиеся векторы – противоположно направленные.
Мы приходим к выводу, что удвоение угла осуществляет взаимнооднозначное отображение пространства векторов ориентаций в пространство
обычных векторов. Важно, что это отображение является непрерывным и обеспечивает «хорошую» метрику в пространстве ориентаций, определяемую евклидовой
нормой разности соответствующих векторов.
Для удвоения угла вектора не обязательно использовать тригонометрические
T
функции. Вместо этого можно рассмотреть вектор  x, y  как комплексное число
x  iy , и возвести его в квадрат:
 x  iy 
2
  x2  y 2   i   2 xy  .
(1)
  x
(2)
Для соответствующего преобразования вектора введем операцию sqr :

sqr  x, y 
T
2
 y 2 , 2 xy  .
T
Это выражение может быть вычислено целочисленно.
Помимо удвоения угла, преобразование (2) приводит к возведению в квадрат
длины вектора. Если это изменение длины является нежелательным, то можно
поделить новый вектор на длину исходного:


⎛ x ⎞ sqr  x, y 
(3)
.
⎜ y⎟ 
2
2
x y
⎝ ⎠
Кроме направления ориентации, интерес представляет её «выраженность» –
число, характеризующее то, насколько сильно данная ориентация «заметна» в окрестности изображения, и насколько она выделяется среди других ориентаций.
В непрерывном случае в качестве выраженности ориентации логично взять
длину соответствующего вектора градиента или квадрат этой длины.
2. Алгоритмы вычисления ориентации в дискретном случае. Существует
большое количество алгоритмов вычисления ориентации в дискретном случае [4].
Приведем некоторые из них:
1. Метод структурного тензора. Для всех пикселей изображения вычисляются
дискретные аналоги градиентов, эти градиенты возводятся в квадрат по
формуле (2), а затем квадраты усредняются по окрестности каждого пикселя.
2. Спектральный метод (в базовом варианте даёт дискретные углы). Для всех
пикселей скользящего окна рассчитываются спектральные коэффициенты
с помощью преобразования Фурье. Среди них находится максимальный
коэффициент и соответствующие ему координаты m1 , m2 в окне. Ориентация рассчитывается по формуле tg    m1 m2 .
T
189
Известия ЮФУ. Технические науки
3.
Тематический выппуск
Дифференциальныйй метод (в базовом варианте даёт дискретные угглы).
Внутри скользящегго окна вычисляются производные вдоль направлеений
конкретных углов (для маски 3  3 вычисляются производные вдольь направлений 0 , 45 , 90 , 135 , а для маски 5  5 – производные вдольь направлений 0 , 26 , 45 , 63 , 90 , 116 , 135 , 153 ). Производная фуункции яркости по ннаправлению, совпадающему с направлением полоосы,
имеет наименьшее (по модулю) значение среди производных по напправлению в текущей тоочке:   arg min f .

Алгоритм параметррической аппроксимации. Функция яркости аппроксимируется поверхноостями первого и/или второго порядка в симметриччном
окне. Вычисляютсяя коэффициенты полиномов, с помощью которых про
п исходит расчет орииентаций.
Рассмотрим первый аллгоритм, как наиболее близкий к алгоритму для непрерывного случая. Нетрудно видеть, что этот алгоритм даст выраженную ориеентацию в областях с большимми по модулю и параллельными (возможно, противонаправленными) градиентамии. Если же векторы градиентов малы по модулю или
перпендикулярны, то ориеннтация получается слабовыраженной.
Примеры вычисленияя ориентаций этим алгоритмом показаны на рис. 2. Обратите внимание, что ориеннтация наклонной линии (слева) отличается от углаа наклона этой линии, что мож
жет доставлять проблемы при обработке изображенний.
Этот эффект вызван наличчием систематической погрешности у большинстваа методов измерения ориентацций – вычисленные ориентации получаются бллиже
к вертикалям и горизонталяям, чем они должны быть; дефект тем сильнее, чемм более мелкие и чёткие детали попадают в обрабатываемую окрестность.
4.
а
б
в
Рис. 2. Векторы ориентацций некоторых элементов изображения, вычисленны
ые
методом структурного теензора (ориентация симметричной фигуры равна нуулю)
В случае квадратной оокрестности любого размера  2 N  1   2 N  1 меетод
позволяет вычислять ориеннтацию для каждого пикселя за время O 1 . Для этого
можно воспользоваться слеедующим алгоритмом (для сокращения записи гранничные условия не приводим):
1) Вычисляем дискреттный аналог градиента для каждого пикселя. Это мо
ожно
сделать, например, при поммощи следующего разностного шаблона:
⎛ 2ci , j 1  ci 1, j 1  ci 1, j 1  2ci , j 1  ci 1, j 1  ci 1, j 1 ⎞
gi , j  ⎜
⎟,
⎝ 2ci 1, j  ci 1, j 1  ci 1, j 1  2ci 1, j  ci 1, j 1  ci 1, j 1 ⎠
где ci , j – яркость пикселя  i, j  .
190
(4)
Раздел VI. Математические методы искусственного интеллекта
2) Возводим векторы в квадрат:
(5)
ai , j  sqr  g i , j  .
3) Вычисляем промежуточные вертикальные суммы по рекуррентной формуле:
(6)
bi , j  bi 1, j  ai  N 1, j  ai  N , j .
4) Вычисляем горизонтальные суммы вертикальных сумм, получая требуемую ориентацию окрестности:
(7)
oi , j  oi , j 1  bi , j  N 1  bi , j  N .
При программной реализации вычисления (4)–(7) выполняются за один проход по изображению без создания промежуточных буферов большого размера.
Представленный алгоритм обладает недостатками, которые мы постараемся
исправить:
1. При малом размере разностного шаблона (4) вычисленные векторы градиентов имеют большие погрешности, которые у разных векторов противоположны, однако не компенсируют друг друга при усреднении по окрестности из-за нелинейного алгоритма усреднения (5)–(7) (рис. 2,а).
2. При большом размере разностного шаблона алгоритм начинает «пропускать» мелкие детали изображения (рис. 3).
Рис. 3. Разностный шаблон большого размера, «пропускающий» тонкую линию
3. Предлагаемый метод вычисления ориентации. Пусть в окрестности
пикселя каким-либо образом вычислены N векторов градиента g1,…, g N . Так
как в предлагаемом методе нулевые векторы ни на что не влияют, но усложняют
многие рассуждения, предположим, что они выброшены из представленного списка векторов градиента. Если изначально все векторы были нулевыми, то будем
считать ориентацию такой окрестности нулевой. Везде далее векторы g i ,
i  1, , N считаются константами и для сокращения записи не фигурируют в
списках аргументов вводимых функций.
Функцией выраженности ориентации окрестности g1 ,…, g N назовем сле
дующую функцию, зависящую от единичного вектора d :
…
N
(8)
m d  ∑ d , gi ,
i 1
скалярное произведение векторов d и gi . Помимо функции
 


где  d , g i  –
m  d  , будем рассматривать функцию m   , в которой в качестве аргумента
используется угол поворота вектора d . Примеры функции выраженности для некоторых положений четырех векторов приведены на рис. 4.
191
Известия ЮФУ. Технические науки
120
90
4
90
60
120
3
150
30
2
60
150
120
30
150
210
330
180
0
210
300
330
240
30
1
0
270
60
2
1
0
90
4
3
2
0
240
4
3
1
180
Тематический выпуск
300
180
0
0
210
330
240
300
270
270
Рис. 4. Графики функции выраженности для некоторых положений четырех
векторов
Направлением ориентации окрестности g1 ,…, g N назовем единичный век
тор d * или угол его поворота  * , при котором выражение (8) достигает макси-
мума:
d *  arg max m d ,  *  arg d *
d 1
  
 .
(9)
Если функция m достигает максимума при различных значениях вектора d
*
(а это всегда так), то в качестве d возьмем любое из этих значений.
Максимизация функции m отличается от двумерного метода главных компонент тем, что в методе главных компонент максимизируется сумма квадратов
скалярных произведений, а не сумма модулей. Выраженностью ориентации окрестности g1 ,…, g N назовем положительное число m* – разность между выраженностью ориентации в направлении ориентации окрестности и выраженностью ориентации в перпендикулярном направлении:
⎞
⎛
(10)
m *  m  *   m ⎜  *  ⎟ .
2⎠
⎝
Ориентацией окрестности g1 ,…, g N назовем произведение направления
ориентации окрестности (9) на её выраженность
(10):
* *
o  d m .
(11)
Выражение (11) дает определение ориентации окрестности, но не дает алгоритма вычисления этой ориентации. Проблему представляет задача (9) нахождения максимума выражения (8).
192
Раздел VI. Математические методы искусственного интеллекта
Теорема. Рассмотрим функцию
N
G  k1 ,…, k N   ∑ ki gi , ki  1;  1.
(12)
i 1
Пусть G* – максимальное по модулю значение функции G , достигаемое на
некотором наборе коэффициентов k1* ,…, kN* :
G *  G  k1* ,…, k N*   max G  k1 ,…, k N  .
(13)
ki 1;1
Тогда функция m достигает максимума на единичном векторе
* G*
d  * ,
G
причем
m d *  G*
 
Докажем вначале следующую лемму:
Лемма.
 G , k g   0
*
*
i
i
(14)
.
(15)
i  1,… , N .
(16)
Доказательство. Предположим противное: пусть, например,
G , k g   0 .
*
*
1 1
Рассмотрим вектор G  G  k1* , k2* ,…, k N*   G *  2k1* g1 , и вычислим квадрат
его длины:
 G  G, G   G
2
*
  
 2k1* g1, G*  2k1* g1  G*
2


 4 G* , k1* g1  4  g1  .
2
Мы видим, что квадрат длины вектора G больше квадрата длины вектора
*
* * G
, так как выражение
мы, а вектор
g1

4 G , k1 g1
лем не отрицательно по предположению
ненулевой. Это противоречит тому, что вектор
длине. Лемма доказана.
Из леммы следует, что, зная максимальный вектор
коэффициенты
G* максимален по
G* , можно восстановить
ki* , использованные для его получения:
ki*  sign G* , g i

1, x  0;
  , где sign  x   ⎧⎨1, x  0.
(17)
⎩
Теперь докажем теорему. Воспользовавшись равенством
x  sign  x   x,
(18)
мы можем преобразовать выражение (8):
 
N


N

m d  ∑ d , gi  ∑ sign d , gi
i 1
i 1
   d , g   ⎛⎜⎝ d , ∑ sign  d , g   g ⎞⎟⎠.
N
i
i 1
i
i
(19)
193
Известия ЮФУ. Технические науки
Тематический выпуск
Обозначим
N
S d  ∑ sign d , g i
 

i 1
   g ,
(20)
i
тогда
  
 
m d  d,S d .
Функция
(21)
S нечувствительна к длине вектора d (до тех пор, пока он не нуле-
вой), поэтому может быть применена не только к единичным векторам. Эта функ-

ция является частным случаем функции G  k1 ,…, k N  , когда ki  sign d , gi
 .
Подставив вектор G * G * в выражение (21), получим
⎛
m⎜
⎜
⎝
G*
G*
⎞  21 ⎛
⎟  ⎜
⎟
⎜
⎠
⎝
G*
G*
⎛
⎜
⎜
⎝
⎛
,S ⎜
⎜
⎝
G*
G
*
G*
G*
N
,∑k
i 1
*
i
⎞ ⎞  20  ⎛
⎟⎟  ⎜
⎟⎟
⎜
⎠⎠
⎝
G*
G*
⎞ 13 ⎛
 gi ⎟  ⎜
⎟
⎜
⎠
⎝

N
, ∑ sign G , gi
i 1
G*
G
,G
*
*
⎞
⎟
⎟
⎠
*

⎞ 17 
 gi ⎟ 
⎟
⎠
(22)
G* .
Докажем теперь, что G * – максимальное значение, которое может принять
функция m . Из (21) следует, что
m d S d
 
а из (12), (13) и (20) следует, что
 ,
S d  G*
 
Таким образом,
(23)
.
(24)
m d  G* ,
(25)
 
причем значение G * достигается на векторе d *  G * G * , что и требовалось
доказать.
Таким образом, мы свели непрерывную задачу (9) к дискретной задаче (13),
которая заключается в расстановке знаков «+» и «−» перед векторами градиента с
целью получения суммарного вектора максимальной длины. В связи с этим разработанный метод вычисления ориентации логично назвать «методом максимальной
суммы градиентов». Для нахождения G* не обязательно перебирать все 2N вариантов значений
коэффициентов ki ; G* можно найти гораздо эффективнее. Для этого обратим вни194
Раздел VI. Математические методы искусственного интеллекта
…
из которого следует, что векторы ki* g i , i  1, , N ,
направлены так, чтобы лежать в полуплоскости вектора G* , и, напротив, если для
некоторого набора коэффициентов ki , i  1, , N , векторы ki gi не лежат в одной полуплоскости, то их сумма не может быть максимальной по длине. Поэтому
достаточно перебрать лишь те наборы коэффициентов ki , i  1, , N , для котомание на неравенство
(16),
…
…
рых соответствующие наборы векторов ki gi лежат в одной полуплоскости (таких
вариантов в общем случае N , что гораздо меньше, чем 2N ). Перебор вариантов
можно осуществить при помощи следующего алгоритма.
1) Собираем по окрестности пикселя ненулевые векторы градиента g i ,
i  1, , N . Если ненулевых векторов нет, то G*  0 .
2) Умножаем на 1 , те из векторов g i , которые не лежат в правой полуплоскости, затем сортируем векторы по возрастанию угла поворота (он
измеряется от  до   ). Тем самым, мы получаем первый набор век
торов gi1 , i  1, , N . Складываем эти векторы:
…
…
1 N 1
G  ∑ gi .
(26)
i 1
3)
Для того чтобы получить следующий набор векторов, лежащих в одной
полуплоскости, умножим на –1 вектор с минимальным углом поворота
(при этом он станет вектором с максимальным углом поворота). Тогда
суммарные векторы G j , j  2,… , N можно вычислить по следующей
рекуррентной формуле:
G j  G j 1  2 g 1j 1.
(27)
Сам набор векторов gij , давших в сумме вектор G j , нам не важен.
*
j
4) Находим максимальный вектор G среди векторов G .
После нахождения вектора G* можно вычислить ориентацию окрестности
по формулам (14), (15), (10), (11). В качестве разностного шаблона для вычисления
градиентов целесообразно брать шаблон минимального размера:
⎛ ci , j 1  ci 1, j 1  ci , j  ci 1, j ⎞
gi 1 2, j 1 2  ⎜
⎟.
⎝ ci 1, j  ci 1, j 1  ci , j  ci , j 1 ⎠
(28)
В этом случае будет достигнуто максимальное разрешение, а высокие погрешности, даваемые компактным разностным шаблоном, будут скомпенсированы
алгоритмом вычисления ориентации.
Представленный алгоритм вычисляет ориентацию окрестности g1 ,…, g N за
время O  N  ln  N   (определяется временем сортировки векторов g i по углу
ориентации), и поэтому не является эффективным. Однако если допустить наличие
некоторой погрешности в вычислении ориентации, то можно сделать это быстрее.
Для этого можно пойти следующими путями:
195
Известия ЮФУ. Технические науки
Тематический выпуск
Вычислять для окрестности каждого пикселя гистограмму градиентов [5]
c небольшим количеством сегментов (например, 8). Гистограммы могут
быть вычислены по рекуррентным формулам, аналогичным (6), (7). Затем
метод максимальной суммы применяется к гистограмме градиентов, а не к
отдельным векторам. В этом случае быстродействие алгоритма определяется числом сегментов гистограммы, а не размером окрестности. Кроме
того, за время O  N  этим способом можно вычислить ориентацию для
окрестности с гауссовским ядром, а не с квадратным, что дает более
«плавное» поле ориентаций.
2. Гибридный алгоритм: вначале применить метод максимальной суммы для
окрестности небольшого фиксированного размера, а затем к результату
применить алгоритм на основе структурного тензора (выражения (4)–(7)),
чтобы довести размер окрестности до требуемого. В итоге время вычислений составит O 1 . Этот подход быстрее предыдущего, но не дает возможности контролировать точность результата (путем выбора количества сегментов гистограммы). Как и предыдущий метод, данный метод позволяет за
время O  N  вычислить ориентацию для гауссовской окрестности.
3. Итерационный метод: нужно применять метод максимальной суммы
с малой окрестностью многократно, подавая результат одной итерации на
вход следующей. Результирующая окрестность при этом будет близка к
гауссовской, а время работы составит O  N  .
4. Сравнительный анализ точности разработанного метода. Произведем
сравнение разработанного нами метода определения поля ориентаций с уже существующими методами [4]:
 комбинированный метод квадратичной аппроксимации и аппроксимации
плоскостью (ориентация определяется, как сумма ориентаций квадратичной и линейной составляющих аппроксимационной поверхности второго
порядка);
 метод на основе структурного тензора (векторы градиента вычисляются
по формуле (28)).
Во всех методах будем использовать окрестность 5×5 пикселей. Кроме того,
измерим качество работы гибридного метода: сначала применим метод максимальной суммы для окрестности 3×3 пикселя (4 вектора градиента), а затем
к результату применим метод на основе структурного тензора (тоже
с окрестностью 3×3). Обработка четырёх векторов в гибридном методе может
быть осуществлена существенно быстрее общего случая, так как не требуется сортировка векторов по углу ориентации (для четырёх векторов проще перебрать все
8 вариантов их суммирования).
В качестве тестового изображения будем использовать изображение концентрических колец (рис. 5). Изображение достаточно сложное для анализа: на нём
имеется большое количество тонких линий с чёткими границами. Ориентации
в каждой точке известны (направлены по касательной к окружностям), поэтому
нетрудно рассчитать погрешность работы методов.
Погрешность различных методов меняется в зависимости от угла ориентации
и от размера деталей изображения. Поэтому мы будем измерять средние погрешности методов в зависимости от угла ориентации и расстояния от центра концентрических окружностей. Погрешность вычислена, как среднее отклонение измеренной ориентации (выраженной в градусах) от точной ориентации. Результаты
сравнений по этой методике представлены на рис. 6.
1.
196
Раздел V
VI. Математические методы искусственного интеллекта
Рис. 5. Тестовое изображ
жение в виде концентрических окружностей, толщи
ина
которых уменьшается с увеличением радиуса (толщина самых тонких линиий
ссоставляет полтора пикселя)
40
А
30
+40
20
0
10
−20
0
32
64
4
96
10
128
В
Б
+20
−40
0
15
30
45
60
75
+10
90
Г
+5
0
5
−5
0
32
64
4
96
10
128
Д
−10
0
15
30
45
60
75
+10
90
Е
+5
0
5
−5
0
32
64
4
96
10
128
Ж
−10
0
15
30
45
60
75
+10
90
З
+5
0
5
−5
0
32
64
4
96
128
−10
0
15
30
45
60
75
90
Рис. 6. Погрешность мето
одов вычисления ориентации в зависимости от ради
иуса
(слева) и угла (справа). Тоолстая линия – среднее значение модуля погрешност
ти,
тонкая линия – среднее значение погрешности (систематическая ошибка)::
А, Б – аппроксимация повеерхностью второго порядка (масштаб отличается от
остальных графиков); В, Г – метод структурного тензора; Д, Е – предлагаем
мый
метод макси
имальной суммы; Ж, З – гибридный метод
197
Известия ЮФУ. Технические науки
Тематический выпуск
Разработанный метод в среднем имеет меньшую погрешность, чем другие
методы. Например, средняя погрешность метода структурного тензора составила
3,9 градуса, в то время как средняя погрешность разработанного метода – 2,8 градуса, что на 28 % меньше. Средняя погрешность гибридного метода – 2,9 градуса.
Но самая важная особенность метода максимальной суммы, продемонстрированная на данном тесте, – почти полное отсутствие систематической погрешности
(метод специально разрабатывался с целью минимизации этой погрешности).
В этом плане метод хорошо проявляет себя на тестах с чёткими линиями и малым
количеством цветов (например, бинаризованные изображения отпечатков пальцев,
содержащие только чёрный и белый цвета). К сожалению, существуют другие тесты, на которых систематическая погрешность разработанного метода всё же появляется, но она остаётся меньшей, чем у других методов.
Теперь проверим устойчивость к наличию шума на изображении. Диапазон
изменения цвета на изображении 5 составляет 0, 255 . На изображение накладывается нормально распределённый шум с заданным среднеквадратичным отклонением, и вычисленное поле ориентаций сравнивается с теоретическим в каждой
точке изображения. В табл. 1 представлены результаты измерений.
Таблица 1
Зависимость средней ошибки от амплитуды шума
Амплитуда шума
0
8
16
32
64
128
Структурный тензор 3,9
5,0
5,1
5,4
6,6
9,8
Максимальная сумма 2,8
4,0
4,2
4,9
6,8
10,9
Гибридный метод
2,9
4,1
4,3
5,0
7,0
11,5
Из таблицы следует, что разработанный метод обладает чуть меньшей устойчивостью к шуму, чем метод структурного тензора, из-за чего точность работы
методов сравнивается при амплитуде шума, равной примерно 55 единиц (22 %).
Следует отметить, что 22 % – достаточно высокий уровень шума, и большинство
современных изображений имеют более высокое качество.
Заключение. Разработан новый метод вычисления поля ориентаций изображения, имеющий более высокую точность, чем существующие. Основным преимуществом разработанного метода является существенно меньшая систематическая погрешность определения угла (которая у других методов максимальна при
углах, на 15–30 градусов отличающихся от вертикали или горизонтали). Метод
может применяться взамен существующих методов в задачах анализа отпечатков
пальцев, интерполяции, фильтрации шума, детекции объектов, улучшая качество
решения этих задач.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Margaret Brown. Advanced Digital Photography. Media Publishing, 2004.
2. Hozman J., Kubinec R., Trnka J., Varenka J. Biomedical Image Processing Applications.
Biomedical Engineering & Biotechnology. – Praha: Publishing House of the Czech Technical
University, 1995.
3. Ченцова О.Б., Прокофьева Г.Л. Кристаллографический метод обследования при некоторых заболеваниях глаз. – М., 1988.
4. Сойфер В.А. Методы компьютерной обработки изображений. – М.: Физматлит, 2003.
– 459 с.
5. Navneet Dalal and Bill Triggs. Histograms of Oriented Gradients for Human Detection
(INRIA Rhone–Alps).
Статью рекомендовал к опубликованию д.ф.-м.н., доцент М.Ю. Звездина.
198
Раздел VI. Математические методы искусственного интеллекта
Сухинов Антон Александрович
Технологический институт федерального государственного автономного
образовательного учреждения высшего профессионального образования «Южный
федеральный университет» в г. Таганроге.
E-mail: Soukhinov@gmail.com
г. Таганрог, ул. Пархоменко 58/1, кв. 71.
Тел.: +79286205420.
Кафедра высшей математики; к.ф.-м.н.; доцент.
Тетеревлёв Игорь Николаевич
E-mail: tin146@mail.ru.
г. Таганрог, ул. Зои Космодемьянской, 9 Е.
Тел.: +79185199182.
Аспирант.
Царевский Виктор Васильевич
E-mail: dark5511@gmail.com.
Тел.: +79185767552.
г. Таганрог, Октябрьская площадь 5, комната 420.
Аспирант.
Sukhinov Anton Alexandrovich
Taganrog Institute of Technology – Federal State-Owned Autonomy Educational
Establishment of Higher Vocational Education “Southern Federal University”.
E-mail: Soukhinov@gmail.com.
Phone: +79286205420.
58/1, Parkhomenko Street, Apt. 71, Taganrog, Russia.
The Department of Higher Mathematics; Cand. of Phis.-Math. Sc.; Associate Professor.
Teterevlev Igor Nikolaevich
E-mail: tin146@mail.ru.
Phone: +79185199182.
9 E, Zoya Kosmodemyanskaya Street, Taganrog, Russia.
Postgraduate Student.
Tsarevsky Viktor Vasil’evich
E-mail: dark5511@gmail.com.
Phone: +79185767552.
5, Oktyabrskaya Sq., Room 420, Taganrog, Russia.
УДК 681.518
C.А. Бутенков
МАТЕМАТИЧЕСКИЕ МОДЕЛИ ПРОЦЕССОВ НА ФРАКТАЛЬНЫХ
СТРУКТУРАХ С ЗАДАННЫМИ СВОЙСТВАМИ НА ОСНОВЕ МЕТОДОВ
ГРАНУЛЯЦИИ
Фрактальные системы образуют целый мир объектов и явлений, которые в отличие
от непрерывных систем имеют «рыхлую» структуру. Если в математику концепция
фрактальных систем вошла много десятков лет назад, то в физике ценность подобных
идей была осознана лишь в 70-е годы нашего столетия. Одно из новых направлений моделирования физических процессов связано с исследованием фрактальных кластеров (ФК). ФК
(или фрактальные агрегаты) составляют один из классов фрактальных объектов, образующихся при слипании движущихся по определенному закону твердых частиц. В частности, ФК могут также организовываться и при объединении других ФК. К таким ФК относится, в частности, снежный покров (СП), представляющий собой агрегат из снежи199
Документ
Категория
Без категории
Просмотров
21
Размер файла
620 Кб
Теги
вычисления, метод, изображение, новый, поля, ориентации
1/--страниц
Пожаловаться на содержимое документа