close

Вход

Забыли?

вход по аккаунту

?

Правила нечеткой кластеризации при распознавании образов..pdf

код для вставкиСкачать
Материалы Международной конференции
3.
4.
Интеллектуальные САПР”
“
ные САПР/Материалы международной научно-технической конференции и молодежной научной конференции “Интеллектуальные САПР”. Таганрог: TPTУ, 2000. №2(16). С.78–81.
Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. СПб: Питер.
2000 384с.
Малышев Н.Г. Берштейн Л.С., Боженюк А.В. Нечеткие модели для экспертных систем
в САПР. М.: Энергоатомиздат, 1991. 136с.
УДК 007.001.362:681.327.12.001.362
О.Н. Родзина
ПРАВИЛА НЕЧЕТКОЙ КЛАСТЕРИЗАЦИИ ПРИ РАСПОЗНАВАНИИ
ОБРАЗОВ
Когда впервые в 1965 г. Л.Заде представил понятия нечеткой логики, то его
первоначальная цель состояла в формализации операций представления и обработки знаний. В настоящее время нечеткие системы получили широкое распространение и нашли применение в сфере автоматизации управления. Гораздо более скромными на этом фоне выглядят успехи собственно в области анализа нечетких данных и знаний. Между тем сфера прикладных задач нечеткого кластерного анализа
простирается от проблем классификации и функциональной аппроксимации до
построения самообучаемых систем распознавания образов.
В данной работе рассматриваются особенности построения нечетких правил
кластеризации и их преимущества в сравнении с традиционным подходом.
Правило r для задачи классификации представим в виде
r : еслиξ1 естьµ1r & ... & ξ p есть µ rp , то ээт класс Сr .
(1)
Здесь ξ1,...,ξ p являются вещественными переменными, а µ ri – значение степени принадлежности некоторому нечеткому множеству i-го лингвистического
терма, который характеризует это множество. Если вектор (ξ1,..., ξ p ) задан, то
µ ri (ξ ) указывает на то, насколько величина ξ является подходящим значением
для лингвистического терма, причем 0 ≤ ξ ≤ 1 .
Конъюнкция в выражении (1) чаще всего оценивается, согласно [1], как
0 ≤ ξ ≤ 1 , где вычисление минимума может быть заменено вычислением t-нормы
(триангуляция), которая является двуместной операцией, обладающей свойствами
коммутативности, ассоциативности и монотонности роста аргументов, причем 1
является нейтральным аргументом. Наряду с минимумом иногда применяется tнорма Лукасевича, согласно которой двум значениям a, b из интервала [0,1] ставится в соответствие число, равное max{a+b - 1,0}.
Чаще всего некоторый класс требует для своего описания нескольких правил,
образующих множество R = {r1,..., rn } . Обозначим степень выполнимости некоторого правила через
101
Известия ТРТУ
Тематический выпуск
µ r (ξ1 ,..., ξ p ) = min {µ rj (ξ j )} .
i
j =1,..., p
(2)
i
Тогда из множества правил выбирается такое правило, которое имеет наибольшее значение степени его выполнимости:
µ cR (ξ1 ,..., ξ p ) = max { µ r (ξ1 ,..., ξ p ) | C r = C } .
(3)
i
i
Таким образом, определяется степень принадлежности вектора (ξ1,..., ξ p ) ,
описывающего некоторый объект распознавания к классу С:
C , если µCR (ξ1,..., ξ p ) > µ DR (ξ1,..., ξ p ), ∀D ≠ C ,
R (ξ1,..., ξ p ) = 

неопределенное решение
Обозначим через R −1(C ) множество векторов, которые определяют правила
классификации для класса C, т.е.
R −1 (C ) = {(ξ1,..., ξ p ) | R (ξ1,..., ξ p ) = C }.
Известно [2], что линейная сепарабельная проблема классификации при наличии двух классов, разделяемых прямой традиционными «четкими» методами,
может быть решена лишь приближенно. Применяя нечеткие правила, эту проблему
можно решить точно. Обоснуем это.
Лемма. Пусть задана некоторая монотонная функция f, определяющая отображение [a1, b1 ] → [a2 , b2 ] , при ai < bi .
Тогда существует конечное множество R нечетких правил классификации для
классов C и D, такое, что справедливо
R −1 (C ) = {( x , y ) ∈ [a1, b1 ]× [a2 , b2 ] | f ( x ) > y},
R −1( D ) = {( x , y ) ∈ [a1, b1 ]× [a2 , b2 ] | f ( x ) < y}.
Доказательство. Введем следующие обозначения X = [a1, b1 ],Y = [a2 , b2 ]
и определим нечеткое множество следующего вида (рис. 1):
µ1 : X → [0,1],x = ( b2 − f ( x )) /( b2 − a2 ),
µ2 : X → [0,1],x = ( f ( x ) − a2 ) /( b2 − a2 ) = 1 − µ1( x ),
ν1 : Y → [0,1], y = ( y − a2 ) /( b2 − a2 ),
ν 2 : Y → [0,1], y = ( b2 − y ) /( b2 − a2 ) = 1 − ν1 ( y ).
В качестве множества правил R = {r1,r2 } задаются два правила:
r1 : если x есть µ1 и y есть ν 1 , то это класс D,
r2 : если x есть µ 2 и y есть ν 2 , то это класс С.
102
Материалы Международной конференции
Интеллектуальные САПР”
“
Рис.1
Рассмотри три возможных варианта.
1). f(x)>y. Если µ1 ( x ) ≥ ν 1 ( y ) , то отсюда следует, что µ 2 ( x ) ≤ ν 2 ( y ) .
Тогда
µ D ( x , y ) = ν 1 ( y ) = ( y − a2 ) /( b2 − a2 ) < ( f ( y ) − a2 ) /( b2 − a2 ) =
= µ 2 ( x ) = µ C ( x , y ).
Если µ1 ( x ) < ν 1 ( y ) , то это означает, что µ 2 ( x ) > ν 2 ( y ) и поэтому
µ D ( x , y ) = µ1 ( y ) = ( b2 − f ( x )) /( b2 − a2 ) < ( b2 − y ) /( b2 − a2 ) =
= ν 2 ( x ) = µ C ( x , y ).
2). f(x)<y. Этот вариант аналогичен предыдущему (знак < необходимо изменить на знак >).
3). f(x)=y. Отсюда следует, что µ1 ( x ) = ν 1 ( y ) и µ 2 ( x ) = ν 1 ( y ) .
Таким образом, µ D ( x , y ) = µ C ( x , y ) . Что и требовалось доказать.
Лемма легко обобщается для случая частично монотонных решающих функций. Из леммы следует также, что при наличии двух правил классификации достаточно использовать нечеткие области треугольной формы.
Для того, чтобы при нечетко заданном кластере можно было сформулировать
правило классификации в p-мерном пространстве, необходимо найти проекции
кластера. В[3] приводятся формулы для расчета степени принадлежности некоторого значения ξ проекции кластера на некоторый орт p-мерного пространства.
Практическое применение этих формул показывает, что они плохо "работают" в
случае, когда классифицируемый объект расположен далеко от центров всех кластеров.
103
Известия ТРТУ
Тематический выпуск
Более продуктивным представляется подход, согласно которому проекции
соседних "пиков" соединяются прямыми, после чего полученную кривую преобразуют к унимодальному виду (рис.2).
Рис.2
При этом объекты с очень малой степенью принадлежности к кластеру при
нахождении проекции не учитываются.
Другая особенность нечеткой кластеризации заключается в том, что правила
кластеризации имеют параметрическую форму в виде треугольника, трапеции или
гауссовой кривой (рис. 3), которые характеризуются, соответственно, тремя, четырьмя или двумя параметрами.
Рис.3
Задача состоит в таком выборе параметров (a,b,c,a',b',c',d',m,s), чтобы минимизировать сумму среднеквадратичных ошибок и рассчитать степень принадлежности к параметрическому нечеткому множеству. В [4], например, представлен
эвристический алгоритм для трапециевидной формы нечеткого множества. Идея
алгоритма состоит в том, что путем подбора параметров минимизируется среднеквадратичная ошибка. В зависимости от применяемого алгоритма кластеризации
форма кластера может быть различной: "карандаш", эллипс и т.п.
При обучении распознаванию число правил кластеризации выбирается равным числу кластеров. Если число ошибок, допущенных в ходе классификации,
велико, то число правил кластеризации необходимо увеличить, после чего постепенно увеличивается число кластеров. Этот процесс продолжается до тех пор, пока
число ошибок классификации не снизится до заданной величины. Конечно, при
построении проекций нечеткого кластера потери информации полностью избежать
не удается. Тем не менее, применение нечетких правил для решения проблемы
классификации играет существенную роль, в частности, при предобработке исходных данных и оптимизации процесса распознавания образов.
104
Материалы Международной конференции
Интеллектуальные САПР”
“
ЛИТЕРАТУРА
1. Zadeh L. A. Fuzzy Sets/Information and Control, 8(1965). p.338-353.
2. Klawonn F. Fuzzy Sets and Vague Environments / Fuzzy Sets and Systems, 66(1994). p.207221.
3. Родзина О.Н. Методы, модели и технология разработки нечетких кластерных анализаторов для классификации и распознавания графических образов / Электронный Интернет-журнал "Перспективные информационные технологии и интеллектуальные системы", pitis@tsure.ru 2000. №3.
4. Sugeno M., Yasukawa T. A Fuzzy-Logic-Based Approach to Qualitative Modeling / IEEE
Trans. Fuzzy Systems, 1 (1993). p.7-31.
УДК 007:519.23:615.834
Е.А. Алашеева
РАЗРАБОТКА БЛОКА ПОДДЕРЖКИ ПРИНЯТИЯ УПРАВЛЕНЧЕСКИХ
РЕШЕНИЙ ДЛЯ СОВЕТУЮЩЕЙ СИСТЕМЫ
В настоящее время широкое применение получили системы, предназначенные для поддержки процессов принятия решений, в частности, советующие и экспертные системы.
Опыт применения экспертных методов в медицине и здравоохранении показал их высокую эффективность. Широко распространены диагностические, прогнозные и консультативные экспертные системы, реализуемые как с помощью
ЭВМ, так и, в ряде случаев, вручную. Экспертные оценки использованы в качестве
вспомогательного средства в большом числе методик различного назначения /1/.
Для санаторно-курортных учреждений большую практическую ценность
представляют советующие системы, ориентированные не только на повышение
точности диагностики и медицинской эффективности лечения, но и позволяющие
оценить экономическую эффективность проведенного лечения. Это приобрело
особую актуальность вследствие того, что в нынешнюю пору реформ руководителю санаторно-курортного предприятия приходится совмещать свою прямую функцию врача с функциями менеджера-экономиста.
Руководству санаторно-курортных предприятий приходится решать следующие основные задачи /2/:
♦
оказание определенных видов медико-оздоровительных услуг;
♦
достижение определенных качественных результатов;
♦
выполнение плановых показателей при наиболее рациональном использовании всех видов ресурсов.
Несмотря на то, что эти задачи взаимосвязаны, пути их достижения могут
быть различны и даже противоположны. Так, для улучшения качества часто приходится сокращать набор оказываемых услуг и увеличить расход ресурсов.
Соответственно решаемым задачам используются различные методы управления. Существует набор мероприятий, видов лечения, которые должны производиться определенной категорией медицинских учреждений в соответствии с их
специализацией вне зависимости от их экономической эффективности.
105
Документ
Категория
Без категории
Просмотров
5
Размер файла
220 Кб
Теги
нечеткой, образов, pdf, правила, распознавание, кластеризацию
1/--страниц
Пожаловаться на содержимое документа