close

Вход

Забыли?

вход по аккаунту

?

Анализ коммерческих предприятий на основе алгоритма нечеткой кластеризации.

код для вставкиСкачать
Известия ТРТУ
Тематический выпуск
формации. Поэтому поиск сводится к нахождению слоя, на котором находятся образы расположения объектов.
Устанавливается схема рассуждений. В рассматриваемом случае
можно либо оценивать степень пересечения построенного образа (использовать дедуктивную схему), либо сравнивать объем фигур пересечения
известного объекта и заданного (использовать аналогию).
Результатом выполнения перечисленных действий является определение степени истинности переменной ОбъектВыгодноРасположен, которая далее может использоваться для вывода в продукционной базе знаний.
Подводя итог, можно заключить следующее:
1) нечеткие знания, используемые ГИС, могут представляться графическими образами и обрабатываться и храниться подобно другим картографическим объектам;
2) логический вывод на основе правил целесообразно сочетать с
выводом, базирующемся на обработке визуальных образов.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Искусственный интеллект: Справочник / Под ред. Д.А. Поспелова. М.: Радио и
связь, 1990. Т. 2.
2. Берштейн Л.С., Боженюк А.В. Нечеткие модели принятия решений: дедукция, индукция, аналогия. Таганрог: Изд-во ТРТУ, 2001.
А.В. Боженюк, С.А. Радченко
АНАЛИЗ КОММЕРЧЕСКИХ ПРЕДПРИЯТИЙ
НА ОСНОВЕ АЛГОРИТМА НЕЧЕТКОЙ КЛАСТЕРИЗАЦИИ
Необходимость проведения анализа состояния коммерческих предприятий1 объясняется различными причинами. Такой анализ необходим
и владельцу предприятия, и его менеджерам, и потенциальным инвесторам,
и банкам, и даже покупателям продукции предприятия. Анализ состояния предполагает многокритериальный подход (например, необходимость
учета различных критериев, таких как ликвидность, задолженность, прибыльность и т.п.) и требует сравнения с состояниями других предприятий. Проведение сравнений состояния предприятий ? это проблема, которая трудна для формализации. Проблема требует знаний эксперта, его опыта и интуиции. Такой анализ во многом связан с сомнительными и неточными результатами из-за различной природы критериев оценки.
Одним из методов анализа, позволяющего проводить сравнение коммерческих предприятий по различным критериям, является кластерный
анализ. Кластерный анализ позволяет разбивать предприятия на классы
и, таким образом, определять принадлежность каждого из них к той или
иной группе, используя при этом некоторую меру сходства. Однако использование традиционных подходов кластерного анализа обладает существенным недостатком. В результате кластеризации «теряется» информация о том, насколько «сильно» предприятие относится к тому или
иному классу. В терминах теории нечетких множеств [1] это означает,
что степень принадлежности предприятия к тому или иному классу либо
равна 0, либо 1. Введение в алгоритм кластеризации нечеткости позволит избавиться от этого недостатка и в результате получать степени
принадлежности объекта к классам, определенные в интервале [0, 1].
1
180
Работа поддержана РФФИ (проект № 03-07-90202).
Раздел II. Проектирование и моделирование интеллектуальных систем
Чем ближе степень принадлежности к единице, тем "сильнее" объект
принадлежит данному классу.
В данной статье для анализа предприятий предлагается использовать алгоритм, основанный на методе нечеткой кластеризации [2]. Здесь
расположение любого кластера представлено его центром, вокруг которого концентрируются объекты этого кластера. Значение функции принадлежности k-го объекта i-му классу определяется как
µ ik =
- ( m ?-)
?
?
??
x ? vi
? k
2
G
c ??
??
j=-? x k ? v j
?
?
?
??
?
2
G
- ( m ?-)
?
?
?
?
?
, i=1,? ,c; k=1, ? , n,
(1)
где
vi =
n
n
? (µ ik )
m
? (µ ik ) x k , i=1, ? , c.
(2)
m k =-
k =-
Здесь vi ? центр i-го кластера; xk ? вектор значений к-го объекта
(по нескольким показателям); x k ? v j
G
? нормированное (в частности,
евклидово) расстояние между объектом к и центром кластера i; µik ?
степень принадлежности к-го объекта к i-му классу; m ? вес, который
уменьшает влияние «шума» при расчете кластерных центров и значения
~
целевой функции Z m ( U, v ) .
Задача нечеткой кластеризации в этом случае ставится следующим образом: определить значение
~
n
c
min Z m ( U, v) = ? ? (µ ik )m x k ? v i
2
,
(3)
k =- i =-
~
где U ? матрица размера сЧn функций принадлежности i-го объекта кму классу: i=1, ? , n; k=1, ? , c.
При этом величина m уменьшает влияние небольших значений µik
(точек, более отдаленных от vi) по сравнению с большими значениями µik
(точки, расположенные ближе к vi).
Рассмотренная задача в общем случае не решается аналитически.
Поэтому, для ее решения предлагается использовать нечеткий итерационный алгоритм. Данный алгоритм сходится за конечное число итераций.
Реализация алгоритма разбивается на последовательность следующих шагов:
~
10. Выбираются значения с (2?с?n), m (1<m<?) и U 0 ; L=0.
20. Рассчитываются с нечетких кластерных центров
пользованием U
~
(L )
{v } с
( L)
i
ис-
.
181
Известия ТРТУ
Тематический выпуск
30. Рассчитывается
U
~
( L +-)
новая
матрица
{ }
функций
принадлежности
с использованием значений v i ( L) , в том случае, если x j ? v i ( L) .
?
?-, +)"# j = i
.
Иначе полагаем µ ik = ?
?0, +)"# j ? i
?
0
4 . Выбирается подходящая норма матрицы и рассчитывается значение ? = U
~
( L +-)
?U
~
( L)
. Если величина ?>?, то L:=L+1, и переходим ко
G
второму шагу. Если ???, то останавливаемся.
В данном алгоритме задается ряд параметров: количество кластеров с (2?с?n), экспоненциальный вес m (1<m<?), метод для инициали~
зации матрицы функций принадлежности U 0 , критерий окончания алгоритма ???.
В приведенном алгоритме необходимо самостоятельно задать экспоненциальный вес m, норму G, количество кластеров «с» и начальную
~0
матрицу степеней принадлежности U .
Значительное влияние на конечный результата алгоритма оказывает выбор экспоненциального веса m. Чем больше m, тем более расплывчаты значения матрицы окончательного разбиения. Обычно более
предпочтительными являются «менее» нечеткие функции принадлежности, поскольку более высокий уровень принадлежности означает большую концентрацию точек вокруг центров кластеров. Не существует теоретического правила для выбора m. Обычно полагают 1?m?2 [3].
Выбор нормы значительно влияет на форму кластеров, например,
выбор евклидовой нормы означает, что G ? это единичная матрица, а
форма кластеров будет сферической.
Для оценки правильности выбора кластеров в алгоритме нечеткой
кластеризации можно адаптировать несколько критериев из четкого кластерного анализа.
Одним из наиболее прямых критериев является целевая функция
(3). Поскольку значение целевой функции монотонно убывает с увеличением
количества кластеров «с» (это означает, что функция достигает своего минимума, когда c=n), то с* можно выбирать, когда будет происходить наибольшее падение при переходе от величины с* к величине с* + 1.
Другой критерий ? это уровень сходимости. Установлено [2], что
для хорошей кластерной структуры и для правильного количества кластеров «c» достигается хороший уровень сходимости алгоритма.
Правильный выбор количества кластеров делает алгоритм «устойчи~
вым» к различным начальным значениям матрицы U 0 . Неправильный выбор числа кластеров приводит к тому, что реализуются различные «оптима~
льные» решения при различных начальных инициализациях матрицы U 0 .
Все критерии служат для определения «правильного» количества
кластеров. Они эвристичны по своей природе и поэтому могут приводить
к окончательным разбиениям, которые не всегда правильно определяют
существующие кластеры. Бездек показал, например, что глобальный минимум целевой функции не обязательно достигается при правильном
разбиении [2]. Поэтому другие оценки для обоснования количества кластеров необходимы для того, чтобы судить о качестве разбиения.
182
Раздел II. Проектирование и моделирование интеллектуальных систем
При использовании следующих критериев рассчитываются функционалы обоснованности кластеризации, которые каждому окончательному разбиению присваивают скалярную величину, которая должна отражать качество кластеризации. При проектировании таких критериев
предположили, что кластерная структура лучше определяется, когда
больше точек концентрируются вокруг центров кластеров, то есть более
четкая (менее размытая) матрица принадлежности окончательного разбиения, генерируемая алгоритмом нечеткой кластеризации.
Наиболее известные величины для оценки нечеткости кластерного ре~
~
шения ? коэффициент разбиения F( U; c) и коэффициент энтропии H( U; c) .
~
Пусть U ? это нечеткое разбиение n точек на с классов. Коэффиn c (µ )2
~
~
циентом разбиения U является величина F( U; c) = ? ? ik .
n
k =-i =Энтропией разбиения нечеткого с-разбиения является величина
~
- n c
H ( U; c) = ? ? µ ik log e (µ ik ) .
n k =-i =Для приведенных оценок справедливы следующие отношения:
~
~
? F (U ; c ) ? -, 0 ? H (U ; c ) ? log e (c ).
c
Экстремальные значения коэффициента разбиения и коэффициента энтропии имеют следующую взаимозависимость:
~
~
F (U ; c ) = - ? H (U ; c ) = 0,
~
~
F (U ; c ) = ? H (U ; c ) = log e (c ).
c
Эвристические правила для выбора "правильных" или наилучших
разбиений следующие:
~
max{max
{ F (U ; c )}}
~
c = 2,..., n ? -,
~
min{min
{ H (U ; c )}}
~
c = 2,..., n ? -.
c
c
U ?? c
U ??c
Здесь ?с ? это множество всех "оптимальных" решений для данного с.
~
~
Ограничения F( U; c) и H( U; c) в связи с тем, что монотонно возрастают их значения, не позволяют судить о приемлемости окончательного
разбиения. Монотонность обычно приводит к тому, что «правильное»
разбиение ? это разбиение на два класса. Эта проблема может быть решена, к примеру, если выбирать разбиение i*, для которого значение
~
H( U; c) лежит ниже его тренда при переходе от с*?1 к с*.
Рассмотренный алгоритм может оказаться полезным для сравнения состояний различных коммерческих предприятий. С его помощью могут быть
определены степени принадлежности предприятий к выделенным классам.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Классификация и кластер / Под ред. Дж. Райзина. М.: Мир. 1980. 389 с.
183
Известия ТРТУ
Тематический выпуск
2. Zimmermann H.-J. Fuzzy set theory and its applications. Kluwer Academic
Publishers. 1990. 399 p.
3. Runkler T.A., Bezdek J.C. Living Clusters: An Application of the El Farol Algorithm to the Fuzzy c-Means Model // 5th European Congress on Intelligent
Techniques & Soft Computing. Aachen, Germany, September 8?11, 1997, vol.2.
Р. 1678?1682.
В.С. Васильев
ЭНЕРГЕТИЧЕСКИ НЕЙТРАЛЬНАЯ СТРОГО ДИССИПАТИВНАЯ
АППРОКСИМАЦИЯ ДВУМЕРНОЙ ГИДРОДИНАМИЧЕСКОЙ
СИСТЕМЫ НА ПОДВИЖНОЙ КРИВОЛИНЕЙНОЙ СЕТКЕ
В ВЕРТИКАЛЬНОМ ПОЛЕ
Ранее [1] для гидродинамической системы
??t + (?u )? x + (?w)? z = 0 ,
(?u )?t + (?uu )?x + (?wu )? z = ? p?x ? ???x + (2?u?x + ??(u?x + w?z ))?x + (?(u?z + w?x ))?z ,
(1)
(2)
(?w)?t + (?uw)?x + (?ww )?z = ? p?z ? ???z + (?(u?z + w?x ))?x + (2?w?z + ??(u?x + w?z ))?z , (3)
где ? = ?(t , x, z ) , u = u(t , x, z ) ,
? = ?(t , x, z ) ,
w = w(t , x, z ) ,
p = p(t , x, z ) ,
? = ? (t , x, z ) и ?? = ??(t , x, z ) ? плотность, компоненты вектора скорости,
давление, гравитационный потенциал, первый и второй коэффициенты
вязкости соответственно, была предложена энергетически нейтральная
аппроксимация конвективных и строго диссипативная (за счет действия
сил вязкого внутреннего трения) аппроксимация вязких слагаемых на
криволинейной неподвижной сетке.
Целью является построение гидродинамической модели водоема
при наличии свободной поверхности у жидкости. В случае неподвижной
сетки это приведет к появлению, помимо заполненных, также незаполненных и частично заполненных ячеек. Другой подход состоит в использовании подвижной (вслед за движениями свободной поверхности) сетки.
Заметим, что наличие заполненных, незаполненных и частично заполненных ячеек в случае неподвижной сетки координат делает расчетную
сетку фактически подвижной, поскольку (после дискретизации по времени) значения сеточных функций на новом временном слое могут относиться к иным точкам сетки по сравнению с предыдущим слоем.
В условиях вертикального поля тяжести невозмущенная поверхность водоема будет горизонтальной. Если ось x направить горизонтально, а ось z ? вертикально (вверх), то
??x = 0 , ??z = g = g (z ) ,
g = ? gk = ???z k = ?grad? .
Модель призвана описывать медленные движения без образования
брызг и обрушивания волн. Поэтому свободную поверхность водоема
e(t , x ) и поверхность дна d (t , x ) будем считать однозначными функциями
x в любой момент времени t .
В гидростатическом приближении давление воды p(t , x, z ) связано с
атмосферным давлением a(t , x ) и глубиной z ( d ? z ? e ) соотношениями:
184
Документ
Категория
Без категории
Просмотров
21
Размер файла
232 Кб
Теги
анализа, нечеткой, алгоритм, коммерческое, основы, предприятия, кластеризацию
1/--страниц
Пожаловаться на содержимое документа