close

Вход

Забыли?

вход по аккаунту

?

Задача нечеткой кластеризации данных мониторинга деятельности преподавателей.

код для вставкиСкачать
№ 1, 2007
Технические науки. Информатика и вычислительная техника
УДК 519.23.8
В. И. Волчихин, Е. Н. Прошкина
ЗАДАЧА НЕЧЕТКОЙ КЛАСТЕРИЗАЦИИ ДАННЫХ
МОНИТОРИНГА ДЕЯТЕЛЬНОСТИ ПРЕПОДАВАТЕЛЕЙ
Предлагается алгоритм решения задачи кластеризации при анализе деятельности преподавателей с учетом размытости границ формируемых подмножеств. Приводится пример решения задачи кластеризации в среде математического пакета Mathcad.
В настоящее время во многих вузах страны используется рейтинговая
оценка деятельности преподавателей как способ выявления их компетентности, знаний и опыта [1]. Целью рейтинговой оценки деятельности преподавателей университета с последующим поощрением лучших является стимулирование роста квалификации и профессионализма, развития творческой инициативы, эффективности педагогической и научной работы преподавателей,
что позволяет повысить качество образовательных услуг, предоставляемых
университетом, и престижность вуза [2].
В статье обсуждается постановка и решение задачи нечеткой кластеризации данных мониторинга деятельности преподавателей вуза. Приводятся
результаты решения задачи нечеткой кластеризации средствами математического пакета Mathcad.
В рейтинговой оценке принимают участие все преподаватели вуза,
включая совместителей. Для обеспечения сравнимости результатов предусматриваются квалификационные категории преподавателей: все преподаватели, профессора, доценты, старшие преподаватели (преподаватели), ассистенты. В данном случае границы формируемых классов четко определены.
Иногда для поиска закономерностей в данных необходимо сформировать
кластеры, границы которых размыты. Эта размытость состоит в том, что переход от принадлежности к непринадлежности элементов к данным классам
скорее постепенен, чем скачкообразен [3]. В данном случае следует применять методы нечеткой кластеризации.
В случае рейтинговой оценки деятельности преподавателей выборку
для кластеризации могут составлять преподаватели одной кафедры, одного
факультета или всего университета в целом. Обозначим множество объектов
кластеризации как A = {a1 , a2 , ..., an } . Конечное множество признаков или
атрибутов P = { p1 , p2 , ..., pq } , где n – общее количество объектов; q – общее количество измеримых признаков объектов.
Для каждого объекта кластеризации (преподавателя) измерены все признаки множества P в некоторой количественной шкале. Каждому из элементов ai ∈ A поставлен в соответствие вектор xi = ( x1i , x2i , ..., xqi ) , где xij – количественное значение признака p j ∈ P для объекта ai ∈ A . Векторы значений признаков xi = ( x1i , x2i , ..., xqi ) удобно представить в виде так называемой
матрицы данных D размерности (n × q ) , каждая строка которой равна значению вектора xi . Требуется на основе исходных данных определить такое не61
Известия высших учебных заведений. Поволжский регион
четкое разбиение ℜ( A ) = { Ak | A k ⊆ A } множества A = A на заданное число
c нечетких кластеров A ( k ∈{2, ..., c}) , которое доставляет экстремум неk
которой целевой функции f (ℜ( A )) среди всех нечетких разбиений.
Предположим, что искомые нечеткие кластеры представляют собой нечеткие множества Ak , образующие нечеткое разбиение исходного множества
объектов кластеризации A = A , для которого
c
∑ μ A (ai ) = 1 (∀ai ∈ A) ,
где c – общее количество нечетких кластеров A k
считается
предварительно
(1)
k
k =1
заданным
( k ∈{2, ..., c}) ,
(c ∈ N , c > 1) ;
μ A
k
–
которое
функция
принадлежности объекта кластеризации ai нечеткому кластеру Ak .
Для каждого нечеткого кластера рассчитаем центры ν k по каждому из
признаков по формуле
n
∑ (μ A (ai ))m ⋅ xij
ν kj = i =1
k
n
∑ (μ A (ai ))
i =1
(∀k ∈ {2, ..., c}, ∀p j ∈ P ) ,
(2)
m
k
где m – некоторый параметр, называемый экспоненциальным весом и равный
некоторому действительному числу (m > 1) .
В качестве целевой функции будем рассматривать сумму квадратов
взвешенных отклонений координат объектов кластеризации от центров искомых нечетких кластеров:
f ( Ak , ν kj ) =
n
c
q
∑∑ (μ A (ai )) ∑ ( xij − ν kj )2 .
i =1 k =1
m
k
(3)
j =1
Таким образом, задача нечеткой кластеризации может быть сформулирована следующим образом: для заданных исходных данных D , количества нечетких кластеров c (c ∈ N , c > 1) , параметра m определить матрицу U значений функций принадлежности объектов кластеризации ai ∈ A нечетким кластерам A ( k ∈ {2, ..., c}) , которые доставляют минимум целевой функции (3).
k
Решим задачу нечеткой кластеризации с помощью алгоритма нечетких
с-средних (FCM, Fuzzy C-Means). Предварительно зададим количество искомых нечетких кластеров c (c ∈ N , c > 1) , максимальное количество итераций
алгоритма s ( s ∈ N ) , параметр сходимости алгоритма ε (ε ∈ R+ ) , экспоненциальный вес расчета целевой функции и центров кластеров m (как правило, m = 2 ), некоторое исходное нечеткое разбиение ℜ( A ) = { Ak | A k ⊆ A }
на с непустых нечетких кластеров, которые описываются совокупностью
62
№ 1, 2007
Технические науки. Информатика и вычислительная техника
функций принадлежности μ k (ai ) ( ∀k ∈ {2, ..., c}, ∀ai ∈ A ) . Возможный вид
функций принадлежности приведен на рисунке 1.
Рис. 1
Значение функции принадлежности для каждого объекта ai ∈ A рассчитывается исходя из правила формирования кластеров. Например, по результатам рейтинговой оценки преподавателей необходимо выделить следующие кластеры: преподаватели, у которых активностная составляющая
рейтинга превышает квалификационную; преподаватели, у которых квалификационная составляющая рейтинга превышает активностную и пр. На рисунке 2 приводится фрагмент программы в среде Mathcad, позволяющей рассчитать значение функции принадлежности.
Рис. 2
Для исходного нечеткого разбиения ℜ( A ) = { Ak | A k ⊆ A } по формуле
(2) рассчитаем центры нечетких кластеров ν kj (∀k ∈ {2, ..., c}, ∀p j ∈ P ) и
значение целевой функции f ( Ak , ν kj ) по формуле (3). Количество выполненных итераций положим равным единице. Сформируем новое нечеткое раз63
Известия высших учебных заведений. Поволжский регион
биение ℜ′( A ) = { A k | Ak ⊆ A } исходного множества объектов кластеризации
A на c непустых нечетких кластеров, рассчитаем центры кластеров и значение целевой функции. Повторим данную последовательность в цикле. Если
количество выполненных итераций превышает заданное число s или же модуль разности f ( A , ν k ) − f ′( A , ν k ) ≤ ε , т.е. не превышает значения параk
j
k
j
метра сходимости алгоритма ε , то в качестве искомого результата нечеткой
кластеризации принимаем нечеткое разбиение ℜ′( A ) = { A k | A k ⊆ A } и заканчиваем выполнение алгоритма.
Результатом работы данного алгоритма является нечеткое разбиение
множества преподавателей на кластеры (рис. 3; таблица 1).
Центр кластера
Объект кластеризации
Рис. 3
Таблица 1
1-й кластер:
Преподаватель
Иванова Мария Александровна
Петров Павел Иванович
Сидоров Илья Владимирович
Ромашов Андрей Николаевич
Степень принадлежности
0,84
0,77
0,95
0,87
2-й кластер:
Преподаватель
Кобрышева Галина Владиславовна
Голубева Елена Михайловна
Болгова Ирина Анатольевна
Кошкина Марина Александровна
Богрова Галина Викторовна
Нуждина Наталья Николаевна
Степень принадлежности
0,998
0,867
0,932
0,905
0,999
0,851
3-й кластер:
Преподаватель
Арсенова Лидия Ивановна
Вергеев Ринат Ильдусович
Золотова Татьяна Владимировна
Казарина Ирина Анатольевна
Меркулова Татьяна Александровна
64
Степень принадлежности
0,951
0,721
0,896
0,976
0,996
№ 1, 2007
Технические науки. Информатика и вычислительная техника
В пределах полученных групп возможна дальнейшая обработка данных: ранжирование преподавателей, вычисление средних значений и т.д.
Таким образом, алгоритм нечеткой кластеризации как инструмент
предварительного или разведочного анализа данных незаменим при поиске
закономерностей в больших наборах многомерных данных.
Список литературы
1. Н о в а к о в , И . А . Научно-методические основы и практика организации учебного процесса в вузе : учебное пособие / И. А. Новаков, Ю. В. Попов, В. Н. Подлеснов [и др.]. – Волгоград : Изд-во ВолгГТУ, 2003.
2. СТУ 151.1.50.хх-2005 Рейтинговая оценка деятельности преподавателей университета. – Пенза : Изд-во Пенз. гос. ун-та, 2005.
3. Л е о н е н к о в , А . В . Нечеткое моделирование в среде MATLAB и fuzzyTECH /
А. В. Леоненков. – СПб. : БХВ-Петербург, 2003.
65
Документ
Категория
Без категории
Просмотров
9
Размер файла
236 Кб
Теги
мониторинг, нечеткой, данных, преподавателей, деятельности, задачи, кластеризацию
1/--страниц
Пожаловаться на содержимое документа