close

Вход

Забыли?

вход по аккаунту

?

Прогнозирование состояния сервера на основе регрессионно-нечетких моделей.

код для вставкиСкачать
На правах рукописи
Козлов Александр Олегович
ПРОГНОЗИРОВАНИЕ СОСТОЯНИЯ СЕРВЕРА НА ОСНОВЕ
РЕГРЕССИОННО-НЕЧЕТКИХ МОДЕЛЕЙ
05.13.18 – Математическое моделирование, численные методы и комплексы программ
Автореферат
диссертации на соискание ученой степени
кандидата технических наук
Ульяновск – 2014
Работа выполнена на кафедре «Прикладная математика и информатика» в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Ульяновский государственный технический университет».
Научный руководитель:
доктор технических наук, профессор
Татьяна Васильевна Афанасьева
Официальные оппоненты: доктор технических наук, профессор, ФГБОУ
ВПО «Ростовский государственный университет
путей сообщения», профессор кафедры «Автоматика и телемеханика на железнодорожном
транспорте»
Ковалев Сергей Михайлович
кандидат технических наук, доцент кафедры телекоммуникационных технологий и сетей
ФГБОУ ВПО «Ульяновский государственный
университет»
Липатова Светлана Валерьевна
Ведущая организация:
Федеральное государственное образовательное
бюджетное учреждение высшего профессионального образования «Поволжский государственный университет телекоммуникаций и информатики»
Защита диссертации состоится 18 июня 2014 г. в 1430 часов на заседании диссертационного совета Д 212.278.02 при ФГБОУ ВПО «Ульяновский государственный университет», расположенном по адресу: г. Ульяновск, ул. Набережная р. Свияги, 106, корп. 1, ауд. 703.
С диссертацией можно ознакомиться в научной библиотеке Ульяновского государственного университета и на сайте ВУЗа http://ppo.ulsu.ru, с авторефератом – на сайте ВУЗа http://ppo.ulsu.ru и на сайте Высшей аттестационной комиссии при Министерстве образования и науки РФ – http://vak.ed.gov.ru.
Отзывы на автореферат в двух экземплярах, заверенные печатью организации,
просим направлять по адресу: 432017, г. Ульяновск, ул. Л. Толстого, д. 42,
УлГУ, Отдел послевузовского профессионального образования.
Автореферат разослан «___» _________ 20__ г.
Ученый секретарь
диссертационного совета Д 212.278.02
кандидат физико-математических наук, доцент
М.А. Волков
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы
В современных условиях интенсивного развития информационнокоммуникационных технологий задача обеспечения стабильного функционирования отдельного сервера, как элемента ИТ-структуры является актуальной.
Особую важность эта задача приобретает для предприятий малого и среднего
бизнеса, обладающих ограниченными ресурсами и находящимися на стадии
развития.
В случае возникновения изменения нагрузки на отдельный сервер, приводящего к снижению или потере его работоспособности, в таких организациях требуется от нескольких часов до нескольких дней для восстановления его
стабильного функционирования. Изменение нагрузки может возникнуть и в
случае воздействия на сервер внешних трудно формализуемых факторов, а поэтому формулируемых экспертно лицами, принимающими решение, например, таких как увеличение объема решаемых задач, рост числа клиентов, изменение масштаба предприятия. Все это может привести к потере ценной информации, непредвиденным и значительным материальным затратам в условиях активного перехода к интернет-экономике. Чтобы обеспечить раннее
предупреждение о возможных в будущем нарушениях функционирования отдельного сервера и учесть эти риски при планировании развития ИТ-ресурсов
предприятия целесообразно применять методы анализа состояния сервера,
ориентированные как на текущие, так и на прогнозные оценки тенденций изменения физических (числовых) параметров сервера с учетом внешних экспертных оценок тенденций развития предприятия.
Для решения проблемы обеспечения стабильного функционирования сервера применяются системы мониторинга и контроля работоспособности серверов по отдельным параметрам (например, «PWS ИТ-мониторинг»1, «NMS
Aurora»2), однако, функции таких систем не предусматривают решение задачи
прогнозирования, а также не позволяют идентифицировать опасные тенденции изменения состояния сервера как целостного объекта.
Достаточно часто используется подход к прогнозированию состояния
сервера путем визуального анализа графиков временных рядов числовых параметров, однако при этом результаты прогноза в значительной степени зависят от квалификации и субъективного мнения администратора вычислительной сети.
Поэтому в ряде работ обоснована необходимость прогнозирования числовых параметров сервера, в частности в работе Терейковской (2011) предлагается применять статистические модели временных рядов для прогнозирова-
1
PWS ИТ-Мониторинг // PingWin Software [Электронный ресурс]. 2013.
http://www.pingwinsoft.ru/pages/resheniya/resheniya/pwsitmonitoring
2
Система управления сетью NMS Aurora // NMS [Электронный ресурс]. 2013.
http://www.softm.tv/index.php/product-and-service-ru/nms-ru
3
ния числовых параметров интернет-серверов 3 . В работе Веркотрен и др.
(2007)4 для прогнозирования нагрузки на веб-сервер предлагается иерархическая модель временного ряда, включающая в себя гармоническую и авторегрессионную составляющие. В работе Ярушкиной и др. (2007)5 предложена
математическая имитационная модель числовых параметров терминал-сервера
как элемента вычислительной сети на основе временных рядов их нечетких
тенденций, позволяющая прогнозировать трафик сервера. Также разрабатываются подходы к прогнозированию отдельных характеристик сервера для целей управления его ресурсами6,7.
Можно констатировать, что существующие модели прогнозирования состояния сервера основаны на моделировании его внутренних числовых параметров по временным рядам и не учитывают внешние экспертные оценки тенденций развития предприятия.
Возникает научно-техническая проблема разработки метода прогнозирования работоспособности сервера путем интеграции статистических моделей
прогнозирования его числовых параметров и нечетких моделей экспертного
оценивания для обнаружения возможных проблем на ранних стадиях и получения о них информации, необходимой для принятия обоснованных и оперативных управленческих решений.
Объектом исследования является сложный технический объект – сервер
предприятия.
Предметом исследования являются модели прогнозирования состояния
сервера.
Цель работы – повышение эффективности прогнозирования состояния
сервера на основе разработки метода, интегрирующего регрессионное и нечеткое моделирование его параметров.
Задачи исследования
Для достижения указанной цели в работе необходимо решить следующие
задачи:
1. Выбор эффективного подхода к моделированию числовых временных
рядов, обладающих различным поведением.
2. Разработка обобщенной модели прогнозирования состояния сервера,
включающей числовые временные ряды и нечеткую экспертную оценку.
3. Разработка алгоритма получения комплексной оценки состояния сервера.
3
Терейковская Л.А. Перспективы использования методов теории вейвлет-преобразований для
прогнозирования технического состояния internet-серверов // Управление развитием сложных систем. —
Киев, 2010. — 4. — C. 100-103.
4
Vercauteren T., Aggarwal P., Wang X., Li T.H. Hierarchical Forecasting of Web Server Workload Using Sequential
Monte Carlo Training // IEEE Transactions on Signal Processing. — 2007. — Т. 55 вып. 4. — C. 1286-1297.
5
Ярушкина Н.Г., Юнусов Т.Р., Афанасьева Т.В. Моделирование трафика терминал-сервера на основе анализа
нечетких тенденций временных рядов // Программные продукты и cистемы. - 2007. - №4. - С. 15-19.
6
Паяин С.В. Методика динамического управления загрузкой канала связи в корпоративных сетях с гарантированной доставкой данных: Дис. канд. техн. наук. – М., 2009. – 112 с.
7
Басараб М. А., Колесников А. В., Иванов И. П. Анализ сетевого трафика корпоративной сети университета
методами нелинейной динамики // Наука и образование. — М., 2013. — 8. — C. 341-352.
4
4. Разработка метода регрессионно-нечеткого моделирования для прогнозирования состояния сервера, заданного набором гетерогенных данных.
5. Создание специализированной программной системы для моделирования и прогнозирования состояния сервера.
Научная новизна работы заключается в создании новых обобщенной регрессионно-нечеткой модели и метода регрессионно-нечеткого моделирования, позволяющих прогнозировать состояния сервера по временным рядам его
числовых параметров и экспертной прогнозной оценкой его загрузки. Предложены новые алгоритмы, включая алгоритм вычисления комплексной нечеткой оценки состояния сервера. Разработан программный комплекс для прогнозирования состояния сервера.
Основные положения, выносимые на защиту
1. Обобщенная модель состояния сервера, состоящая из взаимосвязанных
моделей: комплексной динамической регрессионной модели временных рядов
внутренних числовых параметров сервера; модели нечеткой шкалы для получения нечетких оценок уровня и тенденций числовых параметров сервера;
двухуровневой нечеткой модели прогноза состояния сервера, учитывающей
внешнюю экспертную оценку.
2. Метод регрессионно-нечеткого моделирования для прогнозирования состояния сервера, отличающийся интеграцией моделей различных типов, согласованных по времени и значению, обеспечивающий снижение временных и
экономических затрат за счет включения в модель внешней экспертной оценки
и модели нечеткой тенденции.
3. Вычислительный алгоритм нахождения нечеткой оценки числового параметра сервера в виде нечеткой оценки общей тенденции его развития.
4. Комплекс алгоритмов и программ регрессионно-нечеткого моделирования, позволяющий прогнозировать состояние сервера по временным рядам
числовых параметров и экспертным оценкам.
Общетеоретическая значимость и практическая ценность
Теоретической значимостью обладает предложенный метод интеграции
гетерогенных данных при прогнозировании состояния сложной технической
системы, и открывает новые практические возможности повышения качества
прогнозирования состояния таких систем.
Практическая ценность результатов работы заключается в том, что разработанные алгоритмы и программы могут быть использованы для исследования
состояния ИТ-инфраструктуры малых и средних предприятий.
Проведенное диссертационное исследование было в значительной мере
мотивировано и поддержано выполнением НИР для предприятий и организаций:
1. «Проектирование подсистемы раннего предупреждения о нарушении
условий устойчивого функционирования серверного узла» для ООО «Фирма
ВИА».
2. Заявка на грант РФФИ №14-07-0247 «Методология моделирования и
прогнозирования локальных тенденций временных рядов в задачах анализа
5
больших данных».
3. Анализ состояния и автоматизация прогнозирования серверов в ЗАО
Банк «Венец» и ООО «Симбирск-Ойл».
Достоверность результатов, представленных в диссертации, обеспечивается корректностью применения математического аппарата статистического
и нечеткого моделирования, и подтверждается результатами экспериментов
на реальном оборудовании.
Апробация работы
Основные результаты работы докладывались на 5-й Международной
научно-практической конференции "Интегрированные модели и мягкие вычисления" (Коломна, 2009); Всероссийских научно-технических конференциях
аспирантов, студентов и молодых ученых "Информатика и вычислительная
техника" (Ульяновск, 2010, 2011, 2012); Всероссийской научной конференции
«Современные проблемы математического моделирования, супервычислений
и информационных технологий» (Таганрог, 2012); 7-й Всероссийской научной
конференции «Математическое моделирование развивающейся экономики и
экологии» (Киров, 2012); Российской школе-семинаре аспирантов, студентов и
молодых ученых «Информатика, моделирование, автоматизация проектирования» (Ульяновск, 2012); XIII Международная конференция "Информатика:
проблемы, методология, технологии" (Воронеж, 2013); на ежегодных научнотехнических конференциях профессорско-преподавательского состава УлГТУ
(2010-2012); XVII Российская научно-практическая конференция «Инжиниринг предприятий и управление знаниями» (Москва, 2014).
Публикации
По теме диссертации опубликовано 13 печатных работ, из которых 3 – в
изданиях, входящих в перечень ВАК.
Личный вклад автора
Постановка задачи осуществлена совместно с научным руководителем.
Содержание диссертации и основные положения, выносимые на защиту, отражают персональный вклад автора в опубликованные работы. Подготовка к
публикации полученных результатов проводилась совместно с соавторами,
причем вклад диссертанта был определяющим. Все представленные в диссертации результаты получены лично автором.
Структура и объем работы
Диссертационная работа состоит из введения, четырех глав, заключения,
библиографического списка литературы, включающего 94 наименования источников отечественных, зарубежных авторов и электронных ресурсов, списка
сокращений и 1 приложения. Общий объем диссертации составляет 135 страниц.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении рассмотрена актуальность темы диссертационной работы,
определена ее цель и задачи, сформулированы положения, выносимые на за6
щиту, их научная новизна и практическая ценность, представлены сведения об
использовании, реализации и апробации результатов работы, структуре диссертации.
В первой главе выполнен обзор систем контроля параметров сервера, а
также математических моделей, методов и программного обеспечения, применяемых для обработки ВР.
Сервер представляет собой сложный объект, характеризующийся множеством показателей, постоянно изменяющихся во времени, значения которых
образуют временные ряды (ВР), обладающие стационарным и нестационарным поведением, имеющими выраженные трендовые и периодические компоненты.
Для анализа ВР применяются подходы на основе статистических моделей
прогнозирования числовых параметров, (Андерсон, Бокс-Дженкинс, ХольтУинтерс, Канторович, Лукашин, Носко). Достоинство указанных моделей состоит в ориентации на определенные классы динамических процессов. Этой
проблеме применительно к прогнозированию числовых параметров сервера
посвящены работы авторов Терейковская, Веркотрен.
Однако не учитывается проблема, что временные ряды числовых параметров сервера могут иметь различное поведение, это затрудняет подбор подходящей модели. Не в полной мере проводится идентификация и диагностическая проверка различных регулярностей, лежащих в основе структуры ВР, что
в итоге приводит к снижению точности математического описания и прогнозирования динамики ВР.
Другая проблема может возникнуть на этапе оценивания параметров модели методом наименьших квадратов (МНК). Моделирование поведения временных рядов на классических схемах МНК не всегда осуществимо с достаточной точностью из-за нарушения условий их применения, таких как, например, высокая степень автокорреляционной зависимости остатков ε, ненормальность их распределения из-за наличия систематического смещения и
непостоянной дисперсии процесса. Для преодоления указанных ограничений
Валеевым8 был предложен подход динамического регрессионного моделирования (ДРМ). Подход ДРМ позволяет строить адаптивные модели временных
рядов9, в том числе при прогнозировании трафика сервера, точность которых в
значительно превышает стандартные методики на основе моделей АРПСС.
Другой класс моделей ориентированный на применение экспертных оценок – класс нечетких временных рядов (Song-Chissom, Дегтярев, Ярушкина,
Афанасьева) – недостаточно эффективен в плане точности для стационарных
временных рядов. Однако, нечеткие модели, основанные на нечеткой импликации, реализованной системой нечетких правил «Если-То», имеют большой
потенциал для прогнозирования состояния сервера по нечетким оценкам. В
8
Валеев С. Г. Регрессионное моделирование при обработке наблюдений. — М. : Наука, 1991. — 272 c. —
(второе издание, дополненное и переработанное: Валеев С. Г. Регрессионное моделирование при обработке
данных. – Казань: ФЭН, 2001. – 296 с.).
9
Валеев С. Г., Кузин С. П., Татевян С. К., Фасхутдинова В. А. Статистическое моделирование временных
рядов изменений координат // Геодезия и картография. — 2010. — 10. — C. 9-14.
7
связи с этим в работе ставится и решается задача создания метода, интегрирующего достоинства статистических и нечетких моделей для прогнозирования
состояния сервера по числовым параметрам и нечетким экспертным оценкам.
Во второй главе описывается обобщенная модель состояния сервера и
разработанный метод регрессионно-нечеткого моделирования (РНМ) для прогнозирования поведения сервера предприятия.
В работе предложена интеграция статистических и нечетких моделей для
прогнозирования состояния сервера по числовым параметрам ( ) и нечетким экспертным оценкам. В качестве числовых параметров сервера использованы временные ряды максимальных суточных значений числовых параметров сервера: «Загрузка центрального процессора», «Загрузка оперативной памяти», «Загрузка сети». В качестве нечеткой внешней экспертной оценки выбран прогноз тенденции развития предприятия.
Модель состояния сервера, интегрирующую числовые параметры и экспертные оценки, рассмотрим в виде
̃
(1)
( ̃ ̃)
где – некоторый метод, генерирующий комплексную прогнозную оценку состояния сервера; – вектор числовых параметров, характеризующих
прогнозное техническое состояние сервера; ̃
( ̃ ̃ ) где ̃ – вектор
внутренних экспертных оценок числовых параметров сервера , например,
«Недостаток загрузки», «Превышение загрузки», «Норма»; ̃ – вектор экспертных оценок значений параметров , например, «Очень низкий», «Низкий», «Ниже среднего», «Среднее», «Выше среднего», «Высокий», «Очень
высокий»; ̃ – вектор экспертных оценок тенденций изменения параметров
(«Рост», «Падение», «Стабильность»); – некоторый метод определения
внутренних экспертных оценок числовых параметров сервера ; ̃ – экспертная оценка, характеризующая внешние факторы изменения предприятия и выражаемая в виде набора нечетких термов тенденций «Уменьшение нагрузки»,
«Стабильность», «Увеличение нагрузки»; ̃ – прогнозное состояние сервера,
задаваемое нечетким термом из множества значений: «Недостаток загрузки»,
«Норма», «Превышение загрузки».
( )
Модель числовых параметров
представим в виде
зависимостей, отражающих основные особенности их поведения:
( )
( )
( )
( )
( )
(2)
где – время, ( ) – неслучайная функция полиномиального тренда,
имеющая вид
( )
∑
(3)
( ) – неслучайная периодическая функция
( )
∑
(
8
)
(4)
( ) - случайная с элементами регулярности функция, которая может
включать в себя процессы АРСС(p,q)
( )
(
∑
)
( )
(
∑
)
(5)
а также процесс GARCH(p,q)
( )
(
∑
)
(
∑
)
(6)
( ) – нерегулярная случайная компонента.
Тогда модель прогноза каждого числового параметра сервера определим
в виде
)
(
)
(
)
(
)
(7)
̂(
,
где – горизонт прогноза.
Модель экспертной оценки числового параметра сервера представим в
̃,
виде функций принадлежности ̃
, ̃
{ ( ) ̃ ( ( ))} , ( )
[
],
,
[
] , терм-множества ̃ {«Очень низкий»,
«Низкий», «Ниже среднего», «Среднее», «Выше среднего», «Высокий»,
«Очень высокий»}.
( )
̃
( ( ))
( )
̃
( ( ))
[
( )
{
( )
( )
[
]
]
( )
[
( )
[
(8)
]
{
( )
̃
( ( ))
{
]
где
,
(
) ,
.
̃
Модель экспертной оценки прогнозной нечеткой тенденции ̃
изменения числового параметра на временном отрезке, состоящем из исходного и прогнозного ВР, определим в виде алгоритмически заданных операций
ACL-шкалы.
(9)
̃
( ̃ ( ) ̃ ( ) ̃ ( ))
где
̃.
(10)
̃( )
̃
( ( )) ( )
) ̃ ( )), ̃ (
) ̃ ̃( ) ̃
(11)
̃( )
(̃ (
) ̃ ( )), ̃ (
) ̃ ̃( ) ̃
(12)
̃( )
(̃ (
Тогда обобщенную модель прогноза отдельного параметра сервера, выразим в виде нечеткой модели логического вывода:
̃
(13)
(̃ ̃ )
9
̃ – прогнозная лингвистическая оценка состояния отдельного
где ̃
параметра сервера: «Недостаток загрузки», «Норма», «Превышение загрузки»;
– набор правил для определения прогноза состояния отдельного параметра
̃ – прогнозная лингвистическая оценка общей тенденции
сервера; ̃
нечеткого временного ряда отдельного параметра сервера; ̃ ̃ это нечеткая оценка последнего спрогнозированного значения отдельного параметра
сервера;
̃
̃
̃
̃( )
̃
̃
̃
̃
̃( )
̃
(14)
̃
̃
̃
̃( )
̃
{
Результаты, полученные по (13) служат входными данными для определения нечеткой оценки прогнозного состояния сервера, которую определим в
виде
̃
(15)
( ̃ ̃)
̃
где – итоговая прогнозная лингвистическая оценка состояния сервера:
«Недостаток загрузки», «Норма», «Превышение загрузки»; ̃ – экспертная
оценка, характеризующая внешние факторы изменения предприятия и выражаемая в виде набора нечетких термов тенденций «Уменьшение нагрузки»,
«Стабильность», «Увеличение нагрузки»; ̃ – прогнозная лингвистическая
оценка состояния отдельных характеристик сервера, получаемая по (13); –
набор правил определения прогнозной оценки стояния сервера:
̃
̃
̃
̃
{
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
(16)
̃
где ̃
– лингвистический терм прогнозной оценки состояния
отдельного параметра сервера, ̃ – лингвистический терм прогнозной оценки
тенденции развития предприятия.
Обобщенная нечеткая модель состояния сервера интегрирует внутренние
нечеткие оценки состояния отдельных числовых параметров сервера и внешнюю экспертную оценку тенденции развития предприятия, задаваемую ЛПР.
Для построения модели (15) разработан метод регрессионно-нечеткого
моделирования, решать задачу прогнозирования параметров сервера в условиях, когда сервер описывается множеством числовых характеристик и, в то же
время, существует экспертная оценка развития предприятия.
Идея метода заключается в построении модели состояния сервера, которое интегрирует математические модели временных рядов и нечеткие модели
экспертного оценивания.
Для прогнозирования числовых параметров сервера, представляющих собой временные ряды, в результате анализа был выбран и адаптирован алгоритм ДРМ-моделирования.
10
Применительно к задаче прогнозирования числовых параметров
сервера, в соответствии с особенностями ВР, модель ( ) рассматривается в виде:
Начало
СЕРВЕР
набор технических
параметров сервера
ДРМ-моделирование
одновременных временных
рядов значений
характеристик сервера
Получение прогнозных
значений характеристик
сервера
( )
( )
Построение ACL-шкалы
временных рядов значений
характеристик сервера
( )
( )
( )
( )
( )
( (
( )
( )
Фаззификация прогнозных
значений характеристик
сервера
))
( (
( )
))
(17)
( )
( ) – составляющая модели в
где
виде
алгебраического
тренда,
ЭКСПЕРТ
( ) – гармоническая компооценка динамики
Определение общей
предприятия
( )) – составлянента,
(
тенденции характеристик
сервера
( )
( )) –
ющая АРСС,
(
Нечеткий прогноз
(G)ARCH-компонента, ( ) , ( ) ,
состояния сервера
( ), ( ) - остатки от моделироВывод прогноза
вания на соответствующих ступесостояния сервера
нях.
Оценивание параметров модеКонец
лей (17) производится по схеме
МНК. Для оценки параметров лиРисунок 1. Блок-схема метода РНМ
нейных моделей используется вычислительная схема Гаусса-Жордана, для модели АРСС используется алгоритм Марквардта для нелинейного МНК. Оценивание параметров (G)ARCHмоделей производится методом максимального правдоподобия.
Для оценки точности модели используется критерий среднеквадратичного отклонения и коэффициент детерминации
. Оценивание адекватности
модели производится по F-критерию Фишера. Если
, то принимается гипотеза об адекватности модели.
С целью проверки точности РНМ-метода был сгенерирован модельный
временной ряд:
Определение тенденций
характеристик сервера
( )
(
)
( )
( )
( )
(
)
( )
(
) – процесс АРСС(1,1).
В результате применения РНМ-метода была построена приближенная
модель ВР:
где
( )
(
( )
(
)
( )
(
).
Оценки модели
, СКО
зывают ее адекватность и высокую точность.
)
( )
( )
где
11
,
пока-
Для реализации возможности интеграции числовых прогнозов и нечетких
экспертных оценок в работе предложена вычислительная процедура, позволяющая на основе адаптации нечеткой ACL-шкалы10 по временным рядам каждого из числовых параметров получать их нечеткие оценки. Модель шкалы
представим в виде:
(18)
где
– универсальное
{ ̃ ̃ ̃ } – множество объектов шкалы:
множество объектов – область допустимых значений числового параметра
сервера, ̃ - терм-множество абсолютных лингвистических оценок значения
временного ряда числового параметра сервера: ̃
,
̃ - множество значений нечетких тенденций изменения состояния сервера
̃
, ̃ – множество значений интенсивностей изменения состояния сервера ̃
– множество операций, определенных на множестве
:
(описаны ниже)
– множество параметров настройки шкалы.
При адаптации шкалы к решению задачи прогнозирования состояния сервера
были
определены
ее
параметры.
Класс
шкалы
. Максимальное и минимальное
значения
( ) и
( ) . Тип функций принадлежности
Определена мощность шкалы
̃,
Функции принадлежности ̃
, ̃
{ ( ) ̃ ( ( ))} , ( )
[
],
,
[
] вычисляются согласно (8).
Для получения нечетких оценок значений ВР параметров сервера разработана процедура фаззификации – определения нечеткой оценки ̃ по значе̃
нию оцениваемого объекта . Для этого используется операция
ACL-шкалы.
(19)
̃( )
̃ ( ) ̃.
( ( )) ( )
Алгоритм процедуры фаззификации представлен ниже.
̃ определяем для оцениваемого объек1. С помощью операции
та
множество нечетких оценок ̃
{ ( ) ̃ ( ( ))} , ( )
̃,
[
].
,̃
2. Среди полученного множества нечетких оценок ̃ вычисляем номер
оценки с максимальным значением функции принадлежности:
[
]
[ ̃ ( ( ))] при изменении
3. Тогда, ̃ ( )
.
( ( )) ̃
После применения алгоритма фаззификации ко всем значениям ВР числовых параметров сервера и их прогнозным значениям ̂ получены нечет10
Афанасьева Т.В. Нечеткое моделирование временных рядов и анализ нечетких тенденций / Т.В. Афанасьева,
Н.Г. Ярушкина – Ульяновск: УлГТУ, 2009. – 299 с.
12
кие временные ряды (НВР) каждого из параметров сервера. Для получения
комплексной интегральной оценки состояния сервера с учетом внешней экспертной оценки, сначала необходимо получить нечеткую оценку общей тенденции динамики функционирования отдельного параметра сервера.
Для этого предлагается пошаговая процедура оценивания нечеткой тенденции. На первом шаге определим элементарные тенденции на НВР на основе операций
,
и
, введенные построенной ACL-шкалой.
Нечеткая элементарная тенденция (НЭТ) нечеткого временного ряда – это
нечеткая тенденция ( ) 〈 ̃ ( ) ̃ ( ) ̃ ( )〉, выражающая качественный характер изменения на участке нечеткого временного ряда между двумя сосед) , ̃ ( ) со степенью принадлежности
ними нечеткими метками ̃ (
) ̃ ( )).
̃( )
(̃ (
) ̃ ( )), ̃ (
) ̃ ̃( ) ̃
(20)
̃( )
(̃ (
Таблица 1 – Реализация операции
Термы
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
̃
стабильность
рост
рост
рост
рост
Рост
рост
падение стабильность
рост
рост
рост
Рост
рост
падение
падение стабильность
рост
рост
Рост
рост
падение
падение
падение стабильность
рост
Рост
рост
падение
падение
падение
падение стабильность
Рост
рост
падение
падение
падение
падение
падение стабильность
рост
падение
падение
падение
падение
падение
Падение стабильность
) ̃ ( )), ̃ (
̃( )
(̃ (
Таблица 2 – Реализация операции
Термы
̃
̃
нулевой
̃
очень
малый
̃
̃
очень
малый
)
̃ ̃( )
̃
больше
среднего
̃
(21)
̃
̃
очень большой
̃
̃
малый
средний
нулевой
очень
малый
малый
средний
больше
среднего
большой
малый
очень
малый
нулевой
очень
малый
малый
средний
больше
среднего
̃
средний
малый
очень
малый
нулевой
очень
малый
малый
средний
̃
больше
среднего
средний
малый
очень
малый
нулевой
очень
малый
малый
̃
большой
больше
среднего
средний
малый
очень
малый
нулевой
очень
малый
̃
очень большой
большой
больше
среднего
средний
малый
очень
малый
нулевой
большой
На следующем шаге необходимо на основе НЭТ ВР вычислить параметры общей тенденции, наблюдаемого ВР. Для этих целей введем следующие
формулы. Для дефаззификации типа нечеткой тенденции:
̃
̃
(̃ ) {
(22)
̃
Для дефаззификации интенсивности нечеткой тенденции – по методу
центра тяжести, используемому в моделях нечетких систем (
,
определяются через минимальные и максимальные приращения значений временного ряда числовых параметров сервера):
13
(̃ )
̃( )
∫
(23)
)
̃(
∫
В случае дискретного универсального множества дефаззификация нечеткого множества по методу центра тяжести осуществляется по формуле численного интегрирования по методу прямоугольников:
∑
̃( )
(24)
(̃ )
∑
̃( )
Для идентификации комплексной оценки общей нечеткой тенденции
числового параметра сервера введем операцию
.
(25)
̃
( ̃ ( ) ̃ ( ) ̃ ( ))
Алгоритм 1 – Вычисление значения общей нечеткой тенденции ̃ .
1. Получение временного ряда нечетких элементарных тенденций ( )
〈 ̃( ) ̃( ) ̃( )〉,
и дефаззификация интенсивностей нечетких
элементарных
тенденций
согласно
формуле
(23)
( )
( ̃( )).
2. Вычисление суммарных интенсивностей однотипных нечетких элементарных тенденций по всему временному ряду ( ) 〈 ̃( ) ̃( ) ̃( )〉
(
):
( ))
( )
Рост"
( )
(
( )
( ) "Падение"
(
( ))
) или (
3. Если (
), то тип основной нечеткой тенденции ̃
и после дефаззификации
, динамика временного ряда стационарна, иначе шаг 4.
4. На основе сравнительного анализа значений
и
определим
тип основной нечеткой тенденции. Если
, то
̃
и после дефаззификации
, иначе тип основной нечеткой тенденции ̃
и после дефаззификации
.
Динамика временного ряда нестационарна.
5. Определение интенсивности основной тенденции ̃ :
|
|.
Решение модели прогноза отдельного параметра сервера (13) и модели
состояния сервера (15) производится стандартным методом нечеткого вывода
Мамдани.
Получаемые результаты представлены в лингвистической форме, основаны на математических моделях временных рядов и нечетких тенденций, а поэтому более достоверны по сравнению с экспертными оценками администраторов ИТ-ресурсов. С другой стороны, по сравнению с методиками прогнозирования на основе математических методов анализа числовых временных ря14
дов предлагаемый подход имеет преимущество, так как в нем прогноз уточняется за счет внешних экспертных оценок.
В третьей главе описан разработанный комплекс программ регрессионно-нечеткого анализа состояния сервера (НЕРА), предназначенный для разработки комплексных моделей ВР характеристик сложного объекта с последующим использованием
Сбор значений
Экспертное
их для прогноза состоВвод экспертной оценки
характеристик
формирование базы
развития предприятия
сервера
правил нечеткого вывода
яния объекта.
В программе исБаза правил
База экспертных
База числовых
нечеткого
оценок
пользуются
методы
характеристик
вывода
предприятия
построения оптимальных комплексных диПрогнозирование числовых
намических моделей
характеристик сервера
временных рядов хаФаззификация прогнозных
рактеристик сервера и
значений и определение
прогнозирования
их
тенденций
будущих состояний.
Также, в проГенерация итогового
заключения
грамме реализованы
алгоритмы нечеткой
Вывод прогноза
логики, с помощью
состояния сервера
которого проводится
Рисунок 2. Схема модулей программного комплекса фаззификация полуНЕРА
ченных
прогнозных
значений и построение
нечеткой модели, позволяющей получить заключение о состоянии сервера с
учетом мнения эксперта.
В четвертой главе приводятся результаты применения и анализ эффективности метода РНМ для прогнозирования состояния терминального сервера
предприятия.
В качестве исследуемого объекта был рассмотрен сервер терминалов ЗАО
Банк «Венец». С помощью модуля сбора значений характеристик сервера были получены временные ряды максимальных суточных значений следующих
характеристик: «Загрузка ЦП», «Загрузка ОП» и «Трафик» за период с 17
июня 2013 года по 14 сентября 2013 года.
Для каждого параметра были построены: комплексная модель ВР и получены прогнозные оценки, вычислены значения СКО
, характеризующие
точность прогнозирования.
В качестве примера приведем полученную модель ВР «Загрузка сетевого
интерфейса»
( ), включающую трендовую и гармонические составляющие, а также компоненты АРСС(2,0) и ARCH(1):
( )
(26)
15
(
)
(
(
(
)
)
)
(
(
(
где ( ) – вычисляется по формуле
)
)
( )
)
( )
(27)
– остатки модели после вычитания алгебраического тренда;
–
остатки модели после вычитания гармонического тренда;
– остатки модели после вычитания компоненты АРСС(2,0); ( ) – остатки модели.
( )
(
)
Загрузка сети, %
100
80
60
40
Данные
20
Прогноз
0
( )
Рисунок 3. График наблюдений и прогноза для
(внешнее СКО = 3,71)
Результаты диагностики остатков последнего шага: остатки распределены
нормально; авторегрессия отсутствует; дисперсия остатков гомоскедастична.
СКО прогнозирования
, коэффициент детерминации
, F-критерий Фишера
. Т.к. для уровня значимости
, модель является адекватной.
По параметрам
( ),
( ) также были построены соответствующие
модели и проведено прогнозирование. Результат сравнения точности прогнозирования с другими моделями по внешним ошибкам показан в таблице 3.
Таблица 3 – Значение ошибки прогнозирования
для различных моделей
Предложенный подход
ARIMA (Statistica)
Нечеткие ВР (Q. Song)
(
(
(
)
)
)
,%
3,71
7,26
16,35
,%
5,26
6,83
18,37
,%
4,14
7,03
14,78
Очевидно, что применение ДРМ-моделей дает существенное увеличение
точности по сравнению с другими исследованными моделями.
С целью реализации нечеткого оценивания числовых значений прогнозов
были сгенерированы ACL-шкалы по временным рядам каждого параметра
сервера. Использовалась треугольная функция принадлежности.
Таблица 4 – Параметры ACL-шкалы для переменной
Нечеткое множество
Очень низкий
Низкий
минимум
-16,5
0
16
Параметры ФП
Среднее
максимум
0
16,5
16,5
33
Нечеткое множество
Ниже среднего
Средний
Выше среднего
Высокий
Очень высокий
Параметры ФП
минимум
Среднее
максимум
16,5
33
50
33
50
66,5
50
66,5
83
66,5
83
100
83
100
116,5
По полученным ACL-шкалам проведена фаззификация прогнозных значений характеристик сервера. В таблице 5 представлены результаты процеду( ) – загрузка сетевого интерфейса сервера.
ры фаззификации параметра
( )
Таблица 5 – Результаты оценивания по нечеткой ACL-шкале для
№
Значение
82
83
84
85
86
87
88
89
90
77,3
54,71
76,438
68,159
64,029
73,36
67,396
65,366
71,681
Степень принадлежности
0,760
0,791
0,892
0,844
0,786
0,638
0,728
0,582
0,618
Нечеткое значение
Выше среднего
Низкий
Выше среднего
Средний
Средний
Выше среднего
Средний
Средний
Выше среднего
Нечеткая тенденция
Рост
Падение
Рост
Падение
Стабильность
Рост
Падение
Стабильность
Рост
Интенсивность
Очень малый
Средний
Средний
Очень малый
Нулевой
Малый
Очень малый
Нулевой
Очень малый
После фаззификации прогнозных значений переменных определены нечеткие элементарные и общие тенденции согласно (25) и предложенному алгоритму 1.
Таблица 6 – Результаты определения тенденций параметров сервера
№
82
83
84
85
86
87
88
89
90
ОТ
Рост
Падение
Рост
Падение
Стабильность
Рост
Падение
Стабильность
Рост
Рост
Стабильность
Стабильность
Стабильность
Падение
Стабильность
Стабильность
Рост
Падение
Стабильность
Рост
Рост
Падение
Рост
Стабильность
Падение
Рост
Падение
Стабильность
Рост
Стабильность
Для всех параметров сервера по модели (13) построены правила нечеткого вывода. Согласно проведенному модулированию были идентифицированы
следующие тенденции: ̃
,̃
,̃
.
Таблица 7 – Пример правил нечеткого вывода характеристик сервера
Нечеткое значение
̃(
)
Нечеткая тенденция
̃
Прогноз состояния характеристики сервера
̃

Входная переменная
Входная переменная
Выходная переменная
Низкий
Низкий
Средний
…
Высокий
Падение
Рост
Стабильность
…
Рост
Недостаток загрузки
Норма
Норма
…
Превышение загрузки
17
Затем произведено построение итогового прогноза состояния сервера по
модели (15) в виде совокупности правил. В данной модели включено мнение
эксперта, что позволяет учитывать внешние факторы, не связанные с техническими параметрами сервера.
Таблица 8 – Пример правил нечеткого вывода заключения о состоянии сервера
Загрузка ЦП
̃

Загрузка ОП
̃

Загрузка
сети
̃

Экспертная оценка
изменения нагрузки
̃
Состояние
сервера
̃
Выходная переменная
Входная переменная
Входная переменная
Входная переменная
Входная переменная
Норма
…
Превышение
загрузки
…
Недостаток загрузки
Норма
…
Превышение
загрузки
…
Превышение
загрузки
Норма
…
Стабильность
…
Норма
Увеличение загрузки
…
Недостаток
загрузки
…
Снижение загрузки
Норма
…
Превышение
загрузки
…
Недостаток загрузки
Таблица 9 – Заключение о прогнозе состояния сервера
Лингвистическая
оценка
Степень принадлежности
Загрузка ЦП
Загрузка ОП
Загрузка
сети
Превышение
загрузки
Превышение
загрузки
Норма
0,925
0,729
0,618
Экспертная
оценка
нагрузки
Увеличение
загрузки
Превышение
загрузки
1
0,618
Состояние
сервера
Применение метода регрессионно-нечеткого моделирования для прогнозирования состояния сервера позволило получить прогноз состояния сервера
предприятия – «Превышение загрузки», что послужило причиной принятия
управленческого решения о закупке дополнительного сервера терминалов и
разделением загрузки между существующим и новым серверами.
Оценка эффективности предложенного подхода к прогнозированию состояния сервера произведена по критериям точности распознавания ситуаций,
которые могут привести к потере работоспособности сервера, информационному критерию по формуле Хартли, критериям достоверности и объективности, временному и экономическому критериям. Результат сравнения предложенного метода с традиционным подходом визуального контроля состояния
сервера представлен в таблице 10.
Таблица 10 – Оценка эффективности метода
Точность распознавания
Информационный критерий
Достоверность
Объективность
Время
увеличение с 7 до 18 ситуаций
увеличение с 8,42 до 25,90
увеличение с 0,83 до 1
увеличение с 0,17 до 0,25
сокращение с 8 до 5 дней
Для примера был рассчитан экономический эффект для организации с годовым доходом 379 864 тыс. руб., который составил при использовании предложенного подхода 8018 тыс. руб.
18
В заключении приведены основные результаты и выводы по работе. В
диссертации разработаны модель состояния сервера и метод регрессионнонечеткого моделирования состояния сервера, алгоритмы и программное обеспечение для решения поставленной задачи раннего обнаружения ситуаций потери работоспособности сервера. Применение данного ПО позволило провести испытания разработанного метода в условиях реального сервера и показать эффективность его применения.
Основными результатами работы являются следующие:
1. Проведен анализ существующих подходов к решению прикладной
проблемы. Сделан вывод о целесообразности интеграции математических моделей ВР и нечетких моделей на основе согласования по времени и по значениям.
2. Предложен способ интеграции регрессионного и нечеткого моделирования и на этой основе разработана обобщенная регрессионно-нечеткая модель, отличающаяся возможностью прогнозирования состояния сервера по
временным рядам его числовых параметров и экспертной прогнозной оценке
его загрузки.
3. Разработан метод регрессионно-нечеткого моделирования для прогнозирования состояния сервера, отличающийся интеграцией моделей различных
типов, имеющий лучшие показатели эффективности по сравнению с традиционным подходом визуального контроля состояния сервера (увеличение достоверности на 20%, объективности на 47%, повышения точности в 2,5 раза, увеличения информативности в 3 раза и сокращения времени принятия решения в
1,6 раз).
4. Разработан комплекс алгоритмов моделирования состояния сервера,
отличающийся применением ACL-шкалы для формализации экспертных оценок; вычислительный алгоритм нахождения нечеткой оценки числового параметра сервера в виде нечеткой оценки общей тенденции его развития.
5. Предложена и реализована архитектура комплекса программ, ориентированного на регрессионно-нечеткое моделирование состояния сервера.
СПИСОК ПУБЛИКАЦИЙ
Основные результаты диссертации изложены в следующих публикациях.
В ведущих научных изданиях, включенных в перечень ВАК:
1.
Афанасьева Т.В. Моделирование временных рядов в терминах нечетких
тенденций / Т.В. Афанасьева, С.Г. Валеев, А.О. Козлов // Обозрение
прикладной и промышленной математики. – 2009. – Т. 16. – № 6. – С.
1019–1020.
2.
Валеев С.Г. Прогнозирование состояния СОЖ / С.Г. Валеев, А.Ю.
Богданов, А.М. Великанов, А.О. Козлов // Справочник. Инженерный
журнал. №1(178). – 2012. – С. 45–51.
19
3.
Козлов А.О. Методика обработки техногенных временных рядов на
основе адаптивных динамических регрессий / А.О. Козлов, А.М.
Великанов, С.Г. Валеев // Известия Южного федерального университета.
Технические науки. – 2012. – № 6(131). – С. 82–87.
В других изданиях:
4.
Афанасьева Т.В. Моделирование лингвистических оценок на основе ACLшкалы / Т.В. Афанасьева, А.О. Козлов, А.А. Ивахина // Труды V-й
Международной научно-практической конференции "Интегрированные
модели и мягкие вычисления" (Коломна, 20-30 мая 2009 г.). – М.:
Физматлит, 2009. – Т. 1. – С. 298–304.
5.
Козлов А.О. Программа FATS и перспективы ее развития // Вузовская
наука в современных условиях: тезисы докладов 44-й научно-технической
конференции (Ульяновск, 1-7 февраля 2010 г.). – Ульяновск: УлГТУ, 2010.
– С. 157.
6.
Валеев С.Г. Формирование нечетких тенденций по результатам
функционирования пакета АС ДРМ-Т / С.Г. Валеев, А.О. Козлов //
Информатика и вычислительная техника: сборник научных трудов
Российской конференции аспирантов, студентов и молодых ученых: ИВТ2010 (Ульяновск, 25-26 мая 2010 г.). – Ульяновск: УлГТУ, 2010. – С. 72–
74.
7.
Козлов А.О. Оптимальные динамические
характеристик технологического процесса
современных условиях: тезисы докладов
конференции (Ульяновск, 24-29 января 2011
2011. – С. 190.
8.
Козлов А.О. Вычислительные эксперименты по прогнозированию
состояния смазочно-охлаждающей жидкости // Информатика и
вычислительная техника: сборник научных трудов 3-й Всероссийской
научно-технической конференции аспирантов, студентов и молодых
ученых: ИВТ-2011 (Ульяновск, 24-25 мая 2011 г.). – Ульяновск: УлГТУ,
2011. – С. 292–294.
9.
Козлов А.О. Экспертная оболочка для СРП: вопросы проектирования при
синтезе АДР-моделей // Вузовская наука в современных условиях:
сборник материалов 46-й научно-технической конференции (Ульяновск,
23-28 января 2012 г.). – Ульяновск: УлГТУ, 2012. – Т. 2. – С. 212–214.
регрессии для описания
// Вузовская наука в
45-й научно-технической
г.). – Ульяновск: УлГТУ,
10. Валеев С.Г. Методика совместной обработки временных рядов
технологического процесса на основе адаптивных динамических
регрессий / С.Г. Валеев, А.О. Козлов // Информатика и вычислительная
техника: сборник научных трудов 4-й Всероссийской научно-технической
конференции аспирантов, студентов и молодых ученых: ИВТ-2012
20
(Ульяновск, 21-23 мая 2012 г.). – Ульяновск: УлГТУ, 2012. – Т. 1. – С.
315–319.
11. Козлов А.О. Система раннего предупреждения для анализа поведения
технологических процессов // VII Всероссийская научная конференция
Математическое моделирование развивающейся экономики, экологии и
биотехнологий: ЭКОМОД 2012 (Киров, 2-8 июля 2012 г.): материалы
конференции. – Киров: ВятГУ, 2012. – С. 41.
12. Козлов А.О. Методика моделирования поведения сложной системы на
примере серверного узла предприятия / А.О. Козлов, Т.В. Афанасьева //
Информатика, моделирование, автоматизация проектирования: сборник
научных трудов 4-й Всероссийской школы-семинара аспирантов,
студентов и молодых ученых ИМАП-2012 (Ульяновск, 22-24 октября 2012
г.). – Ульяновск: УлГТУ, 2012. – С. 225–230.
13. Козлов А.О. Интеллектуальная система анализа и прогнозирования на
основе регрессионно-нечеткого моделирования / А.О. Козлов, Т.В.
Афанасьева // Информатика: проблемы, методология, технологии:
материалы XIII Международной научно-методической конференции
(Воронеж, 7-8 февраля 2013 г.). – Воронеж: Издательско-полиграфический
центр Воронежского государственного университета, 2013. – Т. 2. – С.
274–278.
21
Документ
Категория
Без категории
Просмотров
51
Размер файла
1 029 Кб
Теги
нечеткие, прогнозирование, сервера, состояние, регрессионных, основы, моделей
1/--страниц
Пожаловаться на содержимое документа