close

Вход

Забыли?

вход по аккаунту

?

Метод статистической обработки малых выборок данных в задачах прогнозирования и контроля состояния сложных систем

код для вставкиСкачать
На правах рукописи
Горбунова Екатерина Борисовна
МЕТОД СТАТИСТИЧЕСКОЙ ОБРАБОТКИ МАЛЫХ ВЫБОРОК
ДАННЫХ В ЗАДАЧАХ ПРОГНОЗИРОВАНИЯ И КОНТРОЛЯ
СОСТОЯНИЯ СЛОЖНЫХ СИСТЕМ
Специальность 05.13.01 –Системный анализ, управление и обработка
информации (техника и технологии)
Автореферат диссертации на соискание ученой степени
кандидата технических наук
Новочеркасск 2018
Работа выполнена в федеральном государственном автономном
образовательном учреждении высшего образования «Южный федеральный
университет» на кафедре «Радиотехнические и телекоммуникационные системы»
(РТС).
Научный
руководитель:
Лобач Владимир Тихонович,
кандидат технических наук, доцент, ФГАОУ ВО «Южный
федеральный
университет»,
заведующий
кафедрой
«Радиотехнические и телекоммуникационные системы»
(г. Таганрог)
Официальные
оппоненты:
Ломакина Любовь Сергеевна,
доктор технических наук, профессор, ФГБОУ ВО
«Нижегородский государственный технический университет
имени
Р.Е.
Алексеева»,
профессор
кафедры
«Вычислительные
системы
и
технологии»
(г. Нижний Новгород)
Плаксиенко Елена Анатольевна,
кандидат технических наук, доцент, ЧОУ ВО «Таганрогский
институт управления и экономики», доцент кафедры
«Прикладная математика и информационные технологии»
(г. Таганрог)
Ведущая
организация:
Федеральное государственное бюджетное образовательное
учреждение
высшего
образования
«Ростовский
государственный
университет
путей
сообщения»
(г. Ростов-на-Дону)
Защита состоится «26» апреля 2018 г. в 10-00 на заседании диссертационного
совета Д 999.064.02 на базе Южно-Российского государственного
политехнического университета (НПИ) имени М.И. Платова и Южного
федерального университета по адресу: 347928, Ростовская обл., г. Таганрог,
ГСП-17А, пер. Некрасовский, 44, ауд. Д406.
С диссертацией можно ознакомиться в библиотеке ФГБОУ ВО «ЮжноРоссийский государственный политехнический университет (НПИ) имени
М.И. Платова» и на сайте http://www.npi-tu.ru/
Автореферат разослан «___»_________2018 г.
Ученый секретарь диссертационного совета
Д 999.064.02, кандидат технических наук,
профессор
А.Н. Иванченко
3
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследования.
Повышение эффективности и надежности технических систем
невозможно без разработки специальных средств контроля и прогнозирования
их состояния. Задача создания инструментов эффективного контроля и
диагностики не теряет актуальности благодаря поступательному развитию
технологий и непрерывному усложнению контролируемых объектов. У
термина "сложный объект" или "сложная система" нет строго определения,
однако исследователи выделяют ряд черт, которые им присущи:
- отсутствие строго математического описания;
- случайный характер изменения параметров, обусловленный в первую
очередь сложностью самого объекта, обилием различных внутренних
процессов;
- нестационарность, проявляющаяся в дрейфе характеристик системы и ее
эволюции во времени;
- точки бифуркации и "странные аттракторы";
- невоспроизводимость экспериментов со сложной системой, и др.
Эти черты являются определяющими при выборе подходов к анализу
сложных систем, при этом накладываемые ими ограничения нередко бывают
противоречивы: с одной стороны, неожиданное поведение системы удобнее
рассматривать как случайный фактор и использовать для анализа методы,
учитывающие неопределенность – вероятностно-статистические; с другой
стороны, нестационарность сложных систем ограничивает применимость
статистических моделей, которые, как известно, требовательны к объему
доступных данных и не слишком подходят для работы с динамическими
процессами.
В случаях, когда значительная стохастическая составляющая
препятствует применению детерминированных подходов, нередко прибегают к
выделению и статистическому анализу псевдостацинарных участков процессов,
протекающих в анализируемой системе, однако такие участки не всегда имеют
достаточную длительность для набора представительной статистики. Из этого
факта неизбежно вытекает необходимость поиска эффективных алгоритмов
увеличения информативности анализа при обработке малых выборок.
В классической статистике принято считать пригодными для анализа
выборки данных длиной в сто и более некоррелированных значений, в то время
как менее представительная статистика считается неинформативной из-за
значительных погрешностей оценок. Между тем, в связи с актуальностью
4
задачи извлечения максимально возможного количества информации даже из
неполных данных, на текущий момент разработано некоторое количество
специальных статистических методов, которые ориентированы на анализ
укороченных выборок.
Исторически, начало статистике малых выборок было положено
У. Госсетом (Стьюдентом). Еще более специализированные подходы были
предложены М. Розенблаттом и позже развиты Е. Парзеном. Среди
отечественных ученых, работавших в этой области, следует отметить
Д.В. Гаскарова и В.И. Шаповалова, систематизировавших известные на тот
момент методы.
Эти труды носят фундаментальный характер, и большинство
современных работ по методам анализа малых выборок в той или иной мере
опираются на них. При этом, хотя эта тематика является, очевидно,
прикладной, нередко известные алгоритмы бывает проблематично применить
при решении конкретной задачи ввиду отсутствия объективных рекомендаций
по выбору значений параметров, которые необходимы для реализации
выбранного алгоритма.
Кроме того, хотелось бы отметить разработанный Б. Эфроном бутстрэпанализ. Частоту его использования в современной статистической практике
можно объяснить не только улучшением результатов обработки критически
ограниченных по объему данных, но также простотой и однозначностью
процедуры реализации. Но этот метод не предполагает оценки функции
распределения или плотности вероятностей по выборке, что также является
важной задачей статистического анализа.
Таким образом, потребность в увеличении информативности анализа
неполных данных с одной стороны, и ограничения, возникающие при попытке
реализации существующих подходов, с другой, дают право с уверенностью
говорить об актуальности исследований в данной области.
Объект исследования – обработка информации в задачах диагностики,
контроля и прогнозирования состояния сложных систем.
Предмет исследования – метод статистического анализа данных в
условиях критически ограниченного объема исходных выборок.
Методы исследования: системный анализ; методы математической
статистики и теории вероятностей; имитационное моделирование;
абстрагирование; индукция; статистический эксперимент; классификация и
обобщение.
5
Цель работы. Повышение информативности статистического анализа
выборочных данных в задачах контроля и прогнозирования состояния сложных
систем.
Задачи, решаемые для достижения поставленной цели:
- классификационный анализ подходов к контролю и прогнозированию
состояния сложных систем;
- системный анализ методов и алгоритмов идентификации
статистических моделей по выборкам данных критически ограниченного
объема;
- разработка и исследование нового метода прогнозирования плотности
вероятностей случайной величины по укороченной выборке данных;
- оптимизация параметров метода с точки зрения минимизации
погрешности оценки функции плотности вероятностей по выборке данных.
Тематика работы соответствует п. 4 «Разработка методов и алгоритмов
решения задач системного анализа, оптимизации, управления, принятия
решений и обработки информации»; п. 5 «Разработка специального
математического и алгоритмического обеспечения систем анализа,
оптимизации, управления, принятия решений и обработки информации»; п. 11
«Методы и алгоритмы прогнозирования и оценки эффективности, качества и
надежности сложных систем» и п. 12 «Визуализация, трансформация и анализ
информации на основе компьютерных методов обработки информации»
паспорта специальности 05.13.01 – «Системный анализ, управление и
обработка информации».
Научная новизна работы
- на основе проведенного исследования и классификации существующих
методов статистической обработки малых выборок данных выявлены
ограничения их применимости при решении задачи оценки функции плотности
вероятностей и ее числовых параметров, разработан и исследован метод
имитационного дополнения в целях повышения эффективности обработки
данных в условиях малых выборок;
- получено аналитическое выражение критерия оптимизации параметра
разброса элементов дополняющих массивов;
- разработана компьютерная модель, реализующая статистический
эксперимент по исследованию метода имитационного дополнения;
- в результате серии статистических экспериментов подтверждена
целесообразность использования метода имитационного дополнения для
6
оценки плотности вероятностей в случае, когда объем выборки данных не
превышает девяносто значений;
-подтверждена корректность предложенного критерия оптимизации
параметра разброса элементов дополняющих массивов;
-выполнена оценка влияния числа элементов в дополняющих массивах на
эффективность обработки данных.
Предложенный метод имитационного дополнения отличается от
известных из работ М. Розенблатта, Е. Парзена, Д.В. Гаскарова,
В.И. Шаповалова подходом к формированию оценки на основе дополнительной
рандомизации исследуемой выборки по аналогии с методом бутстрэп-анализа.
При этом аналогия не является полной ввиду отличия процедуры
формирования дополняющих множеств.
Практическая значимость исследования состоит в следующем:
- создана программа для ЭВМ, реализующая разработанный в
диссертации метод оценки плотности вероятностей по малой выборке данных;
- предложена инженерная методика прогнозирования отказоустойчивости
бортовых РЛС «Гроза» по выборкам данных о наработке между отказами;
- предложена методика оценки состояния регуляторных систем и
диагностирования аритмий на основе анализа коротких участков кардиограммы
человека.
Достоверность и обоснованность результатов диссертационного
исследования подтверждается сходимостью данных эксперимента и
аналитического расчета; устойчивостью работы разработанного программного
обеспечения и повторностью результатов экспериментов, а также сходимостью
результатов при сведении разработанного в диссертации нового метода к
известным.
Внедрение результатов работы. Результаты диссертационной работы
внедрены и используются в деятельности ЗАО "Бета Ир", г. Таганрог, в рамках
решения
задачи
прогнозирования
отказоустойчивости
тестируемых
радиоэлектронных блоков авиационного назначения.
В частности, были использованы следующие результаты кандидатской
диссертации:
- метод прогнозирования плотности распределения вероятностей
значений параметра на основе имитационного дополнения выборки данных;
- метод прогнозирования предотказных состояний блоков управления и
обработки сигналов на основе статистической классификации.
7
Кроме того, результаты диссертационной работы используются в
учебном процессе при проведении лабораторных и практических занятий по
дисциплинам «Статистические методы обработки данных», «Проектирование
инфокоммуникационных систем и сетей» на кафедре радиотехнических и
телекоммуникационных систем Института радиотехнических систем и
управления ЮФУ, г. Таганрог.
Основные положения диссертации, выносимые на защиту:
- новый метод оценки (прогнозирования) плотности распределения
вероятностей значений параметров системы на основе имитационного
дополнения выборок данных (соответствует п. 4 паспорта специальности
05.13.01);
критерий оптимизации
параметров предложенного метода
(соответствует п. 5 паспорта специальности 05.13.01);
- результаты экспериментального исследования предложенного метода
(соответствует п. 12 паспорта специальности 05.13.01);
- примеры использования предложенного метода при решении
прикладных задач (соответствует п.11 и п.12 паспорта специальности 05.13.01).
Апробация работы. Результаты диссертационного исследования
докладывались на следующих конференциях.
–
Международная
научная
конференция
по
гидроавиации
«Гидроавиасалон-2014», г. Геленджик;
–
Международная
научная
конференция
по
гидроавиации
«Гидроавиасалон-2012», г. Геленджик;
– Всероссийская научная конференция молодых ученых, аспирантов и
студентов Теоретические и методические проблемы эффективного
функционирования радиотехнических систем («Системотехника - 2015»);
– Международная конференция молодых ученых стран БРИКС
«Сотрудничество стран БРИКС для устойчивого развития»;
– Международная научно-практическая конференция «Новые технологии
и проблемы технических наук», Красноярск 2014;
– X Ежегодная научная конференция студентов и аспирантов базовых
кафедр Южного научного центра РАН, г. Таганрог;
– Международная научно-техническая конференция «Радиотехника,
электроника и связь», г. Омск;
– Международная молодежная научная конференция «XXXVIII
Гагаринские чтения», г. Москва;
8
– 19-й Всероссийская межвузовская научно-технической конференция
студентов и аспирантов «Микроэлектроника и информатика», г. Зеленоград;
– VIII Ежегодная научная конференция студентов и аспирантов базовых
кафедр Южного научного центра РАН, г. Таганрог;
–
15-й
Юбилейный
Международный
молодежный
форум
"Радиоэлектроника и молодежь в XХІ веке", г. Харьков;
– Двенадцатый международный научно-практический семинар «Практика
и перспективы партнерства в сфере высшей школы», Г.Донецк;
– Всероссийская молодежная научная конференция «Мавлютовские
чтения», г. Уфа.
В 2013 году работа, выполненная по тематике диссертационного
исследования, была удостоена премии по результатам конкурса имени
академика И.И. Воровича среди молодых ученых и специалистов Ростовской
области на лучшую работу по фундаментальным и прикладным проблемам
современной техники, проводимого Ростовским отделением Российской
Инженерной Академии.
Публикации. По теме диссертации опубликовано 28 печатных работ, в
том числе 1 монография, 4 статьи в журналах, включенных в перечень ВАК;
свидетельство о государственной регистрации программы для ЭВМ.
Структура и объем диссертации. Диссертационная работа содержит
введение, 4 главы, заключение, список сокращений, библиографический список
из 120 наименований, 9 приложений. Основная часть работы изложена на 152
страницах, содержит 73 рисунка, 7 таблиц.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность, сформулированы объект, предмет,
методы, цель и задачи исследования. Обозначены научная новизна и
практическая ценность работы.
В первой главе произведен сравнительный анализ существующих
методов прогнозирования состояния сложных систем. Выделены области их
применимости, ограничения и требования к исходным данным. Показано, что
каждый из них лишь в той или иной степени приспособлен для решения
прикладных задач, поскольку для получения приемлемой точности все они
требуют значительного количества априорной информации. Сформулирована
постановка задачи исследования как разработки специального метода
обработки выборочных данных.
9
Во второй главе определена методологическая основа обработки
укороченных выборок данных; проведена серия статистических экспериментов,
направленных на исследование известных подходов. Актуализирована
необходимость синтеза нового агрегированного метода обработки выборок в
базисе, во-первых, бутстрэп-оценок, во-вторых оценок Розенблатта-Парзена
или аддитивной аппроксимации, с целью увеличения информативности их
анализа.
В третьей главе разработан новый непараметрический метод оценки
(прогнозирования) функции плотности вероятностей случайной величины по
укороченной выборке данных. Предложенный метод был назван
имитационным дополнением.
Имела место следующая постановка задачи. Пусть имеется
действительная непрерывная случайная величина  с неизвестной плотностью
 ();
проведено

независимых
наблюдений,
представленных
некоррелированной выборкой данных [  …  ]. Необходимо произвести
оценку плотности распределения вероятностей  () по имеющейся выборке.
Оценить погрешности оценки параметров и сопоставить результаты с
классическими методами.
При синтезе методов обработки неполных данных, прежде всего,
необходимо исследовать, за счет чего возможно повысить информативность
анализа. Очевидно, что никакие манипуляции с исходной выборкой не могут
прибавить информации к уже имеющейся в ней, и речь, таким образом, идет
либо об учете тех или иных априорных сведений, либо о минимизации
информационных потерь в ходе обработки. Задача оценки плотности
распределения вероятностей по выборке обычно решается при помощи
построения гистограммы или полигона частот. Т.е. элементы выборки
группируются в пределах некоторого набора заданных интервалов, высота
столбца гистограммы (или ордината точки полигона частот) пропорциональна
числу элементов выборки, попавших в соответствующий интервал. На данном
этапе происходит потеря некоторого количества информации, поскольку
сведения о конкретном значении каждого выборочного элемента
отбрасываются, и далее учитывается только факт его принадлежности к
соответствующему протяженному интервалу. Эти потери некритичны для
больших статистик, где информационный вклад каждого отдельного значения
невелик, но не в условиях малых выборок. Хотя сложно привести объективную
оценку, сколько информации несет в себе элемент выборки  ,
10
информационные потери можно оценить через вносимую группировкой
энтропию по известной формуле (1):
( ) = −
1
1
∙ 
 = log  −  ,
 −
 −
 ≤  <  . (1)
Здесь  ,  - границы интервала .
На качественном уровне это означает, что как бы близко не находился
элемент  к границе -го и ( − 1)-го интервалов, он будет учтен только в -м и
не окажет влияния на ( − 1)-й.
Исходя из (1), можно оценить общие информационные потери вследствие
группировки элементов выборки:
∆Σ =
 ∙ log  − 
=
1
∙

где  − число столбцов гистограммы,  =
 ∙ log  −  ,
(2)
− частость − число элементов в
j-м интервале, отнесенное к длине выборки
Величина (2) является "информационным зазором", благодаря
существованию которого можно говорить о повышении информативности
анализа при небольших  в случае отказа от группировки данных или внесения
модификаций в этот процесс.
Метод имитационного дополнения предполагает следующий механизм
учета положения  внутри -го интервала. Каждый элемент выборки
дополняется группой значений, распределенных заданным образов в его
окрестности. Таким образом, в процессе группировки часть этой группы может
быть учтена в соседних интервалах, причем степень их влияния будет
полностью определяться положением исходного элемента  внутри -го
интервала. Использовалось Гауссово распределение элементов дополняющих
множеств. В качестве параметров регуляризации был введен коэффициент
 ∈ (0; 1),
определяющий,
какую
долю
должно
составлять
среднеквадратическое отклонение дополняющей группы от размаха  (т.е.
величину окрестности  , в которой дополняющее множество существует), и
параметр , означающее число элементов этого множества ( ∈ ℕ).
В результате, имеем следующий алгоритм определени  ():
- генерация N серий нормально распределенных псевдослучайных чисел с
параметрами  =  ;  =  ∙  (где  − математическое ожидание -го
11
дополняющего множества,  − СКО,  − размах , желательно известный из
априорных соображений);
- объединение исходной выборки и дополняющих массивов в одну
совокупность – "расширенную выборку";
- построение гистограммы расширенной выборки;
- интерполяция гистограммы кубическими сплайн-функциями;
- нормировка.
Оценка  () в таком случае записывается следующим образом:
 () =
1
∙
 ∙  ∙ √2
.
(3)
Для определения значения , оптимизируещего (), использовалась
следующая мера:
∞
 () −  (, )
=
 ⇢  .
(4)
∞
В результате преобразований, подробно изложенных на страницах
диссертации, эта мера была приведена к виду (5):
∗ =
1
∙

 2√
+
1
 ∙  ∙ 2√
−
√2

 √
∙
,
(5)
где
1 =
∙ ∙ √
; 2 =
∙
; 3 =
;  −размах
;
 ,  − элементы
исходной выборки.
После чего из известных условий достижения минимума функцией был
построен критерий оптимизации (6):
⎧
⎪
⎪
⎨
⎪
⎪
⎩

∙ 2∙
2

− 1 − 2√2 ∙ 
∙
3

−1
= ,
(6)

2
2

−5
2

+ 1 − √2
∙
3

−5
3

+2
+  ≥ 0.
12
Функция (5) и ее первая производная1 представлены на рис.1. Расчет делался
для нормально распределенной исходной выборки.
На графике видно, как по мере увеличения  точка минимума смещается
в сторону уменьшения  – это объясняет полученный экспериментально факт
сходимости результатов имитационного дополнения и классической
статистической обработки при  > 100.
Рисунок 1 – Мера близости истинной функции плотности и ее оценки;
производная этой меры
Далее был проведен статистический эксперимент, который преследовал
следующие цели:
1) экспериментальная проверка справедливости критерия (6);
2) оценка влияние параметра , который в критерии (6) не учитывается;
3) выявление результатов применения предложенного метода с точки
зрения изменения погрешностей статистического анализа данных;
4) проверка работоспособности метода имитационного дополнения
применительно к распределениям, отличным от Нормального.
Эксперимент проводился в соответствии со следующим разработанным
автором
алгоритмом.
Программно
формировался
длинный
ряд
некоррелированных
псевдослучайных
чисел
с
заданным
законом
распределения, играющий роль генеральной совокупности; из нее случайным
образом извлекались серии выборок объемом  ( = 10. .100). По каждой
1
Переход области значений функции  ∗ () в отрицательную полуплоскость обусловлен исключением из
рассмотрения слагаемого ∫  () , поскольку оно не зависит от .
13
выборке делалась
оценка плотности распределения
вероятностей,
математического ожидания и дисперсии. Затем выборка обрабатывалась с
использованием имитационного дополнения, и оценки делались снова.
Поскольку статистические моменты генеральной совокупности в эксперименте
были известны, по ним оценивались погрешности оценок для обоих случаев.
При имитационном дополнении параметры  и  варьировались от 0 до 1 и от 0
до 1000 соответственно. В результате была экспериментально получена
статистика (4) как функция двух переменных  = (, ) для разных значений
. В каждой точке данные усреднялись по 300 итерациям. На рис. 2 приведен
пример зависимости (, ) для Нормального распределения при  = 20.
0.2
0.15
0.1
0.05
0
1000
500
0
n
0.1
0.05
0
0.15
0.2
k
Рисунок – 2 Мера близости функции плотности и ее оценки как функция
параметров дополняющих множеств (Нормальное распределение)
Квадратичный критерий невязки
0.03
0.02
0.01
1000
0
0
0.05
0.1
500
0.15
k
0.2
0.25
0
n
Рисунок 3 – Мера близости функции плотности и ее оценки как функция
параметров дополняющих множеств (Распределение Рэлея)
14
Аналогичные зависимости были рассчитаны для распределения Рэлея
(рис. 3), произвольного двухмодального распределения при  = 10. .100.
Видно, что исследуемая поверхность имеет 1 экстремум по переменной ,
по переменной  экстремума не наблюдается; ( = опт , ) постепенно
убывает с ростом .
При  = 0 обработка сводится к класическому методу гистограмм; при
 = 0 – к бутстрэпу. Сечения поверхности, представленной на рис.2, при
 =  соответствуют результатам, полученным при помощи выражения (5),
что позволяет сделать выводы о сходимости теории и эксперимента.
Зависимость опт () была аппроксимирована полиномом (7):
опт () = (106.1 − 1.6 ∙  + 0.018 ∙  − 8.17 ∙ 10 ∙  ) ∙ 10 ,
(7)
причем выбранный таким образом коэффициент справедлив для всех
рассмотренных распределений. Коэффициент  рекомендуется выбирать
достаточно большим (по крайней мере, больше 70).
При анализе погрешностей оценок параметров распределения при
использовании имитационного дополнения было выявлено смещение оценки
второго начального момента, для компенсации которого потребовалось
введение поправочного коэффициента; его значения для Нормального
распределения и распределения Рэлея определяются выражениями (8) и (9)
соответственно.
пн () = (−2.73 ∙  + 624 ∙  ) ∙ 10 − 0.0057 ∙  + 1.29,
(8)
р
п () = (−0.13 ∙  + 419 ∙  ) ∙ 10 − 0.0011 ∙  + 1.1.
(9)
В итоге, относительная погрешность оценки СКО по выборке из 10
элементов уменьшилась с 20% до 11% для Нормального распр. и до 13% для
распределения Рэлея, при этом дисперсия самих оценок была меньше в среднем
на 25%. По мере роста  значения относительной погрешности оценки СКО по
исходным и обработанным имитационным дополнением выборкам
сближаются, при  > 90 применение данного метода обработки перестает быть
целесообразным.
Если
рассматривать
имитационное
дополнение
как
способ
прогнозирования плотности распределения случайной величины в условиях,
когда получена только часть требуемой выборки, можно определить, как
зависит горизонт прогнозирования (FTF) от глубины прогноза (FD). В этом
контексте глубиной прогноза следует считать объем имеющейся исходной
выборки , горизонт прогнозирования выражается как число элементов,
которые необходимо собрать дополнительно к имеющимся  для достижения
заданного значения погрешности интересующего параметра распределения при
15
его оценке классическим методом. Эти величины связаны зависимостью,
представленной на рис. 4.
То есть, если предложенная процедура рассматривается как
прогнозирование плотности вероятностей по первым измерениям, горизонт
прогнозирования составляет 25-32 значений для Нормального закона, 14-23
значения для распределения Рэлея и 10-15 значений двухмодального
распределения (в зависимости от заданной доверительной вероятности и
глубины прогноза).
35
30
12
Нормальное распределение
11
FTF
25
20
10
Распределение Рэлея
9
15
7
10
5
10
%
8
Двухмодальное распределение
20
30
40
50
6
60
FD
Рисунок 4 – Взаимосвязь глубины прогноза, горизонта прогнозирования и
относительной погрешности оценки СКО
Разработанный и исследованный метод имитационного дополнения лег в
основу инженерной методики, которая была реализована в виде специального
статистического анализатора малых выборок данных (к диссертационной
работе приложено авторское свидетельство на соответствующую программу
для ЭВМ).
В четвертой главе описаны прикладные задачи, в решении которых был
использован разработанный статистический анализатор.
Так, в задаче прогнозирования отказоустойчивости блоков бортовых
радиолокационных станций по предыстории их отказов использование метода
имитационного
дополнения
позволило
построить
индивидуальную
статистическую
модель
поведения
каждого
имеющегося
блока.
Прогнозирование времени последнего отказа по индивидуальным моделям дало
результат, близкий к полученному при использовании одной общей модели, для
создания которой одновременно использовалась статистика по всем блоком.
Этот факт примечателен тем, что для построения индивидуальной модели
требуется несопоставимо меньше исходных данных.
16
В задаче оценки состояния регуляторных систем человека по
кардиограмме оказалась полезной возможность построения плотности
вероятностей длительности RR-интервалов на коротком участке. В ряде работ
по этой тематике показано, что в связи с нестационарностью нормального
сердечного ритма, вариабельность, которая является основным показателем
состояния сердечнососудистой системы, следует оценивать по участкам
кардиограмм, длительностью до 30 секунд. За это время обычно фиксируется
порядка 32 интервалов между R-зубцами. Использование имитационного
дополнения дало возможность получить, во-первых, более состоятельную
оценку их СКО, во-вторых, оценить вид их распределения, что необходимо для
диагностики аритмии (идентификатором аритмии является появление второй
моды у плотности распределения RR-интервалов).
ЗАКЛЮЧЕНИЕ
В диссертационной работе получены следующие результаты
-теоретического характера:
- классифицированы подходы к решению задачи контроля и
прогнозирования состояния сложных систем;
проанализирован
ряд
известных
методов
идентификации
статистических моделей по выборкам данных критически ограниченного
объема;
- разработан и исследован новый метод оценки функции плотности
вероятностей по укороченной выборе данных;
- получен критерий оптимизации числовых параметров разработанного
метода;
- эффективность предложенного метода и достоверность полученных
аналитически выражений подтверждены серией статистических экспериментов.
прикладного характера:
- использование разработанного в диссертационной работе метода
имитационного дополнения на 9% уменьшает относительную погрешность
оценки СКО по малой выборке данных;
- использование метода имитационного дополнения целесообразно при
объеме выборки < 90 значений, наиболее эффективно при объеме выборки
< 40;
17
- на основе метода имитационного дополнения предложена методика
прогнозирования отказоустойчивости блоков бортовых радиолокационных
станций "Гроза" по выборкам данных о наработке между отказами;
- предложена методика оценки состояния регуляторных систем человека
на основе анализа коротких участков кардиограммы.
Разработанный в ходе диссертационного исследования метод показал
себя удобным инструментом при построении статистических моделей в
условиях значительной априорной неопределенности. Поскольку при его
синтезе учитывались общие свойства сложных систем, и не налагалось
ограничений на природу обрабатываемых сигналов, он получился достаточно
универсальным и может быть использован в рамках системного анализа не
только технических, но и биологических, социальных или каких-либо других
объектов.
СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ
ДИССЕРТАЦИИ
В научных изданиях из перечня ВАК:
1. Самойленко, А.П., Горбунова, Е.Б. Метод восстановления плотности
вероятностей прогнозируемой случайной величины по укороченной выборке
данных // Нелинейный мир. – 2015. – №6. – с. 10-17.
2. Горбунова Е.Б. Методика оценки состояния регуляторных систем и
диагностирования аритмий на основе анализа коротких участков кардиограммы
// Известия ЮФУ. Технические науки. – 2017. – № 6. – с. 169 – 179
3. Горбунова, Е.Б. Метод непараметрической оценки закона
распределения случайного параметра по малому числу наблюдений //
Инженерный вестник Дона. – 2014 – №3. – Режим доступа к журн.:
ivdon.ru/magazine/archive/n3y2014/2516. (дата обращения 9.12.2016).
4. Самойлеко, А.П., Горбунова, Е.Б. Полиномиальная интерполяция при
синтезе моделей технологических объектов по выборкам данных критически
ограниченного объема // Известия ЮФУ. Технические науки. – 2013. –№11. –
C. 24-31.
Монография:
5. Самойленко, А.П., Горбунова, Е.Б. Технологии прогнозирования
надежности РЭА при ограниченных объемах статистических данных:
Монография. – Ростов-на-Дону: Изд-во ЮФУ, 2014. – 153 с.
18
Свидетельство о государственной регистрации программы для ЭВМ:
6. Программа оценки функции плотности вероятностей случайной
величины по выборочным данным критически ограниченного объема с
использованием имитационного дополнения: а. с. 2016611748 Рос. Федерация /
Горбунова Е.Б., Самойленко А.П., Горбунов А.А. ; правообладатель ФГАОКВО
«Южный федеральный университет»; заявл. 14.12.2015 ; опубл. 20.03.2016,
Бюл. № 3(113).
Прочие публикации (выборочно):
7. Самойленко, А.П., Горбунова, Е.Б., Буряк, А.В., Гончаров, И.И. Метод
оценки диагностической значимости параметров при контроле РЭА
авиационного назначения // Сборник докладов X Международной научной
конференции по гидроавиации «Гидроавиасалон-2014», часть 2, Издательский
отдел Центрального Аэрогидродинамического института имени проф. Н.Е.
Жуковского (ЦАГИ), 2014.
8. Самойленко, А.П., Горбунова, Е.Б. Чапцев, А.Г., Буряк, А.В.,
Оводенко, А.В., Горбунов, А.А., Гончаров, И.И. Модель формирования
пространства контролируемых параметров радиоэлектронного комплекса
гидроавиалайнера // Сборник докладов IX Международной научной
конференции по гидроавиации «Гидроавиасалон-2012». Ч. 2. Изд. отдел ЦАГИ,
2012.
9. Самойленко, А.П., Горбунова, Е.Б. Чапцев, А.Г., Буряк, А.В.,
Оводенко, А.В., Горбунов, А.А. Системный анализ проблем диагностики
радиоэлектронного оборудования летательных аппаратов в нештатных режимах
// Сборник докладов IX Международной научной конференции по
гидроавиации «Гидроавиасалон-2012». Ч. 2. Изд. отдел ЦАГИ, 2012.
10. Горбунова, Е.Б. Имитационное дополнение как метод повышения
достоверности при формировании статистической модели по выборочным
данным. Тезисы доклада // Материалы X ежегодной научной конференции
студентов и аспирантов базовых кафедр Южного научного центра РАН. –
Ростов-на-Дону: Изд-во ЮНЦ РАН, 2014.
11. Горбунова, Е.Б. Метод прогнозирования надежности авиационного
радиоэлектронного оборудования по выборочным данным // Сборник работ
лауреатов конкурса молодых ученых им. академика И.И. Воровича
«Фундаментальные и прикладные проблемы современной техники». – Ростовна-Дону: Изд-во СКНЦ ВШ ЮФУ, 2013.
19
12. Горбунова, Е.Б. Непараметрический метод обработки статистических
данных об отказах РЭА // Сборник научных трудов по итогам Международной
научно-практической конференции «Новые технологии и проблемы
технических наук». Красноярск 2014.
Личный вклад автора в работах, опубликованных в соавторстве:
[1] – разработка и реализация статистического эксперимента для
исследования метода имитационного дополнения; исследование смещения
полученных с его помощью оценок; анализ результатов;
[4] – реализация построения эмпирического случайного процесса по
выборочным данным на ЭВМ; количественная оценка методов интерполяции;
[5] – разделы 2; 3, 4, 6; количественный анализ метода аддитивной
аппроксимации в разделе 5;
[6] – разработка математического обеспечения, архитектуры и кода
программы;
[7] – разработка алгоритма идентификации вида функций плотности
распределения выходного сигнала и погрешности измерения с заданной
достоверностью при минимальных временных затратах;
[8] – анализ известных критериев оценки диагностической значимости
контролируемых параметров;
[9] – анализ применимости статистической диагностики к задаче
контроля состояния РЭА.
Горбунова Екатерина Борисовна
МЕТОД СТАТИСТИЧЕСКОЙ ОБРАБОТКИ МАЛЫХ ВЫБОРОК
ДАННЫХ В ЗАДАЧАХ ПРОГНОЗИРОВАНИЯ И КОНТРОЛЯ
СОСТОЯНИЯ СЛОЖНЫХ СИСТЕМ
Автореферат
Формат 60×84 1/16. Бумага офсетная. Печать цифровая.
Усл. печ. л. 1,0. Уч.-изд. л. 1,5. Тираж 100 экз. Заказ № 125
Отпечатано в Отделе полиграфической, корпаративной и сувенирной продукции ИПК
КИБИ МЕДИА ЦЕНТР ЮФУ
ГСП 17А, г. Таганрог, 28, Энгельса, 1. тел. (88634)371655
1/--страниц
Пожаловаться на содержимое документа