close

Вход

Забыли?

вход по аккаунту

?

Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств

код для вставкиСкачать
На правах рукописи
Лукьянова Наталья Александровна
РАЗРАБОТКА МЕТОДА И АЛГОРИТМОВ РЕКУРРЕНТНОГО
ПОСТРОЕНИЯ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТЕЙ
КОНЕЧНЫХ СЛУЧАЙНЫХ МНОЖЕСТВ
05.13.18 — Математическое моделирование,
численные методы и комплексы программ
Автореферат
диссертации на соискание ученой степени
кандидата физико-математических наук
Томск – 2017
Работа
выполнена
в
федеральном
государственном
автономном
образовательном учреждении высшего образования «Сибирский федеральный
университет» на кафедре высшей и прикладной математики.
Научный руководитель:
кандидат физико-математических наук, доцент
Семенова Дарья Владиславовна
Официальные оппоненты:
Рыков Владимир Васильевич, доктор физико-математических наук,
профессор, федеральное государственное бюджетное образовательное
учреждение высшего образования «Российский государственный университет
нефти и газа (национальный исследовательский университет) имени
И.М. Губкина», кафедра прикладной математики и компьютерного
моделирования, профессор
Моисеева Светлана Петровна, доктор физико-математических наук, доцент,
федеральное государственное автономное образовательное учреждение
высшего образования «Национальный исследовательский Томский
государственный
университет»,
кафедра
теории
вероятностей
и
математической статистики, профессор
Ведущая
организация:
Федеральное
государственное
бюджетное
учреждение науки Институт проблем управления имени В.А. Трапезникова
Российской академии наук
Защита состоится 27 апреля 2017 г. в 12 час. 30 мин. на заседании
диссертационного совета Д 212.267.08, созданного на базе федерального
государственного автономного образовательного учреждения высшего
образования «Национальный исследовательский Томский государственный
университет», по адресу: 634050, г. Томск, пр. Ленина, 36 (корпус 2,
аудитория 102).
С диссертацией можно ознакомиться в Научной библиотеке и на официальном
сайте федерального государственного автономного образовательного
учреждения высшего образования «Национальный исследовательский
Томский государственный университет» www.tsu.ru.
Материалы по защите диссертации размещены на официальном сайте ТГУ:
http://www.ams.tsu.ru/TSU/QualificationDep/co-searchers.nsf/newpublicationn/LukyanovaNA27042017.html
Автореферат разослан «
» февраля 2017 г.
Ученый секретарь диссертационного совета
Скворцов
доктор технических наук, профессор
Алексей Владимирович
3
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность и степень разработанности темы исследования. В многомерном анализе данных актуальны задачи моделирования случайных объектов произвольной природы. Такие задачи возникают во многих практических
областях, например, в медицине – при прогнозировании осложнений, возможных у пациента по множеству диагностических симптомов; в экономике – для
исследования потребительского спроса и т.п. Изложение вероятностных и статистических результатов этих задач можно вести на языке конечных случайных множеств. Под конечным случайным множеством понимается случайный
элемент со значениями из совокупности всех подмножеств некоторого конечного множества M . При этом множество M называется носителем конечного
случайного множества. Носителем может быть конечное множество объектов
числовой или нечисловой природы. Основной объект диссертационного исследования — конечные случайные множества с носителем в виде множества
случайных событий. Конечные случайные множества с такими носителями
можно рассматривать в качестве математической модели сложных объектов
и систем, когда число описываемых их признаков конечно и появление любого из этих признаков представляется как случайное событие. Например, в
анализе лекарственной устойчивости при лечении туберкулеза в роли моделируемого объекта выступает больной с конечным множеством лекарственных
препаратов, используемых при его лечении. Если число признаков равно N,
то возможное число различных состояний объекта равно 2N . Если каждому из
этих состояний соответствует некоторая вероятность появления, то набор всех
2N вероятностей задает при определенных условиях распределение конечного
случайного множества.
На начальной стадии статистических исследований одной из важных задач
является представление результатов наблюдений в виде, наиболее удобном для
обработки, хранения и принятия решения. Если в условиях конкретной задачи
можно исходить из предположения о том, что данная выборка имеет распределение вероятностей по какому-либо закону с известными N маргинальными
вероятностями событий, то в таком случае можно перейти от хранения массива с 2N значениями к хранению N значений маргинальных вероятностей
и закону распределения конечного случайного множества. Помимо удобства
в хранении это позволит избавиться от необходимости повторных исследований; получить альтернативную выборку, ее можно будет сгенерировать по
имеющемуся закону распределения; упростить получение вероятностных характеристик случайного множества.
Многие актуальные проблемы формулируются в терминах теории случайных множеств, и многие методы решения, развиваемые в рамках этой теории,
оказываются вполне пригодными для использования.
4
Исследования случайных множеств начинаются с классических работ
G. Choquet,D. G. Kendall и G. Matheron. В работах этих авторов понятие случайного множества определяется различными способами в зависимости от используемого носителя и соответствующей ему структуре множества значений:
замкнутое, открытое, непустое компактное, выпуклое случайное множество и
другие. Случайные множества с различными типами носителей изучены в работах И. Молчанова, H. T. Nguyen, О. Ю. Воробьева, А. И. Орлова, D. Stoyan,
J. Serra, L. Santalo, Р. В. Амбарцумяна, P. Diggle и другие.
Основные теоретические результаты исследования конечных случайных
множеств с носителем в виде множества случайных событий принадлежат
О. Ю. Воробьеву (1976–2016 гг.). В рамках разработанного им случайномножественного подхода в работах A. A. Новоселова, Э. Н. Валендик, И. В. Барановой, А. О. Воробьева, Е. Е. Голденок, Т. В. Куприяновой, Е. Г. Тягловой,
А. Ю. Фомина, К. А. Белова, Д. В. Семеновой были поставлены и решены
многие прикладные задачи различного характера: социально-экономические
(анализ потребительского спроса, портфельный анализ, банковский скоринг,
анализ финансовых рисков), экологические и медицинские (прогнозирование
распространения лесных пожаров, анализ уровня заболеваемости в зависимости от районов проживания).
На сегодняшний день основной проблемой, ограничивающей практическое
применение случайно-множественного подхода, является проблема размерности. В общем случае количество параметров, задающих распределения вероятностей конечного случайного множества, зависит от мощности носителя.
Увеличение количества признаков в носителе влечет экспоненциальный рост
размерности распределения. Тем не менее современные приложения требуют
повышения мощности носителя и увеличения объема выборки данных для
построения статистической оценки параметров распределения. Однако эти
факторы значительно увеличивают время формирования и исследования этих
распределений. Техническая сложность хранения и работы со всеми 2N вероятностями распределения конечного случайного множества является одной из
самых острых проблем. Подходы к решению проблемы снижения числа параметров, необходимых для описания распределений вероятностей конечных
случайных множеств, на сегодняшний день представлены лишь отдельными
работами с использованием среднемерного и энтропийных методов построения распределений вероятностей конечных случайных множеств для ряда
конкретных экономических приложений. Проблема размерности по-прежнему
остается актуальной научной задачей и требует новых подходов и методов для
ее решения. При случайно-множественном моделировании сложных объектов и систем востребованы процедуры построения конечных случайных множеств с заданными законами распределения. К настоящему времени уже из-
5
вестны и используются на практике порядка двадцати распределений вероятностей конечных случайных множеств. Однако расширение области применения случайно-множественного моделирования требует увеличения спектра
законов распределений. Решению этих проблем посвящено настоящее диссертационное исследование.
Цели и задачи исследования. Целью исследования является разработка
метода и алгоритмов рекуррентного построения распределений вероятностей
конечных случайных множеств.
Для достижения цели были поставлены и решены следующие задачи.
1. Выявить достаточные условия существования распределений вероятностей II-го и V-го рода конечных случайных множеств.
2. Исследовать известные семейства ассоциативных функций и разработать
метод рекуррентного построения распределений вероятностей конечных случайных множеств на основе ассоциативных функций.
3. Разработать алгоритмы реализации метода рекуррентного построения
распределений вероятностей конечных случайных множеств на основе ассоциативных функций и выполнить анализ их эффективности.
4. Создать комплекс проблемно-ориентированных программ, реализующий
алгоритмы рекуррентного построения распределений вероятностей конечных
случайных множеств на основе ассоциативных функций, позволяющий моделировать и исследовать распределения вероятностей конечных случайных
множеств, выполнять вычислительные эксперименты.
Научная новизна результатов, представленных в диссертации.
1. Разработан новый метод представления распределений вероятностей конечных случайных множеств на основе ассоциативных функций. Данный метод осуществляет рекуррентное построение распределений вероятностей через меньшее число параметров. По сравнению с известными среднемерным и
энтропийными методами предложенный метод позволяет получать набор распределений вероятностей конечных случайных множеств, структура зависимостей событий которых описывается только параметром используемой ассоциативной функции. Предложенный метод позволяет получать новые классы
распределений вероятностей конечных случайных множеств.
2. Впервые доказаны достаточные условия существования распределений
вероятностей II-го и V-го рода конечных случайных множеств. Эти условия
служат обоснованием области применимости метода рекуррентного построения распределений вероятностей конечных случайных множеств.
3. Модифицированы известные границы Фреше для вероятностей пересечений и объединений случайных событий, уточняющие необходимые и достаточные условия существования распределений вероятностей II-го и V-го рода
конечного случайного множества.
6
4. Разработан алгоритм рекуррентного построения распределений вероятностей конечных случайных множеств для произвольной ассоциативной
функции и его модификации для четырех конкретных ассоциативных функций, реализованные в виде комплекса проблемно-ориентированных программ
и позволяющие проводить предобработку данных для реальных прикладных
задач и вычислительных экспериментов.
Соответствие паспорту специальности. Диссертационная работа соответствует области исследования специальности 05.13.18 — Математическое моделирование, численные методы и комплексы программ по п.1 «Разработка
новых математических методов моделирования объектов и явлений» (пункт
1 научной новизны), п.2 «Развитие качественных и приближенных аналитических методов исследования математических моделей» (пункты 1–3 научной
новизны), п.4 «Реализация эффективных численных методов и алгоритмов в
виде комплексов проблемно-ориентированных программ для проведения вычислительного эксперимента» (пункты 3–4 научной новизны).
Положения и результаты, выносимые на защиту.
1. Метод рекуррентного построения распределений вероятностей конечных
случайных множеств на основе ассоциативных функций и обоснование области его применимости.
2. Достаточные условия существования распределений вероятностей II-го
и V-го рода и уточненные границы Фреше.
3. Алгоритм рекуррентного построения распределений вероятностей конечных случайных множеств для произвольной ассоциативной функции и его
модификации для четырех конкретных ассоциативных функций.
4. Комплекс проблемно-ориентированных программ для моделирования и
исследования распределений конечных случайных множеств.
Методы исследования. Для решения поставленных задач и доказательства
сформулированных утверждений применены методы математического моделирования, теории вероятностей и математической статистики, теории случайных множеств и ассоциативных функций.
Ассоциативные функции хорошо известны и используются в теориях
неопределенности, таких как нечеткая логика, теория копул и другие. В работе
ассоциативные функции впервые применены для построения распределений
вероятностей конечных случайных множеств.
Теоретическая значимость работы. Работа носит преимущественно теоретический характер. Предложенный метод рекуррентного построения распределений вероятностей конечных случайных множеств на основе ассоциативных функций позволяет определить аналитический вид и условия существования для ряда распределений вероятностей конечных случайных множеств. Полученные теоретические результаты могут быть использованы для
7
дальнейшего расширения и изучения новых распределений вероятностей конечных случайных множеств. Работа имеет важное значение для развития теории случайных множеств.
Практическая значимость работы. Предложенный метод позволяет проводить предобработку входных данных в виде распределений вероятностей
конечных случайных множеств и их характеристик для моделирования реальных медицинских и экономических систем. Разработанный комплекс алгоритмов и программ может быть использован в научных исследованиях для изучения свойств конечных случайных множеств, а также в учебном процессе при
изучении методов построения стохастических моделей с помощью конечных
случайных множеств.
Достоверность полученных результатов. Достоверность теоретических
результатов диссертационной работы подтверждается строгими математическими доказательствами. Предложенный в диссертации метод рекуррентного построения распределений вероятностей конечных случайных множеств
на основе ассоциативных функций теоретически обоснован. Данный метод
позволил получить ранее известные распределения конечных случайных множеств с независимо-точечной, вложенной и непересекающейся структурой зависимостей событий, а также и новые классы распределений вероятностей
конечных случайных множеств на основе однопараметрических семейств ассоциативных функций Франка, Али-Михаэля-Хака, Гумбеля, Клейтона, Джо.
Использование результатов диссертации. Результаты диссертации применяются в учебном процессе Сибирского федерального университета для
подготовки бакалавров и магистров по направлениям «Прикладная математика и информатика», «Математика. Компьютерные науки», а также Красноярского государственного медицинского университета им. проф. В.Ф.ВойноЯсенецкого для подготовки специалистов направления «Медицинская кибернетика». Имеются акты об использовании.
Личное участие автора в получении результатов, изложенных в диссертации. Автор лично участвовал в получении всех результатов, изложенных в
работе, а именно в разработке и исследовании метода рекуррентного построения распределений вероятностей конечных случайных множеств на основе
ассоциативных функций, выводе всех формул, доказательстве всех представленных в диссертации теорем, разработке алгоритмов и представленного комплекса проблемно-ориентированных программ.
Апробация работы. Основные положения работы и отдельные ее вопросы
докладывались и обсуждались на следующих конференциях и семинарах международного и всероссийского уровня: III IASTED International Conference on
Automation, Control, and Information Technology (ACIT 2010), г. Новосибирск,
15–18 июня 2010 г.; II, IV International Conference «Problems of Cybernetics
8
and Informatics», г Баку, 2010, 2012 гг.; Международная конференция «Теория
вероятностей и ее приложения», посвященная 100-летию со дня рождения
Б.В. Гнеденко, г. Москва, 26–30 июня 2012 г.; IX–X Российские конференции
с международным участием «Новые информационные технологии в исследовании сложных структур», пос. Катунь Алтайского края, 2012, 2014 гг.; IV
Congress of the Turkic World Mathematical Society, г. Баку, 1–3 июля 2011 г.; XIV
Applied Stochastic Models and Data Analysis International Conference (ASMDA
2011), г. Рим, 7–10 июня 2011 г.; Республиканская научно-практическая конференция «Статистика и ее применения», г. Ташкент, 2012, 2015 гг.; 12-ая
Международная научная школа «Моделирование и Анализ Безопасности и
Риска в сложных системах» (МАБР–2014), г. Санкт-Петербург, 18–20 ноября 2014 г.; XIII–XIV Международные конференции имени А.Ф. Терпугова
«Информационные технологии и математическое моделирование» (ИТММ–
2014, 2016), г. Анжеро-Судженск, 20–22 ноября 2014 г.; пос. Катунь, 12–16
сентября 2016 г.; VI Международная конференция «Проблемы оптимизации и
экономические приложения», г. Омск, 28 июня – 4 июля 2015 г.; IX–XIV Международные конференции по финансово-актуарной математике, г. Красноярск,
2010–2015 гг.; V Международная конференция «Актуальные проблемы прикладной математики и информационных технологий – Аль-Хорезми 2016»,
г. Бухара, 9–10 ноября 2016 г.
Публикации. По тематике диссертации опубликовано 20 работ, из них 5
статей в журналах, включенных в Перечень рецензируемых научных изданий,
в которых должны быть опубликованы основные научные результаты диссертаций на соискание ученой степени кандидата наук, на соискание ученой
степени доктора наук (в том числе 1 статья в российском научном журнале,
индексируемом Scopus), 3 статьи в изданиях, индексируемых Web of Science
и Scopus, 1 свидетельство о регистрации электронного ресурса, 1 статья в
научном журнале, 10 публикаций в сборниках материалов международных и
всероссийских научных и научно-практических конференций (из них 1 сборник материалов зарубежной конференции).
Структура и объем диссертации. Диссертация состоит из введения, трех
глав, заключения, списка литературы, двух приложений, списка таблиц, списка
иллюстраций и списка условных обозначений. Общий объем диссертации составляет 147 страниц, включая приложения; иллюстративный материал представлен 12 рисунками (из них 4 в приложениях) и 9 таблицами; список литературы содержит 157 наименований.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Используемая далее нумерация теорем, лемм, формул и таблиц — такая же,
как в диссертационной работе.
9
Во введении описаны актуальность, теоретическая и практическая значимость работы, цель, основные задачи и методы исследования.
В первой главе приводятся основные сведения о ключевых объектах исследования — конечных случайных множествах, носителями которых выступают множества случайных событий, и их распределениях вероятностей, которые используются для описания всех способов взаимодействия элементов
между собой в моделируемом множестве.
В параграфе 1.1 приведены основные определения и утверждения, касающиеся конечных случайных множеств.
Для описания конечного случайного множества используется понятие случайного элемента1 . Случайные множества определяют, как случайный элемент
посредством отображения некоторого вероятностного пространства такого, у
которого образами элементов пространства элементарных событий являются
подмножества фиксированного множества.
В работе исследуются специфические случайные множества, носителем которых выступают конечные множества случайных событий X ⊂ F, выбранных из алгебры F вероятностного пространства (Ω, F, P), |X| < ∞.
Случайное множество K, заданное на носителе X ⊂ F определяется
как
X
отображение K: Ω → 2X , измеримое относительно пары алгебр F, 22 в
X
том смысле, что для всякого X ∈ 22 справедливо K −1 (X) ∈ F.
Выражение K (ω) = {x ∈ X : ω ∈ x} может быть истолковано, как «случайное множество наступивших событий», поскольку элементарному исходу
эксперимента ω ∈ Ω ставится в соответствие некоторое подмножество событий X ⊆ X, которое содержит все те события, которые наступили в данном
испытании. Измеримое событие {ω : K(ω) = X, X ⊆ X} ∈ F, которое
заключается в том, что случайное множество K принимает одно из своих
возможных значений X ⊆ X, означает, что наступившие случайные события из X образуют подмножество X ⊆ X, а ненаступившие
— подмножество
!
!
\
\ \
X c = X \ X: {ω : K(ω) = X, X ⊆ X} =
x
xc ⊆ Ω.
x∈X
x∈X c
Для простоты далее вместо {ω : K(ω) = X, X ⊆ X} будем писать {KX = X},
где нижний индекс X при K означает, что конечное случайное множество K
задано на носителе X. Множество всех таких событий, порожденных множеством
P событий X, образует разбиение пространства элементарных событий
Ω=
{KX = X}. Пусть N — мощность носителя X.
X⊆X
Распределения вероятностей конечных случайных множеств являются функциями множества f : 2X → [0, 1], которые заданы на различных системах
случайных событий, порожденных множеством X. Для полного определения
1
Ширяев А. Н. Вероятность. В 2-х кн. / 3-е изд., перераб. и доп. — М.: МЦНМО, 2004. — Кн. 1. — 520 с.
10
распределения вероятностей конечного случайного множества KX достаточно
любого одного из шести типов распределений I-го — VI-го рода, каждое из
которых задано на своей системе событий, порожденной X. В работе рассматриваются следующие три типа.
Распределение вероятностей I-го рода конечного случайного множества KX
— это аддитивная функция множества, определенная
на
системе несовмест!!
!
\ \
\
xc
, где X c = X \ X,
x
ных событий вида {KX = X} =
x∈X
c
x∈X c
N
x = Ω \ x. Это набор из 2 вероятностей p(X) = P({K
X X = X}). Распределение вероятностей I-го рода удовлетворяет условию
p(X) = 1.
X⊆X
Распределение вероятностей II-го рода конечного случайного множества
KX — это супераддитивная функция множества,
! определенная на системе сов\
местных событий вида {KX ⊇ X} =
x . Это набор из 2N вероятностей
x∈X
pX = P({KX ⊇ X}). Распределение вероятностей II-го рода удовлетворяет
системе неравенcтв Фреше для вероятностей пересечений событий:
(
)
!
X
\
max 0,
P(x) − |X| + 1 ≤ P
x ≤ min P(x),
(1.3)
x∈X
x∈X
x∈X
где P(x) = P {x ∈ KX } — маргинальные вероятности событий.
Распределение вероятностей V-го рода конечного случайного множества
KX — это субаддитивная функция множества,
! определенная на системе сов[
местных событий вида {KX * X c } =
x . Это набор из 2N вероятностей
x∈X
uX = P {KX * X c } . Распределение вероятностей V-го рода удовлетворяет
системе неравенств Фреше для вероятностей объединения событий:
!
(
)
[
X
max P (x) ≤ P
x ≤ min 1,
P (x) .
(1.5)
x∈X
x∈X
x∈X
Распределения вероятностей I-го и II-го рода, I-го и V-го, V-го и II-го рода
попарно связаны взаимно-обратными формулами обращения Мёбиуса2 .
В параграфе 1.2 доказаны теоремы о достаточных условиях существования распределений вероятностей II-го и V-го рода конечного случайного
множества, которые дополняют ранее доказанные в работах О. Ю. Воробьева
необходимые условия существования этих распределений.
2
Воробьев А.О., Воробьев О.Ю. Суммирование сет-аддитивных функций и формула обращения Мёбиуса //
Доклады РАН, Т. 336. № 4, 1994. – С. 417–420.
11
Функции множества, заданные на системах событий {KX ⊇ X} и
{KX * X c }, значения которых удовлетворяют границам Фреше (1.3) и (1.5)
соответственно, не всегда определяют распределения вероятностей II-го рода
и V-го рода конечного случайного множества.
Теорема 1.1 (Достаточные условия существования распределения вероятностей II-го рода). Функция множества f : 2X → [0, 1], заданная на системе событий {KX ⊇ X}, X ∈ 2X , является распределением вероятностей II-рода
конечного случайного множества KX , если выполнены следующие условия:
(1) f (∅) = P({KX ⊇ ∅}) = 1;
(2) f (x) = P({x ∈ KX }) — значения функции множества на событиях
x ∈ X совпадают с вероятностью этих событий;
(3) значения функции множества удовлетворяют системе неравенcтв Фреше для вероятностей пересечений событий при всех X ∈ 2X , |X| ≥ 2,
(
)
X
max 0, 1 −
(1 − f (x)) ≤ f (X) ≤ min f (x);
x∈X
x∈X
(−1)|Y |−|X| f (Y ), получен-
P
(4) значения функции множества p(X) =
Y ∈2X :X⊆Y
ной из f (X) по формуле обращения Мёбиуса, неотрицательны.
Теорема 1.2 (Достаточные условия существования распределения вероятностей V-го рода). Функция множества f : 2X → [0, 1], заданная на системе событий {KX * X c }, X ∈ 2X , является распределением вероятностей V-рода
конечного случайного множества KX , если выполнены следующие условия:
(1) f (∅) = P({KX * X c }) = 0;
(2) f (x) = P({x ∈ KX }) — значения функции множества на событиях
x ∈ X совпадают с вероятностью этих событий;
(3) значения функции множества удовлетворяют системе неравенcтв Фреше для вероятностей объединения событий при всех X ∈ 2X , |X| ≥ 2
(
)
X
max f (x) ≤ f (X) ≤ min 1,
f (x) ;
x∈X
(4) значения функции множества p(X) =
x∈X
P
(−1)|X|−|Y | (1 − f (Y c )) ,
Y ∈2X :Y ⊆X
полученной из f (X) по формуле обращения Мёбиуса, неотрицательны.
В параграфе 1.3 получены модификации границ Фреше для вероятностей
пересечений и объединений событий в виде лемм 1.6 – 1.7, которые уточняют
необходимые и достаточные условия существования распределений вероятностей II-го и V-го рода конечных случайных множеств. Опираясь на новую
модификацию границ Фреше, сформулированы и доказаны теоремы 1.3 –1.4,
которые являются уточнением теорем 1.1–1.2 соответственно.
12
Лемма 1.6 (Уточненные границы Фреше для вероятности пересечения событий). Распределение вероятностей II-го рода конечного случайного множества KX для
удовлетворяет
уточненной верхней границе
X ⊆ X, |X| > 2, T
T
Фреше P
x ≤ min P
x ≤ min P(x) и уточненной нижней
Y ⊆X,
|Y |=|X|−1
x∈X
x∈X
x∈Y
границе Фреше при ∀t1 , t2 ∈ X




2
X
\
max 0,
P
x − P 
{t1 ,t2 }⊆X
i=1
x∈X\{ti }

\
x  ≤ P
x∈X\{t1 ,t2 }
!
\
x .
x∈X
Лемма 1.7 (Уточненные границы Фреше для вероятностей объединений событий). Распределение вероятностей V-го рода конечного случайного множества KX для X ⊆ X, |X| > 2, удовлетворяет уточненной верхней границе
Фреше при ∀t1 , t2 ∈ X





!
2
[
X
[
[




P
x −P
x 
P
x ≤ min
1,
x∈X
{t1 ,t2 }⊆X
i=1
x∈X\{ti }
x∈X\{t1 ,t2 }
и уточненной нижней границе Фреше
max P
Y ⊆X,
|Y |=|X|−1
S
S
x ≤P
x .
x∈Y
x∈X
Полученные в первой главе достаточные условия существования распределений вероятностей конечного случайного множества используются при доказательстве теорем 2.2 – 2.5, 2.8, 2.9 главы 2. Уточненные границы Фреше
применяются в алгоритме 1 главы 3.
Во второй главе изложены основные результаты диссертации. Предлагается метод рекуррентного построения распределений вероятностей конечных
случайных множеств на основе ассоциативных функций. Данный метод сокращает число параметров, необходимых для описания распределения, с 2N
до N + 1 параметра и порождает новые классы распределений вероятностей
конечных случайных множеств.
В параграфе 2.1 даются предварительные сведения из теории ассоциативных функций и обосновывается применение понятия ассоциативной функции
к распределению вероятностей конечного случайного множества.
В современных теориях неопределенности широкое распространение получили классы ассоциативных функций (S. Alsina, M. Frank, B. Schveizer), в частности, треугольные нормы (E. P. Klement, K. Menger) и копулы (R. B. Nelsen,
A. Sclar). Дадим определение ассоциативной функции, используемое в работе.
Ассоциативная функция определяется как двуместная функция
AF: [0, 1]2 → [0, 1], удовлетворяющая следующим свойствам.
A1. Граничные условия: AF(a, 0) = AF(0, a) = 0, AF(a, 1) = AF(1, a) = a
∀a ∈ [0, 1].
13
A2. Монотонность: ∀a1 , a2 , b1 , b2 ∈ [0, 1] таких, что a1 ≤ a2 , b1 ≤ b2 справедливо AF(a1 , b1 ) ≤ AF(a2 , b2 ).
A3. Коммутативность: AF(a, b) = AF(b, a), ∀a, b ∈ [0, 1].
A4. Ассоциативность: AF(AF(a, b), c) = AF(a, AF(b, c)), ∀a, b, c ∈ [0, 1].
A5. Условие Липшиц-непрерывности: AF(c, b) − AF(a, b) ≤ c − a, a ≤ c,
a, b, c ∈ [0, 1].
Согласно свойству A2 ассоциативная функция возрастает по вертикали и по
горизонтали, а по свойству A3 симметрична относительно плоскости a = b.
Свойства A1 — A3, A5 гарантируют, что значение функции AF(a, b) будет обладать свойствами вероятности. Свойство A4 позволяет рекуррентно перейти
к n-местной функции. Таким образом, ассоциативная функция — непрерывная t-норма, удовлетворяющая условию Липшица, или, что тоже самое, ассоциативная и коммутативная копула. Именно такая трактовка понятия ассоциативной функции используется в диссертационной работе и применена к
распределению вероятностей конечного случайного множества.
В параграфе 2.2 изложен метод рекуррентного построения функции множества на основе ассоциативных функций.
Основная идея построения функции множества, заданной на системе событий {KX ⊇ X}, заключается в том, чтобы формировать вероятности пересечений событий как n-местную функцию (n = |X|, n ≤ N ) на основе
ассоциативной функции, применяя рекуррентные соотношения, в качестве аргументов используются маргинальные вероятности событий P(x) = px , x ∈ X:
!
\
P
x = g (px , x ∈ X) = AF px , g py , y ∈ X \ {x} .
(2.2)
x∈X
Например,
P (x ∩ y) = AF (px , py ) = g (px , py ) ,
P (x ∩ y ∩ z) = AF (P (x ∩ y) , pz ) = AF (AF(px , py ), pz , ) = g (px , py , pz )
и далее аналогичным образом. В результате формируются 2N − N − 1 вероятностей пересечений событий, удовлетворяющих границам Фреше. Функция
множества f (X), определенная на системе событий {KX ⊇ X}, X ⊆ X, есть
набор n-местных функций со следующими значениями:
f (∅) = 1; f (x) = px ; f (xy) = g (px , py ) ; . . . ; f (X) = g (px , x ∈ X) .
(2.3)
Формулы (2.2) и (2.3) определяют метод рекуррентного построения функции множества, заданной на системе событий {KX ⊇ X}, используя в качестве входных параметров вероятности событий px и вид ассоциативной
функции. Метод рассмотрен для следующих ассоциативных функций:
AF(a, b) = a · b;
(2.7)
14
AF(a, b) = min{a, b};
AF(a, b) = max{a + b − 1, 0};
a·b
AF(a, b) =
;
a+b−a·b
однопараметрическое семейство функций Франка
1
(e−α·a − 1)(e−α·b − 1)
AFα (a, b) = − ln 1 +
, α 6= 0,
α
(e−α − 1)
(2.10)
(2.14)
(2.24)
(2.34)
где α – параметр зависимости между a и b. Предложенный метод решает проблему размерности, однако порождает другую проблему: построенные с помощью данного метода функции множества могут не являться распределением
вероятностей II-го рода. Для каждого рассматриваемого семейства ассоциативных функций возникает необходимость исследования области применимости метода. Параграф 2.3 посвящен решению этой проблемы. Для каждой из
функций (2.7), (2.10), (2.14), (2.24), (2.34) доказаны теоремы 2.1 – 2.5, леммы 2.2 – 2.3, устанавливающие аналитический вид и условия существования результирующих распределений вероятностей. Важно, что для функций
(2.7), (2.10), (2.14) распределения вероятностей II-рода в точности совпадают
с ранее известными распределениями конечных случайных множеств с независимо-точечной, вложенной и непересекающейся структурой зависимостей
событий. Это подтверждает корректность предлагаемого подхода. В доказательстве теоремы 2.3 показано, что рекуррентное построение распределения
вероятностей конечных случайных множеств на основе ассоциативной функции (2.14) возможно только при выполнении определенных ограничений на
входные вероятности событий. При этом возникают только три вида результирующих случайных множеств с соответствующими распределениями вероятностей, два из которых новые (следствие 2.5) в теории конечных случайных
множеств. Лемма 2.3 и теоремы 2.5, 2.6 устанавливают аналитический вид и
условия существования ранее неисследованного класса распределений вероятностей конечных случайных множеств. Использование однопараметрического
семейства ассоциативных функций Франка (2.34) дает набор распределений
вероятностей конечных случайных множеств, структура зависимостей событий которых описывается параметром ассоциативной функции Франка. Введем обозначения:
F rank(px , x ∈ X; α) = AFα px , F rank(pt , t ∈ X \ {x}; α) , X ⊆ X.
Теорема 2.6 (Предельные случаи для функции Франка). Пусть X ⊂ F конечное множество случайных событий, выбранных из алгебры F вероятностного пространства (Ω, F, P). И пусть конечное случайное множество KX
15
определяется распределением вероятностей II-го рода, построенным ассоциативной функцией Франка pX = F rank (px , x ∈ X; α), X ⊆ X. Тогда распределение {pX , X ⊆ X}
1. при α → 0± стремится к распределению II-го рода независимо-точечного
случайного множества, определяемому ассоциативной
Y функцией (2.7):
lim± F rank(px , x ∈ X; α) =
px ;
α→0
x∈X
2. при α → +∞ стремится к распределению II-го рода случайного множества вложенных событий, определяемому ассоциативной функцией (2.10):
lim F rank(px , x ∈ X; α) = min px ;
α→+∞
x∈X
3. при α → −∞ стремится к распределению II-го рода случайного множества, определяемому ассоциативной функцией
(2.14):
(
)
X
lim F rank(px , x ∈ X; α) = max
px − |X| + 1, 0 , |X| > 1.
α→−∞
x∈X
Для каждого из построенных распределений вероятностей на основе функций (2.7), (2.10), (2.14), (2.24), (2.34) найдены характеристики конечного случайного множества: следствия 2.3, 2.4, 2.6 – 2.8.
В параграфе 2.4 метод рекуррентного построения распределений вероятностей V-го рода конечных случайных множеств распространен на двойственные ассоциативные функции (теоремы 2.7 – 2.9).
В третьей главе диссертации приводятся описание алгоритмов и комплекса программ. Изложенный во второй главе метод рекуррентного построения
распределений вероятностей конечных случайных множеств ассоциативными
функциями допускает численную реализацию с помощью соответствующих
алгоритмов. Проведены экспериментальные исследования по обработке реальных данных c целью апробации комплекса программ.
В параграфе 3.1 приводятся алгоритмы построения распределений конечных случайных множеств на основе ассоциативных функций. Описание алгоритмов представлено на псевдокоде. Приведены оценки трудоёмкости представленных алгоритмов. Трудоёмкость задает время выполнения алгоритмов в
зависимости от длины входа N и описывается функцией t(N ). Все представленные в этой главе алгоритмы имеют экспоненциальное время выполнения,
что отражено в Таблице 3.1.
Таблица 3.1 — Порядок роста алгоритмов 1 – 5
Ассоциативная функция
Произвольная
AF(a, b) = a · b
AF(a, b) = min(a, b)
AF(a, b) = max(a + b − 1, 0)
Франка (2.34)
Теорема
1.3
2.1
2.2
2.3
2.5
Алгоритм
1
2
3
4
5
Порядок роста
O(3N )
O(N · 2N )
O(2N )
O(N · 2N )
O(N · 2N )
16
Алгоритм 1 имеет более высокую вычислительную сложность (по времени)
по сравнению с его модификациями даже при малой длине входа N . Это объясняется тем, что он носит универсальный характер, поскольку работает с
произвольно заданной ассоциативной функцией. Вычислительная сложность
модификаций алгоритма 1 для конкретных ассоциативных функций (алгоритмы 2 – 5) может быть снижена за счет полученных и доказанных в главе 2
теоретических положений об аналитическом виде распределений вероятностей конечных случайных множеств.
В параграфе 3.2 представлено описание разработанного комплекса проблемно-ориентированных программ «Моделирование и исследование распределений вероятностей конечных случайных множеств». Комплекс программ
состоит из трех модулей. Модуль F INITE R ANDOM S ETS предназначен для построения распределений конечных случайных множеств и вычисления их основных характеристик: арных ковариаций, корреляций Фреше, энтропии, сетсредних. Алгоритмы 1 – 5 программно реализованы в этом модуле. Модуль
D ISTRIBUTION F ITTING OF F INITE R ANDOM S ETS предназначен для численной аппроксимации эмпирических распределений теоретическими распределениями, построенными с помощью ассоциативных функций. Модуль
S IMULATION OF F INITE R ANDOM S ETS носит вспомогательный характер и
предназначен для моделирования выборки значений конечного случайного
множества с заданным распределением и для проведения серии вычислительных экспериментов.
В параграфе 3.3 приведены результаты численных экспериментов по моделированию распределений конечных случайных множеств с использованием
разработанного комплекса программ для исследования лекарственной устойчивости у больных туберкулёзом.
При проведении различного рода исследований зачастую приходится прибегать к обработке больших массивов экспериментальных данных и иногда
возникает необходимость подобрать теоретическое распределение. Рассмотрен пример по базе данных Красноярских краевых противотуберкулёзных
диспансеров №1 и №2 за 2007-2011 гг., сформированной экспертами, содержащей результаты ретроспективного анализа первичной медицинской документации впервые выявленных больных туберкулезом с лекарственной устойчивостью. По запросу экспертов сформированы классы пациентов с определенным набором возрастно-половых, медико-биологических и социальнопрофессиональных факторов. Для примера рассмотрен один из классов. Каждый пациент класса проверялся на лекарственную устойчивостью к противомикробным препаратам из множества X = {H, R, S, E, K, P t, Of l}, где H –
изониазид, R – рифампицин; S – стрептомицин, E – этамбутол; K – канамицин, P t – протионамид, Of l – офлоксацин. Конечное случайное множество,
17
заданное на носителе X, будет выступать в качестве математической модели
случайного пациента с лекарственной устойчивостью к противомикробным
препаратам, используемым для лечения болезни. Для каждого набора X ⊆ X
вероятность I-го рода интерпретируется, как вероятность того, что случайный
пациент будет обладать лекарственной устойчивостью точно к набору препаратов X, а вероятности II-го рода интерпретируется, как вероятность того,
что среди препаратов, на которые у случайного пациента присутствует лекарственная устойчивость, есть набор препаратов X. С помощью программного
комплекса вычислены эмпирические распределения вероятностей I-го рода и
II-го рода. Получена численная аппроксимация эмпирических распределений
конечных случайных множеств теоретическими распределениями, построенными на основе однопараметрических ассоциативных функций Франка, АлиМихаэля-Хака, Гумбеля, Клейтона, Джо с маргинальными вероятностями событий P (H) = 0, 17011, P (R) = 0, 13843, P (S) = 0, 18664, P (E) = 0, 13085,
P (K) = 0, 06612, P (P t) = 0, 0489, P (Of l) = 0, 0186.. В качестве меры близости между эмпирическим q (X) и теоретическим p (X; α) = g (px , x ∈ X)
(согласно соотношению (2.2)) распределениями использовалось расстояние
Кульбака-Лейблера
X
q (X)
DKL (q (X) , p (X; α)) =
q (X) ln
.
p (X; α)
X⊆X
Выбор этого расстояния обусловлен, тем что оно удовлетворяет принципу минимальной различающей информации. Значение параметра α является решением задачи минимизации функции α∗ = arg min DKL (q (X) , p (X; α)) .
α
Таблица 3.3 — Результаты численной аппроксимации
AFα
α
DKL
Франк
30, 70263
0, 0439765
Али-Михаэль-Хак
1
0, 225445
Гумбель
6, 710429
0, 063657
Клейтон
2, 814419
0, 095653
Джо
27, 267973
0,041714
Из Таблицы 3.3 видно, что наилучшее приближение дает распределение,
построенное функцией Джо. От массива данных по отобранному классу пациентов перешли к эмпирическому распределению, описываемому 2N = 128 вероятностями. Переход от эмпирических распределений к теоретическим распределениям позволяет оперировать при N = 7 только восемью числовыми
величинами, семь из которых являются исходными вероятностями событий
x ∈ X, и параметром α ассоциативной функции Джо.
Теоретические распределения вероятностей случайного пациента с лекарственной устойчивостью к противомикробным препаратам могут быть использованы в качестве входных данных при решении задачи классификации
факторов, оказывающих влияние на риск развития туберкулёза и в моделях
сет-регрессионного анализа медицинских данных.
18
В заключении диссертации сформулированы основные результаты и выводы, полученные на основе настоящей диссертационной работы.
В приложении А приводятся демонстрационные примеры.
В приложении Б описывается структура и основные функции комплекса
программ.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
Статьи в журналах, включенных в Перечень рецензируемых научных изданий, в которых должны быть опубликованы основные научные результаты
диссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук:
1. Лукьянова Н. А. Ассоциативные функции Франка в построении семейств дискретных вероятностных распределений случайных множеств событий / Н. А. Лукьянова, Д. В. Семенова // Прикладная дискретная математика.
— 2016. — № 2 (32). — C. 5–19. — DOI: 10.17223/20710410/32/1. — 0,8/ 0,4 п.л.
2. Lukyanova N. A. The study of discrete probabilistic distributions of random
sets of events using associative function / N. A. Lukyanova, D. V. Semenova //
Journal of Siberian Federal University. Mathematics & Physics. — 2014. — № 7 (4).
— P. 500–514. — 0,9/ 0,45 п.л. (Scopus)
3. Семенова Д. В. Рекуррентное построение дискретных вероятностных
распределений случайных множеств событий / Д. В. Семенова, Н. А. Лукьянова // Прикладная дискретная математика. — 2014. — № 4 (26). — C. 47–58.
— 0,68/ 0,34 п.л.
4. Lukyanova N. A. Eventological Scoring in the Theory of Fuzzy Events /
N. A. Lukyanova, M. I. Rybnikova, D. V. Semenova // Журнал Сибирского федерального университета. Математика и физика. Journal of Siberian Federal University. Mathematics & Physics. — 2012. — № 5 (2). — P. 143–155. — 0,8/ 0,27 п.л.
5. Vorobyev O. Yu. Properties of the Entropy of Multiplicative-Truncated Approximations of Eventological Distributions / O. Yu. Vorobyev, N. A. Lukyanova //
Журнал Сибирского федерального университета. Математика и физика. Journal
of Siberian Federal University. Mathematics & Physics. — 2011. — № 4 (1). —
P. 50–60. — 0,58 / 0,29 п.л.
Статьи в изданиях, индексируемых Web of Science и Scopus:
6. Semenova D. Formation of Probabilistic Distributions of RSE by Associative Functions / D. Semenova, N. Lukyanova // Information Technologies and
Mathematical Modelling: proceedings of 13th International Scientific Conference,
ITMM 2014, named after A.F. Terpugov. Anzhero-Sudzhensk, Russia, November
20–22, 2014. — Springer International Publishing, Switzerland, 2014. — Communications in Computer and Information Science, vol. 487. — P. 377–386. —
DOI: 10.1007/978-3-319-13671-4_43. — 0,7/ 0,35 п.л.
19
7 Semenova D. V. Random Set Decomposition of Discrete-Continuous Random Variables / D. V. Semenova, N. A. Lukyanova // Problems of Cybernetics and Informatics (PCI 2012): proceedings of the IV Int. conference. Baku,
September 12–14, 2012. — Baku, 2012. — Vol. IV. — P. 180–183. —
DOI: 10.1109/ICPCI.2012.6486479. — 0,38/ 0,19 п.л.
8. Goldenok E. E. Applications of wide dependence theory in eventological
scoring / E. E. Goldenok, N. A. Lukyanova, D. V. Semenova // Control, Diagnostics,
and Automation: proceedings of the IASTED International conference on Automation, Control and Information Technology (ACIT-CDA 2010). Novosibirsk, Russia,
June 15–18, 2010. — Novosibirsk, 2010. — Automation, Control and Information
Technology, vol. 692. — P. 316–322. — 0,87/ 0,3 п.л.
Cвидетельство о регистрации электронного ресурса:
9. Лукьянова Н. А. Комплекс программ «Вероятностные распределения
случайных конечных множеств событий» / Лукьянова Н. А., Семенова Д. В. —
Объединенный фонд электронных ресурсов «Наука и образование». — Свид.
о рег. №21892, дата рег.: 01.06.2016.
Публикации в других научных изданиях:
10. Лукьянова Н. А. Краткий обзор по теории случайных множеств /
Н. А. Лукьянова, Д. В. Семенова // Информационные технологии и математическое моделирование (ИТММ–2016): материалы XV международной конференции имени А. Ф. Терпугова. Катунь, 12-16 сентября 2016 г. — Томск,
2016. — Ч.2. — С. 172–178. — 0,38/ 0,19 п.л.
11. Лукьянова Н. А. Ассоциативные функции в построении семейств
распределений
вероятностей
конечных
случайных
множеств
/
Н. А. Лукьянова, Д. В. Семенова // Актуальные проблемы прикладной математики и информационных технологий – Аль-Хорезми 2016: труды V международной конференции. Бухара, Республика Узбекистан, 09–10 ноября 2016
г. — Бухара, 2016. — Т. 2. — С. 208–210. — 0,22/ 0,11 п.л.
12. Лукьянова Н. А. Уточненные границы Фреше для вероятностного распределения случайного множества событий / Н. А. Лукьянова, Д. В. Семенова
// XIV конференция по финансово-актуарной математике и эвентологии многомерной статистики (ФАМЭМС’2015): труды конференции. Красноярск, 24–25
апреля 2015 г. — Красноярск, 2015. — C. 302–308. — 0,88/ 0,44 п.л.
13. Лукьянова Н. А. Применение ассоциативных функций для оценки вероятности целевого события / Н. А. Лукьянова, Д. В. Семенова // Статистика и
ее применения: материалы республиканской научно-практической конференции. Ташкент, 16–17 октября 2015 г. — Ташкент, Республика Узбекистан, 2015.
— С. 91–98. — 0,36/ 0,18 п.л.
14. Семенова Д. В. Семейство случайных множеств событий Франка /
Д. В. Семенова, Н. А. Лукьянова, Л. Ю. Шангареева // XIII конференция
20
по финансово-актуарной математике и эвентологии многомерной статистики
(ФАМЭМС’2014): труды конференции. Красноярск, 18–19 апреля 2014 г. —
Красноярск, 2014. — C. 234–238. — 0,63/ 0,21 п.л.
15. Семенова Д. В. Оценка параметра ассоциативной функции методом
наименьших квадратов для семейств Франка и Али-Михаэля-Хака случайных
множеств событий / Д. В. Семенова, Н. А. Лукьянова, Л. Ю. Шангареева //
XIII конференция по финансово-актуарной математике и эвентологии многомерной статистики (ФАМЭМС’2014): труды конференции. Красноярск, 18–19
апреля 2014 г. — Красноярск, 2014. — C. 239–243. — 0,63/ 0,21 п.л.
16. Лукьянова Н. Ассоциативные случайные множества событий в скоринге / Н. Лукьянова, Д. Семенова, М. Мельникова // Моделирование и Анализ
Безопасности и Риска в сложных системах (МАБР–2014): труды Двенадцатой
междунар. науч. школы. Санкт-Петербург, 18–20 ноября 2014 г. — СПб., 2014.
— C. 275–282. — 0,42/ 0,14 п.л.
17. Semenova D. Recurrent metod of constructing of probabilistic distributions
of random sets of events by associative functions / D. Semenova, N. Lukyanova
// Информационные технологии и математическое моделирование (ИТММ–
2014): материалы XIII международной конференции имени А. Ф. Терпугова.
Анжеро-Судженск, 20–22 ноября 2014 г. — Томск, 2014. — Ч.1. — C. 15–20. —
0,38/ 0,19 п.л.
18. Лукьянова Н. А. Энтропия множества событий и его подмножества /
Н. А. Лукьянова // XII международная конференция по финансово-актуарной
математике и эвентологии безопасности (ФАМЭБ’2013): труды конференции.
Красноярск, 19–20 апреля 2013 г. — Красноярск, 2013. — С. 264–271. — 0,6 п.л.
19. Semenova D. Random set decomposition of joint distribution of random
variables of mixed type / D. Semenova, N. Lukyanova // Proceedings of Institute
of Applied Mathematics. — 2012. — V. 1, № 2. — P. 188–202. — 0,68/ 0,34 п.л.
20. Goldenok E. E. About entropy of eventological distributions / E. E. Goldenok,
N. A. Lukyanova, M. I. Rybnikova, D. V. Semenova // XIV International Conference on Applied Stochastic Models and Data Analysis (ASMDA 2011): proceedings.
Rome, Italy, June 7–10, 2011. — Rome, Italy, 2011. — P. 518–525. — 0,44/ 0,11 п.л.
Издание подготовлено в авторской редакции
Отпечатано на участке цифровой печати
Издательского Дома Томского государственного университета
Заказ №160217 от «17» февраля 2017 г. Тираж 100 экз.
г. Томск Московский тр.8 тел. 53-15-28
1/--страниц
Пожаловаться на содержимое документа