close

Вход

Забыли?

вход по аккаунту

?

Математическое моделирование популяционной динамики больных артериальной гипертензией для задач поддержки принятия врачебных решений

код для вставкиСкачать
1
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы исследования и степень ее разработанности.
Важным инструментом цифровой трансформации здравоохранения являются
виртуальные клинические испытания. Они используют данные вычислительных экспериментов для обоснования возможности применения новых лекарственных препаратов, медицинской техники, организационных мероприятий, направленных на повышение качества оказания медицинской помощи, а также
оценки их эффективности. Это требует реалистичного цифрового воспроизведения изменчивости всей популяции потенциальных пациентов с учётом особенностей их анамнеза, условий протекания заболевания и ранее назначенной
терапии. Потому для создания синтетических популяций пациентов
в виртуальных клинических испытаниях применяются методы математического
(имитационного) моделирования.
На сегодняшний день получен успешный опыт построения популяционных моделей развития и лечения хронических неинфекционных заболеваний
(ХНИЗ), в том числе сахарного диабета и хронической сердечной недостаточности. Однако для такого социально значимого заболевания, как артериальная
гипертензия (АГ), вопрос до сих пор остается открытым. Это связано, в первую очередь, с недостаточно ясной этиологией АГ. Само заболевание может
развиваться у пациента десятки лет, его патогенез сопряжен с множеством как
эндогенных (например, ожирение), так и экзогенных (стрессы, вредные привычки) факторов. Кроме того, существующие клинические рекомендации предусматривают большое количество вариантов лечения АГ без четких различий
в эффективности терапии. При этом в ходе развития АГ возникают сопутствующие заболевания, реактивно увеличивающие тяжесть ее протекания. Как
следствие, невозможность выделения выраженных причинно-следственных
связей ограничивает применение классических методов моделирования популяционной динамики и требует развития специального математического аппарата на вероятностных основах.
Исследования (S. Polak и A. Mendyk, 2008; J.B. Echouffo-Tcheugui, 2013;
P.L. Teixeira, 2017 и др.) ориентированы на разработку методов моделирования,
направленных на оценку рисков развития АГ у конкретного, изначально здорового человека (а не на создание и манипулирование синтетической популяцией
пациентов). Таким образом, представляются актуальными развитие методического аппарата для математического моделирования популяционной изменчивости и динамики развития АГ, а также разработка методов, направленных на
обоснование тактики и стратегии лечения АГ с учетом индивидуальных особенностей пациентов.
Целью исследования является разработка новых методов математического моделирования возникновения, эволюции и лечения АГ с учетом всевозможных сценариев развития заболевания, что позволит обосновывать тактику и
2
стратегию медикаментозной терапии для различных групп пациентов в популяции.
Задачи исследования:
 обоснование требований к методам моделирования на основе сравнительного анализа решений и оценки применимости клинических рекомендаций
кардиологических сообществ в реальной практике;
 разработка метода моделирования динамики развития популяции больных
АГ в различных временных масштабах;
 разработка метода моделирования процесса лечения пациентов
с диагнозом АГ на основе пациент-ориентированного подхода с учетом
многомерности пространства факторов, влияющих на исход клинической
терапии;
 разработка вычислительных алгоритмов и реализация методов математического моделирования в виде комплекса программ;
 валидация разработанных методов на реальных клинических данных,
а также экспериментальное исследование возможностей их применения,
включая оценку качества и экономической эффективности лечения.
Научная новизна исследования определяется комплексным подходом
к постановке и решению задачи математического моделирования, охватывающим весь жизненный цикл пациента с АГ, на основе системы взаимосвязанных
имитационных моделей демографической изменчивости, развития самого заболевания и сопутствующих патологий, а также лечения с учетом индивидуальных особенностей пациента.
Теоретическая и практическая значимость работы. Теоретическая
значимость работы заключается в разработке и исследовании нового математического аппарата для популяционного моделирования развития ХНИЗ
с неясной этиологией, управляемых большим количеством случайных факторов.
Практическую значимость определяет использование разработанных методов моделирования и программных средств в качестве инструмента для планирования нагрузки на лечебно-профилактические учреждения, для разработки
лечебных и профилактических мероприятий, направленных на снижение рисков осложнения заболевания, для оценки экономической эффективности лечения. В ходе выполнения диссертационного исследования разработаны:
 программный модуль моделирования популяционной динамики больных
АГ, который может служить ядром пациент-ориентированной рекомендательной системы при назначении клинической терапии и выработке профилактических стратегий, а также виртуальных клинических испытаниях;
 программное средство «Симулятор артериального давления» для тестирования производительности и надежности телемедицинских комплексов,
реализующих технологии больших данных.
Методология и методы исследования включают в себя методы теории
вероятностей и математической статистики, имитационного моделирования и
многомерного статистического анализа, методы и алгоритмы машинного обу-
3
чения и интеллектуального анализа данных, а также инженерии программного
обеспечения.
На защиту выносятся:
 метод математического моделирования развития АГ в популяции, формализующий процессы возникновения и первичной регистрации заболевания,
развитие самого заболевания и сопутствующих патологий, а также естественного старения популяции и убыли населения;
 метод математического моделирования процесса лечения пациентов
с диагнозом АГ, позволяющий вырабатывать оптимальные стратегии их
лечения на основе прогнозирования исходов медицинских вмешательств
при различных сценариях терапии.
Степень достоверности научных результатов обусловлена строгостью
формальной постановки задачи, обоснованностью и корректностью применения математического аппарата, а также результатами экспериментальных исследований разработанных методов на фактических данных электронных медицинских карт (ЭМК) пациентов, предоставленных ФГБУ «НМИЦ им.
В.А. Алмазова» Минздрава России.
Использование результатов работы. Результаты работы использованы
при выполнении следующих проектов: Программа повышения конкурентоспособности Университета ИТМО среди ведущих мировых научнообразовательных центров на 2013–2020 гг., № 715788 от 31.03.2015 г. «Информационная технология обеспечения жизненного цикла систем поддержки принятия решений нового поколения для задач персонифицированной медицины»,
2015–2019 гг.; Министерство образования и науки Российской Федерации, Соглашение № 14.575.21.0161 от 26.09.2017 г. «Технология выработки персонифицированных рекомендаций для пациентов с хроническими заболеваниями на
основе гибридного моделирования жизненных процессов» 2017–2019 гг.; Российский фонд фундаментальных исследований, Соглашение № 18-37-00441 от
27.03.2018 г. «Математические модели и интеллектуальные методы предсказательного моделирования мультифакториальных процессов для управления неопределённостью в условиях принятия клинических решений» 2018–2019 г;
ФЦПИР, Соглашение № 14.578.21.0077 от 24.11.2014, шифр 2014-14-579-0133;
ФЦПИР, Соглашение № 14.575.21.0165 от 26.09.2017 (уникальный идентификатор RFMEFI57517X0165).
Апробация результатов. Основные результаты работы обсуждались
на международных и всероссийских конференциях, семинарах и симпозиумах,
включая: «Всероссийский VII Конгресс молодых ученых» (Санкт-Петербург,
2018); «Национальный медицинский инновационный форум «Медицина XXI
века – интеграция знаний на перекрестке наук» (Санкт-Петербург, 2018);
«XLVII научную и учебно-методическую Конференцию Университета ИТМО»
(Санкт-Петербург, 2018); «International Conference on Health and Social Care Information Systems and Technologies» (Барселона, 2017); «XXII СанктПетербургскую Ассамблею молодых ученых и специалистов» (СанктПетербург, 2017); «27th European Meeting on Hypertension and Cardiovascular
4
Protection» (Милан, 2017); «The International Conference on Computational Science (ICCS 2017) «The Art of Computational Science. Bridging Gaps–Forming Alloys» (Цюрих, 2017); «European society of cardiology congress» (Барселона,
2017); «Digital Transformations & Global Society» (Санкт-Петербург, 2016).
Публикации. По материалам настоящего диссертационного исследования опубликованы 4 печатные работы, из них 3 – в изданиях, реферируемых
Web of Science или Scopus, 1 – в журнале из перечня ВАК. Кроме того, 2 работы опубликованы в журналах, реферируемых Web of Science или Scopus, по медицинской тематике.
Личный вклад автора в работах, выполненных в соавторстве,
заключается в: формализации постановки задачи математического моделирования популяционной динамики и обосновании требований к методам моделирования; разработке метода моделирования динамики развития популяции больных АГ; создании метода моделирования процесса лечения пациентов
с диагнозом АГ на основе пациент-ориентированного подхода с учетом многомерности пространства факторов, влияющих на исход клинической терапии;
разработке вычислительных алгоритмов и элементов программной реализации
методов математического моделирования; проведении экспериментальных исследований построенных моделей и участии в интерпретации их результатов.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность исследуемой проблемы и анализируется степень ее разработанности, формулируются цель и задачи исследования, приводятся выносимые на защиту положения, определяющие научную
новизну, теоретическую и практическую значимость диссертационной работы.
Также представлены сведения об использовании результатов работы и их апробации.
В первой главе выполнен аналитический обзор и сравнительный анализ
подходов к математическому моделированию процессов развития и лечения
АГ, а также других ХНИЗ. Обоснована необходимость популяционного моделирования эволюции АГ с учетом всевозможных сценариев развития заболевания для различных групп пациентов, а также лечения больных АГ в рамках пациент-ориентированного подхода. Аргументирована целесообразность применения аппарата вероятностного моделирования при воспроизведении синтетической популяции пациентов для ХНИЗ неясной этиологии.
АГ широко распространена, она играет ведущую роль в причинах сердечно-сосудистых осложнений и смерти во всем мире. АГ является хронической
многокомпонентной нозологией, которая может протекать совместно с другими
заболеваниями, в свою очередь, повышающими степень тяжести АГ. Также АГ
требует пожизненной (в некоторых случаях – в течение десятков лет) медикаментозной терапии. При этом и эффективность антигипертензивного лечения
подвержена влиянию имеющейся у пациента сопутствующей терапии.
В клинической практике единственным объективным показателем для началь-
5
ного обследования пациента, диагностирования АГ и верификации поставленного диагноза является уровень артериального давления (АД): систолического
(САД) и диастолического (ДАД). Измерения АД могут осуществляться посредством следующих методов: офисное измерение, суточное амбулаторное и домашнее мониторирование. Офисное АД представляет собой измерения, проведённые лечащим врачом в клинике во время амбулаторного приёма пациента.
При суточном амбулаторном мониторировании АД к пациенту на 24–25 ч подключается портативный прибор. Как правило, при использовании данного способа АД измеряется: днём каждые 15 мин, ночью – каждые 30 мин. Суточное
амбулаторное мониторирование АД позволяет получать данные об уровне АД в
фазах активности и сна, а также провести количественную оценку вариабельности АД за короткие интервалы времени. Домашнее мониторирование АД проводится в привычных для пациента условиях и выполняется пациентом самостоятельно; данные измерений АД пациент записывает в специальный дневник.
Из доказательной медицины известно, что с увеличением возраста пациентов
возрастает распространенность и тяжесть АГ, обусловленная повышением АД,
что влечет за собой увеличение риска появления и развития сердечнососудистых заболеваний.
В клинической практике больные АГ классифицируются по степени тяжести нозологии: АГ 1-й, 2-й и 3-й степени, а также уровню риска сердечнососудистых осложнений (ССО): низкий (1), средний (2), высокий (3) и очень
высокий (4) риск. Распределение пациентов по степени тяжести АГ осуществляется на основе уровней АД. Классификация по уровню риска ССО производится на основе количественной оценки факторов риска пациента (мужской
пол, возраст, курение, дислипидемия, нарушение толерантности к глюкозе,
ожирение, наследственность) и поражений органов-мишеней. Кроме того, важно отметить, что разные комбинации имеющихся факторов риска и поражений
органов-мишеней могут привести к различным сценариям развития АГ. Как
следствие, необходимо выделять группы пациентов с однородным качественным составом. Кроме того, медицинские исследования классифицируют АГ
как заболевание неизвестной этиологии (причинности), а значит, существуют:
(а) множество факторов, которые могут влиять на процесс появления АГ; (б)
высокая изменчивость в развитии АГ, во многом зависящая от индивидуальных
характеристик пациента. В целом на основе анализа медицинских сведений
можно сделать вывод о том, что развитие АГ невозможно исследовать на основе чисто детерминистических моделей. Необходимо в совокупности рассматривать как причинно-следственные, так и стохастические факторы, влияющие
на возникновение АГ, а также учитывать разнообразие сценариев ее эволюции.
Анализ подходов к моделированию АГ показывает, что, несмотря на эволюционный и многомасштабный характер течения заболевания, рассмотренные
решения фрагментарны, поскольку направлены на краткосрочные задачи диагностики и выявления условий появления АГ. Однако сама задача моделирования динамики АГ гораздо более емка, поскольку должна учитывать
на популяционном уровне:
6

риск первого проявления АГ на основе анамнеза (условий жизни) пациента;
 развитие АГ, с учетом сопутствующих заболеваний (как существующих
независимо, так и вызванных высоким АД), в течение всей жизни пациента;
 влияние медикаментозной терапии (антигипертензивного лечения и дополнительных видов терапии, направленных на лечение сопутствующих
патологий) на эволюцию АГ.
Во второй главе представлен метод популяционного моделирования
процесса развития АГ. Он позволяет воспроизводить следующие взаимосвязанные компоненты исследуемого процесса:
 появление новых случаев АГ в здоровой популяции;
 эволюция популяции больных АГ, включая изменчивость характеристик
цифрового профиля пациента с АГ;
 мелкомасштабная изменчивость АД у больных с АГ в течение суток.
В силу отсутствия значимых причинно-следственных связей, влияющих
на появление и эволюцию АГ, популяционная модель развития этой нозологии
строится непосредственно на данных, в частности клинических данных крупных лечебно-профилактических учреждений, оказывающих медицинскую помощь, в том числе амбулаторный приём и консультирование.
В диссертационном исследовании использована база данных медицинской информационной системы ФГБУ «Национальный медицинский исследовательский центр им. В.А. Алмазова» Минздрава России, содержащая 4 521 ЭМК пациентов, обратившихся с 2010 по 2015 г. за консультацией к специалисту
по причине повышения уровня АД.
Модель возникновения АГ в здоровой популяции строится на основе демографической модели населения. Динамика численности всей популяции заданного возраста τ в произвольный момент времени t с учетом значений прироста и смертности населения каждый год описывается уравнением:
 2 p  2 p
p
 2  2   t ,   ,
t
t
 
1

 pt , 0   at   ,    pt   ,  d ,
0

 pt ,    p  ,
0
 0
 pt ,  n   0.
(1)
Здесь p(t, τ) – численность населения, μ(t, τ) – коэффициент смертности, a(t, τ) –
коэффициент рождаемости, λ – естественный временной интервал, требуемый
для рождения,  – число умерших, [τ0, τ1] – репродуктивный возрастной интервал.
Число больных АГ заданного возраста τ в популяции определяется тремя
факторами:
7
появление новых пациентов (первичная регистрация заболевания АГ);
старение пациентов возраста τ – 1;
убыль пациентов возраста τ – 1 за счет общей смертности.
Если задана общая доля больных АГ в популяции К, то факторы 2 и 3 однозначно рассчитываются с использованием модели (1). Однако для определения новых пациентов в популяции применяется вероятностная модель времени
первой регистрации заболевания, учитывающая различную вероятность проявления АГ у здорового пациента в разных диапазонах возрастов [τ1, τ2], выражаемая через коэффициент пропорциональности κ(t, τ):
1)
2)
3)
h  t2 , τ   h  t1 , τ 
h  t1 , τ 
 κ t, τ 
p  t2 , τ   p  t1 , τ 
p  t1 , τ 
,
(2)
где h(t1, τ), h(t2, τ) – численность популяции пациентов с АГ возраста τ в момент
времени t1 и t2 (t1 < t2) соответственно; p(t1, τ), p(t2, τ) – численность здоровой популяции возраста τ в момент времени t1 и t2 (t1 < t2) соответственно.
Для оценки κ(t, τ) использована эмпирическая функция распределения
времени первого случая регистрации АГ, построенного непосредственно по
данным ЭМК; на рисунке 1(а) приведена ее ядерная оценка. Такая интерпретация порождает оценку сверху, поскольку полагает, что любому человеку преклонного возраста может быть поставлен диагноз АГ. Так, в популяции первое
выявление АГ по медиане, т.е. как минимум у половины пациентов, происходит
с 60 лет, а вероятностный интервал наступления данного события 95 % – от 18
до 77 лет. Распределение времени фиксации диагноза АГ зависит от гендерной
принадлежности пациента: у мужчин АГ может появиться в более раннем возрасте (медиана – 56 лет), чем у женщин (62 года).
В целом построенные функции распределения имеют региональную и расовую специфику. Потому говорить о возможной аппроксимации этих функций
каким-либо аналитическим законом не представляется возможным. Кроме того,
до конца не ясна динамика коэффициента κ(t, τ) относительно времени t, поскольку она обладает долгопериодной изменчивостью в силу изменения общего
уклада жизни населения (экологии, условий жизни и труда, пропаганды здорового образа жизни и пр.). Поскольку в ХХ–начале ХХI века такие изменения
имели масштабы десятилетий, в выражениях (1), (2) далее используется постоянный коэффициент κ(τ), зависящий только от возраста.
Выражения (1), (2) определяют только долю заболевших АГ в предположении однородности популяции. Потому для более детального описания введена вероятностная модель, характеризующая изменчивость цифрового профиля
пациента – многомерной случайной величины, отражающей его личные данные, анамнез, физиологические параметры, а также условия протекания заболевания. Цифровой профиль пациента построен в трёх временных масштабах: (а)
годовом, (б) внутригодовом, (в) внутрисуточном.
8
(а)
(б)
(в)
Рисунок 1 – Характеристики цифрового профиля пациента АГ: (а) функция
распределения вероятности регистрации первого случая АГ (ядерная оценка),
(б) квантильный биплот модельного распределения Вейбулла ИМТ, (в) ядерные
оценки условных плотностей распределения САД в зависимости от пола и возраста
Для идентификации модели цифрового профиля пациента проведена параметрическая аппроксимация распределений каждой группы переменных.
Следует отметить, что допустимо условно считать непрерывными случайными
величинами четыре компонента цифрового профиля пациента: возраст, индекс
массы тела (ИМТ), САД, ДАД; для всех остальных компонентов целесообразно
использовать модель дискретной случайной величины.
9
Рассмотрена модель четырёхмерного распределения F(τ, ИМТ, S, D)
в форме произведения условных распределений (где S, D – временные ряды измерений САД и ДАД соответственно). Это позволяет, зная возраст τ пациента
из модели возникновения АГ и опираясь на свойственные возрасту значения
ИМТ, смоделировать изменчивость АД – двумерной случайной величины
(S, D). Для аппроксимации распределения ИМТ с целью дальнейшего использования его в модели использовано трёхпараметрическое распределение Вейбулла.
На рисунке 1(б) приведен квантильный биплот: видно, что теоретическое
распределение Вейбулла хорошо аппроксимирует эмпирическое распределение
ИМТ вплоть до квантили 90 % (38 кг/м2) и не отражает длинный хвост, связанный с тяжёлыми случаями ожирения. Следует отметить, что при моделировании популяции это допустимо, поскольку все значения ИМТ больше 40 кг/м2
подпадают под определение «очень резкое ожирение» и рассматриваются не
как отражение текущего статуса здоровой жизни пациента, а как патологическое состояние. Потому с точки зрения анализа популяции эти пациенты могут
рассматриваться как выбросы, и выборка естественным образом цензурируется.
Величина ИМТ связана с парой (САД, ДАД). Модельное распределение
САД аппроксимируется условным трёхпараметрическим распределением Вейбулла, причём параметры формы и масштаба функционально зависят от возраста и пола (рисунок 1(в)), а коэффициент сдвига зависит только от гендерной
принадлежности. Для моделирования ДАД используется условное нормальное
распределение, параметры которого линейно зависят от САД. На основе моделирования измерений САД и ДАД дополнительно вводится вероятностная модель внутрисуточной изменчивости АД, позволяющая воспроизвести вариабельность САД и ДАД с детализацией минуты–часы, с учетом двух факторов:
(а) изменения давления во время сна и (б) событий, влияющих на изменение
давления (резкая нагрузка, стресс, алкоголь и пр.).
Для учета различных причин возникновения АГ в процессе моделирования в рамках популяции по модели (1), (2) проведена детализация однородных
групп пациентов путем их кластеризации с помощью алгоритма t-SNE (tdistributed stochastic neighbor embedding). Таким образом, в результате кластеризации в популяции пациентов с АГ выделено восемь кластеров, которые сводятся в четыре базовых класса, допускающих следующую предметную интерпретацию:
 класс I: преимущественно пожилые женщины с высокими уровнем АД и
риском ССО (вследствие наличия ишемической болезни сердца и дислипидемии). Кластеры 1, 2 – разные возрастные группы;
 класс II: пациенты с тяжёлой АГ (высокое АД) и высокой распространённостью нарушений углеводного и липидного обменов. Кластеры 3, 4 – разные возрастные группы и уровень АД;
10

класс III: преимущественно молодые мужчины с отягощённой наследственностью и факторами риска, с поражениями органов-мишеней. Кластер
5;
 класс IV: пациенты с мягкой АГ (АГ 1-й степени, невысокое АД) с факторами риска прогрессирования атеросклероза. Кластеры 6–8 – разные возрастные группы и уровень АД.
С течением времени по мере развития заболевания и старения пациента
с АГ его профиль может меняться. Для описания этого процесса построена вероятностная модель динамики развития АГ на основе отдельных кластеров.
Разработанная модель позволяет учесть динамику развития АГ в форме переходов между дискретными состояниями, характеризующими степень тяжести,
особенности протекания заболевания и возможность появления сопутствующих
заболеваний. При этом сам процесс переходов задается на основе матрицы условных вероятностей в форме простой цепи Маркова.
Пример графа межкластерных переходов приведен на рисунке 2.
Рисунок 2 – Иллюстрация процесса межкластерных переходов
11
Следует отметить, что переходы связаны не только с объективным развитием заболевания, но и с изменением самого диагноза по мере накопления фактов лечащим врачом.
Третья глава посвящена описанию метода математического моделирования процесса лечения пациентов с АГ, который позволяет на индивидуальном уровне вырабатывать эффективные стратегии антигипертензивного лечения с учетом персональных особенностей пациента. Для моделирования процесса лечения АГ введен вероятностный оператор лечения F, прогнозирующий эффективную антигипертензивную терапию по характеристикам пациента
в определенный момент времени:


F : xj1 ti   ...  xjm  ti   y j1 ,..., y jl  .
(3)
Здесь вектор X j (ti )  x j1 ti ,..., x jm  ti , j  1,..., k ; i  1,..., n – множество возможных
характеристик объекта (пациента) Xj(ti) в момент времени ti, k – число пациентов, n – временная точка, m – число характеристик пациента;
Y j ( X j (ti ))  y j1 ,..., y jl  , – множество видов медикаментозной антигипертензивной терапии, назначенной пациенту Xj(ti) в момент времени ti, l – число назначенных препаратов.
Критерием эффективности назначенной антигипертензивной терапии
является максимизация вероятности достижения целевого уровня АД на фоне
приема антигипертензивных препаратов.
s
E ( f , y , x i  )   f k  y k
2
 min .
(4)
k 1
Задача определения структуры оператора рассмотрена в логике построения классификатора, минимизирующего функцию потерь. С этой целью разработана гибридная классификационная модель, которая использует ансамбль деревьев решений для каждого класса антигипертензивных препаратов.
Процедура построения деревьев решений (decision trees) осуществлялась
посредством адаптации CART-алгоритма. Механизм обучения дерева решений
включает в себя следующие этапы.
 генерация обучающего и валидационного наборов данных путем случайного разделения исходной выборки в пропорциональном соотношении 0,75
к 0,25;
 настройка оптимальной глубины дерева решений (процедура редукции дерева решений) методом трехкратного скользящего контроля (3-fold cross
validation);
 оценка качества работы классификатора путем введения характеристических метрик (чувствительность (sensitivity) и специфичность (specificity)).
12
Таким образом, для каждого пациента на основе индивидуальных компонентов его профиля построены классификаторы, являющиеся структурными
элементами модели лечения, которые для пациента каждого класса по выявленным закономерностям определяют вероятности эффективности антигипертензивных препаратов.
Достигнутые показатели качества работы классификаторов представлены
в таблице.
Таблица – Метрические показатели обобщающей способности построенных деревьев решений
Оптимальная
глубина дерева;
метрики качества
Бетаблокаторы
Ингиби-
Антагонисты
торы
рецепторов к
АПФ
ангиотензину II
Антагонисты
Диурети-
кальция
ки
Применение индекса Джини в качестве критерия разделения предикторов
Глубина дерева
4
4
4
4
5
Accuracy
0,63
0,58
0,59
0,56
0,5
Sensitivity
0,62
0,12
0,19
0,33
0,25
Specificity
0,56
0,9
0,92
0,71
0,6
Наиболее значимым для оценки качества разработанных классификаторов является показатель специфичности (specificity). Данные таблицы показывают, что построенная классификационная модель при идентификации неэффективного вида терапии обеспечивает в среднем 74 % точности с использованием не более пяти характеристик (глубина деревьев решений) из множества
профилей пациентов.
Таким образом, на основе построенных бинарных деревьев решений, являющихся структурными элементами классификационной модели, для каждого
класса антигипертензивных препаратов оказалось возможным построить модельные правила для выработки стратегии назначения медикаментозного лечения. Модельные правила представляют собой конъюнкцию наиболее значимых
характеристик пациента и их пороговых значений для непрерывных признаков,
и значений бинарных признаков. Как следствие, модельные правила позволяют
с помощью метода Монте-Карло воспроизвести процесс лечения с учетом вероятностного характера эффективности каждого класса антигипертензивных препаратов.
В четвёртой главе рассматриваются практические вопросы настройки и
использования популяционной модели возникновения, развития и лечения АГ
на основе предложенных методов.
13
Реализация разработанной процедуры популяционного моделирования
включает в себя пять этапов, исполняемых численно. На первом этапе на основе уравнения (1), (2) моделируется общая демографическая обстановка в исследуемом регионе. При этом входными параметрами модели являются демографические характеристики рассматриваемого региона (численность населения,
коэффициенты рождаемости и смертности), а также данные медицинской статистики о возрастной динамике больных АГ, которые используются для определения числа вновь выявленных случаев.
Второй этап процедуры заключается в формировании заданного размера
начальной популяции пациентов с диагнозом АГ в форме ансамбля синтетических цифровых профилей пациентов, реализуемых посредством метода МонтеКарло.
На третьем этапе происходит детализация смоделированной начальной
популяции больных АГ по группам с однородным качественным составом. Затем для пациентов внутри каждого кластера моделируются непрерывные параметры цифрового профиля: количественные значения ИМТ, уровни САД и
ДАД. Далее на основе метода Монте-Карло можно разыграть случаи возникновения сопутствующих заболеваний и как следствие – назначения дополнительной медикаментозной терапии, направленной на лечение вновь выявленных патологий.
На четвёртом этапе процедуры популяционного моделирования воспроизводится эволюция популяции пациентов с АГ на основе построенной вероятностной модели динамики развития АГ. В качестве управляющих переменных
модели эволюции популяции больных АГ определены: обращения новых пациентов, убыль пациентов преклонного возраста вследствие смертности, переходы пациентов из одного кластера в другой по мере прогрессирования заболевания или в случаях изменения с течением времени индивидуальных характеристик профилей пациентов.
На пятом этапе разработанной процедуры моделируется процесс лечения
пациентов из полученной синтетической популяции больных АГ. Важно отметить, что моделирование процесса лечения осуществляется в масштабе всей
популяции, но отдельно для каждого индивида, с учётом персональных особенностей каждого пациента (реального или синтетического). Входными переменными модели лечения являются компоненты цифрового профиля пациента.
В качестве выходных параметров модель возвращает вероятности эффективности различных видов антигипертензивной терапии для пациента.
Общая схема процесса моделирования представлена на рисунке 3.
14
Рисунок 3 – Общая схема процедуры популяционного моделирования
С использованием разработанной модели рассмотрена задача оценки
экономической эффективности лечения артериальной гипертензии, которая
учитывает, что врач, назначающий терапию, может не всегда владеть актуальной информацией об экономической составляющей процесса лечения. Для
этого были собраны и проанализированы данные по среднемесячной стоимости лечения пациента с диагнозом АГ в рамках монотерапии (выборка состоит
из 10 541 пациента, она шире исходной выборка, использованной для построения модели). Частота назначений рекомендованных классов препаратов:
16,6 % – доля пациентов, которым назначены бета-блокаторы; 31,6 % – доля
пациентов, которым назначены ингибиторы АПФ; 32,9 % – доля пациентов,
которым назначены антагонисты рецепторов к ангиотензину II (сартаны);
11,8 % – доля пациентов, которым назначены антагонисты кальция; 7,1 % –
доля пациентов, которым назначены диуретики.
Проведенный анализ показал, что частота назначения дженериков в каждой рассматриваемой группе препаратов преобладает над частотой назначения
15
оригинальных препаратов и имеет тенденцию увеличиваться со временем (причиной этого может являться фактор цены препарата, поскольку стоимость оригинальных препаратов, как правило, многократно превышает стоимость дженериков). Анализ тенденций демонстрирует, что вследствие этого рост среднего
чека на лечение статистически значимо ниже, чем суммарного среднего чека в
рознице. Однако это негативно сказывается на эффективности самого лечения.
Данные особенности формализованы в виде регрессионных соотношений и
включены в общую процедуру моделирования.
Также в четвёртой главе приведено описание программного средства
«Симулятор артериального давления», которое реализует разработанные методы моделирования для тестирования производительности быстродействующей
кластерной системы хранения и обработки сверхбольших объёмов данных в составе телемедицинского комплекса.
ЗАКЛЮЧЕНИЕ
В ходе выполнения диссертационного исследования получены следующие результаты:
 разработан метод моделирования динамики развития популяции больных
АГ в различных временных масштабах;
 разработан метод моделирования процесса лечения пациентов с диагнозом
АГ на основе пациент-ориентированного подхода с учётом многомерности
пространства факторов, влияющих на исход клинической терапии;
 разработаны вычислительные алгоритмы и программная реализация методов математического моделирования;
 проведена валидация разработанных методов на реальных клинических
данных (ЭМК пациентов), а также исследованы возможности их применения для оценки качества и экономической эффективности стратегий лечения.
СПИСОК ПУБЛИКАЦИЙ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ
1. Semakova A., Zvartau N., Bolgova E., Konradi A. Quality of Hypertensive Patients' Electronic Health Records in Specialized Cardiological Centre: 6-year
Trends // Communications in Computer and Information Science. – 2016. –Vol. 674.
– pp. 544–552. (Web of Science/Scopus)
2. Semakova A., Zvartau N., Bochenina K., Konradi A. Towards Identifying
of Effective Personalized Antihypertensive Treatment Rules from Electronic Health
Records Data Using Classification Methods: Initial Model // Procedia Computer Science. – 2017. – Vol. 121. – pp. 852–858. (Web of Science/Scopus)
16
3. Semakova A., Zvartau N. Data-Driven Identification of Hypertensive Patient Profiles for Patient Population Simulation // Procedia Computer Science. –
2018. – Vol. 136. – pp. 433–442. (Web of Science/Scopus)
4. Семакова А.А., Звартау Н.Э., Ковальчук С.В., Бухановский А.В.
Многомасштабное популяционное моделирование процессов развития и лечения артериальной гипертензии // Известия высших учебных заведений. Приборостроение. – 2018. – Т. 61. – № 10. – С. 922–929. (перечень ВАК)
Прочие публикации по теме диссертации
1. Zvartau N., Krikunov A., Semakova A., Bolgova E., Kovalchuk S.,
Boukhanovsky A., Konradi A. Antihypertensive treatment in routine clinical practice
of specialized cardiological centre: six-years trends // Journal of Hypertension. –
2017. – Vol. 35. –No. e-Supplement 2. – pp. e93–e93.
2. Zvartau N.E., Krikunov A.V., Semakova A.A., Bolgova E.V., Kovalchuk
S.V., Bukhanovsky A.V., Konradi A.O. Five-year trends in specific risk factors in hypertensive patients reffered to specialized cardiological centre // European heart journal. – 2016. – Vol. 37. – No. Suppl. 1. – pp. 66–67.
1/--страниц
Пожаловаться на содержимое документа