close

Вход

Забыли?

вход по аккаунту

?

Моделирование и методы статистического анализа пространственной структуры древостоев на основе случайных точечных полей.

код для вставкиСкачать
На правах рукописи
ГРАБАРНИК Павел Яковлевич
МОДЕЛИРОВАНИЕ И МЕТОДЫ СТАТИСТИЧЕСКОГО
АНАЛИЗА ПРОСТРАНСТВЕННОЙ СТРУКТУРЫ
ДРЕВОСТОЕВ НА ОСНОВЕ СЛУЧАЙНЫХ ТОЧЕЧНЫХ
ПОЛЕЙ
Специальность 05.13.18 – Математическое моделирование, численные
методы и комплексы программ
Автореферат
диссертации на соискание ученой степени
доктора физико-математических наук
Петрозаводск — 2013
Работа выполнена в Федеральном государственном бюджетном учреждении науки
Институте физико-химико и биологических проблем почвоведения РАН (г. Пущино)
Научный консультант:
доктор биологических наук, профессор
Комаров Александр Сергеевич
Официальные оппоненты:
Мазалов Владимир Викторович,
доктор физико-математических наук, профессор,
директор Института прикладных математических
исследований Карельского научного центра РАН
Малышев Вадим Александрович,
доктор физико-математических наук, профессор,
заведующий лабораторией больших случайных сиcтем Московского государственного университета
им. М. В. Ломоносова
Логофет Дмитрий Олегович,
доктор физико-математических наук, профессор,
главный научный сотрудник лаборатории математической экологии Института физики атмосферы
им. А. М. Обухова РАН
Ведущая организация:
Государственное научное учреждение Агрофизический научно-исследовательский институт РАСХН
Защита состоится 25 декабря 2013 г. в 11:00 на заседании диссертационного совета
Д212.190.03 на базе ФГБОУ ВПО "Петрозаводский государственный университет"
по адресу: 185910, г. Петрозаводск, пр. Ленина, 33.
С диссертацией можно ознакомиться в научной библиотеке Петрозаводского государственного университета.
Автореферат разослан
2013 года.
Ученый секретарь
диссертационного совета
Р. В. Воронов
3
Общая характеристика работы
Актуальность проблемы. Изучение пространственных взаимоотношений между
взаимодействующими объектами сложноструктурированных многокомпонентных систем является предметом исследования многих научно-естественных и социо-экономических дисциплин. В качестве самостоятельного класса задач можно выделить моделирование случайных систем пространственно распределенных дискретных объектов. Задачи, связанные со свойствами таких случайных систем, решаются методами
стохастической геометрии и теории случайных точечных полей, развитие которых в
значительной степени стимулировалось запросами прикладных исследований. Примерами применения указанных методов являются анализ распределения эпицентров
землетрясений в геофизике, изучение пространственного размещения географических
объектов, анализ пространственной структуры растительных сообществ, моделирование распределения месторождений полезных ископаемых в геологии, моделирование
нейронных сетей в нейрофизиологии, пространственный анализ социо-экономических
систем и многие другие.
Общим для указанных задач является то, что, во-первых, случайные события
происходят в физическом пространстве и, во-вторых, эти события не являются независимыми. Предполагается, что локализация случайных событий в рассматриваемой
области мала и наблюдаемая конфигурация объектов может рассматриваться как
частная реализация случайного точечного поля. Отметим, что для задач, в которых
случайные точки образуют поток событий (на временной оси), существует хорошо
разработанная теория случайных точечных процессов (потоков), которая, как и теория временных рядов, допускает обобщение на случай многомерного параметра. В
отличие от случайных процессов, где имеется естественная упорядоченность событий,
модели случайных точечных полей требуют поиска новых подходов и разработки специальных методов, которые позволяли бы строить и проверять согласие моделей и
экспериментальных данных.
Методы анализа точечных структур тесно связаны со стохастической геометрией,
которая предлагает математические модели для данных, соответствующих точечным
конфигурациям. Примерами таких данных являются карты расположения деревьев
в лесу, местоположения археологических находок, расположение гнездовий птиц и
многие другие объекты в географии, астрономии, биологии, медицине.
Несомненным источником идей для пространственной статистики явились теоретические результаты, наработанные в задачах статистической физики. Модели, которые используют физики, чтобы описать большие молекулярные системы, оказались
достаточно универсальны, чтобы быть полезными для описания пространственных
данных различной природы. Идея использовать микроописание системы взаимодей-
4
ствующих объектов, чтобы предсказать ее макроповедение, успешно реализуется во
многих науках, являясь основой имитационного и статистического моделирования.
Теоретические основы для применения статистических методов, базирующихся
на моделях случайных точечных полей, были заложены в работах Б. Рипли и развиты усилиями представителей немецкой математической школы (Фрайберг, Германия). Важные результаты в области стохастической геометрии и теории случайных
пространственных точечных процессов получены в работах М.Бартлетта, П.Диггла,
Ю.Бесага, Б.Рипли, И. Мекке, Д.Штояна, К.-Х.Ханиша, И. Маттеса, Е. Огаты, Д. Дели, Д. Вери-Джонса, О. Калленберга, Д. Кендалла, Р. Майлза, А. Бэддли, Е.Йенсен,
И. Молчанова, Е. Мёллера и других. Известна своими работами в области стохастической геометрии группа, возглавляемая акад. Р.В. Амбарцумяном в Армении.
Часто полигоном для опробования новых методов стохастической геометрии и
статистического анализа пространственных данных являются задачи лесной экологии. Интерес экологов к математическим методам пространственной статистики обусловлен той значительной ролью, которую играет пространственная структура растительного сообщества в общей структуре функциональных единиц лесной экосистемы.
Изучение пространственной структуры древесного яруса растительных сообществ является важной частью исследования всего комплекса разнообразных взаимодействий
элементов лесной экосистемы. Кроме того, пространственная структура закономерно
связана с процессами, протекающими в растительном сообществе. Неслучайно интерес к изучению пространственной структуры значительно вырос в последнее время,
так как развитие методов анализа данных о пространственной структуре сделало возможным математически строго отвечать на вопросы, которые раньше не могли быть
поставлены в практической плоскости.
Несмотря на значительный прогресс методов пространственной экологии, многообразие и сложность факторов, влияющих на возобновление, рост и отпад деревьев и
приводящих к специфической пространственной организации древостоев, настолько
велики, что построение исчерпывающей системы моделей и методов далеко от завершения. В настоящей работе мы систематизируем модели и методы, которые могут
быть использованы для изучения особенностей пространственной структуры популяций и сообществ растений, и предлагаем ряд новых инструментов теоретического
характера, существенно расширяющих палитру методов математического моделирования.
Необходимо подчеркнуть роль компьютерных вычислений в методах стохастической геометрии и статистического анализа пространственных данных. В последние
два десятилетия с увеличением мощности компьютеров и их большей доступностью
растет интерес к применению компьютерных программ для реализации статистиче-
5
ских методов и методов стохастической геометрии. Причем, компьютерные методы
используются не только в их традиционном амплуа, на стадии анализа данных, но и
для изучения свойств математических объектов, где теоретические инструменты либо слишком грубы, либо просто отсутствуют. Более того, такие программы особенно
важны, когда исследуют свойства реальных систем и, следовательно, упрощающие
предположения могут быть слишком ограничительны. В настоящее время имеется
ряд пакетов программ, которые включают методы анализа пространственных данных и моделирования пространственных систем, однако далеко не все разработанные
методы доступны потенциальным пользователям.
Таким образом, три взаимосвязанные проблемные области: модели случайных
точечных полей и статистические методы, основанные на этих моделях, математическое моделирование популяций растений как системы взаимодействующих объектов,
а также программные средства, необходимые для реализации новых методов моделирования, являются активно развивающимися областями исследования и определяют
актуальность настоящей работы.
Цель работы. Целью работы является развитие методов стохастической геометрии, включающие вероятностно-статистические модели, описывающие различные
особенности пространственной структуры случайных точечных систем, а также разработка эффективных процедур анализа пространственных данных и применение их
для анализа различных экологических проблем.
Задачи исследования.
В диссертации были поставлены и решаются следующие задачи:
1) в рамках направления, связанного с анализом пространственной структуры
растительных сообществ, разработать методы и классы моделей, описывающих случайные системы пространственно распределенных взаимодействующих объектов, которые в наибольшей степени отвечают характеристикам природных систем;
2) предложить и изучить свойства статистических процедур диагностики пространственной структуры, которые учитывают особенности пространственной структуры одновозрастных и разновозрастных многовидовых популяций древесных растений;
3) предложить вероятностно-статистические модели, позволяющие учесть иерархию взаимодействия объектов в системе, и разработать теоретические аспекты моделирования пространственно распределенных систем локально взаимодействующих
объектов, включающих как симметричное так асимметричное взаимодействие;
4) разработать методы параметрического оценивания для моделей случайных точечных полей с локальным взаимодействием и изучить их свойства;
5) разработать методы проверки согласия моделей случайных точечных полей с
6
учетом возможных альтернатив;
6) разработать комплекс программных средств, реализующий методы моделирования и статистического анализа пространственно распределенных точечных систем.
Методы исследования. В работе используются методы стохастической геометрии и случайных точечных полей; методы теории оценивания и проверки гипотез;
базовые положения популяционной экологии растений. Для численного исследования
свойств алгоритмов обработки данных применяются методы статистического моделирования. Для реализации алгоритмов используются среды и языки программирования
С, C++, R.
Научная новизна.
1. Предложены модели случайных точечных полей с локальным взаимодействием, вероятностная структура которых управляется небольшим числом параметров и
которые способны воспроизводить широкий спектр регулярных, кластерных и смешанных регулярно-кластерных точечных конфигураций.
2. Впервые предложены модели, способные описывать и анализировать пространственную структуру с учетом асимметричного взаимодействия между объектами.
3. Предложен новый класс процедур оценивания параметров моделей случайных
точечных полей в условиях, когда метод максимального правдоподобия не может быть
применен непосредственно, изучены свойства оценок параметров вероятностных моделей, получаемых новым методом.
4. Разработан метод оценивания параметров случайных точечных полей, допускающий реализацию с помощью стандартных пакетов программ.
5. Разработан статистический критерий, обобщающий классический критерий
Пирсона хи-квадрат, для проверки гипотезы полной пространственной случайности.
Новый критерий обладает большей мощностью, чем статистические критерии, известные в литературе, когда в качестве альтернативы рассматриваются точечные поля,
проявляющие регулярно-кластерных свойства.
6. Впервые задачи проверки согласия модели и пространственных данных рассмотрены с позиций задачи проверки нескольких гипотез одновременно. Предложен
метод контроля вероятности ошибки первого рода для критерия, основанного на построении области типичности функционалов от реализаций случайного точечного поля.
Основные положения и результаты, выносящиеся на защиту:
1) Предложен и исследован класс моделей, описывающих пространственно распределенные системы взаимодействующих объектов, применимый к широкому кругу
задач, возникающих в популяционной экологии растений. Изученные в работе маркированные гиббсовские точечные поля используются как в качестве описания простран-
7
ственной структуры растительного сообщества, так и в качестве моделей, позволяющих воспроизводить специфические особенности взаимного расположения деревьев с
учетом сложных механизмов взаимодействия между соседними деревьями.
2) Модели гиббсовских точечных полей применимы для анализа большого разнообразия точечных конфигураций и допускают изучение в рамках наиболее информативного подхода, основанного на анализе функции правдоподобия. Предложенные
новые методы оценивания параметров моделей случайных точечных полей применимы в ситуациях, когда модель не может быть полностью специфицирована.
3) Естественная иерархия пространственных взаимоотношений растений описана в рамках пространственных моделей с локальным взаимодействием с помощью
нового класса многомерных точечных процессов с иерархическим потенциалом взаимодействия.
4) Потеря мощности критериев значимости, описанная в литературе, когда точечный паттерн имеет смешанные регулярно-кластерные свойства, может быть устранена с помощью применения критериальной статистики пирсоновского типа, которая
обобщает классический тест хи-квадрат на случай зависимых данных.
4) Разработанные методы диагностики моделей гиббсовских точечных полей, а
также проверки согласия моделей и данных позволяют выдвигать и проверять биологические гипотезы на основе экспериментальных данных.
Теоретическая и практическая значимости работы. Статистические методы случайных точечных полей – активно развивающаяся область теории вероятностей и математической статистики. Описанные в диссертационной работе методики являются вкладом в развитие теоретических и прикладных аспектов стохастической геометрии и пространственной статистики. Методы построения и идентификации
вероятностно-статистических моделей, предлагаемых в диссертационной работе, расширяет инструментарий исследователя, позволяя анализировать различные классы
моделей, учитывающие специфические характеристики объекта.
Разработанные алгоритмы и статистические методы имеют практическую ценность для анализа экспериментальных данных, получаемых в ходе натурных исследований. Программная реализация методов оформлена в виде пакета программ и получено свидетельство о государственной регистрации программ SPPS (Spatial Point
Pattern Statistics) – программный комплекс моделирования и анализа точечных структур. Кроме того, некоторые программы были включены в пакет программ Spatstat
(http://www.spatstat.org). Разработанные программы используются в учебном процессе и научной работе ряда учреждений (биологический факультет МГУ, Центр по
проблемам экологии и продуктивности лесов РАН, Институт леса им. В. Н. Сукачëва
СО РАН, Пущинский государственный естественно-научный институт).
8
Апробация работы. Основные результаты диссертации были доложены на многих международных и всероссийских конференциях, а также выносились на семинары с участием специалистов - мировых лидеров в данной области. Список (с 2000 г.)
конференций и семинаров, выступление на которых с устными докладами входили в
программу и были заслушаны участниками, включает:
International Conference on Spatial Statistics in the Agro-Bio- and Geosciences (Фрайберг, Германия, 2000),
11th International Workshop on Stereology, Stochastic Geometry and Related Fields
(Перт, Австралия, 2001),
International Workshop on "Spatial Statistics, Image Analysis and Signal Processing
Within Bioscience and Thechnology",̇ (Смоген, Швеция, 2004),
5th European Conference on Ecological Modelling (Пущино, Россия, 2005),
International Conference on Stochastic Geometry and its Applications(Берн, Швейцария, 2005),
1-я Международная конференция "Математическая биология и биоинформати˙
ка"(Пущино,
2006),
International Workshop on Spatial and Spatio-temporal Modelling in Biology, Ecology
and Geosciences (Смоген, Швеция, 2006),
International Workshop on Stochastic Geometry, Spatial Statistics and their Applications
(Райзенбург, Германия, 2007)
III Всероссийская научная конференция "Принципы и способы сохранения биоразнообразия" , (Пущино, 2008),
2-я Международная конференция "Математическая биология и биоинформатика" (Пущино, 2008),
Национальная конференция "Математическое моделирование в экологии" (Пущино, 2009).
Большой семинар кафедры теории вероятностей (рук. ак. А.Н. Ширяев), МГУ,
(Москва, 2010).
International conference "Spatial Statistics 2011- Mapping Global Change"(Эншеде,
Голландия, 2011)
Большой семинар Института Стохастики (рук. проф. Д. Штоян), Технический
университет, (Фрайберг, Германия, 2011)
II Национальная конференция "Математическое моделирование в экологии" (Пущино, 2011)
7th International Conference on Stereology, Spatial Statistics and Stochastic Geometry
(Прага, Чехия, 2012)
3-я Международная конференция "Математическая биология и биоинформати-
9
ка" (Пущино, 2012),
Поддержка работы грантами:
Грант РФФИ №04-01-00622-а "Статистическое моделирование систем случайных
множеств с локальным взаимодействием и его применение в экологии" , 2004–2005,
руководитель.
Грант РФФИ №12-04-01527-а "Разработка моделей пространственно-временной
структуры лесных экосистем" , 2012–2014, руководитель.
Hong Kong Research Council, проект "Goodness of fit testing the complete spatial
randomness against mixtures of regular and clustered spatial point processes" , 1998, исполнитель, руководитель С. Чиу (S.N. Chiu).
Australian Research Council, проект "Extrapolating and interpolating of spatial patterns" ,
2001–2002, исполнитель, руководитель А.Бэддли (A. Baddeley).
INTAS проект 01-0633 "Silvicultural Systems for Sustainable Forest Resource Management"
(SILVICS), 2001-2005, исполнитель, руководитель с российской стороны А.С. Комаров.
The Royal Swedish Academy of Sciences, Research Grant Programme, проект "Bayesian
analysis of spatial point patterns evolving in time 2005–2007, со-руководитель.
DAAD (Германия), программа "Научные стажировки ученых" , проект "Computerintensive methods in Stochastic Geometry" 2006, со-руководитель.
Публикации. Основные работы, изданные в реферируемых журналах, в которых отражены результаты диссертации: [1–16]. К тематике диссертации относятся
также работы [17–26], соответствующие главам в монографиях, публикациям в сборниках статей и трудах конференций.
Личный вклад автора. Все работы, в которых отражено основное содержание
диссертации, за исключением [1-2], инициированные соавтором (проф. Д. Штояным),
были спланированы при прямом участии автора. Автору принадлежат постановки задач, разработка и участие в программной реализации алгоритмов, доказательство теорем, анализ данных и интерпретация результатов, а также основной вклад в оформление текстов статей. В работах [5] и [12] основной соавтор являлся аспирантом. В
работах [3], [6], [9], [12] соавторы отвечали за биологическую составляющую работы.
В работе [1] автору принадлежит теорема о связи функции условной интенсивности и
корреляционной функции точечного поля и идея использовать конструкцию специального маркирования для задачи определения сходимости алгоритмов к стационарному
состоянию и диагностики моделей. В работе [4] автору принадлежит утверждение о
связи методов оценивания и получение представления функции псевдо-правдоподобия
для точечных полей. В работе [16] доказательство первой теоремы получено соавтором, доказательство других утверждений получено совместно.
Структура и объем диссертации. Диссертация состоит из введения, 8 глав,
10
приложения и списка литературы из 222 наименований. Полный объем диссертации
(без приложения) – 263 страницы.
Содержание работы
Во введении сжато изложено обоснование исследования: дан краткий исторический
обзор, обоснована актуальность диссертационной работы, сформулирована цель и раскрыта научная новизна исследований, показана теоретическая и практическая значимость полученных результатов, представлены выносимые на защиту научные положения.
Глава 1. Обзор методов и моделей случайных точечных полей
В первой главе мы определяем, даем характеризацию и приводим примеры
центрального понятия, которое будет использовано во всех частях данной работы,
случайного точечного поля. Для статистических задач, которые оперируют наблюдаемыми данными, в большинстве случаев можно ограничиться конечными случайными
полями. В некоторых ситуациях в изложение включены технически более сложные
модели полей, заданных на неограниченных множествах. Данная глава носит справочный характер, вводя необходимые определения. В частности, мы определяем меры
Кэммбелла, распределение Пальма, моментные меры, меру условной интенсивности,
рассматриваем связь между различными характеризациями условных распределений,
и даем сводку основных операций, которые позволяют конструировать новые модели из базовых. Далее рассматриваются типичные модели случайных точечных полей,
среди которых особое внимание уделяется конечным полям, заданных плотностью
относительно пуассоновского точечного поля, – гиббсовским точечным полям.
Случайные точечные поля (или пространственные точечные процессы) служат
естественными моделями пространственных данных, которые представляют собой конфигурации точек. Часто такие данные называются точечными множествами или точечными паттернами (паттерн здесь означает структурированное точечное множество, обладающее определенным рисунком). Геометрический взгляд на вероятностную
модель представляется оправданным с точки зрения многочисленных приложений, в
которых наблюдению доступны местоположения всех точечных объектов.
Во многих приложениях удобно работать с расстояниями между точками, поэтому мы предполагаем, что пространство S, где могут располагаться точки, снабжено
метрикой. В общем случае будем предполагать, что пространство S является польским, т.е. метрическим полным сепарабельным пространством. Обозначим через B
борелевское σ-поле, порожденное открытыми множествами в S. Кроме того, интерес
будет представлять σ-алгебра ограниченных множеств из S, которую мы обозначим
11
B0 , т.е. B0 ⊂ B. Мы предполагаем, что пространство S снабжено сигма-конечной
мерой ν, в частном случае евклидова пространства Rd это может быть лебегова мера.
Предполагается, что точечные конфигурации x = {x1 , x2 , . . . , xi , . . .}, где xi ∈ S,
являются локально конечными. Под конфигурацией понимается множество неупорядоченных точек. Будем обозначать через X множество всех точечных конфигураций
X = {x ⊂ S : n(xB ) < ∞, B ∈ B0 }, где n(xB ) обозначает число точек в множестве
x ∩ B. В частности x = ∅ будет соответствовать "вакуумной" конфигурации, то есть
конфигурации с нулевым числом точек n(xB ) = 0. Если само пространство S ограничено или число всех точек любой конфигурации конечно, т.е. n(xS ) < ∞, то тогда
точечное поле называется конечным.
Далее будем предполагать, что S = D, где D ⊂ Rd . Обозначим x = {x1 , . . . , xn }
конфигурацию точек xi ∈ D, где n может быть произвольным целым неотрицательным числом, и случай n = 0 соответствует конфигурации без точек x0 .
Рассмотрим конфигурации xn , для которых n фиксировано. Пусть X(n) есть множество всех конфигураций с n точками, и рассмотрим конфигурационное простран∞
S
ство, состоящее из всех возможных точечных конфигураций X =
X(i) . Обозначим
i=0
через F (X) наименьшую σ-алгебру, содержащую F0 , F1 , . . . , где Fi = B(Xi ). Пусть
(Ω, A , P) - вероятностное пространство.
Определение. Случайное (конечное) точечное поле есть измеримое отображение
X : Ω → X из (Ω, A ) в (X, F (X)). Вероятностная мера PX на (X, F (X)), индуцируемая случайной величиной X и порождаемая вероятностной мерой P, называется
распределением случайного точечного поля X.
Определим меру Лебега-Пуассона на (X, F (X)) как
Z
Z
∞
X
1
µ(F ) = 1(x0 ∈ F ) +
···
1{(x1 , . . . , xn ) ∈ πn−1 F }ν(dx1 ) · · · ν(dxn ), F ∈ F ,
n!
D
D
n=1
где πn : Dn → X(n) . Нормированная мера PX = e−ν(D) µ определяет пуассоновское
точечное поле на D, которое называется стандартным и обозначается ΠD (1), где
число соответствует единичной интенсивности точек.
Стандартное пуассоновское поле является отправной точкой для построения большого числа других моделей. Заметим, что конечные точечные поля являются основой
многих моделей, где требуется вычисление характеристик, зависящих от вероятностного распределения. Важным примером здесь являются модели в гиббсовской форме,
которые рассматриваются в этой работе. Кроме того, экспериментальные данные и
компьютерные вычисления оперируют конфигурациями конечного размера и, следовательно, в вычислительных процедурах используются именно модели конечных
точечных полей.
12
Условные распределения, связанные с точечными полями.В изучении случайных
точечных полей часто возникают задачи, связанные со свойствами распределений,
условных относительно одной или несколько точек точечного поля. Типичным примером является вопрос о вычислении распределения расстояния от произвольной точки
случайного точечного поля до ближайшей к ней точки поля. На произведении измеримых пространств (Rd × X, B ⊗ B(X)) вводится мера, называемая мерой КэмпP
белла C(B × F ) = E[ Xi ∈X 1{Xi ∈ B}1{X ∈ F }] для всех B ∈ B и F ∈ B(X).
Поскольку C(B × F ) ≤ EX(B) = Λ(B), где мера интенсивности Λ(·) существует и
σ-конечна, то мера C(· × F ) абсолютно непрерывна относительно меры Λ(·), и по теореме Радона-Никодима существует плотность, которая является измеримой функцией
P(·) (F ) : Rd → R+ , определенной единственно до Λ-нуль множества. При фиксированном x ∈ Rd Px (·) есть вероятностная мера, которая называется распределением
Пальма точечного поля X в точке x.
В концепции, двойственной распределению Пальма, предлагается вычислять локальную интенсивность появления точек при условии, что вне локальной области точечное поле имеет заданную конфигурацию. Эта идея реализуется с помощью меры
условной интенсивности Папангелу. Пусть X – случайное точечное поле. Предположим, что для любого ограниченного борелевского множества B ∈ B0 мера Кэмпбелла
C(·×·) абсолютно непрерывна относительно распределения точечного поля P(·), тогда
имеет место соотношение C(B × F ) = E[Λ∗ (B, X)1{X ∈ F }], где плотность Λ∗ (·, x)
есть локально конечная борелевская мера, которая называется ядром Папангелу. На
практике значительно более удобной оказывается работа с локальной версией ядер Папангелу – функцией условной интенсивности λ∗ : S × X → R+ , которая определяется
(если существует) из соотношения, которое называется формулой Нгуена-Цессина:
E[
X
Z
g(Xi , X \ Xi )] =
Xi ∈X
E[g(x, X)λ∗ (x, X)]dx,
S
для любой измеримой неотрицательной интегрируемой функции g. Это уравнение
является основой методов оценки параметров случайных гиббсовских точечных полей.
Модели случайных точечных полей. Предметом изучения в данной работе являются вероятностно-статистические свойства разнообразных точечных полей, которые
используются в задачах стохастической геометрии для описания больших систем геометрических объектов, структура которых не может быть описана в рамках детерминистических моделей. В первой главе приводится описание наиболее употребительных
моделей, которые находят применение в задачах анализа пространственной структуры экологических и биологических систем.
Однородное точечное поле Пуассона является фундаментальной моделью в стоха-
13
стической геометрии. В большом числе случаев, отправляясь от этой модели, удается
получить теоретические результаты, и, кроме того, она играет роль эталонной модели, относительно которой рассматриваются многие другие модели. Точечное поле
Пуассона формализует представления о "совершенной" случайности, что выражается
в отсутствии определенной структуры у множества точек, образующих реализацию
данного точечного поля.
Модели, учитывающие неоднородность распределения ресурсов, и модели возобновления. Для природных процессов характерна пространственная вариабельность,
которая обусловлена неоднородностью распределения того или иного ресурса по территории и которая не может быть описана взаимовлияниями, действующими на расстояниях сопоставимыми с размерами объектов. Например, топографическая или почвенная вариабельность могут приводить к формированию растительных сообществ,
отличающихся по составу, биометрическим характеристикам и т.д. Эти отличия, как
правило, проявляются не резко, а нарастают постепенно. В этом случае удовлетворительными моделями являются случайные поля Кокса.
Кластерные случайные точечные поля. Пространственная структура древостоя с
возобновлением может быть описана моделями случайных точечных полей кластерного типа, в котором группа деревьев, образующих кластер, рассматривается как совокупность "потомков" некоторого "родительского" дерева. Кластерное точечное поле
можно рассматривать как случайное точечное поле (обычно пуассоновское) центров
кластеров (или "родительское" точечное поле) и точечное поле "потомков" , т.е. с
каждой точкой "родительского"поля связана независимая копия точечного поля "потомков" . Таким образом, кластерное точечное поле представляет собой суперпозицию
точечных полей "потомков" .
Модели, заданные плотностью относительно пуассоновского точечного поля,
являются гибким и мощным инструментом исследования систем точечных объектов.
Многие авторы отмечали закономерные изменения пространственной структуры лесной экосистемы, прослеженной в течении длительного времени. Если пространственная структура древостоя на этапе начального заселения характеризуется кластерными
свойствами, то для зрелого древостоя тип размещения можно описать как регуляризованный. Класс моделей, заданный плотностью относительно пуассоновского точечного поля, позволяет описывать широкий спектр типов размещений, и, следовательно,
изменение типов размещения отражается в соответствующем изменении параметров.
Пусть PΠ – распределение пуассоновского точечного поля X ∼ Π. Мы будем
рассматривать конечные точечные поля X, которые имеют плотность p : X → [0, ∞)
относительного пуассоновского точечного поля PΠ , называемого "свободной" мерой,
R
P(X ∈ F ) = F p(x)dPΠ (x).
14
Важный вопрос, который возникает в связи с классом точечных полей, заданных плотностью относительно пуассоновской меры, – это условия, которым должна
удовлетворять функция плотности, чтобы обеспечить существование заданного ею точечного поля. Следующие условие являются достаточными, чтобы плотность p была
Π-интегрируема. Неотрицательная измеримая функция p : X → [0, ∞) называется
стабильной (по Рюэлю), если существует константы K > 0 и c > 0 такие, что для
всех конфигураций x ∈ X выполняется p(x) ≤ cK n(x) .
Класс случайных точечных полей, заданных положительной плотностью относительно пуассоновской меры, совпадает с классом так называемых гиббсовских
точечных полей на ограниченном множестве. Гиббсовские точечные поля впервые
были введены в статистической физике, где они использовались для описания систем
взаимодействующих объектов. Этим обстоятельством объясняется терминология, используемая для определения данных моделей. Так, отрицательный логарифм ненормализованной функции плотности U (x) = − ln p(x)/p(∅) называется полной энергией
системы или гамильтонианом. Отрицательный логарифм функции условной интенсивности E(u, x) = − ln λ∗ (u, x) называется локальной энергией. Заметим, что функция плотности вероятности определена с точностью до нормирующего множителя,
который не может быть выписан в явном виде за исключением простейших моделей.
В статистической физике нормирующий множитель плотности распределения называется статистическая сумма, исследованию которой посвящено большое количество
работ.
Для многих задач, в частности, для моделирования пространственной структуры
растительного сообщества гиббсовское описание вероятностного распределения оказывается достаточно удобным. Модельные представления, описывающие тип размещения объектов в терминах взаимодействий между объектами, достаточно хорошо соответствуют реальности, поскольку под взаимодействием может пониматься влияние,
которое соседние деревья оказывают друг на друга, в частности, через перераспределение доступного ресурса.
Марковские точечные поля. Наибольший интерес с точки зрения приложений
представляют гиббсовские точечные поля, распределение которых связано с некоторой структурой соседства, определенной для точек конфигураций. В то же время
можно показать, что отношение соседства позволяет ввести класс марковских точечных полей, который совпадает с классом гиббсовских точечных полей, специфицированных такой же системой отношений между соседними точками. Эта связь между
глобальным и локальным описанием случайных систем составляет содержание теоремы Аверинцева-Хаммерсли-Клиффорда, первоначально доказанной для случайных
полей на графах.
15
Глава 2. Модели маркированных гиббсовских точечных полей
Вторая глава посвящена описанию класса моделей гиббсовских точечных полей, который находит применение для анализа более общего типа пространственных
данных – точечных конфигураций, в которых точки снабжены марками. Многие природные системы пространственно распределенных объектов могут быть описаны с помощью моделей маркированных точечных полей. Так, в популяционной экологии растений анализ взаимодействия растений двух и более видов является одной из важнейших задач, позволяющий приблизиться к пониманию проблемы устойчивости ценозов.
Большой интерес также представляет задача оценки конкурентных взаимоотношений
между растениями, которые зависят как от их взаимного расположения (пространственный аспект), так и от размерных характеристик индивидуальных особей с учетом
расстояния между ними, что может быть прослежено с помощью пространственной
корреляции. Использование марки в качестве переменной, соответствующей характеристике биомассы дерева, например, диаметру ствола, высоте дерева или площади
кроны, позволяет моделировать конкурентные взаимоотношения между растениями
в сообществе.
Более того, структура самих марок может быть довольно сложной, например,
соответствовать размеру и форме геометрических фигур. Тем самым, модели маркированных гиббсовских полей могут быть использованы для анализа геометрических
случайных систем, к которым относятся, например, поля случайных отрезков, поля
непересекающихся кругов и т.д. Указанные стохастические модели пространственно
распределенных геометрических объектов могут служить средством описания свойств
горизонтальной структуры древостоя при моделировании отклонения центров крон и
анализа геометрического рисунка проекций крон [3].
В разделе 2.1 вводится формальная конструкция (конечных) маркированных
гиббсовских точечных полей, и даны некоторые примеры, соответствующие различным типам марок. В разделе 2.2 описывается модель марковского точечного поля
относительно маркированных соседей. В разделе 2.3 мы описываем предложенный
нами в [5] метод оценивания, основанный на функции псевдо-правдоподобия, который обобщает метод максимального псевдо-правдоподобия [4] на случай маркированных точечных полей. Далее, в разделе 2.4 изучаются статистические свойства оценок,
получаемых методом максимального псевдо-правдоподобия, в случае гиббсовского точечного поля с двумя типами точек. Раздел 2.5 посвящен специальной модели маркированных точечных полей - взаимодействующим дискам, которая была применена
для анализа закартированных данных древостоя.
Пусть D ⊂ Rd и ν(D) < ∞, и B(D) – σ-алгебра борелевских множеств, ν –
мера Лебега. Пусть (L, L , κ) – измеримое пространство марок. Пространство марки-
16
рованных точек есть произведение D × L, соответствующая σ-алгебра обозначается
B(D) ⊗ L , и мера – µ ⊗ κ. Часто в качестве пространства марок L выбирается (конечное) дискретное множество или интервал L ⊂ R. Чтобы подчеркнуть неравноправность каждого из пространств, будем называть элементы пространства D точками, L
– марками, и D × L – маркированными точками, которые будем обозначать [x, l]. Наконец, множество маркированных точек xhli = {[x1 , l1 ], [x2 , l2 ], . . . , [xn , ln ]} будем называть маркированными точечными конфигурациями. Условие локальной конечности
для точечных конфигураций влечет, что число маркированных точек n(xhli ∩ D × L)
любой маркированной конфигурации xhli конечно.
Предположим, что точки конфигурации xhli , не могут совпадать, т.е. xi 6= xj ,
если i 6= j, тогда пространство реализаций маркированного точечного поля X hli есть
множество всех маркированных точечных конфигураций Xhli . Обозначим B(Xhli ) наименьшую σ-алгебру, которая порождается отображениями xhli 7→ n(xhli ∩ B × L), где
B ⊂ D и L ⊂ L.
Пусть Λp – мера интенсивности точечного поля на D и M – распределение марок.
Соответственно, мера интенсивности маркированного поля с независимыми марками
есть Λm = Λp ⊗ M .
Определение. Случайное маркированное точечное поле X hli называется маркированным гиббсовским точечным полем с энергией U , если его распределение P на
(Xhli , B(Xhli )) удовлетворяет соотношению
Z
hli
hli
g(x )P (dx ) =e
Xhli
−Λm (D)
Z
Z
∞
X
1
[1 +
· · · g(πn ([x1 , l1 ], . . . , [xn , ln ]))
n!
n=1
1
exp(−U (πn ([x1 , l1 ], . . . , [xn , ln ])))Λm (d[x1 , l1 ]) . . . Λm (d[xn , ln ])],
Z
где g – измеримая неотрицательная функция, Z – нормирующая константа, и измеримая функция U : Xhli → (−∞, ∞] должна удовлетворять условию наследственности,
а именно, если yhli ⊂ xhli , тогда из U (yhli ) = ∞ следует U (xhli ) = ∞, и, кроме, того
U (∅) = 0.
Преимущество экспоненциального представления плотности связано с тем, что
функция полной энергии U может быть представлена как сумма потенциалов взаимодействия Φ, т.е.
U (xhli ) =
X
Φ(yhli ),
yhli ⊆xhli
где Φ : Xhli → (−∞, ∞] измеримая функция с Φ(∅) = 0. Функция потенциального
взаимодействия описывает вклад каждого из подмножеств маркированных точек в
полную энергию системы. На практике в качестве модели часто используют маркированное гиббсовское поле с парным взаимодействием.
17
Оценивание параметров маркированного гиббсовского точечного поля является
одной из важных задач анализа данных. Некоторые способы обойти основную трудность, связанную с оцениванием параметров гиббсовских моделей, – отсутствию аналитического выражения для нормирующей константы – были предложены нами в
работах [2] и [4]. В этих работах рассматривались параметрические модели гиббсовских точечных полей без марок. В [5] был предложен метод максимального псевдоправдоподобия для оценки параметров маркированного точечного поля. Нами было
указано, что основой метода является интегральная характеризация маркированного
гиббсовского точечного поля, аналогичная формуле Нгуена-Цессина.
Теорема. Маркированное точечное поле X hli является гиббсовским точечным
полем тогда и только тогда, когда для всех неотрицательных измеримых функций
g : D × L × Xhli → [0, ∞)
Z
X
Xhli
g(x, l, xhli \ [x, l])P (dxhli )
=
[x,l]∈xhli
Z Z
D
g(u, l, xhli )λ∗ (u, l, xhli )P (xhli )Λm (d[u, l]),
Xhli
где λ∗ (u, l, xhli ) – условная интенсивность точечного поля X hli , а Λm (d[u, l]) – мера интенсивности маркированного пуссоновского поля, взятого в качестве свободной меры.
Часто пользуются логарифмической формой условной интенсивности E(u, l, xhli ) =
− ln λ∗ (u, l, xhli ), которую называют локальной энергией, и неизвестные параметры θ,
которые следует оценить, входят в параметрическое выражение локальной энергии
E = Eθ , θ ∈ Ω ⊂ Rp , где Ω – пространство параметров.
В работе [5] была введена функция (логарифма) псевдо-правдоподобия
ln P L(θ; xhli ) = −
X
Eθ (x, l, xhli \ [x, m])
[x,l]∈xhli
Z Z
−
D
exp(−Eθ (u, t, xhli ))M (dt) du.
L
Оценка максимального псевдо-правдоподобия (МПП) есть значение векторного параметра θ, при котором функция псевдо-правдоподобия достигает максимума,
P L(θ̂) = supθ∈Ω P L(θ; xhli ).
Статистические свойства оценок максимального псевдо-правдоподобия изучались в ряде работ. Наличие состоятельности дает основания для применения метода
максимального псевдо-правдоподобия в случае больших выборок. В то же время информация о свойствах оценок максимального псевдо-правдоподобия для конечных
размеров выборок и точности оценивания в случае типичных объемов данных представляет значительный интерес. В работе [4] были представлены результаты обшир-
18
ного вычислительного эксперимента, где сравнивались различные методы оценивания
параметров немаркированных моделей гиббсовских точечных полей. Мы пришли к заключению, что метод максимального псевдо-правдоподобия дает оценки приемлемого
качества, кроме тех случаев, где модели соответствовали сильным взаимодействиям
между точками. В работе [5] представлены результаты сходного эксперимента, в котором изучались свойства оценок для параметров моделей маркированных гиббсовских
моделей. В [5] для сравнения свойств оценок был использован метод, который основан
на аппроксимации функции правдоподобия кластерными интегралами второго порядка. Эксперимент показал существенное преимущество метода псевдо-правдоподобия.
Гиббсовские модели с непрерывными марками. Важный в экологическом контексте пример маркированных гиббсовских точечных полей дает модель взаимодействующих дисков [5]. Эта модель представляет собой точечное поле, реализациями которого являются маркированные конфигурации точек, причем в качестве марки здесь
выступает радиус диска (или шара). Диск B(xi , Ri ) может интерпретироваться как
жизненное пространство, связанное с деревом, расположенном в точке xi , и радиус
диска Ri , соответствует размеру дерева и является количественной характеристикой
ресурсной области, которая необходима дереву для получения элементов питания для
его жизнедеятельности. Множество Ξ = ∪i B(xi , Ri ), таким образом, может интерпретироваться как область, которая освоена растительным сообществом в целом на
территории D. В частности, отношение |Ξ|/|D| имеет отношение к лесотехническому
понятию полноты древостоя.
При моделировании пространственной структуры древостоя естественно предполагать, что взаимодействуют только соседние деревья. Дополнительное предположение состоит в том, что отличны от нуля только парные потенциальные функции взаимодействия, которые могут быть выбраны в форме Φ(x, y, m, l; θ) = θ1(||x − y|| ≤ m +
l),
θ > 0, где θ – параметр взаимодействия. Мы использовали данную модель, чтобы
описать размещения деревьев на постоянной пробной площади [5]. Зафиксируем наименьший R0 и наибольший Rmax радиусы дисков так, чтобы пространство марок было
интервалом L = [R0 , Rmax ]. Чтобы полностью специфицировать модель, нам необходимо выбрать параметрическое представление для одноточечного потенциала Φ([·, l]; µ),
где µ – вектор неизвестных параметров. В случае, если функциональная форма для
потенциала неизвестна, прагматичным подходом является выбор ступенчатой функции, т.е. для некоторого разбиения интервала R0 < . . . < Ri−1 < Ri < . . . < Rk = Rmax
значение Φ([·, l]; µ) на Ri−1 , Ri положим равным неизвестному параметру µi . Наконец,
фиксируем распределение марок свободной меры, выбрав равномерное распределение
на L = [R0 , Rmax ].
Таким образом, для модели точечного поля взаимодействующих дисков с уче-
19
том выбранной параметризации химического потенциала и функции взаимодействия
штрауссовского типа функция псевдо-правдоподобия принимает вид
ln P L(µ, θ; xhli ) =
k
XX
X X
−
µi 1(Ri−1 ,Ri ] (m) − θ ·
1(||x − y|| ≤ m + l)
[x,m] i=1
−
1
|Rmax − R0 |
[x,m] [y,l],y6=x
Z Z
Rmax
exp(−
D
R0
k
X
µi 1(Ri−1 ,Ri ] (t) − θ
i=1
X
1(||u − y|| ≤ t + l) ) dt du.
[y,l]
Максимизируя функцию псевдо-правдоподобия, мы получили оценку θ̂ = 1.108
для потенциала взаимодействия, величина которой характеризует взаимодействия как
достаточно сильные. С помощью модельных повторностей была рассчитана стандартная ошибка оценки sθ = 0.071.
В работе [5] также обсуждалась роль одноточечного потенциала Φ([x, l]) в процедурах оценки параметров и его соотношение с эмпирическим распределением марок
и распределением марок свободной меры.
Глава 3. Моделирование кластерных конфигураций
Цель третьей главы – предложить подходящие модели гиббсовских точечных
полей, которые позволяют получать и анализировать точечные конфигурации с кластерными свойствами, причем, эти свойства должны быть связаны с наличием взаимодействия между соседними точечными объектами.
В начале главы определяется понятие динамического соседства, чтобы на его
основе ввести класс марковских точечных полей более широкий, чем марковские точечные поля относительно статических соседей. Далее, вводится класс случайных
точечных полей взаимодействующих соседей, в которых вклад соседей точек поля в
логарифм плотности распределения может описываться многочастичными функциями взаимодействия бесконечного порядка. Мы изучаем марковское свойство новых
моделей и показываем, что этот класс точечных полей является марковским относительно 2-х шагового соседства. Мы доказываем характеризационную теорему для
нового класса полей и показываем, что некоторые известные в литературе модели
являются частными случаями полей взаимодействующих соседей. С помощью вычислительного эксперимента изучаются свойства известных и новых моделей из данного
класса. Глава завершится примером применения новых моделей к анализу реальных
данных размещения деревьев.
Модели, которые могут быть использованы на практике, должны иметь небольшое число параметров, а параметрические функции – содержательную интерпретацию
20
в терминах свойств изучаемых природных систем. Поэтому гиббсовские точечные поля с парным взаимодействием – идеальный кандидат для моделирования пространственной структуры древостоя. Парный потенциал взаимодействия, или парная функция взаимодействия удобны для описания пространственных взаимодействий (или
взаимовлияний) соседствующих деревьев. Хотя эти взаимодействия в отличие от физических систем не могут приводить к изменению положения деревьев в пространстве,
тем не менее экологическая система как целое претерпевает определенные изменения,
которые выражаются в изменении количественных характеристик пространственной
структуры.
Часто характер взаимодействий между соседними деревьями можно охарактеризовать как взаимное угнетение, то есть препятствие для свободного развития, роста
и получения элементов питания, что является следствием ограниченности ресурсов в
зоне, доступной для потребления. Такой вид взаимодействия относят к конкуренции
за ресурс и по аналогии с физическими системами, например, моделями молекулярного газа, говорят о таких взаимодействиях как об отталкивании. Данный вид взаимодействия приводит к конфигурациям, рисунок (паттерн) которых характеризуется
регуляризованными свойствами. В вероятностных терминах это означает, что в некоторой зоне, связанной с расположением объекта, так называемой зоне взаимодействия
или влияния, вероятность встретить еще один объект ниже, чем для пуассоновского
точечного поля. Экстремальный случай этого правила - это полный запрет нахождения одного или более объектов в зоне взаимодействия для каждого объекта. Типичными примерами в лесной экологии могут быть модели, учитывающие размер ствола
дерева. Более интересные примеры доставляют модели лесных систем теневыносливых деревьев, кроны которых препятствует близкому расположению других деревьев.
Существует целый спектр степени угнетения, которое может оказывать одно дерево
на соседнее дерево в зависимости от породы. Это служит обоснованием применения
простых потенциальных функций, которые описывают изменение количественного показателя взаимодействия в зависимости от расстояния от центра дерева.
Вместе с тем нередки ситуации, когда особенности биологии вида (вегетативное
размножение), характер и условия возобновления, а также абиотические факторы
среды приводят к необходимости применять модели, которые способны порождать точечные конфигурации, характеризующиеся групповыми или кластерными свойствами. При этом простые модели с парным взаимодействием не подходят для описания
конфигураций с кластерными свойствами.
В работе [7] мы ввели новый класс моделей точечных полей с расширенным определением соседства, способных порождать кластерные конфигурации.
Модель точечного поля взаимодействующих соседей [7]. Пусть PΠ – распределе-
21
ние пуассоновского точечного процесса Π(1) с единичной интенсивностью в D. Обозначим ∂x (xi ) – множество соседей точки xi .
Определение. Случайное точечное поле X называется точечным полем взаимодействующих соседей с заданным отношением соседства ∼ на D, если его плотность
относительно PΠ имеет вид
p(x) = Z −1
Y
g(xi , ∂x (xi )),
xi ∈x
где g : D × XD → [0, ∞) есть измеримая функция, и Z нормирующий множитель.
Особенностью данной модели является то, что отношение p(x ∪{u})/p(x) зависит
не только от точки u, соседей точки u, но и соседей соседей точки u. Чтобы определить
отношение соседства, включающее соседей соседей, нам понадобится
Определение. Пусть задано отношение соседства ∼ на D. Точки x ∈ x и y ∈ x
являются 2 шаговыми соседями x ∼2x y, если либо они ∼-соседи, либо существует
точка z ∈ x, что x ∼ z ∼ y.
Таким образом, отношение ∼2x определяется на конфигурации x и, следовательно,
то, что две точки являются соседними, может зависеть от положения других точек
конфигурации.
Еще одна трудность, которая возникает, когда понятие марковости распространяется на случай конфигурационных соседей, – это "динамическое" изменение множеств
взаимных соседей, или клик. В отличие от случая статических соседей мы должны наложить ограничения на множество клик, которое обеспечивает отсутствие появления
новых клик, не включающих добавляемую точку к имеющейся конфигурации.
Определение. Множество z ⊂ x называется 2-х шаговой кликой, если для каждой
пары точек {u, v} ⊂ z они либо ∼-соседи (u ∼ v), либо существует еще одна точка
этого множества w ∈ z, которая является ∼-соседом каждой из этих двух точек (u ∼
w ∼ v ).
Обозначим множество всех ∼2x -клик, соответствующих конфигурации x через
Fx (∼2x ). Множество F∼2x -клик позволяет сформулировать характеризационную теорему, которая утверждает, что для точечных полей, являющихся марковскими относительно 2-х шаговых соседей, вклад (потенциальной) функции взаимодействия в
плотность нетривиален только для 2-х шаговых клик.
Теорема [7]. Если конечное точечное поле X является полем взаимодействующих
соседей относительно некоторого статического соседства ∼, тогда его плотность p может быть выражена как
p(x) = Z −1
Y
y∈F∗x (∼2x )
φ(y),
22
где φ(·) ≥ 0 – функция взаимодействия, описывающая вклад всех подмножеств точечной конфигурации в функцию плотности, F∗x (∼2x ) – множество звездных клик,
которые определяются условием, что существует точка, являющаяся соседом каждой
точки множества, образующего звездную клику.
Точечные поля, когда взаимодействие задано в полупараметрической форме [16],
являются одним их важнейших примеров полей взаимодействующих соседей (ВСполей). Распределение предлагаемого точечного процесса есть вероятностная мера
на измеримом пространстве (XD , B(XD )), определяемая плотностью по отношению к
мере стандартного пуассоновского поля:
f (x) = Z −1
Y
β|∂x (xk )| ,
xk ∈x
где {βm , m ≥ 0} — некоторая последовательность неотрицательных чисел, а Z —
нормирующий множитель.
Ограничения на параметры βm , обеспечивающие конечность статистической суммы Z и, таким образом, существование конечного точечного процесса, устанавливает
Теорема [16]. 1) Если существует константа C > 0, такая, что для всех m
выполняется βm ≤ Cmα , где α < 1, то статистическая сумма Z конечна.
2) Если существует константа C > 0, такая, что для всех m выполняется βm ≥
Cmα , где α > 1, то статистическая сумма Z бесконечна.
Таким образом, эта модель может рассматриваться как полупараметрическая
версия класса ВС-полей с плотностью, принадлежащей экспоненциальному семейству
распределений. Данный выбор формы модели удобен, когда отсутствует априорная
информация о виде функции взаимодействия с соседями g(xi , ∂x (xi )).
Для данной модели было доказано свойство локальной стабильности для достаточно широкого класса рассматриваемых точечных полей. Точечное поле с условной
интенсивностью λ(u|x) называется локально стабильным, если существует такая константа C > 0, что неравенство λ(u|x) ≤ C выполняется равномерно по всем u ∈ D и
x ∈ F . Полезность данного условия объясняется тем, что его выполнение обеспечивает геометрическую сходимость алгоритмов моделирования точечных полей, заданных
плотностью относительно пуассоновской меры. Кроме этого локальная стабильность
влечет выполнение центральной предельной теоремы для некоторых функционалов
от точечных полей.
Теорема. [16] Если βi > 0, i = 0, . . . , N, и βi = γ ≥ 0, i > N, для некоторого
фиксированного N , то точечное поле локально стабильно.
Практический интерес представляют малопараметрические модели с плотностью,
принадлежащей к семейству экспоненциальных распределений, так как в некоторых
23
Рис. 1: Модельные реализации ВС-точечного поля с двумя фазами (би-паттерн) с
параметрами ln γ равными a) 0.04 b) 0.08.
случаях удается использовать стандартное программное обеспечение для нахождения
оценок параметров. В качестве примера в [7] рассмотрено точечное поле с плотностью
p(x) = Z −1 β |x|
Y
γ max{0,|∂x (xi )|(c−|∂x (xi )|)} ,
xi ∈x
где β > 0 контролирует интенсивность точек, γ > 0 – параметр взаимодействия и c –
произвольная константа.
В случае γ > 1, величина γ max{0,|∂x (xi )|(c−|∂x (xi )|)} принимает наибольшее значение,
когда число соседей равно b 2c c, и, таким образом, конфигурации точек с кластерами
размеров b 2c c + 1 реализуются чаще, чем конфигурации с другими свойствами. Следовательно, выбором соответствующей константы c мы можем контролировать размер
кластеров.
В случае 0 < γ < 1 наибольшие значения величина γ max{0,|∂x (xi )|(c−|∂x (xi )|)} принимает, когда либо точка не имеет соседей, либо число соседей равно bcc. Следовательно,
вместо того, чтобы проявлять регуляризованные свойства эта модель является специальным случаем кластерных конфигураций: вместе с кластерами, имеющих размер
bcc + 1, оставшееся пространство заполняется изолированными точками, не имеющих
соседей. Таким образом, данная модель демонстрирует одновременно кластерные и
регулярные свойства, и поэтому была названа в [7] двухфазным (би-паттерн) полем
(см. Рис.1)
В работе [7] сделан вывод, что данная модель, сочетающая регулярные и кластерные свойства, может найти применение в анализе пространственной структуры
разновозрастного древостоя, когда одновременно встречаются два типа размещений:
групповое, связанное с возобновлением, и регуляризованное, отвечающее характеру
размещения взрослых деревьев.
Глава 4. Моделирование несимметричного взаимодействия
Подход, который мы развиваем, состоит в том, чтобы моделировать размещение
24
точечных объектов с помощью случайных точечных полей с локальным взаимодействием. Преимущество данного класса моделей связано с тем, что они основаны на
хорошо разработанных методах, использующих вероятностное распределение, параметры которого могут быть интерпретированы в терминах конкурентных взаимоотношений между деревьями. Однако, в классических моделях гиббсовских точечных
полей предполагается, что взаимодействие между объектами является симметричным,
в то время как взаимодействие между объектами в реальных системах не обязательно
симметрично. Например, при моделировании пространственной структуры древостоя
мы сталкивается с необходимостью учесть асимметричный характер взаимодействия
между деревьями – непропорциональный раздел ресурсов соседствующих деревьев в
пользу большего дерева.
В работах [11, 14] показывается как, используя так называемый иерархический
потенциал, можно построить модель с асимметричным взаимодействием. Преимущество предлагаемой модели случайного точечного поля с иерархическим взаимодействием, состоит в более точном учете характера взаимодействия. Кроме того, иерархический потенциал позволяет моделировать оба типа взаимодействия симметричное
(т.е. когда соседние деревья оказывают сравнимое влияние) и асимметричное (когда
одно из соседних деревьев подавляет другое) одновременно.
Модель с иерархическими взаимодействиями. Модель, которую мы берем в качестве исходной, является многомерным (относительно числа переменных) точечным
полем X = (X 1 , . . . , X q ) на D ⊂ Rd . Это частный случай маркированного точечного
поля, где пространство марок есть конечное множество L = {1, . . . , q}. Каждая компонента X i отвечает определенному типу точек (например, породе или виду растений),
или маркированные точки могут быть разбиты на группы согласно выбранному критерию.
Идея, которая лежит в основе нового подхода, состоит в конструировании иерархии точечных конфигураций, в которой точки более высокого уровня являются источником неоднородности для точечных конфигураций следующих уровней. Заметим,
что только точки одного и того же типа образуют конфигурацию, соответствующую
определенному уровню.
Указанный подход реализуется с помощью представления многомерной плотности как произведения маргинальной и условных плотностей с использованием формулы умножения вероятностей,
p(x) = p1 (x1 )p2 (x2 |x1 )p3 (x3 |x1 , x2 ) · · · pq (xq |x1 , ..., xq−1 ),
(1)
где x = (x1 , x2 . . . , xq ) и x1 – точечная конфигурация верхнего уровня, а xq – точечная
25
конфигурация самого нижнего уровня иерархии.
Таким образом, моделирование точечной конфигурации, состоящей из точек нескольких типов, осуществляется последовательно, начиная с верхнего уровня, который
определяется маргинальным распределением p1 (x1 ), затем моделируют конфигурацию следующего по порядку уровня в соответствии с условным распределением p2 (x2 |x1 )
и так далее. Преимущество такого подхода состоит в том, что мы можем управлять
выбором функции взаимодействия на каждом уровне иерархии модели, что ведет к
более адекватному учету характера взаимоотношений реальных объектов.
Рассмотрим пример, поясняющий принятую методологию. Допустим, имеется
простая модель конечного двухчастичного точечного поля (X, Y ), компоненты которого суть пуассоновские поля X и Y , и взаимодействие между ними задано условием, что минимальное расстояние между точками различных типов больше, чем R.
Маргинальное распределение поля точек первого типа X имеет вид
n(x)
p1 (x) = Z −1 β1
exp(β2n |D \ Ux | − |D|)
, где мы обозначили через Ux область, покрытую дисками (шарами) b(xi , R) радиуса
n(x)
R, центрированных в точках конфигурации x, т.е. Ux = ∪i=1 b(xi , R). Таким образом,
маргинальное поле X имеет значительно более сложную структуру, чем исходное
поле.
Наш подход к построению моделей пространственно распределенных иерархрчески взаимодействующих точечных объектов предполагает выбор маргинального распределения точечной конфигурации верхнего уровня p(x) и цепочки условных распределений, описывающих размещение точек последующих уровней pk (xk |x1 , x2 , . . . , xk−1 ),
исходя из простых предположений о характере взаимодействия между точками одного
типа и разных типов. Так построенная модель в состоянии учесть например, несимметричный характер взаимодействия между растениями в сообществе в соответствии
с представлениями об отношениях между соседними деревьями на различных уровнях
иерархии.
Алгоритм моделирования гиббсовского поля с иерархическими взаимодействиями является модификацией метода, который используется для статистического моделирования многомерной плотности, заданной с помощью функции (потенциального)
взаимодействия. В случае, когда многомерная плотность задана с точностью до нормирующего множителя, прибегают к процедурам Монте-Карло по схеме марковских
цепей (MCMC), которые включают алгоритмы Метрополиса-Хастингса и пространственные процессы рождения и гибели.
Идея, на которой основаны MCMC-алгоритмы, состоит в том, чтобы выбрать
марковкую цепь (процесс), для которого моделируемое распределение является пре-
26
дельным. В нашем случае предельное распределение соответствует плотности гиббсовского поля, реализации которого нам необходимо получить. Если длина марковской
цепи, т.е. последовательности точечных конфигураций, достаточно большая, то финальная конфигурация есть реализация гиббсовского точечного поля с плотностью,
достаточно близкой к плотности "целевого" распределения. Существуют различные
методы диагностики, что марковская цепь вышла на стационарный режим, один из
которых описан в [1].
Схема одного из возможных алгоритмов рассмотрена в [11]. Мы ограничились
описанием алгоритма, который порождает конфигурации с фиксированным числом
точек каждого типа. Внимание к моделированию конфигураций с заданным числом
точек оправдано тем обстоятельством, что на практике, как правило, имеют дело с
единственной реализацией и интерес к вариабельности, связанной с интенсивностями
точек поля, имеет второстепенное значение. Такие алгоритмы, когда подразумеваются
определенные ограничения, накладываемые на реализацию случайного поля, называются условными.
Предположим, что число точек n1 , .., nq всех уровней фиксированно.
• Допустим, что текущее состояние марковской цепи есть точечная конфигурация x≤k = (x1 , x2 , . . . , xk ), где x1 , . . . , xk−1 – конфигурации, которые являются
результатом работы алгоритма на предыдущем шаге, и xk есть произвольная
конфигурация nk точек k-того типа,
• Выберем точку xki конфигурации xk случайно и определим для нее новое расположение u, которое равномерно распределено в области D,
• С вероятностью (принятия)
α = min{1,
fk ({u} ∪ xk \ {xki }|x1 , . . . xk−1 )
},
fk (xk |x1 , . . . xk−1 )
новая конфигурация {u} ∪ x≤k \ {xki } (точка xki удаляется а новая точка u добавляется) становится новым состоянием цепи. В противном случае сохраняется
старое состояние цепи и конфигурация x≤k остается неизменной.
Реализации случайного точечного поля с иерархическим взаимодействием использовались в [11] для проверки согласия модели и данных.
Глава 5. Методы оценивания параметров гиббсовских точечных полей
Пятая глава посвящена рассмотрению свойств методов оценивания параметров
гиббсовских точечных полей, основанных на семействе так называемых инвариантных
27
во-времени (ИВ) оценивающих уравнений, введенных в работе Бэддли1 .
В п. 5.1 мы описываем два метода оценивания: максимального псевдо-правдоподобия, изученного в [4] и метода, предложенного Такачем2 и Фикселем3 . В п. 5.2 мы
даем различные формы инвариантных во времени оценок, в частности, описывается
новый метод оценивания, допускающий простую реализацию с помощью стандартных
пакетов. В п. 5.3 мы обобщаем метод ИВ-оценивания. В п. 5.4 сравнивается качество
различных ИВ-оценок на основе результатов вычислительного эксперимента.
Стандартный метод максимального правдоподобия для таких моделей не может
быть использован из-за трудностей вычислительного характера. Оценивание методом максимального псевдо-правдоподобия (МПП) или методом Такача-Фикселя (ТФ)
является в этом случае альтернативой, позволяющей избежать вычислительных проблем. Однако, эти оценки являются неэффективными и имеют значительное смещение
в случае моделей, в которых взаимодействие между точками характеризуется значительными величинами. Следовательно, имеет смысл поиск оценивающих процедур,
обладающих вычислительной простотой МПП- или ТФ-оценок, но имеющих лучшие
статистические свойства.
Основные критерии выбора той или иной оценки являются качество и удобство
вычислительной реализации. В литературе4 обсуждаются практические аспекты вычислительной реализации наиболее часто использующегося метода нахождения оценок – максимального псевдо-правдоподобия (МПП). Мы показываем, что среди ИВоценок существует такая, которая допускает реализацию с помощью стандартных статистических пакетов и в то же время имеет значительно лучшие статистические свойства, чем МПП-оценка.
Предположим, что p(x, θ) есть параметрически заданная плотность распределения точечного поля X на D ⊂ Rd , параметр θ которой нам требуется оценить по
имеющимся данным x, т.е. точечной конфигурации в выборочном окне W ⊂ D. Пусть
(Y t , t > 0) есть дискретная (для простоты) марковская цепь такая, что для любого θ
равновесное распределение цепи (Y t ) имеет плотность вероятности p(x; θ). Пусть Aθ
генератор цепи (Y t ),
(Aθ S)(x) = Eθ [S(Y t+1 ) − S(Y t ) | Y t = x]
Инвариантная-во-времени оценка θ̂ есть решение уравнения (Aθ S)(x) = 0 . Поскольку
1
Baddeley A. J. Time-invariance estimating equations //Bernoulli. – 2000. – V. 6. – P. 783-808.
Takacs R. Estimator for the pair–potential of a Gibbsian point process //Statistics: A Journal of
Theoretical and Applied Statistics. –1986. – V. 17. – P. 429–433.
3
Fiksel T. Estimation of parametrized pair potentials of marked and non-marked Gibbsian point
processes //Elektronische Informationsverarbeitung und Kybernetik. – 1984. – V. 20. – P. 270–278.
4
Baddeley A., Turner R. Practical maximum pseudolikelihood for spatial point patterns //Australian
& New Zealand Journal of Statistics. – 2000. – V. 42. – P. 283–322.
2
28
Eθ (Aθ S)(X) = 0, то уравнение является несмещенным оценивающим уравнением.
В работе1 было установлено, что уравнение псевдо-правдоподобия могут быть
получены из ИВ-оценивающих уравнений для экспоненциального семейства моделей,
основанных на марковской цепи рождения и гибели с непрерывным временем (РГНВ),
такой, что интенсивности рождения и гибели имеют вид
bθ (x, u) =
p(x ∪ u; θ)
,
p(x; θ)
dθ (x, xi ) ≡ 1,
и статистика S(x) является достаточной статистикой для данного вида распределений.
В более общем случае мы можем получить семейство РГНВ марковских цепей,
для которых метод, основанный на генераторе цепи, позволяет получить семейство
РГНВ-оценивающих уравнений:
X
(Aθ S)(x) =
[S(x \ xi ) − S(x)] λ(1−c) (xi , x; θ),
xi ∈x
Z
+
[S(x ∪ u) − S(x)] λc (u, x; θ) du.
W
Аналогичные рассмотрения для генератора марковских цепей Метрополиса-Хастингса ведут к оценивающим уравнениям вида
(Aθ S)(x) =
X
mθ (xi , x \ xi ) [S(x \ xi ) − S(x)]
xi
Z
mθ (u, x) [S(x ∪ u) − S(x)] λ(u, x; θ) du
+
W
где
mθ (u, x) = min{
1−c
1
c
,
},
n(x ∪ u) λ(u, x; θ) |W |
или
mθ (u, x) =
1
,
c n(x ∪ u) + (1 − c)λ(u, x; θ)|W |
которые названы Гейер-Мёллер (Г-М) и Баркер-Хастингс (Б-Х) уравнениями, так как
отвечают соотвествующим МСМС алгоритмам.
Определим модификацию функции (логарифма) псевдо-правдоподобия
ln QLc (θ; x)
1X
λ(xi , x; θ)
ln
c x ∈x c n(x) + (1 − c)λ(xi , x; θ)|W |
i
Z
n(x)
−
ln(c n(x ∪ u) + (1 − c)λ(u, x; θ)|W |) du.
(1 − c)|W | W
=
Можно показать, что частные производные ln QL дают оценивающие уравнения Баркера-
29
Хастингса. Преимущество Б-Х оценивающего уравнения состоит в том, что метод оценивания, использующий функцию QL, допускает реализацию с помощью стандартных
пакетов программ.
Класс ИВ-оценок содержится в классе оценок Такача-Фикселя. Чтобы расширить класс инвариантных во времени оценок в диссертации предложено обобщение
ИВ-метода оценивания, которое приводит к оценивающим уравнениям, которые не
могут быть получены с помощью метода Такача-Фикселя. В частном случае, используя алгоритм Метрополиса, мы получили следующие оценивающие уравнения
(Bθ V )(x) =
XZ
xi ∈x
1(∆U < 0) − 1(∆U > 0) exp(−∆U ) du,
W \x
где ∆U = U (x \ xi ∪ u; θ) − U (x; θ), и U (·, θ) – полная энергия системы.
Мы сравнили качество оценок (см. Таблицы 1 и 2), получаемых с помощью различных оценивающих уравнений. В качестве модельного распределения использовалось точечное поле Штраусса5 , заданное плотностью
p(x; θ) =
1
1(h(x) = 0) exp(αn(x) + βs(x)),
Z(θ)
где θ = (α, β) параметры, которые управляют плотностью точек (параметр α) и взаимодействием между точками (параметр β), n(x) обозначает число точек в точечном
множестве x, наблюдаемом в выборочном окне W ⊂ R2 . Статистика s(x) есть число
пар точек, которые удалены далее, чем r0 и ближе, чем r единиц друг от друга, и
статистика h(x) определяет условие твердой сердцевины, которое проверяет отсутствие пар точек, расположенных ближе друг к другу, чем r0 ; r0 называется радиусом
твердой сердцевины, а r - радиусом взаимодействия, и могут быть выбраны заранее
или оцениваться по данным.
Таблица 1. Средние и стандартные ошибки (в скобках) для ИВ-оценок параметра взаимодействия β в модели Штраусса с взаимодействием отталкивающего типа .
Оценка
β = −0.8
β = −1.2
β = −1.6
β = −2.0
β = −2.4
-0.842 (0.192) -1.27 (0.252) -1.73 (0.353) -2.23 (0.508) -2.84∗ (0.870)
МПП
РГНВ(c = 0.5) -0.851 (0.193) -1.27 (0.241) -1.70 (0.296) -2.14 (0.356) -2.58 (0.423)
Г-М
-0.836 (0.189) -1.24 (0.230) -1.66 (0.278) -2.08 (0.328) -2.50 (0.373)
Б-Х
-0.842 (0.188) -1.25 (0.230) -1.67 (0.275) -2.09 (0.327) -2.51 (0.377)
Метроп
-0.813 (0.183) -1.22 (0.222) -1.63 (0.261) -2.05 (0.310) -2.47 (0.355)
∗
5
in 5.2% реализаций конечная оценка не была найдена
Strauss D. J. A model for clustering //Biometrika. – 1975. – V. 62. – P. 467–475.
30
Таблица 2. Средние и стандартные ошибки (в скобках) для ИВ-оценок параметра взаимодействия β в кластерной модели Штраусса с жесткой сердцевиной.
β = 0.4
0.371 (0.187)
β = 0.8
0.780 (0.183)
β = 1.2
1.22 (0.249)
β = 1.6
1.92∗ (0.604)
РГНВ( c = 0.5) 0.371 (0.189)
0.770 (0.171)
1.17 (0.169)
1.60 (0.212)
Г-М
0.377 (0.203)
0.772 (0.196)
1.16 (0.196)
1.58 (0.226)
Б-Х
0.374 (0.197)
0.773 (0.187)
1.17 (0.190)
1.58 (0.224)
Метроп
0.401 (0.186)
0.796 (0.169)
1.20 (0.175)
1.66 (0.255)
Оценка
МПП
∗
in 2.9% реализаций конечная оценка не была найдена
Результаты эксперимента демонстрируют, что оценка, основанная на цепи Маркова с динамикой Метрополиса, является наилучшей в терминах как смещения, так
и стандартной ошибки. Оценки, основанные на марковских цепях с динамикой обновления Гейера-Мëллера и Баркера-Хастингса имеют сходное качество, и их статистические свойства несколько лучше, чем у оценки, основанной на марковской цепи
рождения и гибели с параметром c = 0.5. Наш эксперимент подтверждает низкое
качество МПП-оценок в случае моделей с высокими значениями параметра взаимодействия, как это раньше уже было отмечено в [4].
Глава 6. Проверка согласия гипотезы "пространственной случайности"
против альтернатив смешанных регулярно-кластерных размещений
Задача проверки гипотезы о совершенно случайном размещении является классической. Подбор модели размещения точек естественно начать с предположения, что
точки распределены однородно по пространственной области и не взаимодействуют
между собой. Эти предположения формально соответствуют свойствам модели, определяющие точечное поле Пуассона.
Обычно статистические критерии для проверки гипотезы о пуассоновости поля
строятся с помощью статистик, использующих так называемые сводные (summary)
характеристики точечных множеств, основанные на вычислениях расстояний до ближайших соседей, межточечных расстояний и числа подсчета точек в выборочных областях. Было предложено большое число статистических критериев для проверки гипотезы "пространственной случайности" , и проведены сравнительные исследования
мощностей нескольких групп статистических критериев.
Типичными альтернативами к "совершенно случайному" размещению являются
размещения, обладающие либо кластерными, либо регулярными свойствами, которые
визуально представляют хорошо выраженные группы точек в первом случае и относительно упорядоченное расположение точек (например, центры непересекающихся
31
шаров, плотно заполняющих пространство) во втором. Однако реальные пространственные структуры, например, экологических систем имеют иерархическую организацию и могут характеризоваться различными типами структур в зависимости от
пространственной шкалы.
Значительно более сложная ситуация возникает, когда на отдельных подобластях общей пространственной области конфигурации точек имеют место различные
свойства на одних и тех же шкалах расстояний. В этом случае мы говорим о пространственной смеси типов размещений. Особенно трудный случай представляет смесь кластерного и регулярного типов. В то же время, этот специальный случай размещения
встречается в реальных ситуациях. Например, в разновозрастных древостоях процесс
возобновления связан с разрывами в лесном пологе, образующимися в результате падения старого крупного дерева, и появления на этом месте группы молодых деревьев, получивших пространство для своего роста. Эти окна, заполненные молодыми
деревьями следующего поколения, окружены взрослыми деревьями, расположение
которых есть результат длительного процесса изреживания отставших в росте, конкурирующих за ресурсы деревьев этого и следующего поколения.
В работе [7] были описаны модели, которые позволяют создавать модельные конфигурации точек с такими специальными свойствами. Пример решения задачи оценки
параметров подходящей модели может быть найден в работе [20].
Цель данной главы состоит в том, чтобы описать критериальную статистику,
предложенную в работе [8], которая, как было показано, чувствительна к обоим свойствам пространственной смеси - регулярному и кластерному типу размещения точек.
Новая статистика объединяет информацию, которая содержится в совокупности всех
функций расстояния до n-того ближайшего соседа. Эта статистика представляет собой квадратичную форму и имеет асимптотически хи-квадрат распределение. Таким
образом, критическая область может быть определена без обращения к методу МонтеКарло, в то время как конкурирующие критериальные статистики могут применяться
только основываясь на монте-карловских вычислениях. Дополнительно, новый тест
легко адаптируется к ситуациям, когда необходимо проверять отклонения от "пространственной случайности"для нескольких шкал одновременно.
Критериальная статистика. Пусть X – случайное точечное поле в Rd с интенсивностью λ. Определим случайную меру Mk (·, r), положив Mk (B, r) равным числу
точек в X ∩ B таких, что их числа r-близких соседей равны в точности k, где k = 0,
1, 2, . . . для B ⊂ Rd and r ≥ 0.
Уточненная теорема Кэмпбелла и условие однородности позволяют выразить математическое ожидание случайной меры M в виде
EMk (B, r) = λk (r)|B| = λ|B|P0! {x : |x ∩ b(0, r)| = k},
32
где P0! – редуцированная мера Пальма поля X, и λk (r) есть интенсивность тех точек
поля, которые имеют ровно k r-близких соседа.
Функции λk (r) обеспечивают детальное описание точечного поля. Более того,
многие популярные сводные функции, например, K-функция Рипли, могут быть выражены через линейные комбинации функций λk (r). Их общим недостатком, является
то, что они не позволяют различить эффекты, относящиеся к разным свойствам конфигураций. Например, из-за взаимной компенсации отклонений в сторону регулярного и кластерных размещений указанные статистики могут оказаться малочувствительными к отклонениям от модели пуассоновского поля - типичной нулевой гипотезы.
Ниже мы описываем новый подход к задаче проверки гипотезы "пространственной случайности". В работе [8] была предложена критериальная статистика, основанная на отклонениях случайных величин Mk от их математических ожиданий при
нулевой гипотезе. Чтобы эти отклонения не компенсировали друг друга статистика
критерия была выбрана вальдовского типа, которая декоррелирует и нормирует компоненты, входящие в статистику. Именно, рассмотрим квадратичную форму
Q2 (r) = (m − µ)0 Σ−1 (m − µ),
где m = (m1 , m2 , ..., mq )0 состоит из Mk (B, r) и их сумм, т.е. mi =
P
k∈Ii
Mk (B, r) где B
– окно наблюдения, а Ii – непустое множество индексов, содержащее неотрицательные
целые числа и такое, что Ii1 ∩ Ii2 = ∅ для любых i1 6= i2 . Вектор µ = (µ1 , µ2 , . . . , µq )0
состоит из математических ожиданий наблюденных статистик mi , т.е. µi = Emi , и Σ−1
– матрица, обратная к ковариационной матрице вектора m. Выбор множества индексов Ii может быть произвольным, при условии, что соответствующая ковариационная
матрица Σ обратима.
Математические ожидания µi = Emi и компоненты ковариационной матрицы
Σ, при условии, что точечное поле X является пуассоновским или биномиальным,
находятся по формулам, которые были получены в работе [8]. Для этого была использована конструкция маркированного точечного поля Y , ассоциированного с исходным точечным полем Пуассона X, где каждой точке x ∈ X назначается марка
s(x), которая соответствует числу r-близких соседей точки x. Применение теоремы
Мекке-Кэмпбелла дает в конечном итоге явные формулы.
В работе [8] были изучены асимптотические свойства предложенной статистики Q2 . Мы рассматриваем случай, когда однородное пуассоновское точечное поле с
фиксированным параметром интенсивности наблюдается в выборочном окне, которое
расширяется регулярным образом до всего пространства Rd . Было показано, что статистика Q2 асимптотически (W % Rd ) распределена как χ2 -распределение с числом
степеней свободы равным рангу ковариационной матрицы Σ.
33
Рис. 2: Оценки мощности критериев проверки гипотезы о случайном размещении
точек против альтернатив смешанного регулярно-кластерного типа, состоящих из
n = 100 точек кластерного поля Матерна с средним числом точек в кластере ρ, и
n = 100 точек поля Штраусса с параметром взаимодействия β. Радиус кластеров и
радиус взаимодействия были равны. Оценки мощности соответствуют ошибке первого
рода 5%.
Интерес представляет сравнение мощности критериев, основанных на предложенной нами статистике Q2 и некоторых других популярных статистиках. В качестве
альтернативной гипотезы мы взяли пространственную смесь кластерного поля Матерна и точечного поля Штраусса. Кластерное поле Матерна позволяет создавать
размещения, точки которых образуют группы, в то время как точечное поле Штраусса хорошо приспособлено для создания размещений, точки которых образуют разреженные паттерны, степенью разреженности которых можно управлять с помощью
параметра взаимодействия между точками. Таким образом, реализации данной модели проявляют кластерные и регулярные свойства одновременно.
В качестве конкурирующих к статистике Q2 мы рассматривали следующие по|B| P
b
пулярные статистики: эмпирический аналог K-функции Рипли, K(r)
= n(n−1)
i6=j
P
1(kxi − xj k ≤ r), статистику Vb (r) = i6=j |b(xi , r) ∩ b(xj , r)|, эмпирическую функцию,
P
|B|2
b (3) (r) =
связанную с редуцированной третьей моментной мерой, K
n(n−1)(n−2)
i6=j6=k
34
1(kxi − xj k ≤ r)1(kxi − xk k ≤ r), и эмпирическую функцию распределения расстояния
P
b
до ближайшего соседа, называемую G-функцией, G(r)
= n−1
1(minj6=i {kxi − xj k} ≤
i
r). В качестве статистики критерия в данном сравнительном исследовании был выc (rj ) − W0 (rj )|, где W0 является теоретической описабран вариант U = maxj=1,...,p |W
c является соответствутельной функцией, вычисленной для нулевой гипотезы, и W
ющей эмпирической функцией, значения которой находятся на основе эмпирических
данных, т.е. координат точек конфигурации. Для оценки мощности критериев мы
использовали метод Монте-Карло.
Результаты, представленные на Рис. 2, показывают преимущество статистики
Q2 для проверки "пространственной случайности" против альтернатив, соответствующих моделям, объединяющим строго противоположные тенденции, приводящим к
точечным конфигурациям с кластерными и регулярными свойствами.
Глава 7. Метод проверки адекватности модели гиббсовского случайного
поля
Развитие статистических методов анализа пространственных данных и, в частности, точечных конфигураций сделало возможным привлечение разнообразных достаточно сложных моделей для описания данных, встречающихся в приложениях .
Однако среди имеющихся методов отсутствовали процедуры проверки и диагностики адекватности подогнанной (fitted) модели, т.е. модели, параметры которой были
оценены по имеющимся данным. В то же время, если обратиться к близкому разделу
математической статистики - многомерному анализу, то нельзя не отметить наличие
развитых средств проверки качества подгонки, например для общей линейной модели. Таким образом, отсутствие среди арсенала методов пространственной статистики
процедур, аналогичных анализу остатков или выявлению выбросов, не позволяет выделить необычные наблюдения, которые искажают свойства изучаемого объекта или
системы.
Первые шаги в этом направлении были сделаны в работе [1], где было введено
понятие экспоненциального маркирования. В мотивировочной части этой работы мы
отмечали, что гиббсовские точечные поля представляют собой модели, которые позволяют описать большое разнообразие точечных конфигураций. Однако, применение
этих моделей на практике затруднено, так как получение моментных характеристик
сопряжено с большими трудностями. Так, например, две основные характеристики,
которые описывают пространственную конфигурацию – интенсивность и парная корреляционная функция в случае гиббсовских моделей не могут быть вычислены аналитически.
35
В [1] было показано, что в случае специального выбора марок, операция маркирования позволяет получить выражение для характеристик первого и второго порядка
в явном виде. Этот факт может быть использован для построения процедур экспресспроверки адекватности модели, причем, как в случае алгоритмов статистического
моделирования (диагностика сходимости), так и в случае подгонки или отбора моделей из заданного класса. В [1] мы не привели примеров использования предложенного
подхода. Этот недостаток был впоследствии устранен в работах других исследователей.
Основания метода диагностики. Укажем те особенности модели, которую мы
рассматривали в [1]. Мы ограничились рассмотрением гиббсовских точечных полей
с парным взаимодействием, т.е. заданных параметром химической активности α и
парным потенциалом Φ(||x − y||), где x, y ∈ Rd . Следовательно, функция локальной
энергии, в терминах которой определяется распределение точечного поля, может быть
P
записана как E(x, x) = α + y∈x\{x} Φ(||x − y||), x, y ∈ Rd , x ∈ X. Здесь X обозначает
множество всех локально конечных конфигураций в Rd . Предполагается, что на парный потенциал Φ(·) наложены условия, чтобы обеспечить существование точечного
поля X в Rd .
Доказательство утверждений о свойствах моментных мер, которые мы собираемся установить, существенным образом опирается на соотношение между мерой Пальма
и распределением гиббсовского точечного поля (формула Нгуен-Цессина), обобщенного на случай маркированного гиббсовского точечного поля, а именно, для всех неотрицательных измеримых функций g : Rd × L → Xhli верно равенство λ E0! [g(0, l, X hli ] =
E[g(0, l, X hli ) exp(−E(0, l, X hli ))]. Здесь символ E0! обозначает математическое ожидание относительно редуцированной меры Пальма.
Процедура маркирования для точечного поля X, которая превращает исходное
точечное поле в маркированное X hli = {[x, l]}, соответствует назначению каждой
марке положительного значения по правилу
l(x) = exp( E(x, x \ {x})) = exp(α +
X
Φ(||x − y||)).
y∈x\{x}
Такой вид маркирования получил название "экспоненциальный" . Полезность данной
конструкции дает
Теорема. [1] Пусть X - маркированное гиббсовское точечное поле с локальной
энергией E, не зависящей от значения марок. Тогда средняя марка ¯l = E0! L удовлетворяет соотношению ¯l = 1/λ.
Следствие. Среднее суммы всех экспоненциальных марок точек в борелевском
множестве B ⊂ Rd равна лебеговой мере множества B.
36
Таким образом, если модель гиббсовского точечного поля хорошо соответствует
данным и оценка параметров модели близка к верному значению, мы ожидаем, что
сумма марок не должна систематически отклоняться от объема области B. Здесь
мы предполагаем, что область B используется как сканирующая тестовая площадка,
перемещающаяся по всему исследуемому образцу.
Идея диагностики на основе отклонений правой и левой частей равенства НгуенаЦессина была развита в (Baddeley at al. 2005), где введено понятие меры остатков по
аналогии с процессом инноваций в теории точечных процессов.
Средства диагностики, основанные на моментных мерах второго порядка. Моментные меры второго порядка, взвешенные "экспоненциальными" марками могут
быть использованы как дополнительные средства диагностики.
В [1] было показано, что экспоненциальное маркирование позволяет получить
аналитические выражения для моментных мер второго порядка. Этот результат имеет
важное значение, так как упрощает процедуру оценивания и диагностику отклонения
от подходящей модели. Кроме того, для некоторых простых моделей эти соотношения
являются основой метода оценивания (см. [2]).
Глава 8. Метод статистического моделирования Монте-Карло в задачах
проверки статистических гипотез для точечных полей
Методы Монте-Карло находят широкое применение в математической статистике, поскольку часто являются единственно возможной альтернативой для решения
практически интересных задач, когда аналитические результаты относительно поведения вероятностных моделей либо не известны, либо их получение сопряжено со значительными трудностями. Привлекательной стороной методов, основанных на статистическом моделировании (методе Монте-Карло) является принципиальная возможность их реализации.
В главе 8 рассматриваются методы проверки статистических гипотез при анализе точечных конфигураций. Мы показываем, что существующая практика применения широко используемых методов не вполне удовлетворительна. Глава основана на
результатах работ [15] и [26], где предложены новые улучшенные процедуры проверки
гипотез.
Обычно для проверки гипотез в задачах анализа точечных конфигураций используются два подхода, один из которых основан на мере отклонений от теоретической (известной или оцененной по модельным реализациям) описательной функции,
в то время как второй использует огибающие, представляющие собой границы критических областей. Оба метода относятся к критериям значимости и используют в
качестве критериальной статистики одну из возможных описательных функций F (r)
(например, распределение расстояния до ближайшего соседа), оцененную на основе
37
точечной конфигурации x = {x1 , . . . , xn }. Причина, по которой приходится прибегать
к статистическому моделированию при решении указанных задач, состоит в том, что
распределение статистики F̂ (r) даже для простых моделей как правило не известно,
в то время как метод Монте-Карло позволяет получать оценку распределения для
F̂ (r).
В методе отклонений информация о расхождении между наблюдаемой функциональной статистикой F̂набл (r) и теоретической Fтеор (r) трансформируется в скалярную
величину, которая сравнивается с распределением таких величин, полученных на основе модельных реализаций. Конструирование критерия в данном случае не вызывает принципиальных трудностей. Более сложная ситуация возникает в случае метода
огибающих, в котором значения F̂ (r) инспектируются на интервале расстояний одновременно. Таким образом, мы имеем дело с критерием множественных сравнений и
определение вероятности ошибки первого рода представляет значительные трудности.
Улучшенный метод огибающих. В работе [15 ] был предложен улучшенный метод монте-карловских огибающих. Опишем вначале классический метод огибающих.
Во-первых, необходимо получить s независимых маркированных точечных конфигураций, являющихся реализациями модели, соответствующей нулевой гипотезе. Затем, выбирается описательная функция F (r) и вычисляются оценки для эмпирической (вычисленной по данным) F̂1 (r) каждой модельной конфигурации F̂i (r), 2 =
1, . . . , s + 1. Далее, для каждого значения расстояния r в выбранном диапазоне значений [rmin , rmax ] мы находим k-тое наибольшее и наименьшее значение F̂i (r) из множества {F̂i (r), i = 1, . . . , s + 1}, которые в совокупности формируют 2k/(s + 1) верхний
Fup (r) и нижний Flow (r) границы зоны, соответствующую "принятию" нулевой гипотезы, и которая, следовательно, определяет критическую область.
В частном случае наибольшего и наименьшего F̂i (r) для каждого r в [rmin , rmax ]
эти значения образуют огибающие, т.е. кривые за пределы которых модельные статистики не выходят, что дает верхнюю и нижнюю огибающую,
Fup (r) = max F̂i (r),
i=1,...,s
Flow (r) = min F̂i (r).
i=1,...,s
Построенный так критерий, однако, не отвечает на вопрос, какое число модельных конфигураций s мы должны сгенерировать, чтобы получить критерий заданного
размера (т.е. уровня значимости). В литературе такой критерий часто интерпретируют, как имеющий размер 2k/(s + 1), что не является корректным.
Хотя мы не можем контролировать уровень значимости (ошибку первого рода)
α, используя критерий огибающих, мы можем оценить его значение, т.е использовать
его в выводах a posteriori.
38
Алгоритм вычисления оценки вероятности ошибки первого рода, когда значение расстояния r не фиксировано, следующий. Для каждой модельной конфигурации
маркированных точек мы определяем, находится ли F̂i (r) полностью между огибающими, т.е. мы проверяем истинность неравентсва Flow (r) < F̂i (r) < Fup (r), для всех r
в [rmin , rmax ]. Пусть t - это число тех модельных маркированных конфигураций, для
которых данное неравенство истинно. В качестве оценки вероятности ошибки первого
рода положим величину α̂ = 1 − t/s, где s - число всех модельных конфигураций
точек.
В работе [15] был предложен усовершенствованный метод огибающих, позволяющий получить критерий желаемого размера (т.е. желаемую ошибку первого рода).
Мы определяем новый метод огибающих как процедуру построения огибающих, описанных выше, где вероятность ошибки первого рода оценивается после построения
огибающих и используется в статистических выводах. В том случае, если выбор числа модельных повторностей s дает неприемлемо большую ошибку первого рода, число
s должно быть увеличено так, чтобы ошибка первого рода оказалась близка к желаемому значению. В этом случае усовершенствованный метод огибающих становится
строгой статистической процедурой.
В качестве примера анализа точечной конфигурации с количественными марками
мы рассмотрели данные, состоящие из координат расположения деревьев и измерений
их диаметров [15]. Вопрос, являются ли величины диаметров деревьев независимыми
случайными величинами, представляет биологический интерес, так как характеризует
взаимоотношения индивидуальных растений в сообществе. Мы исследуем независимость диаметров деревьев лесного участка с помощью описательной функции F (r),
соответствующей маркированной моментной мере второго порядка.
Вначале мы используем традиционный подход к построению критерия на основе
метода огибающих, при котором число модельных повторностей было невелико s = 99.
Результаты представлены на Рис. 3а).
Прежде всего отметим, что кривая, соответствующая описательной функции
F̂1 (r), оцененной по данным, выходит за границы области, образованной кривыми,
полученными по 99 модельным повторностям. Таким образом, традиционный метод
огибающих дает основания отклонить нулевую гипотезу. Далее, вычисление оценки
вероятности ошибки первого рода, соответствующей построенным огибающим, дает
величину 0.48. Таким образом, заключение, что нулевая гипотеза должна быть отклонена, следует пересмотреть, так как размер критерия представляется слишком
большим, чтобы вывод был надежным.
Повторное построение огибающих с числом s = 999 модельных повторностей
представлено на Рис. 3б). В данном случае оценка вероятности ошибки первого рода
39
;
Рис. 3: Метод огибающих для данных из работы [15]. Число модельных повторностей
а) s = 99, б) s = 999. Кривая, показанная жирной линией, соответствует эмпирической
функции F̂ (r). Кривые, соответствующие модельным повторностям, показаны серым,
огибающие показаны разрывной линией.
составляет приблизительно 0.08, что представляется приемлемой величиной для применения критерия. Однако, теперь эмпирическая функция F̂1 (r), лежит полностью
между огибающими, поэтому мы не имеем достаточных оснований для того, чтобы
отклонить нулевую гипотезу H0 на уровне значимости 8%.
Таким образом, мы можем заключить, что применение модифицированного метода огибающих ведет к получению новой информации об анализируемых данных, В
качестве объяснения можно предположить, что объем данных слишком мал (134 точки), чтобы надежно обнаружить слабую корреляцию между марками. С экологической точки зрения полученный результат может быть объяснен тем обстоятельством,
что лесное насаждение подвергалось рубкам ухода, причем, оставлялись в основном
хорошо развитые деревья. Такая процедура ведет к тому, что эффект конкуренции
становится мало выраженным, формируя относительно однородное по диаметрам сообщество с небольшими корреляциями в размерах соседних деревьев.
В Приложение вынесено описание разработанного комплекса программ и некоторые листинги программного кода.
Основные результаты и выводы:
1) В работе предложены и изучены модели, описывающие пространственно распределенные системы взаимодействующих объектов, которые применимы к широкому
кругу задач, возникающих в популяционной экологии растений.
2) Изученные в работе маркированные гиббсовские точечные поля могут быть
использованы как в качестве описания пространственной структуры растительного
40
сообщества, так и в качестве вероятностных моделей, позволяющих воспроизводить
специфические особенности взаимного расположения деревьев с учетом сложных механизмов взаимодействия между конкурирующими деревьями.
3) На многочисленных примерах экспериментальных данных показано, что различные типы размещения деревьев, в том числе смешанные регулярно-кластерные
размещения, характерные для разновозрастных древостоев, могут быть описаны с помощью моделей, соответствующих гиббсовским перестройкам пуассоновских случайных полей, и, следовательно, могут быть изучены в рамках наиболее информативного
подхода, основанного на анализе функции правдоподобия.
4) В работе введены новые теоретические понятия, такие как иерархический
потенциал взаимодействия и показано, что естественная иерархия взаимоотношений
растений может быть описана в рамках пространственных моделей с локальным взаимодействием с помощью нового класса многомерных точечных процессов с потенциальной функцией иерархического типа. Предложены модели случайных точечных
полей, способные описывать и анализировать пространственную структуру с учетом
асимметричного взаимодействия между объектами.
5) Предложен и обоснован новый метод оценивания параметров моделей гиббсовских точечных полей, использующий так называемую функцию оценивания с марковской структурой. Этот метод является практической альтернативой методу максимального правдоподобия, применение которого в контексте зависимых данных затруднено. Изучены свойства оценок параметров вероятностных моделей, получаемых
новым методом, и показано, что качество оценок предложенного метода в терминах
минимума стандартных ошибок превосходит качество метода (максимального псевдоправдоподобия), используемого в качестве стандартного.
6) Новый теоретический результат получен в области проверки статистических
гипотез, заключающийся в том, что доказано, что потеря мощности критериев значимости, описанная в литературе, когда точечный паттерн имеет смешанные регулярнокластерные свойства, может быть устранена с помощью применения критериальной
статистики пирсоновского типа, которая обобщает классический тест хи-квадрат на
случай зависимых данных.
7) Развиты средства диагностики параметрических моделей гиббсовских точечных полей. Эти методы могут быть полезны на предварительной стадии анализа согласия модели и данных. Предложенные методы могут быть использованы как средства диагностики при мониторинге сходимости марковских цепей в практике применения методов Монте-Карло (MCMC).
8) Несоответствие между глобальным характером проверки гипотезы и локальными выводами в задаче проверки согласия модели и пространственных данных устра-
41
нено рассмотрением проблемы с позиций проверки нескольких гипотез одновременно.
Предложен метод контроля вероятности ошибки первого рода для критерия согласия.
Разработан улучшенный метод огибающих, сочетающий наглядность графического
представления данных и строгость теоретических оснований.
9) Работа очерчивает возможности и перспективы теории статистических выводов относительно параметрических моделей случайных точечных полей, а также
демонстрирует связь с прикладными аспектами стохастической геометрии и пространственной статистики. Методы построения и идентификации вероятностно-статистических
моделей, предлагаемых в данной работе, расширяют инструментарий исследователяэколога, позволяя анализировать различные классы моделей, учитывающих специфические характеристики природных систем. Вычислительные алгоритмы, разработанные для анализа и моделирования больших случайных систем, являются основой
получения новых результатов в сложных моделях стохастической геометрии и пространственной статистики.
Список публикаций автора
Публикации в реферируемых изданиях, входящих в список ВАК для публикации
результатов диссертации на соискание ученой степени доктора наук, в которых
отражено основное содержание диссертации
1. Stoyan, D. Second-order characteristics for stochastic structures connected with
Gibbs point processes / D. Stoyan, P. Grabarnik // Mathematische Nachrichten. – 1991.
– V.151. – P. 95–100.
2. Stoyan, D. Statistics for the stationary Strauss model by the casp point method /
D. Stoyan, P. Grabarnik // Statistics. 1991. V. 22. pp. 283–289.
3. Gavrikov, V.L. Trank-top relations in a Siberian pine forest / V.L. Gavrikov, P.Ya.
Grabarnik, D. Stoyan // Biometrical Journal. – 1993. – V. 35. – P. 487–498.
4. Diggle, P. On parameter estimation for pairwise interaction point processes / P.
Diggle, T. Fiksel, P. Grabarnik, Y. Ogata, M. Tanemura, D. Stoyan // International
Statistical Review. – 1994. – V.62. – P. 99–117.
5. Goulard, M. Parameter estimation for marked Gibbs point processes through the
maximum pseudo-likelihood method / M. Goulard, A.Särkkä, P. Grabarnik // Scandinavian
Journal of Statistics. – 1996. – V.23. – P. 365–379.
6. Grabarnik, P. Simulation study of the geometrical properties of a maize crop root
system, and its consequences for root length density and root intersection density / P.
Grabarnik, P. Loic, G. Bengough // Plant and Soil. 1998. – V. 200. – P. 157–167.
42
7. Grabarnik, P. Interacting neighbour point processes: models for clustering / P.
Grabarnik, A. Särkkä // Journal of Statistical Computation and Simulation. – 2001. – V.
68. – P. 113–126.
8. Grabarnik, P. Goodness-of-fit test for complete spatial randomness against mixtures
of regular and clustered spatial point processes / P. Grabarnik, S.N. Chiu // Biometrika.
– 2002. – V.89. – P. 411–421.
9. Грабарник, П.Я. Статистическое моделирование и анализ данных лесной таксации для задач оценки биоразнообразия / П.Я. Грабарник , В.Э. Смирнов, И.Е. Сизов
// Лесоведение. – 2004. – №3. – C. 35–43.
10. Grabarnik, P. Contribution on the paper by A. Baddeley, R. Turner, J. Møller, M.
Hazelton "Residual analysis for spatial point processes"/ P. Grabarnik, others // Journal
of the Royal Statistical Society, Ser.B. – 2005, – V.67, – P. 600–601.
11. Grabarnik, P. Modelling the spatial structure of forest stands by multivariate point
processes with hierarchical interactions / P. Grabarnik , A. Särkkä // Ecological Modelling.
– 2009. – V. 220. – P. 1232–1240.
12. Eckel, S. Modelling tree roots in mixed forest stands by inhomogeneous marked
Gibbs point processes / S. Eckel, F. Fleischer, P. Grabarnik, M. Kazda, A. Särkkä, V.
Schmidt // Biometrical Journal. – 2009. – V. 51. – P. 522–539.
13. Грабарник, П.Я. Анализ горизонтальной структуры древостоя: модельный
подход / П.Я. Грабарник // Лесоведение. – 2010. – №2. – C. 77–85.
14. Grabarnik, P. Modelling the spatial and space-time structure of forest stands: How
to model asymmetric interaction between neighbouring trees / P. Grabarnik, A. Särkkä //
Procedia Environmental Sciences. – V.7. – 2011. – P. 62–67.
15. Grabarnik, P. Correct testing of mark independence for marked point patterns
/ P. Grabarnik, M. Myllymäki, D. Stoyan // Ecological Modelling.– 2011. – V. 22. – P.
3888–3894.
16. Грабарник, П.Я. О модели точечных конфигураций, заданной полупараметрическим взаимодействием / П.Я. Грабарник, В.В. Щербаков // Вестн. Моск. ун-та.
сер.1. Математика. Механика. – 2012. – №2. – C.3–8.
Публикации в сборниках научных трудов, коллективных монографиях, выпусках
научных и учебных заведений, а также представленных для публикации и находящихся в подготовке.
17. Грабарник, П.Я. Статистический анализ пространственных структур. Методы, использующие расстояния между точками. Экомодель-4. / П.Я. Грабарник, А.С.
Комаров // Материалы по математическому обеспечению ЭВМ. – Пущино: ОНТИ
НЦБИ. 1980. – 1–48 c.
18. Грабарник, П.Я. Статистический анализ горизонтальной структуры древо-
43
стоя / П.Я. Грабарник, А.С. Комаров // Моделирование биогеоценотических процессов. – Ред. В.В. Галицкий. – М.: Наука. 1981. – C. 81–89.
19. Грабарник, П.Я. Марковские модели пространственных точечных процессов
с несколькими типами точек / П.Я. Грабарник // Математическое моделирование
популяций растений и фитоценозов. – М., Наука. 1992. –C. 85–90.
20. Грабарник, П.Я. Анализ пространственной структуры древостоя: подход с
использованием корреляционных мер / П.Я. Грабарник, А.С. Комаров, Е.П. Носова,
С.С. Родин// Математическое моделирование популяций растений и фитоценозов. –
М., Наука. 1992. – C. 74–84.
21. Grabarnik, P. Some interaction models for clustered point patterns / P. Grabarnik,
A. Särkkä// Dep. Statistics, Gothenburg University, Research report 8. – Gothenburg.
1998. – 1–13 p.
22. Grabarnik, P. Some interaction models for clustered point patterns: application
to forestry. / P. Grabarnik, A. Särkkä // Proceedings of Conference on Stereology, Spatial
Statistics and Stochastic Geometry, Ed. V. Benes, J. Janacek, I. Saxl, – Prague. 1998.–
P.107–112.
23. Грабарник, П.Я. Моделирование пространственной структуры древостоев. /
П.Я. Грабарник //Моделирование динамики органического вещества в лесных экосистемах. А.С. Комаров, О.Г. Чертов и др. – М.: Наука. 2007, –C. 132–146.
24. Grabarnik, P. Contribution to discussion to the paper ҝModern statistics for
spatial point processesњ by J. Møller and R.P. Waagepetersen / P. Grabarnik, A. Särkkä
// Scandinavian Journal of Statistics. – 2007. – V.34. P. 691.
25. Bezrukova, M. DLES: A Component-Based Framework for Ecological Modeling
/ M. Bezrukova, V. Shanin, A. Mikhailov , N. Mikhailova, Y. Khoraskina, P. Grabarnik,
A. Komarov // Models of the Ecological Hierarchy: From Molecules to the Ecosphere. –
Eds F.Jordan and S.E. Jorgensen. Developments in Environmental Modelling Series . V.25.
Elsevier Science. 2012. – P. 331–354.
26. Myllymäki, M. On the power of deviation tests for spatial marked point patterns
/ M. Myllymäki, P. Grabarnik, H. Seijo, D. Stoyan // arXiv:1306.1028 [stat.ME]. – 2013.
– P. 1–26.
Свидетельства о регистрации программ для ЭВМ.
27. Свидетельство о государственной регистрации программы для ЭВМ
№2012619311. SPPS – программный комплекс моделирования и анализа точечных
структур (Spatial Point Pattern Statistics). Правообладатель: ФГБУН Институт физико-химических и биологических проблем почвоведения РАН (ИФХиБПП РАН). Авторы: Грабарник П.Я. Заявка №2012616906 от 15.08.2012. Зарегистрировано в Реестре
программ для ЭВМ 15.10.2012.
1/--страниц
Пожаловаться на содержимое документа