close

Вход

Забыли?

вход по аккаунту

?

Культурное наследие

код для вставкиСкачать
Ремарович С.С.
Области применения онтологий –
культурное наследие, биологические
системы
Институт программных систем НАН Украины
2012
1
Культурное наследие
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Что такое культурное наследие?
Разнообразие культурного наследия
Функции информации о культурном наследии
Онтология CIDOC CRM - ISO21127
Терминология CRM
Список сущностей (фрагмент)
Пример описания сущностей
Рассуждение о пространственной информации
Рассуждения о темпоральной информации
Сущности верхнего уровня CIDOC CRM
Основные идеи CRM
FRBRoo и исполнительные виды искусства (Performing Arts)
Другие онтологии: ABC, DOLCE
Главные Терминологические Системы
2
Что такое культурное наследие?
В более узком смысле мы можем рассматривать культурное
наследие как вещи, сохраненные учреждениями памяти, т.е.
музеями, архивами и библиотеками.
В действительности культурное наследие - больше чем
предметная область. Оно включает широкий спектр функций
исследования и сохранения вещественных доказательств всех
видов деятельности человека в прошлом.
Главные международные организации: Международный Совет
Музеев (International Council of Museums - ICOM), Международная
федерация библиотечных ассоциаций (International Federation of
Library Associations - IFLA) и Международный Совет Архивов
(International Council of Archives - ICA). Они поддерживают свои
политики и стандарты специфической документации.
Обработка информации обо всех видах вещей подразумевает
использование очень богатой терминологии, многоязычная и
часто специфическая для особых сообществ или даже
определенных ученых. Соглашение по общей терминологии
является трудным и эквивалентные термины на других языках
часто отсутствуют.
3
Разнообразие культурного наследия
Главные виды коллекций:
• история искусств и современные искусства (графика, живопись,
фотография, скульптура, архитектура, рукописи, религиозные
объекты);
• историческое наследие (соглашения, письма, рукописи, рисунки,
фотографии, фильмы, личные объекты, оружие);
• археология (черепки, скульптуры, инструменты, оружие,
домашние изделия, человеческие остатки);
• дизайн (мебель, столовая посуда, автомобили, и т.д.);
• наука и техника (машины, инструменты, оружие, транспортные
средства, известные эксперименты, открытия);
• этнология (костюмы, инструменты, оружие, домашние изделия,
религиозные объекты, и т.д.);
• неподвижные места (Immobile sites) (архитектура, скульптура,
горное искусство, пещеры);
• коллекции естествознания, такие как палеонтология, биоразнообразие, минералогия - также доказательства деятельности
человека (т.е. исследование) и следовательно культура.
4
Функции информации о культурном наследии
Виды информационных систем культурного наследия по
их главным функциям:
• управление коллекцией (приобретение, регистрация,
пополнение (“deaccession”), инвентарь, ссуды,
выставки, страховка, права, зоны защиты);
• сохранение (диагностика состояния, превентивные
меры, вмешательства, обработки и химические
вещества);
• научное исследование (исследование, описание,
интерпретация);
• представление (порталы, обучение, публикация).
Информация во всех этих системах частично совпадает и
должна быть взаимно доступной. Одна из основных
проблем управления информацией о культурном
наследии - способность к взаимодействию этих систем
и интеграция информации.
5
Проблема интеграции схемы
Большинство профессиональных информационных систем основано
на довольно сложных схемах баз данных. Например, CIDOC,
предложенная в 1995 г., стандартная реляционная схема для
музеев, содержит более чем 400 таблиц. Информация о
культурном наследии распределена во многих разных системах,
которые дополняют друг друга. Например, один источник может
связать римские имена с римскими надписями, другой - римские
надписи с камнями, следующий - камни с местом обнаружения и
другой - места с координатами.
Онтология CIDOC CRM (Conceptual Reference Model )(теперь
ISO21127, с 2006 г.) в настоящее время является наиболее
разработанной онтологией для интеграции информации о
культурном наследии.
CIDOC CRM - формальная онтология, которая предназначена, чтобы
облегчить интеграцию, посредничество и обмен гетерогенной
информацией о культурном наследии. Была разработана
междисциплинарными командами экспертов, которые
представляют такие области как информатика, археология,
музейная документация, история искусств, естествознание,
библиотечная наука, физика и философия, под эгидой
Международного комитета Документации (CIDOC)
Международного Совета Музеев (ICOM).
6
ISO21127
CIDOC CRM онтология представлена в текстовой форме,
чтобы продемонстрировать независимость от
форматов представления знаний. Существует
формальное определение в TELOS.
CRM отличает отдельные классы от свойств (бинарные
отношения). Свойства являются направленными и
двунаправленными с определенными метками для
каждого направления.
Использует строгое многократное наследование (без
исключений) для классов и свойств, предусматривает
многократное создание экземпляра (instantiation), т.е.
один определенный элемент может быть экземпляром
больше чем одного класса.
Существуют эквиваленты в KIF, RDFS и OWL.
Содержит 80 классов и 132 свойства.
7
Терминология CRM
• "Entity" для чего-либо, что можно назвать "классом",
"сущностью" или "узлом“(“class”, “entity” or “node” ).
• "Links" для чего-либо, что можно назвать "атрибутом",
"ссылкой", "связью" или "свойством“(“attribute”, “reference”, “link”,
or “property” ).
• “ Superclass - Subclass” отношения относятся к “isA”
отношениям, “подкласс – суперкласс”, “родительский класс производный класс”, “обобщение - специализация”, и т.д
(“subclass – superclass”, “ parent class - derived class”,
“generalization - specialization”).
По умолчанию все ссылки (links) (или свойства) рассматриваются
как необязательные(optional), и потенциально
многократные(multiple). Ссылки строго наследуются
подклассами. У ссылок могут самостоятельно быть ссылки,
которые указывают на другие сущности.
8
Список сущностей (фрагмент)
E1 CRM Entity
E2 - Temporal Entity
E3 - - Condition State
E4 - - Period
E5 - - - Event
E7 - - - - Activity
E8 - - - - - Acquisition
E9 - - - - - Move
E10 - - - - - Transfer of Custody
E11 - - - - - Modification
E12 - - - - - - Production
E13 - - - - - Attribute Assignment
E14 - - - - - - Condition Assessment
E15 - - - - - - Identifier Assignment
E16 - - - - - - Measurement
E17 - - - - - - Type Assignment
E65 - - - - - Conceptual Creation
E66 - - - - - Formation
E63 - - - - Beginning of Existence
E67 - - - - - Birth
E12 - - - - - Production
E65 - - - - - Conceptual Creation
E66 - - - - - Formation
E64 - - - - End of Existence
E6 - - - - - Destruction
E68 - - - - - Dissolution
E69 - - - - - Death
E72
E18
E19
E20
E21
E22
E23
E24
E22
E23
E25
E26
E27
E21
E25
E71
E24
E22
E23
E25
E28
E73
E23
-
Stuff
- Physical Stuff
- - Physical Object
- - - Biological Object
- - - - Person
- - - Man-Made Object
- - - - Iconographic Object
- - Physical Man-Made Stuff
- - - Man-Made Object
- - - Iconographic Object
- - - Man-Made Feature
- - Physical Feature
- - - Site
- - - Person
- - - Man-Made Feature
- Man-Made Stuff
- - Physical Man-Made Stuff
- - - Man-Made Object
- - - - Iconographic Object
- - - Man-Made Feature
- - Conceptual Object
- - - Information Object
- - - - Iconographic Object
9
Пример описания сущностей
E1 CRM Entity
Belongs to: Meta Entity
Superclass of:Temporal Entity
Actor
Appellation
Contact Point
Time-Span
Place
Dimension
Type
Number
Stuff
Legal Object
Scope note: This is the abstract concept of the entities of our universe of discourse. It carries the rule that all entities
can be classified by a type, which further refines the specific subclass an instance belongs to, and a free text field
for anything we want to express and that is not captured by formal links.
Properties:
identification
is identified by (identifies): Appellation
classifications
has type (is type of): Type
other descriptions
has note: String
(has type : Type)
The entity is referenced by:
Type Assignment: classified (was classified by)
Document: documents (is documented in)
Conceptual Object: refers to (is referred to by)
(has type : Type)
End of Existence: took out of existence (was taken out of existence by)
10
Beginning of Existence: brought into existence (was brought into existence by)
E4 Period
Belongs to:
Subclass of:
Superclass of:
Period Type
Temporal Entity
Event
Scope note: A period is characterized by a coherent set of phenomena and or manifestations (explicitly intended or not),
which are assumed to have taken place over a certain space and time.
Examples: Glacial period, bronze period, Ming Dynasty, Impressionism, Neolithic Period, Mc Carthy Era, The Sixties,
Niniveh, 'Sturm und Drang'.
Properties:
identifications
is identified by (identifies): Appellation
classifications
has type (is type of): Type
spatial definitions
took place at (witnessed): Place
spatial definitions, short cut
took place on or within (witnessed): Physical Object
temporal definitions
has time-span (is time-span of): Time-Span
structures
consists of (forms part of): Period
falls within (contains): Period
other descriptions
has note: String
(has type : Type)
The entity is referenced only by itself.
The entity inherits references:
Type Assignment: classified (was classified by)
Document: documents (is documented in)
Conceptual Object: refers to (is referred to by)
(has type : Type)
Beginning of Existence: brought into existence (was brought into existence by)
End of Existence: took out of existence (was taken out of existence by)
11
Рассуждение о пространственной информации
CIDOC Entity
Conta ct Point
Actor
Appel lation
Place
0,n
Physi cal Entity
consists of (forms part of)
0,n
0,n
0,n
0,n
0,n
has contact poi nts (provi des access to)
i denti fi es (i s identified by)
0,n
Place Appel lation
has secti on (is l ocated on or within)
0,n
Addre ss
Spati al Coordinates
Place Nam e
Physi cal Obj ect
Section Defi nition
defines secti on (has section defini ti on)
0,n
0,n
12
Рассуждения о темпоральной информации
C R M E n tity
f a lls w ith in (c o n ta in s)
c o n sists o f (f o rm s p a rt o f )
0 ,n
0 ,n
T e m p o ra l E n tity
0 ,n
T im e S p a n
A p p e lla tio n
P la c e
0 ,n
0 ,n
0 ,n
h a s tim e -sp a n (is tim e -sp a n o f )
0 ,n
is id e n tif ie d b y (id e n tif ie s)
0 ,n
0 ,n
T im e A p p e lla tio n
P e rio d A p p e lla tio n
0 ,n
f a lls w ith in (c o n ta in s)
c o n sists o f (f o rm s p a rt o f )
0 ,n
C o n d itio n S ta te
P e rio d
0 ,n
D a te
0 ,n
0 ,n
0 ,n
0 ,n
E v ent
is c a lle d (id e n tif ie s)
to o k p la c e a t (w itn e sse d )
13
Сущности верхнего уровня CIDOC CRM
14
Папа Римский Leo І встречает Attila
15
Основные идеи CRM
1.
2.
Возможная двусмысленность отношений между сущностями и
идентификаторами («Appellations» – "Названия"), которые
используются, чтобы обратиться к сущностям, которые
являются частью исторической действительности, которые
будут описаны онтологией. Поэтому, CRM отличает узлы,
представляющие реальные элементы, от узлов,
представляющих только названия элемента.
"Type" и системы классификации являются не только средством,
чтобы структурировать информацию о действительности с
внешней точки зрения, но также и частью исторической
действительности как человеческие изобретения. Как таковые,
они подпадают под “Conceptual Objects”, наследуя свойства
создания, использования и т.д. Точно так же вся документация
видится как часть действительности, и может быть описана
непосредственно вместе с описанным содержанием. С этой
проблемой материализации не имеют дело текущие языки
онтологии. CRM вынужден использовать некоторые
искусственные приемы, которые мы не анализируем здесь.
16
Основные идеи CRM (продолжение)
3.
Нормальный человеческий способ проанализировать прошлое
состоит в том, чтобы разделить развитие сущностей на дискретные
события в пространстве и времени. Таким образом, описанное
прошлое может быть сформулировано как серия событий,
вовлекающих “Persistent Items” (постоянные элементы) (названные
endurants) подобно Physical Things и Persons. Соединение
элементов, мест и времени через события создает понятие " worldlines (мировых линий)" вещей, встречающихся в пространстве и
времени (см. рис.). События, замеченные как процессы
произвольного масштаба, обобщены как “Periods" и далее как
“Temporal Entities” (названные perdurants). Последние два класса
непосредственно связаны с пространством и временем в
онтологии.
17
Основные идеи CRM (продолжение)
4.
Невещественные объекты (“Conceptual Objects”) являются
элементами, которые могут быть созданы, но могут находиться
больше чем на одном физическом носителе в то же самое время,
включая человеческие мозги. Невещественные элементы могут
присутствовать в событиях через соответствующие физические
информационные носители (см. рис.). Невещественные элементы
не могут быть разрушены, но они исчезают, когда последний
носитель потерян.
18
FRBRoo и исполнительные виды искусства
(Performing Arts)
Модель FRBR (Functional Requirements for Bibliographic Records Функциональные Требования для Библиографических записей)
была разработана как модель сущность-отношение
исследовательской группой, назначенной Международной
федерацией Библиотечных ассоциаций и Учреждений
(International Federation of Library Associations and Institutions IFLA) в 1991–1997г.г. В 1998 она была издана.
Отличает четыре уровня абстракции - от понятия до книги в моих
руках: Работа, Выражение, Проявление, Пункт (Work,
Expression, Manifestation, Item).
Формирование в 2003 г. Международной Рабочей группы по
гармонизации FRBR/CIDOC CRM.
Цель - выразить модель IFLA FRBR понятиями, онтологической
методологией и соглашениями нотации, обеспеченными CIDOC
CRM, и слить две объектно-ориентированные модели.
19
FRBRoo (продолжение)
2008 г. - заключительный проект FRBRoo, то есть объектноориентированная версия FRBR, согласованная с CIDOC CRM. Эта
формальная онтология предназначена, чтобы охватить и
представить основную семантику библиографической информации
и облегчить интеграцию, посредничество и обмен
библиографической и музейной информацией.
Главное новшество FRBRoo - реалистическая, явная модель
интеллектуального процесса создания, которая должна быть
развита далее в будущем в пользу библиотекарей и ученых из
различных музейных дисциплин. FRBRoo делает фундаментальное
различие между внутренними представлениями нашего ума (Work),
наборами знаков или символов, которые человек может
интерпретировать (Expression), и физическими информационными
носителями.
Текущая версия FRBRoo включает модель исполнительных видов
искусства (performing arts), соединяя интерпретацию театральных
игр с записью и документацией действий. Отличает и связывает
три интеллектуальных вклада (работы) создания игры,
интерпретации и записи со связанными символическими формами
и физическими носителями.
20
Другие онтологии
Онтология ABC - результат Проекта Гармонии, который
финансировался совместно Технологическим Кооперативным
Научно-исследовательским центром Распределенных Систем
(Distributed Systems Technology Cooperative Research Centre - DSTC)
(Австралия), Объединенным Комитетом по Информационным
системам (Joint Information Systems Committee - JISC)
(Великобритания) и Инициативой Национального научного фонда
Цифровых Библиотек (National Science Foundation Digital Libraries
Initiative - NSF DLI2) (США).
Цель - потребность объединить информацию от множества жанров
мультимедийной информации в пределах цифровых библиотек.
Содержит13 классов и 14 свойств. Как CIDOC CRM, ABC описывает
темпоральность.
ABC включает оба понятия "events" и " situations", которые
соответственно моделируют переходы (transitions) (т.е. глаголы) и
экзистенциальные свойства. ABC основывается на понятиях,
развитых в модели FRBR. Эти понятия – работы, выражения,
проявления и пункты – дают ABC возможность связать сущности, у
которых есть общее происхождение интеллектуальной
собственности.
21
Графическое представление Модели ABC (пример)
Рассказ в качестве примера: 14 июня 2001 в Wesley Hospital, была доставлена девочка 8
фунтов 11 унций к родителям Jill и John Smith. Акушеркой при доставке была Jane Kildare и
акушером был Carl Nightingate.
Этот пример демонстрирует, как Action type детализирует, или более узко определяет действия,
которые происходят в Event. Agent Role далее детализирует или более узко определяет
роль определенных агентов в действии.
22
Другие онтологии (продолжение)
Онтология DOLCE (Descriptive Ontology for Linguistic and
Cognitive Engineering) - продукт переработки основных
концептов WordNet, лингвистический ресурс, полученный
из словарей, обогащенных на основе теории
основополагающих отношений, таких как участие, частьцелое, состав и т.д. Строго сформулировано в логике,
делая ее довольно трудной для экспертов области, чтобы
постигать и использовать ее. В отличие от CRM,
пространство и время рассматриваются как зависимые
свойства вещей, а не как вещи, существующие в
потенциально пустом пространстве-времени –
единственная, но глубокая несовместимость между
обеими онтологиями.
23
Характеристики онтологий для культурного
наследия
Культурное наследие может быть рассмотрено как
материальное доказательство деятельности человека в
прошлом. Поэтому:
• информация является мезоскопической, т.е. в
человеческом масштабе, ни астрономической, ни
микроскопической, за исключением микроскопического
анализа следов и материалов. Информация дискретна. О
процессах сообщают или становятся очевидными как
дискретные события, вовлекающие дискретные вещи, в
отличие от геологического или метеорологического
явления;
• информация является центральным событием. Вещи,
люди и идеи соединяются и имеют отношение через
события;
• описание является ретроспективным, в отличие от
информации, чтобы планировать будущее.
24
Терминология в культурном наследии
Терминология для библиотекарей - обеспечение доступа к
информации.
Терминология культурного наследия - поддержка построения
гипотезы. Поэтому терминология культурного наследия могла
быть разделена на верхний, устойчивый уровень, подходящий
для поиска, и более низкий изменчивый уровень, который
поддерживает построение гипотезы.
Проблема с классификацией материальных объектов - различные
аспекты (aspects) (facets), под которыми может быть сделана
классификация. Доминирующие аспекты - функция объекта, его
формы или появления, элементы или принципы конструкции. Эти
три аспекта частично связаны. Например, у типичного молотка
могут быть классическая форма и конструкция, но
моторизованный молоток может только разделить функцию, но
не другие аспекты. Другие аспекты - формы, определенные для
исторических периодов или стран. Результат может сбить с толку
редакторов тезауруса и онтологии, при построении иерархии IsA,
и может ввести в заблуждение пользователей, когда они
применяют термины классификации.
25
Главные Терминологические Системы
AAT (Art & Architecture Thesaurus )- самая широко распространенная онтология в
культурном наследии. Ее тема - искусство и архитектура, но покрывает широкий
диапазон археологических и этнологических материалов, а также любые виды
объекта, которые могут быть предметом искусства. Построена для фасетной
классификации. Ее главные фасеты: Действия (Activities), Агенты (Agents), Материалы
(Materials), Объекты (Objects), Физические атрибуты (Physical Attributes), Стили &
Периоды (Styles & Periods), Связанные Концепты (Associated Concepts). Используются
отношение IsA. Ее первоначально моноиерархическая (“tree") обобщенная структура
была расширена до полииерархической (направленый нециклический граф).
English Heritage ( EH) поддерживает большие тезаурусы терминов для мобильных и
неподвижных объектов для Соединенного Королевства, а также французский тезаурус
MERIMEE.
SHIC - система классификации деятельности человека, для описания музейных
экспонатов несколькими британскими музеями. Вместо того, чтобы характеризовать
объект, рассматривается только функция или полезность объекта для деятельности
человека.
ICONCLASS - единственная широко распространенная система для иконографической
классификации.
CAMEO - доступный для поиска информационный центр, созданый Музеем
изобразительных искусств, Бостон.
База данных MATERIALS содержит химическую, физическую, визуальную и
аналитическую информацию о более чем 10 000 исторических и современных
материалах, используемых в производстве и сохранении артистических,
архитектурных, археологических и антропологических материалов. Она предлагает
только поиск по ключевым словам и алфавитный порядок.
26
Источники (культурное наследие)
1. Martin Doerr, “Ontologies for Cultural Heritage” (Steffen Staab, Rudi Studer,
“Handbook on Ontologies”, Second Edition, Springer)
2. M. Doerr, “The CIDOC CRM - An Ontological Approach to Semantic Interoperability
of Metadata”, AI Magazine, 24(3), 2003
3. Carl Lagoze, Jane Hunter, "The ABC Ontology and Model", DC-2001, International
Conference on Dublin Core and Metadata, Tokyo, October 2001,
http://metadata.net/harmony/lagoze_hunter_dc2001.pdf
4. http://www.cidoc-crm.org/technical_papers.html
27
Онтологии для формального представления
биологических систем
•
•
•
•
•
•
•
•
Онтологические артефакты
Цели использования онтологий в биомедицинском исследовании
Построение гипотез и моделей биологических систем
Задачи разработки формального представления
Роль Семантической паутины
Примеры онтологий
Foundational Model of Anatomy - FMA
Основополагающие принципы дисциплинированного
моделирования
• Схема основных классов АТ(Anatomy Taxonomy)
• Примеры определений классов
• Схема Анатомической Структурной Абстракции (ASA)
• Схема Абстракции Анатомического Преобразования (ATA)
• Среда моделирования знаний - Protégé-2000
• Архитектура Anatomy Information System - AIS
28
Онтологические артефакты:
- управляемые словари (controlled vocabularies - CV). CV
обеспечивает список терминов, которые используются обычно,
чтобы индексировать записи в базе данных. Генная онтология
(Gene Ontology - GO) наиболее широко использует CV.
- информационная модель (модель данных) описывает, как
различные части информации связаны друг с другом. Microarray
Gene Expression Object Model (MAGE-OM) является примером
информационной модели.
- онтология - спецификация сущностей (или понятий) и отношений
между ними в области обсуждения; наряду с декларациями
свойств каждого отношения и набором явных аксиом,
определенных для этих отношений и сущностей. Примером
является Foundational Model of Anatomy (FMA) основополагающая модель анатомии, которая представляет
классы и отношения, необходимые для символического
моделирования структуры человеческого тела, в форме,
которая является понятной людям и является также
управляемой, синтаксически анализируемой и поддающаяся
толкованию машинными системами.
29
Использование онтологий в биомедицинском
исследовании
- интегрировать разнообразную информацию о
биологических системах, чтобы
сформулировать гипотезы
- создать базы знаний, чтобы получить
соответствующие факты, организовать и
интерпретировать несопоставимые знания,
вывести неочевидные отношения и оценить
гипотезы, выдвигаемые учеными
- использование онтологий для формального
представления биологических систем
30
Построение гипотез и моделей биологических
систем
Задачи процесса биомедицинского исследования :
• сбор информации различных типов о биологических
объектах, которые участвуют в биологическом
процессе;
• формулирование гипотезы (или модели) об
отношениях среди этих объектов;
• исследование различных данных, чтобы оценить
степень, до которой поддерживается гипотеза;
• совершенствование гипотезы, чтобы достигнуть
самого лучшего соответствия с данными.
31
Построение гипотез и моделей биологических
систем (продолжение)
Требуемые свойства формального представления для моделей
биологических процессов:
1). Возможность представить структуру, функции и динамику
биологического процесса.
2). Формальное представление должно включать объединенную
онтологию, которая однозначно идентифицирует объекты и
отношения в процессе.
3). Возможность представить биологические процессы в различных
масштабах и позволить иерархическое представление
подпроцессов, чтобы управлять сложностью.
4). Возможность включать новые данные и новые категории
информации.
5). Концептуальная (математическая) платформа должна
позволять проверку системных свойств, используя
моделирование и/или логические механизмы вывода.
6). Представление должно иметь интуитивную визуальную схему.
32
Задачи разработки формального
представления
Представление знаний. Представление различных видов биологических
объектов, участвующих в любом процессе болезни, и многих
качественно различных видов отношений между ними. Необходимы
различные онтологии, чтобы представлять биологические процессы
на разных уровнях детализации, поскольку биологические процессы
и соответствующие данные можно рассматривать на переменных
уровнях детализации, в пределах от молекулярных механизмов до
общих процессов, таких как деление клетки, и от матриц исходных
данных до качественных отношений.
Концептуальное представление. Концептуальная структура
биологической системы позволяет рассуждать о биологической
системе и выполнять мысленные эксперименты. Концептуальная
основа для представления биологических систем должна вмещать
модульный принцип и темпоральное поведение биологических
систем. Концептуальные основы, используемые, чтобы представить
биологические модели, изменяются от уравнений полного
дифференциала до булевских выражений, от сетей Байеса, сетей
Петри до исчисления процессов, специальных логик и систем
правил.
Знания и сбор данных. Сбор, хранение и кодирование существующей
информации. Информация находится в отдельных репозитариях, с
пользовательскими форматами хранения и разнообразными
методами доступа.
33
Роль Семантической паутины
Ожидание от Семантической паутины в науках о жизни
состоит в том, что отношения, которые существуют
неявно в умах ученых, будут явно объявлены
(используя онтологии OWL) и затем использоваться,
чтобы агрегировать геномные, белковые, клеточные,
физиологические
и
химические
данные.
Семантические определения зададут, какие объекты
связаны с другими и как. Такое связывание позволит
семантическим инструментам вытащить вместе
разнообразную
информацию,
представить
ее
способом, определенным пользователем, и возможно
рассуждать над сопоставленной информацией,
чтобы получить новое понимание.
34
Примеры онтологий
• Gene Ontology - http://www.geneontology.org
Главная инициатива биоинформатики с целью стандартизации
представления гена и атрибутов генных продуктов по
разновидностям и базам данных. Проект обеспечивает
управляемый словарь терминов для того, чтобы описать
характеристики генного продукта и данные аннотации генного
продукта от участников GO Consortium , а также инструменты,
чтобы получить доступ и обработать эти данные.
• Foundational Model of Anatomy (FMA) -
http://fma.biostr.washington.edu
Является доменной онтологией концептов и отношений, которые
принадлежат структурной организации человеческого тела. FMA
как ссылочная онтология в биомедицинской информатике,
чтобы коррелировать другие представления анатомии,
выравнивая существующие и появляющиеся онтологии в
онтологиях биоинформатики и обеспечивая структурный
шаблон для представления биологических функций.
35
Foundational Model of Anatomy - FMA
Модель содержит 70 000 различных
анатомических понятий — представление
структур от некоторых макромолекулярных
комплексов и компонентов клетки к главным
частям тела. Эти понятия связаны более чем
с 110 000 термов и связаны друг с другом
более чем 1.5 миллионами экземпляров из
более чем 170 видов отношений.
Подход к моделированию дисциплинированное моделирование
(disciplined modeling).
36
Основополагающие принципы
дисциплинированного моделирования
• Объединенный контекстный принцип. Абстракция должна
соответствовать строго структурному контексту.
• Принцип абстрактного уровня. Абстракция должна
моделировать каноническую анатомию и служить основой для
анатомических вариантов, но должна исключить
инстанцированную анатомию (instantiated anatomy).
• Принцип специфики разновидностей. Начальная итерация
абстракции должна смоделировать анатомию Homo sapiens, но
одновременно она должна служить платформой для анатомии
других млекопитающих и, в конечном счете, других видов
позвоночных.
• Принцип определения. Определение атрибутов класса в модели
должно быть определено в терминах физических и других
структурных (т.е., анатомических) атрибутов анатомических
сущностей, которые включает класс.
• Принцип доминирующего концепта. Доминирующий класс
онтологии– это класс, в отношении которого в онтологии
определены другие классы.
37
Основополагающие принципы
дисциплинированного моделирования
(продолжение)
•
•
•
•
•
Принцип организационного элемента (Organizational unit principle).
Абстракция должна иметь два элемента, с точки зрения которых
определены подклассы Анатомической структуры (Anatomical
structure): Клетка (Cell) и Орган (Organ).
Принцип ограничения контента. Самая большая представленная
анатомическая структура должна быть целым организмом (в текущей
итерации, человеческое тело) и самое маленькое Биологическая
макромолекула. Если возникает потребность, молекулы, не
синтезируемые через выражение собственных генов организма, должны
быть представлены в отдельных онтологиях.
Принцип ограничения отношения. Абстракция должна моделировать три
типа отношений, которые появляются между анатомическими
сущностями: 1) отношения категоризации класса; 2) статические
физические отношения; 3) отношения, которые описывают
преобразование анатомических сущностей во время онтогенеза
(индивидуальное развитие) организма.
Принцип когерентности. У абстракции должен быть один корень,
Anatomical entity, который включает все объекты (entity), которые
касаются структурной организации тела; понятия, относящиеся к этим
объектам, должны быть расположены в единственной и всеобъемлющей
иерархии категоризации класса наследования.
Принцип представления. Абстракция должна быть смоделирована как
онтология анатомических концептов и должна разместить все
38
поименованные соглашения, связанные с этими концептами.
Высокоуровневая схема
FMA = (АТ, ASA, ATA, Mk),
где АТ - Таксономия Анатомии (Anatomy Taxonomy);
ASA - Анатомическая Структурная Абстракция (Anatomical
Structural Abstraction) описывает разделительные (meronymic)
(partitive (meronymic)) и пространственные отношения
понятий, представленных в таксономии;
ATA - Абстракция Анатомического Преобразования (Anatomical
Transformation Abstraction) описывает морфологические
преобразования с временной зависимостью понятий,
представленных в таксономии во время жизненного цикла
человека, который включает пренатальное развитие,
послеродовой рост и старение;
Mk - Метазнания (Metaknowledge), которые включают принципы и
наборы правил, согласно которым представляются отношения в
других трех компонентных абстракциях модели.
39
Схема основных классов АТ
Anatomical
Entity
- is a -
Physical
Anatomical Entity
Non-physical
Anatomical Entity
Anatomical
Relationship
Material Physical
Anatomical Entity
Non-material Physical
Anatomical Entity
Anatomical
Structure
Body Substance
(вещество)
Biological
Macromolecule
Cell
Part
Anatomical space
Cell
Tissue
(ткань)
Organ
Part
Organ
Organ
System
Body
Part
Human
Body
40
Примеры определений классов
Anatomical entity is a biological entity,
which constitutes the structural organization of a
biological organism,
or is an attribute of that
organization.
Anatomical structure is a material physical anatomical entity
which has inherent 3D shape;
is generated by coordinated expression of the organism’s own
structural genes;
consists of parts that are anatomical structures;
spatially related to one another in patterns
determined by coordinated gene expression.
Cell is a anatomical structure
which consists of cytoplasm surrounded by a plasma
membrane
with or without the cell nucleus.
41
Примеры определений классов (продолжение)_
Organ is an anatomical structure,
which consists of the maximal set of organ parts
so connected to one another that together
they constitute a self-contained unit of macroscopic anatomy
morphologically distinct from other such units.
Organ part is an anatomical structure,
which consists of two or more types of tissues,
spatially related to one another in patterns determined by
coordinated gene
expression;
together with other contiguous organ parts it constitutes an organ.
Tissue is an anatomical structure,
which consists of similarly specialized cells and intercellular matrix,
aggregated according to genetically determined spatial
relationships.
42
Часть таксономии структурных отношений
43
Схема Анатомической Структурной Абстракции
(ASA)
ASA
Anatomical Structural
Abstraction
DT
Dimensional
Taxonomy
Bn
Boundary
network
Pn
Part-of
network
SAn
Spatial
Association
network
Ln
Location
network
CTMn
Containment
network
AJn
Adjacency
network
On
Orientation
network
QCn
Qualitative
coordinate
network
CTn
Continuity
network
Cn
Connectivity
network
ATn
SYn
Attachment
network
Synaptic
Connectivity
network
44
Схема Абстракции Анатомического Преобразования (ATA)
ATA
Anatomical Transformation Abstraction
DevT
Developmental
Taxonomy
A1
Immediate
Precursor
DL
Developmental
Lieneage
D1
Immediate
Descendant
∆Pt
Phenotype
Change
DStrT
DSpT
DPT
Developmental
Structure
Taxonomy
Developmental
Space Taxonomy
Developmental
Process
Taxonomy
TAg
Transformating
Agent
Sc
Source of TAg
PTr
Phenotypic
Transformation
Tg
Target of TAg
PC1
Immediate
Precursor
Rn
Regulatory
Networks
S1
Immediate
Descendant
DPT
Developmental
Time Parameter
∆Pt
Phenotype
Change
POT
Post-ovulatory
Time
Gf
Gene
facilitated
Gr
Gene repressed
Prop
Propagation of
TAg
DSt
Developmental
Stage
∆Pt
Phenotype
Change
45
Среда моделирования знаний - Protégé-2000
Фрейм концепта Vertebra
46
Среда моделирования знаний - Protégé-2000
Разнообразие терминов, связанных с понятием Uterine tube
47
Среда моделирования знаний - Protégé-2000
Отношения приписанной смежности и преемственности для
понятия Esophagus (пищевод)
48
Архитектура Anatomy Information System - AIS
Protege
Emily
GAPP
FME
GOQAFMA
Image
Manager
Other agents and
interfaces
Other agents and
interfaces
Image
Server
Image
Database
Annotated
Image
FMA
Server
FMA
3D Model
Server
Model
Database
3D
Models
49
Источники (биосистемы)
1. Nigam Shah, Mark Musen, “Ontologies for Formal Representation of Biological
Systems” (Steffen Staab, Rudi Studer, “Handbook on Ontologies”, Second Edition,
Springer)
2. C. Rosse, J. L. V. Mejino, “A reference ontology for biomedical informatics:
the foundational model of anatomy”, J Biomed Inform, 36(6):478–500, Dec 2003.
3. http://fma.biostr.washington.edu
50
Документ
Категория
Презентации
Просмотров
20
Размер файла
1 128 Кб
Теги
1/--страниц
Пожаловаться на содержимое документа