close

Вход

Забыли?

вход по аккаунту

?

Поисковые схемы для семантических моделей в системах типа социальной сети.

код для вставкиСкачать
М. В. Яковлева, В. М. Куглер
Поисковые схемы для семантических моделей
в системах типа социальной сети
Тема статьи связана с системой СЕМАНТИК, находящейся в стадии разработки, —
электронной библиотекой, в которой все файлы индексируются семантическими моделями.
С
истема СЕМАНТИК предназначена
для использования в качестве соци
альной сети, где множество пользо
вателей могут создавать объекты и зада
вать их свойства, с целью интеграции уси
лий по семантическому моделированию
и получения суммарного эффекта.
В системе СЕМАНТИК:
· поддерживаются свойства и семанти
ческие объекты;
· свойство характеризуется наименова
нием и типом данных: числовое, текстовое,
дата, ссылка на объект;
· объект характеризуется наименовани
ем и значениями своих свойств;
· типы объектов характеризуются на
именованием и множеством объектов, при
надлежащих данному типу.
Создавая объекты, пользователи могут
использовать индивидуальные ячейки, что
бы складывать эти объекты. Далее пользо
ватель выбирает один из двух режимов:
· глобальный — видны объекты из всех
ячеек;
· режим подключенных ячеек, которые
он сам выбирает, — видны только находя
щиеся в них объекты.
Такая избирательность объектов имеет
своими предпосылками авторство, качест
во описания, тематику, лексику.
С помощью ячеек строится система ин
дивидуальных и групповых прав пользова
телей (этот вопрос в данной статье не рас
сматривается).
В системе можно указывать синонимы
наименований объектов, свойств, типов
объектов. Благодаря созданию объектов
с разработанной синонимией можно вести
поиск в различной лексике.
Информационная аура объекта при про
стом поиске состоит:
· из наименования объекта;
· из текстовых свойств объекта — из на
именований свойств и их значений;
· из свойств типа «ссылка» — из наиме
нований свойств и наименований объектов,
являющихся их значениями;
· из наименования типа данного объекта.
Простой поиск состоит в указании поль
зователем ключевых слов. Результатом по
иска является выделение объектов, кото
рые содержат их в своей ауре.
В структурном поиске накладываются
условия на совокупность объектов:
· на наименования объектов;
· на значения свойств этих объектов
(путем выбора этих свойств из имеющихся
в системе).
Если свойство числовое или типа даты,
то условие может быть >,<,=. Если свойство
текстовое, то условие: какие слова (части
слов) есть в значении, а каких быть не
должно. Если ссылка, то условие определя
ет, на какие объекты системы свойство
ссылается.
Чтобы написать эффективный запрос,
следует знать, какие объекты и свойст
ва есть в системе. В системе с элемен
Вопросы теории R Информатика и информационные системы
87
тами социальной сети это сделать не
просто.
Псевдонимы и схемы
Лингвист или знающий тему специалист:
Поисковые схемы для семантических моделей в системах типа социальной сети
1) при создании новых объектов или
свойств пропишет полный список синони
мов их наименований;
2) при необходимости задаст все воз
можные синонимы при поиске.
Какое средство поможет при поиске
в системе, близкой по характеру к социаль
ной сети, если создание объектов и поиск
осуществляют люди, которые не в совер
шенстве знают тему, а значит, и лексику?
Поисковая схема предназначена для
сглаживания эффекта от различий в пред
ставлениях о лексике и структуре связей
пользователя, создающего объекты, и поль
зователя, создающего поисковый запрос.
Поисковая схема содержит:
· список псевдонимов объектов;
· список псевдонимов свойств с указа
нием, какой тип данных могут иметь соот
ветствующие им свойства системы;
· условия на наименования свойств и
объектов системы, соответствующих псев
донимам;
· описание связей между объектами и
свойствами системы, соответствующими
псевдонимам.
Поскольку в поисковом запросе необхо
димо задать условия на не известные в ис
ходный момент объекты, разумно ввести
псевдонимы (или переменные — как в урав
нениях математики), которым впоследствии
будут соответствовать конкретные объекты
и конкретные свойства системы.
Итак, потребуются два списка: псевдо
нимы объектов и псевдонимы свойств. На
звания псевдонимов создают мнемонику,
позволяющую пользователям свободно
оперировать ими. Подчеркнем: имена объ
ектов и свойств системы, соответствующие
88
псевдонимам, не обязаны совпадать с на
именованиями псевдонимов.
Далее за псевдонимами свойств закреп
ляются типы данных, поскольку в запросе
на значения соответствующих им свойств
могут накладываться условия, и формат
этих условий зависит от типа данных. Суще
ствуют 3 варианта:
· число;
· дата;
· текстовое или ссылка.
Затем накладываются условия на наиме
нования свойств и объектов, соответствую
щих псевдонимам. Формат такого условия:
1) наборы слов (подслов), которые долж
ны входить в наименование объекта (свой
ства), соответствующего псевдониму. Та
кие условия соединяются связкой ИЛИ (для
объекта объединяются имя объекта и имя
его типа; считается, что «слова есть», когда
они входят в такое объединенное имя);
2) перечень слов, которые не должны
содержаться в наименованиях объектов
(свойств), соответствующих псевдониму.
Описывается структурность. Формат
этих описаний:
< Псевдоним объекта 1> через <Псевдоним свойства
1> ссылается на <Псевдоним объекта 2>, обратная
ссылка через <Псевдоним свойства 2>.
Поисковые запросы,
основанные на поисковых схемах
Одну и ту же поисковую схему можно ис
пользовать для написания различных поис
ковых запросов.
Запрос состоит из следующих частей:
· ссылка на поисковую схему, на базе
которой он построен;
· условия на наименования объектов;
· условия на значения свойств объектов;
· указание, что является целью поиска
запроса.
Вопросы теории R Информатика и информационные системы
<Псевдоним объекта> <Псевдоним свойства> Усло
вие на значение.
Специалист по информатике, анализируя те
му, создал в системе поисковую схему, которая,
в частности, включает:
Псевдонимы объектов (в скобках — условие на на
именования, соответствующие псевдониму):
Министр иностранных дел (Слова есть: <Министр ино
странных дел> ИЛИ < Государственный секретарь>),
Условия на значение для чисел и дат за
даются как >,<,=.
Для псевдонимов свойств, которым со
ответствуют свойства с типом данных «тек
стовое» или «ссылка на объект», условие
имеет формат:
Человек (Слова есть: <Человек> ИЛИ <Персона> ИЛИ
<Мужчина> ИЛИ <Женщина> ИЛИ <Люди>),
1) наборов слов (подслов), которые долж
ны входить в значение1; такие условия со
единяются связкой ИЛИ;
2) перечня слов, которые не должны со
держаться в значении.
Государство (Слова есть: <Государство>, <Страна>).
Цель поиска определяется как псевдо
ним объекта из схемы. Соответствующие
ему объекты системы при выполнении усло
вий, задаваемых в схеме и в запросе, со
ставляют результат поиска.
Пример.
Два пользователя занесли в систему типа со
циальной сети следующую информацию (мини
стерство иностранных дел в разных странах на
зывается поразному).
Государство (Слова есть: <Государство>, <Страна>).
Псевдонимы свойств:
Исполнитель (Слова есть:
<Персона> ИЛИ <Человек>),
<Исполнитель>
ИЛИ
Структурные связи:
< Министр иностранных дел > через свойство < Го
сударство > ссылается на объект <Государство>
< Министр иностранных дел > через свойство < Ис
полнитель > ссылается на объект < Человек>
Пользователь 3, чтобы найти список всех ми
нистров иностранных дел, использует поиско
вую схему и строит свой запрос следующим об
разом:
Условие:
Что искать: Человек
Пользователь 4, чтобы найти министра ино
странных дел Ирландии, написал, используя по
исковую схему, запрос:
Тип объекта: Министр иностранных дел
Условие: на значение свойства < Государство >
объекта < Министр иностранных дел> (Слова есть:
<Ирландия>)
Объект: Министр иностранных дел Ирландии
Что искать: Человек
Пользователь 1
Свойства:
Персона: Micheа´l Martin TD
Государство: Ирландия
Пользователь 2
Тип объекта: Государственный секретарь
Объект: Государственный секретарь США
Свойства:
Исполнитель: Condoleezza Rice
Государство: USA
Следует сделать вывод. Использование
средства поисковых схем с псевдонимами
позволяет смягчить различия в представле
ниях пользователей, создающих информа
цию и выполняющих поисковые запросы, о
лексике и структуре связей используемых
объектов и тем самым успешно применять
совместно создаваемую информацию в со
циальной сети.
1
Под значением понимается текстовое значение свойства или наименование объекта, который является зна
чением свойства.
Вопросы теории R Информатика и информационные системы
89
М. В. Яковлева, В. М. Куглер
Условия на наименования объектов имеют
такой же формат, как для поисковой схемы.
Условия на значения свойств объектов
имеют формат:
Документ
Категория
Без категории
Просмотров
5
Размер файла
118 Кб
Теги
типа, социальная, система, сети, поисковых, моделей, схема, семантические
1/--страниц
Пожаловаться на содержимое документа