close

Вход

Забыли?

вход по аккаунту

?

Ипсэт (информационно-поисковая система экспертного типа по гуманитарным наукам) как аналог философской машины Раймонда Луллия..pdf

код для вставкиСкачать
Новые технологии
4. Люгер Дж. Искусственный интеллект. -М.: Изд. «Вильямс», 2003.
5. Дьячук П.П., Бортновский С.В. Пооперационный контроль в динамическом компьютерном тестировании // Международная конференция, «Образование 21 века», -Красноярск, -2002. -С. 157–158.
ИПСЭТ (ИНФОРМАЦИОННО–ПОИСКОВАЯ СИСТЕМА
ЭКСПЕРТНОГО ТИПА ПО ГУМАНИТАРНЫМ НАУКАМ) КАК
АНАЛОГ ФИЛОСОФСКОЙ МАШИНЫ РАЙМОНДА ЛУЛЛИЯ
А.Г. Егоров, к.ф.н., доц. кафедры Философии,
Тел.: 812–584–06–17, E-Mail: Pecherskiy@mail.ru.
ПГУПС
In this article it is given summary materially working information retrieval system of expert
type on the humanities. To call attention philosophical basis of this system, future trends of
it development and make a comparison with philosophical machine of Raymond Lully
(XIV century).
Задача исследователя в любой
области познания
состоит в том,
чтобы найти, собрать, систематизировать информацию и затем на
основе
какихлибо
всеобщих
принципов превратить ее в знание, то есть привнести в эту информацию
свой уникальный, неповторимый вклад с
сохранением момента всеобщности. Это
невозможно сделать без концентрации, систематизации, переплавки собранных сведений на основе определенных принципов и
приемов.
Цели конкретных наук всех типов в
основном состоят в анализе знания, синтез
стоит на втором плане и касается только
отдельных сторон и фрагментов бытия в
целом. Задача же философского познания
состоит в том, чтобы добиться максимально
возможного, всеобщего синтеза всех знаний, которые могут быть доступны мыслителю. Другими словами, одна из основных
целей философии – собирание, систематизация и концентрация рассеивающегося,
разбегающегося, непрерывно дифференцирующегося знания обо всем. Описываемая
ИПСЭТ (которая в электронном варианте
разрабатывается с 1991 года) – одна из ступеней создания мощного и эффективного
инструмента по реализации указанной выше основной цели философии.
Открытое образование • 2/2005
Помимо прочего в познание входит
процесс иерархизации знания. Знание только тогда становится знанием, когда каждый
его составной момент (понятие, суждение,
умозаключение, определение, факт) находится в строго определенном месте в соответствии с принципами и задачами исследования, объективными свойствами познаваемой области. Истинность знания является производной от степени его дифференцированности и целостности, то есть от
уровня его иерархизации. Создаваемая ИПСЭТ – средство иерархизации знания на
основе различных взаимодополняющих
принципов.
Одной из теоретических основ предлагаемой экспертной системы является следующая концепция понятия. Понятие есть
идеальное сущностное образование, благодаря которому возможна та часть бытия,
которую это понятие не только выражает,
но и создает, хотя бы в гносеологическом
смысле. Любое понятие состоит из других
понятий, но не так, как обычная вещь состоит из каких-то своих частей. Каждое понятие одновременно есть часть и целое других понятий, то есть между понятиями существуют идеальные, духовные отношения,
в корне отличающиеся от отношений между вещами в нашем материальном мире.
Часть понятия есть одновременно и целое
этого понятия. Хотя в самой ИПСЭТ как
материальном образовании отношения между понятиями строятся во многом аналогично отношениям между вещами. То
есть ИПСЭТ, как и все в этом мире, отражает и выражает отношения между поня-
31
Новые технологии
тиями внешним, искаженным, проективным
образом. Понятия формальной логики также являются всего лишь одной из проекций
мира спекулятивных, разумных понятий. В
мире духа и разума при погружении в содержание одного понятия мы тем самым
раскрываем содержание и других понятий.
Каждое понятие – идеальная структура какого-то аспекта бытия, обладающая одновременно всеобщим и уникальным характером. Предлагаемая ИПСЭТ является техническим средством, помогающим наладить в
сознании исследователя более интенсивные
процессы взаимодействия понятий друг с
другом, повысив, тем самым, эвристичность
поиска, его диапазон и глубину.
Автор описываемой системы пошел
сравнительно простым путем. К середине
90-х годов он убедился в том, что все известные ему электронные системы, работающие с БД (или базами знаний), эффективно действуют, в основном, в технических, медицинских и экономических областях, но очень не удобны для представления,
обработки и синтеза гуманитарных знаний.
Поэтому пришлось в качестве инструмента
создания БД использовать обычные текстовые редакторы. В результате практических испытаний самым удобным редактором оказался “Multi–Edit” по двум основным причинам. Он работает в ASCII–коде,
то есть создаваемый им файл БД не имеет
таких вкладок, которые существуют в
“Word’е”. Это позволяет добиваться большой скорости обработки файлов БД, и поисковая программа ИПСЭТ не натыкается
на неизвестные вкладки, создаваемые “Microsoft”. Вторая причина заключается в том,
что редактор “Multi–Edit” является не
столько текстовым редактором, сколько
редактором многих языков программирования. Этот редактор сам по себе обладает
мощными поисковыми и эвристическими
модулями, которые и вне среды ИПСЭТ
позволяют эффективно работать с гуманитарными текстами, необходимо только соответствующим образом оформить эти тексты.
Основной «секрет» описываемой ИПСЭТ заключается в оформлении файла ее
БД. Это обычный текстовый файл (который
можно создавать и в “Word’е”, однако при
больших объемах этот редактор просто захлебнется). Но создается он по определенным правилам. Кратко опишем структуру
этого файла.
32
Начинается файл с указания даты написания его фрагмента (фрагмент этот разработчик ИПСЭТ называет записью). Далее
идет номер этого фрагмента. Обычно каждый отдельный файл БД начинается с номера 1. После номера записи следует так
называемое «Поле дескрипторов». Здесь по
определенной системе, с использованием
различных знаков ASCII кода, записываются различные дескрипторы, отражающие
содержание данной записи или фрагмента
БД. Эти дескрипторы подразделяются на
следующие группы: дескрипторы понятий,
авторов, персоналий, анализируемых источников и переводчиков, цитирующих
авторов и цитируемых авторов, места и
времени (последние две группы в случае
необходимости). Возможно добавление новых групп дескрипторов, например, недавно была добавлена группа «На каком
языке» написан данный фрагмент.
Определение дескрипторов – работа
экспертов, специалистов в соответствующей области знания – философов, историков, политологов, социологов, психологов и
т. д. Как показала практика, немногие способны на качественный уровень работы по
определению дескрипторов, особенно в
группе понятий. Наиболее типичный промах эксперта – примысливание того, чего в
данном фрагменте нет, хотя косвенная
связь и имеется. Другая ошибка – неумение
найти наиболее оптимальное понятие. Третья группа ошибок – неправильное определение приоритета понятий. Понятия должны располагаться внутри поля дескрипторов по уровню их значимости. Таким образом, эксперт, определяющий поисковые
признаки данного фрагмента БД, выполняет
ту работу, которую вряд ли сможет выполнить на качественном уровне даже самый
мощный компьютер с самой изощренной
программой, особенно в случае философских текстов. То есть автор ИПСЭТ изначально отказался от того направления работы, в котором шли ученые Японии, потратившие миллиарды долларов и не достигшие поставленной задачи, хотя попутно
ими было совершенно много важных открытий в области информационных технологий.
Следующая составная часть записи –
поле текста. С одной стороны, здесь все
просто. В поле текста находится собственно
содержание БД. Текст этот должен быть
небольшим, являться законченным выражением какой-либо мысли. Как правило,
Открытое образование • 2/2005
Новые технологии
объем его находится между 2–3 и 10–15
строками (ширина строки около 75 символов; этот параметр не принципиален). С
другой стороны, проблема заключается в
критериях отбора этого фрагмента. Отбор
фрагмента – тоже работа эксперта. Обычно
критерием отбора являются: тема исследования, сформулированная проблема или
вопрос, определенное понятие, факт, событие, персоналия, год, эпоха, место. Поле
текста обычно вводит ОБД (оператор базы
данных). Нередко работа ОБД и эксперта
совмещается.
Пятой составной частью записи является поле источников. Здесь указывается
название произведения, из которого был
взят данный текст и источник, в котором
находится данное произведение. Требование к оформлению поля источников в соответствии с правилами библиографии.
И шестой, заключительной частью записи (фрагмента БД) является поле администратора. В настоящее время в это поле
входят два параметра: поле ОБД, в котором
указывается фамилия и инициалы оператора БД, вводившего данную запись, и поле
Э (эксперта), указывающего эксперта, проводившего логическую обработку данного
фрагмента и проверившего правильность
оформления всей записи. Каждый из них
отвечает за свою область работы. Это же
поле позволяет учитывать объем работы
операторов и экспертов (как по количеству
обработанных записей, так и по количеству
введенных строк – в случае ОБД). Благодаря второму полю записи – дате ведется
учет работы ОБД и Э по дням, месяцам и
годам.
Одним из достоинств такого оформления БД является то, что создавать базовый
файл ИПСЭТ можно в любом редакторе,
целиком или по частям. Далее сама ИПСЭТ
конвертирует (импортирует) этот файл в
свою среду и начинает с ним работать в соответствии с запросами пользователя.
Однако планируется возможность подключения к самой ИПСЭТ какого-либо редактора, с тем чтобы БД создавать внутри
ИПСЭТ, без последующей конвертации или
импорта файла.
Аналогом ИПСЭТ является "философская машина" (ее также называют "машиной истины", логической машиной) Раймонда Луллия (ок. 1235 – ок. 1315), описанная в книге "Великое искусство". Это было
чисто механическое устройство, более простое, чем арифмометр. Однако смысл в ней
Открытое образование • 2/2005
был гораздо более глубокий, чем простое
оперирование цифрами. "Философская машина" Раймонда Луллия позволяла ставить
вопросы философского характера и получать на них ответы. Это была попытка перейти от логики доказательства к логике
открытий. Гениальным последователем
Раймонда Луллия был Джордано Бруно.
"Архиметрия" Сент-Ива д'Альвейдра также
является еще одной попыткой реализации
"машины истины".
Благодаря возможностям современной
компьютерной техники ИПСЭТ обладает
более значительным информационным и
эвристическим потенциалом, чем философская машина Раймонда Луллия, но с меньшими философскими и прочими претензиями. Машиной непосредственного открытия истин и их обоснования ИПСЭТ не
является, но может быть важным техническим подспорьем в научном и педагогическом труде.
Кроме того, ИПСЭТ является в определенном смысле электронным аналогом монады, понимаемой в духе Г.В. Лейбница. В
ИПСЭТ может отражаться особым образом
многое происходящее в мире. Качество и
мощность этого отражения зависят как от
самой программной оболочки системы, так
и от мощности ее базы. Главным же образом, качество и мощность ИПСЭТ зависят
от уровня работы экспертов. Это отражение может варьироваться от простой электронной картотеки до эффективной экспертной системы, могущей служить составным блоком какой-либо программы искусственного интеллекта. Правда, в отличие от
монады в трактовке Г.В. Лейбница, ИПСЭТ, конечно, ничего не созерцает, даже в
интеллектуальном отношении. Созерцают
эксперты, создающие ее БД.
ИПСЭТ является еще одной попыткой
подготовки перехода к полилинейному
мышлению. Функции ИПСЭТ позволяют
двигаться по ее базе знаний не по одной
единственной нити, как происходит при
обычном чтении текстов, а по ткани, или,
даже, по объемному телу, то есть по любой
нити, в любых направлениях, через пересечение других нитей и любые повороты (в
зависимости от поставленной цели пользователя и экспертных возможностей системы). В информатике такая возможность
частично выражена в понятии гипертекста.
Одним из важнейших достоинств ИПСЭТ является возможность буквально в течение несколько секунд увидеть в количе-
33
Новые технологии
ственно-качественном аспекте работу, проделанную в течение многих лет, даже десятков лет. Всего лишь беглый взгляд на
соответствующие рейтинги сразу дает
представление о том, чем занимался исследователь (или группа ученых) за любой период времени, с какой интенсивностью, и с
какой динамикой. В этом отношении ИПСЭТ является и инструментом самопознания, самоанализа. Кроме того, разрабатываемая система позволяет достаточно полно
и быстро актуализировать все ранее приобретенное (и соответствующим образом препарированное) знание.
В ИПСЭТ предусмотрена возможность
быстрого интегрирования персональных баз
знаний с целью общего использования. Это
позволяет в значительной степени сократить дублирование исследований, повысить
эвристичность и системность поиска. Индивидуальная работа каждого исследователя может использоваться другими на любых этапах сбора, систематизации, анализа
и синтеза информации.
В ИПСЭТ в какой-то мере реализован
переход от логики формальной к логике
содержательной. Формальная логика оперирует с понятиями как с неразложимыми
далее атомами. В ИПСЭТ же раскрываются
содержание и структура каждого понятия (в
узком и широком смыслах) на различных
уровнях: листинг, рейтинг алфавитный и
количественный (планируется разработка
построения плоскостной и объемной структуры понятий).
Система работает не со словами, а с
понятиями, благодаря такому подходу в
ИПСЭТ имеется невысокий уровень "информационного шума", создаваемый, в основном, невысоким уровнем логической
культуры экспертов.
ИПСЭТ создается с 1991 года (в бумажных вариантах – на перфокартах и унитермкартах с 1976 года). Основное содержание БД ИПСЭТ – философия плюс история, литературоведение, политика, культура, религия. Объем БД ИПСЭТ – более
350 тысяч строк (то есть более 10 тысяч
страниц текстов в ASCII–коде – около 20
Mb). Это более 28 тысяч записей (условных
единиц информации). Время поиска по всей
БД на ПК с частотой более 2 GHz – 5 с.
Имеющаяся БД и ее программная оболочка
являются личной собственностью разработчика этой системы и автора данной статьи.
Но, по-видимому, настало время для создания общей БД, с последующим публичным
34
ее использованием в научной и педагогической работе.
Кратко опишем главные функции и
блоки ИПСЭТ.
Информационно-поисковые
функции
Возможность получить (практически
мгновенно) любую имеющуюся в БД информацию по любым параметрам, предусмотренным программой: вывод на монитор, создание соответствующего файла, его
распечатка.
Аналитические функции
Вскрытие пробелов в познании какойлибо области или проблемы. В первую очередь это достигается с помощью развертки
содержания заданного дескриптора (то есть
понятия, автора, персоналии, источника,
факта, даты или периода времени). Развернутая структура (в форме листинга или рейтинга) наглядно показывает, что уже имеется в БД исследователя, а над чем следует
еще работать. Разумеется, пробелы вскрываются не в позитивном смысле. То есть
непосредственно программа не может указывать, что еще нужно для исследования
данной темы.
Анализ философских понятий: выявление их внутренней структуры и "внешних"
связей. Эту операцию проводит блок выявления очевидных логических связей.
Выявление неочевидных логических
связей между понятиями, фактами, явлениями, событиями, вещами и любыми процессами, зафиксированными в БД ИПСЭТ.
Анализ состояния имеющихся БД ИПСЭТ по следующим параметрам:
философские категории;
обычные понятия;
вещи (предметы);
временные (в историческом смысле:
даты, века, эпохи) и пространственные (в
географическом смысле: города, страны,
континенты) характеристики;
авторы;
персоналии (в том числе мифологические и литературные);
факты;
источники;
анализируемые источники.
Быстрое сопоставление различных
идей, концепций, высказываний, произведений, авторов, персоналий, фактов.
Прочие возможности и функции
ИПСЭТ
Возможность выполнения функции
АОС (автоматизированной обучающей сис-
Открытое образование • 2/2005
Новые технологии
темы) от школьников и студентов до профессионалов.
Быстрое интегрирование индивидуальных БД в общую БД.
Экспресс-диагностика границ познаний
создателя данной БД,
разумеется, количественно-формальная.
Развертка содержания и структур понятий (и вообще всех дескрипторов) в форме
листингов и количественных рейтингов.
Ответы на вопросы, задаваемые на естественном языке: исходя из одного запрошенного понятия; на основе пересечения,
сопоставления двух, трех и более понятий;
на основе вопроса, сформулированного на
естественном языке.
Экспресс-анализ общего состояния
системы. Учет работы экспертов и ОБД
(операторов базы данных), истории поисков, определение рейтинга популярности
тех или иных запросов.
Возможность быстрого и эффективного
написания диссертаций. В том числе благодаря оперативному и наглядному отслеживанию хода работы на всех этапах диссертационного исследования. Опыт показывает, что для написания кандидатской диссертации достаточно иметь около двух тысяч записей по теме исследования. Количество вхождений главного понятия исследования около 300–500. Для докторской диссертации, по-видимому, будет достаточно
1000 вхождений главного понятия.
Перспективы дальнейшего развития
ИПСЭТ
Известно, что развитые и практически
работающие экспертные системы в технике,
медицине и экономике стоят миллионы и
десятки миллионов долларов. Подавляющая
часть финансовых средств уходит на оплату
труда экспертов. Их работа наиболее сложна и требует наибольшего количества времени (по сравнению с трудом программиста, администратора и операторов БД).
С учетом гуманитарного характера
создаваемой ЭС и более низкой оплаты
труда в России стоимость ее будет на порядок ниже, чем за рубежом. Однако одной из
проблем будет то, что многие гуманитарии
и их организации будут не в состоянии платить за пользование этой системой. Поэтому стоит под вопросом окупаемость
ИПСЭТ при ее доведении до "товарного",
коммерческого уровня.
Планируется использование не только
текстов, но и изображений, музыки, песен,
видеосюжетов. Например, при запросе на
Открытое образование • 2/2005
понятие "Страх" появляются различные
тексты из философии, истории, литературы,
психологии и т. д. плюс разнообразные
изображения, музыкальные произведения,
песни, фрагменты фильмов и т. д., различным образом выражающие и представляющие это состояние психики человека. Сознание будет получать больше возможностей для более глубокого и многостороннего синтеза и анализа выбранного понятия
не только в рациональном, но и в иррациональном аспекте.
Ведется работа по введению параметров "Сложность (уровень) информации" и
"Оценка пользователя" (данного фрагмента
информации). Такой параметр позволит
системе работать с некоторой обратной связью, более тонко реагировать на требования
и пожелания пользователей.
Ведется теоретическая подготовка по
внедрению в ИПСЭТ HTML.
Планируется возможность применения
технологии "Data Mining".
В перспективе видится возможность
создания функции подстройки, ориентации
ИПСЭТ на различный мировоззренческий и
интеллектуальный уровень пользователей.
Например, пользователю задаются наиболее существенные вопросы мировоззренческого порядка, и на основе ответов ИПСЭТ
перестраивает свою БД в соответствии с
аксиологическими особенностями данного
пользователя.
Существенным улучшением работы
системы будет создание блока, работающего аналогично американской экспертной
системе «Пролог», где БД будет уже построена не на основе отдельных фрагментов
текстов, а на основе отдельных суждений. В
этом случае будет достигнута большая
формально-логическая точность рассуждений, более четкими будут различные переходы, но, с другой стороны, будет потеряна
живость, индивидуальность языка оригинала.
Предполагается создание блока графического развертывания схем структуры понятий (и всех дескрипторов) как в плоском,
так и в объемном виде. Эти схемы могут
быть неподвижными, статичными в одном режиме и динамическими, развивающимися в другом.
На основе уже имеющихся возможностей ИПСЭТ и еще не реализованных практически ведется теоретическая работа по
созданию блока построения систем мировоззрений.
35
Новые технологии
Планируется введение в блок ответов
на вопросы параметра ответов в соответствии с уровнем подготовки и образования
спрашивающего.
Существует план (в случае достижения
системой соответствующей количественной
и качественной мощности) подключения к
Интернету в качестве информационной и
экспертной системы по гуманитарным знаниям.
Немало сил необходимо будет потратить на четкое оформление правил работы
администратора, экспертов и операторов
БД. Кроме того, важным моментом снижения информационного шума в системе будет сравнительно однозначное определение
всех дескрипторов, входящих в ИПСЭТ.
Сейчас их уже более 12 тысяч, в том числе
более 5,5 тысяч собственно понятий.
Для вывода ИПСЭТ на международный уровень планируется существенное
увеличение текстов на других языках (в настоящее время имеется только несколько
сотен записей на английском и немецком
языках – это меньше 1% от всей БД), а также создание возможности переключения
интерфейса системы на наиболее распространенные европейский языки. Это облегчит работу с ИПСЭТ зарубежных ученых.
Эта работа несложна, но потребует сотни и
тысячи часов рутинной работы.
Одной из главных целей разработчика ИПСЭТ является создание модуля,
позволяющего на основе всех БД, входящих
в систему, строить ту или иную подвижную
и статическую модель Универсума (мира,
вселенной) на основании различных принципов (например, на основе системы категорий "Науки логики" Г. Гегеля, Сефирот
Каббалы, Арканов Таро или, хотя бы, на
основе УДК – универсальной десятичной
классификации, используемой в библиографии).
Для осуществления всего вышеизложенного на первом этапе требуется «всего
лишь» два главных шага: создание официальной рабочей исследовательской группы
и обеспечение финансирования ее работы.
Основные средства, более 80 %, необходимы для оплаты работы экспертов. Эффективность и уровень работы системы в первую очередь зависят от объема ее БД и качества ее оформления. Потребуются десятки и сотни экспертов по самым различным
областям гуманитарного знания, тогда как
для технической и организационной поддержки ИПСЭТ нужен один или два про-
36
граммиста, администратор и несколько
операторов БД.
Создателю ИПСЭТ известны попытки
создания информационных систем по философии. Это обучающая система, созданная в ЛИТМО; система, создаваемая в
МИИТе в начале 90-х годов; и система, создаваемая в середине 90-х в ПГУ (Поморском государственном университете).
Принципы их построения во многом отличны от идей, лежащих в основе ИПСЭТ.
Генератором идей и организатором
разработки описываемой ИПСЭТ является
автор данной статьи кандидат философских
наук, доцент кафедры философии ПГУПСа
Егоров А.Г. В состав рабочей группы, работающей сугубо на общественных началах,
входят: программист Гончаров А.В., эксперт к.ф.н. Машенцев А.В., операторы БД
Соколов А.Б., Печерский И.С., Бреднев
М.В. Необходимо отметить определенную
финансовую помощь Санкт-Петербургской
общественной организации по содействию
развития образования «Пифагорейский Союз».
В настоящее время ИПСЭТ состоит
из 12 работающих блоков. Степень качества
и полноты действий каждого из блоков различна. Ведется постоянная работа по совершенствованию их функций. Но практически все они позволяют уже сейчас получать положительные результаты при самых различных исследовательских и педагогических запросах.
1. Блок импорта и экспорта данных
Осуществляет конвертацию и импорт
подготовленных файлов для БД, подключение дополнительных файлов и объединение
всех файлов в единую БД. Осуществляет
экспорт файлов, созданных в ИПСЭТ, для
работы в других информационных средах.
2. Блок поиска
Этот блок состоит из трех подблоков.
Первый подблок осуществляет поиск и запись в отдельный файл текстов, соответствующих той или иной маске запроса по любым дескрипторам и любой их комбинации.
Второй подблок выявляет неочевидные
логические связи между двумя любыми понятиями. Осуществляется это так. Сначала
разворачиваются структуры (в форме алфавитного или количественного рейтинга)
этих понятий по отдельности. Затем происходит сравнение этих структур. В итоге
строится новый рейтинг, раскрывающий
соотношение двух сопоставляемых понятий
друг с другом. Результаты работы этого
Открытое образование • 2/2005
Новые технологии
блока часто носят неожиданный и эвристический характер. В качестве яркого примера
можно привести следующее. Эксперт, работая над статьей о взаимосвязи между славянофильством и большевизмом, включил
этот блок и сопоставил эти понятия. Одним
из ответов был: общим моментом для славянофильства и большевизма, кроме прочих, является фашизм! Для кого-то это и
так было очевидно. Для некоторых же это
было ошеломляющим открытием. Разумеется, разное отношение к этому выводу будет также определяться и мировоззренческой позицией данного пользователя.
Третий подблок осуществляет поиск с
учетом приоритетов понятий. Работает эта
часть блока поиска аналогично первой части, но уже учитывает порядок расположения понятий в поле дескрипторов. С помощью этого блока отсекаются знания, не
имеющие значения для целей данного исследования.
3. Блок количественных и алфавитных рейтингов
Идея, лежащая в основе работы этого
блока, проста, но в значительной степени
облегчает работу с огромными массивами
информации. Автор привнес эту идею из
спорта еще в конце 70-х годов, когда разрабатывал информационно-поисковую систему по философии на перфокартах и унитермкартах.
С помощью счетчика блок считает количество вхождений дескрипторов в данной
БД и располагает их в двух формах: в виде
количественного или в виде алфавитного
рейтинга. Количественный рейтинг позволяет сразу определить, сколько информации
имеется по тому или иному дескриптору,
какова вообще информационная мощь данной системы (ее экстенсионал). Алфавитный рейтинг, в котором все понятия (дескрипторы) располагаются в соответствии с
тем или иным алфавитом, позволяет сразу
определить есть в данной БД искомое понятие (любой дескриптор) или нет. Алфавитный рейтинг содержит в себе одновременно и количественный.
Поиск внутри обоих рейтингов осуществляется автоматически. Рейтинг только
5,5 тысяч понятий занимает объем более
180 страниц. Выход на нужное понятие
осуществляется за 1–2 секунды.
В настоящее время ИПСЭТ строит следующие виды рейтингов:
• рейтинг понятий;
• рейтинг авторов;
Открытое образование • 2/2005
•
•
•
•
•
•
•
•
•
•
рейтинг цитирующих авторов;
рейтинг цитируемых авторов;
рейтинг персоналий;
рейтинг произведений;
рейтинг анализируемых источников;
рейтинг источников;
рейтинг переводчиков;
рейтинг операторов БД;
рейтинг экспертов;
рейтинг популярности дескрипторов;
Этот рейтинг показывает администратору, какие понятия или дескрипторы пользуются наибольшим спросом у пользователей. Такие сведения могут дать толчок развитию ИПСЭТ в каком-либо новом направлении или же в направлении, более соответствующем потребностям исследователей.
• рейтинг состояния системы по понятиям.
Этот рейтинг предоставляет данные о
том, какова количественная динамика ввода
в ИПСЭТ информации по тому или иному
понятию или дескриптору (по годам, месяцам, дням).
4. Мастер ответов на вопросы
Позволяет искать ответы на вопросы,
сформулированные на естественном языке.
Фактически это блок дублирует первый
подблок блока поисков, так как после формулировки вопроса в обычной, разговорной
форме, он включает процедуру формализации вопроса, в результате которой вопрос
будет превращен в вид, удобный для логического сложения или вычитания, то есть
вопрос будет преобразован в ту или иную
комбинацию понятий с тем или иным логическим оператором.
5. Блок учета работы эксперта и
ОБД
Позволяет администратору проводить
проверку и анализ работы, сделанной данным экспертом или ОБД за определенный
период времени в количественном отношении. Сколько записей было обработано экспертом и сколько строк написано данным
оператором.
6. Блок вычисления экстенсионала
Позволяет сразу определить общую
информационную мощность данной БД.
Это осуществляется путем суммирования
количества вхождений всех видов дескрипторов. В настоящей момент в ИПСЭТ содержится 12500 различных дескрипторов, а
общий ее экстенсионал превышает 210000.
Всего БД ИПСЭТ содержит сейчас 27600
37
Новые технологии
записей. Следует отметить, что действительная эффективность ИПСЭТ начнет
проявляться при значении экстенсионала
более 1 миллиона и наличии более 100 тысяч записей. В течение почти 30-летней работы над ИПСЭТ автору никогда не удавалось ввести и обработать в год более 2500
записей. Этот факт еще раз говорит в пользу того, что настало время перевода работы
над ИПСЭТ в более мощный и развернутый, коллективный режим.
7. Блок пользователей
Здесь производится регистрация пользователей, обращающихся к системе, а также контролируется степень доступа к различным операциям внутри системы. Фактически – это инструмент работы администратора системы. Имеется система паролей.
8. Блок помощи (справочный блок)
К настоящему времени этот блок разработан пока в общих чертах. В первую
очередь по той причине, что ИПСЭТ применяется в узком круге пользователей, которые сами легко ориентируются в ее среде.
В окне «О программе» работает автоматический вывод фамилий экспертов и операторов, внесших наибольший вклад в БД.
9. Блок развертки структуры понятия (дескриптора)
Один из наиболее эффективных инструментов экспресс-анализа наличия информации по тому или иному понятию. Позволяет сразу установить уровень разработки темы исследования, увидеть все понятия, авторов, персоналий, источники, тем
или иным образом связанные с анализируемым понятием.
10. Блок ободряющих приколов
Эта часть ИПСЭТ находится на первоначальной стадии разработки. В шутливой
форме ИПСЭТ реагирует на количественный и качественный уровень БД конкретного исследователя, выводит различные картинки при загрузке персональной
базы данных, дает тексты поучающих афоризмов и анекдотов. Планируется озвучивание высказываний и воспроизведение
различных звуков. Это, так сказать, расслабляюще-развлекательная часть ИПСЭТ.
11. Блок администратора системы
Создание этого блока находится пока в
самом начале. Имеются модули контроля за
паролями, уровнем доступа к системе. Отслеживаются количественные параметры
работы экспертов и операторов.
12. Блок настроек
Позволяет выбрать наиболее удобный
режим работы с системой для данного
пользователя.
ИПСЭТ создана с помощью языка С++,
с расширением Borland. Среда разработки
RAD (Rapid Application Development) – Borland C++ (BCB) 6.0. Service Pack 4.
В завершение статьи хотелось бы сделать предложение всем заинтересовавшимся ученым и их организациям присоединиться к дальнейшей работе по созданию
и совершенствованию этой простой, но полезной системы, вплоть до создания информационного центра по экспертизе гуманитарного знания и оказания информационной помощи ученым-гуманитариям. Обращаться можно на кафедру философии
Санкт-Петербургского университета путей
сообщения, к автору данной статьи и разработчику описанной выше ИПСЭТ или же
по электронному почтовому ящику: Pecherskiy@mail.ru.
Open Source Forum Russia
Выставка и конференция Open Source Forum Russia - Москва, 27-29 апреля 2005 г.
Выступают Jon maddog Hall (Linux International), Adam Jollans (IBM),
Richard Seibt (Novell), Larry Wall (Perl), представители Hewlett Packard, Линукс
Инк, ASPLinux, ALT Linux. В программе доклады разработчиков MySQL,
Zope, Mandrakesoft, Scientific Linux и др.
В работе конференции участвуют представители министерств Экономразвития и Связи. В программе представлен опыт создания электронного правительства за рубежом, отечественные проекты перехода государственных
структур на Linux.
Источник. http://opensource-forum.ru/rindex.html
38
Открытое образование • 2/2005
1/--страниц
Пожаловаться на содержимое документа