close

Вход

Забыли?

вход по аккаунту

?

Компьютерная лексикография

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное образовательное
учреждение высшего профессионального образования
«Оренбургский государственный университет»
Кафедра романской филологии и методики преподавания
французского языка
Т.В. Андрусенко
КОМПЬЮТЕРНАЯ ЛЕКСИКОГРАФИЯ
Рекомендовано
к
изданию
Редакционно-издательским
советом
федерального
государственного
бюджетного
образовательного
учреждения высшего профессионального образования «Оренбургский
государственный университет» в качестве методических указаний для
студентов, обучающихся по программам высшего профессионального
образования по направлению подготовки 035700.62 Лингвистика
Оренбург
2013
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 811’314.13 (076.5)
ББК 81.115,7
А66
Рецензент – ассистент, кандидат филологических наук
Е.А. Подтихова
А 66
Андрусенко, Т.В.
Компьютерная лексикография: методические указания /
Т.В. Андрусенко; Оренбургский гос. ун-т. – Оренбург: ОГУ,
2013. – 29 с.
В методических указаниях содержатся рекомендации к
изучаемой дисциплине; изложены вопросы для контроля
самостоятельной работы, а также вопросы для коллоквиума;
представлен глоссарий основных терминов компьютерной
лексикографии.
Методические указания по дисциплине «Компьютерная
лексикография» предназначены студентам направления подготовки
035700.62 Лингвистика, квалификации «бакалавр».
Целью методических указаний является оказание комплексной
помощи студентам-бакалаврам в освоении дисциплины.
УДК 811’374 (0765)
ББК 81.115.я7
© АндрусенкоТ.В., 2013
© ОГУ, 2013
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Содержание
Введение..................................................................................................................... 4
1 Методические рекомендации к дисциплине «Компьютерная
5
лексикография»………………………………………………………………………
2 Тематика практических занятий ………………………………………………..
8
3 Задания для контроля самостоятельной работы студентов…………………...
11
4 Образец контрольной работы…………………………………………………
16
5 Задания для итогового теста…………………………………………………..
16
6 Вопросы к коллоквиуму…………………………………....................................
23
7 Глоссарий по «Компьютерной лексикографии».……………............................. 26
8 Литература, рекомендуемая для изучения дисциплины………………………
3
28
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Введение
Методические
указания
по
дисциплине
«Компьютерная
лексикография» предназначены для студентов направления подготовки
035700.62
указания
Лингвистика,
составлены
квалификации
с
учетом
«бакалавр».
федерального
Методические
государственного
образовательного стандарта высшего профессионального образования по
направлению
подготовки
035700.62
Лингвистика,
квалификация
«бакалавр», утвержденного приказом Министерства образования и науки
Российской Федерации от 20 мая 2010 г. № 541.
В методических указаниях содержатся рекомендации к изучаемой
дисциплине; изложены вопросы для контроля самостоятельной работы, а
также вопросы для коллоквиума; представлен глоссарий основных
терминов компьютерной лексикографии.
Методические указания нацелены на оказание комплексной помощи
в освоении дисциплины «Компьютерная лексикография». В содержание
указаний включены задания, которые позволяют организовать как
аудиторную, так и самостоятельную работу студента квалификации
«бакалавр».
4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1
Методические
рекомендации
«Компьютерная лексикография»
к
дисциплине
В настоящее время в словарном деле активно применяются новые
лексикографические
технологии.
Ведущие
лексикографические
издательства готовят не только электронные версии своих традиционных
словарей, но и собственно электронные словари.
Преимущества компьютеризации в лексикографии очевидны: только
компьютер может быстро предоставить доступ к обширному словнику,
цитатному материалу, быстро дать информацию о многозначном слове,
привести синонимы и антонимы, значения фразеологизмов, обозначить
сферу употребления лексики и т.д. Применение компьютера позволяет
лексикографу расположить материал в любом, необходимом ему порядке,
определить
частотность
слова,
выполнить
рисунки,
найти
иллюстрирующие цитаты, привести этимологию слова и т.д.
К настоящему времени созданы языковые машинные фонды
(Corpora),
основе
включающие разнообразные языковые базы данных. На их
было
сформировано
новое
направление
в
лексикографии
корпусная лексикография, то есть, специальная область изучения языка на
основе текстовых и акустических корпусов с постоянным использованием
компьютера для анализа, хранения и обработки имеющихся данных.
У этого направления лексикографии уже имеется своя история.
Например, первые базы данных и словари, сформированные на их основе,
появились в США в 1956 г. (Georgetown University Machine Translation
Research and Language Projects). На основе электронных баз данных были
подготовлены такие известные словари, как Random House Dictionary
(1966), American Heritage Dictionary (1969), Webster’s Eighth Dictionary
(1973), Collins COBUILD Dictionary
(1979) - совместный проект
издательства Collins и Бирмингемского университета.
5
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Богатейший материал по русскому языку в виде текстовых и
звучащих файлов хранится в Машинном фонде русского языка.
Другим направлением современной лексикографии, которая связана
с
компьютеризацией,
является
киберлексикография,
то
есть
использование Интернета для составления, создания словаря, для работы с
текстом.
Существующие поисковые системы позволяют быстро и эффективно
осуществлять поиск нужной информации, используя разнообразные
лексикографические источники. Так, например, в каталоге “Yahoo!”
имеется более 50 категорий и более полутысячи сайтов, посвященных
словарям ( Dictionaries). Они выдаются согласно иерархической системе;
сначала более полные и общие, а затем специальные справочники по
отдельным отраслям знаний (химия, медицина, компьютеры, экономика и
т.д.). Они могут быть не только на английском, но и на других европейских
и восточных языках и, конечно, на русском.
Поскольку организация материала является тезаурусной, то каждая
категория может разбиваться на менее крупные подразделения, или
содержать список словарей по теме: Language, Slang, Etymology, etc., Web
Directories, OneLook Dictionaries, etc. Знак @ обозначает, что можно
использовать перекрестные ссылки в других категориях. При нажатии на
этот знак можно выйти не в каталог нижнего уровня, а в параллельное
дерево каталогов.
В Интернете, как и в традиционной лексикографии, существуют
словари нелингвистические (энциклопедии) и лингвистические.
Среди русскоязычных справочных материалов следует отметить
энциклопедический ресурс системы http:// yandex.ru, на котором в разделе
«Словари», можно получить доступ к «Большой советской энциклопедии»,
«Малой советской энциклопедии», «Малому энциклопедическому словарю
Брокгауза и Эфрона» (44 194 статьи), «Литературной энциклопедии» в 11
томах, «Словарю русских синонимов и сходных по смыслу выражений
6
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н. Абрамова, «История Отечества с древнейших времен до наших дней»
(4438 статей), к толковом словарю В.И.Даля и др.http://slovari.yandex.ru/
Работа с энциклопедиями в Интернете может быть двух видов:
использование
справочной информации из
наиболее
авторитетных
энциклопедических справочников, или создание на базе существующих
собственных Интернет-энциклопедий. Например, на Dic.academic.ru при
введении нужного слова в поисковое окно, поиск будет осуществляться
сразу по всем подключенным энциклопедиям и словарям. Можно вести и
индивидуальный поиск – открыв по алфавитной таблице нужную
энциклопедию и листая только ее.
Одна из самых популярных Интернет –энциклопедий – «Кругосвет»
http://www.krugosvet.ru, продукт компании «Россия он-лайн», заходить в
нее можно также с титульной страницы поисковой системы «Апорт»
http://www.aport.ru.
Тематика
статей
очень
широкая:
лингвистика,
психология, социология, экономика, история и т.д.
Обширный информационный материал по русской и всемирной
истории содержится на сайте « Библиотека электронных ресурсов
исторического факультета МГУ им. М.В.Ломоносова»
http://www.hist.msu.ru/ER/index.html
Словари и энциклопедии можно найти и на почтовом сервере mail.ru
- http://enc.mail.ru Например, «Российский энциклопедический словарь»,
« Всемирный биографический энциклопедический словарь» (свыше 23 000
статей об исторических и современных деятелях различных стран и
народов мира), «Всемирная История», «Мифы народов мира», «Народы и
религии мира»,
Еще один специальный информационно-справочный сайт « Словари
и энциклопедии on-line http://dic.academic.ru/searchall.php. Здесь есть как
общие словари, так и частные. Например: «Толковый словарь Ушакова»,
«Толковый словарь В.И.Даля», Толковый словарь Ожегова», Англорусский словарь В.К.Мюллера», «Финансовый словарь», «Экономический
7
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
словарь», Англо-русский словарь финансовых терминов», «Словарь
терминов антикризисного управления», «Исторический словарь» и др.
Ценным для лингвистических исследований является словарь
немецкого лингвиста М.Фасмера (1886-1962) « Этимологический словарь
русского языка», электронная версия которого находится на
http://vasmer.narod.ru/p430.html. Перевод этого 4-х томного словаря на
русский язык был выполнен советским лингвистом О.Н.Трубачевым,
который внес в словарь свои дополнения и пометы.
2 Тематика практических занятий
Во время практических занятий проверяется качество усвоения
студентами теоретического материала. Для подготовки к занятиям
необходимо изучить материал лекции и литературу, предложенную
преподавателем,
студенты
могут
также
самостоятельно
подбирать
источники. Готовясь к занятиям, обучающиеся приобретают навык работы
с источниками, усваивают термины изучаемой дисциплины. Задания для
контроля самостоятельной работы, а также глоссарий по компьютерной
лексикографии способствуют закреплению и систематизации материала.
Занятие 1
1
Информационные технологии как объект исследования.
2
Прикладная лингвистика и проблемы изучения языка.
3
Традиционная лексикография в свете задач современного
языкознания.
Занятие 2
1
Лексикографическое описание как способ представления мира.
2
Истоки и традиции русской лексикографии.
3
Информативные возможности современной лексикографии.
8
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Занятие 3
1
Теоретическая лексикография.
2
Типология словарей русского языка.
3
Практическая лексикография.
4
Аспекты лексикографического описания.
Занятие 4
1
Лексикографическое обеспечение лингвистических
исследований.
2
Проблема организации лексикографических баз данных.
3
Система электронного перевода.
4
Электронные технологии в создании словарей нового типа.
5
«On-line»-словари.
Занятие 5
1
Электронные энциклопедии, справочники, толковые словари.
2
Тезаурусы, многоязычные словари, глоссарии.
3
Конкордансы (конкордансы к литературным произведениям).
4
Критерии поиска информации.
5
Лексикографические страницы Интернет.
Занятие 6
1
Современные стратегии доступа к филологической информации.
2
Организация электронного массива языка и отбор материала.
3
Понятие «языковой корпус».
4
Задачи корпусной лингвистики и построение словарей нового
типа
Занятие 7
9
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1
Из истории создания национального корпуса русского языка.
2
Массив данных, доступ к НКРЯ (скачивание из системы
Интернет, набор с клавиатуры).
3
Организация выборки, специальные поисковые системы.
4
Понятие «конкорданс».
5
Лексикографы как пользователи корпуса.
Занятие 8
1
Возможности сети Интернет.
2
Электронная библиотека как упорядоченная коллекция
электронных документов, снабженных средствами навигации и поиска.
3
Лексикографические базы данных.
4
Информационный поиск.
Занятие 9
1
Критерии отбора информации для лексикографического
описания.
2 Соответствие описываемого материала типу словаря.
3 Способы представления значения.
4 Структура словарной статьи.
5 Словарная дефиниция.
6 Иллюстративное поле словарной статьи.
Занятие 10
1
Взаимосвязь традиционной и компьютерной лексикографии.
2
Компактность хранения лексикографической информации на
электронных носителях.
3
Традиционный словарь на электронных носителях как форма
развития старой лексикографической версии.
10
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Занятие 11
Прикладное
значение
электронной
лексикографии.
Лингвометодический аспект применения информационных технологий.
Понятие «электронная презентация». Формы электронных презентаций.
Приемы и способы создания.
3 Задания для контроля самостоятельной работы
студентов
Раздел 1 Предмет и задачи курса
1
Что означает термин прикладная лингвистика?
2
Какие задачи решает прикладная лингвистика?
3
Направления прикладной лингвистики.
4
Методы прикладной лингвистики.
5
Дайте определение лексикографии.
6
Вклад лексикографии в развитие других наук.
7
Какие задачи решает лексикография?
8
Что является объектом изучения лексикографии?
9
Связь лексикографии с лексикологией.
Раздел 2 Лексикография как отрасль современной лингвистики
1
Что представляли собой первые словари?
2
Когда появились первые толковые словари?
3
Происхождение термина «лексикография».
4
Инструментарий современной лексикографии.
5
На какие группы делятся компьютерные лексикографические
программы?
6
Этапы лексикографической работы.
11
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7
Какие программы используются для оригинал-макета словарей?
8
Создайте
структуру
записи
базы
данных
для
фиксации
контекстов употребления слова, которая включала бы информацию о
самом слове, примере употребления, авторе, источнике примера, а также
предварительное описание значения.
Раздел 3 Теория и практика лексикографических исследований
1 Привести минимум пять существительных женского рода с
окончанием
прилагательных,
обозначающих
помещение
по
их
назначению. Указать путь их образования (семантическая конденсация или
по модели). Дать общую семантическую характеристику группы. Для
выполнения задания следует использовать БАС, в справочном отделе
словарной статьи которого даны сведения о первой фиксации в
лексикографических работах анализируемого слова.
2 Привести минимум пять существительных, образованных при
помощи суффикса -щик в ХХ веке. Указать, есть ли в словаре
словообразовательные
варианты.
Дать
общую
семантическую
характеристику слов этой группы.
Образец выполнения
Существительное
фрезеровщик
–
«рабочий,
работающий
на
фрезерном станке» впервые зафиксировано в ХХ веке, образовалось при
помощи суффикса -щик и интерфикса -ов-. Других вариантов у слова в
словаре нет. Общее значение слов этой группы – «наименование лица по
профессии, по роду занятий».
3 Привести 5 примеров космической лексики, образованной в ХХ
веке.
Указать
сферу
бытования
словообразовательной структуры слова.
12
лексем.
Дать
характеристику
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Образец выполнения
Слова
космонавт,
космонавтка
зафиксированы в словаре
«женщина
«Новые
слова
–
космонавт»
и значения»,
впервые
под
ред.
Н.З. Котеловой и Ю.С. Сорокина. – М., 1973. Сфера бытования слов –
нейтральная
лексика.
Существительное
космонавт
образовано
от
интернационального элемента космо- при помощи суффиксоида -навт;
слово
космонавтка
образовано
от
слова
космонавт при помощи
суффикса -к-.
4 Подобрать иллюстрации процесса пополнения литературного
языка профессионализмами и иноязычными словами. При подборе
профессионализмов необходимо сопоставить данные двух словарей. В
раннем по времени выхода толковом нормативном словаре должна быть
помета спец. или помета, говорящая о конкретной специальной сфере
функционирования слова, например, линг., астр., мат. и под. В более
позднем словаре не должно быть специальной пометы.
Для подбора иноязычных слов можно использовать словари
иностранных слов или страницы газет, журналов и т.п. Но нужно доказать,
что слово появилось в ХХ веке.
Раздел 5 Электронная лексикография нового типа (тезаурусы,
глоссарии, конкордансы и т.д.)
1 Приведите примеры словарей-тезаурусов.
2 В чем заключается проблема создания словаря-тезауруса?
3 Дайте определение таксонов.
4 Структура словаря конкордансов.
5 Каковы отличительные особенности глоссариев и их назначение?
6 Где впервые стали применять глоссы?
7 Сформулируйте определение энциклопедии.
13
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
8
Перечислите
наиболее
известные
универсальные
энциклопедические издания.
Раздел 6 Корпусная лингвистика как новое направление в
филологии
1
Что такое проблемная область корпусной лингвистики?
2 Сформулируйте определение корпуса данных.
3 Что является единицей хранения корпуса данных?
4 Что такое корпус текстов?
5 Перечислите корпусы данных.
6 Каковы способы представления и хранения корпуса данных?
7 Что понимается под порогом отображения?
8 Что понимается под репрезентативностью корпуса текстов?
Раздел 7 Национальный корпус русского языка
1
Когда началась работа над созданием национального корпуса
русского языка?
2
Цель создания корпуса текстов.
3
Что такое инвентаризация проблемной области?
4
Каковы критерии отбора корпусов текста?
5
Что такое динамический корпус текстов?
6
Дайте определение конкорданса.
7
Какие лингвистические задачи решают конкордансы?
8
С какими проблемами сталкивается корпусная лингвистика?
Раздел 8 Электронные библиотеки и информационный поиск
1
Перечислите
отличительные
библиотеки.
14
особенности
электронной
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2
Приведите примеры универсальных и специализированных
электронных библиотек.
3
Какие
форматы
хранения
информации
используются
в
электронных библиотеках?
4
Дайте определение поискового образа документа.
5
Какие ошибки могут возникнуть в процессе информационной
деятельности?
6
Чем характеризуются результаты поиска?
7
На какие группы подразделяются поисковые системы по типу
хранимой информации?
8
Приведите примеры иерархических баз данных.
9
На какие группы подразделяются информационно-поисковые
языки?
10 Что такое информационно-поисковый тезаурус?
11 Какова структура информационно-поискового тезауруса?
Раздел 10 Традиционная лексикография на электронных
носителях
1
Каковы преимущества компьютерной лексикографии?
2
На
какие
группы
подразделяются
компьютерные
лексикографические программы?
3
Перечислите наиболее известные терминологические банки
данных.
4
Какие проблемы стоят перед компьютерной лексикографией?
5
Что такое автоматизированные лексикографические системы?
6
Функции автоматической обработки текстов.
7
Что такое лексикографическое автоматизированное рабочее
место?
15
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4 Образец контрольной работы
Раздел 4 Контрольная работа
1
Что такое электронный перевод?
2
В чем преимущества электронного перевода?
3
С
какими
трудностями
сталкиваются
при
использовании
электронного перевода?
4
Какие факторы влияют на качество электронного перевода?
5
Какую
функцию
выполняет
переводчик-лексикограф
при
электронном переводе?
6
Перечислите наиболее популярные системы, осуществляющие
электронный перевод.
7
Дайте определение базы данных.
8
С какой целью создаются базы данных?
9
Перечислите этапы лексикографической работы.
10 Особенности Он-лайн словарей.
5 Задания для итогового теста
Нижеприведенный тест выполняется на последнем этапе изучения
дисциплины, предназначен для контроля теоретических знаний по
дисциплине «Компьютерная лексикография».
1. Электронное собрание текстов, размеченное таким образом, чтобы
в нем можно было быстро найти слова и конструкции с заданными
грамматическими и другими интересными лингвисту свойствами – это:
а) корпус текстов;
б) национальный корпус языка;
в) корпусная лингвистика;
16
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
г) поисковая система.
2. Аппарат, «встроенный» в корпус и позволяющий быстро и
эффективно найти в корпусе те слова, формы и конструкции, которые
нужны исследователю обычно называется:
а) пояснительной запиской;
б) примечанием;
в) дефиницией;
г) разметкой корпуса.
3. Национальный корпус языка – это:
а) сформированная по определенным правилам выборка данных;
б) вид корпуса данных, единицами которого являются тексты;
в) собрание произведений художественной литературы;
г)
информационно-справочная
система,
которая
может
дать
представление о языке на том или ином этапе его существования.
4. Системы автоматизации, подготовки и использования словарей,
включают
в
себя
справочные
данные
необходимые
для
лексикографической обработки текстов – это:
а) автоматизированные лексикографические системы;
б) корпус текстов;
в) информационно-поисковые системы;
г) компьютерная лексикография.
5.
В
информационно-поисковых
системах
хранятся
тексты
документов или их описание.
а) фактографических;
б) графических;
в) документальных;
г) аудиовизуальных.
6.Упорядоченная
коллекция
книг,
произведений
печати
письменности, снабжённая средствами навигации и поиска – это:
а) литературный журнал;
17
и
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
б) сайт свободной публикации;
в) электронная библиотека;
г) сетевая словесная гостевая книга.
7. Среди перечисленных найдите один неверный: форматы для
скачивания:
а) TXT;
б) DOC;
в) Mobipocket .PRC;
г) HNLM.
8. Действительное соответствие содержания выданного документа
содержанию запроса – это:
а) смысловая релевантность;
б) формальная релевантность;
в) поисковое предписание;
г) поисковый образ.
9. … используются в областях, где характеристики объектов имеют
четкую иерархию.
а) реляционные базы данных;
б) сетевые базы данных;
в) иерархические базы данных;
г) базы данных с разнородной информацией.
10. Процедура описания документа на информационно-поисковом
языке – это:
а) индексирование;
б) дескрипция;
в) кодирование;
г) классификация.
11. Словарные издания подразделяются на:
а) лингвистические словари и лингвострановедческие;
б) лингвистические словари и энциклопедические;
18
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в) энциклопедические словари и лингвострановедческие;
г) терминологические словари и лингвострановедческие.
12. Объектом описания энциклопедического словаря являются:
а) различные понятия, реалии и факты;
б) значение, употребление отдельных слов;
в) термины определенной области науки;
г) понятия, реалии и факты, относящиеся к различным сферам
определенной страны.
13. Толковый словарь в словарной статье которого помещаются
близкие по значению слова – это:
а) словарь паронимов;
б) словарь антонимов;
в) словарь омонимов;
г) словарь синонимов.
14. Выберите вариант, который не относится к частным словарям:
а) словарь иностранных слов;
б) фразеологический словарь;
в) толковый словарь русского языка;
г) словарь диалектных слов.
15.
…
-
словарь,
целью
которого
является
объяснение
научно
объясняет
происхождения слова.
а) толковый словарь;
б) словообразовательный словарь;
в) исторический словарь;
г) этимологический словарь.
16.
…
описывает,
систематизирует,
происхождение географических названий.
а) словарь диалектных слов;
б) географический словарь;
в) топонимический словарь;
19
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
г) этимологический словарь.
17. Компьютерные лексикографические программы подразделяются
на:
а)
программы
поддержки
лексикографических
работ
и
автоматические словари;
б) программы поддержки лексикографических работ и электронные
переводчики;
в) электронные переводчики и автоматические словари;
г) программы поддержки лексикографических работ и базы данных.
18.
Компьютерная
технология
создания
словаря
включает
следующие этапы:
а) формирование корпуса
текстов, автоматическое формирование
корпуса примеров, написание словарных статей, перепечатка рукописи;
б) формирование корпуса текстов, автоматическое формирование
корпуса примеров, написание словарных статей, ввод словарных статей в
базу данных;
в) формирование словника словаря, поиск примеров и формирование
картотеки примеров;
г) формирование корпуса текстов, поиск примеров и формирование
картотеки примеров.
19. Преимуществами компьютерной лексикографии по сравнению с
традиционной являются:
а) корпус текстов, написание словаря;
б) лексикографические базы данных, картотеки примеров;
в) редактирование словарных статей в базе данных; редактирование
словарных статей;
г) лексикографические базы данных, корпус текстов, редактирование
словарных статей в базе данных;
20. Поиск примеров на употребление слова называется
построением:
20
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
а) конкордансов;
б) корпуса текстов;
в) лексикографической базы данных;
г) словарной статьи.
21. Автоматические словари подразделяются на:
а) АС конечного пользователя человека и АС для программ
обработки текста;
б) АС толковые и энциклопедические;
в) АС переводные и одноязычные;
г) АС страноведческие и энциклопедические.
22. Выберите один правильный ответ.
Поиск примеров на
употребление слова называется:
а) конкорданс;
б) корпус текстов;
в) поисковая система;
г) глоссарий.
23.
Выберите
один
правильный
ответ.
Компьютерные
лексикографические программы разделяются на две группы:
а) программы обработки текста и автоматические словари;
б)
электронные
энциклопедии
и
программы
поддержки
лексикографических работ;
в)
программы
поддержки
лексикографических
работ
и
автоматические словари;
г) электронные переводчики и информационно-поисковые системы.
24.
Выберите один неправильный ответ: в электронном словаре
становится возможным:
а) доступ к отдельным фрагментам статьи с запросом пользователя
по определенному параметру;
б) появление на экране той или иной зоны словарной статьи
осуществляется по выбору пользователя;
21
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в)
алфавитный
принцип
организации
словарного
материала
обеспечивает единственный вариант входа в словарь;
г) пользователь может создавать свою собственную композицию,
активизируя ту или иную информацию в соответствии с его запросом.
25.
Выберите
один
неправильный
ответ.
Этапы
создания
электронного словаря:
а) формирование словника словаря;
б) составление корпуса примеров (с использованием электронных
корпусов текстов);
в) корректура текста словаря непосредственно в базе данных;
г) составление картотеки примеров.
26.Автоматические словари подразделяются на группы:
а) словари конечного пользователя – человека и словари для
программ обработки текста;
б) словари конечного пользователя – человека и Он-лайн словари;
в) электронные переводчики и словари для программ обработки
текста,
г) словари конечного пользователя – человека и толковые словари.
27. Словарь в специальном машинном формате, предназначенный
для использования на ЭВМ – это:
а) автоматизированный словарь;
б) он-лайн словарь;
в) автоматический словарь;
г) глоссарий.
28. Выберите один неправильный ответ: выделяет следующие
основные педагогические цели использования средств современных
информационных технологий:
а) интенсификация всех уровней учебно-воспитательного процесса
за счет применения средств современных информационных технологий;
22
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
б)
развитие
личности
обучаемого,
подготовка
индивида
к
комфортной жизни в условиях информационного общества;
в) работа на выполнение социального заказа общества;
г) развитие умения составлять компьютерные программы.
29. Автоматизированная обучающая система, включающая в себя
дидактические, методические и информационно–справочные материалы по
учебной дисциплине,
а
также
программное
обеспечение,
которое
позволяет комплексно использовать их для самостоятельного получения и
контроля знаний – это:
а) электронный справочник;
б) обучающая программа;
в) компьютерные учебные программы;
г) электронный учебник.
30. Презентации по форме их демонстрации делятся на:
а) бумажные и электронные;
б) интерактивные и неинтерактивные;
в) непрерывно выполняющиеся презентации;
г) статичные презентации.
31. По типу формата презентации подразделяются на:
а) мультимедийные презентации и презентации в Power Point;
б) презентации в Power Point, в PDF, Flash-презентация;
в) статичные презентации и анимированные презентации;
г) видео презентации и 3D презентации.
6 Вопросы к коллоквиуму
1. Каковы традиционно выделяемые дифференциальные признаки, на
базе которых строится классификация существующих словарей?
23
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2. Какие другие признаки вы могли бы предложить в качестве
основания для классификации словарей?
3. Предположим,
что
лингвистами
сконструирован
некоторый
принципиально новый словарь. Как определить его место в существующей
классификационной схеме?
4. Как
можно
типологическую
было
модель
бы,
более
в
случае
гибкой?
необходимости,
Какие
сделать
лексикографические
параметры следовало бы, на ваш взгляд, добавить к уже существующим?
5. Определите содержание понятия "правильно построенный языковой
объект": языковая единица, конкретная структура, языковая модель,
система (подсистема).
6. Укажите принципы выделения из множества словарей подмножества
правильно построенных.
7. Зачем нужны малые толковые словари при наличии больших?
Какова общая структура малых толковых словарей?
8. Что такое системная лексикография и каковы ее основные
принципы?
9. Раскройте содержание следующего тезиса: "Все современные
толковые словари ориентируются и опираются на ту или иную
лингвистическую теорию".
10. Какие
существуют
типы
и
способы
взаимодействия
лингвистической теории и толкового словаря?
11. Каковы
общие
структурные
характеристики
и
особенности
распределения информации в толковых словарях?
12. Определите
назначение
вспомогательных
текстов
толковых
словарей.
13. Проведите краткий анализ преимуществ и недостатков различных
типов упорядочивания входов в словарные статьи толкового словаря.
14. Какие
существуют
типы
и
лингвистической теории и толкового словаря?
24
способы
взаимодействия
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
15. Какого рода информация помещается в толковый словарь?
Существует ли зависимость типа помещаемой в него информации от вида
словаря? Каким может быть распределение этой информации по зонам в
пределах толкового словаря определенного типа?
16. Постройте эскиз какой-либо зоны для ТКС (для интегрального
толкового словаря, для малого толкового словаря, для толкового словаря
иностранного языка, изучаемого Вами).
17. Опишите строение толкования, обращая особое внимание на
выделение отдельных смысловых компонентов (принцип декомпозиции);
18. В чем существо проблемы минимизации толкований?
19. Какова структура текста толкования и его отдельных частей?
20. Рассмотрите
ряд
толкований,
предлагаемых
существующими
словарями, и проанализируйте отдельные недочеты и погрешности,
содержащиеся в них. Предложите способы устранения этих недостатков.
21. Постройте собственные толкования предлагаемых Вам слов для
последующего обсуждения на семинаре.
22. Каковы семантические признаки слова и их отражение в толковых
словарях (виды признаков, определение их места в структуре слова; разбор
примеров)?
23. Какие сведения о слове обычно помещаются в синтаксическую зону
толкового словаря и как именно они подаются в словарях?
24. Какова роль и назначение синтаксических признаков в толковом
словаре?
25. Проанализируйте способы словарного представления сведений о
синтаксической валентности слова и сферах действия (разбор конкретного
языкового материала).
26. Каково взаимоотношение стилистики и лексикографии?
25
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7 Глоссарий по «Компьютерной лексикографии»
Данный глоссарий состоит из наиболее употребительных терминов
компьютерной
теоретический
лексикографии
материал,
и
поможет
позволяет
как
в
систематизировать
процессе
подготовки
к
практическим заданиям, так и к экзамену.
Автоматический словарь – словарь в специальном машинном
формате, предназначенный для использования на ЭВМ пользователем или
компьютерной программой обработки текста.
Адресат словаря – тип пользователя, для которого этот словарь
предназначен.
Входной язык – язык, с которого происходит перевод.
Глоссарий – словарь узкоспециализированных терминов какойлибо отрасли знаний с толкованием.
Дескриптивный словарь – словарь, предназначенный для полного
описания лексики определенной сферы и фиксации всех употреблений.
Дефиниция – логическое определение понятия, установление
содержания понятия, его отличительных признаков.
Единица хранения – это некоторая совокупность естественноязыковых выражений проблемной области, которой сопоставляется одно
описание
на
некотором
метаязыке,
определяемом
процедурой
формирования корпуса.
Индекс – информация об морфологических особенностях лемм и
отсылающая пользователя к определенной грамматической таблице.
Конкорданс
–
лексикографическое
произведение
на
основе
компьютерной обработки данных, представляющее собой свод всех
случаев употребления слов в определенных контекстах.
Корпус данных – сформированная по определенным правилам
выборка данных из проблемной зоны.
26
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Корпусная лексикография – специальная область изучения языка
на
основе
текстовых
использованием
и
акустических
компьютера
для
корпусов
анализа,
с
хранения
постоянным
и
обработки
имеющихся данных.
Корпус словаря – совокупность словарных статей.
Лексикография – прикладная дисциплина, изучающая методы
создания (составления) словарей.
Лексико-семантический вариант – отдельное словарное значение
многозначной словарной единицы.
Лемма – это слово или словосочетание, которое составляет единицу
словника.
Лингвистический словарь – словарь, который описывает единицы
языка
и
особенности
их
употребления,
структурные
свойства,
сочетаемость, соотношение с лексическими системами других языков.
Национальный корпус языка – набор текстов определенного языка
в электронном виде, информационно-справочная система, которая дает
представление о языке на том или ином этапе развития.
Нормативный словарь
словарь,
–
указывающий норму
употребления слова.
Машинный
перевод
компьютеризированная
–
обработка
лексических баз данных в аспекте переводной лексикографии.
Общие словари – словари, которые охватывают с большей или
меньшей полнотой весь словарный состав языка.
Ономастиконы – словари имен собственных.
Помета – слово (реже словосочетание), большей частью приводимое
в сокращенной
или условной (символической) записи
и дающее
определенную характеристику слову.
Словари-тезаурусы – словари, лексика в которых организуется по
тематическому принципу.
27
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Словарная статья – лемма со всей приводимой при ней
информацией.
Словообразовательное гнездо – группа однокоренных лексических
единиц, находящихся в непосредственной словообразовательной связи с
заголовочной единицей и образующих,
как правило, отдельную часть
словарной статьи.
Специальные словари – словари, которые включают определенные
разряды лексем.
Таксоны – группы лексем, объединенных по близости значения.
Филиация лексемы – членение слова на значения.
Частотные словари – вид словарей, в которых приводятся числовые
характеристики слов (словоформ, словосочетаний) какого-либо языка.
Электронная библиотека – упорядоченная коллекция разнородных
электронных документов (в том числе книг), снабженных средствами
навигации и поиска.
Энциклопедические словари (энциклопедии) - научные или
популярные издания систематизированного свода знаний в каких-либо
областях.
Этимологический словарь – словарь, цель которого объяснение
происхождения слова.
8 Литература, рекомендуемая для изучения дисциплины
1.
Баранов,
А.
Н.
Введение
в
прикладную
лингвистику
/ А. Н. Баранов; МГУ им. М. В. Ломоносова, Филологический факультет. –
3-е изд. – М.: ЛКИ, 2007. – 360 с. – (Новый лингвистический учебник). –
Библиогр.: с. 326-340. – Указ.: с. 346-354. – ISBN 978-5-382-00231-6.
28
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2. Козырев, В. А.
Козырев, В. Д. Черняк.
Русская лексикография: учеб. пособие / В. А.
– М.: Дрофа, 2004.
– 288 с. – (Высшее
образование). - Библиогр.: с. 281-284. – ISBN 5-7107-7434-0.
3. Минаева, Л. В.
Лексикология и лексикография английского
языка = English Lexicology and Lexicography: учеб. пособие
/ Л. В.
Минаева. – М. : АСТ : АСТРЕЛЬ, 2007. –224 с. – На англ. яз – ISBN 5-17037829-7. – ISBN 5-271-14245-0.
4. Крупнов, В. Н.
Лексикографические аспекты перевода: учеб.
пособие / В. Н. Крупнов . – 2-е изд., доп. – М. : Либроком, 2009. –
208 с.
– Указ. слов.: с. 197-200. – Библиогр.: с. 201-203. - ISBN 978-5-397-005463.
29
Документ
Категория
Без категории
Просмотров
234
Размер файла
174 Кб
Теги
компьютерные, лексикографии
1/--страниц
Пожаловаться на содержимое документа