close

Вход

Забыли?

вход по аккаунту

?

bd000101619

код для вставкиСкачать
На правах рукописи
ГАЛИУЛЛИНА ГУЛЬНАРА ВАГИЗОВНА
МАШИННЫЙ ФОНД ТАТАРСКОГО ЯЗЫКА:
МОРФОЛОГИЧЕСКИЕ КОМПОНЕНТЫ
10.02.02 - Языки народов Российской Федерации
(татарский язык)
Автореферат
диссертации на соискание ученой степени
кандидата филологических наук
Казань-2005
Работа выполнена в отделе лексикологии и лексикографии
Института языка, литературы и искусства им. Г.Ибрагимова
Академии наук Республики Татарстан
Научные руководители:
доктор филологических наук,
профессор
Ганиев Фуат Ашрафовнч;
доктор филологических наук,
профессор
Галнуллнн Камиль Рахимовнч
Официальные оппоненты:
доктор филологических наук,
профессор
Хисамова Фагнма Миргалиевна;
доктор филологических наук,
профессор
Хайруллин Малик Бареевич
Ведущее учреяздение:
Татарский государственный
гуманитарно-педагогический
университет (г. Казань)
Защита диссертации состоится 25 ноября 2005 года в 13.00 часов на
заседании диссертационного совета Д 022.001.01 в Институте языка,
литературы и искусства им. Г.Ибрагимова Академии наук Республики
Татарстан по адресу: 420111, г. Казань, ул. Лобачевского, 2/31.
С диссертацией можно ознакомиться в Центральной научной
библиотеке Казанского научного центра РАН (г. Казань, ул. Лобачевского,
2/31).
Автореферат разослан 25 октября 2005 г.
Ученый секретарь диссертационного совета,
кандидат филологических наук
-в=г— СабероваГ.Г.
15^^
2.D11S
^^O^L^^^f
3
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. «В век компьютерной революции новое мышление
проникает и в область лексикографической деятельности, которая предстает как
система деятельности, приводящая к системе
словарей, создаваемых с
помощью ЭВМ» [Городещсий 1986: 231].
Активно разрабатывается и приобретает новые формы формирование
Машинного фонда языков. Поднятая А.С.Гердом в 1986 году, как «качественно
новая филологическая
проблема, поставленная
перед
современным
языкознанием», в наше время, проблема создания Машинных фондов стала
одной из перспективных областей развития теоретической и прикладной
лингвистики. Первые
отечественные разработки
автоматизированного
язьпсового фонда были связаны с русским языком. Методологическая основа
создания Машинного фонда русского языка (МФРЯ) была сформулирована
Ю.Н.Карауловым и устанавливала следующее: «Любые данные о языке могут
быть
представлены
в
лексикографической
форме.
<...>
Любые
лексикографированные данные о языке могут быть переведены в
алгоритмизированную, машинную форму» [Караулов 1986: 13]. Создание М Ф Р Я
активно обсуждалось среди учёных-лингвистов. Об этом свидетельствуют
всесоюзные конференции, посвященные Машинному фонду русского языка
[1983, 1987,1988, 1989]. Формирование М Ф Р Я послужило отправной точкой для
создания компьютерных фондов других языков.
Основным направлением в информатизации татарской лингвистики
явилось формирование Машинного (компьютерного) фонда татарского языка
(МФТЯ). Концепция построения М Ф Т Я была разработана в конце 80-х годов
членами группы «Прикладная лингвистика» ( К Г У ) совместно с сотрудниками
отдела лексикологии и лексикографии Института языка, литературы и искусства
АН РТ. Идея создания компьютерного фонда нашла широкий отклик и
послужила предметом многочисленных обсуждений на конференциях и
семинарах [К.Р.Галиуллин, Р.Г.Бухараев, Н.А.Обносова, Ф.С.Сафиуллина,
В.Д. Соловьев, Д.Ш.Сулейманов].
Создание М Ф Т Я
позволит «обеспечить принципиально новую
техническую основу для поиска, хранения, обработки и описания
лингвистической информации<.. .>» [Компьютерная лингвография 1995: 50].
Структурно М Ф Т Я состоит из двух подфондов - словарного
(грамматического) и иллюстративно-текстового. Формирование М Ф Т Я , в
первую очередь, призвано содействовать оптимизации лингвистических
исследований,
а
также
справочно-информационному обеспечению,
информатизации и компьютеризации татарского языкознания.
В рамках словарного (грамматического) подфонда создаются словари
различных типов, значительное место среди которых занимают компьютерные
словари.
содержащие
грамматическую
(морфологическую
и
словообразовательную) характеристику слов. Актуальность разработки
грамматических компьютерных словарей обуславливается тем, что грамматика
уделяется особое BHHM.IIIHI,' U 11роцг1.-1-и,.цЯуЦ(1ния. Важное место в описании
лексической единицы! занишет'д^£,^орфопогическая характеристика. О
значимости сведений мс1рфоло51|да€шд»' характера, свидетельствует тот факт,
I
OSJ^ZilSa^/^i
4
что
эти
сведения
являются обязательной частью практически всех
словарей. Поэтому разработка компьютерного морфологического компонента
татарского язьпса даст немало нового материала для анализа и характеристики
морфологических особенностей слова, обеспечит повышение уровня
информатизации татарского языкознания.
Возможность многоцелевого использования имеющегося материала
позволила создать на базе морфологического компонента компьютерный
морфологический словарь (КМС) и обратный словарь татарского языка (ОСТЯ).
Обратный (инверсионный)
алфавитный порядок расположения слов
представляет собой интерес для татарской лингвистики в силу постфиксального
характера слово- и формообразования.
Цели и задачи исследования. Целью данной диссертационной работы
является разработка морфологической харакгеристики лексических единиц в
Машинном фонде татарского язьпса. Поставленная цель определила ряд задач
теоретического и практического характера, которые решались в ходе работы с
ориентацией на компьютерно-лексикографическое представление материала,
это:
- характеристика степени изученности морфологических явлений в
современном русском и тюркском языкознании;
- определение основного круга вопросов, возникающих при
морфологическом описании слова;
- исследование проблемы частей речи в русском, тюркском, татарском
язьпсознании;
- описание общих точек зрения на критерии выделения частей речи в
русском, тюркском, татарском языкознании;
- рассмотрение актуальных вопросов морфологии в русском, тюркском,
татарском языкознании;
- выработка принципов описания лексикографических источников;
- отбор источников для анализа
и описания морфологической
информации в татарских и русских словарях;
- определение типологии грамматических (морфологических) сведений
в словарях;
- описание формы представления морфологической информации (по
частям речи и формообразованию) в современных лексикографических
источниках по татарскому и русскому языку;
- расширение базы Машинного фонда татарского язьпса (МФТЯ);
- создание первичной версии компьютерного морфологического
словаря, на основе которого будет проходить дальнейшее развитие и
формирование справочно-информационной базы;
- разработка
концепции
и
архитектуры
компьютерного
морфологического словаря;
- определение круга возможных запросов справочно-информационной
базы;
- составление частотного указателя морфологических признаков;
- описание продуктивных суффиксов татарского языка, участвующих в
образовании разных частей речи;
5
- создание обратного словаря татарского
языка
на
базе
компьютерного морфологического компонента;
- описание структуры обратного словаря татарского языка;
- выявление особенностей при описании словарной статьи обратного
словаря татарского языка.
Новизна работы. Научную новизну работы мы видим в том, что, в
результате анализа специальных и общих словарей, нам удалось поднять и
решить ряд вопросов грамматического описания словарной единицы, связанных
как с отнесенностью слов к определенным частям речи, так и с
формообразованием данных слов. Результатом данного рассмотрения явилось
создание компьютерного морфологического компонента татарского языка.
Данный морфологический компонент является новой
компьютерной
справочно-информзционной системой на татарском языке. Справочноинформационная система представляет собой разветвленную структуру, на
основе которой созданы два лексикографических издания - компьютерный
морфологический словарь татарского языка и обратный словарь татарского
языка, не имеющий аналогов в современной татарской лексикографии. В
исследовании
- дано методическое обоснование целесообразности
создания
компьютерного морфологического словаря;
- разработана концепция архитектуры компьютерной морфологической
базы татарского языка;
- предусмотрена возможность отбора слов по заданной совокупности
морфологических характеристик;
- рассмотрены принципы создания обратного словаря;
- предложена морфологическая характеристика для каждого слова,
вошедшего в словник обратного словаря;
- применена система индексации в структуре обратного словаря;
- проанализированы словообразовательные суффиксы татарского языка с
применением статистических подсчетов.
Теоретическая и практическая значимость. Теоретическая и
практическая значимость диссертации заключается в следующих аспектах. В
процессе исследования была представлена концепция компьютерной
морфологической справочно-информационной базы и разработанный на её
основе обратный словарь татарского языка. Эти лексикографические
справочники могут быть использованы в работах по татарско-русской и русскотатарской общей и учебной лексикографии, при преподавании татарского языка
как родного и неродного, а также в качестве информационно-справочной
системы при изучении языков, для решения различных затруднений, связанных
с грамматической характеристикой слова и словоизменением. Пользователями
справочно-информационной базы могут быть: школьники, студенты,
преподаватели - представленная информация оптимизирована для всех
категорий пользователей. На базе морфологического компонента можно
создать различные учебные и игровые программы. Материалы диссертации
могут быть использованы в научных и методических работах по компьютерной
лингвистике и по компьютерной технологии обучения.
6
Краткое описание источников. При формировании
компьютерного
морфологического словаря и при создании обратного словаря татарского языка
привлекались различные источники. Основу
базовой
лексики составил
академический лексикографический источник, представленный в трёх томах, «Толковый словарь татарского языка» [«Татар теленец анлатмалы сузлеге»
1977-1981]. Его объём составляет 46890 единиц. Данный словарь явился
основным источником интересующей нас информавдга по словарному составу,
акцентологии, частеречной отнесенности лексики татарского языка.
В процессе формирования словника были привлечены и другие
лексикографические источники общего и учебного характера, включающие в
себя разнообразные
морфологические сведения. В
частности, это
орфографические
словари.
Первым
назовем
изданный
недавно
«Орфографический словарь татарского языка» [«Татар теленен орфография
сузлеге» 2002] - 140079 слов и форм слов. Данный словарь явился основным
источником для пополнения словарной базы, так как в нём содержатся новые
слова, которые отсутствуют в названном вьппе словаре. Словарь служил
источником грамматической информации. Также в компьютерную базу был
включён
«Орфографический словарь татарского языка» [«Татар теленен
орфографик сузлеге» 1983] - 38000 слов.
К формированию язьпсовой базы привлекались и двуязычные словари.
Это «Татарско-русский словарь» [«Татарча-русча сузлек» 1966], словарный
объём которого составляет 38000. Данный словарь является академическим
изданием, содержащим сведения по грамматике. Использовался и «Татарскорусский словарь» [«Татарча-русча сузлек» 1995] - 25000 слов, предоставивший
сведения по акцентологии и частям речи татарского языка.
Вышеназванные словари явились основными источниками для
формирования Генерального словника.
Краткий обзор литературы по теме. В ходе работы были использованы
материалы различных исследований, связанных с нашей проблематикой.
Современная библиография располагает значительным количеством работ,
посвященных проблемам морфологии, лингвографии, а также теории и практике
создания и эксплуатации различного рода автоматизированных справочных
систем. Множество
исследований посвящено различным проблемам
морфологии, в частности, вопросам классификации частей речи и принципов их
выделения. Существует значительное количество работ, посвященных
проблемам лингвографирования в языковых справочниках. Среди исследований,
посвященных вопросам русской и татарской лексикографии (как общей, так и
учебной), рассматривающих комплекс проблем, можно отметить работы
В.М.Андрющенко [Андрющенко 1986, 1988]; Д.Р.Валиахметовой [Валиахметова
1992], К.Р.Галиуллина [Галиуллин 2000]; Ф.А.Ганиева [Ганиев 1992, 2000],
А.С.Герда [1988]; М.Р.Гатиатуллина [Гатиатуллин 1988, 1990, 2000]; П.Н.
Денисова №нисов 1969, 1977, 1978]; Х.Ф.Исхаковой [Исхакова 1968];
Ю.Н.Караулова [Караулов 1986, 1988] В.В.Морковкина [Морковкин 1986, 1987],
Л.А.Новикова [Новиков 1969, 1974]. А.А.Поликарпов [Поликарпов 1990];
Р.П.Рогожниковой [Рогожникова 1984].
Среди работ, специально посвященных проблемам компьютеризации
лексикографии, можно отметить работы казанских исследователей [Галиуллин
7
1988,
1990,
1992;
Галиуллин, Валиахметова, Сабаева и др. 1995;
Хасанова 1991; Сулейманов 1995; Сабаева 1999; Ризванова 2001; Сабитова 1999,
2002].
Методы исследования.
Для решения поставленных задач в процессе работы использовались
следующие методы:
- метод лингвистического описания (при описании лингвистического материала
для компьютерного морфологического компонента);
- сравнительно-сопоставительный метод (при сравнительно-сопоставительном
анализе материалов различных лексикографических источников);
- квантитативный метод (при описании количественных данных).
Апробация работы. Результаты исследования и основные положения
диссертации отражены в публикациях, которые были представлены в научных
сборниках и докладах на конференциях (4 доклада, 7 публикаций).
Демонстрахдаонная версия
компьютерного обратного словаря была
представлена на Международной научной конференции, посвященной 200летию Казанского университета (Казань, 4-6 октября 2004 года).
Структура работы. Диссертация состоит из введения, основной части,
содержащей четыре главы, заключения, библиографии и приложений.
ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Во введении формулируется цель и задачи исследования, обосновывается
актуальность и новизна работы, определяется ее теоретическая и практическая
значимость, делается краткий обзор привлечённых источников и литературы по
теме.
В первой главе «Морфология слова в современной лингвистике»
раскрываются проблемы
морфологии
слова в русском и тюркском
языкознании, проблемы морфологии слова в татарском языкознании.
В первом разделе мы рассмотрели наиболее актуальные проблемы
морфологии в русском язьпсознании. Одним из основных вопросов морфологии
является определение объекта изучения. В лингвистике на данной проблеме
существует несколько точек зрения. Согласно одной - морфология является
грамматическим учением о слове. Такой подход характерен для русской
традиции в целом и объединяет, несмотря на наличие порой весьма серьёзных
расхождений по другим проблемам языкознания, таких лингвистов как
Ф.Ф.Фортунатов,
В.В.Виноградов, В.А.Богородицкий,
Л.А.Булаховский,
А.АШахматов., Т.СКузнецов. Другая точка зрения основывается на
расширенном понимании морфологии, определяя её как науку о формах языка
вообще, а не только как науку о формах слова. Такой взгляд, популярный в 2030 Г.Г., был представлен в работах И.А.Бодуэна де Куртэне, В.Матиуса, Ф. де
Соссюра, О.Есперсена. В современном языкознании, на наш взгляд, наиболее
точную формулировку объектов морфологии представил В.А.Плунгян, который
полагает, что объектом современной морфологии являются минимальные
двусторонние единицы языка (морфемы) и «жёсткие» комплексы этих единиц
(словоформы). «Таким образом, можно сказать, что вся морфологическая
проблематика помещается в пространстве между морфемой и словоформой; на
8
менее техническом языке морфология определяется как описание свойств
слова и его (значащих) частей» рТлунгян 2000:13-14].
Наиболее дискуссионной является проблема сущности и принципов
классификации частей речи. На протяжении X I X века к этой проблеме
обращались ведущие языковеды А.Х.Востоков, Г.П.Павский, К.С.Аксаков,
Ф.И.Буслаев, А.А.Потебня. В X X веке продолжили обсуждать эту проблему
Ф.Ф.Фортунатов,
А.М.Пешковский,
А.А.Шахматов,
Л.В.Щерба,
И.И.Мещанинов,
Г.О.Винокур,
Р.И.Аванесов,
В.В.Виноградов,
А.А.Реформатский.
Одной из основных и актуальных проблем, стоящих перед языкознанием,
является «проблема функционирования слова - центральной единицы в системе
языка, и классификация слов на различные части речи ...» [Болдычева 1991: 16].
Ж. Вандриес справедливо заметил, что «классифицировать части речи настолько
трудно, что до сих никто удовлетворительной классификации не создал»
[Вандриес 1937: 114]. Практически каждый известный грамматист имеет свою
классификацию частей речи, а их количество может варьироваться от 2-х
(Ж.Вандриес считал, что в индоевропейских языках существует только две
части речи - имя и глагол) до 14 (у А.А.Шахматова). Части речи могут
выделяться на основе семантического (у А.А.Потебни), функционального
(дескриптивисты), формального (Ф.Ф.Фортунатов) или на основе всех трех
вместе взятых признаков (В.В.Виноградов).
Тема подходов к выделению частей речи на сегодншпний день остается
наиболее обсуждаемой и разрабатываемой. Ряд теоретических работ раскрывают
новые аспекты в решении данного вопроса [В.М.Алпатов 1986,1990].
Во втором разделе первой главы диссертации мы рассмотрели
актуальные проблемы в тюркском языкознании.
В равной мере, как и для русского язьшознания, проблема классификации
слов по частям речи является актуальной и для тюркского язьпсознания.
В X I X веке проблемы частей речи и принципов их классификаций были
отражены в исследованиях ученых-тюркологов А.Казем-Бека, О.Бётлингка,
В.В.Радлова, П.М.Мелиоранского. Классификации этого времени составляются,
как правило,
под влиянием русских или арабских грамматик. Так,
классификация, предложенная А.Казем-Беком, была составлена по схеме
русских грамматик, состояла из имени (существительное, прилагательное,
местоимение, числительное), глагола, служебных слов (наречие, предлоги,
союзы, междометия). О.Бётлингк характеризует лексику якутского язьпса в двух
аспектах - словообразования и словоизменения. П.М.Мелиоранский,
руководствуясь семантическим и синтаксическим признаками, выделяет в
киргизском язьгсе 8 частей речи: имена (существительное и прилагательное
рассматриваются вместе), местоимения, числительные, глаголы, наречия,
послелоги, союзы, частицы. Междометия не вошли в состав частей речи.
В X X веке, проблема частей речи начинает рассматриваться более
детально в работах А.Н.Самойловича, В.А.Гордлевского, Н.К.Дмитриева,
А.Н.Кононова,
Н.П.Дыренковой,
А.К.Боровикова,
И.А.Батманова,
Н.А.Баскакова, Н.И.Ашмарина, К.К.Сартбаева, Н.Х.Ишбулатова, Ф.Г.Исхакова.
Основные положения классификации частей речи тюркских языков были
отражены в работах А.Н.Самойловича.
9
Проблема классификации частей речи, выступая в общем аспекте,
неразрывно связана с вопросом перехода слов из одной части речи в другую. В
тюркологии вопросы конверсии обсуждались многими исследователями
[П.М.Мелиоранский,
Н.Ф.Катанов,
Н.И.Ашмарин,
Н.П.Дыренкова,
Н.К.Дмитриев, A.H.KOHOHOB, А.И.Исхаков, Ф.Р.Зейналов, В.М.Жирмунский,
Н.А.Баскаков]. Перечисленные исследователи реализовывали различные
подходы к решению этого вопроса. В 60-е годы по данной проблеме в тюркском
языкознании появляется новая концепция и явления перехода слов из одной
части речи в другую были рассмотрены как конверсия (от лат. conversioизменения, превращения) [Ф.А.Ганиев, А.А.Юлдашев].
В тюркском язьшознании неоднократно обсуждался вопрос о глагольном
виде. Глагол, являющийся крупной частью речи по своему количественному
составу, является наиболее сложной грамматической единицей в тюркских
языках, так как не был решён вопрос о существовании вида вообще. Одни
исследователи считали, что в тюркских языках наличествует категория
глагольного
вида
[В.А.Богородицкий,
А.К.Боровков,
Н.К.Дмитриев,
А.А.Юлдашев и др.], другие исследователи [А.Н.Кононов, Б.А.Серебренников]
считают, что нет достаточных оснований для выделения данной категории. И в
настоящее время этот вопрос остается открытьш.
Актуальным также остается вопрос о количестве падежей в тюркских
языках. В настоящее время в тюркских языках ученые выделяют различное
количество падежей: в якутском от 7 до 9 падежей, казахском и турецком 6,7
падежей, в татарском от 6 до 11 падежей. В башкирском языке в связи с
зависимостью от огласовки слова и качества конечного согласного основы
насчитывают от б (Н.Дмитриев) до 19 (Р.Зарипов) падежей.
Третий раздел первой главы диссертации «Вопросы морфологии в
татарском языкознании». Конкретным объектом морфологии выступают
проблемы, во-первых, связанные с классификацией слов по частям речи и
деление каждой из них на более мелкие лексико-грамматические и
морфологические
разряды,
во-вторых,
интерпретации
и
описания
морфологических категорий, существующих в определенных системах форм, а
также и общая классификация самих этих форм [Татарская грамматика 1993: б].
При рассмотрении проблемы морфологии слова в татарском языкознании
была установлена их определенная связь с аналогичными проблемами общего
языкознания. Так, вопрос о количестве частей речи, рассматриваемый в общем и
тюркском языкознании, является основным и для татарского языка. Авторы
первых грамматик татарского языка И.Гиганов (1801), И.Хальфин (1809),
М.Иванов (1842), А.Троянский (1860)
выделяют 8 частей речи: имя,
местоимение, глагол, причастие, наречие, предлог, союз, междометие. В составе
имен рассматривались такие части речи как имя существительное,
прилагательное, числительное. А.Казем-Бек в своей грамматике (1839) выделяет
9 частей речи и отдельно рассматривает имя существительное, имя
прилагательное, имя числительное, как самостоятельные части речи.
Вопрос о количестве частей речи в татарском языке неоднократно
обсуждался и рассматривался исследователями. Авторы грамматик, учитывая
особенности татарского языка, основывались на различных подходах к
выделению частей речи. Как мы отметили выше, количество последних было
10
неодинаково. Так, Г.Фейзхаиов (1887) указывает
на
5
частей
речи,
основываясь на лексико-семантическом принципе: имя (исем), прилагательное
(сыйфат), местоимение (киная), глагол (фигыль), служебные слова (адэт).
К.Насыри (1895) по семантическому принципу вьвделяет 3 части речи: имя
(исем), глагол (фигыль), частицы или служебные слова (хореф). Г.Нугайбек
(1911)
указывает на 9 частей речи: существительное, прилагательное,
числительное, местоимение, глагол, наречие, послелог, союз, междометие.
Г.Ибрагимов (1913), придерживаясь лексико-семантического принципа,
выделяет уже 9 частей речи. На основании семантического различия Дж.Валиди
(1919) выделяет следующие части речи: имя (существительное, прилагательное,
числительное), глагол (фигыль), связка (элемтв). По формально-семантическому
принципу Г.Алпаров (1945) выделяет 9 частей речи: глагол, с^тцествительное,
прилагательное, числительное, местоимение, наречие, междометие, служебные
слова. Во второй половине X X века количество частей речи в татарском языке
было
рассмотрено
в
грамматиках
В.Н.Хангильдина
(1954),
Д.Г.Тумашевой(19б4). Современные грамматики выделяют 12 частей речи.
Важным и актуальным остается исследование категории падежа. Падеж
как грамматическая категория был отмечен уже в ранних грамматиках
[И.Гиганов, И.Хальфин, А.Троянский, А.Казем-Бек, К.Насыри, Г.Фейзханов,
Г.Нугайбек, Г.Алпаров и др.] В разных грамматиках количество выделяемых
падежей было различно. Авторы грамматик X I X века выделяют в татарском
языке 7 падежей [И.Гиганов, И.Хальфин, А.Троянский, А.Казем-Бек]; К.Насыри
- б, Г.Фейзханов - 8 падежей. В грамматиках нач. X X века количество падежей
колеблется от 6 до 8 [Г.Нугайбек, А.Алпаров]. С 40-х годов X X века их число в
грамматиках ограничилось шестью падежами: баш килеш (основной падеж),
иялек килеше (притяжательный падеж), юнэлеш килеше (направительный
падеж), чьпыш килеше (исходный падеж), урын-вакыт килеше (местновременной падеж). Современные татарские грамматики и до сих пор сохраняют
данную падежную систему [Д.Г.Тумашева 1978; Ф.С.Сафиуллина, М.З.Закиев
1994,2002; З.М.Валиуллина 1992, Татарская грамматика 2002]. Новые аспекты в
рассмотрении падежной системы были предложены М.З.Закиевым и
Ф.А.Ганиевым. В своих работах исследователи татарского языка, пересмотрев
установленные каноны, доказывают многопадежную систему татарского языка.
В татарском язьпсе глагол относится к наиболее изученным частям речи.
Так, у глагола установлены грамматические категории (наклонение, время,
отрицание, залог, число, лицо) и формы (причастие, деепричастие, инфинитив,
имя действия, модальные формы). Но, несмотря на это, исследования по глаголу
не прекращаются. В татарском язьпсе актуальньпл остаётся вопрос о наличии у
глагола категории вида. В татарском язьшознании исследованию глагола и его
формам
посвящен
ряд
кандидатских
диссертаций:
Л.С.Гадельшин
«Инфинитивная форма глагола в современном татарском язьпсе» [Казань, 1957];
А.Х.Нуриева «Система спряжения глагола по категориям времени» [Казань,
1961]; Ф.А.Ганиев «Видовая характеристика глаголов татарского языка»
[Казань, 1963]; К.3.3иннатуллина «Залоги глагола в современном татарском
языке» [Казань, 1968]; Н.Х.Салехова «Грамматическая категория глагола и
темпоральность» [Казань, 1975]; Д.Ш. Шайхадарова «Грамматическая категория
11
лица
татарского
глагола
и персональность» [Алма-Ата, 1980];
Р.К.Иштанова «Глаголы татарского языка в семантическом аспекте» [Казань,
2002].
В последнее время наметился определенный прогресс в решении
отдельньк проблем татарской морфологии. Среди диссертационных
исследований, решающих грамматические вопросы, можно отметить следующие
работы: С.Ф.Гарифуллин «Послелоги татарского языка» [Казань, 1990];
А.Г.Акберова «Структура и семантика наречий в современном татарском языке»
[Казань, 1998]; В.А.Костенко «Имена прилагательные в современном татарском
языке» [Казань, 2002]; Фаттахова Р.Ф. «Категория числа в современном
татарском литературном языке» [Казань, 2002]; Г.Р.Самирхзнова «Выражение
падежных отношений в татарском литературном языке» [Казань, 2004].
Вторая глава «Информация о морфологических компонентах в
современной
лексикографии»
посвящена
рассмотрению
типов
морфологической информации и форм их лексикографирования в
разноаспектных словарях татарского языка; во второй части главы
проанализированы формы представления грамматических характеристик,
таких как частеречная отнесенность слов и формообразование частей
речи в языковых справочниках русского языка.
В первом разделе второй главы диссертации предметом нашего
исследования явилась грамматическая характеристика слов в словарях. В
процессе работы нами были проанализированы толковые, учебные и
двуязычные словари, несущие в себе разнообразную грамматическую
информацию о лексических единицах татарского языка. Для анализа были
отобраны б словарей татарского языка: «Татарско-русский словарь» [1966]
(«Татарча-русча сузлек»), содержащий около 38 000 слов; «Толковый
словарь татарского языка» («Татар теленен анлатмалы сузлеге») [1977,
1979, 1981], содержащий 46 890 словарных единиц, из них - 32 880
заглавных слов и 14.010 составных слов и фразеологических единиц;
«Орфографический словарь татарского языка» [1983] («Татар теленен
орфографик сузлеге»)- 38 000 слов; «Татарско-русский учебный словарь»
[1993] («Татарча-русча уку-укыту сузлеге») - 10 000 слов; «Татарскорусский словарь» [1995] («Татарча-русча сузлек») - содержит 25 000 слов;
«Орфографический словарь татарского языка» [2002] («Татар теленен
орфография сузлеге»), в котором на сегодняшний день представлено
наибольшее количество слов и форм слова татарского языка - 140 079
единиц.
Формы лингвографирования в рассмотренных выше лексикографических
источниках имеют значительные различия в зависимости от типа словарей, но
неизменной грамматической информацией остается указание на часть речи. В
большинстве словарей отмечена эта морфологическая принадлежность слова. В
татарском языке, как и во многих тюркских языках, у значительного числа слов
слабо выражено их формальное различие по частсречному признаку. Поэтому
указание на часть речи даёт возможность представить грамматическую
сущность слова, возможные его формы и сочетаемость. Сведения по частям
речи могут быть представлены в виде прямого указания частеречной
характеристики рядом с заголовочным словом и косвенно (показана
12
формообразовательная
парадигма, характерная
только
для
определенной части речи). Частеречное указание приводится или на
русском, или на татарском языке. При этом оно может быть зафиксировано
как у всех представленных заголовочных единиц, так и только у отдельных слов.
Например, в «Толковом словаре татарского языка» [1966] сведения по частям
речи отмечены только у местоимений (с указанием разряда); у числительных
порядковых, собирательных, разделительных и приблизительного счета (с
указанием разряда); у союзов (с указанием разрядов); междометий и послелогов.
В словарях орфографической направленности [1983, 2002] прямое указание на
часть речи отсутствует, однако у имен существительных и глаголов выделяются
формообразовательные показатели, характеризующие слово как относящееся к
той или иной части речи.
Сведения по формообразованию представлены практически во всех
словарях. Эти сведения указываются после частеречной характеристики
слова. В отдельных словарях при помощи вертикальной черты (|)
отделяется неизменяемая часть слова.
Во втором разделе второй главы диссертации в целях более полного
представления морфологической информации нами были проанализированы
специальные разноаспектные общие и учебные словари, несущие в себе
разнообразную грамматическую информацию о лексических единицах русского
языка. Для анализа были использованы: «Грамматический словарь русского
языка: Словоизменение» [Зализняк, 1987] - 100000 слов; «Словарь
грамматических трудностей русского языка» [Ефремова, Костомаров, 1993];
«Объяснительный словарь русского языка: Структурные слова: предлоги,
союзы, частицы, междометия, вводные слова, местоимения, числительные,
связочные глаголы» [Морковкин, 2002] - 12000 слов; «Школьный грамматикоорфографический словарик русского языка» [Безрукова, 2001] - около 10,5
тысяч слов. В словарях используется система индексов, которая может быть
представлена в виде основной формы грамматической информации «Грамматический словарь русского языка» [Зализняк, 1987] - и пояснительной «Объяснительный словарь русского языка» [Морковкин, 2002].
В третьей главе диссертации - «Машинный фонд татарского язьша:
морфологический словарь татарского языка» - рассмотрен принцип построения
компьютерного морфологического словаря татарского языка, представляющего
собой информационно-справочную систему. Необходимость такой разработки
связана с поставленной перед татарским языкознанием задачей, связанной с
расширением фундамента научных исследований и созданием информационносправочных систем различного характера на базе компьютера. Для решения этой
проблемы была разработана концепция компьютерного морфологического
словаря татарского язьпса (КМСТЯ), входящая в круг задач по формированию
Машинного фонда татарского языка (МФТЯ). М Ф Т Я состоит из нескольких
подфондов, одним из которых является Грамматический подфонд.
Грамматический подфонд представляет собой многоуровневую структуру, в
состав которой входят следующие компоненты:
1) словообразовательный компонент (компьютерный словообразовательный
словарь татарского языка) - информационная система словообразовательных
связей татарского языка;
13
2) морфологические компоненты - компьютерный морфологический
словарь татарского язьпса, на базе которого сформирован обратный словарь
татарского язьпса [см. ниже];
3) текстовый компонент (компьютерная версия академической грамматики
татарского словаря);
4) грамматический
гипертекст
нелинейное
множество
текстов
(информационных блоков), связанных друг с другом разнообразными
ассоциативными связями и образующих, таким образом, систему. Гипертекст
позволяет облегчить поиск информации по содержательному критерию (в
отличие от формального). Гипертекстовая организация материала позволяет «не
листая» осуществлять прямой переход к соответствующим информационным
зонам.
В
результате Грамматический подфонд явился стержневым в
формировании компьютерного морфологического компонента, на базе которого
был разработан компьютерный морфологический словарь.
В компьютерном морфологическом словаре нашли отражение сведения
по морфологии, рассмотренные в теоретической части диссертации. В
частности, в виде информационно-справочных окон была представлена
морфологическая (грамматическая) характеристика по частям речи, склонению
и спряжению знаменательных частей речи. Неизменяемые части речи были
отражены в информационных окнах с указанием разрядов и степеней. В каждом
грамматическом информационном окне были указаны примеры:
СЛОВОФОРМЫ
АГАЧ-ДЕРЕВО
(исем - существительное)
В татарском языке с помощью суффиксов выражается
принадлежность предмета к какому-либо лицу. Категория
пряиадлежяости бывает прелсгавлепа личными формами
единственного и множественного числа.
ед ч
формы принадлежности
1л.
Пл.
Шл.
икижт
именительный падеж
притяжательный падеж
направительный падеж
винительный падеж
исходный падеж
местно-временной падеж
агач-АН#
агач-*/лг
агач-ы
мн ч
лтгл-ыбыз
атач-ыгыз
1 агач-ларь/
ед.ч.
агач
агач-/ГАИГ
агач-ла
агач-я*/
агач-гая
агач-та
■СЛОВОФОРМЫЕЛАРГА - ПЛАКАТЬ
(фигыль - глягол)
мв.ч.
лтач-ляр
атгп-ляр-ныа
агач-ляр-га
агач-ляр-ны
лпч-ляр-дян
атач-лар-да
14
настоящее время
(жазергс заман)
1л.
11л.
Ill л.
tn-ыЛ-м
еп-ый-сын
ел-АИГ
ел-ый-быз
ил. ел-ый-еиз
Шл. ел-ый-лар
1л.
КМСТЯ
позволит
повысить
качество
лексикографического
представления языкового материала, будет способствовать совершенствованию
описания морфологических данных (по частям речи и формообразованию) и
эффективному использованию их в лингвистике и лингводидактике.
Глава четвертая «Обратный словарь татарского языка как база для
исследования морфологических компонентов».
Повышение интереса к использованию компьютерной техники в изучении
татарского языка требует создания автоматизированных разработок. Создание
обратного словаря татарского языка (ОСТЯ) поэтому явилось актуальной,
востребованной разработкой. Разработанный нами ОСТЯ использует обратный
порядок расположения слов как средство наиболее наглядного представления
основного содержания - сведений о слово- и формоизменении татарского
языка. Для татарского языка этот принцип особенно показателен, так как
суффиксы располагаются по одну сторону ОТ корня. Таким образом, слова в
инверсионном словаре сгруппированы по грамматическому признаку (часть
речи, группа в пределах части речи, наличие определённого суффикса).
Инверсионный тип словаря позволил организованно представить все
многообразие суффиксальных средств, образующих имена существительные,
имена прилагательные, наречия, глаголы и другие части речи.
В результате анализа нами было выявлено свыше ста имяобразующих
суффиксов, свыше шестидесяти глаголообразующих суффиксов, свыше
пятидесяти суффиксов, образующих имена прилагательные, двадцати пяти
суффиксов, образующих наречия. Наряду с производительными выделяется
значительное количество непроизводительных суффиксов. Данный факт
обусловлен расширением значения у ряда производительных суффиксов и
интенсивным заимствованием слов из русского и других языков. Также нами
была отмечена высокая продуктивность многих суффиксов. В обратном словаре
представлены существенные массивы (более тысячи) слов, имеющих один
определенный суффикс. Вместе с тем, при обработке массива словаря
встречаются слова, суффиксы у которых не вычленяются. Проведенный анализ
суффиксов, образующих части речи татарского языка, доказывает практическую
обоснованность создания обратного словаря татарского языка, который
непосредственно служит для решения ряда филологических вопросов.
В ОСТЯ содержится следующая информация:
1. В словаре даны ссылки на словари-источники, то есть указывается, в каких из
этих словарей содержится данное слово. Данные ссылки выполняют важную
функцию: пользователь видит, к какому из словарей-источников он может
обратиться за необходимыми сведениями о слове. Эти ссылки помогают
15
использовать
данный словарь
в качестве обратного индекса к любому
из 5 словарей-источников в отдельности. Ссылки важны для пользователя, так
как из наличия слов в одних словарях и отсутствия в других можно сделать
вывод как о характере самого слова, так и о принципах, которыми
руководствовались
составители разных словарей-источников. Ссылки на
словари-источники позволяют увидеть расхождения между словарями в
грамматической интерпретации слова, числе выделяемых омонимов (римские
цифры), а также лексических значений (арабские цифры):
баба'
ба'ба
и.
и.
а5
кара
с.
кара
al
и.
all
кара
и.
йолдызара
с.
агрочара
аффрика'та
и.
и.
азыклата
а
Ы
Ы1
d
b с
b
e
dl
el
dll
ell
dlll
а
b
e
b
с
рэв.
b
с
d
e
тирв-якта
рэв.
b
с
d
e
киста
и.
b
с
d
e
а
b
e
2.При слове в форме помет представлена основная грамматическая
характеристика - указание на часть речи. В случае расхождения между
словарями пометы даются при индексе соответствующего словаря-источника.
Соответственно, словарь
частично выполняет функции грамматического
словаря: даёт возможность получить простые грамматические сведения,
статистические подсчёты по частям речи, является источником информации обо
всех грамматических разночтениях между словарями-источниками:
каршында
югында
b
рэв.
с
b
а.
d
бош,^
d
6,Л.^
гелбаба
и.
а
тота-каба
рэв.
а
таба
бэйл.
all
ва
ы.
а
га-га-га
аваз.ияр
а
b с
асылда
кер суз.
а
b
с
анда
а.
а5
b
с
d
гадэд
сан
b
с
d
b
с
ЖЫЮ
ф.
аШ
b
b с
bll
e
dll
d
d
ell
e
<"" e
e
e
3.Словарь даёт сведения о числе омонимов, имеющих данную исходную
словоформу, а также обеспечивает возможность увидеть расхождения в
интерпретации омонимов по словарям-источникам:
риза'
16
а2
bll
и.
а
и
al,6
и. all.3
и.
alll
и. aIV,2
Ы
Ы
bll
bin
blV
хаб.суз.
ри'за
басма
басма
басма
басма
с
dl
dll
din
4.B словаре представлены сведения о наличии лексических значений для
отдельных грамматических форм заглавного слова:
кыскартма
и.
аЗ
b с
d
e
атмосфе'ра
и.
а4
b с
d
e
туйра
и.
а5
b с
d
e
фигу'ра
и
а9
b с
d
e
растра'та
и.
а2
b
d
нокта
и.
а7
b с
d
e
кызылча
и. al.3
bl с
dl
el
кызылча
и. all.2 bll
dll
ell
тэлэкэ
и
а6
b
e
5.B словаре представлены сведения по орфографии и акцентологии.
Надстрочная звёздочка (*) означает, что у данного слова есть орфографический
или акцентологический вариант. Исходная словоформа даётся с одной
звёздочкой (*), а орфографический или акцентологический вариант с двумя
звёздочками (**):
*тамуг
**тамук
*о'бщина
**общи'на
*фиразэ
**фирузэ
"^шешмэ
**шешмэк
*зерэ'
**зе'рэ
и.
и.
и.
и.
а
а
а2
а2
и.
с.
с.
рве.
рае.
а2
а
а
а
а
и.
а
b
b
b
b
b
b
b
Инверсионный тип словаря определил его структуру:
§1. Слова в ОСТЯ расположены в алфавитном порядке конечных букв
слова:
а
а
ба
ба
баба'
17
ба'бя
ата-баба
*эби-баба
§2. Словари-источники для более удобного расположения информации
условно индексированы латинскими буквами:
а - Толковый словарь татарского языка в 3-х томах [Татар теленен анлатмалы
сузлеге: 1978-1981];
b - Орфографический словарь татарского языка [Татар теленен орфография
сузлеге: 2002];
с - Орфографический словарь татарского языка [Татар теленен орфографик
сузлеге: 1983];
d - Татарско-русский словарь [Татарча-русча сузлек: 1966];
е - Татарско-русский словарь [Татарча-русча сузлек: 1995].
§3. При каждом слове, включенном в обратный словарь, даётся условное
обозначение, указывающее, в каком из перечисленных выше словарей оно
зафиксировано:
кящпкэ
лвцка
сулэмэ
фотокургвзмэ
бе'лмича
и.
и.
и.
и.
рэв.
а
а
b
b
b
b
b
d
d
d
d
d
§4. Слова представлены в той же словарной форме, что и в словареисточнике, за исключением глаголов:
арба
и. а
b с
d
e
*хврби-Ьава
с.
b
d
e
хаксызга
натнжа
эченда
бара-бэра
рэв.
и. а
бэйл. а
аваз.ияр
b
Ь с
b с
b
d
d
d
d
e
e
e
Глаголы даны в форме имени действия на -у/-у/-ю. Форма имени
действия выбрана по следующим причинам: во-первых, в одноязычных словарях
принято представлять глаголы в формах имени действия; во-вторых, она
наиболее оптимальна для образования чистой исходной формы глагола; втретьих, словарная база Грамматического подфонда была сформирована на
основе данной формы глагола; в-четвёртьк, данная форма наиболее компактна
в плане размещения:
тою
ую
кую
сую
тую
жыю
а4
ф
а4
ф
ф al9
а5
ф
а5
ф
ф aI6.I
b с
b с
d
d
e
e
b с
d
e
b с
d
e
b с
d
e
b с
d
e
18
§5. Все слова имеют свою грамматическую
помету:
имя
существительное - исем (и.), глагол - фигыль (ф.), имя прилагательное - сыйфат
(с), наречие -рввеш (рве.), местоимение - алмашлык (а.), имя числительное - сан
(сан), союзы - терквгечлэр (терк.), частицы - кисекчелар (кис), междометия ымлыклар (ы.), послелоги - бвйлеклэр (байл.), шумо- и звукоподражательные
слова - аваз ияртэме сузлэр (аваз.ияр.), предикативные слова - хэбэрлек сузлэр
(Х.С.).
§6. Помета омонимии представлена в виде римских цифр рядом с
индексом словаря-источника:
кашвнкэ
и.
al
Ы
кашэнкэ
и. all
bll
и.
dl
серке
al
bl с
el
серкэ
и. all
bll
dll
ell
серка
и. alll
bill
din elll
§7. Помета лексических значений слова представлена арабскими цифрами
рядом с индексом словаря-источника:
иечкэ
с. aI2
b e d
е
ейлэ
и.
а2
b a d e
швулэ
и.
а7
b a d e
§8. В тех случаях, когда одновременно представлена информация по
омонимии и лексическому значению в пределах одной словарной единицы, для
разделения сведений используется запятая (,):
ма'рка
и. aU
bl с
d
e
ма'рка
и.
all
bll
ма'рка
и. aim bill
жэймэ
и. al.4
bl с
d
e
айлэнмэ
с.
al.3
bl с
d
el
керпа
и. al.3
bl с dl
el
карпа
и. all,2 bll
dll ell
§9. В словаре отмечены случаи несовпадения в грамматической
характеристике слов (частеречная). в фиксации омонимии, лексического
значения:
койка'
и.
a
bll
с
d
e
ко'йка
и.
a
bl
d
e
сызма
с.
al.3
bl
с
d
с.
all
bll
el
сызма
сызма
и.
bill
ell
Анализ исходного массива слов обратного словаря выявил суффиксы и
финали разных типов. Нами был проведен статистический анализ наиболее
продуктивных суффиксов, образующих части речи: -лык (2.495 слов); -лек/
(1 526 слов); -лы ('1-054 слова); -чы (1.039 слов); -ле (836 слов); -ма (345 слов); ча (399 слов); -сыз (309 слов); -сез (280 слов); -чэ2 (234 слова); -чан (197 слов)
МО (164 слова); -лап (149слов); -чэн(144 слова); -лэп (115 слов) -малы (79 слов)
-моле (47 слов) Таким образом, мы получаем представление о соотносительной
продуктивности словообразовательных суффиксов татарского языка.
19
Заключение содержит основные выводы, обобщающие результаты
работы, также здесь приводятся рекомендащ1И и предложения по
использованию упомянутых результатов, раскрываются перспективы работы
над темой.
Основное содержание
публикациях автора:
диссертацин
отражено
в
следующих
1. Валиуллина, Г.В. Компьютерная лингвография: комплексное описание
языковых единиц / Г.В.Валиуллина, К.Р.Галиуллин // Dialog'95: Computation
Linguistics and its Appications: International Workshop (Kazan, May 31 - June 4,
1995): Proceedings.- Казань, 1995.- С. 107-110.
2. Валиуллина, Г.В. Информатизация татарской лингводидактики и
компьютерные справочники / Г.В.Валиуллина, К.Р.Галиуллин // Проблемы
обучения татарскому языку учащихся старших классов школ, средних
специальных и высших заведений: Тез. докл. первой городской науч.-практ.
конф.- Казань, 1996.- С. 10-11.
3. Валиуллина, Г.В. Квантигативная характеристика татарской лексики;
анализ форм словарных единиц / Г.В.Валиуллина, К.Р.Галиуллин // Модели
национальных языков.- Казань: Фэн, 1996.- С.34-39.
4. Валиуллина, Г.В. Татар теленец морфологик компонентлы компьютер
сузлеген принциплары турында / Г.В.Валиуллина // Языковая ситуация в
Республике Татарстан: состояние и перспективы: в 2 ч. - Казань: Мастер Лайн,
1999.- Ч. П.- С. 144-145.
5. Валиуллина, Г.В. О принципах построения обратного словаря
татарского языка / Г.В.Валиуллина // Проблемы лексикологии и лексикографии
татарского языка.- Казань: Фикер, 1999.- С. 12-17.
6. Галиуллина, Г.В. О морфологическом кохшоненте Машинного фонда
татарского языка / Г.В.Галиуллина // Сопоставительная филология и
полилингвизм: Матер. Всерос. науч.-практ. конф. (Казань, 29-31 окг. 2002 г.).Казань: РИЦ «ШКОЛА», 2002.- С. 321-322.
7. Галиуллина, Г.В. Свод лексики татарского язьпса: инверсионный
компонент / Г.В.Галиуллина // Русская и сопоставительная филология:
состояние и перспективы: Междунар. науч. конф., посвященная 200-летию
Казанского университета (Казань, 4-6 окт. 2004 г.): Труды и материалы.- Казань:
Казан, гос. ун-т им. В.И. Ульянова-Ленина, 2004.- С. 287.
i!2009t
РНБ Русский фонд
2006-4
20778
Документ
Категория
Без категории
Просмотров
0
Размер файла
1 022 Кб
Теги
bd000101619
1/--страниц
Пожаловаться на содержимое документа